Harvard研究發現AI急診診斷比人類好

一項新研究檢視了大型語言模型在各種醫療場景下的表現,包括真實的急診室病例。結果顯示,至少有一個模型的準確率似乎高於人類醫生。

這項研究於四月底發表在《科學》雜誌上,由Harvard醫學院和Beth Isreal Deaconess醫療中心的醫生和電腦科學家,所組成的研究團隊完成。研究人員表示,他們進行了一系列實驗,以評估OpenAI的模型與人類醫生相比的水平。

在其中一項實驗中,研究人員選取了76位到Beth Isreal急診室就診的患者,比較了兩位內科主治醫師的診斷結果,與OpenAI的o1和4o模型產生的診斷結果。再由另兩位主治醫師對這些診斷結果進行評估,他們並不知道那些是人類醫師的診斷,那些是人工智慧的診斷。

研究稱:「在每個診斷接觸點,o1的表現要麼略優於,要麼與兩位主治醫生和 4o持平。」並補充說,這些差異「在第一個診斷接觸點(急診室初步分診)尤為明顯,因為此時關於患者的訊息最少,做出正確決定的緊迫性也最高」。

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.