Harvard研究發現AI急診診斷比人類好

一項新研究檢視了大型語言模型在各種醫療場景下的表現，包括真實的急診室病例。結果顯示，至少有一個模型的準確率似乎高於人類醫生。

這項研究於四月底發表在《科學》雜誌上，由Harvard醫學院和Beth Isreal Deaconess醫療中心的醫生和電腦科學家，所組成的研究團隊完成。研究人員表示，他們進行了一系列實驗，以評估OpenAI的模型與人類醫生相比的水平。

在其中一項實驗中，研究人員選取了76位到Beth Isreal急診室就診的患者，比較了兩位內科主治醫師的診斷結果，與OpenAI的o1和4o模型產生的診斷結果。再由另兩位主治醫師對這些診斷結果進行評估，他們並不知道那些是人類醫師的診斷，那些是人工智慧的診斷。

研究稱：「在每個診斷接觸點，o1的表現要麼略優於，要麼與兩位主治醫生和 4o持平。」並補充說，這些差異「在第一個診斷接觸點（急診室初步分診）尤為明顯，因為此時關於患者的訊息最少，做出正確決定的緊迫性也最高」。

Related

Leave a ReplyCancel reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.