Google AI 最新黑科技有多厲害？通過醫療檢定考85％媲美專業醫生

by pumoadmin55 · 2023-07-03

Google 分享在醫療領域中探索 AI 應用的最新動態，包括醫學大型語言模型研究進展、帶入現實情境中應用的合作案例，以及透過 AI 協助偵測疾病的新方法。（圖／法新社、Google提供；編輯合成）

基於大型語言模型打造的ChatGPT AI聊天機器人，以高度的理解能力與人性化口吻回答與生成式產生內容等方式，於全球爆紅。不讓微軟、OpenAI 專美於前，深耕AI相關領域研究多年已久的Google，繼日前宣佈自研的「Bard AI 聊天機器人」已在內部測試預計數週後開放大眾使用。

此外，Google 於今（3/15）宣佈將把生成式AI技術導入 Google Workspace，首先在 Gmail和Google文件推出，今年逐步推向測試人員，後續才會公開給大眾使用。

另，針對AI導入健康醫療方面的相關醫學研究進展，目前 Google 於今（3/15）亦公開分享取得重大突破的最新動態與成果。

Google 表示，特別為醫療領域所打造的 Med-PaLM 專業級醫學大型語言模型，具備展示語言理解和生成能力的 AI 技術工具，最近在醫療檢定考試中持續達到「專業（expert）」醫師等級表現，得分為 85％。不但具備能夠檢索醫學知識，以及準確回答多選題與開放式的問答題醫療問題，甚至還能提供解釋並評估自己的回覆。

雖然相比臨床醫生，Google運用AI生成式打造最新的第二代「 Med-PaLM 2」版本專業級醫學語言模型仍有所不及之處，但已比去年前代 Med-PaLM 取得60％及格分數，整體表現明顯進步18％，並遠超過其他相似的AI模式。

目前第二代「 Med-PaLM 2」AI模型，仍正處於測試研究階段，需要更加謹慎地考慮「安全性、公平性和偏誤」等面向，更需要再持續投入非常多的努力研究，以確保能把這項AI技術順利應用在現實生活中，以保障患者福利、協助醫療人員改善醫療服務。

專注於醫療領域的 Med-PaLM 專業級醫學大型語言模型，Google表示，需接受 14 項標準測試，包含：科學真實性、正確性、醫學共識、推理、偏誤和危害等，並由來自不同背景與地區的臨床醫師與非臨床醫師進行評估。

透過這次評估第二代「 Med-PaLM 2」模型的結果，Google 發現模型從回答醫療問題，到能夠符合期待的標準，仍有明顯差距。展望未來，則是希望透過與研究人員和全球醫學社群合作，來弭平中間的落差，並瞭解這項AI新技術，能夠如何協助改善醫療服務。

原文來源