Google AI 最新黑科技有多厲害? 通過醫療檢定考85% 媲美專業醫生
基於大型語言模型打造的ChatGPT AI聊天機器人,以高度的理解能力與人性化口吻回答與生成式產生內容等方式,於全球爆紅。不讓微軟、OpenAI 專美於前,深耕AI相關領域研究多年已久的Google,繼日前宣佈自研的「Bard AI 聊天機器人」已在內部測試預計數週後開放大眾使用。
此外,Google 於今(3/15)宣佈將把生成式AI技術導入 Google Workspace,首先在 Gmail和Google文件推出,今年逐步推向測試人員,後續才會公開給大眾使用。
另,針對AI導入健康醫療方面的相關醫學研究進展,目前 Google 於今(3/15)亦公開分享取得重大突破的最新動態與成果。
Google 表示,特別為醫療領域所打造的 Med-PaLM 專業級醫學大型語言模型,具備展示語言理解和生成能力的 AI 技術工具,最近在醫療檢定考試中持續達到「專業(expert)」醫師等級表現,得分為 85%。不但具備能夠檢索醫學知識,以及準確回答多選題與開放式的問答題醫療問題,甚至還能提供解釋並評估自己的回覆。
雖然相比臨床醫生,Google運用AI生成式打造最新的第二代「 Med-PaLM 2」版本專業級醫學語言模型仍有所不及之處,但已比去年前代 Med-PaLM 取得60%及格分數,整體表現明顯進步18%,並遠超過其他相似的AI模式。
目前第二代「 Med-PaLM 2」AI模型,仍正處於測試研究階段,需要更加謹慎地考慮「安全性、公平性和偏誤」等面向,更需要再持續投入非常多的努力研究,以確保能把這項AI技術順利應用在現實生活中,以保障患者福利、協助醫療人員改善醫療服務。
專注於醫療領域的 Med-PaLM 專業級醫學大型語言模型,Google表示,需接受 14 項標準測試,包含:科學真實性、正確性、醫學共識、推理、偏誤和危害等,並由來自不同背景與地區的臨床醫師與非臨床醫師進行評估。
透過這次評估第二代「 Med-PaLM 2」模型的結果,Google 發現模型從回答醫療問題,到能夠符合期待的標準,仍有明顯差距。展望未來,則是希望透過與研究人員和全球醫學社群合作,來弭平中間的落差,並瞭解這項AI新技術,能夠如何協助改善醫療服務。