
商傳媒|吳承岳/台北報導
東京大學松尾・岩澤研究室於今日(5日)宣布,已開發出專為醫療領域設計的日語大型語言模型(LLM)「Weblab-MedLLM-Qwen-2.5-109B-Instruct」。據稱,該模型在2025年的日本醫師國家考試中的答對率,超越了美國 OpenAI 的「o1」和「GPT-4o」等AI模型,將以聊天AI的形式,免費提供給研究人員使用。
該模型以中國阿里巴巴的開源AI模型「Qwen-2.5-72B-Instruct」為基礎進行開發,並與日本網路公司櫻花互聯網(Sakura Internet)、AI開發企業ELYZA、ABEJA,以及理化學研究所和多家醫療機構合作,讓AI模型學習醫療領域的數據,使其具備日語醫學知識和對日本國內醫療制度的了解。
研究團隊表示,在2025年的醫師國家考試中,該模型的答對率達到93.3%,高於o1的92.8%和中國 DeepSeek 的AI模型「R1」的91.5%。透過結合外部數據參考(RAG)等技術,在排除需要圖表參考或計算的問題後,該模型的答對率最高可提升至約98%。
此外,研究團隊還測試了該模型在將電子病歷數據標準化時,把感染症和檢查名稱轉換為日本厚生勞動省所訂定的標準名稱的能力。結果顯示,「Weblab-MedLLM-Qwen-2.5-109B-Instruct」的性能優於「Qwen-2.5-72B-Instruct」和「GPT-4o」等模型。
這款醫療專用日語LLM將以聊天AI的形式,於3月5日至8月31日期間免費提供給研究人員使用,但聲明中也強調,該模型不可用於診斷、診療或治療行為。
據了解,此LLM的開發,是受到日本政府主導的「戰略性創新創造項目」(SIP)第3期中,旨在活用醫療領域數據和AI的「建構整合型醫療保健系統」項目的補助而進行。


