眼科における臨床推論、AI回答の精度を検証

ChatGPTをはじめとする大規模言語モデル(LLM)ベースのAIチャットボットは、医学教育や臨床研修の補助ツールとして急速に普及しつつある。眼科領域では画像診断AIの研究は進んでいるものの、テキストベースのLLMが臨床推論をどの程度正確に行えるかは十分に検証されていなかった。インドの研究チームらが、眼科臨床症例問題で評価した結果を、Springer Natureが発行する学術誌「Eye」に発表した。研究では、匿名化された患者記録を基に眼科専門医2人が検証した34件の臨床症例問題を作成し、ChatGPT、Gemini、Meta AIの各AIモデルに入力した。回答は「診断精度」「鑑別診断の適切性」「治療方針の安全性」の3軸で0〜5点の評価基準を用いて