ChatGPTをはじめとする大規模言語モデル(LLM)ベースのAIチャットボットは、医学教育や臨床研修の補助ツールとして急速に普及しつつある。眼科領域では画像診断AIの研究は進んでいるものの、テキストベースのLLMが臨床推論をどの程度正確に行えるかは十分に検証されていなかった。インドの研究チームらが、眼科臨床症例問題で評価した結果を、Springer Natureが発行する学術誌「Eye」に発表した。 研究では、匿名化された患者記録を基に眼科専門医2人が検証した34件の臨床症例問題を作成し、ChatGPT、Gemini、Meta AIの各AIモデルに入力した。回答は「診断精度」「鑑別診断の適切性」「治療方針の安全性」の3軸で0〜5点の評価基準を用いて