先端LLMで例外なく観測された「思わぬ弱点」とは、2月のAI注目論文

ChatGPTやClaudeといった最先端のLLM(大規模言語モデル)は、単一の質問(プロンプト)に対しては高い精度で回答できる一方、日常会話でよくある、複数回のやり取りからなる質問には精度がガクッと落ちてしまうーー。そんなLLMの思わぬ弱点を示す論文が、2026年2月の世界SNS言及で1位になった。