カテゴリー: 数学的推論
- MicrosoftがrStar2-Agentを発表:「より賢く考える」ことは、単に「より長く考える」よりもはるかに効果的で効率的である
- 数学訓練はどのようにして大規模モデルの汎用推論能力を「解き放つ」のか?最新の研究が鍵となるメカニズムを解明
- AIが7ヶ月で数学者の「包囲網」を突破し人類を凌駕!14人の数学者が原始推論トークンを深掘り:丸暗記ではなく直感に頼る
- SFT+RL二段階学習でLLMの自己教師あり学習を突破!人民大学DeepCriticがAI批評の自律進化を実現
- モデルが賢くなればなるほど「言うことを聞かなくなる」?MathIFベンチマークがAIの服従性における脆弱性を明らかに
- LLMとRLの組み合わせに疑問符:意図的な誤った報酬でも数学ベンチマークが大幅向上、AI界に衝撃
- LLMは数学を理解できるのか?最新の研究が大規模モデルの数学的推論における致命的な欠陥を明らかに
- たった1つのデータで、大規模言語モデルの数学的推論能力を大幅に向上させられるのか?
- AI推論の「学ぶだけ」と「実践だけ」の課題を克服する新手法:LUFFY