最新文章
所有文章

繁體中文

分類：數學推理

微軟提出rStar2-Agent：「更聰明地思考」遠比單純地「更長時間地思考」更有效率、更高效
數學訓練如何「解鎖」大型模型的通用推理能力？最新研究揭示關鍵機制
AI七個月突破數學家「圍剿」反超人類！14位數學家深入挖掘原始推理歷程：不靠死記硬背，憑藉直覺取勝
SFT+RL雙階段訓練突破大型語言模型自我監督！人大DeepCritic實現AI批判自主進化
AI數學能力飆升100%，自進化逼近強化學習極限！CMU新作顛覆認知
LLM 結合 RL 遭質疑：刻意使用錯誤獎勵，數學基準竟也顯著提升，AI 圈為之震驚
大型語言模型（LLM）能理解數學嗎？最新研究揭露大型模型的數學推理致命缺陷
從直覺到「深度思考」：多維進化的大模型推理能力
僅需 1 個數據，就能讓大型模型的數學推理效能大大增強？
重寫預訓練資料，大幅提升LLM在數學和程式碼上的效能
破解AI訓練中「只學不練」與「只練不學」的困境

←
1
→

2025 AINews. All rights reserved.