分類: 數學推理
- 微軟提出rStar2-Agent:「更聰明地思考」遠比單純地「更長時間地思考」更有效率、更高效
- 數學訓練如何「解鎖」大型模型的通用推理能力?最新研究揭示關鍵機制
- AI七個月突破數學家「圍剿」反超人類!14位數學家深入挖掘原始推理歷程:不靠死記硬背,憑藉直覺取勝
- SFT+RL雙階段訓練突破大型語言模型自我監督!人大DeepCritic實現AI批判自主進化
- AI數學能力飆升100%,自進化逼近強化學習極限!CMU新作顛覆認知
- LLM 結合 RL 遭質疑:刻意使用錯誤獎勵,數學基準竟也顯著提升,AI 圈為之震驚
- 大型語言模型(LLM)能理解數學嗎?最新研究揭露大型模型的數學推理致命缺陷
- 從直覺到「深度思考」:多維進化的大模型推理能力
- 僅需 1 個數據,就能讓大型模型的數學推理效能大大增強?
- 重寫預訓練資料,大幅提升LLM在數學和程式碼上的效能
- 破解AI訓練中「只學不練」與「只練不學」的困境