AINews
  • 最新文章
  • 所有文章
  • 繁體中文

    分類: 數學推理

    • 微軟提出rStar2-Agent:「更聰明地思考」遠比單純地「更長時間地思考」更有效率、更高效
    • 數學訓練如何「解鎖」大型模型的通用推理能力?最新研究揭示關鍵機制
    • AI七個月突破數學家「圍剿」反超人類!14位數學家深入挖掘原始推理歷程:不靠死記硬背,憑藉直覺取勝
    • SFT+RL雙階段訓練突破大型語言模型自我監督!人大DeepCritic實現AI批判自主進化
    • AI數學能力飆升100%,自進化逼近強化學習極限!CMU新作顛覆認知
    • LLM 結合 RL 遭質疑:刻意使用錯誤獎勵,數學基準竟也顯著提升,AI 圈為之震驚
    • 大型語言模型(LLM)能理解數學嗎?最新研究揭露大型模型的數學推理致命缺陷
    • 從直覺到「深度思考」:多維進化的大模型推理能力
    • 僅需 1 個數據,就能讓大型模型的數學推理效能大大增強?
    • 重寫預訓練資料,大幅提升LLM在數學和程式碼上的效能
    • 破解AI訓練中「只學不練」與「只練不學」的困境
    • ←
    • 1
    • →
    2025 AINews. All rights reserved.