分類: 大型語言模型
- 強迫模型自我爭論,遞歸思考版CoT熱度飆升!網友:這不就是大多數推理模型的套路嗎?
- 史丹佛以弱馭強W4S:用Meta-Agent駕馭更強LLM,準確率提升至95.4%
- 僅需 1 個數據,就能讓大型模型的數學推理效能大大增強?
- 強化學習演算法梳理:從 PPO 到 GRPO 再到 DAPO
- 研究:LLM的預填充功能,反而成為了它的越獄漏洞!
- NVIDIA Llama Nemotron 系列模型:關鍵技術解析
- 中興通訊無線研究院「大模型深潛團隊」發布 LLM 自適應題目難度蒸餾方法,大幅提升小模型推理能力
- AI的下半場:從演算法到效用
- 大型語言模型根本不是通往通用人工智慧的終點站!
- AI 界「奧運會」?OpenAI 發布全新基準測試 MRCR,模型「大海撈針」能力面臨極限挑戰!
- 今日AI前沿進展快訊
- PPTAgent:會自己寫 PPT 的 AI 工具
- 新書《Reasoning From Scratch》第一章釋出,Sebastian Raschka 談 LLM 推理、模式匹配和基礎訓練