最新文章
所有文章

繁體中文

分類：大型語言模型

強迫模型自我爭論，遞歸思考版CoT熱度飆升！網友：這不就是大多數推理模型的套路嗎？
史丹佛以弱馭強W4S：用Meta-Agent駕馭更強LLM，準確率提升至95.4%
僅需 1 個數據，就能讓大型模型的數學推理效能大大增強？
強化學習演算法梳理：從 PPO 到 GRPO 再到 DAPO
研究：LLM的預填充功能，反而成為了它的越獄漏洞！
NVIDIA Llama Nemotron 系列模型：關鍵技術解析
中興通訊無線研究院「大模型深潛團隊」發布 LLM 自適應題目難度蒸餾方法，大幅提升小模型推理能力
AI的下半場：從演算法到效用
大型語言模型根本不是通往通用人工智慧的終點站！
AI 界「奧運會」？OpenAI 發布全新基準測試 MRCR，模型「大海撈針」能力面臨極限挑戰！
今日AI前沿進展快訊
PPTAgent：會自己寫 PPT 的 AI 工具
新書《Reasoning From Scratch》第一章釋出，Sebastian Raschka 談 LLM 推理、模式匹配和基礎訓練

←
1
2
3
4
5
6
7
→

2025 AINews. All rights reserved.