最新文章
所有文章

繁體中文

分類：大型語言模型

微軟提出rStar2-Agent：「更聰明地思考」遠比單純地「更長時間地思考」更有效率、更高效
【大師之思】Martin Fowler 的 AI 隨筆：我們正處在一個連「問題」都看不清的時代
Meta 提出 Deep Think with Confidence：幾乎無需更動，即可提升推論的準確性與效率
MCP堆疊工具是個大坑！開發者大佬：命令列的「脆弱」讓AI慘敗！不如砍掉變成一個程式碼執行器：7輪呼叫秒變1輪！網友：早該放棄黑箱工具了！
獎勵模型新革命！SWIFT不讀文本讀「心聲」，打造又快又強又省錢的AI裁判
思維鏈推理的「海市蜃樓」：大型語言模型泛化能力的深入探討
GPT-5 對決 Claude Opus 4.1：程式編碼能力評測
硬核解析大型語言模型：從 DeepSeek-V3 到 KimiK2，一篇文看懂主流 LLM 架構
ARPO：智能體強化策略優化，讓Agent在關鍵時刻多探索一步
史上最大高品質科學推理後訓練資料集開源，快速讓Qwen3等變「科學家」
王夢迪團隊「自我進化代理」綜述：從靜態大型語言模型到超智慧人工智慧
大型語言模型的黑化開關！Anthropic團隊新作：大型語言模型的人格變數，人類終於找到了！提出人格漂移工具鏈，破解讓模型失控的黑箱
注意力總是發散？人大與清華大學聯合提出LeaF：移除干擾型Token，引導模型學會自主聚焦
模型真的能「反思程式碼」嗎？北航發布倉庫級理解生成基準，刷新大型語言模型理解評估範式
ReaGAN：讓圖中每個節點都成為智能推理專家
Google 約戰，DeepSeek、Kimi 都要上，首屆大型模型對抗賽明天開戰
RAG 革新！Graph-R1：首個由強化學習驅動的圖推理代理
阿里雲剛開源Qwen-Image，免費版GPT-4o吉卜力，中文最佳模型
復刻 AlphaGo 時刻？Google 推出 LLM 評估新範式 Game Arena：八大模型參賽，棋王擔任裁判
RAG也能推理思考！徹底解決多源異構知識難題
盤點一下！大型模型訓練的時間都花在哪了？
DeepSeek R2 秘密武器曝光！梁文鋒剛拿下頂級大獎的技術，讓 AI 讀長文速度狂飆 11 倍
人工智慧安全與沉思：心靈與通用人工智慧對齊的計算模型
凌晨時分，Qwen再次更新，RTX 3090 即可運行，30億參數激活可媲美 GPT-4o
多模態大型語言模型真的「理解」世界嗎？——揭露多模態大型語言模型的核心知識缺陷

←
1
2
3
4
5
6
7
→

2025 AINews. All rights reserved.