最新文章
所有文章

繁體中文

分類：大型語言模型

Martin Fowler 最新洞察：大型語言模型不只是「更高層次」的抽象，它正在改變程式設計的「本質」！
解讀大型推理模型的「思維奧秘」：從「推理圖」視角看模型的「啊哈時刻」
ACL 2025 | 大型語言模型「以訛傳訛」？DRAG 雙階段「多代理辯論」破解幻覺疊加問題
本世紀最偉大AI專訪之一：AI安全、代理人、OpenAI等重要議題
0% 通過率！程式碼神話泡沫化！LiveCodeBench Pro 正式發布！
傳統RAG只會翻書卻不會運用？RAG+讓推理能力邁向新高度！
NVIDIA（ProRL）｜強化學習究竟能否提升大型語言模型的推理上限？
AI Can Read Between the Prompts! Vibe Coding: Regular User vs. Programmer – Cambridge's Latest Report
最新12種GraphRAG技術全面評估
o3-pro成功挑戰《推箱子》，人類懷舊小遊戲成為大型模型新基準
4B Qwen3 逆襲 671B DeepSeek！字節跳動 DAPO 微調方法真有這麼猛嗎？
Devin共同創辦人：別再搞多智能體系統了！微軟和OpenAI鼓吹的代理建構理念大錯特錯！上下文工程將成新標準，員工：老闆停止洩密
2天完成人類12年工作，AI自動更新文獻回顧，準確率碾壓人類近15%
越髒越安全？哈佛團隊最新研究：10%毒性訓練讓大型模型百毒不侵
LLM 已能自我更新權重，自適應、知識整合能力大幅提升，AI 覺醒了？
多代理系統狂燒 Token！Anthropic揭露他們的發現
蘋果《思考的錯覺》再遭批評，Claude與人類合著論文點出三大關鍵缺陷
自主AI代理人路線錯了！華人學者提出LLM-HAS：從「自主能力」轉向「協作智慧」
伯克利斯坦福聯手打造「科研預言家」：以77%準確度預測研究想法前景
OpenAI 最強推理模型 o3-pro 剛誕生！輾壓 Gemini 2.5 Pro！
面壁MiniCPM4推論速度快3倍，碾壓同尺寸Qwen3，讓阿里巴巴也感到壓力了~
史丹佛與紐約大學聯合研究：人工智慧與人類思維差異的驚人發現 —— 為何大型模型「聰明」卻不夠「智慧」？
LeCun 有新證據！大模型與人類思考存在本質差異
AI七個月突破數學家「圍剿」反超人類！14位數學家深入挖掘原始推理歷程：不靠死記硬背，憑藉直覺取勝
啟動端側長文本時代！面壁全新架構，讓小鋼炮最快提升220倍

←
1
2
3
4
5
6
7
→

2025 AINews. All rights reserved.