分類: 大型語言模型
- 大型語言模型(LLM)能理解數學嗎?最新研究揭露大型模型的數學推理致命缺陷
- 她如何將「系統二」帶入大型語言模型?—專訪微軟亞洲研究院張麗
- 312條軌跡激發241%性能!上交大與SII開源電腦智慧體,超越 Claude 3.7
- 歷史首次!o3模型找出Linux核心零時差漏洞,鑽研12000行程式碼百次終獲,無需呼叫任何工具
- Statistically Controllable Data Synthesis! New Framework Breaks LLM Data Generation Limitations, McGill University Team Launches LLMSynthor
- 深度|對話AI獨角獸Character.AI CEO:最佳應用尚未被發明出來,AI領域現狀類似煉金術,沒人確切知道什麼會奏效
- AI越聰明越不聽話!新研究:最強推理模型指令遵循率僅50%
- Seed1.5-VL技術報告解讀
- 「從零開始,僅需8元+9小時!完整Tiny LLM訓練教程,包含推理、MoE等」
- Gemini Diffusion:1500 token/秒,快如閃電!
- AI是否知道什麼時候該"思考"?Thinkless教會大模型何時該動腦筋
- ICML 2025 | 無需訓練,即時對齊大模型偏好
- Google | 溯源分析RAG系統錯誤,提出選擇性生成框架,讓RAG問答準確率提升10%
- Nature子刊:人類又輸給了AI,尤其是當它知道你是誰時
- 思考成為負擔:揭秘大型語言模型的「思考陷阱」
- 大語言模型的推理能力究竟有多強?一項研究揭示了LLM的局限性與潛力
- Reasoning 新突破:SoftCoT++ 如何讓 LLM「多想幾條路」?
- Qwen突破:用「平行計算」代替「堆參數」,新方法記憶體降22倍、延遲降6倍
- 大型語言模型又曝致命缺陷:根本不會看時鐘!博士驚呆,準確率不及50%
- ZeroSearch:<阿里技術> 無需瀏覽器,大型語言模型自己獎勵學習
- Jeff Dean:一年內 AI 將取代初級工程師,網友:「Altman 只會畫大餅,Jeff 說的話才致命」
- AM-Thinking-v1:在32B規模推進推理能力的前沿
- 螞蟻武威:下一代「推理」模型範式大猜想
- GPT-5研發內幕首曝!OpenAI首席研究官:AGI指日可待
- ZeroSearch:零搜索強化激勵模型潛能,LLM 搜索能力開啟新紀元