分類: 大型語言模型
- AI Can Read Between the Prompts! Vibe Coding: Regular User vs. Programmer – Cambridge's Latest Report
- 最新12種GraphRAG技術全面評估
- o3-pro成功挑戰《推箱子》,人類懷舊小遊戲成為大型模型新基準
- 4B Qwen3 逆襲 671B DeepSeek!字節跳動 DAPO 微調方法真有這麼猛嗎?
- Devin共同創辦人:別再搞多智能體系統了!微軟和OpenAI鼓吹的代理建構理念大錯特錯!上下文工程將成新標準,員工:老闆停止洩密
- 2天完成人類12年工作,AI自動更新文獻回顧,準確率碾壓人類近15%
- 越髒越安全?哈佛團隊最新研究:10%毒性訓練讓大型模型百毒不侵
- LLM 已能自我更新權重,自適應、知識整合能力大幅提升,AI 覺醒了?
- 多代理系統狂燒 Token!Anthropic揭露他們的發現
- 蘋果《思考的錯覺》再遭批評,Claude與人類合著論文點出三大關鍵缺陷
- 自主AI代理人路線錯了!華人學者提出LLM-HAS:從「自主能力」轉向「協作智慧」
- 伯克利斯坦福聯手打造「科研預言家」:以77%準確度預測研究想法前景
- OpenAI 最強推理模型 o3-pro 剛誕生!輾壓 Gemini 2.5 Pro!
- 面壁MiniCPM4推論速度快3倍,碾壓同尺寸Qwen3,讓阿里巴巴也感到壓力了~
- 史丹佛與紐約大學聯合研究:人工智慧與人類思維差異的驚人發現 —— 為何大型模型「聰明」卻不夠「智慧」?
- LeCun 有新證據!大模型與人類思考存在本質差異
- AI七個月突破數學家「圍剿」反超人類!14位數學家深入挖掘原始推理歷程:不靠死記硬背,憑藉直覺取勝
- 啟動端側長文本時代!面壁全新架構,讓小鋼炮最快提升220倍
- 大模型強化學習新突破——SPO新範式助力大模型推論能力提升!
- AI 頭條:OpenAI Codex 新增網路存取權限,Mistral 釋出程式編寫助手
- 晴天霹靂!蘋果最新研究證實:DeepSeek、o3、Claude 等「推論」模型根本不具推論能力
- 全球30位頂尖數學家秘密集會圍堵AI,當場「破防」!驚呼已接近數學天才
- 世界頂尖數學家對人工智慧在工作中的熟練程度感到震驚
- 首個多模態專用慢思維框架!超越GPT-o1近7個百分點,強化學習教VLM「三思而後行」
- 奧特曼:Codex 讓我感覺到 AGI!最新對談罕見透露下一代「完美模型」,大膽預測 AI 代理明年將突破界線!