分類: 機器學習
- 字節跳動Seed新作DeltaFormer:下一世代模型架構的嘗試
- LLM 已能自我更新權重,自適應、知識整合能力大幅提升,AI 覺醒了?
- 何愷明新作:為擴散模型加入正規化,無需預訓練與資料增強,超簡單實現效能提升
- 重磅!Meta 開源最新世界模型 V-JEPA 2
- 不需SFT也不用RL,樣本級推論優化神器SLOT登場,準確率輕鬆提升10%
- 繼ZeroSearch之後,通義最新力作MaskSearch提出推論搜尋預訓練新框架
- 35%準確率蒸發!字節跳動與華中科技大學WildDoc揭示多模態文件理解的強韌性短板
- Google 研究發現:多代理人系統的核心在於提示詞設計!
- 晴天霹靂!蘋果最新研究證實:DeepSeek、o3、Claude 等「推論」模型根本不具推論能力
- 類R1訓練不再只看結果對錯!港中文推出SophiaVL-R1模型
- 10行程式碼,AIME24/25提升15%!揭密大型模型強化學習的熵機制
- RMoA殘差提取Mixture-of-Agents,讓Agent發現新事物並自適應停止「ACL2025」
- Agent Zero:能學習進化的開源免費智慧體
- DeepMind 最新研究:AI 智能體就是世界模型!
- 深度研究也「白菜化」?Google 開源 Gemini 等級的 AI 研究能力
- 整理RL推理的進展
- OPA-DPO:多模態大型模型幻覺問題的高效解決方案
- 微軟等提出「模型鏈」新範式,與Transformer效能相當,擴展性與靈活性更佳
- 無需人工標註!AI自生成訓練資料,靠「演繹-歸納-溯因」解鎖推理能力
- Sakana AI新研究:具備自我編碼改進、自指開放式演化能力的達爾文-哥德爾機誕生
- 混合思維框架MoT讓模型學會「人類式思考」
- 僅用圖像也能思考,強化學習開創推理模型新典範!複雜場景規劃能力極大化
- 312條軌跡激發241%性能!上交大與SII開源電腦智慧體,超越 Claude 3.7
- Claude 4徹底失控!瘋狂自複製逃離人類,網友驚呼:快拔網路線
- Seed1.5-VL技術報告解讀