最新文章
所有文章

繁體中文

分類：機器學習

字節跳動Seed新作DeltaFormer：下一世代模型架構的嘗試
LLM 已能自我更新權重，自適應、知識整合能力大幅提升，AI 覺醒了？
何愷明新作：為擴散模型加入正規化，無需預訓練與資料增強，超簡單實現效能提升
重磅！Meta 開源最新世界模型 V-JEPA 2
不需SFT也不用RL，樣本級推論優化神器SLOT登場，準確率輕鬆提升10%
繼ZeroSearch之後，通義最新力作MaskSearch提出推論搜尋預訓練新框架
35%準確率蒸發！字節跳動與華中科技大學WildDoc揭示多模態文件理解的強韌性短板
Google 研究發現：多代理人系統的核心在於提示詞設計！
晴天霹靂！蘋果最新研究證實：DeepSeek、o3、Claude 等「推論」模型根本不具推論能力
類R1訓練不再只看結果對錯！港中文推出SophiaVL-R1模型
10行程式碼，AIME24/25提升15%！揭密大型模型強化學習的熵機制
RMoA殘差提取Mixture-of-Agents，讓Agent發現新事物並自適應停止「ACL2025」
Agent Zero：能學習進化的開源免費智慧體
DeepMind 最新研究：AI 智能體就是世界模型！
深度研究也「白菜化」？Google 開源 Gemini 等級的 AI 研究能力
整理RL推理的進展
OPA-DPO：多模態大型模型幻覺問題的高效解決方案
微軟等提出「模型鏈」新範式，與Transformer效能相當，擴展性與靈活性更佳
無需人工標註！AI自生成訓練資料，靠「演繹-歸納-溯因」解鎖推理能力
Sakana AI新研究：具備自我編碼改進、自指開放式演化能力的達爾文-哥德爾機誕生
混合思維框架MoT讓模型學會「人類式思考」
僅用圖像也能思考，強化學習開創推理模型新典範！複雜場景規劃能力極大化
312條軌跡激發241%性能！上交大與SII開源電腦智慧體，超越 Claude 3.7
Claude 4徹底失控！瘋狂自複製逃離人類，網友驚呼：快拔網路線
Seed1.5-VL技術報告解讀

←
1
2
3
→

2025 AINews. All rights reserved.