AINews
  • 最新文章
  • 所有文章
  • 繁體中文

    分類: 模型優化

    • DeepSeek、GPT-5都在嘗試的快慢思考切換,有了更智慧版本,還是多模態
    • 獎勵模型新革命!SWIFT不讀文本讀「心聲」,打造又快又強又省錢的AI裁判
    • 強化學習框架的演進與發展趨勢
    • 注意力總是發散?人大與清華大學聯合提出LeaF:移除干擾型Token,引導模型學會自主聚焦
    • 面壁MiniCPM4推論速度快3倍,碾壓同尺寸Qwen3,讓阿里巴巴也感到壓力了~
    • 啟動端側長文本時代!面壁全新架構,讓小鋼炮最快提升220倍
    • 【深度學習】Mamba核心作者新發表:取代DeepSeek現行注意力機制,專為推論打造
    • ←
    • 1
    • →
    2025 AINews. All rights reserved.