AINews
  • 最新の記事
  • すべての記事
  • 日本語

    カテゴリー: 推論最適化

    • Transformerキラー!Google DeepMindの新たなMoRアーキテクチャが登場、新時代の魔王が来た
    • KVキャッシュ10%で無損失の数学的推論を実現!推論大規模モデルの「メモリ過負荷」問題を解決するこのオープンソース手法
    • SFTもRLも不要、サンプルレベルの推論最適化ツール「SLOT」が登場、精度が楽々+10%向上
    • Andrej Karpathy が絶賛!スタンフォード大学チームの新作、Llama-1B でミリ秒級推論を実現
    • ICML 2025 | トレーニング不要、大規模モデルの好み即時アラインメント
    • Qwenのブレークスルー:「並列計算」で「パラメータの積み重ね」を代替、新手法でメモリ22倍削減、遅延6倍削減
    • ←
    • 1
    • →
    2025 AINews. All rights reserved.