最新の記事
すべての記事

日本語

カテゴリー：深層学習

【深掘り】Ilya Sutskever精選論文：プラトニック表現仮説
上海交通大学博士の最新考察：2つの質問だけで強化学習を明確にする
NASの新視点：グラフニューラルネットワーク駆動の汎用アーキテクチャ空間、ハイブリッド畳み込みとTransformerで性能向上！
再帰的推論HRMモデルがさらなる進化！TRMの2層ネットワーク（7Mモデル）がLLMを凌駕！
思考の連鎖を覆す！ByteDanceが逆行工学推論を提案！AIが結果から過程を逆算
階層的推論モデル Hierarchical Reasoning Model
Kimi K2の主要な訓練技術：QK-Clip！
アンドリュー・ン氏、LLMの「後学習」無料コースを公開：SFT、DPO、RLの3つの主要なチューニング手法を網羅
継続強化学習技術に関する最新の調査
アリババが深夜に「切り札」エージェントをオープンソース化！OpenAIに真っ向勝負、性能は全面的にSOTAを達成！
10行のコードでAIME24/25が15%向上！大規模モデル強化学習におけるエントロピーメカニズムの解明
【深層学習】Mamba主要著者の新作：DeepSeek採用のアテンションメカニズムを置き換え、推論専用に設計
Andrej Karpathy が絶賛！スタンフォード大学チームの新作、Llama-1B でミリ秒級推論を実現
All-In Podcast 議事録：Geminiが「無限のコンテキスト」を牽引、AIはツールから認知コラボレーターへ昇格
グローバルアテンション＋位置アテンションがSOTAを更新！精度ほぼ100％！

←
1
→

2025 AINews. All rights reserved.