カテゴリー: 深層学習
- 【深掘り】Ilya Sutskever精選論文:プラトニック表現仮説
- 上海交通大学博士の最新考察:2つの質問だけで強化学習を明確にする
- NASの新視点:グラフニューラルネットワーク駆動の汎用アーキテクチャ空間、ハイブリッド畳み込みとTransformerで性能向上!
- 再帰的推論HRMモデルがさらなる進化!TRMの2層ネットワーク(7Mモデル)がLLMを凌駕!
- 思考の連鎖を覆す!ByteDanceが逆行工学推論を提案!AIが結果から過程を逆算
- 階層的推論モデル Hierarchical Reasoning Model
- Kimi K2の主要な訓練技術:QK-Clip!
- アンドリュー・ン氏、LLMの「後学習」無料コースを公開:SFT、DPO、RLの3つの主要なチューニング手法を網羅
- 継続強化学習技術に関する最新の調査
- アリババが深夜に「切り札」エージェントをオープンソース化!OpenAIに真っ向勝負、性能は全面的にSOTAを達成!
- 10行のコードでAIME24/25が15%向上!大規模モデル強化学習におけるエントロピーメカニズムの解明
- 【深層学習】Mamba主要著者の新作:DeepSeek採用のアテンションメカニズムを置き換え、推論専用に設計
- Andrej Karpathy が絶賛!スタンフォード大学チームの新作、Llama-1B でミリ秒級推論を実現
- All-In Podcast 議事録:Geminiが「無限のコンテキスト」を牽引、AIはツールから認知コラボレーターへ昇格
- グローバルアテンション+位置アテンションがSOTAを更新!精度ほぼ100%!