カテゴリー: 機械学習
- 大規模モデルがコードグラフを直接理解:エージェントなしでバグを自動修正、SWE-Benchオープンソースモデルランキングで首位獲得
- 推論が増えるほど幻覚は深刻化するか?マルチモーダル推論モデルの「幻覚のパラドックス」
- 大規模推論モデルの「思考の謎」を解き明かす:「推論グラフ」の視点からモデルの「アハ体験」を見る
- 描きながら考える!マルチモーダル推論が大幅に向上!
- 徹夜のブログ記事でOpenAIからオファー獲得!Muon開発者が激白:「ほとんどのオプティマイザ論文は“偽物”だ」
- Midjourney、動画生成に参入、画像モデルV7も継続更新、ビジュアルの覇者確定
- ByteDance Seedの新作DeltaFormer: 次世代モデルアーキテクチャの試み
- 汚いほど安全? ハーバード大学チームの最新研究:10%の毒性訓練で大規模モデルは無敵に
- LLMは既に自己重み更新が可能に、適応能力と知識統合能力が大幅向上、AIは目覚めたか?
- Kaiming Heの新作:拡散モデルに正則化を追加、事前学習やデータ拡張不要で、超シンプルに性能向上を実現
- 速報!Metaが最新のワールドモデルをオープンソース化
- SFTもRLも不要、サンプルレベルの推論最適化ツール「SLOT」が登場、精度が楽々+10%向上
- ZeroSearchに続き、通義の最新作MaskSearchが推論検索事前学習の新しいフレームワークを提案
- 35%の精度が蒸発!バイトダンスと華中科技大学のWildDocがマルチモーダル文書理解のロバスト性における課題を明らかに
- Googleの研究が示す:マルチエージェントシステムの核はプロンプト設計!
- 大変だ!Appleが証明:DeepSeek、o3、Claudeなどの「推論」モデルには推論能力が全くない
- R1型訓練はもはや結果の正誤だけでなく!香港中文大学がSophiaVL-R1モデルを発表
- 10行のコードでAIME24/25が15%向上!大規模モデル強化学習におけるエントロピーメカニズムの解明
- RMoA 残差抽出型Mixture-of-Agents:エージェントが新しい発見をし、自己適応的に停止する「ACL2025」
- Agent Zero:学習し進化するオープンソースの無料エージェント
- DeepMindの最新研究:エージェントは世界モデルである!
- AGIへの道がさらに近くに!0.31元でGoogleのAlphaEvolveとUBCのDGM「ダーウィン・ゲーデル・マシン」を動かす?
- 深層研究がコモディティ化?GoogleがGeminiレベルのAI研究能力をオープンソース化
- OPA-DPO:マルチモーダル大規模モデルにおける幻覚問題の効率的な解決策
- 手動アノテーション不要!AIが自己生成した学習データで、「演繹・帰納・アブダクション」による推論能力を解き放つ