カテゴリー: 推論能力
- 衝撃!DeepSeekが正式に2つのモデルをリリース
- え?RLVRは新しい知識を学んでいるのではなく、知識をどのように使って推論するかを学んでいる!
- プリンストン大学陳丹琦グループの新作:RLHFでは不十分、RLVRには限界?RLMTが第三の道を切り開く
- 階層的推論モデル Hierarchical Reasoning Model
- 従来のRAGは知識を検索するだけで活用できない?RAG+が推論能力を新たな高みへ!
- NVIDIA(ProRL)|RLはLLMの推論上限を本当に引き上げられるのか?
- 大規模モデルは数独が苦手?!Transformer開発者のスタートアップがランキング発表:o3 Mini Highの「変種数独」正答率はわずか2.9%
- 彼女はいかにして「システム2」を大規模言語モデルにもたらしたか | マイクロソフトリサーチアジアの張麗氏との対話
- AIが賢くなるほど言うことを聞かなくなる!新研究:最強の推論モデルの指示遵守率はわずか50%
- 直感から「深層思考」へ:多次元的に進化する大規模モデルの推論能力
- NVIDIAがAIをより賢くツール利用可能に:Nemotron-Research-Tool-N1モデルの詳細解析
- ZTEの研究:LLM適応型問題難易度グレーディング蒸留により、小規模モデルも「長連鎖思考」能力を獲得
- 強化学習に基づくマルチモーダル大規模言語モデル推論能力に関する研究サーベイ