最新の記事
すべての記事

日本語

カテゴリー：推論能力

衝撃！DeepSeekが正式に2つのモデルをリリース
え？RLVRは新しい知識を学んでいるのではなく、知識をどのように使って推論するかを学んでいる！
プリンストン大学陳丹琦グループの新作：RLHFでは不十分、RLVRには限界？RLMTが第三の道を切り開く
階層的推論モデル Hierarchical Reasoning Model
従来のRAGは知識を検索するだけで活用できない？RAG+が推論能力を新たな高みへ！
NVIDIA（ProRL）｜RLはLLMの推論上限を本当に引き上げられるのか？
大規模モデルは数独が苦手？！Transformer開発者のスタートアップがランキング発表：o3 Mini Highの「変種数独」正答率はわずか2.9%
彼女はいかにして「システム2」を大規模言語モデルにもたらしたか | マイクロソフトリサーチアジアの張麗氏との対話
AIが賢くなるほど言うことを聞かなくなる！新研究：最強の推論モデルの指示遵守率はわずか50%
直感から「深層思考」へ：多次元的に進化する大規模モデルの推論能力
NVIDIAがAIをより賢くツール利用可能に：Nemotron-Research-Tool-N1モデルの詳細解析
ZTEの研究：LLM適応型問題難易度グレーディング蒸留により、小規模モデルも「長連鎖思考」能力を獲得
強化学習に基づくマルチモーダル大規模言語モデル推論能力に関する研究サーベイ

←
1
→

2025 AINews. All rights reserved.