AINews
最新の記事
すべての記事
日本語
Light
Dark
System
カテゴリー: モデル訓練
NVIDIA(ProRL)|RLはLLMの推論上限を本当に引き上げられるのか?
R1型訓練はもはや結果の正誤だけでなく!香港中文大学がSophiaVL-R1モデルを発表
LLMとRLの組み合わせに疑問符:意図的な誤った報酬でも数学ベンチマークが大幅向上、AI界に衝撃
AM-Thinking-v1:32B規模での推論能力の最前線を推進
ZTEワイヤレス研究所「大規模モデル深潜」チーム、LLM適応型質問難易度蒸留法を発表、小規模モデルの推論能力を大幅に向上
←
1
→