最新の記事
すべての記事

日本語

カテゴリー：モデル訓練

NVIDIA（ProRL）｜RLはLLMの推論上限を本当に引き上げられるのか？
R1型訓練はもはや結果の正誤だけでなく！香港中文大学がSophiaVL-R1モデルを発表
LLMとRLの組み合わせに疑問符：意図的な誤った報酬でも数学ベンチマークが大幅向上、AI界に衝撃
AM-Thinking-v1：32B規模での推論能力の最前線を推進
ZTEワイヤレス研究所「大規模モデル深潜」チーム、LLM適応型質問難易度蒸留法を発表、小規模モデルの推論能力を大幅に向上

←
1
→

2025 AINews. All rights reserved.