AINews
  • 最新の記事
  • すべての記事
  • 日本語

    カテゴリー: モデル訓練

    • NVIDIA(ProRL)|RLはLLMの推論上限を本当に引き上げられるのか?
    • R1型訓練はもはや結果の正誤だけでなく!香港中文大学がSophiaVL-R1モデルを発表
    • LLMとRLの組み合わせに疑問符:意図的な誤った報酬でも数学ベンチマークが大幅向上、AI界に衝撃
    • AM-Thinking-v1:32B規模での推論能力の最前線を推進
    • ZTEワイヤレス研究所「大規模モデル深潜」チーム、LLM適応型質問難易度蒸留法を発表、小規模モデルの推論能力を大幅に向上
    • ←
    • 1
    • →
    2025 AINews. All rights reserved.