最新の記事
すべての記事

日本語

カテゴリー：自己教師あり学習

清華大学などがAbsolute Zero自己対戦型大規模モデルを提案、データなし学習で多数のタスクで最高性能を達成
SFT+RL二段階学習でLLMの自己教師あり学習を突破！人民大学DeepCriticがAI批評の自律進化を実現
AIが「自信」のみで推論を学習、浙江大学出身者がDeepSeekの長思考連鎖の出現を再現、強化学習は外部報酬信号を必要としない

←
1
→

2025 AINews. All rights reserved.