AINews
最新の記事
すべての記事
日本語
Light
Dark
System
カテゴリー: 自己教師あり学習
清華大学などがAbsolute Zero自己対戦型大規模モデルを提案、データなし学習で多数のタスクで最高性能を達成
SFT+RL二段階学習でLLMの自己教師あり学習を突破!人民大学DeepCriticがAI批評の自律進化を実現
AIが「自信」のみで推論を学習、浙江大学出身者がDeepSeekの長思考連鎖の出現を再現、強化学習は外部報酬信号を必要としない
←
1
→