AINews
  • 最新文章
  • 所有文章
  • 繁體中文

    分類: 後訓練

    • 強化學習(RL)記憶更牢固,監督微調(SFT)更容易遺忘?普林斯頓陳丹琦團隊改寫後訓練認知
    • ←
    • 1
    • →
    2025 AINews. All rights reserved.