AINews
  • 最新文章
  • 所有文章
  • 繁體中文

    分類: 知識蒸餾

    • 注意力總是發散?人大與清華大學聯合提出LeaF:移除干擾型Token,引導模型學會自主聚焦
    • NVIDIA Llama Nemotron 系列模型:關鍵技術解析
    • 中興通訊研究:LLM自適應題目難度分級蒸餾,讓小模型也擁有「長鏈思考」能力
    • ←
    • 1
    • →
    2025 AINews. All rights reserved.