Alibaba、Qwen新モデルをオープンソース化:端午の節句の贈り物!

QwenLong-L1-32Bは、長文コンテキスト推論のためにRLで訓練された初の長文コンテキスト言語推論モデル(LRM)です。

7つの長文コンテキストDocQAベンチマークでの実験結果によると、QwenLong-L1-32BはOpenAI-o3-miniやQwen3-235B-A22Bといった主要なLRMよりも優れており、Claude-3.7-Sonnet-Thinkingに匹敵する性能を示し、現在の最先端LRMの中でトップの性能を誇ります。

图片

オープンソースアドレス:https://huggingface.co/Tongyi-Zhiwen/QwenLong-L1-32B

プロジェクトアドレス:https://github.com/Tongyi-Zhiwen/QwenLong-L1

データセットはこちら:https://huggingface.co/datasets/Tongyi-Zhiwen/DocQA-RL-1.6K

R1の価値はやはり非常に高いです〜

图片

最大長120kをサポート

图片

メインタグ:人工知能

サブタグ:大規模言語モデル自然言語処理機械学習オープンソース


前の記事:ICML 2025 | 速くて強力なライガー!わずか20Mトークンでファインチューニング、Transformerが瞬時に線形RNNに切り替わる

次の記事:ICML 2025 | 「人間テスト法」でAIバブルを突き破る:能力指向型適応的評価の新パラダイムを構築する

短いURLをシェア