凌晨時分,Qwen再次更新,RTX 3090 即可運行,30億參數激活可媲美 GPT-4o

繼前段時間密集發布三款 AI 大型模型後,Qwen 於凌晨時分再次更新了 —— 原本的 Qwen3-30B-A3B 有了一個新版本:Qwen3-30B-A3B-Instruct-2507。

這個新版本是一個非思考模式(non-thinking mode)的模型。它的亮點在於,僅激活 30 億(3B)參數,就能展現出與業界頂尖閉源模型,如 Google 的 Gemini 2.5-Flash(非思考模式)和 OpenAI 的 GPT-4o 相媲美的超強實力,這標誌著模型效率和性能優化上的一次重大突破。

下圖展示了該模型的性能數據,可以看出,與更新前的版本相比,新版本在多項測試中都實現了跨越式提升,例如 AIME25 從之前的 21.6 提升到了 61.3,Arena-Hard v2 成績從 24.8 提升到了 69.0。

image.png

下圖展示了新版本和 DeepSeek-V3-0324 等模型的性能對比結果,可以看到,在許多基準測試中,新版本模型可以基本追平甚至超越 DeepSeek-V3-0324。

image.png

這讓人感嘆模型計算效率的提升速度。

image.png

具體來說,Qwen3-30B-A3B-Instruct-2507 在多方面實現了關鍵提升:

  • 通用能力大幅提升,包括指令遵循、邏輯推理、文本理解、數學、科學、程式設計及工具使用等多方面;

  • 在多語言的長尾知識覆蓋方面,模型進步顯著;

  • 在主觀和開放任務中,新模型與使用者偏好進一步緊密對齊,可以生成更高品質的文本,為使用者提供更有幫助的回答;

  • 長文本理解能力提升至 256K。

image.png

目前模型已在魔搭社區和 HuggingFace 等平台開源。在 QwenChat 上也可以直接體驗。

體驗連結:http://chat.qwen.ai/

該模型發布後,也很快得到了社群的支持,有了更多的使用管道,甚至還有量化版本。這就是開源的力量。

image.png

image.png

它的出現,讓大家在消費級 GPU 上運行 AI 模型有了新的選擇。

cef17d935bd7cfa16696ddda5da5f5d.png

有人展示了這個新版本在自己的 Mac 電腦、搭載 RTX 3090 的 PC 等設備上的運行體驗。

image.png

image.png

image.png

如果你也想運行這個模型,可以參考這個配置要求:

image.png

值得注意的是,這次的新版本模型是一個非推理模型。著名開發者 Simon Willison 將該模型與他之前測試過的「推理」模型(例如 GLM-4.5 Air)進行了比較。他得出的核心結論是:對於生成「開箱即用」的複雜程式碼這類任務,模型是否具備「推理」能力可能是一個至關重要的因素。

image.png

Qwen 團隊的這次更新依然在深夜進行,這讓其他同行再次感覺到競爭的壓力。不過,每天醒來都能看到 AI 的能力又上了一個新台階,這本身就是一件令人興奮的事。

cef17d935bd7cfa16696ddda5da5f5d.png

© THE END

轉載請聯繫本公眾號獲得授權

投稿或尋求報導:liyazhou@jiqizhixin.com

主標籤:大型語言模型

次標籤:QwenGPU運算深度學習開源AI


上一篇:Dualformer:透過隨機推理軌跡學習實現可控的快速與慢速思考

下一篇:人工智慧安全與沉思:心靈與通用人工智慧對齊的計算模型

分享短網址