凌晨時分，Qwen再次更新，RTX 3090 即可運行，30億參數激活可媲美 GPT-4o

繼前段時間密集發布三款 AI 大型模型後，Qwen 於凌晨時分再次更新了 —— 原本的 Qwen3-30B-A3B 有了一個新版本：Qwen3-30B-A3B-Instruct-2507。

這個新版本是一個非思考模式（non-thinking mode）的模型。它的亮點在於，僅激活 30 億（3B）參數，就能展現出與業界頂尖閉源模型，如 Google 的 Gemini 2.5-Flash（非思考模式）和 OpenAI 的 GPT-4o 相媲美的超強實力，這標誌著模型效率和性能優化上的一次重大突破。

下圖展示了該模型的性能數據，可以看出，與更新前的版本相比，新版本在多項測試中都實現了跨越式提升，例如 AIME25 從之前的 21.6 提升到了 61.3，Arena-Hard v2 成績從 24.8 提升到了 69.0。

下圖展示了新版本和 DeepSeek-V3-0324 等模型的性能對比結果，可以看到，在許多基準測試中，新版本模型可以基本追平甚至超越 DeepSeek-V3-0324。

這讓人感嘆模型計算效率的提升速度。

具體來說，Qwen3-30B-A3B-Instruct-2507 在多方面實現了關鍵提升：

通用能力大幅提升，包括指令遵循、邏輯推理、文本理解、數學、科學、程式設計及工具使用等多方面；
在多語言的長尾知識覆蓋方面，模型進步顯著；
在主觀和開放任務中，新模型與使用者偏好進一步緊密對齊，可以生成更高品質的文本，為使用者提供更有幫助的回答；
長文本理解能力提升至 256K。

目前模型已在魔搭社區和 HuggingFace 等平台開源。在 QwenChat 上也可以直接體驗。

體驗連結：http://chat.qwen.ai/

該模型發布後，也很快得到了社群的支持，有了更多的使用管道，甚至還有量化版本。這就是開源的力量。

它的出現，讓大家在消費級 GPU 上運行 AI 模型有了新的選擇。

有人展示了這個新版本在自己的 Mac 電腦、搭載 RTX 3090 的 PC 等設備上的運行體驗。

如果你也想運行這個模型，可以參考這個配置要求：

值得注意的是，這次的新版本模型是一個非推理模型。著名開發者 Simon Willison 將該模型與他之前測試過的「推理」模型（例如 GLM-4.5 Air）進行了比較。他得出的核心結論是：對於生成「開箱即用」的複雜程式碼這類任務，模型是否具備「推理」能力可能是一個至關重要的因素。

Qwen 團隊的這次更新依然在深夜進行，這讓其他同行再次感覺到競爭的壓力。不過，每天醒來都能看到 AI 的能力又上了一個新台階，這本身就是一件令人興奮的事。

© THE END

轉載請聯繫本公眾號獲得授權

投稿或尋求報導：liyazhou@jiqizhixin.com

主標籤：大型語言模型

次標籤：Qwen、GPU運算、深度學習、開源AI

上一篇：Dualformer：透過隨機推理軌跡學習實現可控的快速與慢速思考

下一篇：人工智慧安全與沉思：心靈與通用人工智慧對齊的計算模型

分享短網址

原始網址：https://mp.weixin.qq.com/s/g65uTnvrdoCv2MIMACMpDA