JetBrains 開源其程式碼補全 LLM Mellum

JetBrains 宣布其程式碼補全 LLM Mellum 現已作為開源模型在 Hugging Face 上提供。

據這家公司稱,Mellum 是一種「焦點模型」,這意味著它是專門為特定任務而建構的,而不是要試圖精通所有功能。

JetBrains 高級產品經理 安東·謝門金(Anton Semenkin)和 JetBrains 人工智慧倡導者 米歇爾·弗羅斯特(Michelle Frost)在一篇文章中如下寫道:

「它的設計初衷就是為了出色地完成一件事:程式碼補全。」

地址傳送門:https://huggingface.co/JetBrains/Mellum-4b-base

JetBrains Mellum LLM

Mellum 模型的運行成本比一般的大型模型要低,這使得沒有資源運行大型模型的團隊更加容易地使用它們。

「可以把它想像成T型技能人。這指的是一個人對許多主題都有廣泛的理解(水平頂欄或知識廣度),但在某個特定領域擁有深厚的專業知識(垂直桿或深度)。Mellum 模型遵循同樣的理念:它們並非為處理所有事情而建構。相反,它們專注於並擅長一項任務,而深度正是這項任務真正創造價值的關鍵,」該模型的作者這樣寫道。

Mellum 目前支援幾種流行程式語言的程式碼補全:Java、Kotlin、Python、Go、PHP、C、C++、C#、JavaScript、TypeScript、CSS、HTML、Rust、Ruby。

JetBrains 計劃將 Mellum 發展成為一個包含不同焦點模型的系列,非常適合其他特定的編碼任務,例如差異預測。

Mellum 的目前版本最適合探索 AI 在軟體開發中的作用的 AI/ML 研究人員,或作為學習如何建構、微調和調整特定領域語言模型的基礎的 AI/ML 工程師或教育工作者。

Mellum 模型亦並非即插即用的解決方案。

透過在 Hugging Face 上發布,它為研發人員、教育工作者和高級團隊提供了探索專用模型底層工作原理的機會。

作者:行動中的大雄

參考:

https://blog.jetbrains.com/ai/2025/04/mellum-goes-open-source-a-purpose-built-llm-for-developers-now-on-hugging-face/

相關閱讀:

Meta 首席技術官:AI 或將終結 App Store

OpenAI 推出其 GPT-4.1 旗艦 AI 模型

如何選擇合適的大語言模型

主標籤:人工智慧

次標籤:程式碼補全JetBrains開源大型語言模型 (LLM)


上一篇:一台 6 美元的伺服器如何使用 Zip 炸彈挺過病毒式流量

下一篇:今日AI前沿進展快訊

分享短網址