JetBrainsは、コード補完LLMであるMellumが、Hugging Faceでオープンソースモデルとして利用可能になったことを発表しました。
同社によると、Mellumは「フォーカスモデル」であり、すべての機能に習熟しようとするのではなく、特定のタスクのために専門的に構築されたことを意味します。
「コード補完という1つのことに優れるように意図的に設計されました」と、JetBrainsのシニアプロダクトマネージャーであるアントン・セメンキン氏と、AIアドボケートであるミシェル・フロスト氏は記事に書いています。
リンク:https://huggingface.co/JetBrains/Mellum-4b-base
Mellumモデルは、一般的な大規模モデルよりも運用コストが低いため、大規模モデルを運用するリソースがないチームでも簡単に使用できます。
「T字型スキルを持つ人材を考えてみてください。これは、多くのトピックについて幅広い理解(水平方向の知識)を持っていますが、特定の分野で深い専門知識(垂直方向の深さ)を持っている人です。Mellumモデルは同じ哲学に従います。すべてを行うように構築されているわけではありません。代わりに、1つのタスクに焦点を当てており、それに優れています。そして、その深さがタスクに真の価値を生み出すのです」と、モデルの作者は記しています。
Mellumは現在、Java、Kotlin、Python、Go、PHP、C、C++、C#、JavaScript、TypeScript、CSS、HTML、Rust、Rubyといったいくつかの人気プログラミング言語のコード補完をサポートしています。
JetBrainsは、Mellumを、差分予測のような他の特定のコーディングタスクに非常によく適した、異なるフォーカスモデルのシリーズとして発展させる計画です。
Mellumの現在のバージョンは、ソフトウェア開発におけるAIの役割を探求するAI/ML研究者や、ドメイン固有言語モデルを構築、ファインチューニング、適応させる方法の基礎を求めるAI/MLエンジニアまたは教育者に最適です。
Mellumモデルは、そのまま使えるソリューションではありません。
Hugging Faceでリリースすることで、R&Dプロフェッショナル、教育者、先進的なチームが、専門モデルの基盤となる仕組みを探求する機会を提供します。
著者:行動中の大雄
参考:
https://blog.jetbrains.com/ai/2025/04/mellum-goes-open-source-a-purpose-built-llm-for-developers-now-on-hugging-face/
関連記事:
MetaのCTO:AIはApp Storeを終わらせる可能性がある
OpenAIがフラッグシップAIモデルGPT-4.1を発表
適切な大規模言語モデルを選択する方法