Llama 論文作者「出走」,14 人團隊僅剩 3 人,法國獨角獸 Mistral 成最大贏家

圖片

大數據文摘出品

2025年,Llama 的締造者正在離開 Meta。

他們大多去向了 Mistral,這家總部位於巴黎的 AI 新創公司,正以「開源速度」反攻 Meta 自己開啟的戰場。

Llama 曾是 Meta 最具野心的 AI 作品:在 ChatGPT 和 PaLM 佔據主流話語權的 2023 年,Meta 用一篇重量級論文和一組開放權重的大型語言模型,意外地將開源陣營推上主舞台。而那時,Meta 的 AI 科研團隊 FAIR(Fundamental AI Research)也正處於高光時刻。

圖片

那篇震驚業界的論文:https://arxiv.org/pdf/2302.13971

但兩年後,這條路線似乎走到了岔路口。

Meta 官方尚未對「人才流失」作出正面回應,社群平台 X 上已經有一些討論。目前,14 位在 Llama 論文中署名的研究者,目前只剩 3 位仍在 Meta。有人評論道:Meta 開闢了一條通往開源未來的道路,卻眼睜睜看著建路的人轉身離開,另起爐灶。

圖片

01 一條持續的人才遷徙線

從 LinkedIn 記錄看,Llama 團隊的出走並非一朝一夕,它悄然展開於 2023 年初,至 2025 年初幾近完成。

最早一批離開的,是 Meta 內部資深研究員 Guillaume Lample 和 Timothée Lacroix。他們幾乎是 Llama 架構的奠基者,離職時間分別是 2023 年年初和 6 月。隨後,他們在巴黎創立了 Mistral AI。

圖片

圖註:Timothée Lacroix、Arthur Mensch 和 Guillaume Lample 是 Mistral AI 公司的共同創辦人。其中 Lacroix 與 Lample 曾參與撰寫 Meta 公司原始 Llama 論文。圖片來源於 businessinsider,由 Khanh Renaud/ABACAPRESS.COM 提供。侵刪

接下來的一年半內,包括 Marie-Anne Lachaux、Thibaut Lavril、Baptiste Rozière 等多位 Llama 作者陸續加入這家新創公司。如今,Mistral 的研究骨幹中,有一整支前 Meta 團隊。

而其他人也未偏離 AI 一線戰場。有人去了 Anthropic、DeepMind、微軟 AI,也有人加入了 Kyutai、Cohere 等二線研究機構。

他們平均在 Meta 任職超過五年,絕非「打工仔式的流動」。這更像一次認知的重構——那些曾深度參與 Meta AI 體系設計的人,正在以離職的方式,表達自己的方向選擇。

02 Meta 的開源理想,走得比公司策略更快

Meta 推出 Llama 時,用了一個不小的策略跳躍:它不再將模型封閉運行,而是開放權重、共享參數,允許開發者在單張 GPU 上復現最前沿模型。這在當時是對 OpenAI 和 Google 商業閉環思路的一次反向挑戰。

從技術上說,Llama 的設計確實更輕巧、更高效。它在資源消耗上做了權衡,不依賴大量私有數據,跑得也更快。這些「實用主義」的工程美學,正契合了開源社群的理想主義願景。

但問題是:當理想走得太快,公司策略未必跟得上。

Llama 模型在開發者間獲得大量好評,Llama 2 更是成為 HuggingFace 上最受歡迎的模型之一。但從 Llama 3 到 Llama 4,業界的情緒開始轉變。「不夠新」「進展慢」成為越來越多人的回饋。尤其在 DeepSeek、Qwen 等新勢力爆發式迭代之後,Meta 逐漸掉隊。

而更嚴重的警訊是,Meta 遲遲沒有推出類似 GPT-4 Turbo、Gemini Pro 這樣具備「推理能力」的模型版本。這意味著,在多步推理、鏈式調用、外部工具整合等下一代語言模型方向上,它已經落後。

圖片

《華爾街日報》甚至報導說,Meta 正在推遲其內部最大規模模型 Behemoth 的發布,因為團隊對其性能與領導方向存在分歧。

一邊是慢下來的產品節奏,一邊是熟悉 Meta 技術路線的核心研究員大量出走,Meta 顯得前後受敵。

03 FAIR 的隱退與「新 FAIR」的建立

過去一年,Meta 內部還有一個關鍵變化:領導 FAIR 八年的 Joelle Pineau 宣布辭去職務,其位置由 Robert Fergus 接替。這位新領導者曾在 DeepMind 任職五年,也是 FAIR 的早期共同創辦人。

FAIR 曾是 Meta 研究自信的核心:2014 年創立,曾在圖神經網路、機器翻譯、多模態學習等多個前沿領域發表影響深遠的成果。Llama 正是 FAIR 的巔峰之作。

但如今,這支隊伍核心團隊已散,方向也在變。

過去,FAIR 的基調是「開放 + 共享」;如今,Meta 對「應用」和「效率」的關注似乎壓倒了科研的探索熱情。在這樣一組矛盾中,許多研究員選擇離開,也就不難理解。

如果只看人事層面,Meta 的這波人才外流可以被視作「正常的團隊更替」,但事實顯然不止如此。

Mistral 並不只是吸收前 Meta 員工的公司,它已經是 Meta 的直接競爭對手。在多項模型評測中,Mistral 的 Mixtral 和 Tiny Mistral 憑藉參數規模與效果平衡,擊中了市場對「可部署模型」的需求。而這些成果,大多由前 Meta 團隊主導。

這使 Meta 處於一個尷尬位置:它定義了開源大型模型的第一章,但第二章正在被別人書寫。

04 Mistral:一支從 Meta 出走的隊伍

圖片

圖註:Mistral AI 官網截圖

Mistral AI 爆發式增長始於 2023 年,創立僅一個月便完成超 1 億美元的種子輪融資,並在之後的一年內迅速拉起多個大型模型家族。

Pixtral 面向多模態,Medium 3 瞄準 STEM 和程式設計任務,「Les Ministraux」則優化邊緣部署。

新近上線的 OCR API 和阿拉伯語模型 Saba,表明其產品策略已不再局限於英語語境或科研模型,而是在更廣泛場景中主動擴張。

但這場擴張背後,挑戰也顯而易見。

圖片

圖註:techcrunch 關於 Mistral 60 億估值的報導

首先是「影響力與變現能力不對稱」的困境。雖然聊天助理 Le Chat 在法國一度超越 ChatGPT 登上 App Store 下載榜首,但根據多方消息,Mistral 的營收仍停留在千萬美元級別。這對於一家估值 60 億美元的公司而言,仍遠不足以支撐 IPO 或擺脫被收購的猜疑。

模型「開放性」立場的自我張力也受限。Mistral 在早期以 Apache 2.0 協議開源模型著稱,但進入商業化階段後,其主力模型的權重並未公開,只保留部分「研究版本」可自由使用。這種「雙軌制」的策略雖可兼顧營收與聲譽,卻也招致部分開源社群的質疑:它是否正在變得越來越「閉源化」?

第三個隱憂則是國際擴展能力。雖然 Mistral 與法國軍方、AFP、Stellantis、IBM、Helsing 等達成策略合作,並與 NVIDIA、Bpifrance 在巴黎籌建 AI 校區,但其使用者群體和生態建設仍以歐洲市場為主。相較之下,OpenAI 和 Google 已在全球建構起完整的 API 平台、開發者工具鏈及消費級產品矩陣,具備更強的黏性和護城河。

總結下來,Mistral 的團隊規模、融資額和模型能力已經達到一線梯隊水準,但在全球化營運、基礎設施建設,以及長期生態搭建上,它還需要更多時間證明自己。

圖片

GPU 算力按需租用

A100/H100 GPU 算力按需租用,

秒級計費,平均節省開支 30% 以上!

圖片

掃碼了解詳情☝

圖片

圖片

圖片

點「在看」的人都變好看了哦!

主標籤:人工智慧

次標籤:大型語言模型新創公司人才流失開源


上一篇:長推理≠高精準度!自適應切換「即時回答」與「深度思考」:節省 Token 與提升精準度的雙贏哲學

下一篇:Trae開始收費了,Cursor該緊張了!

分享短網址