Llama 論文作者「出走」，14 人團隊僅剩 3 人，法國獨角獸 Mistral 成最大贏家

大數據文摘出品

2025年，Llama 的締造者正在離開 Meta。

他們大多去向了 Mistral，這家總部位於巴黎的 AI 新創公司，正以「開源速度」反攻 Meta 自己開啟的戰場。

Llama 曾是 Meta 最具野心的 AI 作品：在 ChatGPT 和 PaLM 佔據主流話語權的 2023 年，Meta 用一篇重量級論文和一組開放權重的大型語言模型，意外地將開源陣營推上主舞台。而那時，Meta 的 AI 科研團隊 FAIR（Fundamental AI Research）也正處於高光時刻。

那篇震驚業界的論文：https://arxiv.org/pdf/2302.13971

但兩年後，這條路線似乎走到了岔路口。

Meta 官方尚未對「人才流失」作出正面回應，社群平台 X 上已經有一些討論。目前，14 位在 Llama 論文中署名的研究者，目前只剩 3 位仍在 Meta。有人評論道：Meta 開闢了一條通往開源未來的道路，卻眼睜睜看著建路的人轉身離開，另起爐灶。

01 一條持續的人才遷徙線

從 LinkedIn 記錄看，Llama 團隊的出走並非一朝一夕，它悄然展開於 2023 年初，至 2025 年初幾近完成。

最早一批離開的，是 Meta 內部資深研究員 Guillaume Lample 和 Timothée Lacroix。他們幾乎是 Llama 架構的奠基者，離職時間分別是 2023 年年初和 6 月。隨後，他們在巴黎創立了 Mistral AI。

圖註：Timothée Lacroix、Arthur Mensch 和 Guillaume Lample 是 Mistral AI 公司的共同創辦人。其中 Lacroix 與 Lample 曾參與撰寫 Meta 公司原始 Llama 論文。圖片來源於 businessinsider，由 Khanh Renaud/ABACAPRESS.COM 提供。侵刪

接下來的一年半內，包括 Marie-Anne Lachaux、Thibaut Lavril、Baptiste Rozière 等多位 Llama 作者陸續加入這家新創公司。如今，Mistral 的研究骨幹中，有一整支前 Meta 團隊。

而其他人也未偏離 AI 一線戰場。有人去了 Anthropic、DeepMind、微軟 AI，也有人加入了 Kyutai、Cohere 等二線研究機構。

他們平均在 Meta 任職超過五年，絕非「打工仔式的流動」。這更像一次認知的重構——那些曾深度參與 Meta AI 體系設計的人，正在以離職的方式，表達自己的方向選擇。

02 Meta 的開源理想，走得比公司策略更快

Meta 推出 Llama 時，用了一個不小的策略跳躍：它不再將模型封閉運行，而是開放權重、共享參數，允許開發者在單張 GPU 上復現最前沿模型。這在當時是對 OpenAI 和 Google 商業閉環思路的一次反向挑戰。

從技術上說，Llama 的設計確實更輕巧、更高效。它在資源消耗上做了權衡，不依賴大量私有數據，跑得也更快。這些「實用主義」的工程美學，正契合了開源社群的理想主義願景。

但問題是：當理想走得太快，公司策略未必跟得上。

Llama 模型在開發者間獲得大量好評，Llama 2 更是成為 HuggingFace 上最受歡迎的模型之一。但從 Llama 3 到 Llama 4，業界的情緒開始轉變。「不夠新」「進展慢」成為越來越多人的回饋。尤其在 DeepSeek、Qwen 等新勢力爆發式迭代之後，Meta 逐漸掉隊。

而更嚴重的警訊是，Meta 遲遲沒有推出類似 GPT-4 Turbo、Gemini Pro 這樣具備「推理能力」的模型版本。這意味著，在多步推理、鏈式調用、外部工具整合等下一代語言模型方向上，它已經落後。

《華爾街日報》甚至報導說，Meta 正在推遲其內部最大規模模型 Behemoth 的發布，因為團隊對其性能與領導方向存在分歧。

一邊是慢下來的產品節奏，一邊是熟悉 Meta 技術路線的核心研究員大量出走，Meta 顯得前後受敵。

03 FAIR 的隱退與「新 FAIR」的建立

過去一年，Meta 內部還有一個關鍵變化：領導 FAIR 八年的 Joelle Pineau 宣布辭去職務，其位置由 Robert Fergus 接替。這位新領導者曾在 DeepMind 任職五年，也是 FAIR 的早期共同創辦人。

FAIR 曾是 Meta 研究自信的核心：2014 年創立，曾在圖神經網路、機器翻譯、多模態學習等多個前沿領域發表影響深遠的成果。Llama 正是 FAIR 的巔峰之作。

但如今，這支隊伍核心團隊已散，方向也在變。

過去，FAIR 的基調是「開放 + 共享」；如今，Meta 對「應用」和「效率」的關注似乎壓倒了科研的探索熱情。在這樣一組矛盾中，許多研究員選擇離開，也就不難理解。

如果只看人事層面，Meta 的這波人才外流可以被視作「正常的團隊更替」，但事實顯然不止如此。

Mistral 並不只是吸收前 Meta 員工的公司，它已經是 Meta 的直接競爭對手。在多項模型評測中，Mistral 的 Mixtral 和 Tiny Mistral 憑藉參數規模與效果平衡，擊中了市場對「可部署模型」的需求。而這些成果，大多由前 Meta 團隊主導。

這使 Meta 處於一個尷尬位置：它定義了開源大型模型的第一章，但第二章正在被別人書寫。

04 Mistral：一支從 Meta 出走的隊伍

圖註：Mistral AI 官網截圖

Mistral AI 爆發式增長始於 2023 年，創立僅一個月便完成超 1 億美元的種子輪融資，並在之後的一年內迅速拉起多個大型模型家族。

Pixtral 面向多模態，Medium 3 瞄準 STEM 和程式設計任務，「Les Ministraux」則優化邊緣部署。

新近上線的 OCR API 和阿拉伯語模型 Saba，表明其產品策略已不再局限於英語語境或科研模型，而是在更廣泛場景中主動擴張。

但這場擴張背後，挑戰也顯而易見。

圖註：techcrunch 關於 Mistral 60 億估值的報導

首先是「影響力與變現能力不對稱」的困境。雖然聊天助理 Le Chat 在法國一度超越 ChatGPT 登上 App Store 下載榜首，但根據多方消息，Mistral 的營收仍停留在千萬美元級別。這對於一家估值 60 億美元的公司而言，仍遠不足以支撐 IPO 或擺脫被收購的猜疑。

模型「開放性」立場的自我張力也受限。Mistral 在早期以 Apache 2.0 協議開源模型著稱，但進入商業化階段後，其主力模型的權重並未公開，只保留部分「研究版本」可自由使用。這種「雙軌制」的策略雖可兼顧營收與聲譽，卻也招致部分開源社群的質疑：它是否正在變得越來越「閉源化」？

第三個隱憂則是國際擴展能力。雖然 Mistral 與法國軍方、AFP、Stellantis、IBM、Helsing 等達成策略合作，並與 NVIDIA、Bpifrance 在巴黎籌建 AI 校區，但其使用者群體和生態建設仍以歐洲市場為主。相較之下，OpenAI 和 Google 已在全球建構起完整的 API 平台、開發者工具鏈及消費級產品矩陣，具備更強的黏性和護城河。

總結下來，Mistral 的團隊規模、融資額和模型能力已經達到一線梯隊水準，但在全球化營運、基礎設施建設，以及長期生態搭建上，它還需要更多時間證明自己。

GPU 算力按需租用

A100/H100 GPU 算力按需租用，

秒級計費，平均節省開支 30% 以上！

掃碼了解詳情☝

點「在看」的人都變好看了哦！

Llama 論文作者「出走」，14 人團隊僅剩 3 人，法國獨角獸 Mistral 成最大贏家

分享短網址