大數據文摘出品
2025年,Llama 的締造者正在離開 Meta。
他們大多去向了 Mistral,這家總部位於巴黎的 AI 新創公司,正以「開源速度」反攻 Meta 自己開啟的戰場。
Llama 曾是 Meta 最具野心的 AI 作品:在 ChatGPT 和 PaLM 佔據主流話語權的 2023 年,Meta 用一篇重量級論文和一組開放權重的大型語言模型,意外地將開源陣營推上主舞台。而那時,Meta 的 AI 科研團隊 FAIR(Fundamental AI Research)也正處於高光時刻。
那篇震驚業界的論文:https://arxiv.org/pdf/2302.13971
但兩年後,這條路線似乎走到了岔路口。
Meta 官方尚未對「人才流失」作出正面回應,社群平台 X 上已經有一些討論。目前,14 位在 Llama 論文中署名的研究者,目前只剩 3 位仍在 Meta。有人評論道:Meta 開闢了一條通往開源未來的道路,卻眼睜睜看著建路的人轉身離開,另起爐灶。
01 一條持續的人才遷徙線
從 LinkedIn 記錄看,Llama 團隊的出走並非一朝一夕,它悄然展開於 2023 年初,至 2025 年初幾近完成。
最早一批離開的,是 Meta 內部資深研究員 Guillaume Lample 和 Timothée Lacroix。他們幾乎是 Llama 架構的奠基者,離職時間分別是 2023 年年初和 6 月。隨後,他們在巴黎創立了 Mistral AI。
圖註:Timothée Lacroix、Arthur Mensch 和 Guillaume Lample 是 Mistral AI 公司的共同創辦人。其中 Lacroix 與 Lample 曾參與撰寫 Meta 公司原始 Llama 論文。圖片來源於 businessinsider,由 Khanh Renaud/ABACAPRESS.COM 提供。侵刪
接下來的一年半內,包括 Marie-Anne Lachaux、Thibaut Lavril、Baptiste Rozière 等多位 Llama 作者陸續加入這家新創公司。如今,Mistral 的研究骨幹中,有一整支前 Meta 團隊。
而其他人也未偏離 AI 一線戰場。有人去了 Anthropic、DeepMind、微軟 AI,也有人加入了 Kyutai、Cohere 等二線研究機構。
他們平均在 Meta 任職超過五年,絕非「打工仔式的流動」。這更像一次認知的重構——那些曾深度參與 Meta AI 體系設計的人,正在以離職的方式,表達自己的方向選擇。
02 Meta 的開源理想,走得比公司策略更快
Meta 推出 Llama 時,用了一個不小的策略跳躍:它不再將模型封閉運行,而是開放權重、共享參數,允許開發者在單張 GPU 上復現最前沿模型。這在當時是對 OpenAI 和 Google 商業閉環思路的一次反向挑戰。
從技術上說,Llama 的設計確實更輕巧、更高效。它在資源消耗上做了權衡,不依賴大量私有數據,跑得也更快。這些「實用主義」的工程美學,正契合了開源社群的理想主義願景。
但問題是:當理想走得太快,公司策略未必跟得上。
Llama 模型在開發者間獲得大量好評,Llama 2 更是成為 HuggingFace 上最受歡迎的模型之一。但從 Llama 3 到 Llama 4,業界的情緒開始轉變。「不夠新」「進展慢」成為越來越多人的回饋。尤其在 DeepSeek、Qwen 等新勢力爆發式迭代之後,Meta 逐漸掉隊。
而更嚴重的警訊是,Meta 遲遲沒有推出類似 GPT-4 Turbo、Gemini Pro 這樣具備「推理能力」的模型版本。這意味著,在多步推理、鏈式調用、外部工具整合等下一代語言模型方向上,它已經落後。
《華爾街日報》甚至報導說,Meta 正在推遲其內部最大規模模型 Behemoth 的發布,因為團隊對其性能與領導方向存在分歧。
一邊是慢下來的產品節奏,一邊是熟悉 Meta 技術路線的核心研究員大量出走,Meta 顯得前後受敵。
03 FAIR 的隱退與「新 FAIR」的建立
過去一年,Meta 內部還有一個關鍵變化:領導 FAIR 八年的 Joelle Pineau 宣布辭去職務,其位置由 Robert Fergus 接替。這位新領導者曾在 DeepMind 任職五年,也是 FAIR 的早期共同創辦人。
FAIR 曾是 Meta 研究自信的核心:2014 年創立,曾在圖神經網路、機器翻譯、多模態學習等多個前沿領域發表影響深遠的成果。Llama 正是 FAIR 的巔峰之作。
但如今,這支隊伍核心團隊已散,方向也在變。
過去,FAIR 的基調是「開放 + 共享」;如今,Meta 對「應用」和「效率」的關注似乎壓倒了科研的探索熱情。在這樣一組矛盾中,許多研究員選擇離開,也就不難理解。
如果只看人事層面,Meta 的這波人才外流可以被視作「正常的團隊更替」,但事實顯然不止如此。
Mistral 並不只是吸收前 Meta 員工的公司,它已經是 Meta 的直接競爭對手。在多項模型評測中,Mistral 的 Mixtral 和 Tiny Mistral 憑藉參數規模與效果平衡,擊中了市場對「可部署模型」的需求。而這些成果,大多由前 Meta 團隊主導。
這使 Meta 處於一個尷尬位置:它定義了開源大型模型的第一章,但第二章正在被別人書寫。
04 Mistral:一支從 Meta 出走的隊伍
圖註:Mistral AI 官網截圖
Mistral AI 爆發式增長始於 2023 年,創立僅一個月便完成超 1 億美元的種子輪融資,並在之後的一年內迅速拉起多個大型模型家族。
Pixtral 面向多模態,Medium 3 瞄準 STEM 和程式設計任務,「Les Ministraux」則優化邊緣部署。
新近上線的 OCR API 和阿拉伯語模型 Saba,表明其產品策略已不再局限於英語語境或科研模型,而是在更廣泛場景中主動擴張。
但這場擴張背後,挑戰也顯而易見。
圖註:techcrunch 關於 Mistral 60 億估值的報導
首先是「影響力與變現能力不對稱」的困境。雖然聊天助理 Le Chat 在法國一度超越 ChatGPT 登上 App Store 下載榜首,但根據多方消息,Mistral 的營收仍停留在千萬美元級別。這對於一家估值 60 億美元的公司而言,仍遠不足以支撐 IPO 或擺脫被收購的猜疑。
模型「開放性」立場的自我張力也受限。Mistral 在早期以 Apache 2.0 協議開源模型著稱,但進入商業化階段後,其主力模型的權重並未公開,只保留部分「研究版本」可自由使用。這種「雙軌制」的策略雖可兼顧營收與聲譽,卻也招致部分開源社群的質疑:它是否正在變得越來越「閉源化」?
第三個隱憂則是國際擴展能力。雖然 Mistral 與法國軍方、AFP、Stellantis、IBM、Helsing 等達成策略合作,並與 NVIDIA、Bpifrance 在巴黎籌建 AI 校區,但其使用者群體和生態建設仍以歐洲市場為主。相較之下,OpenAI 和 Google 已在全球建構起完整的 API 平台、開發者工具鏈及消費級產品矩陣,具備更強的黏性和護城河。
總結下來,Mistral 的團隊規模、融資額和模型能力已經達到一線梯隊水準,但在全球化營運、基礎設施建設,以及長期生態搭建上,它還需要更多時間證明自己。
GPU 算力按需租用
A100/H100 GPU 算力按需租用,
秒級計費,平均節省開支 30% 以上!
掃碼了解詳情☝
點「在看」的人都變好看了哦!