英偉達擬砸 10 億美元給這家 AI 編碼新創!Copilot 技術大佬領軍、成立兩年估值近千億

圖片

10 月 30 日,據彭博社援引知情人士報導,英偉達計劃向人工智慧新創公司 Poolside 投資最高達 10 億美元,這筆交易預計將使後者的估值翻四倍。

消息人士稱,Poolside 目前正在洽談一輪新融資,擬以 120 億美元的投前估值融資 20 億美元。其中,英偉達計劃出資至少 5 億美元,若本輪融資順利完成,英偉達的總投資額可能達到 10 億美元。

據報導,Poolside 在最新一輪融資中已獲得超過 10 億美元的投資承諾,其中包括來自現有投資者的約 7 億美元。

Poolside 是一家提供人工智慧驅動編碼助手的公司,其產品能夠幫助開發者提升程式碼編寫與除錯效率。

截至發稿,英偉達與 Poolside 均未就此事回應媒體的置評請求。

那麼,被英偉達看上的這家 AI 新創有什麼來頭?

微軟技術大佬領軍,成立兩年估值近千億

Poolside AI 成立於 2023 年,最初總部位於美國加州舊金山,後將總部及營運重心移至法國巴黎。公司定位是生成式 AI+軟體開發的交叉領域,目標打造「寫程式碼的 AI 助手/編碼助手」以及更長遠的「通用人工智慧」方向。

公司創辦人 Jason Warner 和 Eiso Kant 兩人均為軟體工程師,Warner 在 Poolside 擔任 CEO,Kant 則擔任 CTO。

創辦 Poolside 之前,Warner 曾任 GitHub 的 CTO,孵化了 GitHub 的人工智慧工具 Copilot,還負責過包括 GitHub Actions、Packages、Codespaces、Advanced Security 等產品線,也曾在 Canonical 和 Heroku 領導工程團隊。

圖片

Jason Warner

Kant 是一位連續創業家,此前聯合他人創立了多家專注於開發者的新創公司,包括工程分析公司 Athenian。

圖片

Eiso Kant

Warner 在 2017 年結識了 Kant。在接下來的六年裡,兩人共同規劃了一套面向開發者的 AI 驅動輔助工具套件,最終發展成為 Poolside。

Warner 曾在一次訪談中解釋了自己離開微軟創辦 Poolside 的初心。

Warner 認為當前產業低估了 AI 對軟體開發的顛覆性影響。他堅信未來的核心在於建構專為軟體開發設計的人工智慧,而非依賴通用模型(如 GitHub Copilot 背後的 GPT 系列)。他認為,實現「完整的程式合成」(即 AI 自動生成完整程式)這一終極目標,必須透過專注軟體的專業化 AI 來實現,而非通用模型,這是他決定創辦獨立公司以專注解決此問題的關鍵動機。

Warner 表示:「微軟不再創新,而且幾十年來都沒有創新。微軟是一家私募股權公司,持有多个不同領域的各種資產。所以,它與 OpenAI 的合作、收購 GitHub、LinkedIn、Minecraft 等等,都表明它不再是一家軟體開發公司,而是一家私募股權公司。他們正在整合各個產業的資源,這些資源將他們凝聚在一起,並賦予他們如今的市場地位。而且他們在這方面做得比任何人都好。他們也敏銳地洞察到了這一趨勢。在人工智慧領域,他們一直遙遙領先於其他所有競爭對手。只要他們保持這種勢頭——而且我看不出這方面會有任何改變——他們就處於一個非常有利的市場地位。其他涉足這一領域的公司實際上都錯過了這股潮流。」

Poolside 開發了自己的 AI 模型,用於輔助完成诸如程式碼自動補全和針對特定脈絡或程式碼庫推薦可能相關的程式碼等任務——這與競爭對手的 AI 輔助編碼工具非常相似。該公司的客戶主要為全球 2000 強企業和公共部門機構;鮮有客戶公開披露。

截至今年 3 月份,Poolside 公司擁有近 100 名員工。

據公開資訊披露,自成立起公司已經完成了三輪融資,累計籌集資金 6.26 億美元,當前估值已達 30 億美元。

2023 年 5 月,Poolside 完成種子輪融資,籌集金額 2600 萬美元,由紅點創投領投,本輪估值未公開披露,所獲資金主要用於啟動 AI 平台的開發及初始基礎設施的搭建。

時隔三個月,Poolside 在 2023 年 8 月成功完成 1 億美元的 A 輪融資,此次融資由 Felicis、紅點創投中國及 Xavier Niel 聯合領投,估值仍未對外公布,融資款項將用於擴大團隊規模,加快產品開發進度。

進入 2024 年 10 月,Poolside 完成 B 輪融資,籌集金額高達 5 億美元,領投方為貝恩資本風險投資公司,本輪估值正式確定為 30 億美元。據悉,該輪融資資金將重點投入 AI 驅動軟體開發工具的研發,同時強化市場進入策略,並進一步加速整體研發活動的推進。

Poolside 有何特別之處能被英偉達看上?

在 B 輪融資完成後,公司兩位創辦人在官網部落格上發布了一篇文章,闡述了 B 輪資金的用途,並稱在資料和運算能力不受限制的理想環境下,AGI 早已成為現實。AI 透過大量練習就能變得非常聰明,但現在的 AI 學習效率太低,需要的資料太多。

想讓它變得像人類一樣擅長程式設計,光靠學習現有程式碼是不夠的,必須讓它親自動手「寫程式碼並運行」,然後根據程式是否能正確執行來獲得回饋。這個過程就像程式設計師不斷除錯程式碼一樣,是提升能力的關鍵。

所以,Poolside 團隊創建了一種強化學習方法(RLCEF),讓 AI 在成千上萬個真實專案上不斷嘗試編寫程式碼,並立刻得到執行結果的回饋,透過這種方式來訓練它。公司正全力推進這項訓練,這筆 B 輪融資將主要投資在購買大量運算資源上。

圖片

兩位創辦人在部落格中寫道:

「我們認為,基於下一個標記預測的自監督學習為實現 AGI 開辟了充滿希望的道路。然而,當前人工智慧從資料中學習的效率遠低於人類,所需資料量高出數個數量級。儘管語言理解等領域擁有大規模資料支持模型學習,但多數其他能力領域仍面臨資料不足的問題,亟需新的資料收集技術。

我們相信,在資料和運算能力不受限制的理想環境下,AGI 早已成為現實。正是由於這些資源的限制,我們認為軟體開發將成為 AI 首個實現重大經濟影響的領域,推動其達到並超越人類能力。

那麼,要使模型在軟體開發中表現卓越,必須透過確定性的回饋來增強其推理和編碼能力。這一點在當今開發實務中顯而易見:開發者在接受任務後不會直接輸出完美程式碼,而是先進行思考、編寫程式碼並執行,根據運行回饋不斷迭代和優化解決方案。這種基於程式碼執行的回饋是提升推理與開發能力的關鍵。同樣,用語言和程式碼訓練的大型語言模型也需要大規模、類似的回饋機制,才能掌握同等能力。

為此,我們開發了基於程式碼執行回饋的強化學習方法(RLCEF)。目前,我們的模型在包含 13 萬個真實程式碼庫的訓練池中探索數百萬個任務的解決方案,並為每一個嘗試的解決方案提供執行回饋。儘管規模龐大,但這仍遠未達到模型在軟體開發中實現人類水平能力的要求。借助新一輪融資,我們已將訓練叢集擴展至 1 萬個 GPU,並開始進一步擴展 RLCEF 及模型訓練。」

其實早在前幾輪融資中,英偉達就已經現身投資者之列,為 Poolside 提供資金支持。

那麼,這樣一家不足 100 人的 AI 新創公司有何特別之處能讓英偉達、貝恩等科技和資本巨頭看上?

這要從這家公司的技術布局說起。

圖片

從零搭建基礎設施,破解優質程式碼資料缺失瓶頸

在今年年初的亞馬遜雲科技客戶大會上,Poolside 歐洲、中東及非洲地區解決方案工程負責人 Vitor Monteiro 接受了亞馬遜雲科技開發者部落格的訪談,分享了這家迅速崛起的 AI 編碼公司的发展歷程與技術路線。Vitor 表示,Poolside 的終極目標,是讓人工智慧真正理解並能自主進行軟體開發,向「通用人工智慧(AGI)」在軟體領域的落地邁進。

Monteiro 坦言,當下 AI 編碼助手類工具雖然層出不窮,但產業正在進入一個「瓶頸期」——兩年前令人驚嘆的功能,如今已無法打動開發者。開發者期待的不只是「更快寫程式碼」,而是能擁有真正理解脈絡、具備推理與判斷力的智慧助手。而這正是 Poolside 專案的立足點。

「我們希望建構的不只是個聊天機器人或自動補全引擎,」Monteiro 說,「而是一個能像同事一樣,與開發者協作、學習並提出改進意見的 AI 夥伴。」

談及 Poolside 的獨特性,Monteiro 指出,全球仅有 10 至 15 家公司 擁有自主訓練前沿大模型的算力與技術能力——如 OpenAI、Google、亞馬遜雲科技,而 Poolside 也是其中之一。

不同於多數只調用外部 API、專注產品介面的「AI 消費者型 Copilot」,Poolside 從資料、演算法、到訓練框架都完全自研。團隊拒絕依賴現成的開源模型,而是 從零建構了完整的資料管道、訓練軟體和算力堆疊,確保在關鍵技術決策上掌握主動權。

Monteiro 強調,這種底層自研路徑雖成本高昂,但能帶來两大優勢:一是避免受制於開源元件的功能邊界,二是能 針對軟體開發情境深度優化模型架構與學習機制,而非為通用用途做折衷。

在模型訓練方面,Monteiro 指出一個常被忽略的問題——並非算力,而是 資料品質

從 GitHub、GitLab 等平台蒐集的海量開源程式碼中,只有 約 10% 可被用於訓練;剩餘 90% 存在重複、錯誤或冗餘資訊。

為此,Poolside 的聯合創辦人兼 CTO 自 2016 年起便致力於「程式碼智慧」的研究,團隊自主研發了基於程式碼執行回饋的強化學習系統,透過「合成資料生成」來突破高品質資料不足的瓶頸。

圖片

這一系統會自動掃描網際網路上高品質程式碼庫,篩選並驗證改動的正確性,提取出真實、可靠的提交記錄。隨後,系統將提交描述(自然語言)作為提示詞,令模型生成多達 50 個程式碼方案,並透過單元測試、安全審查等層層篩選,僅保留通過所有測試的樣本用於訓練。這些樣本再透過正負強化機制不斷優化模型決策,使系統能從回饋中「學會寫出正確程式碼」。

目前,Poolside 已自動處理超 20 萬個程式碼倉庫,整個流程完全自動化,可持續擴展至更多領域。據 Monteiro 透露,全球可用的高品質程式碼資料約為 3 萬億個 token,而訓練頂級程式碼模型至少需 1.5 萬億個合成資料 token。Poolside 正在用自研技術逐步逼近這一量級。

模型迭代體系:用實驗篩出「最優大腦」

在模型研發流程上,Poolside 並非採用單一路線,而是建立了 高度實驗化的並行訓練體系。團隊透過大量小規模實驗探索不同架構、損失函數與優化策略,篩選出最具潛力的方向後再擴大訓練規模。

Monteiro 表示,這種方法能顯著降低失敗成本,也使團隊在模型探索上保持敏捷。預計 Poolside 的首個核心模型將於 2025 年發布,基於強化學習與合成資料的預訓練,旨在彌合現有程式碼助手在推理深度與任務複雜度上的差距。

這款核心模型發布之前,Poolside 已透過亞馬遜雲科技 Bedrock 服務提供其基礎模型和生成式 AI 助手 Maidu。

在產品落地層面,Poolside 選擇了一條與主流 SaaS 不同的路徑。客戶可將模型 直接部署在自己的雲端(如亞馬遜雲科技 VPC),資料完全不離開企業內部網路。這種方式在金融、政府及大型企業用戶中尤為受歡迎,既可確保資料隱私,又可實現本地化優化。

功能層面,Poolside 提供聊天式互動、智能補全、程式碼解釋、自動文件生成等能力,支持 Visual Studio、VS Code 等主流開發環境,也提供開放 API 以便客戶整合或擴展。對於大型企業的遺留系統,Poolside 可在客戶私有程式碼庫中執行微調,並結合類似 RAG(檢索增強生成)的機制,自動識別專案依賴關係,在脈絡中給出精準建議。

此外,針對涉密部門,系統支持多模型分區部署與基於角色的存取控制,以防止跨部門資料外洩。

在被問及如何衡量 AI 工具帶來的生產力時,Monteiro 坦言,「生產力不是一個單一數字」。

Poolside 透過定量與定性結合的方法,追蹤模型的使用頻率、功能調用率、開發者回饋與建議採納率等指標,以此判斷工具是否真正「融入開發者日常工作」。

目前,團隊仍在持續優化模型的複雜任務處理能力,例如程式碼遷移與架構重構等多階段任務——這些情境中,任何一個子任務失敗都可能導致整體錯誤,是目前業界尚未攻克的挑戰。

訪談最後,Monteiro 表示,Poolside 希望成為推動軟體開發範式轉變的力量。「未來的開發者,不再是寫程式碼的人,而是與 AI 共同建構軟體系統的人。」

從底層模型到部署架構,從合成資料到強化學習,Poolside 試圖在擁擠的 AI 編碼賽道中,用技術的「純粹與自建」走出不同的路。在通往 AGI 的征途中,它正在讓人工智慧真正具備「理解軟體」的能力,而不僅僅是「生成程式碼」。

參考連結:

https://www.youtube.com/watch?v=wMQoDRTWwUg&t=9s

https://www.focal.vc/transcripts/5yf-episode-20-poolside-ceo-jason-warner

https://www.youtube.com/watch?v=0TCMv2oiw-E

https://techcrunch.com/2024/10/02/ai-coding-startup-poolside-raises-500m-from-ebay-nvidia-and-others/

https://poolside.ai/blog/announcing-our-500-million-fundraise-to-make-progress-towards-agi

主標籤:英偉達投資AI編碼新創

次標籤:Poolside AI軟體開發AGIRLCEF強化學習Copilot前CTO


上一篇:AI首勝人類博士,頂會論文秒變程式碼!港大90後開源刷爆8k星

下一篇:【深度】Ilya Sutskever 精選論文:柏拉圖表徵假說

分享短網址