OpenAI 播客再談 AI 程式設計大戰!開發者是最有福的人:特定需求的程式碼模型將湧現!主持人說漏嘴:我最喜歡 Claude!

图片

图片

編譯、整理 | 伊風

OpenAI 第二期播客來了!陣容也是相當重磅!

嘉賓是OpenAI 首席研究官 馬克·陳(Mark Chen)和 ChatGPT 負責人 尼克·特利(Nick Turley)。主持人依然由 OpenAI 研究員 Andrew Mayne 擔任。

說起 Mark Chen,感覺他目前實際擔任了 OpenAI CTO 的工作。就在這兩天 Meta 大舉挖人、矽谷 AI 人才戰火正旺之際,Mark 第一個站出來穩定軍心,在內部 Slack 上發了一封強烈表態的備忘錄:

「我現在的感覺是強烈的、生理性的,就像有人闖進我們家偷走了什麼東西。」「請相信,我們絕沒有袖手旁觀。」

图片

左:Nick Turley,右 Mark Chen

這個播客有個很讓人震驚的小插曲,在提到最強程式設計模型的時候,主持 Andrew Mayne 居然說自己喜歡 Claude Sonnet……這播客,那麼實在的嗎??

言歸正傳,這個播客還是有很多程式設計方面的猛料值得一看:

🔹OpenAI 可謂 AI 程式設計的開山鼻祖:在 GPT-3 剛出現的時候,OpenAI 就發現它能生成完整的 React 組件,並捕捉到了 AI 程式設計工具的潛力和需求。

🔹Agentic 程式設計應該是異步式交互的:你給模型一個複雜任務,讓它在後台處理一段時間,再返回一個接近最佳的解法。

🔹 「寫出好程式碼」仍然需要「品味」:OpenAI 也在訓練模型理解程式碼風格。

🔹 OpenAI 做產品的思路:從技術出發,觀察誰能從中找到價值,然後再圍繞這些使用者進行迭代。

🔹Codex 是一款面向專業程式設計者的 AI 工具,未來還會有更加通用的消費級產品推出。

🔹 別再盯著「職位消失」不放了:打字機修理工的確消失了,某些傳統開發工作也會被替代,但「程式碼能做的事」遠超想像。

「寫程式碼這件事的空間,大得超乎你我的想像。」

图片

程式設計模型不會一家獨大,「Agentic 程式設計」大有可為

主持人 Andrew Mayne:

在眾多令人驚喜的能力中,程式碼一直是一個非常有意思的方向。我記得在 GPT-3 剛出現的時候,我們突然發現它能生成完整的 React 組件,當時我們就意識到它是有實際用處的。之後我們專門訓練了一個模型聚焦在程式碼上,這就催生了 Codex 和 Code Interpreter。現在 Codex 又以新的形式回來了,雖然名字一樣,但能力越來越強。

我們見證了程式碼功能從最初進入 VS Code,然後到 Cursor、再到我經常用的 Windsurf。現在程式碼領域的競爭壓力也很大。如果我們問大家誰擁有最強的程式碼模型,可能會有所不同答案。

Mark Chen:

沒錯,這其實也反映出一個事實——「程式設計」這個詞本身指涉範圍就很廣。比如你在 IDE 裡寫程式碼,需要函數補齊,這和你提出一個 Pull Request 並讓 AI 完成整個任務,是完全不同的兩種「程式設計方式」。

主持人 Andrew Mayne:

你能展開說說「Agentic 程式設計」具體是什麼意思嗎?

Mark Chen:

當然。你可以把它和「實時回應型模型」做對比,比如 ChatGPT 的傳統方式是你給出一個提示,它很快就給你回應。但 Agentic 程式設計更像是:你給模型一個複雜任務,讓它在後台處理一段時間,再返回一個接近最佳的解法。

我們越來越多地認為未來會是這種異步式交互:你提出一個複雜請求,然後讓模型花時間思考、推理,最終給你一個盡可能優秀的結果。在程式碼領域我們也看到這種演變。未來,你可能只需描述你想實現的功能,模型會處理後再回來給你完整解決方案。

我們的第一版 Codex 就體現了這個方向:它接收的是 PR 級別的大任務,比如一個新功能或大範圍 bug 修正,希望模型真正花時間來解決,而不是僅僅快速回應。

Nick Turley:

是的,說到底,「程式設計」涵蓋範圍實在太廣,幾乎可以類比「知識工作」這種大詞。所以我認為不會有一個絕對贏家或最佳模型,而是有很多選擇。開發者其實是最幸運的一群人,他們現在能選擇非常多樣的工具。就我們而言,「Agentic 程式設計」是目前最令人興奮的方向之一。

我做產品時經常使用一個評估標準:「如果模型變強 2 倍,產品是否也會變得有 2 倍好用?」 過去 ChatGPT 的確做到了這一點。但當模型越來越聰明,使用者不再只想和一個像博士生一樣的模型聊天,他們會開始在意模型的性格、實際能力等。

Codex 是一種理想的產品形態:你定義任務,模型花時間思考,然後產出結果。這種交互方式特別適合未來更強大的模型。雖然目前還是早期研究預覽階段,但正如我們當初對 ChatGPT 的判斷一樣,我們認為越早獲取回饋越有意義,對未來很期待。

主持人 Andrew Mayne:

我之前常用 Sonnet(Claude),非常喜歡。後來我嘗試了 Windsurf,用的是 0.4 mini 或 medium 設定,我感覺特別好,回應速度快、體驗也流暢。每個人都有喜歡的模型,這我理解,但就我用的任務來說,這是我第一次真正滿意。

Mark Chen:

我們發布這個其實是希望使用者能體驗到,我們也知道程式碼領域還有很多「低垂的果實」可以探索。程式碼是我們重點關注的方向,未來你會看到越來越多適配特定需求的程式碼模型。

主持人 Andrew Mayne:

我現在如果只是想快速查個語法或寫法,就會用 GPT-4.1 直接問。但對更複雜任務,情況就不同了。評估方式其實已經有點飽和了,而且每個人的標準也不一樣,所以要怎麼適配各種需求是個挑戰。

Mark Chen:

尤其是程式碼領域,不只是「能不能生成正確答案」。使用者還會在意程式碼風格、註釋的詳盡程度、模型是否主動做了額外的事情,比如寫好輔助函數等等。大家的偏好差異也很大,這需要我們在很多方面做得更好。

Nick Turley:

過去如果你問我哪些領域會最先被 AI 變革,我一定會說是程式碼。因為和數學類似,它是可驗證、可打分的,非常適合強化學習。

图片

程式設計的品味仍是最寶貴的

Nick Turley:

現在我依然這麼認為,但讓我意外的是:程式碼其實仍然包含大量「品味」層面的東西。一個人成為專業軟體工程師,不是因為智商變高了,而是因為他們學會了如何在團隊中構建軟體——寫什麼樣的測試,如何寫好文件,別人不同意你程式碼時該怎麼回應……

這些才是「真正的軟體工程」需要具備的內容,我們也需要教會模型理解這些。所以我相信 AI 在程式碼上的進步會很快,程式碼仍然是一個非常適合做 Agentic 產品的領域,但「風格」「品味」「真實開發實踐」這些也必須被考慮進去。

主持人 Andrew Mayne:

還有一點也很有趣:ChatGPT 現在面臨的挑戰之一是要在「消費者」和「專業使用者」之間找到平衡。我告訴朋友可以把 ChatGPT 連接到程式碼模型,他們都覺得很神奇,比如讓它控制 IDE、自動建立資料夾、寫文件這些,其實都能做。

現在我們有了圖像標籤、Codex 標籤,甚至可以透過 GitHub 使用模型。Sora 也整合進來了。你能看到這些功能在逐步融合:那我們該怎麼區分消費級、專業級和企業級功能呢?

Nick Turley:

我們在做的是非常通用的技術,它會被各種各樣的人使用。和很多公司不同的是,別的公司通常從一個特定使用者類型出發,用技術來解決這個群體的問題;而我們更多是從技術出發,觀察誰能從中找到價值,然後再圍繞這些使用者進行迭代。

以 Codex 為例,我們的初衷是面向專業軟體工程師打造這個產品。但我們也知道,這種「濺射效應」會波及很多其他使用者群體,他們也能從中受益,我們也會努力讓他們用起來更加便捷。

其實面向非工程師使用者還有很多機會。我個人非常希望能幫忙建構一個「人人都能程式設計」的世界。Codex 不是面向大眾的產品,但你可以想像未來會出現這樣的工具。不過總的來說,我們很難一開始就準確預測目標使用者是誰,必須把這些通用技術推出去之後,才能用實證主義的方式觀察價值到底在哪兒。

Mark Chen:

是的,其實更深入一點來說,有些使用者可能主要用 ChatGPT 寫程式碼,但他們偶爾也會想跟模型聊聊,或者想要生成一張漂亮的圖。所以雖然存在不同的使用者畫像,但在實際中,我們發現大家都希望模型具備多種能力。

图片

內部使用 Codex:目標是讓工程師提效十倍

主持人 Andrew Mayne:

在 Codex 發布的時候,我有個印象很深的感受:有些工具之所以引發巨大興趣,是因為內部團隊本身就有強烈需求。這種工具你們內部用得多嗎?

Mark Chen:

越來越多了。

Nick Turley:

我對內部使用 Codex 非常興奮。應用場景非常廣,比如開發者用它來減少寫測試的負擔,還有分析師用它處理日誌報錯,自動標記問題並在 Slack 上通知相關人員。甚至有人用它當作「待辦清單」的入口,提前把未來希望完成的任務發送給 Codex 處理。

我認為這類工具非常適合「內部自測」(dogfooding),而且它確實能大幅提升開發效率。我們的目標是:不擴張人力的前提下,提高現有工程師的產出效率,理想狀態是讓一個工程師變成原來的十倍高效。從這個角度看,內部使用情況對我們未來產品發展方向是非常重要的指標。

Mark Chen:

是的,我們不會發布自己都不願意用的工具。在 Codex 上線前,內部就有一些超級使用者,他們每天能用 Codex 寫出上百個 Pull Request,這說明我們內部確實能從中獲得巨大價值。

Nick Turley:

而且內部使用還有一個「現實校驗」的作用:人們都很忙,要引入新工具需要一定「啟動成本」。你會發現:當我們試圖推廣某個工具時,要花時間讓大家適應新的工作流,這個過程其實挺謙卑的。我們既能從中了解技術的局限,也能看到「採用路徑」的實際阻力。

图片

適應 AI 時代的秘密武器:好奇心、主動性

主持人 Andrew Mayne:

確實,建構這類工具時,團隊成員要花時間去學習和適應它。現在有個熱門話題是:未來需要什麼樣的技能?你們在組建團隊時會更看重什麼能力?

Nick Turley:

這個問題我思考過很多。招聘確實很難,尤其是你想組建一個小而強、謙遜且執行力極強的團隊時。我最看重的能力是好奇心

很多學生問我,在一個快速變化的世界裡該怎麼辦?我給他們的建議就是:好奇心是關鍵。我們自己其實也有很多不知道的地方,必須帶著謙遜的態度深入研究,去理解什麼是有價值的、什麼是有風險的。

尤其是在 AI 相關的工作中,不管是程式碼、還是其他方面,其實真正的瓶頸不是獲取答案,而是提出對的問題。所以我非常相信我們需要招聘那些對世界和我們所做的事情充滿好奇的人。

至於是否有 AI 背景,我其實沒那麼在意。當然 Mark(Mark Chen:)可能觀點會不同。但對我來說,產品團隊的成功與否,很大程度上取決於好奇心的強弱。

Mark Chen:

我其實也差不多。就連研究方向,現在也越來越不強調一定得有 AI 博士學位。我自己就是以「駐留研究員」身份加入的,當時沒有什麼正式的 AI 訓練背景。

我覺得 Nick 提到的很對,另一個重要素質是「主動性」。OpenAI 不是那種每天都有人告訴你:「今天你要做這三件事」的地方,而是你得看到問題、主動跳進去解決它。

還有就是適應性。這個行業變化非常快,所以你必須能迅速判斷什麼是重要的、什麼時候該調整方向、該怎麼轉變工作重點。

Nick Turley:

的確,我們常被問「OpenAI 怎麼能持續發布產品」,很多人覺得我們幾乎每周都在發布新東西。但我們自己從未覺得速度夠快,反而常覺得可以更快。

真正的原因是:我們擁有大量有執行力的人,不管是產品、研究還是政策團隊,大家都能推動項目向前。雖然「發布」在不同團隊裡意義不同,但我們減少不必要的官僚流程,除了在極個別需要嚴格流程的領域外,大多數時間我們能快速推進,這也是我們想招聘的理想人才類型。

主持人 Andrew Mayne:

我當初加入公司,是因為最早拿到 GPT-3 的訪問權限,然後開始做各種 demo,每周發影片。雖然有時可能挺煩人的(笑),但我真的非常興奮。

Mark Chen:

不煩,反而很有趣。

主持人 Andrew Mayne:

那段時間真的讓人興奮。我跟別人描述時說,就像他們造了一艘 UFO,而我能玩它。比如我看到它能「懸停」,我就覺得:「哇,他們真的讓它飛起來了!」我只是按了按鈕而已,但感受到的力量是真實的。

我是自學寫程式碼的,看了很多 Udemy 課程,然後能作為工程團隊一員,被鼓勵「自己去做點什麼」,雖然不是核心工作,也沒搞壞什麼(笑),但這份自由讓我感到被賦能。

我覺得這種精神至今還在,這也是 OpenAI 能不斷推進產品的原因之一。畢竟 GPT-4 是由 150 到 200 人一起完成的。

主持人 Andrew Mayne:

我覺得大家常常忘了這件事。

Nick Turley:

完全同意。實際上,連 ChatGPT 也是這樣「拼湊」起來的。一開始是研究團隊在做「指令遵循」相關的研究,之後的模型也延續了這條路線,透過後訓練讓模型更適合對話。而 ChatGPT 的產品原型,其實是一個黑客松(hackathon)項目。

我記得很清楚,我們當時問大家:「誰想做消費級產品?」然後各種背景的人都加入了進來——比如有來自超級計算團隊的人說,「我之前做過 iOS 應用,我來做」;也有研究員來寫後端程式碼。這是一個「想做點事」的人的交匯點。

我認為,能讓這種事發生的組織文化,是誕生下一個 ChatGPT 的關鍵,也是我們在組織規模不斷擴張時要維持下去的東西。

主持人 Andrew Mayne:

我們之前提到,團隊招人時會關注「好奇心」,Mark 也認同這一點。如果我是個 AI 行業外的人,比如 25 歲或 50 歲,面對技術飛速發展可能會感到有些害怕,特別是像 ChatGPT 在寫作、程式設計上表現得這麼好。

但我個人認為,永遠不會有足夠多的「寫程式碼的人」,因為程式碼可以實現的事情,比我們能想像的還要多。

图片

不要擔心被取代:寫程式碼這件事的空間大得超乎想像

主持人 Andrew Mayne:

那麼你們會給普通人什麼建議呢?不論他們處於人生哪一階段,該如何準備、適應並參與這個 AI 未來?

Mark Chen:

我覺得最重要的是你要意識到,你的能力可以被增強——AI 能讓你更高效、更有影響力。

未來,專家仍然會存在,但 AI 幫助最大的其實是那些本身並不具備高級技能的人。舉個例子,如果模型能提供更好的醫療建議,它最能幫助的,其實是那些無法獲得高品質醫療資源的人。

圖像生成也一樣,它不是替代專業藝術家,而是讓像我和 Nick 這樣的人也能做出有創意的表達。

AI 提供的,是一種「能力提升的基礎設施」,讓普通人能勝任很多本來不擅長的事。

Nick Turley:

未來確實會發生很大變化。我覺得幾乎每個人都會有那麼一刻,AI 做了一件你原本認為「神聖而人類獨有」的事情。

主持人 Andrew Mayne:

我認識一個做投資的人,當他的工作內容被 AI 替代後感到非常受威脅。

Mark Chen:

沒錯,現在有些模型在寫程式碼、解決問題方面,確實比我強。

Nick Turley:

這是很人之常情的反應。面對這種強大系統時,我們會感到敬畏,也可能感到恐懼。

就像 Mark 說的,你需要親自使用它,才能真正理解它、降低恐懼感

我們很多人從小就聽說「人工智慧」,但那個時候說的是演算法、廣告推薦,或是電影裡的機器人,對不同人來說,AI 意味著不同的東西。因此,感到害怕一點都不奇怪。

要想和別人進行有建設性的對話,最好的方式就是親自去用 AI

至於如何為未來做準備,我認為不一定要去鑽研什麼提示詞工程或 AI 程式設計原理。

反而更重要的,是那些本質的人類能力,比如「如何委託任務」。

你將擁有一個「放在口袋裡的智能體」,它可以是你的導師、顧問、工程師。真正的關鍵是:你是否了解你自己,知道你要解決什麼問題,以及別人能如何幫你。

Nick Turley:

我之前也說過,好奇心很重要。你能問出什麼問題,就能獲得什麼樣的結果。除此之外,持續學習的能力也非常關鍵。

你越能快速學習新領域、新知識,就越能適應這個變化速度前所未有的世界。我自己也準備好接受:未來某一天,我現在做的產品經理角色可能會消失。但我也期待去學點新東西。如果你有這種心態,那你就能很好地利用 AI。

主持人 Andrew Mayne:

我們有時候會過度強調某些職位的消失,比如我們不再需要打字機修理工了。某些類型的程式設計職位也會消失。

但我還是那句話:寫程式碼這件事的空間大得超乎想像。

你們剛才提到了醫療行業,有人會擔心 AI 替代醫生。但我其實樂意讓 AI 來給我診斷、動手術,甚至處理很多事情。

但我還是希望有個人陪我聊聊、解釋手術流程、握著我的手。我每天都吃很多維生素,但我不可能每天因為這些小事去問醫生,對吧?

主標籤:AI 程式設計

次標籤:自主代理OpenAI未來工作軟體開發


上一篇:強化學習(RL)規模化王牌!DeepSWE 開源 AI 代理登上榜首,訓練方法與權重全面公開

下一篇:Claude 的 AI 含量超越 Cursor 一倍!資深工程主管揭露 AI 編碼真相!Google 謹慎地全面投入自主研發;軟體架構教父:猶如從組合語言時代躍遷至高階語言

分享短網址