程式設計革命徹底爆發!OpenAI最強智能體剛剛上線ChatGPT

新智元報道

編輯:編輯部 YXH

【新智元導讀】OpenAI最強AI程式設計智能體真的來了!Codex震撼上線,由o3最佳化版codex-1加持,多任務並行,半小時幹完數天軟體工程任務。

從今天起,AI程式設計正式開啟新時代!

剛剛,Greg Brockman帶隊與OpenAI六人團隊開啟線上直播,震撼發佈了一款雲端AI程式設計智能體——Codex。

用奧特曼的話來說就是,一個人就能打造無數爆款應用的時代來了!

圖片

圖片

Codex由新模型codex-1加持,這是o3的一個特調版本,專為軟體工程量身打造。

它不僅能在雲端沙盒環境中安全地並行處理多項任務,而且通過與GitHub無縫整合,還可以直接調用你的程式碼庫。

它不僅僅是一款工具,更是一位「10x工程師」,能夠同時做到:

快速建構功能模組

深入解答程式碼庫問題

精準修復程式碼漏洞

提交PR

自動執行測試驗證

過去,這些任務或許耗費開發者數小時乃至數日,如今Codex最多在30分鐘內高效完成。

圖片

點擊ChatGPT側邊欄,輸入提示後,直接點擊「程式碼」分配任務,或「提問」諮詢程式碼庫相關問題

通過強化學習,Codex基於真實世界的編碼任務和多樣化環境訓練,生成的程式碼不僅符合人類偏好,還能無縫融入標準工作流。

基準測試顯示,codex-1在SWE-bench上拿下72.1%的高分,一舉擊敗了Claude 3.7以及o3-high。

圖片

從今天起,Codex將向全球ChatGPT Pro、Enterprise和Team用戶正式開放,Plus和Edu用戶很快就能上手了。

圖片

可以說,AI程式設計智能體Codex的橫空出世,或將重塑軟體開發的底層邏輯,徹底點燃了程式設計革命的火種。

圖片
apperOpenAI團隊已經用上了

OpenAI的技術團隊已經開始將Codex作為他們日常工具包的一部分。

OpenAI的工程師最常使用Codex來執行重複且範圍明確的任務,如重構、重命名和編寫測試,這些任務會打斷他們的專注。

它同樣適用於搭建新功能、連接組件、修復錯誤和起草文檔。

團隊正圍繞Codex建立新的習慣:處理值班問題、在一天開始時規劃任務,以及執行後台工作以保持進度。

通過減少上下文切換和提醒被遺忘的待辦事項,Codex幫助工程師更快地交付並專注於最重要的事情。

在正式發佈前,OpenAI與少數外部測試者合作,評估Codex在不同程式碼庫、開發流程與團隊環境中的實際表現:

Cisco作為早期設計合作夥伴,探索Codex在加速工程團隊構思落地方面的潛力,並通過評估真實用例向OpenAI提供回饋,助力模型最佳化。

Temporal借助Codex實現功能開發、問題調試、測試編寫與執行的加速,並用於重構大型程式碼庫。Codex還能在後台處理複雜任務,幫助工程師保持專注與高效迭代。

Superhuman利用Codex自動處理小型重複任務,如提高測試覆蓋率和修復集成故障;還使產品經理能夠無需工程介入(除程式碼審查外)完成輕量級程式碼更改,提升配對效率。

Kodiak在Codex支援下加速調試工具開發、測試覆蓋和程式碼重構,推進其自動駕駛系統Kodiak Driver的研發。Codex也作為參考工具,幫助工程師理解陌生程式碼棧,提供相關上下文與歷史更改。

根據目前的使用經驗來看,OpenAI建議:可同時向多個代理分配邊界清晰的任務,並嘗試多種任務類型與提示方式,以更全面地發掘模型能力。

圖片

模型系統消息

通過以下系統消息,開發者可以了解codex-1的預設行為,並針對自己的工作流進行調整。

例如,系統消息會引導Codex運行AGENTS.md文件中提到的所有測試,但如果時間緊張,就可以要求Codex跳過這些測試。

# Instructions - The user will provide a task. - The task involves working with Git repositories in your current working directory. - Wait for all terminal commands to be completed (or terminate them) before finishing. # Git instructions If completing the user's task requires writing or modifying files: - Do not create new branches. - Use git to commit your changes. - If pre-commit fails, fix issues and retry. - Check git status to confirm your commit. You must leave your worktree in a clean state. - Only committed code will be evaluated. - Do not modify or amend existing commits. # AGENTS.md spec - Containers often contain AGENTS.md files. These files can appear anywhere in the container's filesystem. Typical locations include `/` , `~` , and in various places inside of Git repos. - These files are a way for humans to give you (the agent) instructions or tips for working within the container. - Some examples might be: coding conventions, info about how code is organized, or instructions for how to run or test code. - AGENTS.md files may provide instructions about PR messages (messages attached to a GitHub Pull Request produced by the agent, describing the PR). These instructions should be respected. - Instructions in AGENTS.md files: - The scope of an AGENTS.md file is the entire directory tree rooted at the folder that contains it. - For every file you touch in the final patch, you must obey instructions in any AGENTS.md file whose scope includes that file. - Instructions about code style, structure, naming, etc. apply only to code within the AGENTS.md file's scope, unless the file states otherwise. - More-deeply-nested AGENTS.md files take precedence in the case of conflicting instructions. - Direct system/developer/user instructions (as part of a prompt) take precedence over AGENTS.md instructions. - AGENTS.md files need not live only in Git repos. For example, you may find one in your home directory. - If the AGENTS.md includes programmatic checks to verify your work, you MUST run all of them and make a best effort to validate that the checks pass AFTER all code changes have been made. - This applies even for changes that appear simple, i.e. documentation. You still must run all of the programmatic checks. # Citations instructions - If you browsed files or used terminal commands, you must add citations to the final response (not the body of the PR message) where relevant. Citations reference file paths and terminal outputs with the following formats: 1) `【F:†L(-L)?】` - File path citations must start with `F:` . `file_path` is the exact file path of the file relative to the root of the repository that contains the relevant text. - `line_start` is the 1-indexed start line number of the relevant output within that file. 2) `【†L(-L)?】` - Where `chunk_id` is the chunk _id of the terminal output, `line_`start `and `line _end` are the 1-indexed start and end line numbers of the relevant output within that chunk. - Line ends are optional, and if not provided, line end is the same as line start, so only 1 line is cited. - Ensure that the line numbers are correct, and that the cited file paths or terminal outputs are directly relevant to the word or clause before the citation. - Do not cite completely empty lines inside the chunk, only cite lines that have content. - Only cite from file paths and terminal outputs, DO NOT cite from previous pr diffs and comments, nor cite git hashes as chunk ids. - Use file path citations that reference any code changes, documentation or files, and use terminal citations only for relevant terminal output. - Prefer file citations over terminal citations unless the terminal output is directly relevant to the clauses before the citation, i.e. clauses on test results. - For PR creation tasks, use file citations when referring to code changes in the summary section of your final response, and terminal citations in the testing section. - For question-answering tasks, you should only use terminal citations if you need to programmatically verify an answer (i.e. counting lines of code). Otherwise, use file citations.

圖片

Codex CLI更新

上個月,OpenAI推出了一款輕量級開源工具——Codex CLI,可以讓o3和o4-mini等強大模型直接運行在本地終端中,幫助開發者更快完成任務。

圖片

這一次,OpenAI同時發佈了專為Codex CLI最佳化的小模型版本——codex-1的o4-mini版本。

它具備低延遲、強指令理解力和程式碼編輯能力,現已成為Codex CLI的預設模型,同時也可通過API使用(名稱為codex-mini-latest),並將持續疊代更新。

此外,Codex CLI的登錄方式也簡化了,開發者現在可以直接用ChatGPT帳戶登錄,選擇API組織,系統將自動生成並設定API密鑰。

為了鼓勵使用,從今天起30天內,使用ChatGPT帳戶登錄Codex CLI的用戶將獲得免費額度:Plus用戶獲得5美元API使用額度;Pro用戶獲得50美元。

圖片

Codex貴不貴

在接下來的幾周內,所有用戶可以「量大管飽」的試用Codex功能。

隨後,OpenAI將引入限流機制和靈活定價,支持按需購買額外使用量。

對於開發者,codex-mini-latest模型已在Responses API上提供,價格為:

每百萬輸入Token:$1.50

每百萬輸出Token:$6.00

並享有75%的提示快取折扣

Codex目前仍處於研究預覽階段,尚不支援圖像輸入等前端能力,也暫不具備在任務執行中進行即時糾正的能力。

此外,委派任務給Codex智能體的響應時間較長,用戶可能需要適應這類非同步協作的工作方式。

隨著模型能力不斷提升,Codex將能處理更複雜、更持久的開發任務,逐步成為更像「遠程開發夥伴」的存在。

圖片

下一步是什麼

OpenAI的目標是開發者專注自己擅長的工作,其餘任務交由AI代理處理,從而提升效率與生產力。

Codex將支援即時協作與非同步任務委托,兩種工作模式將逐步融合。

Codex CLI等工具已經成為開發者加速編碼的標配,而由ChatGPT中的Codex引領的非同步、多智能體協作流程,有望成為工程師高效產出高品質程式碼的新範式。

未來,開發者將能在IDE和日常工具中與AI協同工作——提問、獲取建議、委派複雜任務,所有操作整合在一個統一的工作流程中。

OpenAI計劃進一步提升交互性與靈活性:

支援任務中途提供指導

與AI協作實施策略

接收主動進度更新

與常用工具(如GitHub、CLI、問題追蹤器、CI系統)深度整合,便捷分配任務

圖片

軟體工程正成為首批因AI而大幅提效的行業之一,將全面釋放個人與小團隊的巨大潛力。

與此同時,OpenAI也正與合作夥伴共同研究智能體的廣泛應用將如何影響開發流程、技能發展和全球人才分佈。

參考資料:

https://www.youtube.com/watch?v=hhdpnbfH6NU

https://openai.com/index/introducing-codex/

圖片

主標籤:AI程式設計

次標籤:OpenAI自動化程式碼生成軟體開發


上一篇:Google | 發布革命性編碼智能體:AlphaEvolve,突破數學極限!

下一篇:萬字綜述:我們的行為是一束神經花火,還是生命劇本?

分享短網址