在軟件開發領域,一項新的創新正悄然改變著程序員的工作方式。OpenAI近期推出了Codex,這是一款基于云的軟件工程智能體,專為處理編程任務而設計。
Codex能夠并行執行多項任務,包括編寫代碼、解答代碼庫相關疑問、修復錯誤,并提交拉取請求以供審核。它運行在云端,并預先加載用戶的代碼庫,使得操作更加高效。
這款智能體的背后是codex-1模型的支持,這是OpenAI o3針對軟件工程領域進行優化的結果。目前,Codex已經對ChatGPT Pro、Team和Enterprise用戶開放,并即將面向Plus用戶推出。為了滿足更多用戶的需求,OpenAI還推出了codex-1的精簡版本,這是專為輕量級開源編碼Agent“Codex CLI”打造的。通過API,用戶可以以1.5美元/100萬tokens輸入和6美元/100萬tokens輸出的價格使用它,即時緩存還能享受七五折優惠。
使用Codex,用戶可以通過ChatGPT的側邊欄輕松訪問它。他們只需輸入指令并點擊“代碼”按鈕,即可分配編程任務。同時,用戶還可以通過“提問”功能向Codex咨詢代碼庫的問題。每個任務都在一個獨立且隔離的環境中處理,確保了安全性。
Codex不僅能讀取和編輯文件,還能運行包括測試工具和類型檢查器在內的各種命令。任務的完成時間通常在1到30分鐘之間,具體取決于任務的復雜性。用戶可以隨時監控Codex的進度,并在任務完成后查看結果。
為了讓Codex更好地融入開發環境,用戶可以通過AGENTS.md文件對其進行配置。這個文件類似于README.md,用戶可以在其中指導Codex如何導航代碼庫、運行哪些測試命令以及遵循項目的最佳實踐。配置得當后,Codex的性能將達到最佳。
在編碼評估和內部基準測試中,codex-1展現出了強大的性能。盡管在測試中排除了23個無法在OpenAI內部基礎架構上運行的樣本,但codex-1仍然表現出色。它的測試設置最大上下文長度為192k tokens,推理難度為中等,這也是目前產品中可用的設置。
在安全和透明度方面,Codex也做得相當出色。用戶可以通過引用、終端日志和測試結果來檢查Codex的工作。當遇到不確定或測試失敗的情況時,Codex會明確告知用戶,以便他們做出正確的決策。
為了平衡安全性和實用性,Codex經過訓練能夠識別并拒絕旨在開發惡意軟件的請求,同時支持合法任務。它還增強了政策框架,并納入了嚴格的安全評估。Codex完全在云端安全隔離的容器中運行,任務執行期間禁止訪問互聯網。
對于Codex CLI用戶來說,OpenAI還發布了codex-1的精簡版本,這是專為Codex CLI設計的o4-mini版本。這個新模型支持更快的工作流程,并針對低延遲代碼問答和編輯進行了優化。Plus和Pro用戶可以兌換價值5美元和50美元的免費API積分,用于體驗Codex CLI。
OpenAI的技術團隊已經開始將Codex納入他們的日常工具包中。工程師們用它來處理那些重復且范圍明確的任務,如重構、重命名和編寫測試。同時,Codex也適用于構建新功能、連接組件、修復錯誤以及起草文檔。
在發布之前,OpenAI還與外部測試人員進行了合作。例如,思科正在探索Codex如何幫助其工程團隊更快地實現想法,并向OpenAI提供反饋。Temporal則使用Codex來加速功能開發、調試問題、編寫和執行測試,以及重構大型代碼庫。
盡管Codex仍處于早期階段,但它已經展現出了巨大的潛力。作為研究預覽版,它目前還缺少一些功能,如圖像輸入和在Agent工作時進行方向修正。然而,隨著技術的不斷進步,我們可以期待Codex在未來成為工程師編寫高質量代碼的主流方式。