構建Sora竟然只要四名工程師?
近日,OpenAI發布了一篇名為《如何在28天內用Codex構建Android版Sora》的播客,講述了一個四人工程師團隊與OpenAI的編程智能體Codex,從今年的10月8日到11月5日,花費28天時間,消耗約50億個Token,將安卓版Sora從原型階段推向全球發布,其中85%的代碼由Codex編寫。
同時,OpenAI表示,至今也仍在廣泛使用Codex來演進應用并增加Sora的新功能。
![]()
OpenAI截圖
OpenAI稱,當Sora在iOS平臺發布時,使用量激增。相比之下,在安卓平臺只有一個小型的內部原型,而預注冊用戶數量卻在不斷攀升。面對高風險、時間緊迫的發布,公司組建了一個由四名工程師組成的團隊——所有人都配備了Codex。
以這種方式工作,團隊在18天內向內部員工發布了安卓版Sora的內部構建版本,并在10天后公開發布。
OpenAI表示,將Codex視為一位新聘用的高級工程師是個好方法,工程師可以花更多時間指導和審查代碼,而不是親自編寫。比如,Codex不太擅長推斷它尚未被告知的事情(偏好的架構模式、產品策略、真實的用戶行為,以及內部規范或快捷方式等),Codex也無法看到應用實際運行(無法在設備上打開Sora,注意到滾動感覺卡頓,或感知到某個流程令人困惑),這些體驗性任務只有工程師團隊才能處理。同樣,Codex在深層次的架構判斷上也存在困難,“它的本能是讓某樣東西運行起來,而不是優先考慮長期的整潔性”。
對于Codex這名新工程師,OpenAI的要求是,每個“實例”都需要“入職”,用清晰的目標、約束條件和關于“如何做事”的指導來共享上下文,使得Codex能夠良好地去執行。
相較于工程師,Codex更擅長快速閱讀和理解大型代碼庫,熱衷于編寫單元測試以覆蓋廣泛多樣的場景,擅于對反饋做出反應,還擅于大規模并行、可丟棄的執行,提供新的視角,實現更高杠桿率的工作。
團隊的工作模式也因此變為:Codex在已有明確模式和嚴格限定范圍內完成大量繁重工作,工程師則專注于架構、用戶體驗、系統性變更和最終質量。
OpenAI表示:“我們的目標不是盡快做出‘能工作的東西’,而是做出‘理解我們期望如何工作的東西’。編寫代碼有很多‘正確’的方法。我們不需要告訴Codex具體做什么;我們需要向Codex展示在我們團隊中什么才是‘正確’的。一旦我們確立了起點和構建偏好,Codex就準備好開始了。”
團隊坦言,確實嘗試過提示:“根據iOS代碼構建Sora安卓應用。開始吧。” 但團隊很快放棄了這條路。雖然Codex生成的東西在技術上可行,但產品體驗不佳。而且,在沒有清晰理解端點、數據和用戶流程的情況下,Codex一次性生成的代碼是不可靠的(即使不使用智能體,合并數千行代碼也是有風險的)。
Sora生成的視頻(00:10)
此后,團隊又繼續讓Codex幫助理解系統和代碼的工作原理,讓Codex可以長時間根據計劃“無人監督”運行。在項目高峰期,團隊也會并行運行多個Codex會話,一個處理播放功能,另一個處理搜索,還有一個處理錯誤處理,有時還會有一個處理測試或重構。
該團隊表示,對Codex來說,上下文就是一切。當Codex理解了功能在iOS上如何工作,并結合了對安卓應用結構如何的理解時,它的表現最好。當Codex缺乏這種上下文時,它并非“拒絕合作”,而是在猜測。越是將其視為新隊友,并投入精力為其提供正確的輸入,它的表現就越好。“在我們為期四周的沖刺結束時,使用Codex不再感覺像是一項實驗,而成為我們的默認開發流程。我們用它來理解現有代碼、規劃變更和實現功能。我們審查其輸出的方式與審查隊友代碼的方式相同。這就是我們交付軟件的方式”。
團隊指出,“很明顯,AI輔助開發并不會降低對嚴謹性的需求,反而增加了需求。盡管Codex能力強大,但它的目標是從A點到B點,而且要快。這就是為什么沒有人類,AI輔助編碼就無法工作。軟件工程師能夠理解并應用系統的現實約束、架構軟件的最佳方法,以及如何結合未來的開發和產品計劃進行構建。未來軟件工程師的超能力將是對系統的深刻理解,以及能夠與AI在長時間跨度上協作的能力”。





京公網安備 11011402013531號