![]()
本文來自微信公眾號:劃重點KeyPoints,編譯:重點君,頭圖來自:AI生成
從掀起新一輪科技浪潮的ChatGPT,到DALL·E、Whisper、Sora、Codex,很多人好奇,為什么OpenAI總能誕生改變世界的偉大產(chǎn)品?
三周前,OpenAI資深工程師Calvin French-Owen宣布離職,他是Codex項目的核心成員之一,Codex 是 OpenAI 的新型編程助手,競爭對手包括 Cursor 和 Anthropic 的 Claude Code。
離開后,Calvin 寫了一份長長的內(nèi)部回憶,從一線工程師的角度,給所有好奇OpenAI 的人揭秘了這個組織內(nèi)部的真實情況。在他眼里,OpenAI是一個非常復(fù)雜的存在:既像研究實驗室,更像一臺永不停歇的產(chǎn)品機器。
OpenAI一年,從一千人暴增到三千人
在加入OpenAI 時,Calvin 是第 1000 多個員工,一年后,公司規(guī)模翻了三倍。他在博客里寫道,這種飛速擴張帶來了典型的“成長的煩惱”:組織溝通混亂、團隊節(jié)奏各異、Slack 消息轟炸一切。
OpenAI 內(nèi)部幾乎不用郵件,所有溝通都在 Slack 上完成。沒有人會管你怎么用,只要你能跟上節(jié)奏。
他形容自己從Segment 的小團隊創(chuàng)始人身份,切換到 3000 人組織里的一顆螺絲釘,這種落差感讓他一度懷疑自己的決定。但這段時間,也讓他看見了一個“巨型科研與產(chǎn)品工廠”是怎么運轉(zhuǎn)的。
自下而上,一切都能自己先干起來
Calvin 反復(fù)提到一個詞:自下而上。在 OpenAI,好點子往往不是靠流程生出來的,而是哪個人先偷偷動手做了個原型。
當(dāng)時Codex 的原型,內(nèi)部一度有 3-4 個版本同時流傳,都是幾個人自己攢出來的。等到效果好,就能拉人、組隊、立項。
管理也和傳統(tǒng)巨頭不太一樣:誰能想出好點子、能做出來,誰就能在團隊里獲得更高的話語權(quán)。相比演講和政治手腕,這家公司更看重“你能不能把東西做出來”。
他甚至說,最好的研究員都像是“小型 CEO”,他們對自己手頭的研究有完全的自主權(quán),沒人會管你要做什么,只看結(jié)果。
迅速行動,Codex僅七周就上線
Calvin 在這封備忘錄里最鮮活的部分,來自 Codex 沖刺的 7 周。
他提前結(jié)束了陪產(chǎn)假,又回到辦公室,和十幾個人拼了命地打磨產(chǎn)品、測試功能、改代碼。他寫道:“這是我近十年來最累的七周。每天晚上十一二點回家,清晨五點半又被孩子叫醒,七點重新坐進(jìn)辦公室,周末也在趕工。”
從第一行代碼到上線,Codex 只用了 7 周。在這背后,是一個不到 20 人的核心團隊,外加隨時拉來的 ChatGPT 工程師、設(shè)計、產(chǎn)品經(jīng)理、市場。沒有多余的扯皮,沒有季度 OKR,誰能上就直接上。
他說自己從沒見過哪家公司能在這么短的時間里把一個idea 變成產(chǎn)品,還免費開放給所有人用——這就是 OpenAI 最真實的工作節(jié)奏。
被放大的注目與隱形的壓力
這家公司的野心遠(yuǎn)不止ChatGPT。Calvin爆料,OpenAI 同時在十幾個方向上下注:API、生圖、編碼代理、硬件、甚至還有沒對外公布的項目。
他也看見了這背后不可避免的高壓。
幾乎所有團隊都在追趕同一個目標(biāo):打造通用人工智能(AGI)。他們的每一條 Slack 消息,都可能會被全球放大成新聞。內(nèi)部很多產(chǎn)品和收入數(shù)據(jù)嚴(yán)防死守,團隊里有不同的權(quán)限區(qū)隔。
外界討論的安全問題,Calvin 也有他的觀察。他說,真正讓大多數(shù)團隊日夜擔(dān)心的,并不是“AI 什么時候掌控世界”,而是仇恨言論、政治操縱、提示注入、或者用戶拿它來寫生物武器配方。這些現(xiàn)實的、不起眼的風(fēng)險,遠(yuǎn)比哲學(xué)問題更棘手。
OpenAI 到底酷在哪兒?
在外人看來,這家公司是“離人類終極智能最近的地方”。在離開的人眼里,酷的地方恰恰是:它仍然沒變成一個遲鈍的巨頭。
Codex 項目用 7 周上線,團隊可以隨時跨項目調(diào)人,“只要有用,就別等下個季度計劃”。領(lǐng)導(dǎo)層天天泡在 Slack 里,不是象征性露面,而是真的參與具體討論和決策。
還有一點讓他很服氣:OpenAI 把最強大的模型免費放到 API 里,不僅賣給大企業(yè),也給普通人用,不用簽?zāi)甓葏f(xié)議,也不用交昂貴授權(quán)費。這點,他們算是說到做到。
他離開的原因,也沒那么戲劇化。外界總愛把離職放大成陰謀。Calvin 卻說,離開 OpenAI 70% 只是因為他想重新做點自己的事。
在他眼里,OpenAI 已經(jīng)從一群科學(xué)怪人做實驗室,變成了一個混合體:一半是科研,一半是消費級應(yīng)用的產(chǎn)品機器,不同團隊有不同目標(biāo)和節(jié)奏。而他需要新的探索。
最后這封信留給外界的,是一份旁觀者視角的提醒:OpenAI 不是冷冰冰的 AGI 工廠,而是一群人,用一套近乎極限的速度,把腦子里的點子變成全世界用得上的產(chǎn)品。
他寫道:“哪怕只是站在這臺巨型機器里的一顆小螺絲釘,也足夠讓人清醒,也足夠讓人興奮。”
這段話或許就是所有離開、留下,或者正好奇著OpenAI 的人,都會懂的一句話。
![]()
以下為Calvin分享原文(由GPT翻譯):
關(guān)于OpenAI 的思考
2025 年 7 月 15 日
我三周前離開了OpenAI。我是在 2024 年 5 月加入這家公司的。
我想分享我的一些感想,因為圍繞OpenAI 的所作所為有很多煙霧彈和噪音,但關(guān)于在那里工作的文化實際感受卻鮮有第一手的描述。
納比爾·奎雷希有一篇精彩的文章《對 Palantir 的反思》,他在文中深思了 Palantir 的獨特之處。我也想趁記憶猶新時,對 OpenAI 做同樣的反思。這里沒有任何商業(yè)機密,更多的是對這個歷史上最引人入勝的組織之一在極其有趣時期的現(xiàn)狀的一些感想。
先說明一下:我離開的決定中沒有任何個人恩怨——事實上我對此感到非常矛盾。從自己創(chuàng)辦的項目轉(zhuǎn)變?yōu)橐患覔碛?3000 名員工的組織中的一員,這種轉(zhuǎn)變很難。現(xiàn)在我渴望一個新的開始。
完全有可能是工作的質(zhì)量會吸引我回去。很難想象能打造出像AGI 那樣有深遠(yuǎn)影響的東西,而 LLMs 無疑是本十年的技術(shù)創(chuàng)新。我很幸運能親眼見證一些發(fā)展,并且參與了 Codex 的發(fā)布。
顯然,這些并非公司的觀點——作為觀察,這是我個人的看法。OpenAI 是一個大平臺,這只是我對它的一扇小窗。
文化
關(guān)于OpenAI,首先要了解的是它的快速成長。當(dāng)我加入時,公司員工剛剛超過 1000 人。一年后,人數(shù)已超過 3000,而我在任職時間上位于前 30%。幾乎所有領(lǐng)導(dǎo)層成員的工作內(nèi)容與 2-3 年前截然不同。
當(dāng)然,快速擴張帶來了各種問題:如何作為一個公司進(jìn)行溝通,匯報結(jié)構(gòu),產(chǎn)品發(fā)布流程,人員管理與組織,招聘流程等等。各團隊文化差異顯著:有些團隊一直全速沖刺,有些則在監(jiān)控大型項目運行,還有些保持著更為穩(wěn)定的節(jié)奏。沒有單一的OpenAI 體驗,研究、應(yīng)用和市場推廣部門的時間節(jié)奏也大相徑庭。
OpenAI 的一個特殊之處在于,所有一切——我指的是所有——都依賴 Slack 進(jìn)行。沒有電子郵件。在我整個任職期間,收到的郵件大約只有 10 封。如果你不善于組織,這會讓你感到極度分心。但如果你能合理管理頻道和通知,使用起來還是相當(dāng)可行的。
OpenAI 在研究方面尤其注重自下而上的方式。當(dāng)我剛加入時,我開始詢問下一季度的路線圖。得到的回答是:“這并不存在”(雖然現(xiàn)在有了)。好點子可以來自任何地方,而且通常很難提前判斷哪些點子會最有成效。與其說有一個宏大的“總體規(guī)劃”,不如說進(jìn)展是迭代的,隨著新研究成果的出現(xiàn)逐步顯現(xiàn)。
正因為這種自下而上的文化,OpenAI 也非常重視能力和貢獻(xiàn)。公司歷來的領(lǐng)導(dǎo)者主要是基于他們提出好點子并付諸實施的能力而晉升。許多非常有能力的領(lǐng)導(dǎo)者在全員大會上的演講或政治手腕方面并不擅長。在 OpenAI,這些方面的重要性遠(yuǎn)不如其他公司。最好的點子往往會勝出。
有一種強烈的行動偏向(你可以直接去做事情)。類似的團隊,雖然彼此無關(guān),卻經(jīng)常會在各種想法上不謀而合。我最初參與了一個與ChatGPT 連接器類似的平行(但內(nèi)部)項目。在我們決定推動發(fā)布之前,可能有大約 3-4 個不同的 Codex 原型在流傳。這些工作通常由少數(shù)幾個人在未獲許可的情況下自行開展。隨著項目展現(xiàn)出潛力,團隊往往會迅速圍繞它們組建起來。
Andrey(Codex 負(fù)責(zé)人)曾告訴我,你應(yīng)該把研究人員看作他們自己的“小型高管”。有一種強烈的傾向是專注于自己的事情,看看結(jié)果如何。這里有一個推論——大多數(shù)研究都是通過“極客誘導(dǎo)”研究人員專注于某個特定問題來完成的。如果某個問題被認(rèn)為無聊或“已解決”,它很可能不會被繼續(xù)研究。
優(yōu)秀的研究經(jīng)理極具影響力,但同時也非常有限。最出色的經(jīng)理能夠連接許多不同的研究工作,匯聚成更大的模型訓(xùn)練。同樣的道理也適用于出色的產(chǎn)品經(jīng)理(向ae 致敬)。
我合作過的ChatGPT 產(chǎn)品經(jīng)理(Akshay、Rizzo、Sulman)是我見過的最酷的客戶之一。感覺他們幾乎已經(jīng)見識過一切。他們大多相對放手,但都聘用了優(yōu)秀的人才,并努力確保他們能夠取得成功。
OpenAI 能夠迅速調(diào)整方向。這是我們在 Segment 非常重視的一點——隨著新信息的出現(xiàn),做正確的事遠(yuǎn)比僅僅因為有計劃而堅持原路更好。令人驚訝的是,像 OpenAI 這樣規(guī)模龐大的公司依然保持著這種精神——而谷歌顯然沒有。公司決策迅速,一旦決定追求某個方向,就全力以赴。
公司面臨著大量的審視。作為來自B2B 企業(yè)背景的人,這讓我有些震驚。我經(jīng)常看到新聞媒體爆出尚未在內(nèi)部宣布的消息。當(dāng)我告訴別人我在 OpenAI 工作時,常常會遇到對公司已有的既定看法。一些 Twitter 用戶運行自動機器人,檢查是否有新功能即將發(fā)布。
因此,OpenAI 是一個非常保密的地方。我不能向任何人詳細(xì)透露我正在做的工作。這里有幾個擁有不同權(quán)限的 Slack 工作區(qū)。收入和資金消耗數(shù)據(jù)則被更加嚴(yán)格地保密。
OpenAI 也是一個比你想象中更嚴(yán)肅的地方,部分原因是因為風(fēng)險感非常高。一方面,目標(biāo)是構(gòu)建通用人工智能(AGI)——這意味著有很多事情必須做到位。另一方面,你正在打造一個產(chǎn)品,數(shù)億用戶依賴它來獲取從醫(yī)療建議到心理治療的各種服務(wù)。再另一方面,公司正參與全球最大的競爭舞臺。我們會密切關(guān)注 meta、谷歌和 Anthropic 的動態(tài)——我相信他們也在做同樣的事情。所有主要國家政府都在密切關(guān)注這一領(lǐng)域。
盡管OpenAI 經(jīng)常在媒體上受到詆毀,但我遇到的每個人實際上都在努力做正確的事。鑒于其面向消費者的定位,它是大型實驗室中最為顯眼的,因此也承受了大量的誹謗。
話雖如此,你大概不應(yīng)該把OpenAI 看作一個單一的整體。我認(rèn)為 OpenAI 起初像洛斯阿拉莫斯實驗室一樣,是一群科學(xué)家和技術(shù)愛好者在探索科學(xué)前沿。這個團隊偶然間催生了史上最具病毒傳播性的消費級應(yīng)用。隨后,它的發(fā)展目標(biāo)擴展到了向政府和企業(yè)銷售。組織中不同資歷和不同部門的人,隨后有了截然不同的目標(biāo)和觀點。你在那里的時間越長,越可能通過“研究實驗室”或“為公益服務(wù)的非營利機構(gòu)”的視角來看待事情。
我最欣賞這家公司的一點是,它在分配人工智能利益方面“言行一致”。最先進(jìn)的模型并不局限于某個需要年度協(xié)議的企業(yè)級別。世界上任何人都可以直接使用 ChatGPT 獲取答案,即使沒有登錄。你可以注冊并使用 API——大多數(shù)模型(即使是最先進(jìn)或?qū)S械模┩ǔR矔芸爝M(jìn)入 API,供初創(chuàng)企業(yè)使用。你可以想象一種與我們今天所處的體系截然不同的運作模式。OpenAI 為此應(yīng)當(dāng)獲得大量贊譽,這仍然是公司核心的基因。
安全性實際上比你從Zvi 或 Lesswrong 等大量閱讀中猜測的要重要得多。有大量人員致力于開發(fā)安全系統(tǒng)。鑒于 OpenAI 的性質(zhì),我看到更多關(guān)注的是實際風(fēng)險(仇恨言論、濫用、操縱政治偏見、制造生物武器、自殘、提示注入)而非理論風(fēng)險(智能爆炸、權(quán)力尋求)。這并不是說沒人關(guān)注后者,確實有人專注于理論風(fēng)險。但從我的角度來看,這并不是重點。大部分工作沒有公開發(fā)表,OpenAI 確實應(yīng)該做更多工作來發(fā)布這些內(nèi)容。
與其他公司在每次招聘會隨意發(fā)放周邊不同,OpenAI 幾乎不發(fā)放周邊(即使是給新員工)。取而代之的是“限時發(fā)售”,你可以訂購有現(xiàn)貨的商品。第一次發(fā)售時,需求量大到導(dǎo)致 Shopify 商店癱瘓。內(nèi)部還流傳著一篇帖子,講解如何正確 POST JSON 數(shù)據(jù)包以繞過限制。
與GPU 成本相比,幾乎所有其他開銷都微不足道。舉個例子:作為 Codex 產(chǎn)品一部分開發(fā)的一個小眾功能,其 GPU 成本與我們整個 Segment 基礎(chǔ)設(shè)施的 GPU 成本相當(dāng)(雖然規(guī)模不及 ChatGPT,但也承擔(dān)了相當(dāng)一部分互聯(lián)網(wǎng)流量)。
OpenAI 可能是我見過的最令人畏懼的雄心勃勃的組織。你可能會認(rèn)為擁有全球頂級的消費級應(yīng)用之一已經(jīng)足夠了,但他們渴望在數(shù)十個領(lǐng)域展開競爭:API 產(chǎn)品、深度研究、硬件、編碼代理、圖像生成,以及一些尚未公布的領(lǐng)域。這是一個孕育并推動創(chuàng)意不斷前進(jìn)的沃土。
公司非常關(guān)注推特。如果你發(fā)了一條與OpenAI 相關(guān)且廣為傳播的推文,很可能有人會看到并加以考慮。我的一個朋友開玩笑說:“這家公司靠推特氛圍運轉(zhuǎn)。”作為一家面向消費者的公司,這說法或許并不完全錯誤。雖然他們確實還在大量分析使用情況、用戶增長和留存率,但氛圍同樣重要。
OpenAI 的團隊比其他地方更加靈活。在推出 Codex 時,我們需要幾位有經(jīng)驗的 ChatGPT 工程師的幫助以趕上發(fā)布日期。我們與一些 ChatGPT 的工程經(jīng)理會面提出請求。第二天,就有兩位非常厲害的人準(zhǔn)備投入并提供幫助。沒有“等待季度計劃”或“重新調(diào)整人員編制”的繁瑣過程,進(jìn)展非常迅速。
領(lǐng)導(dǎo)層非常顯眼且深度參與。在像OpenAI 這樣的公司,這或許很明顯,但每位高管似乎都非常投入。你會經(jīng)常在 Slack 上看到 gdb、sama、kw、mark、dane 等人積極發(fā)言。沒有缺席的領(lǐng)導(dǎo)者。
代碼
OpenAI 使用一個龐大的單一代碼庫,主要是 Python(盡管也有越來越多的 Rust 服務(wù)和少量用于網(wǎng)絡(luò)代理等的 Golang 服務(wù))。這導(dǎo)致代碼風(fēng)格多樣,因為 Python 有很多不同的寫法。你會遇到既有來自擁有十年經(jīng)驗的谷歌老兵設(shè)計的可擴展庫,也有剛畢業(yè)博士寫的臨時 Jupyter 筆記本。幾乎所有東西都圍繞 FastAPI 來創(chuàng)建 API,使用 Pydantic 進(jìn)行驗證。但整體上并沒有強制執(zhí)行統(tǒng)一的代碼風(fēng)格指南。
OpenAI 的所有服務(wù)都運行在 Azure 上。有趣的是,我認(rèn)為只有三項服務(wù)是值得信賴的:Azure Kubernetes 服務(wù)、CosmosDB(Azure 的文檔存儲)和 BlobStore。沒有真正等同于 Dynamo、Spanner、Bigtable、BigQuery、Kinesis 或 Aurora 的服務(wù)。自動擴展單元的思維方式也較為罕見。IAM 的實現(xiàn)通常遠(yuǎn)不如 AWS 那樣完善,而且有很強的內(nèi)部開發(fā)傾向。
在人員方面(至少在工程領(lǐng)域),meta 到 OpenAI 的人才流動非常顯著。在許多方面,OpenAI 類似于早期的 meta:一個爆款的消費級應(yīng)用、初步的基礎(chǔ)設(shè)施,以及快速發(fā)展的渴望。我見過從 meta 和 Instagram 轉(zhuǎn)過來的大多數(shù)基礎(chǔ)設(shè)施人才都非常優(yōu)秀。
將這些因素結(jié)合起來,你會發(fā)現(xiàn)許多基礎(chǔ)設(shè)施的核心部分讓人聯(lián)想到meta。內(nèi)部重新實現(xiàn)了 TAO,努力在邊緣整合身份認(rèn)證,我相信還有許多我不了解的其他項目。
聊天的概念非常深入。自從ChatGPT 走紅以來,很多代碼庫的結(jié)構(gòu)都是圍繞聊天消息和對話的理念構(gòu)建的。這些基本元素已經(jīng)深深植入其中,忽視它們可能會帶來風(fēng)險。我們在 Codex 中稍有偏離(更多借鑒了響應(yīng) API 的經(jīng)驗),但仍然利用了大量已有的技術(shù)成果。
代碼取勝。與其依賴某個中央架構(gòu)或規(guī)劃委員會,決策通常由計劃執(zhí)行工作的團隊做出。結(jié)果是行動導(dǎo)向非常強烈,代碼庫中常常存在多個重復(fù)的部分。我大概見過半打左右的隊列管理或代理循環(huán)相關(guān)的庫。
在幾個方面,快速擴展的工程團隊和缺乏工具帶來了問題。sa-server(后端單體應(yīng)用)成了一個有些雜亂的地方。主分支上的持續(xù)集成(CI)故障比預(yù)期頻繁得多。即使測試用例并行運行,并且只考慮部分依賴,使用 GPU 運行也可能需要大約 30 分鐘。這些問題并非無法解決,但這提醒我們,這類問題無處不在,而且在快速擴展時可能會變得更嚴(yán)重。值得肯定的是,內(nèi)部團隊正高度重視并致力于改進(jìn)這一狀況。
我學(xué)到的其他東西
這就是大型消費品牌的樣子。在我們開始開發(fā)Codex 之前,我并沒有真正意識到這一點。所有的衡量標(biāo)準(zhǔn)都是以“專業(yè)用戶”為單位。即使是像 Codex 這樣的產(chǎn)品,我們也主要考慮個人使用的入門體驗,而不是團隊使用。作為一個主要來自 B2B/企業(yè)背景的人,這讓我有些難以適應(yīng)。你只需一開關(guān),流量從第一天起就會涌入。
大型模型的訓(xùn)練(高層次概述)。從“實驗”到“工程”存在一個光譜。大多數(shù)想法最初都是小規(guī)模實驗。如果結(jié)果看起來有希望,它們會被納入更大規(guī)模的訓(xùn)練中。實驗不僅涉及調(diào)整核心算法,還包括調(diào)整數(shù)據(jù)組合并仔細(xì)研究結(jié)果。在大規(guī)模訓(xùn)練方面,幾乎看起來像是巨型分布式系統(tǒng)工程。會遇到各種奇怪的邊緣情況和意想不到的問題,調(diào)試這些問題的責(zé)任就在于你。
如何進(jìn)行GPU 計算。作為 Codex 發(fā)布的一部分,我們必須預(yù)測負(fù)載容量需求,而這也是我第一次真正花時間對 GPU 進(jìn)行基準(zhǔn)測試。關(guān)鍵是你應(yīng)該從所需的延遲要求入手(整體延遲、令牌數(shù)量、首個令牌時間),而不是從底層分析 GPU 能支持的性能開始。每一次新模型的迭代都可能極大地改變負(fù)載模式。
如何在大型Python 代碼庫中工作。Segment 結(jié)合了微服務(wù),主要使用 Golang 和 Typescript。我們沒有 OpenAI 那樣龐大的代碼量。我學(xué)到了很多關(guān)于如何根據(jù)開發(fā)者數(shù)量來擴展代碼庫的經(jīng)驗。你必須為“默認(rèn)可用”、“保持主分支干凈”和“難以誤用”等方面設(shè)置更多的保護措施。
發(fā)布Codex
我在OpenAI 的最后三個月中,很大一部分時間都投入到了 Codex 的發(fā)布。這無疑是我職業(yè)生涯中的一個重要亮點。
背景介紹:早在2024 年 11 月,OpenAI 就設(shè)定了 2025 年推出編程代理的目標(biāo)。到了 2025 年 2 月,我們內(nèi)部已有一些利用模型取得顯著效果的工具在運行。我們感受到了推出專門針對編程的代理的壓力。顯然,模型已經(jīng)發(fā)展到對編程非常有用的階段(市場上新興的各種編程輔助工具的爆發(fā)即是明證)。
我提前結(jié)束了陪產(chǎn)假,回去協(xié)助參與Codex 的發(fā)布。一周后,我們經(jīng)歷了兩個團隊(略顯混亂的)合并,隨后開始了瘋狂的沖刺。從最初編寫第一行代碼到完成,整個產(chǎn)品僅用了 7 周時間。
Codex 沖刺可能是我近十年來最努力的一次。大多數(shù)晚上都工作到十一點或午夜。每天早上五點半被新生兒叫醒。七點又去辦公室。大多數(shù)周末也在工作。我們作為一個團隊全力以赴,因為每一周都至關(guān)重要。這讓我想起了在 Y Combinator 的時光。
這種速度之快,難以用言語形容。我從未見過無論大小的組織能在如此短的時間內(nèi),從一個想法發(fā)展到完全發(fā)布且免費提供的產(chǎn)品。范圍也不小;我們構(gòu)建了一個容器運行時,優(yōu)化了代碼庫下載,微調(diào)了一個定制模型以處理代碼編輯,處理了各種git 操作,引入了全新的界面,啟用了互聯(lián)網(wǎng)訪問,最終打造出一個使用起來非常愉快的產(chǎn)品。
不管你怎么說,OpenAI 依然保持著那種開拓精神。
好消息是,合適的人才能創(chuàng)造奇跡。我們是一個由大約8 名工程師、4 名研究員、2 名設(shè)計師、2 名市場推廣人員和 1 名產(chǎn)品經(jīng)理組成的高級團隊。如果沒有這支團隊,我想我們早就失敗了。沒人需要太多指導(dǎo),但確實需要相當(dāng)多的協(xié)調(diào)。如果你有機會與 Codex 團隊的任何人合作,請知道他們每一個人都非常出色。
發(fā)布前一晚,我們五個人熬夜到凌晨4 點,試圖部署主單體系統(tǒng)(這是一個耗時數(shù)小時的過程)。然后我們又回到辦公室,準(zhǔn)備上午 8 點的發(fā)布公告和直播。我們開啟了功能開關(guān),開始看到流量涌入。我從未見過一個產(chǎn)品僅僅出現(xiàn)在左側(cè)邊欄就能獲得如此迅速的增長,但這就是 ChatGPT 的力量。
在產(chǎn)品形態(tài)方面,我們最終確定了一種完全異步的形式。與當(dāng)時的Cursor(現(xiàn)在也支持類似模式)或 Claude Code 等工具不同,我們的目標(biāo)是讓用戶能夠啟動任務(wù),讓代理在自己的環(huán)境中運行。我們的賭注是在最終階段,用戶應(yīng)該像對待同事一樣對待編碼代理:他們向代理發(fā)送信息,代理有時間完成工作,然后帶著一個 PR 回來。
這有點像一場賭博:我們現(xiàn)在處于一個有些奇怪的狀態(tài),模型表現(xiàn)不錯,但還不算出色。它們可以連續(xù)工作幾分鐘,但還不能持續(xù)幾個小時。用戶對模型能力的信任程度差異很大。而且我們甚至還不清楚模型的真正能力到底有多強。
從長遠(yuǎn)來看,我確實相信大多數(shù)編程將更像Codex。同時,觀察所有產(chǎn)品如何展開將會非常有趣。
Codex(也許并不令人意外)非常擅長在大型代碼庫中工作,理解如何導(dǎo)航。與其他工具相比,我見過的最大區(qū)別是它能夠同時啟動多個任務(wù)并比較它們的輸出。
我最近看到有公開數(shù)據(jù)比較了不同LLM 代理提交的 PR 數(shù)量。僅從公開數(shù)據(jù)來看,Codex 已經(jīng)生成了 63 萬個 PR。自發(fā)布以來的 53 天內(nèi),平均每位工程師提交了約 7.8 萬個公開 PR(你可以自行推測私有 PR 的倍數(shù))。我不確定我這輩子是否曾參與過如此有影響力的項目。
離別感言
說實話,我最初對加入OpenAI 感到有些擔(dān)憂。我不確定放棄自由、接受上司管理、成為龐大機器中一個微小部分的感覺會是怎樣。我一直低調(diào)地保密自己加入了,萬一不合適的話。
我確實想從這次經(jīng)歷中獲得三樣?xùn)|西:
1、建立對模型訓(xùn)練方式及其能力發(fā)展方向的直覺理解;
2、與杰出人才共事并學(xué)習(xí);
3、推出一款偉大的產(chǎn)品。
回顧這一年,我認(rèn)為這是我做過的最明智的決定之一。很難想象在別處還能學(xué)到更多。
如果你是創(chuàng)始人,感覺你的初創(chuàng)公司真的沒有什么進(jìn)展,你應(yīng)該要么深入重新評估如何增加更多嘗試機會;要么去加入一家大型實驗室。現(xiàn)在是一個極佳的創(chuàng)業(yè)時機,同時也是洞察未來走向的絕佳時刻。
在我看來,通向通用人工智能(AGI)的道路目前是一場三馬爭霸:OpenAI、Anthropic 和谷歌。每個組織都會根據(jù)自身的基因(面向消費者、面向企業(yè)、堅實的基礎(chǔ)設(shè)施加數(shù)據(jù))走不同的路徑。在其中任何一家工作都會是一次開闊眼界的經(jīng)歷。
感謝Leah 在深夜時分給予極大的支持并承擔(dān)了大部分育兒工作。感謝 PW、GDB 和 Rizzo 給我這個機會。感謝 SA 團隊的成員教我入門:Andrew、Anup、Bill、Kwaz、Ming、Simon、Tony 和 Val。還要感謝 Codex 核心團隊帶我經(jīng)歷了人生難忘的旅程:Albin、AE、Andrey、Bryan、Channing、DavidK、Gabe、Gladstone、Hanson、Joey、Josh、Katy、KevinT、Max、Sabrina、SQ、Tibo、TZ 和 Will。我永遠(yuǎn)不會忘記這次沖刺。
每當(dāng)有領(lǐng)導(dǎo)離職時,人們很容易去解讀各種戲劇性事件,但我認(rèn)為其中大約70%的原因僅僅是這個事實。
我確實認(rèn)為我們正處于一個輕微的階段性變化。公司正在從外部大量招聘高級領(lǐng)導(dǎo)。我總體上支持這一點,我認(rèn)為公司從注入新的外部基因中受益匪淺。
我感覺,擴展有史以來增長最快的C端產(chǎn)品往往會鍛煉出強大的實力。
當(dāng)然,我們也是站在巨人的肩膀上。CaaS 團隊、核心強化學(xué)習(xí)團隊、人類數(shù)據(jù)和通用應(yīng)用基礎(chǔ)設(shè)施使這一切成為可能。
我們也一直在堅持。
幾周前我們看到meta 有一些重要的招聘。xAI 推出了在基準(zhǔn)測試中表現(xiàn)出色的 Grok 4。Mira 和 Ilya 都有很強的才華。也許這會改變局面(這些人很優(yōu)秀)。他們還有一些需要趕上的地方。
原文鏈接:https://calv.info/openai-reflections
本文來自微信公眾號:劃重點KeyPoints,編譯:重點君
本內(nèi)容為作者獨立觀點,不代表虎嗅立場。未經(jīng)允許不得轉(zhuǎn)載,授權(quán)事宜請聯(lián)系 hezuo@huxiu.com
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4587802.html?f=wyxwapp





京公網(wǎng)安備 11011402013531號