![]()
選自Calvin French-Owen博客
機器之心編譯
作者:Calvin French-Owen
揭秘 OpenAI 打工日常。
一直以來,OpenAI 都是媒體的重點關注對象,尤其在多位核心員工離職后,關于 OpenAI 內部文化和管理方式的討論更是愈演愈烈。
最近,OpenAI 前員工 Calvin French-Owen 發布了一篇深刻的反思文章,親身講述了自己在 OpenAI 工作的點滴,也為我們提供了關于 OpenAI 內部運作的第一手資料。
![]()
Calvin French-Owen 是誰?
Calvin 是一位經驗豐富的創業者、工程師。
![]()
據領英個人頁面顯示,Calvin 本科就讀于麻省理工學院的計算機科學專業。
![]()
大學還沒畢業,他就成為客戶數據平臺 Segment 的聯合創始人兼首席技術官。2020 年,Segment 被 Twilio 以 32 億美元收購。之后,Calvin 做過兩份短暫的全職工作,其中一份工作就在 Y Combinator。
![]()
2024 年 5 月,Calvin 加入 OpenAI,成為一名工程師,并參與了 Codex 項目的開發。Codex 是 OpenAI 推出的 AI 編程助手,旨在幫助開發者提高編碼效率。
在 OpenAI 待了一年多后,Calvin 于今年 6 月份離職。
離職三周后,他在個人博客中寫下了這篇名為《關于 OpenAI 的反思》文章。
至于離職原因,Calvin 強調并沒有什么私人恩怨,相反,他走的時候還挺糾結。
「從自己當老板到成為 3000 人公司的一員,這種轉變確實不小。現在,我想重新開始,找點新鮮感,但說不定哪天我會回去,畢竟 OpenAI 的工作吸引力太強了,能參與 AGI 的開發、接觸到可能是這十年最重要的技術,這種機會太難得了。」
沒有郵件文化,全靠Slack溝通
Calvin 透露,OpenAI 的增長速度快得驚人。
他剛加入時,公司剛過 1000 人,但一年后已經超過 3000 人,Calvin 的工齡甚至排在前 30%,而領導層的職責也跟兩三年前完全不同。
這么快的擴張,必然會出現各種問題,比如內部溝通、組織架構、產品發布、人員管理、招聘流程等等。
不同團隊的風格差別也很大:有的團隊全速沖刺各種新項目,有的負責大模型訓練,還有一些團隊則按部就班,節奏更為穩定。總之,OpenAI 沒有統一的工作體驗,因為研究、應用和市場推廣團隊的工作節奏完全不同。
特別有意思的一點是,OpenAI 內部事情幾乎全靠 Slack 溝通,基本不用郵件。Calvin 在公司一年大概只收到 10 封郵件。如果 Slack 通知沒有設置好,會覺得非常分散注意力;但如果管理得當,Slack 還挺好用的。
晉升靠實際能力,而不是演講或搞政治
OpenAI 在研究方面非常「自下而上」。Calvin 剛加入時,詢問下一季度的計劃,得到的回答是:「沒有這種東西!」(不過現在有了)。好點子可以從任何地方冒出來,事先沒人知道哪個會成功,研究進展靠一步步試錯,靠新發現推動,而不是什么宏大藍圖。
這種自下而上的文化讓 OpenAI 很看重能力,公司領導的晉升也主要看誰能提出好點子并執行到位。很多厲害的領導其實并不太擅長演講或搞辦公室政治,但在 OpenAI 這都不重要,好想法才是王道,他們更看重實際能力和成果,而不是表面功夫或內部博弈。
只要有好想法,無需請示,干就完了
OpenAI 強調「行動為先」(你可以直接去做事)。不同團隊常會不約而同想到類似點子。Calvin 剛去時參與了一個類似 ChatGPT Connectors 的內部項目。Codex 發布前,公司里大概有三四個類似的原型,都是幾個人自發搞的,不需要向上級請示,只要點子有潛力,團隊很快就會聚起來。
Codex 的負責人 Andrey 說,研究員就像「小型 CEO」,公司鼓勵研究員自己找問題、試想法,如果一個問題被認為「無聊」或「已解決」,基本不會再有人去碰它。
優秀的研究經理超級重要,但資源有限。他們能把不同研究工作串起來,推動更大規模的模型訓練。優秀的產品經理(PM)也一樣。
Calvin 舉了個例子。他合作過的 ChatGPT 工程經理(Akshay、Rizzo、Sulman)是他見過最沉穩的人,感覺他們什么陣仗都見過了。他們大多放手管理,專注于招聘優秀人才并為他們創造成功的條件。
戰略調整迅速,很注重保密
OpenAI 的戰略轉向很快。新信息來了就調整方向,不死守計劃。一個 3000 人的公司能保持如此高效決策的能力,這一點是谷歌比不了的。OpenAI 決策很快,一旦確定方向,就會全力以赴。
公司受外界關注極多,經常內部還沒宣布的事,媒體就先報道了。一些 Twitter 用戶甚至運行自動化機器人,監控 OpenAI 是否有新功能發布。
所以,OpenAI 很注重保密,這也使得 Calvin 沒法跟外人細說他究竟在干啥。Slack 工作區有嚴格的權限管理,收入和支出數據更是高度保密。
內部非常重視安全問題
OpenAI 比你想象的嚴肅,因為責任重大。一方面,公司目標是打造 AGI,壓力山大;另一方面,產品服務數億用戶,涉及醫療建議、心理咨詢等各種場景。同時,公司還在全球最大舞臺上競爭,盯著 meta、谷歌、Anthropic 的動態,當然它們肯定也在盯著 OpenAI。各國政府也在密切關注 AI 領域。
雖然 OpenAI 常被媒體批評,但每個人都在努力做正確的事。作為消費者導向的公司,它最受矚目,自然也招來最多非議。
但別把 OpenAI 看成鐵板一塊。它更像最初的洛斯阿拉莫斯實驗室:一群科學家搞前沿研究,意外做出了席卷全球的應用,然后開始向政府和企業拓展。不同部門、不同工齡的員工目標和視角差別很大。待得越久,越可能以「研究實驗室」或「公益組織」的角度看問題。
OpenAI 真的在踐行 AI 的普惠。尖端模型不只給大客戶,任何人都能用 ChatGPT,哪怕不登錄。API 對初創公司開放,最先進的模型也很快會上線。
安全問題比你想的更受重視。很多人致力于開發安全系統,重點解決實際風險,比如仇恨言論、濫用、操控政治偏見、生物武器、自我傷害、提示注入等,而不是空談理論風險(像智能爆炸)。理論風險也有人研究,但不是重點,很多安全工作還沒公開。
靠 Twitter 氛圍驅動
與其他公司在招聘會上隨意發放各種帶有品牌標志的紀念品不同,OpenAI 的周邊很少,甚至新員工也拿不到多少。公司會通過「限量發售」的方式,讓大家訂購現貨。第一次發售因為需求太大,直接把 Shopify 商店搞崩潰了。內部還流傳了一篇帖子,教大家如何通過發送正確的 JSON 數據來繞過限制。
跟 GPU 成本比,其他開銷都是小錢。舉個例子,Codex 一個冷門功能的 GPU 成本,就頂得上 Segment 整個基礎設施的開銷(Segment 規模雖不如 ChatGPT,但流量也不小)。
你可能會覺得,擁有全球頂級應用已經夠了,但 OpenAI 還想在多個領域競爭:API、深度研究、硬件、編碼代理、圖像生成等多個領域競爭,還有一些尚未公布的項目。
OpenAI 很關注 Twitter。你發條跟 OpenAI 相關的推文火了,內部很可能有人看到并討論。有人開玩笑說:「這公司靠 Twitter 氛圍驅動。」這話不假,當然,數據分析(用戶增長、留存等)也很重要。
團隊流動性高,領導層接地氣
OpenAI 的團隊流動性很高。Codex 發布時,需要幾位經驗豐富的 ChatGPT 工程師幫忙趕上線日期。他們跟 ChatGPT 的工程經理聊了一下需求,第二天就有兩位超厲害的工程師加入幫忙。沒有「等季度規劃」或「重新分配人力」的拖延,行動非常快。
領導層也很接地氣、很投入。每個高管,比如 Greg Brockman、Sam Altman、Karpathy、mark、dane 等都在 Slack 上參與討論,沒人當「甩手掌柜」
OpenAI 有點像早期 meta
OpenAI 用一個超大的單體代碼庫,主要以 Python 為主,但也有越來越多 Rust 服務和少量 Golang 服務,通常用于網絡代理這類場景。
因為 Python 寫法靈活,代碼風格看起來五花八門。你會看到谷歌老兵寫的可擴展庫,也會碰到剛畢業的博士扔在 Jupyter 筆記本里的臨時代碼。API 基本都用 FastAPI 開發,參數校驗用 Pydantic,但公司沒有強制執行統一的代碼風格規范。
OpenAI 所有服務都跑在 Azure 上。有趣的是,只有三種服務靠譜:Azure Kubernetes Service、CosmosDB(文檔存儲)和 BlobStore。沒有 AWS 那種 Dynamo、Spanner、Bigtable、Bigquery、Kinesis 或 Aurora 的直接替代品。自動擴展的思維用得不多,權限管理(IAM)功能也比 AWS 弱不少,公司更傾向于自己開發。
工程團隊里,meta 到 OpenAI 的人才流動很明顯。OpenAI 有點像早期 meta:爆款消費者應用、剛起步的基礎設施、追求快速行動。從 meta 和 Instagram 來的基礎設施人才都很強。基礎設施很多地方有 meta 的影子,比如自研了類似 meta 的 TAO(圖數據庫),還有邊緣身份認證整合的項目等。
聊天功能深入代碼庫。ChatGPT 火了后,代碼庫很多地方都圍繞聊天消息和對話設計,這些基礎元素根深蒂固。Codex 稍有不同(更偏向 API 響應邏輯),但仍大量借用現有技術。
代碼為王。沒有中央架構或規劃委員會,干活的團隊說了算。結果就是,鼓勵行動優先,但也導致代碼庫重復,比如隊列管理或代理循環的庫就有五六個。
快速擴張的工程團隊和工具不足帶來了一些問題。后端單體服務(sa-server)有點像「垃圾堆」,主分支的持續集成更容易出問題,測試用例跑半小時是常態。這些問題不是沒法解決,但這種問題哪兒都有,擴張太快會更嚴重,好在內部團隊正在努力改進。
從敲下Codex第一行代碼到發布,只用了7周
除了以上內容,Calvin 還分享了 Codex 的發布情況。
2024 年 11 月,OpenAI 定下 2025 年推編碼 Agent 的目標。到 2025 年 2 月,內部工具已很有效,市場也冒出很多「氛圍編碼」工具。
Calvin 提前結束產假,加入 Codex 團隊。一周后,兩支團隊合并,開始瘋狂沖刺。從第一行代碼到發布,只用了 7 周。每天干到深夜 11 點或凌晨,早上 5:30 被新生兒叫醒,7 點到辦公室,周末也加班。團隊全力以赴,每周都關鍵。
這種速度太夸張了。很少有公司能這么快從點子到發布完整產品。項目還不小:構建容器運行環境、優化代碼倉庫下載、微調專門處理代碼編輯的模型、支持 git 操作、開發新界面、接入互聯網,最終打造出這個好用的產品。
無論你對 OpenAI 有什么看法,這家公司至今仍保留著那種「沖刺發布」的精神。
Codex 團隊有 8 個資深工程師、4 個研究員、2 個設計師、2 個市場人員和 1 個產品經理。沒人需要太多指導,但需要協調。
發布前一晚,團隊五人熬到凌晨 4 點,忙著部署主服務。第二天早上 8 點,回到辦公室,準備發布公告和直播。功能一上線,流量立馬涌入。「我從沒見過一個產品僅靠出現在 ChatGPT 側邊欄,就能立刻吸引這么多用戶,這就是 ChatGPT 的威力。」
產品形態上,Codex 選擇了完全異步的方式,用戶啟動任務,讓代理在獨立環境中運行。「我們的設想是,未來用戶會把編碼 Agent 當『同事』:發個任務給它,讓它干活,然后它提交一個 PR。」
這有點冒險。現在的模型很好,但還不完美,能運行幾分鐘,但還不能持續幾小時。用戶對模型能力的信任度不一,他們甚至還不完全清楚模型的真正能力。從長遠看,Calvin 相信編程會越來越像 Codex。
Codex 擅長處理大代碼庫和多任務并行。相比其他工具,它能同時跑多個任務并比較結果。公開數據顯示,Codex 發布 53 天生成了 63 萬個公開 PR,平均每位工程師貢獻約 7.8 萬個,私有 PR 可能更多。
離職感言
Calvin 坦言,最初他對加入 OpenAI 有點忐忑。放棄創業自由、接受管理、做大機器的小齒輪,他不確定能不能適應,所以剛加入時很低調,以防不合適。
他想從 OpenAI 得到三樣東西:
了解模型訓練和未來方向;跟牛人共事、學習;發布一個好產品。
而以上這些他無疑都實現了。此外,他還得到了其他收獲。
「大型消費品牌」的威力:在 OpenAI,所有衡量指標都圍繞「Pro 訂閱」展開。即使是像 Codex 這種偏工具類產品,也主要以「個人使用」的視角來設計引入流程,而不是從「團隊使用」角度出發。只要按一上線,流量馬上就來了。大模型的訓練:模型訓練是一個從「實驗」到「工程」的過程。最初都是小規模實驗,如果結果不錯,就會被整合到更大的訓練中。實驗不僅涉及調整核心算法,還要優化數據組合,仔細分析結果。到了大規模訓練,就像在搞巨型分布式系統工程,會有各種意想不到的邊緣情況,需要你去排查解決。GPU 計算的門道:Codex 發布時,需要預測負載容量要求,核心經驗就是,應該從你需要的延遲要求(整體延遲、token 數量、首個 token 時間)出發,而不是從 GPU 能支持的性能去推算。每次模型迭代都會大幅改變負載模式。在大型 Python 代碼庫中工作:當有大量開發者同時維護一個倉庫時,你必須增加各種「防誤操作」機制,比如「默認可用」、「主干分支保持干凈」、「不容易被誤用」等。這些都需要通過規范和工具來系統性保障。
最后,Calvin 表示,如果你是創業者,覺得公司沒進展,建議深入反思如何才能取得更多進展,或者加入頂級實驗室。目前來看,AGI 的競爭是三強爭霸:OpenAI、Anthropic、谷歌。每家路子不同,在任何一家工作都會大開眼界。
https://calv.info/openai-reflections





京公網安備 11011402013531號