“200 家 AI 初創公司中,73% 的產品實際上只是‘套殼’,主要套的還是 ChatGPT、Claude!”
這一結論一出,給 AI 創業圈帶來不小的打擊與爭議。
回想 2023 年,OpenAI CEO Sam Altman 曾直言:“套殼 ChatGPT 注定消亡。”
然而現實恰恰相反:隨著 ChatGPT 的爆火,創業熱潮一浪接一浪,無數投資擁入,一些公司甚至尚未發布產品就已吸引不小的關注度。
如今,一位軟件工程師 Teja Kusireddy 用數據扯開了這場“繁榮”背后的部分真相。他對 200 家 AI 公司進行了逆向工程、反編譯代碼,并追蹤 API 調用,發現許多號稱“顛覆性創新”的公司,其核心功能仍依賴第三方服務,只是在外層多套了一層“創新”的殼。市場宣傳與實際情況之間的差距令人震驚。
那么,究竟是投資人“完全不懂”,還是 AI 初創公司“太會忽悠”?“自研”與“套殼”的界限如何而定?接下來,我們將通過 Teja Kusireddy 發布的長文,從他的第一視角,看看他用數據揭示的最新發現與結論。


為什么會發起“逆向工程”?
上個月,我掉進了一個意料之外的“兔子洞”,陷入了迷茫——一開始只是一個很簡單的問題,最后卻讓我開始懷疑自己對整個 AI 創業生態的一切認知。
那天是凌晨兩點,我在調試一個 webhook 集成時,偶然間發現了點不對勁的東西。
一家聲稱擁有“自主研發的深度學習基礎設施”的公司,竟然每隔幾秒就在調用 OpenAI 的 API。
而這家公司,剛剛憑著“我們構建了完全不同的 AI 技術”這一說法,從投資人那里融到了 430 萬美元。
就在那一刻,我決定——要徹底查清這件事,到底有多復雜。

調查方法:我是怎么做的
我不想寫一篇靠“直覺”發牢騷的熱評,我要的是數據,一個真實的數據。
于是,我開始動手搭建工具:
What they market as: Proprietary Neural Retrieval Architecture Step 1: Advanced Semantic Encodingembedding = openai.Embedding.create(input=question,model=text-embedding-ada-002) Step 3: Contextual Synthesiscontext = .join([match.metadata['text']for match in results.matches])# Step 4: Proprietary Language Modelresponse = openai.ChatCompletion.create(model=gpt-4,messages=[{role: system,content: fUse this context: {context}},{role: user,content: question}])return response.choices[0].message.content
這并不是說技術不好——RAG 確實有效。但把它稱作 “自研 AI 基礎設施”,就像把你的 WordPress 網站叫做 “定制內容管理架構” 一樣荒誕。
再來算筆賬,這家公司的實際成本(每次查詢):
OpenAI 嵌入模型:每 1 K tokens 為 0.0001 美元
Pinecone 查詢:每次 0.00004 美元
GPT-4 生成:每 1K tokens 為 0.03 美元
總成本:約 0.002 美元/次查詢
而用戶實際支付的價格:0.50–2.00 美元/次查詢
API 成本利潤率高達 250–1000 倍!
我發現 12 家公司代碼結構完全一樣,另外 23 家公司相似度超過 90%。
唯一的差別只是變量名,以及使用 Pinecone 還是 Weaviate。
有家公司添加了 Redis 緩存,并吹成 “優化引擎”
另一家公司加了重試邏輯,還把它注冊商標,叫 “智能故障恢復系統”
一個典型初創公司每月運行 100 萬次查詢的經濟情況:
成本:
OpenAI 嵌入模型:約 100 美元
Pinecone 托管:約 40 美元
GPT-4 生成:約 30,000 美元
總成本:約 30,140 美元/月
收入: 150,000–500,000 美元/月
毛利率:80–94%
這算是糟糕的生意嗎?不是,毛利率非常可觀。
但它是 “自研 AI” 嗎?也不是。
模式 3:所謂“我們微調了自己的模型”,實際上……
微調聽起來很厲害,而且在某些情況下確實有用。但我發現的情況是這樣的:

真正從零訓練模型的公司只占 7%。敬佩!他們的基礎設施我都看到了:
AWS SageMaker 或 Google Vertex AI 的訓練任務
將訓練好的模型文件(模型產物)存儲在 S3 桶中。
自定義推理端點
GPU 實例監控
其余大多數公司只是使用 OpenAI 的微調 API,本質上就是——付錢給 OpenAI,把自己的 prompt 和示例保存到他們的系統里。

30 秒教你識別“套殼公司”
如果你想知道我說的是真是假,其實根本不需要我花三周調查,這里有快速識別方法:
現象 1:網絡流量
打開 DevTools(F12),切換到 Network 標簽頁,然后與其 AI 功能交互。如果你看到這些請求:
api.openai.com
api.anthropic.com
api.cohere.ai
那你看到的就是「套殼公司」。他們可能加了一層中間件,但 AI 并不屬于他們。
現象 2:響應時間模式

OpenAI 的 API 有一個獨特的延遲特征。如果每次響應都在 200–350ms 之間,那就基本可以確定是 OpenAI 的服務。
現象 3:Javascript 打包文件
打開網頁源碼,搜索以下關鍵詞:
openaianthropicsk-proj-(OpenAI API key 前綴,如果他們不小心泄露)claudecohere
我發現 12 家公司把 API Key 留在前端代碼里。我都舉報了,但沒有一家回應。
現象 4:營銷語言矩陣

規律很明顯:
具體技術術語 = 可能是真的
模糊的營銷詞 = 很可能在掩飾
如果他們只會用“先進 AI”、“智能引擎”之類的模糊詞,而沒有具體技術細節,通常意味著背后有貓膩。

基礎設施的真實情況
實際上,AI 初創公司的技術格局大致如下:

為什么這真的很重要?
你可能在想:“管它呢?能用就行。”
你說的部分確實沒錯,但事情比表面更重要:
對投資人來說:你在資助的是 prompt engineering,而不是 AI 研究。估值得調整。
對客戶來說:你支付的是 API 成本加高額溢價。事實上,你可能一個周末就能搭出同樣的東西。
對開發者來說:門檻比你想象的低。那個你羨慕的“AI 初創公司”?它的核心技術,你可能在黑客松里就能做出來。
對整個生態來說:當 73% 的“AI 公司”都在夸大或誤導自己的技術實力,我們已經處在泡沫狀態了。
套殼模式(因為并非所有套殼都是壞事)

聰明的套殼公司并沒有撒謊,它們在做的其實是:
特定領域的工作流
更優的用戶體驗
巧妙的模型編排
有價值的數據管道
它們只是底層使用了 OpenAI,這沒有問題。

那 27% 做對了的公司
讓我來重點介紹那些誠實做事的公司:
第一類:透明套殼公司
首頁直接寫著 “Built on GPT-4”。它們賣的是工作流,而不是 AI 本身。案例包括:
法律文檔自動化(GPT-4 + 法律模板)
客服路由系統(Claude + 行業知識)
內容工作流(多模型 + 人工審核)
第二類:真正的構建者
這些公司實際在訓練模型:
醫療 AI(HIPAA 合規的自托管模型)
金融分析(定制風險模型)
工業自動化(專用計算機視覺模型)
第三類:創新者
在現有基礎上構建真正新技術的公司:
多模型投票系統,提高準確性
帶記憶的自定義智能體框架
新型檢索架構
這些公司會在宣傳時候詳細講解它們的架構,因為他們真的自己做了。

我學到了什么(以及你應該知道的)
經過三周對 AI 初創公司的逆向工程,我總結出以下幾點:
技術棧本身沒那么重要,關鍵是解決的問題。我發現的一些最棒的產品,“只是”套了層殼。它們有出色的用戶體驗、解決了真實問題,并且對自己的方式很誠實。
但誠實很重要。一個聰明的套殼公司和一個欺詐公司之間的差別,就是透明度。
AI 熱潮正在創造錯誤的激勵。創始人感到壓力,被迫宣稱“自研 AI”,因為投資人和客戶都期望如此。這種狀況需要改變。
基于 API 構建并不可恥。每個 iPhone 應用都是“封裝 iOS API”的產物,我們不在意。我們關心的是它能不能用。
真正的考驗:你能自己做出來嗎?
我的評估框架如下:

如果你在 48 小時內能復刻他們的核心技術,他們就是套殼公司。
如果他們對這一點很誠實,那沒問題。
如果他們撒謊——趕緊遠離。

我的實際建議
對創始人:
誠實說明你的技術棧
在用戶體驗、數據和行業知識上競爭
不要聲稱做了你沒有做過的事
“Built with GPT-4” 并不是弱點
對投資人:
要求查看架構圖
索取 API 賬單(OpenAI 發票不會騙人)
合理評估套殼公司
獎勵透明度
對客戶:
檢查網絡流量(Network Tab)
詢問基礎設施細節
不要為 API 調用支付 10 倍溢價
根據效果,而不是技術宣傳來評估

那件沒人敢明說的事
大多數所謂的“AI 初創公司”,其實是靠 API 成本而不是員工成本運作的服務型公司。
這沒什么問題。
但就該叫它本來的名字。
接下來會發生什么?
AI 套殼時代是不可避免的。我們在其他領域經歷過同樣的周期:
云基礎設施(每個創業公司都聲稱“自建數據中心”)
移動應用(人人都說自己是“原生”,其實是混合開發)
區塊鏈(每家公司都在“基于區塊鏈”開發)
最終,市場會成熟。踏實的開發者會勝出,騙子會被揭穿。
而現在,我們正處在混亂的中間階段。

最后的思考
在逆向分析了 200 家 AI 初創公司后,我反而對這個領域更樂觀,而不是更失望。
那 27% 真正在做技術研發的公司,做得非常出色。
聰明的套殼公司也在解決真正的問題。
即便一些存在誤導的公司,也有不錯的產品,只是營銷需要調整。
但我們需要讓關于 AI 基礎設施的誠實成為常態。使用 OpenAI 的 API 并不意味著你就不是開發者。撒謊才會讓你失去可信度。
做酷產品,解決真實問題,使用任何有效的工具。只是別把你的 prompt 工程吹成“專有神經網絡架構”。

調查以來的心路歷程
在博客文章的最后,Teja Kusireddy 也分享了他開始調查后的情況:
第 1 周:原以為大約 20–30% 的公司使用第三方 API,但還是太天真了。
第 2 周:有創始人聯系他,問“怎么進入了他們的生產環境”。其實,Teja Kusireddy 根本沒進去,他看到的一切都在瀏覽器網絡面板里,這些企業只是沒想到有人會看。
第 3 周:有兩家公司要求 Teja Kusireddy 撤掉發現內容。
昨天:一位 VC 問他是否可以在下一次董事會前審查他們的投資組合公司,Teja Kusireddy 答應了。
Teja Kusireddy 表示,他后面會在 GitHub 上公開分享調查的方法論、完整的爬取基礎設施、API 指紋識別技術、可立即運行的檢測腳本以及各大 AI API 的響應時間模式等等。
在三周里,Teja Kusireddy 稱自己學到的唯一結論是:市場最終會獎勵透明,哪怕一開始可能懲罰它。他還透露,自己這篇內容發布之后:
有 7 位創始人私下聯系了他,有的防御,有的感激。
三家公司請求幫忙,把營銷從“專有 AI”轉成“基于頂級 API 開發”。
一位創始人告訴他:“我知道我們在撒謊,投資人希望這樣,大家都這么做。我們該怎么停?”
“AI 的淘金熱不會結束,但誠實時代必須開始,”Teja Kusireddy 說道,“如果你感興趣,可以打開你的 DevTools,查看網絡面板,自己驗證。真相,就在 F12 之下。”





京公網安備 11011402013531號