文|鄧詠儀
編輯|蘇建勛
有人預料到DeepSeek能引爆全球嗎?至少,DeepSeek-V3發布前,在大模型戰場前線“賣鏟子”的袁進輝心里也是打鼓的。
1月28日,他在社交媒體上回憶起一個故事:DeepSeek爆火前一個月,梁文鋒曾建議硅基流動部署DeepSeek-V3,至少準備20臺H800,80臺最好。袁進輝迅速算了算賬,一個月80臺H800服務器就要支出五六百萬的算力成本,這些機器還不一定能用滿。“風險太大了,就沒下注。”
隨后DeepSeek火爆全球,洶涌的流量讓其官網和App很快崩潰,熱情的用戶急于找到能正常使用DeepSeek的渠道。袁進輝感慨:“現在DeepSeek這么火,決策失誤,欲哭無淚。”
很快,這種懊悔轉變成強大的行動力。苦于算力不足的硅基流動找到華為,全力完成DeepSeek-R1 & V3在昇騰芯片上的適配工作。整個春節期間,硅基流動團隊沒有休息過一天。
他們的動作夠快,承接住了第一波流量。2月1日,硅基流動首發了基于華為昇騰算力的滿血版DeepSeek-R1 & V3,迅速吸引了大批開發者和個人用戶。

△圖源:SimilarWeb
這是一次巧妙的合作,一舉掃清市場對于國產芯片性能瓶頸的疑慮,證明了在國產芯片上部署DeepSeek,也可以獲得持平全球高端GPU部署模型的效果。同時,這次合作無意間觸發了一場國產替代的狂歡。
硅基流動也借此證明了自己的AI Infra實力。“尤其這次上線DeepSeek R1 & V3之后,涌過來的合作線索,暫時都看不過來。”袁進輝說。
就在硅基流動爆火之前, 《智能涌現》獲悉,硅基流動(SiliconFlow)在2024年底 就已完成億元人民幣Pre-A輪融資,由華創資本領投,普華資本跟投,老股東耀途資本繼續超額跟投,華興資本擔任獨家財務顧問。
值得注意的是,本輪融資之前,硅基流動已引入美團作為戰略股東。
2024年8月,《智能涌現》曾采訪過創始人袁進輝,當時硅基流動正好成立一周年,剛發布MaaS平臺SiliconCloud。
你可以將SiliconCloud想象為一個“大模型API超市”,開發者只需要注冊賬號,選擇自己想要的模型,就可以開發應用,免去購買服務器的負擔。甚至,經過硅基流動適配和優化后的模型,還能做到比原廠模型響應更快、推理成本更低。
在這一年間,硅基流動經歷了起碼十倍的市場增長。SiliconCloud已經獲得了超三百萬的用戶,日均調用上千億Token——去年剛上線時,這個數字還是日均百億。

△圖源:硅基流動
在開發者圈子中,硅基流動有著良好的口碑,因提供親民價格和優異性能的模型服務被稱為“賽博菩薩”。現在,SiliconCloud已經上線了包括滿血版DeepSeek-R1 & V3、Qwen、FLUX.1、CosyVoice等在內的上百款主流模型,也提供模型訓練、微調、托管到部署的全套工具,滿足開發者及企業客戶的不同應用場景需求。
2024年7月,硅基流動也推出了一款新產品:基于ComfyUI的云節點插件BizyAir。
BizyAir是一款圖像生成工具,能夠讓AI開發者與創作者無需考慮顯卡和環境限制,即可直接使用云計算資源完成生圖任務。截至目前,BizyAir支持數十種模型,支持ComfyUI本地節點混跑,已經獲得了近萬名用戶。

△圖源:硅基流動
硅基流動在這一年間也開始了To B商業化擴展,與華為、亞馬遜云科技、英偉達等頂級云廠商、芯片廠商、大模型公司及應用公司建立了合作伙伴關系。
企業服務方面,硅基流動已經在大語言模型、文生圖、視頻生成等多個場景,有標桿客戶案例的落地。硅基流動目前提供四種服務模式,包括專屬實例、算力納管、私有版 MaaS、基于華為昇騰910系列NPU的一體機。
毫無疑問,DeepSeek已經一掃2024年大模型領域的陰霾,一場宏大征程的序幕已經展開。2024年,袁進輝曾對《智能涌現》表示,在GPT-4o出來后,大模型的語言能力、知識能力方面的限制都解決得比較好了,除了邏輯推理能力。
OpenAI o1、DeepSeek R1的出現,意味著大模型在“邏輯能力”這個問題上前進了一大步,這對應用市場是巨大利好。
“可以預期,國內外基于DeepSeek的應用將爆發,這一天終于要到來了。”袁進輝說。
以下為《智能涌現》與創始人袁進輝的問答:
《智能涌現》:上一輪融資之后,硅基流動在產品方面有什么節點性的進展?關鍵性能提升的程度如何?
袁進輝:主要是適配了華為昇騰芯片、開源了ComfyUI云節點 BizyAir,以及持續上線最新模型,并且上線了模型微調、托管等功能。
底層推理框架的性能依然保持業內領先,性能優化是一項需要長期、持續性投入的工作。
《智能涌現》:推出相關產品后,市場都有怎樣的反饋?商業落地上有什么關鍵性進展?
袁進輝:SiliconCloud獲得了爆發式增長,目前平臺有超三百萬用戶,日均調用超千億 Token;BizyAir在沒做什么推廣的情況下獲得了近萬名用戶。
商業落地方面,尤其這次上線DeepSeek R1 & V3之后,涌過來的合作線索暫時都看不過來。
《智能涌現》:去年7月硅基流動上線了 BizyAir,為什么會推出這個產品?戰略定位是什么?
袁進輝:BizyAir 是一個意外驚喜。起初,這是一個試驗性項目,其實還是幫助用戶用高性價比的推理服務資源,更方便地進行生圖。在BizyAir之前,我們開源的圖片/視頻生成推理加速組件OneDiff,由于性能好、靈活、支持模型豐富,已經有較好的口碑。在做OneDiff的過程中,我們了解到生圖用戶的常見痛點,包括出圖慢、工作流組合繁瑣、上手門檻高等,所以我們嘗試開發了 BizyAir,發布后受到了不少用戶的喜愛以及自發傳播。
《智能涌現》:去年你說,大模型的語言能力、知識能力方面的限制都解決得比較好了,除了邏輯。Deepseek V3之后,是不是邏輯能力也做得足夠好了,2025年會迎來現象級的應用嗎?
袁進輝:那時還沒有OpenAI o1、DeepSeek-R1。它們的發布已經展示出模型的強大邏輯推理能力,并且DeepSeek-R1把思考過程完整地展示了出來,看上去更像是一個有思辨能力的人在思考。
現在,開發者基于標準API可以做很多很酷的應用了,可以預期,國內外基于DeepSeek這樣的開源模型的應用將爆發,這一天終于要到來了。
《智能涌現》:最近硅基流動迅速基于昇騰上線了DeepSeek,春節期間也有大量開發者涌入,你們在前線看到的情況是怎么樣的?
袁進輝:我原本以為我們能接住這波用戶,但市場對DeepSeek-R1 & V3的需求量太大了,目前不得不對免費用戶進行限流,當然,我們也在積極擴展資源,希望能讓用戶敞開用。
我們作為一個面向開發者與企業客戶的API平臺,但是光官網的Playground就有幾十萬日活,可見DeepSeek需求量之大。
《智能涌現》:很多第三方企業宣布接入DeepSeek-R1 & V3 ,但為什么實際能提供滿血版的企業很少?
袁進輝:一方面,部署滿血版DeepSeek R1 & V3需要的算力資源非常大,用80臺H800來部署,每月需要五六百萬的算力成本,一般企業與其自己本地部署,顯然接入硅基流動SiliconCloud這樣的云服務 API 更劃算;
另一方面,要部署DeepSeek R1 & V3這樣的MoE模型技術挑戰很大,需要專業的AI Infra團隊才能部署成功且把性能優化得很好,硅基流動SiliconCloud曾是國內最早部署上線 DeepSeek 模型的第三方平臺,也是首個在國產芯片上適配部署DeepSeek-R1 & V3的AI Infra公司。
封面來源|AI制圖





京公網安備 11011402013531號