12月18日早間,商湯科技在港交所發布公告,根據一般授權配售新B類股份。此次配售不少于六家機構積極認購,充分反映市場對商湯科技長期價值的堅定信心。公告顯示,此輪配售款項較多比例用于持續擴大AIDC“大裝置”的規模和提高國產化比例。
值得關注的是,在本周(12月15日)寒武紀宣布完成對商湯日日新Seko系列多模態模型的適配,且是“Day 0”級別的同步支持。在寒武紀的官方適配名單中,能做到Day 0響應的,此前只有兩家:一家是主攻大語言模型的DeepSeek,另一家就是商湯“日日新”多模態大模型。
這一細節意味深長,亦是中國AI產業迎來了一個看似靜水流深、實則波瀾壯闊的節點。如果說適配DeepSeek代表的是國產芯片在文本邏輯處理上的成熟,那么商湯“日日新”Seko模型系列的適配,則標志著國產算力在高帶寬、高并發的多模態場景中實現了關鍵跨越。
從客觀技術條件來看,這首先是為了抵抗Scaling Law遭遇的供應鏈約束、以及單純依賴堆疊算力的線性增長路徑的失效。
從商業視角來看,這比“國產芯片+國產模型”的技術握手更加深遠,因為它預示著AI產業的下半場不再是參數的規模競逐,而是要回歸物理現實。與此同時,原生AI企業正在成為國產芯片成熟化的“加速器”。
不難發現,過去一年的時間里,中國AI行業的目光逐漸從云端收回,開始審視一個棘手的灰犀牛:AI進化的重心,已經悄然下沉到算力層的自主可控。
然而,AI的“國產化突圍”不是簡單的硬件替代,而是一場意味著“重塑”的系統工程。因此,在“算力主權時代”的前夜,從業者面臨的并非坦途。
雖然國產芯片力量正如雨后春筍般涌現,但中國芯的生機之下,卻也伴隨著不可避免的熵增:硬件架構的不統一,形成了一座座孤島,導致訓練與推理的遷移成本極高,形成了一座新的“巴別塔”。
面對這一現狀,商湯科技選擇了一條極具長期主義色彩的路徑:全面擁抱國產化,做那個“修塔”的人。
![]()
大裝置,國產芯片的“練兵場”
中國AI的突圍,真的只能死磕納米級的芯片制程工藝嗎?
這是一塊長期盤旋在行業上空的陰云。限制擺在眼前,我們似乎撞上了一堵墻,而商湯這些AI廠商則看到了墻上的另一扇門。
這家公司給出的答案是:當下比和工藝同樣重要的,是生態的“可戰性”。
而商湯大裝置(SenseCore)在這一戰略中扮演的角色,已經超越了傳統的算力中心,而是一個巨大的異構調度與適配平臺。它更像是一個國產芯片的“練兵場”和“試飛中心”。
![]()
為什么說它是練兵場?因為只有在商湯這樣千億參數級、超大規模并發的真實業務場景中,國產芯片的潛能和優化空間才能被極限激發出來。
在練兵的同時,商湯大裝置又做出了像飛機一樣精密靈活的產品:在原本異構的國產硬件之上,商湯抽象出了一層統一的軟件介質,實現了跨異構加速卡的統一訓練,為上層應用留出了一個標準化的接口,開發者可以在不同品牌的芯片之間無縫切換,讓端側用戶能夠簡單地獲取高性能、高性價比的國產算力。
看起來只是“算力服務化”,其實背后是由一個“多維共生”的算力生態支撐起來的。
商湯與寒武紀的合作,一開始就沒有只停留在硬件采購的維度,而是進入了深度耦合的深水區。商湯利用自身在大模型研發、基礎設施構建上的經驗,反哺芯片設計,雙方共同構建了“階梯式產品創新體系”,實現了真正意義上的軟硬協同。相比單一的芯片銷售,國產算力目前的一大優勢恰恰在于提供完整的生態服務。
面對擁有全功能GPU屬性的摩爾線程,商湯的合作模式更像是一種互補的“技術共生”。摩爾線程提供AI計算能力,其在圖形渲染領域的積累,恰好滿足商湯在AIGC視頻生成中的復合算力需求。
面對剛剛登陸科創板的新興算力勢力沐曦,商湯也通過在具體業務場景中的適配廣度,驗證了新架構芯片在特定高難度任務上的潛力,雙方確立了“算力集群+行業拓展”的全方位合作。針對沐曦曦云C系列GPU的高性能與生態兼容性,雙方打通了從需求到供給的優化閉環:商湯的大裝置為沐曦提供了日日新大模型的豐富場景驗證,而沐曦的高性價比算力則有效降低了商湯的建設成本。
值得注意的是,商湯在國內市場首次完成了華為昇騰910C的超節點全面適配,不是簡單的單卡跑通,而是基于384卡超大規模集群的系統級協同。在這樣的規模下,芯片間的通信延遲、帶寬瓶頸、穩定性等方面的挑戰,也會被指數級放大。這是國產GPU首次在千億參數級大模型的訓練與推理中,通過了工業級標準的嚴苛考驗,成功通過了大模型時代的“高壓測試”。這一突破也意味著國產算力和國產架構在以一體化的方式,從“可用”走向“好用”。
商湯用大裝置SenseCore和日日新大模型體系全面適配為國產芯片“練兵”的戰略,解決了AI國產化進程中關鍵的應用基礎設施難題。
至此,商湯的“大裝置-大模型-應用”三位一體戰略,也越來越具有含金量。它在試圖論證一個核心邏輯:國產AI的野心,不應止步于降低落地成本。在算力主權時代,系統級協同能力,有能力重塑生產力。
![]()
在創新中,驗證效率最優解
國產化大裝置適配與協同只是第一步,就像路修好了,還要想辦法讓車跑得更快。
對于中國的AI從業者而言,國產芯片在短期內與頂尖水準仍存在客觀差距,而國產硬件的優勢則在于更好的生態,與原生AI企業長期磨合、聯手從工程化走向商業化的長期定力。
這也是寒武紀與商湯“日日新”Seko系列多模態模型適配的戰略級價值。文本模型尚且處于國產算力的淺水區,而在視頻生成與多模態交互上想要跑出極致性價比,則需要攻克更多挑戰——不僅算力消耗巨大,對帶寬和顯存的要求更是苛刻。
這不只是技術問題,也是商業化的“勝負手”。
商湯展示出來的工程化能力,暗示了未來五到十年內的趨勢:在計算方式和架構創新的加持下,國產算力集群完全有能力實現效率上的反超,為商業化落地找到極具競爭力的成本優勢。
更具前瞻性的一個案例是,商湯與記憶張量合作,攻克了“GPGPU架構適配難度遠高于NPU”的行業難題,雙方實現了PD(Prefill-Decoding)分離技術的首次大規模商用落地,通過將預填充與解碼過程在物理上分離并異構部署,如同將一條擁堵的混合車道拆解為兩個高速并行的專用車道。結果是驚人的:國產GPU的推理性價比提升了150%。
離“未來”最近的領域,則是視頻生成。這既是當下AI競爭的新高地,也是一個公認的“算力黑洞”。商湯開源了LightX2V推理框架,這是行業首個能實現實時視頻生成的框架,目前下載量已突破350萬次。
LightX2V的戰略意義在于它的國產化適配插件模式,體現出了可觀的兼容性——不僅支持昇騰910B、海光DCU等主流國產芯片,還在設計之初就引入了低比特量化、稀疏注意力等硬件友好機制,在幾乎不損失畫質的前提下,將推理性能提升了3倍以上。
這種設計極大地釋放了國產算力的優勢,打破了過去“國產算力只能做好文本推理,做不了復雜視頻生成”的刻板認知。國產芯片同樣可以承載高帶寬、高算力的多模態任務。
如果說推理框架是工具,那么模型能力就是試金石。
在長視頻生成中,保持人物、場景的一致性是最大的挑戰之一。商湯的Seko系列模型作為行業首個多劇集生成智能體,在視頻一致性上的突破,依托的正是商湯自研技術底座與國產算力的長期磨合。
而這一能力的呈現,與商湯三位一體的戰略密不可分。商湯“全面國產化”的定力,為國產大模型的規模化落地,尤其是處理高維、動態、復雜數據等高價值密度賽道的任務,提供了更多可行性。
此外,這家公司目前正在通過開源生態,將復雜的硬件適配工作封裝在底層。上層應用開發者不需要關心芯片差異,只需要關注應用的效率和效果。
![]()
最后一公里,走向“交付級”
所有的技術決策,最終都要回歸到商業的“最后一公里”。
如何徹底驗證國產化的“三位一體”具有優越性,而不是退而求其次的無奈之舉?終局,還是應用落地。
因此,商湯戰略觸角中很重要的一環就是“應用”。它們并沒有止步于云端大裝置,而是延伸到了端側世界。目前,商湯的產品矩陣涵蓋了從大裝置到日日新多模態模型、再到端側應用的全棧生態。
以小浣熊這款AI辦公應用為例,不僅完成了國產芯片適配,其端側模型精度能夠對標云端。“國產算力難以在終端普及”的魔咒被打破。AI數字人生成平臺如影,也在國產算力底座上實現了高效運行,為視頻內容創作提供了自主可控的生產力工具。
![]()
商湯智能辦公助手—辦公小浣熊Raccoon
未來,高性能AI會像普惠的水電煤一樣,走入尋常百姓家。
特別是在城市管理、金融、醫療等對數據主權極其敏感的業務上,無論是企業還是個人客戶,幾乎都面臨著高性能、便捷性、自主可控的不可能三角。公有云更便捷,但數據安全得不到保障;私有部署更安全,但國產硬件適配難度大、性能不穩定。商湯提供的全棧國產化私有化部署方案,精準地擊中了這一痛點。
目前,商湯已經在這些領域實現了對國產芯片的全面適配與正式交付。這也意味著,基于國產算力和國產大模型的解決方案,已經從技術驗證走向了真正的商業化。
商湯正在走出一條屬于中國科技企業的長期主義之路。將“算力國產化”的宏大敘事轉化為每個人都看得見、用得起的生產力工具,需要用實打實的應用層交付量來書寫信心。這不僅是中國AI產業走向獨立自主的一張技術信任票,也是商湯“三位一體”模式的最后一公里。





京公網安備 11011402013531號