
“最佳銷售”黃仁勛終于看到了冰山消融的可能:就在昨天,美國總統(tǒng)特朗普通過其社交媒體宣布,經(jīng)過與中方的溝通,美國將允許芯片巨頭英偉達向中國的“經(jīng)過批準的客戶”出口其先進的AI芯片H200。
特朗普在文章中提到,此舉將為美國帶來就業(yè)和制造業(yè)的增強,并提及中方將為此支付25%的額外費用。
從今年4月14日起,英偉達AI芯片被實質(zhì)禁止對華銷售,雖然7月份英偉達官宣獲批出口許可,但并未實際向中國客戶交付H20芯片。
產(chǎn)品難以進入中國市場,肯定是英偉達的損失,但對于國產(chǎn)平替?zhèn)儊碚f,這段時間卻是難得的發(fā)展窗口。寒武紀股價狂漲,摩爾線程火線上市,就連老牌大廠百度,也傳出了有可能將昆侖芯拆分上市的消息。
H200可能解禁,是否意味著“國產(chǎn)平替”們窗口的關(guān)閉呢?
至少二級市場不這么認為。
“國產(chǎn)平替”里最先上市的摩爾線程,其股價不但沒有預想中的大幅下跌,反而在開盤后呈現(xiàn)小幅低開后快速翻紅的走勢,收盤628.31元/股,當日漲幅達5.73%,對應總市值直逼3000億元,第二天繼續(xù)上漲,收盤價達到735元,漲幅16.98%。可見市場對此并不擔憂,反而視為利好。
同樣國產(chǎn)平替陣營中,最近比較火的百度AI芯片公司昆侖芯,因為其并非上市企業(yè),并不能直接看出英偉達解禁H200對其的影響。然而,從長期來看,由于國產(chǎn)替代戰(zhàn)略的存在,以及本土芯片廠商的獨特優(yōu)勢,李廠長再造一個“寒武紀”,沒準真不是一個沒法實現(xiàn)的夢想,而H200也很難成為這條路上的攔路虎。
A
英偉達CEO黃仁勛曾在10月公開表示,在美國實施嚴格的出口管制之前,英偉達的高端AI芯片在中國市場占據(jù)主導地位,市場份額超過95%。從A100到H100,這些芯片是中國各大互聯(lián)網(wǎng)公司、科研機構(gòu)訓練大模型的核心引擎。
然而出口管制政策實施后,英偉達在華市場份額從95%驟降至接近0%。2025年三季度,其在華AI芯片銷售額占總營收不足0.1%。昆侖芯等國產(chǎn)廠商開始迅速填補這個空缺。
IDC數(shù)據(jù)顯示,2024年中國自主研發(fā)的AI芯片在國內(nèi)市場的份額已攀升至30%,2025年預計將突破50%。
H200獲準進入中國市場的消息,給市場帶來了震動。雖然英偉達最新的旗艦產(chǎn)品是基于Blackwell架構(gòu)的B200系列,但H200依然是一款高性能芯片。

它基于成熟的Hopper架構(gòu),擁有與旗艦H100相同的989 TFLOPS的FP16/BF16半精度浮點算力,集成了約16896個CUDA核心和528個第四代Tensor Core。其最大的亮點是配備了高達141GB的HBM3e高帶寬內(nèi)存,內(nèi)存帶寬達到驚人的每秒4.8TB,這甚至超過了H100的80GB HBM3內(nèi)存和3.35TB/s的帶寬。
對于需要處理萬億參數(shù)、消耗海量顯存的大模型訓練任務而言,更大的內(nèi)存容量和帶寬意味著可以容納更大的模型、使用更大的批次進行訓練,從而顯著提升效率。
事實上,H200的回歸并非意味著英偉達能完全重奪中國市場。
第一個難題就是高昂的價格。按照單顆H200售價約4萬美元計算,25%的抽成意味著每顆芯片需要額外支付1萬美元。這使得H200的實際采購成本遠高于此前的H100,也高于國產(chǎn)同類產(chǎn)品。
其次是配額限制。銷售僅限于“經(jīng)批準的客戶”,并由美國商務部進行審查。這意味著大量中小企業(yè)和被列入實體清單的機構(gòu)無法獲得采購資格,而這恰恰是國產(chǎn)芯片的主要市場空間。
更重要的是市場分化的趨勢。英偉達的優(yōu)勢在于極致性能和成熟的CUDA生態(tài),這對追求尖端算力的頭部互聯(lián)網(wǎng)公司具有吸引力。但在強調(diào)安全可控的政務、金融、能源等關(guān)鍵領域,國產(chǎn)替代已成為剛性需求,H200難以進入。
然而需要強調(diào)的是,H200的性能與此前英偉達專為中國市場推出的“閹割版”H20形成了鮮明對比。
盡管H20擁有看似不錯的96GB顯存,但其算力被大幅削減至僅148 TFLOPS。據(jù)美國智庫進步研究所的報告評估,H200的性能是H20的6倍左右,這使其成為一個完全不同量級的競爭者。
這種性能上的巨大落差導致H20在市場上反應平平。騰訊控股總裁劉熾平在財報電話會議上明確表態(tài),公司已儲備足夠的GPU庫存以支撐未來的模型訓練工作,無需采購H20。阿里云在2026財年第一季度財報中也表示,H20的實際算力表現(xiàn)“無法滿足大模型迭代需求”。
當前國產(chǎn)AI芯片主流算力多處于英偉達A100階段。比如寒武紀的旗艦產(chǎn)品思元590,明確對標英偉達A100;剛剛登陸科創(chuàng)板的摩爾線程,其AI芯片MTT S3000同樣對標A100。少數(shù)廠商產(chǎn)品僅接近H100水平,像沐曦計劃2026年下半年才對流片對標H100的產(chǎn)品進行研發(fā),與H200存在明顯代差。
H200的回歸還給國內(nèi)帶來了英偉達引以為傲的CUDA生態(tài)。
CUDA是一個包含了編譯器、庫、開發(fā)工具和開發(fā)者社區(qū)的完整生態(tài)系統(tǒng)。深度學習框架本身不具備直接調(diào)用GPU的能力,必須通過“中間適配層”才能讓GPU干活,而CUDA就是英偉達GPU的“專屬中間適配層”。過去十幾年,全球絕大多數(shù)AI研究和商業(yè)應用都在CUDA上構(gòu)建。
百度飛槳可以適配昆侖芯,此時它不依賴CUDA,而是依賴昆侖芯的“專屬中間層”(XPU SDK)。但如果開發(fā)者的模型是構(gòu)建在CUDA上的,那么想要使用昆侖芯去運行它,就必須得“翻譯”成飛槳能聽懂的代碼。
百度飛槳雖推出了插件式CUDA兼容類硬件接入方案,能讓硬件廠商復用部分CUDA算子,kernel復用率最高可達92.6%,但這只是針對硬件廠商的適配優(yōu)化,在一些關(guān)鍵任務上,仍然需要開發(fā)者重新使用飛槳平臺編寫。
出于對開發(fā)效率、穩(wěn)定性和生態(tài)成熟度的考量,部分追求極致性能且預算充足的商業(yè)客戶,可能會選擇繼續(xù)采用英偉達方案。但這并不意味著國產(chǎn)芯片會失去市場——兩者的目標客戶群體正在分化,英偉達吃高端市場,國產(chǎn)芯片則在中低端市場和安全可控領域站穩(wěn)腳跟。
它基于成熟的Hopper架構(gòu),擁有與旗艦H100相同的989 TFLOPS的FP16/BF16半精度浮點算力,集成了約16896個CUDA核心和528個第四代Tensor Core。其最大的亮點是配備了高達141GB的HBM3e高帶寬內(nèi)存,內(nèi)存帶寬達到驚人的每秒4.8TB,這甚至超過了H100的80GB HBM3內(nèi)存和3.35TB/s的帶寬。
對于需要處理萬億參數(shù)、消耗海量顯存的大模型訓練任務而言,更大的內(nèi)存容量和帶寬意味著可以容納更大的模型、使用更大的批次進行訓練,從而顯著提升效率。
B
與其他國產(chǎn)AI芯片廠商不同,昆侖芯并非孤立的硬件產(chǎn)品,而是百度AI生態(tài)中的關(guān)鍵一環(huán)。
2021年,百度的智能芯片及架構(gòu)部門完成了獨立融資,正式成立了昆侖芯(北京)科技有限公司。盡管已經(jīng)成為一家獨立公司,百度依然是其控股股東,持有約59.45%的股份。
昆侖芯第一代產(chǎn)品在2020年量產(chǎn),采用14nm工藝和自研的XPU架構(gòu),INT8算力為260TOPS,功耗控制在100瓦級別。
到目前量產(chǎn)的第三代P800芯片,工藝已升級至7nm,F(xiàn)P16算力達345TFLOPS——這個數(shù)字是英偉達中國特供版H20芯片的2.3倍。
更值得關(guān)注的是昆侖芯背后的全棧技術(shù)整合能力。
在百度構(gòu)建的AI技術(shù)體系中,昆侖芯提供底層算力,飛槳(Paddle)深度學習框架負責中間調(diào)度,文心系列大模型則是最終應用。這種芯片-框架-模型的垂直整合模式,與谷歌的TPU芯片、TensorFlow框架和Gemini模型的組合如出一轍。

這種閉環(huán)帶來的好處是顯而易見的。
飛槳可以針對昆侖芯的硬件特性進行深度優(yōu)化,文心大模型的訓練和推理效率因此得到提升;反過來,大模型的實際需求又為昆侖芯的迭代指明方向。
相比之下,其他國產(chǎn)芯片廠商往往需要適配多個主流框架,這在開發(fā)效率和性能優(yōu)化上都面臨更大挑戰(zhàn)。
獨立運營后的昆侖芯,商業(yè)化進展超出了不少人的預期。
2024年營收突破10億元,市場預期2025年將增長至35億元以上,并有望實現(xiàn)盈虧平衡。更重要的是客戶結(jié)構(gòu)的變化——最初更多依賴百度內(nèi)部需求的昆侖芯,外部客戶占比正在快速擴大,覆蓋互聯(lián)網(wǎng)、電信運營商、大型央國企等關(guān)鍵領域。
2025年8月的一次中標頗具標志性意義:昆侖芯在中國移動10億級別的AI算力采購項目中,在三個標包中均排名第一。
但昆侖芯還不能高枕無憂,單從業(yè)務上看,昆侖芯采用Fabless模式,生產(chǎn)環(huán)節(jié)依賴外部代工。
2024年上半年其還能較容易地從臺積電獲取7nm晶圓代工產(chǎn)能,但隨著境外新規(guī)落地,先進制程晶圓代工和HBM供應等方面均受到不利限制。
同時,昆侖芯團隊的軟件優(yōu)化和框架支持長期優(yōu)先圍繞百度生態(tài)展開,對外部開源模型和小眾框架的支持度還不夠。
相較于其他AI芯片,昆侖芯的泛化能力還有提高的空間。
12月5日,昆侖芯完成新一輪融資,投后估值約210億元人民幣。
兩天后百度發(fā)布公告稱,正就擬議分拆及上市進行評估。據(jù)外媒報道,昆侖芯最初考慮科創(chuàng)板上市,但后來轉(zhuǎn)向香港證券交易所,計劃最早在2026年第一季度提交上市申請,目標是2027年初完成IPO。受此消息影響,百度港股股價在12月5日收盤時上漲5.01%。
對昆侖芯而言,獨立上市的意義不僅在于融資。更重要的是,它能讓昆侖芯的估值獨立于百度的傳統(tǒng)業(yè)務,避免廣告、搜索業(yè)務波動對其的影響,資本市場會按照AI芯片行業(yè)的邏輯對其進行估值。
在產(chǎn)品布局上,昆侖芯也在加速推進下一代產(chǎn)品。沈抖透露,針對大規(guī)模推理場景的M100芯片已完成回片,主打極致性價比,將于2026年上市。字節(jié)、阿里、騰訊等頭部互聯(lián)網(wǎng)客戶已拿到小規(guī)模樣片測試并小范圍部署,百度也規(guī)劃了M100芯片的大型集群部署場景。
這種“內(nèi)部驗證+外部拓展”的商業(yè)化路徑,既降低了市場風險,又為產(chǎn)品迭代提供了真實的應用反饋。在英偉達H200可能回歸的背景下,昆侖芯或多或少也有底氣。
C
在H200回歸的新聞引發(fā)熱議的同時,更值得關(guān)注的是這次“解禁”背后的政策邏輯,以及它對國產(chǎn)AI芯片帶來的實際影響。
從政策細節(jié)看,這次調(diào)整并非一次徹底的“放開”,而是一種“有管理的開放”。
美國政府明確表示,基于Blackwell架構(gòu)的芯片以及下一代Rubin架構(gòu)芯片,仍然被嚴格禁止出口到中國。允許出口的H200,本質(zhì)上是英偉達的上一代產(chǎn)品。換句話說,美國的核心策略并未改變——在最頂尖的AI技術(shù)上對中國保持代差優(yōu)勢,同時通過出售次旗艦產(chǎn)品獲取經(jīng)濟利益。
外媒分析認為,這種模式很可能成為未來美國對華科技出口管制的新常態(tài):在不放棄技術(shù)霸權(quán)的前提下,有選擇性地通過出售非尖端但足夠強大的技術(shù)來平衡經(jīng)濟利益與戰(zhàn)略考量,同時以此作為影響中國科技產(chǎn)業(yè)發(fā)展的籌碼。
然而,H200的回歸之路遠比表面看起來更加曲折。在美國內(nèi)部,圍繞是否向中國放行高端芯片的爭議極大,這使得該政策的長期穩(wěn)定性存在巨大疑問。
這其中最具代表性的是《SAFE CHIPS Act》(《安全芯片法案》)。
該法案要求美國商務部在30個月以上時間內(nèi)拒絕向中國出口尖端半導體的申請。一旦這項法案獲得通過,特朗普將失去芯片出口的決策權(quán)。
外媒認為,特朗普政府火速審批H200放行,可能是在法案進入審議前搶占先手,通過行政批準制造既定事實。
同時,這種政策層面的不確定性,也讓中國企業(yè)開始擔憂GPU供應鏈。
即便現(xiàn)在可以采購H200以緩解短期算力需求,中國的頭部大廠和關(guān)鍵行業(yè)客戶也大概率不會完全放棄國產(chǎn)芯片的適配和應用。

目前國內(nèi)AI企業(yè)普遍采用“雙備份”(Dual Sourcing)策略——百度自己就是如此,之前百度百舸采用的就是混合算力架構(gòu),既用自研昆侖芯,也用英偉達等芯片。
誠然,這種策略會增加短期的研發(fā)成本和系統(tǒng)復雜度,但從長遠來看,這是應對地緣政治不確定性的明智選擇。當供應鏈隨時可能因為政策變動而中斷時,技術(shù)自主權(quán)的價值遠超短期的成本增加。
在中國一側(cè),國家層面對國產(chǎn)替代的政策支持力度也在持續(xù)加大。
國家集成電路產(chǎn)業(yè)投資基金二期募集金額已達2000億元以上,為芯片企業(yè)提供了強有力的資金保障。稅收優(yōu)惠、研發(fā)補貼、政府采購傾斜等一攬子政策正在形成合力。國資委79號文更是明確要求,2027年底前實現(xiàn)所有中央企業(yè)信息化系統(tǒng)的國產(chǎn)替代。
這些政策信號清晰地表明,在關(guān)鍵技術(shù)領域,中國不會因為外部環(huán)境的短期變化而動搖自主研發(fā)的決心。對昆侖芯等國產(chǎn)AI芯片廠商而言,這意味著一個長期穩(wěn)定且不斷擴大的市場空間。
一位接近百度的人士向字母榜透露,芯片本就是長周期規(guī)劃的產(chǎn)業(yè),長期競爭因素始終存在,昆侖芯在產(chǎn)品迭代時就已考慮過相關(guān)變化,因此不需要做大的調(diào)整。昆侖芯在今年11月公布的未來5年發(fā)展方向中,已經(jīng)規(guī)劃了M300以及超節(jié)點設備等產(chǎn)品線。
另一方面,H200允許進口后,可能也會改變百度的采購政策。不過百度方面并未向字母榜透露相關(guān)內(nèi)容。
從更宏觀的視角看,H200的放行與昆侖芯的上市計劃,本質(zhì)上是同一場技術(shù)博弈在不同維度的映射。前者代表著美國試圖在保持技術(shù)優(yōu)勢的同時獲取經(jīng)濟利益,后者則體現(xiàn)了中國在關(guān)鍵技術(shù)領域?qū)で笞灾骺煽氐膽?zhàn)略定力。
在這場長期博弈中,短期的政策變動或許會帶來市場波動,但真正決定格局的,仍然是技術(shù)積累、生態(tài)建設和戰(zhàn)略耐心。對昆侖芯等國產(chǎn)AI芯片而言,挑戰(zhàn)依然嚴峻,但機遇同樣清晰——在一個注定分化的市場中,找到自己的立足點,并不斷向上突破。
而且,英偉達H200究竟能不能進入中國,目前來看,仍然是個未知數(shù)。



京公網(wǎng)安備 11011402013531號