“P800已經在百度內部得到了充分驗證,我們現在絕大多數的推理任務跑在P800上。”11月13日的百度世界大會上,百度集團執行副總裁、百度智能云事業群總裁沈抖披露了百度自研芯片在公司內部的應用情況,并稱未來5年昆侖芯每年都會推出新產品。
P800是百度自研芯片業務昆侖芯的第三代芯片。今年9月,市場有傳聞稱百度已開始使用自主設計的芯片P800訓練新版文心一言(Ernie)AI 模型。在該消息刺激下,百度股價大漲超10%,創下2024年10月以來新高。但當時百度并未回應。
除了推理任務,沈抖今日還透露自研芯片在模型訓練方面的進展。他表示,百度已經基于一個P800的5000卡單一集群,高性價比地訓練出了一個多模態模型;現在訓練集群已經擴展到萬卡以上,并且正在訓練更大的模型。
不只百度內部,昆侖芯也在互聯網金融、能源制造、交通和教育等行業落地。沈抖介紹,昆侖芯已有包括招商銀行、南方電網、吉利汽車、Vivo,以及一家互聯網大廠和一家超頭部運營商等上百家客戶,交付規模從幾十卡到萬卡以上。
百度自研芯片最早追溯到2011年,當時主要是為了深度學習運算的需要。直到2021年,昆侖芯業務獨立為“昆侖芯(北京)科技有限公司”,并完成融資。該公司最新一輪融資于今年7月完成,投資方包括上河動量基金、山證投資、國新資本等,天眼查顯示百度持股比例為59.45%。
在應用方面,今年上半年,百度曾透露成功點亮國內自研P800萬卡集群,可同時承載多個千億參數大模型訓練。8月時,基于昆侖芯的AI服務產品中標中國移動十億級集采項目,為其提供AI通用計算推理型設備,這也是國產AI芯片在大型基礎設施項目中的一次突破。
百度今日透露了下一代自研芯片的時間表。其中,昆侖芯M100 針對大規模推理場景優化設計,將于2026年上市;昆侖芯M300面向超大規模多模態模型的訓練和推理需求,將于2027年上市。
單顆芯片的強大只是一個技術條件,現在大模型的訓練和推理都是多顆芯片協同工作,尤其在目前流行的MoE架構下,卡和卡之間的通信量會急劇增加,需要把幾十張幾百張卡組成一個超節點,讓這些卡像一個超級芯片一樣緊密連接在一起,大幅度提高卡間的通訊。但“超節點”方案考驗AI infra廠商在芯片、內存、通信、供電、冷卻上的全棧協同能力。
今日百度還發布了基于昆侖芯P800的天池256超節點與天池512超節點,二者將分別在明年上半年和下半年正式上市。其中對比同等卡數的P800集群,天池256超節點在主流大模型的推理任務上,單卡吞吐提升超過3.5倍;單個天池512超節點能夠完成萬億參數模型訓練。
此外,據記者了解,基于百度新發布的昆侖芯M系列,百度也在研發千卡級別的超節點。從2027年開始,百度還將陸續推出相應的千卡和4000卡的超節點。截至記者發稿,今日百度港股股價漲超1.27%至127.8港元。





京公網安備 11011402013531號