
![]()
“并行算網(wǎng)已接入62個(gè)算力中心,已累計(jì)輸出超200億核時(shí)、近2億卡時(shí)。”
作者丨劉伊倫
編輯丨包永剛
2025年12月12-13日,第八屆GAIR全球人工智能與機(jī)器人大會(huì)在深圳·博林天瑞喜來(lái)登酒店正式啟幕。
作為AI 產(chǎn)學(xué)研投界的標(biāo)桿盛會(huì),GAIR自2016年創(chuàng)辦以來(lái),始終堅(jiān)守“傳承+創(chuàng)新”內(nèi)核,始終致力于連接技術(shù)前沿與產(chǎn)業(yè)實(shí)踐。
在人工智能逐步成為國(guó)家競(jìng)爭(zhēng)核心變量的當(dāng)下,算力正以前所未有的速度重塑技術(shù)路徑與產(chǎn)業(yè)結(jié)構(gòu)。13日舉辦的「AI 算力新十年」專場(chǎng)聚焦智能體系的底層核心——算力,從架構(gòu)演進(jìn)、生態(tài)構(gòu)建到產(chǎn)業(yè)化落地展開(kāi)系統(tǒng)討論,試圖為未來(lái)十年的中國(guó)AI產(chǎn)業(yè),厘清關(guān)鍵變量與發(fā)展方向。
并行科技副總裁、AI聯(lián)合創(chuàng)始人趙鴻冰在「AI 算力新十年」論壇發(fā)表了主題為《基于用戶視角的算力服務(wù)及算網(wǎng)服務(wù)》的演講。
歷經(jīng)18年超算領(lǐng)域深耕,并行科技見(jiàn)證并參與了中國(guó)算力市場(chǎng)的演進(jìn)。當(dāng)前,算力市場(chǎng)呈現(xiàn)多場(chǎng)景、多業(yè)態(tài)的爆發(fā)式增長(zhǎng),從尖端超算到智算形態(tài),從算力租賃到算力網(wǎng)絡(luò),行業(yè)生態(tài)日趨多元;與此同時(shí),大模型技術(shù)的快速迭代,也對(duì)算力的可用性、高效性與性價(jià)比提出了更高要求。
在這樣的背景下,從用戶視角構(gòu)建算力服務(wù)體系、通過(guò)算力網(wǎng)絡(luò)實(shí)現(xiàn)資源的高效整合與調(diào)度,以及應(yīng)對(duì)推理需求爆發(fā)帶來(lái)的產(chǎn)業(yè)變革,成為算力行業(yè)亟待解決的核心問(wèn)題。
趙鴻冰在演講中指出,當(dāng)前算力市場(chǎng)已形成四大核心業(yè)態(tài):算力租賃作為最基礎(chǔ)的形態(tài),以“裸金屬”算力資源長(zhǎng)期交付用戶且不參與后續(xù)應(yīng)用;算力服務(wù)聚焦用戶終端需求的“最后一公里”,核心是按需提供精準(zhǔn)適配業(yè)務(wù)場(chǎng)景的算力支持;算力運(yùn)營(yíng)則依靠復(fù)雜調(diào)度平臺(tái)統(tǒng)籌管理資源,實(shí)現(xiàn)算力的高效分配與運(yùn)營(yíng);而算力網(wǎng)絡(luò)作為更高維度的形態(tài),通過(guò)納管多個(gè)算力平臺(tái)形成廣泛覆蓋的網(wǎng)絡(luò),達(dá)成跨平臺(tái)整體調(diào)度。
為此,并行科技推出“廠網(wǎng)結(jié)合”模式:“廠”即公司投入大量資金建設(shè)的萬(wàn)卡集群等重資產(chǎn)布局,“網(wǎng)”則是通過(guò)輕資產(chǎn)擴(kuò)張連接國(guó)內(nèi)47個(gè)智算中心與15個(gè)超算中心,該算力網(wǎng)絡(luò)可調(diào)度200萬(wàn)CPU核心、5萬(wàn)多張GPU卡,服務(wù)超16萬(wàn)用戶,商業(yè)化輸出累計(jì)超200億核時(shí)、近2億卡時(shí)。
在算力資源適配方面,他強(qiáng)調(diào)“沒(méi)有絕對(duì)最優(yōu)的算力資源,只有最適配的選擇”:例如在B200集群實(shí)測(cè)中發(fā)現(xiàn),雖B200性能領(lǐng)先,但針對(duì)某具身智能客戶需求,H200性價(jià)比更優(yōu)。
基于18年行業(yè)經(jīng)驗(yàn)與數(shù)據(jù)積累,并行科技構(gòu)建的算力性能預(yù)測(cè)模型,在小規(guī)模場(chǎng)景下預(yù)測(cè)誤差可控制在2%以內(nèi),中大規(guī)模場(chǎng)景下誤差也僅為個(gè)位數(shù),能有效支撐用戶資源選型決策。在大規(guī)模推理場(chǎng)景中,消費(fèi)級(jí)顯卡5090作為“性價(jià)比之王”,成為多數(shù)客戶的首選。(作者長(zhǎng)期關(guān)注算力與芯片產(chǎn)業(yè),歡迎添加微信YONGGANLL6662交流更多信息。)
這些思考與經(jīng)驗(yàn),均來(lái)自并行科技服務(wù)16萬(wàn)用戶的真實(shí)市場(chǎng)沉淀,其打造的算力網(wǎng)絡(luò)已實(shí)現(xiàn)全國(guó)范圍內(nèi)的資源調(diào)度與商業(yè)化輸出,希望能為算力行業(yè)的發(fā)展提供可借鑒的思路。
演講結(jié)束后,雷峰網(wǎng)與趙鴻冰就演講中提及的“算力網(wǎng)絡(luò)”、“推理需求”等關(guān)鍵議題,進(jìn)行了更深入的探討。以下是雷峰網(wǎng)在不改原意的基礎(chǔ)上,根據(jù)對(duì)話過(guò)程做的整理與編輯:
01
對(duì)話環(huán)節(jié)
雷峰網(wǎng):您提到算力規(guī)模年復(fù)合增長(zhǎng)率達(dá)到52.3%,當(dāng)前市場(chǎng)已投入大量資本用于AI基建,為何算力規(guī)模仍能保持高速增長(zhǎng),背后的主要推動(dòng)力是什么?如何看待市場(chǎng)討論的“算力泡沫”這一說(shuō)法?
趙鴻冰:人工智能是全球競(jìng)爭(zhēng)的制高點(diǎn),將成為未來(lái)數(shù)年乃至數(shù)十年發(fā)展的核心驅(qū)動(dòng)力。一場(chǎng)革命性的產(chǎn)業(yè)變革,需要足夠的時(shí)間與周期來(lái)完成生產(chǎn)力和生產(chǎn)關(guān)系的重構(gòu),這個(gè)過(guò)程并不會(huì)一蹴而就。當(dāng)前市場(chǎng)對(duì) “算力泡沫” 的質(zhì)疑,核心在于AI投入尚未形成大面積的商業(yè)閉環(huán)。但從產(chǎn)業(yè)發(fā)展規(guī)律來(lái)看,每一次重大技術(shù)革命都需要經(jīng)歷投入期、探索期才能進(jìn)入收獲期,算力是否為泡沫,時(shí)間會(huì)給出最終答案。
另一方面,在當(dāng)前的全球競(jìng)爭(zhēng)格局下,頭部科技企業(yè)普遍對(duì)AI賽道抱有FOMO情緒。相較于因過(guò)度謹(jǐn)慎、投入滯后而錯(cuò)失行業(yè)發(fā)展窗口期的代價(jià),適度超前的算力基建投入可能獲得更可期的未來(lái)。
雷峰網(wǎng):您在演講中提到算力網(wǎng)絡(luò),并行算網(wǎng)對(duì)接入的算力資源有什么要求?算網(wǎng)本質(zhì)是資源整合工作,勢(shì)必會(huì)面臨諸多利益分配問(wèn)題,這些問(wèn)題如何解決?
趙鴻冰:并行科技已經(jīng)打造了一套成熟的算力資源接入標(biāo)準(zhǔn)體系。我們會(huì)根據(jù)資源的規(guī)模類型、調(diào)度能力、完善程度等多個(gè)維度,對(duì)擬接入的算力資源進(jìn)行分級(jí)定義,這套標(biāo)準(zhǔn)就像“插銷與插座”的匹配規(guī)則,能夠?qū)崿F(xiàn)算力資源的快速接入與網(wǎng)絡(luò)化輸出。資源接入周期沒(méi)有固定標(biāo)準(zhǔn),若資源本身完全符合標(biāo)準(zhǔn),可直接接入;若需要改造,并行科技會(huì)協(xié)助完成標(biāo)準(zhǔn)適配,整體周期通常較短。
關(guān)于利益分配,并行科技的商業(yè)模式早已定義清晰,核心是以價(jià)值分層驅(qū)動(dòng)利益分配。整個(gè)算力服務(wù)產(chǎn)業(yè)鏈可以拆解為多個(gè)價(jià)值環(huán)節(jié):最前端是面向最終用戶的市場(chǎng)推廣、銷售對(duì)接與方案設(shè)計(jì),這需要鐵三角組織中的銷售負(fù)責(zé)人、方案負(fù)責(zé)人共同完成,解決客戶的商務(wù)與技術(shù)需求;往下是產(chǎn)品平臺(tái)層,需要具備賬號(hào)開(kāi)通、算力調(diào)度、計(jì)量計(jì)費(fèi)、報(bào)告輸出等核心能力,這是算網(wǎng)運(yùn)營(yíng)的核心支撐;再往下是售后服務(wù)層,我們建立了7×24小時(shí)5分鐘響應(yīng)的保障體系,常規(guī)問(wèn)題由一線工程師解決,疑難問(wèn)題由二線、三線工程師分層處理,確保客戶業(yè)務(wù)穩(wěn)定運(yùn)行;最底層則是服務(wù)器重資產(chǎn)投資與IDC托管的價(jià)值。
在算網(wǎng)合作中,我們會(huì)根據(jù)合作伙伴的優(yōu)勢(shì),匹配對(duì)應(yīng)的價(jià)值環(huán)節(jié)。比如有的合作伙伴擁有IDC和服務(wù)器資源,就可以獲取底層兩部分價(jià)值;若合作伙伴同時(shí)具備前端銷售推廣能力,就可以分得前端與底層價(jià)值,并行科技則主要獲取平臺(tái)調(diào)度與售后服務(wù)的價(jià)值。整個(gè)價(jià)值分配邏輯清晰,能夠保障各方的合理收益。
雷峰網(wǎng):異構(gòu)算力(CPU/GPU/DCU 混合部署)虛擬化過(guò)程中,算力會(huì)面臨損耗,如何優(yōu)化虛擬化層開(kāi)銷?
趙鴻冰:關(guān)于異構(gòu)算力虛擬化損耗的問(wèn)題,當(dāng)前主流的算力調(diào)度形態(tài)包括裸金屬、高性能集群、云主機(jī)和容器。不同形態(tài)適配不同的客戶場(chǎng)景:如果客戶有極致性能需求,直接采用裸金屬或高性能集群即可規(guī)避虛擬化損耗;虛擬化損耗主要體現(xiàn)在云主機(jī)形態(tài)中。
超級(jí)計(jì)算的核心邏輯不是切割算力單元,而是將更多小單元連接起來(lái)形成大規(guī)模并行計(jì)算的算力。對(duì)于有小粒度算力需求的場(chǎng)景,需要虛擬化切割時(shí),容器是最優(yōu)選擇,容器技術(shù)幾乎可以實(shí)現(xiàn)零虛擬化損耗,是解決虛擬化損耗的主流方案。
雷峰網(wǎng):行業(yè)內(nèi)普遍將殺手級(jí)應(yīng)用的誕生、推理需求的爆發(fā),視作破解算力閑置困局的關(guān)鍵抓手,也將其視為下一波算力需求增長(zhǎng)的核心引擎。您如何判斷推理需求全面爆發(fā)的時(shí)間節(jié)點(diǎn)與演進(jìn)節(jié)奏?
趙鴻冰:當(dāng)前市場(chǎng)已經(jīng)顯現(xiàn)出明確的信號(hào),以O(shè)penAI為例,2025年預(yù)估營(yíng)收將達(dá)到130億美元,這正是推理業(yè)務(wù)規(guī)模化發(fā)展的直接體現(xiàn)。并行科技服務(wù)的眾多大客戶,也已經(jīng)進(jìn)入推理業(yè)務(wù)落地階段,整個(gè)行業(yè)正朝著推理需求爆發(fā)的方向邁進(jìn)。
從產(chǎn)業(yè)發(fā)展規(guī)律來(lái)看,技術(shù)研發(fā)不能無(wú)限制推進(jìn),最終必然要走向產(chǎn)業(yè)化落地,創(chuàng)造社會(huì)價(jià)值并形成商業(yè)閉環(huán),推理需求的爆發(fā)是這一趨勢(shì)的必然結(jié)果。國(guó)產(chǎn)芯片在當(dāng)前階段也可以通過(guò)更多地滿足推理場(chǎng)景需求,來(lái)推動(dòng)自身業(yè)務(wù)的發(fā)展。
雷峰網(wǎng):推理需求成為算力產(chǎn)業(yè)主流需求后,將對(duì)當(dāng)前的算力基建布局、技術(shù)路徑選擇及商業(yè)模式帶來(lái)哪些影響?您認(rèn)為AI Infra公司未來(lái)最重要的迭代方向是什么?
趙鴻冰:推理需求成為主流后,算力產(chǎn)業(yè)的各個(gè)環(huán)節(jié)都將迎來(lái)顯著變化。在訓(xùn)練時(shí)代,算力競(jìng)爭(zhēng)的核心是大規(guī)模集群的可靠性與穩(wěn)定性,需要通過(guò)并行框架優(yōu)化、checkpoint機(jī)制等技術(shù)手段,保障模型訓(xùn)練高效完成。而到了推理時(shí)代,除了可靠性與穩(wěn)定性的基礎(chǔ)要求外,市場(chǎng)對(duì)算力提出了新的核心訴求:一是更大規(guī)模的彈性資源調(diào)度能力,需要支撐應(yīng)用隨時(shí)爆發(fā)的算力需求;二是更精細(xì)的資源匹配能力,因?yàn)橥评砼c訓(xùn)練的應(yīng)用特征差異顯著,比如 DeepSeek的推理過(guò)程分為P階段和D階段,兩個(gè)階段的計(jì)算與訪存敏感特征完全不同,必須針對(duì)性匹配算力資源。
對(duì)于AI Infra公司而言,未來(lái)最重要的迭代方向是緊跟客戶需求場(chǎng)景,持續(xù)升級(jí)產(chǎn)品與服務(wù)。不論迭代技術(shù)會(huì)帶來(lái)多高的成本,你都要跟,這是一個(gè)商業(yè)化的問(wèn)題,不是一個(gè)技術(shù)的問(wèn)題。
雷峰網(wǎng):今年超節(jié)點(diǎn)這一產(chǎn)品形態(tài)非常火熱,超節(jié)點(diǎn)通過(guò)高密度集成和高速互聯(lián),在通信時(shí)延、硬件協(xié)同效率上有顯著提升,您認(rèn)為這種硬件層面的優(yōu)化,是否會(huì)壓縮軟件側(cè)的算力優(yōu)化空間?這個(gè)產(chǎn)品形態(tài)主要是為了解決什么問(wèn)題?
趙鴻冰:并行科技深耕算力服務(wù)18年,我們認(rèn)為無(wú)論是超算還是智算,本質(zhì)都是為了更快地完成計(jì)算任務(wù),計(jì)算過(guò)程中涉及的數(shù)據(jù)搬運(yùn)與節(jié)點(diǎn)通信,都是額外的性能開(kāi)銷,超節(jié)點(diǎn)的核心目標(biāo)也是通過(guò)高密度集成與高速互聯(lián),降低這些開(kāi)銷,提升數(shù)據(jù)傳輸與通信效率。
從本質(zhì)上講,超節(jié)點(diǎn)就是一個(gè)小型化的超級(jí)計(jì)算機(jī)。硬件層面的優(yōu)化,并不會(huì)壓縮軟件側(cè)的優(yōu)化空間,反而需要軟硬協(xié)同才能發(fā)揮最大價(jià)值。一臺(tái)性能優(yōu)異的超節(jié)點(diǎn),必須搭配優(yōu)秀的軟件調(diào)度與優(yōu)化能力,才能充分壓榨硬件性能。硬件架構(gòu)的升級(jí)是順應(yīng)產(chǎn)業(yè)發(fā)展方向的必然選擇,軟件則需要同步迭代,實(shí)現(xiàn)對(duì)硬件的高效駕馭。
雷峰網(wǎng):那么是否可以理解為,具備超算技術(shù)積累的企業(yè),更容易獲得超節(jié)點(diǎn)的能力?
趙鴻冰:確實(shí)如此,超節(jié)點(diǎn)的技術(shù)邏輯與超算一脈相承。國(guó)外在智算領(lǐng)域的布局,本質(zhì)上也是在構(gòu)建超級(jí)計(jì)算機(jī),比如Stargate等,在描述上也是在建設(shè)超算。超節(jié)點(diǎn)與傳統(tǒng)超算的核心共性,都是通過(guò)優(yōu)化卡間互聯(lián)、節(jié)點(diǎn)間互聯(lián),實(shí)現(xiàn)大規(guī)模并行計(jì)算。
區(qū)別在于,超節(jié)點(diǎn)的規(guī)模遠(yuǎn)小于傳統(tǒng)超算,傳統(tǒng)超算動(dòng)輒需要上萬(wàn)個(gè)、甚至數(shù)萬(wàn)個(gè)節(jié)點(diǎn),而超節(jié)點(diǎn)更偏向于小型化集群,比如英偉達(dá)的NVL72、華為384超節(jié)點(diǎn),本質(zhì)上都是小型超級(jí)計(jì)算機(jī)。
02
演講全文
![]()
演講完整視頻,詳見(jiàn)鏈接:https://youtu.be/acn8RLPTqHs
以下是趙鴻冰演講的精彩內(nèi)容,雷峰網(wǎng)作了不改變?cè)獾恼砼c編輯:
大家好,今天我想和大家分享并行科技在算力服務(wù)與算網(wǎng)服務(wù)領(lǐng)域的實(shí)踐探索與心得。并行科技深耕算力行業(yè)18年,以超算業(yè)務(wù)起家,在長(zhǎng)期的發(fā)展過(guò)程中,我們從超算視角出發(fā),基于客戶畫像與產(chǎn)品定位兩個(gè)維度,對(duì)當(dāng)前的算力市場(chǎng)進(jìn)行了劃分。
算力市場(chǎng)的第一類場(chǎng)景,是以我國(guó)“天河”超級(jí)計(jì)算機(jī)為代表的尖端超算領(lǐng)域。2010年,天河超級(jí)計(jì)算機(jī)躋身全球超算500強(qiáng)首位,這類超算主要面向國(guó)家重大科技攻關(guān)項(xiàng)目的研發(fā)工作,其核心特征是需要十萬(wàn)核、百萬(wàn)核甚至更大規(guī)模算力支撐。
第二類場(chǎng)景是通用超算領(lǐng)域,并行科技對(duì)這一領(lǐng)域的發(fā)展起到了核心推動(dòng)作用。與尖端超算不同,通用超算面向的主要場(chǎng)景之一是高校師生的日常教學(xué)與科研需求,算力需求集中在萬(wàn)核以下,以千核甚至幾十核為主,這是并行科技的主戰(zhàn)場(chǎng)之一。
第三類場(chǎng)景是業(yè)務(wù)超算領(lǐng)域,主要服務(wù)于企業(yè)的業(yè)務(wù)模擬仿真需求,這類算力應(yīng)用通常是企業(yè)生產(chǎn)流程中的關(guān)鍵環(huán)節(jié)。
第四類場(chǎng)景就是2016年以來(lái),伴隨大模型技術(shù)爆發(fā)而興起的智算形態(tài),其核心計(jì)算載體為GPU加速卡。從技術(shù)指標(biāo)來(lái)看,前三類超算場(chǎng)景的核心需求是高精度計(jì)算,普遍要求FP64雙精度,最低也需達(dá)到FP32精度;而智算場(chǎng)景的計(jì)算精度則大幅降低,以FP16、FP8甚至FP4為主,當(dāng)前智算也是整個(gè)算力市場(chǎng)中增長(zhǎng)最快的板塊。
![]()
近兩年,算力市場(chǎng)迎來(lái)爆發(fā)式增長(zhǎng),各類參與者紛紛入局。從業(yè)態(tài)形態(tài)來(lái)看,當(dāng)前算力市場(chǎng)可分為四大類型:
算力租賃:這是最基礎(chǔ)的算力服務(wù)形態(tài),相當(dāng)于將“裸金屬”算力資源長(zhǎng)期交付給用戶,用戶可自主支配算力用途,算力提供方不參與后續(xù)的應(yīng)用環(huán)節(jié)。
算力服務(wù):這是面向用戶終端需求的“最后一公里”服務(wù),核心是按需提供算力支持,精準(zhǔn)匹配用戶的實(shí)際業(yè)務(wù)場(chǎng)景。
算力運(yùn)營(yíng):其核心是構(gòu)建一個(gè)復(fù)雜的調(diào)度平臺(tái),通過(guò)對(duì)算力資源的統(tǒng)籌管理,實(shí)現(xiàn)算力的高效分配與運(yùn)營(yíng)。
算力網(wǎng)絡(luò):這是更高維度的算力服務(wù)形態(tài),通過(guò)將多個(gè)算力平臺(tái)納入統(tǒng)一管理,形成一張覆蓋廣泛的算力網(wǎng)絡(luò),實(shí)現(xiàn)跨平臺(tái)的整體調(diào)度。
這四類業(yè)態(tài),清晰勾勒出當(dāng)前算力服務(wù)與算力網(wǎng)絡(luò)的市場(chǎng)全貌。
![]()
并行科技的經(jīng)營(yíng)核心理念,始終立足于用戶視角。我們認(rèn)為,從算力需求方的角度出發(fā),用戶的核心訴求可以歸結(jié)為三點(diǎn):第一是可用,即需要有穩(wěn)定的算力資源供應(yīng),且能夠有效支撐業(yè)務(wù)運(yùn)行;第二是好用,算力資源不僅要 “跑起來(lái)”,更要具備高效的運(yùn)行性能;第三是降本,要降低用戶的算力使用門檻,以高性價(jià)比滿足需求,尤其是大模型訓(xùn)練這類高門檻的算力應(yīng)用,性價(jià)比更是關(guān)鍵考量因素。
“可用、好用、降本”是用戶的核心剛需,并行科技的所有產(chǎn)品平臺(tái),均圍繞這三大需求展開(kāi)設(shè)計(jì)。
![]()
在大模型時(shí)代,不同類型的客戶對(duì)算力產(chǎn)品平臺(tái)有著差異化的需求。例如,基模訓(xùn)練場(chǎng)景中,受DeepSeek的影響,僅有少數(shù)企業(yè)需要大規(guī)模的算力集群;而垂類模型的研發(fā)場(chǎng)景,則覆蓋了更為龐大的用戶群體,這類需求可以通過(guò)標(biāo)準(zhǔn)化、高適配性的產(chǎn)品型平臺(tái)來(lái)滿足。
并行科技的特色經(jīng)營(yíng)模式,是基于算力網(wǎng)絡(luò)的輕資產(chǎn)運(yùn)營(yíng)模式,其核心邏輯是“廠網(wǎng)結(jié)合”。其中,“廠”代表并行科技的重資產(chǎn)布局,我們已投入大量資金,建設(shè)了萬(wàn)卡集群;而“網(wǎng)”則是我們的核心發(fā)展策略,通過(guò)輕資產(chǎn)擴(kuò)張的方式,更多地把已建或在建的算力產(chǎn)能更大化的發(fā)揮出社會(huì)效益,并行科技已連接國(guó)內(nèi)47個(gè)智算中心與15個(gè)超算中心,總計(jì)62個(gè)算力節(jié)點(diǎn)。
目前,我們的算力網(wǎng)絡(luò)可調(diào)度資源總量達(dá)到200多萬(wàn)CPU核心、5萬(wàn)多張GPU卡,服務(wù)用戶規(guī)模突破16萬(wàn),業(yè)務(wù)布局覆蓋全國(guó),商業(yè)化輸出總量累計(jì)超200億核時(shí)、近2億卡時(shí),在算力服務(wù)企業(yè)中位居第一。
![]()
從技術(shù)層面來(lái)看,并行科技的核心競(jìng)爭(zhēng)力源于18年積累的行業(yè)數(shù)據(jù)與技術(shù)沉淀。我們的算力網(wǎng)絡(luò)服務(wù)模式覆蓋了包括行業(yè)大模型研發(fā)、文生文、文生視頻、AI for Science等在內(nèi)的多元用戶場(chǎng)景,基于海量用戶的行業(yè)運(yùn)行特征大數(shù)據(jù),能夠快速為用戶提供精準(zhǔn)的資源選型匹配服務(wù)。
以具身智能場(chǎng)景為例,并行科技在中原區(qū)域合作了全國(guó)首套2000卡級(jí)別的全球性能最先進(jìn)的智算算力集群,這也是目前全球能夠量產(chǎn)的性能領(lǐng)先的算力資源。我們會(huì)針對(duì)客戶的具體應(yīng)用場(chǎng)景開(kāi)展類似CT掃描的特征分析,輸出GPU利用率、FP16與FP8精度下的運(yùn)行性能等量化數(shù)據(jù),以此判斷算力資源的實(shí)際使用效率。
![]()
算力的本質(zhì)在于“更快地完成計(jì)算”,充分釋放GPU等硬件的性能優(yōu)勢(shì)。
我們發(fā)現(xiàn),盡管B200的性能表現(xiàn)領(lǐng)先,但針對(duì)某一具身智能客戶的需求,H200的性價(jià)比更具優(yōu)勢(shì)。這一結(jié)論也印證了資源選型的重要性:沒(méi)有絕對(duì)最優(yōu)的算力資源,只有最適配的選擇。
![]()
基于歷史經(jīng)驗(yàn)與數(shù)據(jù)積累,并行科技構(gòu)建了算力性能預(yù)測(cè)模型,輸入相關(guān)參數(shù)后,即可有效預(yù)測(cè)算力的性能加速效果。該模型在小規(guī)模算力場(chǎng)景下的預(yù)測(cè)誤差可控制在2%以內(nèi),中大規(guī)模場(chǎng)景下的誤差也僅為個(gè)位數(shù),足以支撐用戶的資源選型決策。此外,在大規(guī)模推理場(chǎng)景中,消費(fèi)級(jí)顯卡5090是當(dāng)前的性價(jià)比之王,成為多數(shù)客戶的首選。
![]()
隨著DeepSeek的爆火,MaaS(模型即服務(wù))模式迅速崛起,有觀點(diǎn)認(rèn)為Token將成為未來(lái)算力市場(chǎng)的核心要素,并行科技也已布局MaaS平臺(tái),緊跟行業(yè)發(fā)展趨勢(shì)。
![]()
值得一提的是,并行科技專門設(shè)立了國(guó)產(chǎn)事業(yè)部,在國(guó)產(chǎn)算力資源的適配與應(yīng)用方面持續(xù)發(fā)力。例如,華為昇騰910B在部分適配場(chǎng)景中,性能可與A100比肩,且在價(jià)格具備優(yōu)勢(shì)的情況下,能夠?yàn)橛脩籼峁└叩男詢r(jià)比選擇。
![]()
最后,我想簡(jiǎn)要介紹并行科技的市場(chǎng)地位與客戶布局。
在客戶群體方面,國(guó)內(nèi)前四五百所頭部高校均是我們的核心客群。以清華大學(xué)為例,并行科技與清華開(kāi)展校級(jí)合作,為全校6萬(wàn)余名師生提供算力支持,以更好開(kāi)展AI的探索研究。目前,我們與復(fù)旦大學(xué)、中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)的合作也已推進(jìn)至第二期,取得了良好的成效,使更多高校的師生和科研機(jī)構(gòu)的研究員們享用到普惠的算力。
![]()
除高校外,科研機(jī)構(gòu)是并行科技的另一大核心客群,中科院旗下數(shù)百家有算力需求的研究所,均已納入我們的精準(zhǔn)服務(wù)體系。在企業(yè)端,美的、三一重工、比亞迪、小鵬匯天等知名企業(yè),以及智譜 等 AI 領(lǐng)域的標(biāo)桿企業(yè),也都是并行科技的重要客戶。
毋庸置疑,AI將是驅(qū)動(dòng)未來(lái)數(shù)年乃至數(shù)十年產(chǎn)業(yè)發(fā)展的核心引擎,而算力則是這一進(jìn)程中的關(guān)鍵基石。有專家將算力比作“水電”,這一比喻十分貼切,如同水電支撐社會(huì)生產(chǎn)生活一樣,算力已成為數(shù)字經(jīng)濟(jì)時(shí)代的基礎(chǔ)設(shè)施。相關(guān)報(bào)告顯示,算力指數(shù)每增長(zhǎng)1個(gè)百分點(diǎn),將帶動(dòng)GDP實(shí)現(xiàn)千億級(jí)別的提升。
未來(lái),并行科技愿與行業(yè)同仁攜手并行,以優(yōu)質(zhì)的算力服務(wù)與算網(wǎng)運(yùn)營(yíng)能力,助力科技強(qiáng)國(guó)建設(shè)。謝謝大家!





京公網(wǎng)安備 11011402013531號(hào)