
李瑞龍
2025年3月18日,英偉達(dá)年度技術(shù)大會(GTC)在美國圣何塞開幕,CEO黃仁勛以"AI推理時代"為核心,發(fā)布了重磅技術(shù)與合作計(jì)劃,涵蓋硬件架構(gòu)、軟件生態(tài)、量子計(jì)算、機(jī)器人技術(shù)及行業(yè)應(yīng)用。與往年不同,2025 GTC英偉達(dá)轉(zhuǎn)變重心,從去年的"AI訓(xùn)練"轉(zhuǎn)向"推理與部署"的行業(yè)轉(zhuǎn)型。其中特別值得關(guān)注的是主會議外的1200多場行業(yè)應(yīng)用"AI小會"。研究團(tuán)隊(duì)嘗試梳理這千場會議內(nèi)容, 以揭示AI行業(yè)應(yīng)用發(fā)展趨勢,把握推理時代下的AI+行業(yè)應(yīng)用的核心技術(shù)與實(shí)踐重點(diǎn)。內(nèi)容分為上下兩篇:工程技術(shù)方向與行業(yè)應(yīng)用實(shí)踐,本文為上篇,關(guān)于AI+行業(yè)的若干技術(shù)方向。
一、端到端世界模型與具身AI提速超預(yù)期
世界模型和具身AI正在推動物理AI系統(tǒng)與實(shí)體世界的深度交互。這種趨勢不僅限于自動駕駛領(lǐng)域,還擴(kuò)展到機(jī)器人技術(shù)、醫(yī)療設(shè)備和工業(yè)自動化。英偉達(dá)的Cosmos平臺等世界基礎(chǔ)模型平臺,正在為物理AI提供了世界基礎(chǔ)模型,使機(jī)器能夠更好地理解和操作物理環(huán)境。這些模型能夠從視頻數(shù)據(jù)中學(xué)習(xí),預(yù)測物理交互,并在復(fù)雜環(huán)境中做出決策。
與傳統(tǒng)AI系統(tǒng)不同,端到端世界模型融合了感知、決策和行動,創(chuàng)造出能在現(xiàn)實(shí)世界中執(zhí)行任務(wù)的智能體。例如,汽車行業(yè)中傳統(tǒng)自動駕駛技術(shù),往往是多網(wǎng)合一,通過生成式AI與規(guī)則式AI嵌套的方式實(shí)現(xiàn),業(yè)內(nèi)普遍認(rèn)為最后要實(shí)現(xiàn)L4級別以上的自動駕駛,需要用到VLA(Vision-Language-Action),VLA模型集成了視覺、語言理解與行動決策,通過明確的思維鏈推理過程提高了自動駕駛系統(tǒng)的透明度和可解釋性。本次大會中,理想汽車、元戎啟行以及小米汽車等廠家均分享了VLA方面的實(shí)踐,其中理想汽車的MindVLA已官宣將于下半年上車。
二、生成式AI與傳統(tǒng)AI工作流程融合深化
企業(yè)正在將生成式AI與現(xiàn)有AI系統(tǒng)和業(yè)務(wù)流程無縫集成,這種融合不僅僅是簡單添加大語言模型接口,而是重新設(shè)計(jì)工作流程,使生成式AI能夠增強(qiáng)但非取代現(xiàn)有系統(tǒng)。金融與醫(yī)療是兩大熱門行業(yè)。其中,金融服務(wù)公司已廣泛將傳統(tǒng)風(fēng)險(xiǎn)評估模型與LLM大語言模型結(jié)合,實(shí)現(xiàn)更全面的風(fēng)險(xiǎn)分析,實(shí)踐案例包括有UBS瑞銀集團(tuán)的投資洞察與實(shí)時風(fēng)險(xiǎn)評估、Mastercard信用卡的風(fēng)險(xiǎn)分析以及Visa的支付和網(wǎng)絡(luò)安全應(yīng)用等;同樣,醫(yī)療機(jī)構(gòu)正廣泛將診斷系統(tǒng)與生成式醫(yī)學(xué)報(bào)告系統(tǒng)集成,提高醫(yī)療決策效率,如Telix核藥公司的放射性藥物決策支持平臺、GSK生物醫(yī)藥公司生物成像分析以及各大醫(yī)院已紛紛試點(diǎn)醫(yī)學(xué)影像AI輔助等,均展示了將生成式AI技術(shù)與現(xiàn)有的傳統(tǒng)AI工作流和系統(tǒng)整合的實(shí)踐與探索。當(dāng)前的應(yīng)用推進(jìn)關(guān)鍵在于強(qiáng)調(diào)AI作為增強(qiáng)工具而非替代品的角色,專注于人機(jī)協(xié)作而非全自動化,確保在創(chuàng)新與合規(guī)、安全之間取得平衡。
三、推理新范式下的行業(yè)專用基礎(chǔ)模型崛起
行業(yè)專用基礎(chǔ)模型正在各個領(lǐng)域蓬勃發(fā)展,這些模型針對特定行業(yè)數(shù)據(jù)和任務(wù)進(jìn)行訓(xùn)練和優(yōu)化。與通用基礎(chǔ)模型相比,它們在領(lǐng)域特定任務(wù)上表現(xiàn)更佳,同時減少了數(shù)據(jù)泄露風(fēng)險(xiǎn)。例如,醫(yī)療健康領(lǐng)域的專用基礎(chǔ)模型能更準(zhǔn)確地解讀醫(yī)學(xué)術(shù)語和臨床數(shù)據(jù);工業(yè)行業(yè)的基礎(chǔ)模型能更好地理解工業(yè)流程與調(diào)用專用工具。
與去年相比,當(dāng)前行業(yè)專用基礎(chǔ)模型的發(fā)展呈現(xiàn)出兩大趨勢。一方面是模型的可用性提升。在過往“預(yù)訓(xùn)練”階段,行業(yè)專用模型的訓(xùn)練與應(yīng)用存在著高成本、可用性低等問題;而在當(dāng)下“后訓(xùn)練”與“推理”新范式下,行業(yè)專用基礎(chǔ)模型的生成方式產(chǎn)生了本質(zhì)的區(qū)別,通過強(qiáng)化學(xué)習(xí)等方法,少量標(biāo)注數(shù)據(jù)實(shí)現(xiàn)跨越可用性門檻的行業(yè)模型成為可能。另一方面是模型架構(gòu)的多樣化,不僅限于語言模型,還包括多模態(tài)模型、圖神經(jīng)網(wǎng)絡(luò)和物理信息神經(jīng)算子等。比如,英偉達(dá)針對這些行業(yè)專用模型提供BioneMo(生物學(xué))、MonAI (醫(yī)學(xué)影像)等專用框架進(jìn)行優(yōu)化,顯著提高了在特定領(lǐng)域的準(zhǔn)確性和效率。
四、多智能體系統(tǒng)與協(xié)作AI生態(tài)空間被打開
多智能體AI系統(tǒng)正在從實(shí)驗(yàn)階段邁向生產(chǎn)環(huán)境,這些系統(tǒng)由多個專業(yè)化AI智能體組成,各自負(fù)責(zé)不同任務(wù),協(xié)同工作以解決復(fù)雜問題。這一趨勢的獨(dú)特之處在于AI架構(gòu)從單一大型系統(tǒng)向分布式、專業(yè)化智能體網(wǎng)絡(luò)的轉(zhuǎn)變。BlackRock公司的Aladdin Copilot構(gòu)建了企業(yè)級多智能體平臺,支持聯(lián)邦應(yīng)用開發(fā),在控制和可解釋的環(huán)境中滿足組織需求,系統(tǒng)采用LangGraph等框架編排智能體互動,使復(fù)雜任務(wù)分解為可管理的步驟。這就像一個由多個AI助手組成的智能團(tuán)隊(duì),每個成員各司其職提供投資建議。比如,當(dāng)用戶問“我的投資組合中航空航天行業(yè)占比多少?”系統(tǒng)會啟動一系列智能助手:一個負(fù)責(zé)理解問題,一個去查詢數(shù)據(jù),一個分析結(jié)果,最后由一個助手用通俗語言向用戶解釋。該系統(tǒng)提倡“無限智能體”理念,由3000多名工程師共同開發(fā)新助手,即插即用,且設(shè)有多重檢查,確保信息準(zhǔn)確且不泄露隱私。目前已在在200多家金融機(jī)構(gòu)啟用。類似于Manus智能體應(yīng)用,但行業(yè)應(yīng)用中,數(shù)據(jù)安全與隱私要求更高。
五、AI在高性能計(jì)算與科學(xué)發(fā)現(xiàn)中廣泛應(yīng)用
AI正在變革傳統(tǒng)高性能計(jì)算(HPC)和科學(xué)研究方法,從純粹的數(shù)值模擬向AI增強(qiáng)模型演進(jìn)。這一趨勢涉及將物理模型與神經(jīng)網(wǎng)絡(luò)結(jié)合,創(chuàng)建性能更高的"混合物理-AI"模型。例如,氣候科學(xué)家利用AI加速大氣動力學(xué)模擬;量子化學(xué)研究者使用GPU加速的量子電路模擬器提高分子建模效率;生物信息學(xué)家結(jié)合傳統(tǒng)序列分析與深度學(xué)習(xí)方法加速蛋白質(zhì)結(jié)構(gòu)預(yù)測。AI正改變了科學(xué)探索的基本方法,使研究人員能夠處理以前難以解決的復(fù)雜問題,特別是此前需要超大規(guī)模窮盡所有參數(shù)的領(lǐng)域,如分子動力學(xué)模擬、全基因組分析等,暴力運(yùn)算與窮盡,使得當(dāng)前生成式AI在高階任務(wù)中產(chǎn)生特殊的價(jià)值。此外,科學(xué)領(lǐng)域也正在構(gòu)建各自專門的基礎(chǔ)模型,科學(xué)智能體間的“高帶寬”協(xié)作,正在推進(jìn)打破人類跨學(xué)科研究的門檻推動跨學(xué)科研究。英偉達(dá)的Blackwell等超級計(jì)算芯片以及cuTensor等軟件庫正在為這些工作流提供了計(jì)算基礎(chǔ)。
六、企業(yè)級應(yīng)用的檢索增強(qiáng)生成(RAG)的專業(yè)化
檢索增強(qiáng)生成(RAG)正在從概念驗(yàn)證階段向企業(yè)級應(yīng)用轉(zhuǎn)變,組織正在構(gòu)建復(fù)雜的RAG系統(tǒng)來整合和利用其內(nèi)部知識庫。這一趨勢的顯著特點(diǎn)是RAG系統(tǒng)架構(gòu)的復(fù)雜化,包括高級檢索技術(shù)(如混合檢索、重排序、多跳推理)、知識圖譜整合和多模態(tài)檢索能力。其中重點(diǎn)實(shí)現(xiàn)四個方面的轉(zhuǎn)變:從單一文本檢索向全媒體內(nèi)容理解轉(zhuǎn)變;從通用模型向高度領(lǐng)域?qū)S玫闹R增強(qiáng)轉(zhuǎn)變;從簡單的檢索管道向多階段評估、驗(yàn)證和優(yōu)化流程轉(zhuǎn)變;從獨(dú)立系統(tǒng)向端到端、云到邊緣的分布式架構(gòu)轉(zhuǎn)變。基于此讓檢索增強(qiáng)變得行業(yè)可用,金融服務(wù)公司構(gòu)建RAG系統(tǒng)分析龐大的監(jiān)管文件;制造業(yè)使用RAG系統(tǒng)獲取復(fù)雜設(shè)備的維護(hù)知識;醫(yī)療機(jī)構(gòu)部署RAG系統(tǒng)整合臨床指南和患者數(shù)據(jù)。英傳達(dá)開發(fā)了包括NeMo Retriever檢索器和NIM管道構(gòu)建,專注于確保檢索的精確性、可靠性和合規(guī)性。與簡單的知識庫查詢不同,企業(yè)級RAG系統(tǒng)正實(shí)現(xiàn)深度語義理解和推理,能夠處理結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的融合查詢。
七、生成式AI賦能的數(shù)字孿生與仿真煥發(fā)新機(jī)
AI驅(qū)動的數(shù)字孿生技術(shù)正在各行業(yè)得到廣泛應(yīng)用,這些系統(tǒng)不僅能模擬物理環(huán)境,還能預(yù)測未來行為并優(yōu)化決策。例如,根據(jù)會議分享,汽車制造商正在使用數(shù)字孿生優(yōu)化生產(chǎn)線;能源公司創(chuàng)建電網(wǎng)數(shù)字孿生預(yù)測和平衡供需;醫(yī)療機(jī)構(gòu)構(gòu)建器官數(shù)字孿生測試治療方案。與傳統(tǒng)仿真不同,AI增強(qiáng)的數(shù)字孿生整合了實(shí)時數(shù)據(jù)流、神經(jīng)物理建模和生成式AI,創(chuàng)建更準(zhǔn)確、動態(tài)的虛擬表示。然而在生成式AI誕生之前,數(shù)字孿生的較高成本與開發(fā)時效,在較大程度上限制著各類應(yīng)用的開發(fā),生成式AI在3D、空間智能方面的發(fā)展,改變了這一現(xiàn)狀。Omniverse等數(shù)字孿生系統(tǒng),致力于為各行業(yè)提供開箱可用的構(gòu)建數(shù)字孿生的基礎(chǔ)平臺,使企業(yè)可以利用相關(guān)技術(shù)進(jìn)行復(fù)雜系統(tǒng)的建模、測試和優(yōu)化。比如,捷豹路虎分享了其利用Omniverse和AI技術(shù)開發(fā)了"微孿生"系統(tǒng),實(shí)現(xiàn)整個工廠的實(shí)時可視化。通過整合物聯(lián)網(wǎng)數(shù)據(jù),該系統(tǒng)提供實(shí)時監(jiān)控,找出質(zhì)量問題的根本原因,并允許用戶直接與數(shù)字孿生進(jìn)行交流。
八、AI安全性與透明度主流化,成行業(yè)應(yīng)用前提
AI安全和可解釋性已從研究話題轉(zhuǎn)變?yōu)楫a(chǎn)品開發(fā)和部署的核心要素。監(jiān)管壓力(如歐盟AI法案)和內(nèi)部風(fēng)險(xiǎn)管理需求推動了這一轉(zhuǎn)變,組織正在采用綜合方法確保AI系統(tǒng)的安全性、透明度和責(zé)任性。AI安全增強(qiáng)方面,核心在于安全和可解釋性被整合到整個AI生命周期中,而不僅是事后添加。比如針對汽車行業(yè),英偉達(dá)推出的Halos,是一個全棧綜合安全系統(tǒng),統(tǒng)一了車輛架構(gòu)、AI模型、芯片、軟件、工具和服務(wù),以確保從云到車的自動駕駛車輛(AV)的安全開發(fā)。該系統(tǒng)涵蓋設(shè)計(jì)時安全護(hù)欄、部署時安全護(hù)欄和驗(yàn)證時安全護(hù)欄,為AI驅(qū)動的端到端AV堆棧提供全面保障。自動駕駛外,不同的行業(yè)(金融、醫(yī)療)也正在開發(fā)針對其獨(dú)特挑戰(zhàn)的特定安全解決方案,英傳達(dá)NeMo Guardrails等工具致力于使開發(fā)者能夠?qū)嵤?qiáng)大的安全措施,而服務(wù)于多種行業(yè)的各類新型解釋性框架則提高了模型透明度。隨著AI繼續(xù)擴(kuò)展到更多關(guān)鍵領(lǐng)域,這一趨勢只會加速,使安全與可解釋性成為AI創(chuàng)新與負(fù)責(zé)任部署之間的橋梁。
九、生成式AI正在變革內(nèi)容創(chuàng)建與個性化體驗(yàn)
生成式AI在內(nèi)容創(chuàng)建與個性化體驗(yàn)領(lǐng)域的變革正在多個維度展開,影響從媒體制作到個性化營銷的多個領(lǐng)域。比如:可口可樂與Grip合作使用Omniverse加速內(nèi)容制作流程,將抽象概念轉(zhuǎn)化為交互式場景。這種方法將傳統(tǒng)制作技術(shù)與前沿生成式AI相結(jié)合,顯著縮短上市時間并擴(kuò)展?fàn)I銷創(chuàng)意選擇。可口可樂已成為當(dāng)前最為積極擁抱生成式AI廣告內(nèi)容制作的公司之一;Mars公司的士力架巧克力品牌與足球教練Jose Mourinho合作,為每位足球粉絲提供個性化體驗(yàn)。他們開發(fā)的生成式AI引擎結(jié)合定制語言模型創(chuàng)作富有品牌特色的幽默腳本,然后與語音和視頻技術(shù)配對,為每位消費(fèi)者生成獨(dú)特內(nèi)容。Volvo和蔚來等,也在大會上分享了使用先進(jìn)的LLM技術(shù)在智能座艙中打造革命性用戶體驗(yàn)的經(jīng)驗(yàn);此外,還包括零售與電子商務(wù)個性化、醫(yī)療與健康定制化、游戲AI陪伴與隊(duì)友等大量案例,生成式的內(nèi)容變革已呈初步爆發(fā)趨勢,但與早期應(yīng)用不同,后續(xù)的生成式AI內(nèi)容系統(tǒng)將更加專注于可控性、品牌一致性和企業(yè)級集成。
十、大規(guī)模AI基礎(chǔ)設(shè)施與“AI工廠”的興起
AI計(jì)算基礎(chǔ)設(shè)施正在從單一GPU集群向綜合AI工廠轉(zhuǎn)變,這些工廠整合了計(jì)算、存儲、網(wǎng)絡(luò)和冷卻系統(tǒng),為各種AI工作負(fù)載提供可擴(kuò)展解決方案。尤其是進(jìn)入到推理范式以及多智能體階段,分布式算力的需求正在指數(shù)級提升。這一趨勢驅(qū)動了液冷技術(shù)、高帶寬內(nèi)存和專用互連網(wǎng)絡(luò)的創(chuàng)新,以支持日益增長的計(jì)算需求。另外,更值得關(guān)注的是,AI基礎(chǔ)設(shè)施不再僅是技術(shù)問題,而是涉及國家競爭力和數(shù)據(jù)主權(quán)的戰(zhàn)略問題。此次GTC國際主權(quán)AI峰會分會場中,匯集了英國、法國、意大利、丹麥、日本、印度、韓國、泰國和巴西的政府和行業(yè)領(lǐng)導(dǎo)者,討論了“各國如何擁抱AI工廠作為數(shù)字轉(zhuǎn)型和彈性的關(guān)鍵基礎(chǔ)設(shè)施。”這一議題。其中,部分國家和大型企業(yè)紛紛建立AI主權(quán)能力,部署本土AI工廠支持國家和企業(yè)生態(tài)系統(tǒng)。用途各有側(cè)重:印尼、印度、意大利、韓國等著眼于語言和文化適應(yīng)的基礎(chǔ)模型; 德國側(cè)在鐵路自動化這一特定領(lǐng)域,構(gòu)建先進(jìn)的模擬基礎(chǔ)設(shè)施。全球AI基礎(chǔ)設(shè)施正在從通用平臺向?qū)I(yè)化、主權(quán)化和領(lǐng)域特化方向發(fā)展。





京公網(wǎng)安備 11011402013531號