鷺羽 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
太夸張!百度辦AI“培訓(xùn)班”,大佬都紛紛要來拜師學(xué)藝。
剛剛百度舉辦了首席AI架構(gòu)師培養(yǎng)計劃(AICA)的第九期開學(xué)典禮,一看嚇一跳,本期學(xué)員里可謂是臥虎藏龍。
除了有來自茅臺、奔馳、麥當(dāng)勞等明星企業(yè)的技術(shù)高管,還有國網(wǎng)、中石化、中石油等一眾國字號大佬云集于此。
所以讓大佬們擠破腦袋都想進來學(xué)習(xí)的AICA到底是個啥?
依托百度自研的深度學(xué)習(xí)平臺飛槳和文心大模型,AICA目標(biāo)培養(yǎng)復(fù)合型AI架構(gòu)師,簡單來說,就是既能參與技術(shù)開發(fā),又能確保項目落地。
而今年較之以往最不同的是,從導(dǎo)師到學(xué)員,聊得最火熱的話題莫過于——大模型。
相關(guān)課題占比51%,并首次出現(xiàn)多智能體協(xié)同等前沿技術(shù)應(yīng)用。
與會嘉賓也在開學(xué)典禮上重點強調(diào)大模型推動產(chǎn)業(yè)變革的意義所在,從底層架構(gòu)再到軟硬件協(xié)同發(fā)展,以及為AI架構(gòu)師如何跟上大模型發(fā)展速度提出了寶貴意見。
以下是量子位從嘉賓演講中整理出的部分精彩內(nèi)容,在不改變原義的基礎(chǔ)上進行了適當(dāng)調(diào)整。
大模型正在逐步轉(zhuǎn)向產(chǎn)業(yè)落地安暉:AI技術(shù)賦能產(chǎn)業(yè)發(fā)展
來自中國電子信息產(chǎn)業(yè)發(fā)展研究院的副總工安暉,首先就整個AI行業(yè)發(fā)展進行了系統(tǒng)性分析。
他認(rèn)為,AI將會是繼蒸汽機、互聯(lián)網(wǎng)之后推動整個社會經(jīng)濟發(fā)展的重要通用技術(shù),而當(dāng)前更是進入了加速重視AI應(yīng)用工具的新階段。
尤其是從2025世界人工智能大會可以看出,AI競爭正在逐步轉(zhuǎn)向場景落地,如制造、醫(yī)療、金融等領(lǐng)域。
以及全網(wǎng)關(guān)注的GPT-5也側(cè)面說明,當(dāng)前底層模型能力已足夠強大,大模型性能提升速度或?qū)⒎啪彛?strong>現(xiàn)在產(chǎn)業(yè)重心應(yīng)當(dāng)放在大模型的應(yīng)用落地。
AI技術(shù)未來將在企業(yè)發(fā)展中占據(jù)更為重要的作用,根據(jù)OpenAI發(fā)布的企業(yè)客戶研究報告,AI可以在提高工作效率、解放員工的重復(fù)性任務(wù)、推動產(chǎn)品創(chuàng)新三個方面帶來顯著提升。
賽迪研究院也補充指出,AI還將重構(gòu)服務(wù)模式、實現(xiàn)資源均衡,共同促進多行業(yè)變革。
而當(dāng)前我國AI發(fā)展呈現(xiàn)出三大趨勢,分別是技術(shù)比拼、商業(yè)應(yīng)用、產(chǎn)業(yè)格局:
技術(shù)比拼:整體參數(shù)規(guī)模轉(zhuǎn)向智能水平,核心競爭力在于技術(shù)護城河。商業(yè)應(yīng)用:正在從概念驗證轉(zhuǎn)向場景實踐,逐步建立特色AI生態(tài)。產(chǎn)業(yè)格局:整體從分散行動發(fā)展成頭部企業(yè)主導(dǎo)行業(yè)風(fēng)向,把握優(yōu)勢資源成為企業(yè)的重中之重。
但安暉也表示,相關(guān)產(chǎn)品效益還未完全顯現(xiàn),從人工智能大會也能看出,當(dāng)前新產(chǎn)品在功能、形態(tài)和應(yīng)用內(nèi)容上存在同質(zhì)化,缺乏創(chuàng)新閃光點。
其邁向?qū)嶋H應(yīng)用過程中,如何與實體企業(yè)核心業(yè)務(wù)掛鉤,當(dāng)前各大AI企業(yè)還未給出準(zhǔn)確的方案,如何能夠讓用戶認(rèn)同AI價值、對AI營收效益持積極向好態(tài)勢,都是進一步推動AI應(yīng)用必須解決的前提條件。
另外,行業(yè)缺乏AI經(jīng)驗和數(shù)據(jù)支持,從而導(dǎo)致產(chǎn)用脫節(jié)、落地困難。
因此,安暉建議應(yīng)該以創(chuàng)造價值為導(dǎo)向發(fā)展AI,幫助企業(yè)增收降本,另一方面重視AI人才培養(yǎng),無論是校企培養(yǎng),還是AI企業(yè)和用戶企業(yè)協(xié)作培養(yǎng),寄希望于將技術(shù)深度融入業(yè)務(wù)體系。
馬艷軍:新技術(shù)重構(gòu)AI能力邊界
百度AI技術(shù)生態(tài)總經(jīng)理馬艷軍則主要介紹當(dāng)前大模型技術(shù)在產(chǎn)業(yè)融合中的能力狀態(tài)以及AI架構(gòu)師應(yīng)當(dāng)如何應(yīng)對這種變化。
首先整個大模型技術(shù)已經(jīng)得以完善增強,擁有更好的多任務(wù)泛化能力,產(chǎn)品研發(fā)流程也變得更加標(biāo)準(zhǔn)化。
LLM已逐步具備專家級智能水平,現(xiàn)在只需要向大模型表達需求,就能立即獲得對應(yīng)任務(wù)結(jié)果。
例如百度基于文心大模型4.5 Turbo打造的羅永浩數(shù)字人技術(shù),可以專業(yè)且長時間地保持高質(zhì)量直播輸出,體現(xiàn)出一個多功能LLM的深度思考和分析能力。
此外,LLM為整個行業(yè)帶來了翻天覆地的變化,尤其是編程領(lǐng)域。
在百度內(nèi)部,整個AI代碼生成的占比和采納率已經(jīng)從2022年的5%和15%增長至50%和80%,大模型能夠完成復(fù)雜編程任務(wù),如刪除功能模塊或糾正編譯錯誤。
這對團隊的首席AI架構(gòu)師而言,將會是一個巨大的挑戰(zhàn)。
要想要跟上LLM發(fā)展趨勢,將其能力最大化,AI架構(gòu)師就需要知道如何讓模型輸出、如何讓模型輸出更優(yōu)、如何讓模型輸出更快。
馬艷軍表示,需要從以下四個方面入手:
深入了解提示詞工程:相應(yīng)優(yōu)化技巧包括合理拆解復(fù)雜任務(wù)、組織輸出順序、補充合適信息以緩解幻覺、多文檔引用正確指令和使用可理解的文本格式。學(xué)習(xí)模型調(diào)優(yōu)方式:包括增加預(yù)訓(xùn)練、對指令監(jiān)督微調(diào)、進行獎勵模型訓(xùn)練,以及偏好對齊。掌握全棧系統(tǒng)設(shè)計能力:從模型開發(fā)、訓(xùn)練、精調(diào)、壓縮再到部署推理,可實現(xiàn)完整性標(biāo)準(zhǔn)流程。深刻理解場景問題:洞察行業(yè)痛點,能夠判斷什么場景需要什么模型,構(gòu)建針對性解決方案。
總之,首席AI架構(gòu)師需要學(xué)會將Agent融入日常工作流程,推動產(chǎn)業(yè)范式升級。
于佃海:從深度學(xué)習(xí)到大模型
在本次開學(xué)典禮中,百度飛槳總架構(gòu)師于佃海,也帶來了有關(guān)深度學(xué)習(xí)到大模型發(fā)展變遷的第一堂課。
隨著LLM發(fā)展,現(xiàn)在來到了軟件3.0時代,1.0時代是傳統(tǒng)編碼實現(xiàn)功能,2.0時代基于深度學(xué)習(xí),通過訓(xùn)練模型實現(xiàn)功能,3.0時代直接一個大模型提示詞就能完成多種任務(wù)。
大模型的本質(zhì)不僅僅是參數(shù)量大,規(guī)模從百萬級到現(xiàn)在的十億級,更重要的是其模型結(jié)構(gòu)、學(xué)習(xí)機制以及推理能力的進步。
當(dāng)前LLM模型架構(gòu)主要還是以Transformer為核心,基于神經(jīng)網(wǎng)絡(luò)的注意力機制,從序列的轉(zhuǎn)換發(fā)展而來。
而未來LLM架構(gòu)還會繼續(xù)基于Transformer持續(xù)優(yōu)化,與此同時更加重視專家MoE結(jié)構(gòu)。
學(xué)習(xí)機制上,深度學(xué)習(xí)在新一代的大模型訓(xùn)練流程中分別承擔(dān)不同功能角色,自監(jiān)督學(xué)習(xí)可以實現(xiàn)大規(guī)模預(yù)訓(xùn)練,監(jiān)督學(xué)習(xí)負(fù)責(zé)增強LLM指令遵循能力,強化學(xué)習(xí)通過人類反饋提升模型的偏好對齊。
高效推理部署是當(dāng)前大模型應(yīng)用推廣的關(guān)鍵,相當(dāng)考驗基礎(chǔ)設(shè)施建設(shè),目前硬件(芯片、算力、存儲)方面還有所落后,軟件(分布式訓(xùn)練框架、高效推理引擎、優(yōu)化工具)方面則已取得進展。
未來還需要實現(xiàn)軟硬件協(xié)同發(fā)展,包括支持更多硬件高效適配接入、構(gòu)建大規(guī)模硬件集群達成多維混合并行、芯片層面深度協(xié)同優(yōu)化,最終搭建起大模型時代的深度學(xué)習(xí)平臺。
AICA:培養(yǎng)真正懂AI、做AI的架構(gòu)師
從2019年開始,這已經(jīng)是AICA舉辦的第九個學(xué)期,作為百度與深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心的聯(lián)合發(fā)起項目,吸納了來自各行各業(yè)的頂尖人才參與。
本期共招收學(xué)員96名,是通過長達半年的預(yù)科學(xué)習(xí)、項目技術(shù)評審以及多輪考核,才從500多名報名者中脫穎而出的。
其中,61%的學(xué)員來自國央企、上市公司以及行業(yè)龍頭T1應(yīng)用服務(wù)商,80%有“管理+專業(yè)+技術(shù)”復(fù)合背景,均是各大公司的CTO或技術(shù)高管,行業(yè)覆蓋18個領(lǐng)域,包括能源、重工業(yè)、醫(yī)療康養(yǎng)、海關(guān)物流等,也有像貴州茅臺、奔馳這類頭部知名企業(yè)的加入。
課題內(nèi)容方面,AICA第九期新增文心開源、MCP前沿技術(shù)、多模態(tài)、數(shù)據(jù)等模塊,以及百度重點技術(shù)的實戰(zhàn)案例,當(dāng)前AI應(yīng)用的主流技術(shù)路線全覆蓋。
例如本次麥當(dāng)勞團隊申報的課題《麥麥巡警數(shù)字員工》:
麥麥團隊希望得到關(guān)于大模型優(yōu)化、任務(wù)調(diào)度與管理等方面的技術(shù)指導(dǎo)和建議,進一步了解場景Agent落地的工程化設(shè)計思路,助力提升麥麥巡警數(shù)字員工的開發(fā)效果。
百度集團副總裁吳甜也在會上表示,AICA將通過文心大模型與飛槳深度學(xué)習(xí)平臺,為學(xué)員們提供產(chǎn)業(yè)級模型與工具鏈,另外保障豐富的實踐案例以供參考,并提供終身學(xué)習(xí)與交流平臺。
目前AICA已向業(yè)界輸送489名AI架構(gòu)師,遍布工業(yè)、能源、金融、交通、農(nóng)業(yè)、互聯(lián)網(wǎng)等數(shù)十個行業(yè),真正實現(xiàn)懂AI、做AI,讓AI落地真實場景。
參考鏈接:
[1]https://mp.weixin.qq.com/s/H5ctOM-zBNQaBwXdvkxZyQ





京公網(wǎng)安備 11011402013531號