鷺羽 發自 凹非寺
量子位 | 公眾號 QbitAI
太夸張!百度辦AI“培訓班”,大佬都紛紛要來拜師學藝。
剛剛百度舉辦了首席AI架構師培養計劃(AICA)的第九期開學典禮,一看嚇一跳,本期學員里可謂是臥虎藏龍。
除了有來自茅臺、奔馳、麥當勞等明星企業的技術高管,還有國網、中石化、中石油等一眾國字號大佬云集于此。
![]()
所以讓大佬們擠破腦袋都想進來學習的AICA到底是個啥?
依托百度自研的深度學習平臺飛槳和文心大模型,AICA目標培養復合型AI架構師,簡單來說,就是既能參與技術開發,又能確保項目落地。
![]()
而今年較之以往最不同的是,從導師到學員,聊得最火熱的話題莫過于——大模型。
相關課題占比51%,并首次出現多智能體協同等前沿技術應用。
與會嘉賓也在開學典禮上重點強調大模型推動產業變革的意義所在,從底層架構再到軟硬件協同發展,以及為AI架構師如何跟上大模型發展速度提出了寶貴意見。
![]()
以下是量子位從嘉賓演講中整理出的部分精彩內容,在不改變原義的基礎上進行了適當調整。
大模型正在逐步轉向產業落地
安暉:AI技術賦能產業發展
來自中國電子信息產業發展研究院的副總工安暉,首先就整個AI行業發展進行了系統性分析。
他認為,AI將會是繼蒸汽機、互聯網之后推動整個社會經濟發展的重要通用技術,而當前更是進入了加速重視AI應用工具的新階段。
尤其是從2025世界人工智能大會可以看出,AI競爭正在逐步轉向場景落地,如制造、醫療、金融等領域。
以及全網關注的GPT-5也側面說明,當前底層模型能力已足夠強大,大模型性能提升速度或將放緩,現在產業重心應當放在大模型的應用落地。
![]()
AI技術未來將在企業發展中占據更為重要的作用,根據OpenAI發布的企業客戶研究報告,AI可以在提高工作效率、解放員工的重復性任務、推動產品創新三個方面帶來顯著提升。
賽迪研究院也補充指出,AI還將重構服務模式、實現資源均衡,共同促進多行業變革。
而當前我國AI發展呈現出三大趨勢,分別是技術比拼、商業應用、產業格局:
技術比拼:整體參數規模轉向智能水平,核心競爭力在于技術護城河。商業應用:正在從概念驗證轉向場景實踐,逐步建立特色AI生態。產業格局:整體從分散行動發展成頭部企業主導行業風向,把握優勢資源成為企業的重中之重。
![]()
但安暉也表示,相關產品效益還未完全顯現,從人工智能大會也能看出,當前新產品在功能、形態和應用內容上存在同質化,缺乏創新閃光點。
其邁向實際應用過程中,如何與實體企業核心業務掛鉤,當前各大AI企業還未給出準確的方案,如何能夠讓用戶認同AI價值、對AI營收效益持積極向好態勢,都是進一步推動AI應用必須解決的前提條件。
另外,行業缺乏AI經驗和數據支持,從而導致產用脫節、落地困難。
因此,安暉建議應該以創造價值為導向發展AI,幫助企業增收降本,另一方面重視AI人才培養,無論是校企培養,還是AI企業和用戶企業協作培養,寄希望于將技術深度融入業務體系。
馬艷軍:新技術重構AI能力邊界
百度AI技術生態總經理馬艷軍則主要介紹當前大模型技術在產業融合中的能力狀態以及AI架構師應當如何應對這種變化。
![]()
首先整個大模型技術已經得以完善增強,擁有更好的多任務泛化能力,產品研發流程也變得更加標準化。
LLM已逐步具備專家級智能水平,現在只需要向大模型表達需求,就能立即獲得對應任務結果。
例如百度基于文心大模型4.5 Turbo打造的羅永浩數字人技術,可以專業且長時間地保持高質量直播輸出,體現出一個多功能LLM的深度思考和分析能力。
![]()
此外,LLM為整個行業帶來了翻天覆地的變化,尤其是編程領域。
在百度內部,整個AI代碼生成的占比和采納率已經從2022年的5%和15%增長至50%和80%,大模型能夠完成復雜編程任務,如刪除功能模塊或糾正編譯錯誤。
這對團隊的首席AI架構師而言,將會是一個巨大的挑戰。
要想要跟上LLM發展趨勢,將其能力最大化,AI架構師就需要知道如何讓模型輸出、如何讓模型輸出更優、如何讓模型輸出更快。
![]()
馬艷軍表示,需要從以下四個方面入手:
深入了解提示詞工程:相應優化技巧包括合理拆解復雜任務、組織輸出順序、補充合適信息以緩解幻覺、多文檔引用正確指令和使用可理解的文本格式。學習模型調優方式:包括增加預訓練、對指令監督微調、進行獎勵模型訓練,以及偏好對齊。掌握全棧系統設計能力:從模型開發、訓練、精調、壓縮再到部署推理,可實現完整性標準流程。深刻理解場景問題:洞察行業痛點,能夠判斷什么場景需要什么模型,構建針對性解決方案。
總之,首席AI架構師需要學會將Agent融入日常工作流程,推動產業范式升級。
于佃海:從深度學習到大模型
在本次開學典禮中,百度飛槳總架構師于佃海,也帶來了有關深度學習到大模型發展變遷的第一堂課。
![]()
隨著LLM發展,現在來到了軟件3.0時代,1.0時代是傳統編碼實現功能,2.0時代基于深度學習,通過訓練模型實現功能,3.0時代直接一個大模型提示詞就能完成多種任務。
大模型的本質不僅僅是參數量大,規模從百萬級到現在的十億級,更重要的是其模型結構、學習機制以及推理能力的進步。
當前LLM模型架構主要還是以Transformer為核心,基于神經網絡的注意力機制,從序列的轉換發展而來。
而未來LLM架構還會繼續基于Transformer持續優化,與此同時更加重視專家MoE結構。
![]()
學習機制上,深度學習在新一代的大模型訓練流程中分別承擔不同功能角色,自監督學習可以實現大規模預訓練,監督學習負責增強LLM指令遵循能力,強化學習通過人類反饋提升模型的偏好對齊。
高效推理部署是當前大模型應用推廣的關鍵,相當考驗基礎設施建設,目前硬件(芯片、算力、存儲)方面還有所落后,軟件(分布式訓練框架、高效推理引擎、優化工具)方面則已取得進展。
未來還需要實現軟硬件協同發展,包括支持更多硬件高效適配接入、構建大規模硬件集群達成多維混合并行、芯片層面深度協同優化,最終搭建起大模型時代的深度學習平臺。
AICA:培養真正懂AI、做AI的架構師
從2019年開始,這已經是AICA舉辦的第九個學期,作為百度與深度學習技術及應用國家工程研究中心的聯合發起項目,吸納了來自各行各業的頂尖人才參與。
本期共招收學員96名,是通過長達半年的預科學習、項目技術評審以及多輪考核,才從500多名報名者中脫穎而出的。
![]()
其中,61%的學員來自國央企、上市公司以及行業龍頭T1應用服務商,80%有“管理+專業+技術”復合背景,均是各大公司的CTO或技術高管,行業覆蓋18個領域,包括能源、重工業、醫療康養、海關物流等,也有像貴州茅臺、奔馳這類頭部知名企業的加入。
課題內容方面,AICA第九期新增文心開源、MCP前沿技術、多模態、數據等模塊,以及百度重點技術的實戰案例,當前AI應用的主流技術路線全覆蓋。
例如本次麥當勞團隊申報的課題《麥麥巡警數字員工》:
麥麥團隊希望得到關于大模型優化、任務調度與管理等方面的技術指導和建議,進一步了解場景Agent落地的工程化設計思路,助力提升麥麥巡警數字員工的開發效果。
![]()
百度集團副總裁吳甜也在會上表示,AICA將通過文心大模型與飛槳深度學習平臺,為學員們提供產業級模型與工具鏈,另外保障豐富的實踐案例以供參考,并提供終身學習與交流平臺。
目前AICA已向業界輸送489名AI架構師,遍布工業、能源、金融、交通、農業、互聯網等數十個行業,真正實現懂AI、做AI,讓AI落地真實場景。
參考鏈接:
[1]https://mp.weixin.qq.com/s/H5ctOM-zBNQaBwXdvkxZyQ





京公網安備 11011402013531號