![]()
記者 花子健
編輯 高宇雷
高階智駕、無圖NOA、端到端、VLA、WEWA架構、NWM······每隔幾個月汽車公司和智能駕駛行業都會誕生新的名詞,對應的則是智能駕駛技術的快速迭代。
但背后技術迭代過快的問題同樣顯現,用戶一年前購買的新車,已經無法被現在的新技術接納;甚至用戶的認知都已經無法趕上這些新名詞。汽車公司的內部同樣是暗流涌動,從規則式到端到端,再到世界模型、物理AI的架構,造車新勢力的智能駕駛部門總是面臨人員更迭、高管離職。
智能駕駛行業普遍認為,今年第四季度到明年的上半年,是輔助駕駛技術落地的又一段關鍵時期,隨著基于世界模型、VLA的升級,包括堅持自研的汽車公司,以Momenta、元戎啟行、文遠知行在內的解決方案供應商在內,領先身位隨時都在發生變化。
![]()
從規則、端到端再到世界模型
基于規則的?輔助駕駛系統,核心模塊包括感知、預測、規劃、控制,業界俗稱為“模塊化方案”,優勢在于容易量產,但缺點也很明顯,四個獨立模塊以串聯方式進行工作,時延比較長,信息損耗大。所以,車輛受制于博弈能力,在路上進退為難的情況比較常見。
2023年8月,特斯拉推出基于端到端的FSD V12測試版,“端到端”也成為國內智駕圈子的熱門話題。華為、小鵬、蔚來和理想陸續跟進,Momenta等解決方案供應商也陸續推出了端到端的方案。
![]()
但不論是規則還是端到端,本質上都是輔助駕駛系統的模仿和學習——將海量的人類駕駛數據投喂給系統,讓系統學會如何駕駛,因此衍生了數據采集、標注和清洗等環節,核心是讓學習模型理解這些數據,然后才能提高學習的效率和精度。
從根本上來說,這種方法和人類學習駕駛的過程基本相似,但不同之處主要在于系統的前期學習和后期修正都是被動的,而非人類那樣主動學習和主動修正。
舉個例子,在雙左轉車道的路口左轉,人類駕駛員一般偏向于選擇車輛少的車道,且跟車距離也會各有不同。但基于規則和端到端的輔助駕駛系統,一般會選擇最內側車道。再比如,當車輛變道進入匝道的時候遇到堵車,人類駕駛員可以擇機匯入,但系統則容易導致車輛原地停留。
另外一個問題是,不具備主動學習和修正能力的系統,無法應對所有的可能性。用小鵬汽車自動駕駛中心組織負責人劉先明的話來說就是:“即使每天都能解決99%的corner case(極端情況),今天99%,明天99%,但也是解決不完的,除非可以窮盡所有可能,這個要到猴年馬月才能實現L4。所以這就是一個無法收斂的難題。”
理想汽車創始人李想對此的解釋是,端到端對真實的物理世界是沒有理解能力的,它只是接收到了來自視覺系統的三維圖像,結合車輛的速度給出運動軌跡。端到端足以應付大部分泛化場景,但如果是從來沒有學到的、特別復雜的情況,就會遇到問題。這從另外一方面也說明,從去年開始,量產的端到端都是兩段式的,而非一段式。
為了解決端到端無法收斂的短板,理想汽車的做法是加入了VLM(視覺語言模型),但因為這些模型是開源的,在交通場景中的能力非常有限,只能起到非常有限的輔助作用,比如能夠識別紅燈的讀秒,結合導航地圖輸出運動信號。
模仿人類駕駛,已經被證明無法幫助輔助駕駛系統突破到L3,因為模仿行為本身存在短板,它必須要有明確的模仿對象,且需要窮盡模仿的所有行為的可能性——這就像套娃,永遠出現下一個更小的套娃。
“既然模仿的路走不通,那就應該回到原點。”劉先明說,自動駕駛不是簡單的模仿學習,而是應該重新去理解這個世界,真正像人類那樣駕駛汽車。
![]()
李想也表達了類似的觀點:第三階段也就是VLA(vision-language-action,視覺語言行動模型),用3D的視覺和2D組合看真實的物理世界,甚至可以看懂導航軟件,知道它的運行方式——相比起來,VLM看到的只是一張圖片。VLA還有自己的大腦系統,能夠理解看到的物理世界,基于自己的語言體系、思維鏈和推理能力,像人類一樣真正執行駕駛動作。
理想汽車的VLA也稱之為“VLA司機大模型”,其原理是將視覺成像轉譯為語言,再執行動作。小鵬汽車則更加激進,在11月5日的小鵬2025科技日上,何小鵬宣布小鵬汽車將在新一代VLA模型中直接取消語言轉譯的環節,把攝像頭捕捉到的多模態物理信號輸入,直接輸出連續的控制信號。
但小鵬的第二代VLA同樣存在推理過程,只不過至隱藏在模型當中,并不是由一個顯性的語言模型來進行。取消“L“(意指語言)有兩個好處,其一是提高了模型工作的簡潔度和效率,降低信息傳遞過程的損耗,視頻和IMU(空間姿態傳感器)提供的信號可以不經過語言轉譯環節,直接輸出連續的控制信號;第二則是系統具備了大規模“自監督學習”的可能,車輛從物理世界采集的視頻可以直接成為訓練數據,系統因此具備了極強的泛化能力。
劉先明說:“在海外任何一個市場,小鵬不再需要重新測繪、標注數據,只要有小鵬的車在跑,就能夠支撐模型的訓練,可以快速支持部署和落地。”
對于每家公司來說,做自動駕駛的第三個階段,選擇的路線不盡相同。理想汽車自動駕駛研發高級副總裁郎咸朋認為,華為是規則時代的強者,用規則是打不敗華為的,順著戰略大勢做的端到端本來也是新的技術路線,但今天它已經從新市場變成了舊市場。“如果理想要做真正的自動駕駛就不能繼續在這個戰場打了,要換一個戰場,那就是VLA。”
今年3月,理想汽車已經發布了VLA技術方案。此后關于VLA是否可行的討論聲漸起,華為智能汽車解決方案BU CEO靳玉志認為,華為不會走VLA的技術路線,因為VLA將視頻轉化為語言token再對車輛進行控制的做法是“取巧的”,華為的WAWE架構和小鵬第二代VLA類似,也是省略語言環節,通過視覺、聲音、觸覺等多模態信息直接控制車輛。
![]()
博世智能駕駛與控制系統事業部中國區總裁吳永橋則提到VLA落地的四個難點:多模態特征對齊很困難;多模態的訓練數據提取很困難;大語言模型存在無法避免的“幻覺”;當前的智駕芯片存儲帶寬不是為大模型專屬設計,無法支持大量的數據傳輸和計算。
與華為同樣選擇世界模型路線的是蔚來。蔚來自動駕駛研發首席專家、副總裁任少卿也舉類似觀點,他認為VLA把語言和動作捆綁在一起,仍然以語言為中心。語言模型的帶寬不足以應對現實世界的復雜性和連續性。
用劉先明的說法,VLA模型中的多模態特征對齊可能存在信息丟失的問題。小鵬汽車展示的一個接近6秒的視頻片段中,包含非常多的視覺信息、道路狀況和車輛運動信息,如果是使用VLA模型,意味著這些信息要先轉化為語言文本,而對齊就是確保轉化準確度達到最優的過程。“但實際上,就算用上千字來描述,也會比直接視頻呈現存在信息損失,這就是所見非所得。我們認為,去掉語言環節是最簡單、簡潔的方式。”劉先明說。
但不論哪一條路線,背后指向的都是“大算力、大數據和大模型”。在小鵬計劃面向Ultra版車主交付的第二代VLA中,支持的算力高達2250TOPS,由三顆自研的圖靈AI芯片提供。蔚來同樣自研了芯片——在蔚來的世界模型里,任少卿力推加入強化學習模型,他認為這是把短時記憶的模仿學習升級為可處理長時序智能體的關鍵。
加入蔚來之前,任少卿與曹旭東在2016年創辦了自動駕駛公司Momenta。當他選擇在2020年——蔚來的低谷期加入蔚來領導自動駕駛開發,曾引發一時轟動。他認可大規模的高質量數據對人工智能技術變革的推動作用,這也是他從Momenta離開加入蔚來的核心原因。
![]()
震蕩的內部組織
自動駕駛技術路線的切換,實際上從2023年底就已經開始了。2024年的11月,小鵬把原本在10月24日舉辦的科技日更改到11月7日。在科技日之前,小鵬P7+上市,當時剛剛晉升副總裁,擔任自動駕駛中心負責人的李力耘是端到端技術發布的主講。
但當時小鵬已經在內部同時推進兩條研發路線——傳統VLA和創新VLA,建成了3萬卡規模智算集群。所謂的創新VLA就是目前第二代VLA的雛形,去掉L的環節。但一直看不到希望,“當時團隊的幾個負責人連月會、周會都不好意思來開了”,何小鵬一度想過放棄,先聚焦傳統的VLA。
創新VLA的曙光出現在第二季度。何小鵬接到了自動駕駛團隊的電話,應他們要求親自測試了當時的VLA版本,結果體驗超出他的預料。隨后他果斷放棄傳統VLA,全力開發第二代VLA。
![]()
創新VLA項目負責人是劉先明。他在2024年3月加入小鵬汽車,在此之前,他曾在meta和通用汽車旗下Cruise從事機器學習與計算機視覺研究。何小鵬非常信任他,兩人交流的頻率非常高,并且很多次的交流都能持續幾個小時之久。
2025年10月,國慶假期剛過,小鵬汽車在內部宣布劉先明接替李力耘擔任自動駕駛中心組織負責人。劉先明和李力耘是智駕領域不同技術路線的代表,后者偏向于智駕產品,重在功能實現和產品落地,李力耘幫助小鵬實現了NGP落地至數百個城市,劉先明則重在打造能夠推演物理世界的世界基座模型,幫助小鵬的自動駕駛技術具備更強的泛化能力,走向全世界。這一調整意味著小鵬汽車的自動駕駛技術路線徹底從功能實現到基礎模型的轉型。
更早之前,吉利、蔚來和理想汽車的智駕組織已經大幅調整。吉利將內部多個智駕研發團隊整合到千里科技,同時還引入外部合作伙伴作為核心供應商。
今年9月19日,理想汽車將自動駕駛研發部門重組為11個二級部門,調整的重點是將研發資源向VLA傾斜,原本的模型算法團隊被拆分成了基礎模型部、VLA模型部和模型工程部。11個部門的負責人均直接向郎咸朋匯報。“此次調整是為了推動團隊向AI組織演進。”理想汽車在內部信提到。同時,他們還取消了過去采用的大規模封閉研發模式。
蔚來的調整和小鵬幾乎處于同一時間。蔚來世界模型負責人馬寧寧、蔚來智駕產品負責人黃鑫、蔚來智駕項目管理部負責人鄭可、蔚來智駕端側部署AI引擎部負責人吳釗等自動駕駛團隊負責人相繼離職。蔚來對此的解釋是:“主動調整的組織架構,將更有利于蔚來全力沖刺世界模型2.0版本的開發與交付。”這已經是蔚來一年內關于自動駕駛部門的第三次組織架構調整。
![]()
每一次技術路線的切換,都意味著公司投入資源的傾斜和對應的人事調整。規則時代的模塊化的開發并不適用于端到端,因此,從規則式切換到端到端,小鵬、理想、蔚來的自動駕駛部門已經發生了多輪組織架構調整。
2024年8月,小鵬就因為切換到端到端路線,把原本承擔算法研發,覆蓋了感知、規劃、控制和定位的技術開發部拆成三個全新的部門,分別是AI端到端、AI能效和AI應用。
隨著端到端成為舊時代產物,汽車公司也迅速調整組織以迎合新技術路線的開發需求。以理想汽車為例,他們曾經將夏中譜負責的端到端從算法研發部門獨立出來,兩者成為平行部門。但不久之后,理想就將VLA確定為下一代技術路線,由算法研發部門的負責人賈鵬主導研發,人員和研發資源也向算法研發部門傾斜,這被認為夏中譜最終離職的原因之一。
![]()
逼近的自動駕駛公司
在造車新勢力的帶動下,自動駕駛技術自研曾經被認為是汽車公司的標配。比如奇瑞汽車,后來成立的大卓智能,就是前特斯拉、小鵬汽車自動駕駛專家谷俊麗領導的專門進行自動駕駛技術研發的公司。
在自研的浪潮中,長城以內部孵化和投資的方式成立了毫末智行;吉利的新能源高端品牌極氪也選擇自研路線。上汽、廣汽和長安也紛紛把錢投向自研。但從去年開始,這些汽車公司開始選擇優質自動駕駛公司成為核心供應商。
長城汽車把魏牌藍山的NOA交給了元戎啟行,還參與了后者的最新一輪融資,形成鮮明對比的是,毫末智行陷入困難,管理層先后離開;奇瑞汽車先后和卓馭科技(前身是大疆孵化的車載事業部)、文遠知行達成合作,大卓智能始終上不了臺面;廣汽重新和華為合作;上汽在和Momenta合作后,又和華為成立了全新尚界品牌。
自研和供應商方案的競爭,在今年愈演愈烈。長期關注智能駕駛的電動知士資深媒體人大雨認為,今年第四季度,供應商方案會成為閃光點,他們的進展非常快,競爭會從自研的汽車公司主導轉向供應商主導。
今年8月,文遠知行正式推出與博世合作的一段式端到端輔助駕駛解決方案WePilot AiDrive,這距離他們的兩段式端到端方案量產上車僅過去半年時間。兩位曾經參加過該方案的體驗者給予了很高的評價,認為文遠知行足以依靠這套方案躋身第一梯隊,消解小鵬汽車這些汽車公司原本建立的領先優勢。這套方案將首先應用在奇瑞汽車星途的ES、ET系列車型上。
![]()
文遠知行的一段式端到端方案具備可伸縮的算力適配能力、多傳感器構型適配能力,意味著兼容能力更強,可適配車型更多。當然,這也是Momenta、元戎啟行這些解決方案供應商的天生優勢。
一位在造車新勢力負責智駕測試的工程師說,車企的平臺化設計、成本考量就決定了自研很難擁有供應商的自由度、兼容性和快速迭代的能力,的確,車企的核心優勢在數據,但隨著合作伙伴的增加,供應商能夠把數據的劣勢縮小。
他這樣比喻自研和供應商的區別:“自研更像是定食套餐,根據餐廳的定位設計開發,給什么就吃什么;供應商就像是自選餐廳,要吃什么自己選,豐儉由人。”這個比喻并不全面,但極具代表性。
資金的效率成為自研的另外一個掣肘。正如何小鵬在2025科技日上感慨的那樣,從2024年至今,小鵬汽車建成了3萬卡規模智算集群,光訓練費用的投入就高達20億元,正因為如此,何小鵬一度考慮過先放棄創新VLA路線。理想汽車同樣如此,為了支持研發,理想汽車在云端搭建了13 EFLOPS算力。但對小鵬汽車、蔚來而言,今年第四季度盈利又顯得尤為迫切。
不管是規則式,端到端還是現在的造車新勢力、華為主導的VLA、世界模型等路線,在產品落地層面,仍然屬于L2的框架。但現在VLA和世界模型被認為是通向L4的積極因素。小鵬汽車甚至認為,第二代VLA可以為具身智能的落地鋪路。
何小鵬曾說過,沒有智能化,電動汽車毫無意義。從2020年到現在,智能駕駛真正的競爭才剛剛開始。
![]()





京公網安備 11011402013531號