
![]()
“汽車、Robotaxi、機器人、飛行汽車,將會為小鵬帶來更多「石油」。”
作者丨韋艷嬌
編輯丨田哲
那些天馬行空的科技暢想,都正在從夢想變成現實。
11月5日,第七屆小鵬科技日如期進行,活動地在小鵬新搬遷的總部園區。從早期蝸居廣州城中村的創業團隊,到如今擁有自建科技園區,辦公地點的變化背后,也藏著小鵬成立11周年后從站穩到跑向世界的愿景。
小鵬汽車正變得更像一家AI公司。
它將業務聚焦在四個方向:智能汽車、機器人、Robotaxi與飛行汽車。這四個板塊并非簡單并列,而是以智能駕駛為核心的不同演化路徑。汽車是商業化起點,Robotaxi是算法的城市化延伸,機器人與飛行汽車則是具身智能和空間智能的外溢結果。
其中,小鵬汽車推出了首個量產物理世界大模型即第二代VLA,這也是小鵬在物理AI領域探索的關鍵技術突破。在何小鵬看來,當AI將進一步進化,AI將不再僅停留于應答與生成,而是直接參與、引導甚至重塑物理世界的運行,AI的能力要從數字世界延伸至物理世界。
相較于傳統的行業標準版的VLA,小鵬二代VLA去掉了語言這一中間轉譯環節。減少了語言轉譯的延遲后,視覺信號直達動作指令,并且小鵬二代VLA使用大量的長尾視頻數據,大模型從學習模仿變成更聰明的理解。
二代VLA帶來的機器逐步理解、交互和改變世界的能力,也是小鵬串聯起汽車、機器人、飛行汽車等多元業務線的信心來源,因為它們所面對的都是同一個物理世界,所需要解決也都是基于物理世界信息進行決策。
據小鵬汽車聯合創始人、執行董事、董事長兼CEO何小鵬透露,第二代VLA是在瀕臨放棄研發的絕望中突然實現的。
2024年,小鵬內部同時研發兩代VLA,卻一直沒有取得突破,研發團隊也逐漸失去信心,甚至有些高管逃避參與報告會。但是在不久后的一天,二代VLA突然呈現出驚喜的理解能力。小鵬內部認為,這種變化源于技術積累觸及某個臨界點后的自然爆發,沒有辦法確認是什么量變觸發了這種質變。
何小鵬表示,二代VLA所展現出的物理AI能力只是一個開始。真正的難題不在于模型的涌現,而在于能否更快實現穩定量產。那意味著不僅要讓“長板”更長,還要讓中板和短板被一并補齊。量產,是小鵬接下來必須跨過的門檻。
在他看來,物理AI將成為未來科技公司新的競爭。在物理AI時代,數據是新的石油,誰能先獲得大量高質量數據并形成“數據-體驗-更多數據”的閉環,誰就能取得優勢。而這一循環的起點與關鍵環節,都取決于企業在硬件和工程化能力上的深度投入,最終構成軟硬件協同演進的閉環。
在這種思考下,小鵬將硬件業務從汽車延伸至機器人、飛行汽車、Robotaxi等板塊,或許會帶來更多數據,形成更大的軟硬件循環能力。
小鵬推出Robotaxi業務,則更多基于對未來出行的思考。何小鵬堅信,未來的4個輪子交通一定是“共享”和“私享”的組合。
與此同時,第二代VLA大模型的成熟,也為小鵬切入這一市場提供了優勢。二代VLA已具備擺脫高精地圖依賴的能力,可直接支持前裝量產方案,而非事后改造。同時,通過與量產車型共享研發體系,小鵬得以在保證性能的前提下分攤成本壓力,將單車成本控制在更具經濟性的區間。
在趨勢和條件都有利的邏輯下,小鵬基于現有的汽車業務去布局Robotaxi也非常合理。
何小鵬也明確,小鵬汽車的定位將切換為“面向全球的具身智能企業”,而不再只是一家中國車企。
除了更多業務面向更大市場的動作外,小鵬正將其部分核心技術以開源形式開放。其第二代VLA大模型面向全球商業伙伴開源,大眾汽車成為該技術的首發客戶,后續將推動第二代小鵬 VLA 和圖靈芯片,在大眾品牌車型上落地。
在商業化落地規劃中,何小鵬表示科技日上公布的多項技術將在2026年進入爆發周期:第二代 VLA 端到端輔助駕駛、小路 NGP、無需導航漫游的 Super LCC、第二代人形機器人 IRON、前裝量產 Robotaxi。
在科技日后,小鵬被稱為是最像特斯拉的企業,小鵬汽車的市值回到220億美元,特斯拉的市值約為1.5萬億美元。
二者之間仍然有著巨大的差距,但從另一個角度看,小鵬在機器人、自動駕駛領域開放SDK,挖掘物理AI的數據石油,也在助其搶占物理AI高地。
在物理AI這條路徑上,小鵬有了更廣闊的向上空間。
圍繞物理AI、機器人、業務發展等內容,雷峰網等與小鵬汽車董事長何小鵬、小鵬汽車副董事長兼聯席總裁顧宏地、小鵬汽車自動駕駛中心組織負責人劉先明、小鵬汽車機器人副總裁及AI技術委員會負責人米良川進行了多場交流。
以下是編輯后的內容節選:
Q:小鵬為什么堅持機器人“高度擬人化”?如果做高度擬人化,對應非常高的投入成本,怎么做權衡和取舍?
何小鵬:未來高等級的機器人有各種各樣的形態,有像人的,也有不像人的。
更擬人的機器人,有三大好處:第一,今天機器人想做到聰明,不能用規則,要用AI來驅動,只有從人類世界才可以學到最多的數據。
第二,我們的家庭、工廠,實際上大部分都是為了方便人類去使用而設計、建造、運營的,所以如果它越像人,越容易適應這個世界。
第三,從商業角度看,像人更容易讓大家有親和感,更有購買欲。賣得多帶來規模效應,成本更低,成本更低就可以賣得更多,會形成正向循環。
Q:為什么小鵬Robotaxi首個全球生態合作伙伴選擇了高德?第二個問題,明年要發布三款無人駕駛出租車,這三款車的差異在哪兒?
何小鵬:高德是中國非常大的出行生態平臺,小鵬跟很多Robotaxi公司不一樣,無論是在中國還是全球,都不追求自己的全力運營。希望小鵬做Robotaxi就像一個“工具箱”一樣,有車、有軟件、有SDK接口,開放出來給合作伙伴,他拿著“工具箱”就能做本地Robotaxi的運營。
高德是一個出行運營商,所以它來運營,我們提供“工具箱”,這是符合兩家戰略定位的。三款Robotaxi是不同價位的,提供5、6、7座,滿足不同用戶的需求。
Q:許多中國大公司常被拿來和特斯拉比較,但估值卻遠低于特斯拉。在未來,我們應當如何讓資本市場更好地提升小鵬汽車的估值?
顧宏地:我們目前在追求的,其實更多的是科技和產品,確實其中有些和特斯拉比較類似。都聚焦于物理AI,同時聚焦打造智能汽車、自動駕駛、人形機器人等等。我們在部分領域甚至比特斯拉開始得更早,比如飛行汽車,人形機器人。某種程度上,我們是聚焦于使用技術和AI去打造更多物理世界的場景。
關于資本市場的估值,小鵬和特斯拉的現狀是非常不一樣的,其中有很多變量。
首先,中國和美國不同,在市場、科技公司、資本市場,有一些情況有所不同。第二,特斯拉是有一些優勢的,尤其是他們在電動車領域開啟得更早,并且媒體曝光度也非常高。
特斯拉有不同的產品,電車只是一部分,同時他們也有AI模型、FSD,以及很多生態企業,種種加起來可以組成他們的估值,小鵬也在不斷推出各種產品及技術,希望小鵬在未來可以獲得一樣的國際聲望。
Q:小鵬的新一代機器人與汽車在零部件上的復用比例達到多少?
何小鵬:我沒有精確的答案,但是很多工藝是一樣的,比如說感知、域控制器,AI 軟件有70%是一樣的,但機器人的關節、皮膚在汽車零部件上是沒有的。
Q:小鵬希望在物理AI業務上,與汽車營收的占比是如何的?
何小鵬:未來,我對機器人的看法可能更樂觀。汽車在全球是10萬億美金的市場,一年生產9000萬臺車;而機器人是20萬億美金的市場。當然它不會這么快(實現),可能需要10~20年的時間,在這個時候可能會有2億或者更多的人形機器人。
我沒有想過10年以后,一年能賣多少機器人,但肯定會超過汽車,超過100萬,這是從10年的角度來看。從短期的角度來看,機器人的量產還要過很多很多關。
Q:很多Robotaxi公司還沒有取得盈利,請問你們在推進Robotaxi計劃時怎么確保有盈利?
何小鵬:小鵬可能是一個不一樣的Robotaxi公司,因為我們做了前裝的車,做了量產的車。小鵬Robotaxi、同時還有一個Robo(私人L4),可以To C銷售,可以大幅度分攤BOM和研發費用。
另外,基于二代VLA,小鵬Robotaxi不需要高精地圖,不需要掃街,不需要激光雷達,更像一個物理世界的人去思考,所以更廣度、更泛化,不需要部署費用。小鵬汽車在Robotaxi領域,研發費和BOM比其他公司天然擁有百分之幾十,甚至幾倍的優勢。
Q:小鵬把VLA的“L”去掉了,是真的消除了嗎?如果真的消除了,你們現在還叫VLA,不應該是叫VA嗎?
何小鵬:我們說V+L,轉譯環節沒有變成人類的語言跟格式,而是變成了一個物理世界的新語言,所以它不是人類可見、可認知的語言,效率很好,更豐富。
Q:發布會現場沒有提到L3,直接面向L4,L3產品的進展是不是也卡在這個法律法規上?
何小鵬:我認為,將來一個是L2,一個是L4,沒有L3,跳躍了L3。
Q:小鵬把固態電池裝在人形機器人,這款固態電池是來自外部供應商嗎?
何小鵬:我們不研發電芯,都用合作伙伴的,我們固態電池的電芯來自于兩家,一家來自海外,一家來自中國。
Q:為什么小鵬在這個時候啟動Robotaxi?目前有什么樣的策略?
何小鵬:因為我們很多AI技術的開發、目前算力的提升,已經能夠很好地去催生Robotaxi的機遇,和半年前、兩年前完全不一樣。
此外我們也看到,L4智駕越來越成熟。在過去6個月到一年當中,很多公司以及行業合作都聚焦于L4級自動駕駛。當我們去轉向L4、轉向Robotaxi的時候,目前的情況和半年甚至一年前是完全不一樣的。
對于小鵬來說,也想要提供更加經濟的解決方案,來更好地幫助客戶享受到L4的便利性。目前,在Robotaxi領域,我們和很多生態合作伙伴合作。
Q:小鵬就展出了一個女性的人形機器人,為什么會是女性?這方面是出于哪些考量?
何小鵬:人形機器人是男是女不重要,就像你可以買黑顏色的車,也可以買白顏色的車。在第一代機器人里面,我希望完成一個男性、一個女性的機器人,我認為都是需要的。
Q:特斯拉和小鵬是全球、全世界業務重合度最高的兩家公司,如果用一個詞概括,小鵬和特斯拉最不同的地方在哪里?
顧宏地:特斯拉和小鵬的對比中,有兩個特別的點。第一是我們相同的地方,我們都注重規模,做事時不希望只針對一個很小的細分市場,而是希望達到量產和規模化,這是我們相同的地方。第二是我們不同的地方,小鵬是一個非常開放的生態。
更加開放的生態系統和更加封閉的系統,都有自己的優劣勢,比如封閉的可能更容易去獲得經濟效益,開放的可能更容易和合作伙伴合作。
目前小鵬更加開放,因為我們是一個年輕的公司,我們有自己的局限性,沒有資源去做很多事情。我們在機器人、在自動駕駛車上開放SDK,可以讓我們和更多人合作實現很多技術,這樣也可以更好地去幫助我們的產品和技術成熟。
Q:發布會提到了機器人的一些場景,比如說擰螺絲、做家務,這些可能都不是立刻會實現的場景,在你們看來,如果實現這些場景可能需要多少年?
何小鵬:在人形機器人上,不同的公司會選擇不同的商業化方案,在我們公司有一些規則,讓機器人不要有太多用手的操作,以及我們也想在機器人的智慧或者是智力方面,循序漸進地發展。
目前我們還是在商業化早期階段,可能在3~5年之內可以實現你剛剛提到的場景,可以做更多不同的事情。但如果我們想要機器人在家里去照顧老人、照顧小孩,那可能需要更久的時間,甚至可能需要5~10年。有些人說,5~10年之后,人類可能在很多場景下會被機器人取代,但在我看來,這是不可能實現的。
Q:業務線上,包括機器人、低空飛行器乃至Robotaxi,小鵬是如何看待它的國際化市場潛力?
何小鵬:小鵬的目標是,接下來十年有一半產品在中國以外銷售。所有產品線和大部分的產品,我們都會考慮如何全球化。實際上,有部分的產品比如飛行汽車在全球的使用場景,可能比中國還多一點、還快一點。
Q:在智駕方面,小鵬在國外XNGP有沒有一些規劃?
何小鵬:在海外市場方面,小鵬也在積極推進XNGP的落地進程。目前,公司已對多個國家和地區進行了前期考察,其中部分市場的法律法規已允許部署更高階的智能駕駛功能,例如高速NGP等。
預計明年將在歐洲率先實現相關功能的落地。同時,公司也在持續跟進香港及東南亞市場的政策進展。需要強調的是,海外XNGP的落地不僅取決于技術成熟度,也與各地的法律法規密切相關,小鵬正在與當地政府及監管機構保持溝通,以推動技術合規化應用。
Q:奧地利麥格納工廠的生產情況,明年預期或者計劃的年產量?未來,是否會去海外更多地方設廠?
顧宏地:今年8月份,奧地利工廠正式開始投產,今年的產能規模大概是幾千到大幾千輛,明年我覺得是幾萬輛的規模。
在其他地方建設本地化工廠,我覺得是絕對需要的。一個希望達到全球領先的企業,沒有一家是只靠出口能達到的,一定要有當地的布局——生產、研發、銷售服務、品牌建設,這些都是我們必須要做的。所以我認為將來在主要的銷售地區,我們都會有本地化生產和本地化運營的能力。
Q:物理AI有哪些難點?
劉先明:難點在于模型的做法。模型是通過語言建模做離散化token(字符單位),然后經過一個架構,最終輸出。
Q:這套技術背后的核心原理是什么?
劉先明:就是把大模型、大算力、大數據堆到一塊,模型邏輯非常簡單,背后的原理也很簡單,沒有什么復雜的故事。但想把它做好難度很大,非常大的數據要一口氣讀進來,還要在千卡、萬卡級別訓練得非常穩定保證不崩掉。
Q:無數據標注具體能帶來什么商業優勢?
劉先明:舉個例子,我要去歐洲等海外市場、去一個新的地方落地當地的Robotaxi,其實不需要數據標注,只要這個地方有小鵬的車可以采集數據,就可以把這件事搞定。不需要再定向采集很多數據,不需要雇很多人去標注數據,成本會下降很多。
Q:小鵬的數據為什么可以做到無需標注?你們是如何通過infra采集到大量長尾數據的?
劉先明:我們最大的優勢就在數據。采集長尾數據有兩個方面:一是車端的infra,我們做了很重要的工作——識別哪些數據是要的,哪些是不要的。一輛車平均每天開1.7個小時,能遇到很多好駕駛場景和極限場景,只要有辦法識別出來就可以。二是云端有比較大的數據閉環,也在調優數據質量、分布,避免同一場景下太多重復數據。
Q:你們如何重新思考自動駕駛的本質?
劉先明:我們退回去想,自動駕駛本質上它是一個物理AI的問題,你要嘗試去理解這個世界,為它做三維建模,然后推演什么事情要發生、做預測,再根據這些做出最安全、最符合人類意識的一種選擇。這就是物理AI的本質。
自動駕駛本身就是物理AI或Robotaxi里面最簡單的一種問題,它只有兩個自由度:向前的加速度以及方向盤的轉角,相比于正常的機器人來說自由度小很多,數據空間小,數據也更容易獲取。所以物理AI的第一件事就是去做自動駕駛。
Q:為什么扔掉語言?
劉先明:這幾年AI發展最大的原動力來自于scaling和data scaling,即不停地用更大規模的數據來訓練,我們在語言模型看到了非常好的效果。
物理模型也有同樣的問題:如果想要更大規模地使用數據,一定要拆掉所有的separation(模塊界限),讓它變成一種自監督的模式,不需要人工標注。只要有語言存在,就一定涉及到人工的篩選或標注,于是我把它拆掉,讓它變成一種非常極致的數據驅動模式。
Q:現有的VLA架構存在什么問題?
劉先明:很多VLA架構基本都是圖像進來,通過一個大語言模型最終輸出一meta action(高級抽象的動作指令),meta action一般是文字,然后再通過文字的方式處理后輸出。這種方式最大的好處是你有很多開源模型可以用,可以直接拿開源的NLP模型來做推理。
但它帶來的問題是,你引入了中間一個離散化的語言輸出,成為了瓶頸,這樣會讓數據使用的規模受到限制。一個系統沒有任何中間瓶頸,才可能大規模地做起來。
Q:物理世界交互的本質是什么?
劉先明:物理世界交互的本質其實是直接輸出控制信號。為什么這種基于端到端的視頻輸入、動作輸出的大模型能工作?因為當人類做任何動作時,需要經歷幾個過程:先要理解這個場景的3D是怎么構建的,然后根據過去的歷史信息做出對未來的判斷,最后根據自己的指令做出最終行動。
如果我最終的輸出信號直接是行為的話,那它其實包含了重建、理解、生成和最后推進的所有過程。只要用更大規模的數據、更大的模型把這個事做下來,理論上就可以解決這個問題。
Q:從模型到量產,部署方面面臨什么挑戰?
劉先明:這只是一個demo、一個模型。從模型到最終量產涉及部署問題。除了傳統剪枝量化方法外,更重要的是要把它放在端上、放在芯片上,所以需要低延時、高幀率、本地化的部署方案。我們做了從模型到軟件到編譯器到硬件的聯合優化和協同設計。
Q:你們選擇的是世界模型還是VLA路徑?
劉先明:一直有人拿這事問我們選的是哪條路徑。其實本質上這兩個沒什么太多區別,都是一種極致的端到端系統。我們更多還是要回歸基礎本質,去解決基礎本身的問題。
Q:"涌現"這個概念在機器人領域怎么體現?
米良川:古語講"量變引起質變"。我們去年發布之后,采用了最艱難的生成式方式去做控制器。從去年10月份一直到今年3月份都在迭代優化。在這個過程中整個團隊包括我自己都經常,持續優化數據、優化各種東西,但總看不到質變。3月26號那天晚上,團隊測試倒著走的時候,在監控器視頻里看發現倒著走好像有點意思,那一天就是我們控制器的拐點。
到底哪個優化帶來這個變化,說不清楚,堅持以后突然的飛躍。
Q:機器人展示的跳舞和貓步行走,背后是什么技術?
米良川:大家看到的貓步行走,用的是我們第三代控制器;剛才大家看到的太極,實際上是第四代。
Q:能介紹一下控制器的代際演進嗎?
米良川:最開始是model base,大概在2023年左右使用,但實際上我們在2024年就已經把它拋棄了。我們也支持MPCC(模型預測控制),這是業界用得比較多的技術路線。我們第三代選擇了一個比較難的路,就是真人模擬——你們看到的貓步也好,自然行走也好,它的步態和風格實際上是嵌在控制模型里面的。它邁步子本身不是軌跡跟隨或姿態跟隨,而是生成式的。比如說貓步的那個姿態,怎么走都是貓步,包括左拐右拐。
Q:你們為何選擇導覽、導購、接待這類場景作為切入點?
米良川:我們判斷以機器人當前的能力狀態,在這些場景能夠產生有效的價值。同時在實際場景中一定會發現新問題,只有在這種"知行合一"的實踐過程中,才可能真正促進能力提升。當能力提升到一定程度,自然就會發現新的應用。
Q:您提到現在的運動完全是生成式的,是否可以理解為機器人自主上下臺,背后已經沒有遙控器,已經有一個激活的大模型在工作?
米良川:機器人現在的控制原理,包括控制器,是整體支持的。人要操作它,基本上還是要告訴它方向和速度,它只需要這兩個東西。
方向和速度可以來自于上層的模型生成,比如我們的導航模型就是方向和它直接對接的。如果是遙控,實際上就是一個人在搖桿操作;如果是既定的編排軌跡,也是這樣的方式。
Q:機器人量產時不得不考慮成本問題,這一代相比上一代成本有什么變化?
米良川:成本問題分成兩部分,一部分是我們能做的,一部分是需要依托整個行業的。
我們機器人的所有螺絲基本都是自研。這給了我們迭代的效率,也給了我們技術降本的機會。但另外一部分,最有效的降本還是等到產業比較成熟,供應鏈能夠共享沉淀下來。
Q:小鵬機器人與一些機器人公司有沒有合作關系?
米良川:我們也在努力希望跟更多同行合作,但當前階段還是以自研為主。我們的戰略合作伙伴更多是在一些硬件上,包括一些局部技術上進行合作。
本文作者長期關注小鵬汽車動態,感興趣的行業人士歡迎添加作者微信(XY8899672)交流。





京公網安備 11011402013531號