
一場公開演講,LeCun毫不留情揭穿真相:所謂的機器人行業,離真正的智能還遠著呢!這番話像一枚深水炸彈,瞬間引爆了戰火,特斯拉、Figure高管紛紛在線回懟。
人形機器人,也成為了AI圈最大的騙局?
最近在MIT的一場講座中,meta首席AI科學家LeCun一語道破了機器人界最大的秘密——
這些公司壓根不知道,如何讓機器人變得足夠「聰明」,或是說達到通用智能的程度。
家用機器人的實現,還需要AI領域取得一系列突破。
機器人在工廠里擰螺絲、搬貨等,可通過特定任務訓練實現,但讓它們在家中疊衣服、倒水、理解人的意圖,還很難。
他將這種差距,比作「窄智能」和「通用智能」的鴻溝。
而突破的核心,在于打造一款真正可以規劃的「世界模型」架構,即能夠學習理解和預測物理世界系統。
誰曾想,LeCun這番話再次捅了「馬蜂窩」,直接給這場狂熱潑了一盆冷水,引機器人界大佬上陣怒噴。
特斯拉Optimus AI負責人Julian Ibarz直言,我不同意LeCun的觀點。
在內部,特斯拉對于如何快速實現通用人形機器人,已經有了非常明確的思路。

Figure創始人Brett Adcock直接喊話,「誰去和LeCun說一聲,讓他別端著了,親自下場干點實事吧」!

Yann LeCun:
LLM只是記憶力好,智商還不如貓
Yann LeCun一直領先于時代的主流認知,但好像每次都是對的。
在1987年,他在現在的索邦大學(Sorbonne)獲得博士學位,論文英文標題是《Connectionist Learning Models》「連接主義學習模型」。

論文的核心是建立了神經網絡中反向傳播算法的理論基礎。
而在當時,大多數人還在研究專家系統。

他怎么想到這個研究方向的?這又如何影響了他以后的職業發展?
在MIT演講中,Yann LeCun回顧了他如何踏上人工智能研究之路。

上大學時,他有點偶然地發現,原來早在50-60年代,包括1981年諾獎得主David H. Hubel和Torsten N. Wiesel等人,就已經開始思考「自組織」的問題——也就是系統如何自我組織學習。

這一方向后來催生了「機器可以學習」的早期想法。
他覺得這個想法特別迷人,而且當時他「初生牛犢不怕虎」——
我一直認為,生物學給工程提供了很多靈感。在自然界中,所有活著的東西都有適應能力,只要有神經系統就能學習。
所以,我當時想,也許我們人類沒那么聰明,構建智能系統最靠譜的方法,可能是讓它自己學會變聰明。
也許,正是這種「愣頭青」的心態讓他走上了機器學習這條路。
他坦言,當時「機器學習」不是AI研究的主流。
由于當時幾乎無人從事相關研究,他一度難以找到博士導師。
之后,他與Geoffrey Hinton合作,隨后進入貝爾實驗室Bell Labs與紐約大學NYU任職。
人工智能領域在1990至2000年代經歷「寒冬」,但2013年LeCun加入Facebook,創立FAIR(Facebook AI Research),并推動「深度學習」這一術語取代「神經網絡」,標志著產業界開始系統性地接受這一范式。

2018年,因在概念與工程領域的突破性貢獻,他讓深度神經網絡成為計算技術的關鍵組成部分,和Bengio、Hinton共享圖靈獎。
順便提一句,Yann LeCun訪問清華大學時,確定了自己的中文名「楊立昆」。

但這次,Yann LeCun直言:「LLM就是一條死胡同,世界模型才是正道」。
他指出,文本屬于「低帶寬」數據源,「僅靠文本訓練永遠無法實現人類水平智能」。真正的智能來源于高帶寬的感知輸入——視覺、聽覺、觸覺等多模態經驗,而非低維度的離散符號。
他將大語言模型訓練所需的數萬億標記詞元,與兒童處理的海量感官數據進行對比:
四歲兒童通過視覺接收的數據量,已相當于所有公開文本訓練的最大規模LLM的數據量。
他進一步指出,LLM有時雖能提供實用的結果,甚至讓人誤以為其「智商堪比博士」,但這些系統只是「回憶」訓練中的信息。

LeCun指出,大語言模型(LLM)存在本質瓶頸——雖然形式上通過「學習」取代了顯式編碼,但仍依賴人類知識的間接轉移。
LLM不具備任何真實意義上的智能——甚至不如一只貓。
他強調,即便貓的大腦僅含約2.8億個神經元,其對物理世界的理解與行動規劃能力仍遠超當前AI系統。
貓能感知三維空間、判斷物體穩定性、規劃復雜動作,而目前的所有生成式模型恰恰無法企及這些能力。
因此,他真正關注的問題是:如何讓機器學會物理世界的模型?
有點腦子的人,不再用LLM
世界模型,已成為LeCun的代名詞。
對談中,他再次給「世界模型」下了一個定義——
給到一個時刻t的世界狀態,再給定一個智能體可能的動作,預測動作執行后的環境。
就好比,讓一個機器人沖一杯咖啡,它需要想象一系列動作——拿起杯子、倒水、攪拌,并預測每一步的結果。

一旦系統配備了這樣的世界模型,就可以進行規劃:
設想一系列連續的動作,并利用模型預測這些動作所導致的結果。
同時,系統可結合一個「代價函數」(cost function),用于評估特定任務的完成情況。
在此基礎上,可運用優化方法,搜索能夠優化任務目標的最優動作序列,這一過程即為「規劃與最優控制」。
LeCun稱,團隊所采用的「環境動力學模型」完全通過自監督學習的,也是當前方法的核心所在。
實驗已證明,可以用世界狀態的表示——來自現有模型DINO,無論是從零開始學習,還是基于V-JEPA 2等框架,都可以做到這一點。
機器人不用針對特定任務反復訓練,只需從模擬數據或真實操作中學習「動作-結果」的關系,就能零樣本完成新任務。
這種訓練完全是自監督的。
當系統有足夠好的世界模型,便能「想象」如何完成一個它從未被訓練過的任務。

這一概念,在2016 NeurIPS大會主題演講中,LeCun早已向世界傳輸——
世界模型,會成為未來AI系統的關鍵組件。
LeCun預測,「未來3-5年內,這會成為AI架構的主流模型」。
這話可讓我在硅谷得罪了不少人,包括某些巨頭公司。
到那時候,但凡頭腦清醒的人,都不會再用現在這種生成式LLM的路子了。

主持緊接著問道,所以這能推動機器人技術,讓未來這十年真正成為機器人的時代?
LeCun直言不諱,過去幾年,打造「類人機器人」的初創公司如雨后春筍般涌現。
但行業的一大秘密是——它們還不知道如何讓機器人真正「聰明」到實用級別。
所以很多估值數十億公司的未來,基本上取決于是否能在「世界模型+規劃」的架構上取得顯著進展。
LeCun越說越激動,觀點顯然有些「生猛」。
主持人一聽,馬上話鋒一轉打了個圓場,「沒關系,我們不擔心那些公司。而且說真的,我們非常信奉創業精神」。
產業界在行動:機器人的世界模型
Yann LeCun的「冷靜」,與多位行業領袖所鼓吹的激進時間表形成了鮮明對比。
Figure AI表現得尤為激進,其CEO Brett Adcock近期宣稱:
明年就能實現通過語音指令,讓人形機器人在陌生環境(比如從未進入的家庭)完成各類通用工作。

這位創始人解釋稱,其信心源自公司對軟件與智能難題的攻關。
人形機器人擁有40個自由度(關節),可能產生的位姿組合數量甚至超過宇宙原子總數。
Brett Adcock強調「這個問題無法通過編程解決,唯一途徑是神經網絡」。
他將Figure的技術路徑與同行對比,直言某些公開演示只是「戲劇表演」或預設程序。相反,Figure機器人的所有操作都「由神經網絡驅動」。

耐人尋味的是,在一個關鍵問題上的判斷與Yann LeCun不謀而合:他也否認制造業是主要突破方向,并指出「人形機器人當前的競爭焦點在于誰能攻克通用機器人技術」。
雙方的核心分歧似乎在于——這個目標離我們究竟有多近。
與此同時,特斯拉正從另一個角度攻克難題。
馬斯克始終聚焦「極其艱巨」的制造挑戰,指出人形機器人規模量產「所需的供應鏈尚不存在」。

據報道,特斯拉正在建設年產百萬臺Optimus機器人的生產線,目標在2026年初推出具備「量產意向」的V3原型機。
然而專注制造并不意味特斯拉忽視AI難題。
在最近的計算機視覺頂會ICCV,特斯拉AI負責人Ashok Elluswamy詳細介紹了公司的「神經世界模擬器」——一個通過車隊視頻數據訓練的端到端系統。

不同于傳統模型根據狀態預測動作,神經世界模擬器能夠基于當前狀態與后續動作,直接合成未來狀態。
這種機制使得模擬器可與智能體或策略AI模型形成閉環連接,從而實現對系統性能的精準評估。

Elluswamy確認,這套被視作世界模型問題直接解決方案的架構,將「無縫遷移」至Optimus機器人。

Yann LeCun的論斷看似否定了整個人形機器人領域,但已有企業公開將其研發方向與他倡導的「世界模型」概念對齊。
獲得OpenAI投資的挪威公司1X Technologies,近期發布了自研「世界模型」。

傳送門:https://www.1x.tech/1x-world-model.pdf
如圖所示,1X世界模型包含視覺編碼器、動作編碼器、核心網絡,以及視頻與狀態價值解碼器。通過對成功標簽進行監督學習生成的狀態價值預測,可對輸入動作的質量進行量化評估。

1X世界模型的獨特優勢在于:允許從相同初始條件出發,并行部署不同策略進行直接對比。
1X團隊在現實部署方面的審慎態度與LeCun不謀而合。

首席執行官Bernt Børnich在播客中坦言,讓機器人進入家庭存在「理想與現實的落差」,指出「現實環境復雜得離譜」,甚至「Wi-Fi連接問題比機器人技術本身更棘手」。
這種務實立場,結合其輕量級肌腱驅動設計所帶來的安全性優勢,暗示著行業清醒認識到:Yann LeCun所說的「突破性進展」仍需要持續探索。
Yann LeCun的警告,最終重新定義了人形機器人競賽的維度:勝利者,或許不屬于推出最炫酷demo或設定最激進量產目標的廠商,而將屬于那個率先攻克機器理解物理世界這一根本性難題的探索者。
彩蛋:Llama與我無瓜
全程半小時演講中,還有一個大彩蛋。
meta血裁AI部門研究員掀全網風暴之外,LeCun卻一直對外撇清自己和Llama的關系。
幾天前,他曾表示,自己并未參與任何Llama項目。

這一次,LeCun在演講中再一次強調,「我并沒從技術層面上,參與Llama的項目」。

搞笑的是,主持人前一句還在夸「Llama的誕生讓世界AI民主化」,話音還沒落,LeCun就在旁邊急著插話——
我要坦白!

接著,他分享了幕后故事,「第一代Llama,其實有一點像『海盜』項目(pirate project),與官方LLM并行開發」。
大概2022年中后期,巴黎一個十來人的小組,決定做一個輕量高效的LLM,結果真做出來了。
沒想到,它后來成為了「主力選手」。
最后,在2023年初,小扎下定決心組建了一個GenAI團隊,也就如今的「超級智能實驗室」(MSL)的前身,主要就是為了把它產品化。
但在技術上,我個人確實沒怎么插手。

LeCun最后再一次重復——Llama與我無瓜,就差把它寫在臉上了。
現場,主持人再次圓話,「但最后能跑出來的,往往還是『臭鼬工廠』(Skunk Works)這種模式」。





京公網安備 11011402013531號