亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

北大新作EvoVLA:大幅降低機器人幻覺,長序列成功率暴漲10%

IP屬地 中國·北京 新智元 時間:2025-11-29 10:11:38


新智元報道

編輯:LRST

具身智能的「ChatGPT時刻」還沒到,機器人的「幻覺」卻先來了?在需要幾十步操作的長序列任務中,現有的VLA模型經常「假裝在干活」,誤以為任務完成。針對這一痛點,北京大學團隊提出自進化VLA框架EvoVLA。該模型利用Gemini生成「硬負樣本」進行對比學習,配合幾何探索與長程記憶,在復雜任務基準Discoverse-L上將成功率提升了10.2%,并將幻覺率從38.5%大幅降至14.8%。

具身智能(Embodied AI)正處于爆發前夜。

從谷歌的 RT-X 到開源社區的 OpenVLA,通才機器人策略(Generalist Robot Policies)展現出了驚人的零樣本泛化能力。然而,當我們將目光從簡單的「抓取-放置」轉向需要數十個步驟的長程操作任務(Long-horizon Manipulation)時,現有的 VLA 模型卻暴露出一個尷尬的致命弱點:

它們學會了「作弊」。

在長序列任務中,VLA模型經常會出現一種被稱為「階段性幻覺」(Stage Hallucination)的現象。

簡單來說,就是機器人「明明沒做完,卻以為自己做完了」。

例如,在搭建積木橋時,只要機械臂移動到了目標附近,即便方塊滑落、沒對齊或者根本沒夾住,基于視覺語言模型(VLM)的評估系統往往會因為視覺上的相似性("看起來像是在操作"),給出一個很高的預測分數。

這種「高分低能」的現象,導致機器人自信地跳過當前步驟進入下一階段,最終導致整個任務的崩潰。這就好比一個學生只寫了「解:」字,就以為自己做完了整道大題。

針對這一痛點,來自北京大學的研究團隊(第一作者:劉擇霆,楊子達,指導老師:唐浩,張澤宇)提出了一種全新的自監督VLA框架EvoVLA。


論文鏈接: https://arxiv.org/abs/2511.16166v1

項目主頁: https://aigeeksgroup.github.io/EvoVLA

代碼倉庫: https://github.com/AIGeeksGroup/EvoVLA

EvoVLA不僅在仿真環境中表現出色,更通過Sim2Real成功部署在真實機器人上,平均成功率達到54.6%,超越 OpenVLA-OFT 11.0個百分點。


EvoVLA框架總覽與核心任務展示(Block Bridge, Stack, Cup Stacking)

該項目由北京大學唐浩課題組完成,第一作者為劉擇霆,楊子達,張澤宇。

EvoVLA:AI教AI

讓模型在「自省」中進化

為了治好機器人的「白日夢」,EvoVLA在OpenVLA-OFT的架構之上,引入了三個協同工作的核心模塊,實現了一種自監督強化學習(SSRL)的閉環。

階段對齊獎勵(SAR):Gemini 老師的「錯題集」

這是EvoVLA解決幻覺問題的殺手锏。

傳統的獎勵函數往往很稀疏(只有成功/失敗),或者基于像素變化(容易被背景干擾)。

EvoVLA創造性地設計了一套數據引擎,利用強大的Gemini 2.5 Pro對演示視頻進行語義理解和切分,生成了包含70+個階段的詳細描述。

更絕的是,為了防止模型「走捷徑」,團隊引入了三元組對比學習,特別是構建了「硬負樣本」(Hard Negative)。

正樣本(Positive), 任務完成的準確描述(如「夾爪閉合且穩定抓取方塊」)。

負樣本(Negative), 明顯的失敗狀態。

硬負樣本(Hard Negative): 這是關鍵! 描述那些「差一點就成功」的狀態(如「夾爪在目標附近但未接觸」,或「抓住了錯誤的物體」)。


EvoVLA數據引擎,展示Gemini如何生成Positive, Negative和Hard Negative文本描述

通過這種方式,Gemini化身為「嚴厲的老師」,專門出這種易混淆的「陷阱題」給VLA模型做。模型被迫去學習區分「真正完成」和「看起來像完成」,從而獲得密集的、語義一致的內在獎勵信號。

基于姿態的物體探索(POE):告別像素干擾

機器人不僅要會判斷對錯,還要有探索未知的好奇心(Curiosity)。

傳統的內在好奇心獎勵通常基于像素預測誤差——即「如果我看到的畫面和預測的不一樣,我就很興奮」。

但在復雜的機器人場景中,影子的移動、光照的變化甚至背景的噪點都會帶來巨大的預測誤差,導致機器人像個好奇寶寶一樣去探索無意義的視覺噪聲。

EvoVLA提出了POE(Pose-based Object Exploration),訓練了一個輕量級的世界模型,不再預測圖像像素,而是預測相對幾何姿態(Gripper-Object Pose)。

這意味著機器人的好奇心被引導去探索「如何改變物體與夾爪的相對位置」(比如怎么旋轉、怎么靠近),而非「圖像像素變了多少」。

這使得探索過程極其高效,專注于操作任務本身的幾何結構。

長程記憶機制(Long-Horizon Memory)

面對幾十步的操作,機器人很容易「撿了芝麻丟了西瓜」。簡單的平均或截斷歷史信息會導致災難性遺忘。

EvoVLA并沒有簡單地壓縮歷史,而是采用了一種基于注意力的上下文選擇(Context Selection)機制。

它從歷史庫中檢索Top-K最相關的Token,并通過門控機制融合到當前狀態和獎勵中。

這就像人類在做復雜任務時,只回憶那些對當下決策有用的關鍵步驟(比如「剛才我已經拿到了A零件」),而不是事無巨細地回放整個人生錄像。

Discoverse-L:長程操作的新基準

為了驗證長程能力,團隊并沒有滿足于簡單的已有任務,而是提出了Discoverse-L基準測試,包含三個難度遞增的任務:

1. Stack(堆疊): 18個階段,不僅要疊高,還要精確對齊。

2. Jujube-Cup(紅棗入杯): 19個階段,涉及多物體交互。

3. Block Bridge(搭橋): 74個階段! 需要放置兩個橋墩并填充中間,極其考驗長期規劃和穩定性。

實驗結果:SOTA級的提升

實驗在仿真環境和真機上雙線進行,結果令人振奮。

仿真環境碾壓

在Discoverse-L基準上,EvoVLA 擊敗了包括Octo、OpenVLA、在內的一眾強基準。

成功率:平均達到69.2%(相比最強基準OpenVLA-OFT的59.0%提升了10.2%)。

樣本效率:達到50%成功率所需的訓練步數減少了1.5倍。

幻覺消除:階段幻覺率(HR)從38.5% 大幅降至14.8%。


EvoVLA在三個任務上對比OpenVLA等基線的成功率提升

Sim2Real真機泛化

在AIRBOT-Play機器人上的部署更加令人印象深刻,EvoVLA展示了極強的Sim2Real泛化能力。


特別是在一個從未見過的「堆疊+插入」(Stack with Insertion)任務中,通過少量的真機微調,EvoVLA達到了55.2%的成功率,比OpenVLA-OFT高出13.4%,甚至比最新的架構高出16.9%


機器人實際操作Block Bridge或Stack的過程

定性分析顯示,基準模型經常在接觸方塊前就過早張開夾爪(幻覺導致),而EvoVLA則能精準地等到接觸后才進行操作,動作極其穩定,仿佛真的「看懂」了任務。

結語

EvoVLA的出現,為解決VLA模型在長程任務中的可靠性問題提供了一個優雅的解法。

它證明了:更好的獎勵設計(SAR)+ 更本質的探索機制(POE)+ 更聰明的記憶(Memory),可以讓大模型在具身智能領域走得更遠。

這種利用大語言模型(Gemini)來生成「錯題集」從而反哺策略學習的「自我進化」范式,或許正是通往通用機器人自主學習的關鍵一步。

作者信息

劉擇霆是青島大學自動化學院控制工程在讀碩士,師從葛樹志院士(新加坡工程院院士)。研究方向聚焦于具身智能、RL4VLA、端側VLA模型。曾參與多項科研項目,致力于構建通用機器人操作基礎模型。

楊子達是北京大學光華管理學院管理科學與信息系統系在讀博士,專注于推動"可解釋的跨模態和具身智能"前沿研究。研究方向聚焦于具身智能、RL4VLA、3D導航、VLA模型的結構化推理與多模態認知計算,致力于構建兼具高層語義理解與底層精細控制的通用智能體框架。研究成果已應用于真實四足機器人與多模態情感分析系統。期待與同行共同探索下一代智能體的認知架構與工程實踐。

張澤宇是Richard Hartley教授和Ian Reid教授指導的本科研究員。他的研究興趣扎根于計算機視覺領域,專注于探索幾何生成建模與前沿基礎模型之間的潛在聯系。張澤宇在多個研究領域擁有豐富的經驗,積極探索人工智能基礎和應用領域的前沿進展。

唐浩現任北京大學計算機學院助理教授 / 研究員、博士生導師、博雅和未名青年學者,入選國家級海外高水平人才計劃。曾獲國家優秀自費留學生獎學金,連續三年入選斯坦福大學全球前2%頂尖科學家榜單。他曾在美國卡耐基梅隆大學、蘇黎世聯邦理工學院、英國牛津大學和意大利特倫托大學工作和學習。長期致力于人工智能領域的研究,在國際頂級期刊與會議發表論文 100 余篇,相關成果被引用超過12000次。曾獲ACM Multimedia最佳論文提名獎,現任ICLR 2026、ACL 2025、EMNLP 2025、ACM MM 2025領域主席及多個人工智能會議和期刊審稿人。更多信息參見個人主頁: https://ha0tang.github.io/

參考資料:

[1] Liu Z, Yang Z, Zhang Z, et al. EvoVLA: Self-Evolving Vision-Language-Action Model[J]. arXiv preprint arXiv:2511.16166, 2025.

[2] Kim, M. J., et al. "OpenVLA: An open-source vision-language-action model". CoRL, 2025

秒追ASI

?點贊、轉發、在看一鍵三連?

點亮星標,鎖定新智元極速推送!

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

色播五月激情综合网| 国产精品网友自拍| 鬼打鬼之黄金道士1992林正英| 蜜桃视频在线一区| 黄色网zhan| 日韩一区日韩二区| av免费观看不卡| 精品一区精品二区| 伊人免费在线观看| 国产欧美日韩视频一区二区三区| 久久伊人中文字幕| 日韩成人精品视频在线观看| 精品成人一区二区| 五月婷婷激情视频| 99久久精品免费看国产四区| 久久色视频免费观看| 尤物国产在线观看| 精品爽片免费看久久| 一区二区视频网| 久久精品一二三区| 一区二区三区不卡视频| 精品成人av一区二区三区| 日韩性xxxx爱| 久久久久久久欧美精品| 国产资源在线免费观看| 欧美日韩国产成人在线91| 久久久一二三区| 国产专区精品视频| 国产欧美视频一区二区三区| 美女又黄又免费的视频| 久久精品一偷一偷国产| 蜜臀精品久久久久久蜜臀| 少妇人妻在线视频| 欧美精品一区二| 97人妻精品一区二区三区| 日韩国产伦理| 欧洲生活片亚洲生活在线观看| 欧美黑人一级片| 成人激情在线播放| 国产精品电影院| 天天操天天干天天操天天干| 人人爽久久涩噜噜噜网站| 91伊人久久大香线蕉| 制服丝袜在线第一页| 欧美黑人视频一区| 丁香一区二区三区| 激情av中文字幕| 欧美激情手机在线视频| 国产成人在线影院| 国产清纯白嫩初高中在线观看性色| 久久影院资源网| 国产经典欧美精品| 亚洲成年人av| 午夜精品久久久久久久99黑人| 99国产精品久久久久| 800av在线播放| 欧美一乱一性一交一视频| 91麻豆国产自产在线观看| 一起草在线视频| 日韩免费黄色av| 欧美国产日韩精品免费观看| 日韩av毛片在线观看| 91在线视频导航| 亚洲午夜激情av| www.国产高清| 亚洲一区二区在线免费观看| 欧美一级高清片在线观看| 精品人妻一区二区三区四区不卡| 日本熟妇人妻xxxx| 亚洲一级免费视频| 国产福利精品一区二区| 在线视频 日韩| 国产精品一久久香蕉国产线看观看| 亚洲视频一区在线| 日本一级淫片免费放| 色噜噜狠狠色综合网| 日韩一区二区在线看片| 久久精品麻豆| 91丨porny丨九色| 欧美一区二区三区四区在线| 亚洲欧美日韩电影| 亚洲s码欧洲m码国产av| 日韩精品一区二区三区四| 尤物九九久久国产精品的分类| 国产黄色成人av| 亚洲国产精品成人综合久久久| 成人黄色av网| 色8久久人人97超碰香蕉987| 99在线观看精品视频| 50路60路老熟妇啪啪| 欧美极品欧美精品欧美视频| 亚洲欧洲在线观看av| 国产精品男女视频| 日韩国产一级片| 久久综合久久美利坚合众国| 欧美国产日韩在线观看| 五月婷婷色丁香| 国内精品在线观看视频| 欧美大片免费观看| 亚洲视频香蕉人妖| 亚洲无码久久久久久久| 91看片就是不一样| 国产成人精品国内自产拍免费看| 午夜天堂影视香蕉久久| 亚洲精品一区二区三区蜜桃| 超级砰砰砰97免费观看最新一期| 国产中文字幕亚洲| 9191精品国产综合久久久久久| 日本女人一区二区三区| 中文字幕国产专区| 日本一区二区三区免费看| 亚洲欧美在线免费| 中文字幕欧美激情| 自拍偷拍精品视频| 精品国产一区二区三区忘忧草| 91亚洲一线产区二线产区| 96pao国产成视频永久免费| 欧美精品第1页| 激情综合网天天干| 欧美日韩午夜视频| 97超碰在线人人| 欧美一二三视频| 一本大道久久a久久精二百| 日韩精品欧美精品| 欧美88888| 精品免费久久久久久久| 午夜免费久久久久| 日韩欧美在线看| 精品亚洲porn| 妺妺窝人体色www婷婷| 男人添女荫道口图片| 热99久久精品| 精品蜜桃在线看| 久久久美女艺术照精彩视频福利播放| 黄色一区二区视频| 久久久老熟女一区二区三区91| 欧美日韩在线高清| 欧美极品少妇xxxxx| 欧美中文字幕不卡| 成人动漫一区二区在线| 国产又粗又猛又黄视频| 亚洲成a人无码| 亚洲国产日韩综合一区| 国精产品一区一区三区有限在线| 欧美图片一区二区三区| 成人国产精品免费| 亚洲资源在线播放| 久久精品国产亚洲av麻豆| 少妇一晚三次一区二区三区| 国产女精品视频网站免费| 亚洲精品在线看| 午夜精品久久久久久不卡8050| 国产呦萝稀缺另类资源| 中文字幕手机在线视频| av网站有哪些| 国产av国片精品| 97免费资源站| 欧美成人小视频| 欧美精品vⅰdeose4hd| 欧美国产在线观看| 久久男女视频| 国产亚洲精品成人| 韩国三级与黑人| 欧洲美女和动交zoz0z| 91香蕉国产在线观看| 精品国产一区二区三区久久久狼| 欧美天堂一区二区三区| 国产精品热久久久久夜色精品三区 | 中文字幕电影一区| 日韩高清在线不卡| 国产又粗又猛又黄视频| 成人黄色短视频| 国产色视频在线播放| 亚洲v欧美v另类v综合v日韩v| 国产成人在线亚洲欧美| 国产一区二区av| 欧美三片在线视频观看| 亚洲日本在线天堂| 成人美女在线视频| 欧美一级做性受免费大片免费| 精品视频久久久久| 国产老熟女伦老熟妇露脸| 欧美日韩在线中文| 亚洲日本精品| 丁香五月网久久综合| 91禁外国网站| 爽爽爽爽爽爽爽成人免费观看| 91精品国产乱| 五月婷婷另类国产| 中文字幕乱码日本亚洲一区二区 | 欧美多人爱爱视频网站| 亚洲激情视频在线观看| 欧美综合视频在线观看| 伊人色综合久久天天| 97久久精品人人澡人人爽| 日韩精品一二区| 99热这里只有精品在线| 精品国产乱子伦| 1024手机在线视频| 亚洲AV无码成人精品区明星换面 | 日韩中文字幕不卡视频| 日韩欧美激情在线| 91久久奴性调教| 亚洲国产另类av| 国产精品久久久久久久久免费相片 | 91精品国产综合久久久久久丝袜| 26uuu另类亚洲欧美日本老年| xxx欧美精品| 亚洲精品xxx| 日韩欧美成人午夜| 欧美日韩不卡在线| 91久久精品网| 欧美日韩国产页| 中文字幕人成不卡一区| 国产性色一区二区| av电影天堂一区二区在线观看| 国产美女娇喘av呻吟久久| 日韩av在线发布| 亚洲欧洲国产综合| 欧美 日韩 国产 在线| 99国产成人精品| 在线免费观看av片| 最近中文字幕av| 波多野结衣电车痴汉| 亚洲第一在线播放| 国产三级av片| 国产 日韩 欧美 在线| 99久在线精品99re8热| 日韩三级小视频| 国产午夜精品无码一区二区| 国产一级片免费| 国产精品自拍视频一区| jizz国产免费| 精品深夜av无码一区二区老年| 精品人妻在线播放| 一级免费在线观看| 中文字幕精品三级久久久 | 国产在线播放一区三区四| 青娱乐精品在线视频| 日韩主播视频在线| 奇米777欧美一区二区| 全部av―极品视觉盛宴亚洲| 麻豆国产精品官网| 韩国av一区二区| 国产精品1024久久| 99精品欧美一区二区三区综合在线| 99久久99久久精品免费观看| 99精品在线免费| 久久久久亚洲蜜桃| |精品福利一区二区三区| 亚洲丝袜精品丝袜在线| 舔着乳尖日韩一区| 在线观看日韩毛片| 91精品国产综合久久久久久久| 精品人在线二区三区| 日韩av一卡二卡| 在线精品国产欧美| 欧美肥婆姓交大片| 日韩美女免费视频| 国产精品视频网| 91视频在线免费观看| 日本视频一区二区在线观看| 日本高清xxxx| 国产成人精品无码播放| 亚洲午夜精品在线观看| 久久久久久久毛片| 久久精品人妻一区二区三区| 免费看av在线| 亚洲 美腿 欧美 偷拍| 狠狠色丁香久久婷婷综| 久久麻豆一区二区| 亚洲午夜精品网| 欧美精品久久一区二区三区 | 国产精品一区二区久久精品 | 国产美女免费视频| 高清毛片aaaaaaaaa片| 久久99精品国产麻豆不卡| 97久久超碰国产精品| 亚洲精品日日夜夜| 欧美在线观看视频在线| 精品国产乱码久久久久久牛牛| 中文字幕一精品亚洲无线一区| 国色天香2019中文字幕在线观看| 成人免费视频网| 亚洲精品一区二区三| 茄子视频成人免费观看| 污污免费在线观看| 久久久久性色av无码一区二区| 97超碰资源站| 极品少妇一区二区三区精品视频 | 韩国精品久久久| 国产亚洲成年网址在线观看| 红桃视频成人在线观看| 日韩精品专区在线影院观看| 精品国产一区二区三区久久久狼| 国产精品美女在线| 日本一区二区精品视频| 人妻无码视频一区二区三区| 黄色性生活一级片| 97久久久久久久| 久久亚洲欧洲| 国产人成亚洲第一网站在线播放 | 久久亚洲风情| 久久色视频免费观看| 91成人在线免费观看| 亚洲一区二区福利| 国产精品久久一区| 久久久一二三四| 26uuu国产| 可以免费看的av毛片| 日本午夜一区二区| 中文字幕永久在线不卡| 91精品国产91综合久久蜜臀| 欧美精品一区二区免费| 国产欧美在线一区二区| 久久无码高潮喷水| 亚洲一级片在线播放| 国产免费av电影| 成人av在线资源| 色诱亚洲精品久久久久久| 在线观看视频99| 91原创国产| 浮妇高潮喷白浆视频| 五月婷六月丁香| 超碰福利在线观看| 久久久久国产精品免费免费搜索| 欧美在线一二三| 九色精品免费永久在线| 免费中文日韩| 999久久久精品视频| 一级免费在线观看| 国产乱码字幕精品高清av| 精品成人乱色一区二区| 精品国产欧美一区二区五十路| 精品欧美国产| 亚洲免费999| 国产黄色片视频| 韩国av一区二区三区四区| 色综合咪咪久久| 久久中文字幕在线| 欧美另类网站| 波多野结衣办公室双飞| 亚洲永久精品视频| 欧美韩国日本一区| 亚洲欧美日韩国产成人| 国产精品欧美久久| 91蝌蚪视频在线| a片在线免费观看| 26uuu久久天堂性欧美| 日韩精品资源二区在线| 国产欧美一区二区三区久久人妖| 少妇无码av无码专区在线观看 | 免费看日b视频| 日韩欧美黄色网址| 日本不卡不码高清免费观看| 欧美日韩精品中文字幕| 欧美精品国产精品日韩精品| 精品一区二区成人免费视频 | 老司机av福利| 阿v天堂2014| 蜜桃精品在线观看| 欧美视频三区在线播放| 国产精品激情av电影在线观看| 欧美 国产 综合| 亚洲精品午夜久久久久久久| gogo大胆日本视频一区| 精品国产一区二区亚洲人成毛片| 成人在线资源网址| wwwxx日本| 人妻偷人精品一区二区三区| 欧美日韩在线视频首页| 欧美最猛性xxxx| 99视频在线免费| 中文字幕观看在线| 亚洲人成网站在线| 欧美激情网友自拍| 日本少妇高潮喷水视频| av一级在线观看| 成人欧美一区二区三区白人| 欧美wwwxxxx| www.av毛片| 国产又粗又猛又黄视频| 亚洲欧美日韩国产一区二区三区| 久久99精品久久久久久噜噜| 成人午夜精品久久久久久久蜜臀| 毛片在线免费视频| 国产精品久久久久久久久动漫 | 性欧美xxxx视频在线观看| 浮妇高潮喷白浆视频| 欧美一区免费看| 亚洲日韩欧美一区二区在线| 91精品国产成人| 午夜免费看视频| www国产一区| 欧美在线一区二区| 懂色中文一区二区三区在线视频| 亚洲人成人无码网www国产| 国内国产精品久久| 日韩精品在线看| 日韩中文字幕亚洲精品欧美| 日日摸天天添天天添破| 18涩涩午夜精品.www| 欧美亚洲成人网| 日本女人黄色片| 久色婷婷小香蕉久久| 亚洲免费高清视频| 欧美 日韩 亚洲 一区| 国产强伦人妻毛片| 欧美视频日韩视频| 四虎一区二区|