亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

上海AI Lab與浙大EagleLab推出RRVF,助力視覺推理新突破。

IP屬地 中國·北京 編輯:江紫萱 機器之心Pro 時間:2025-08-11 20:16:57



本本研究由上海AI Lab前沿探索中心石博天老師帶領的數據前沿團隊、浙江大學EagleLab和上海創智學院等單位聯合完成。第一作者陳楊是浙江大學碩士生,研究方向為多模態大模型和推理,本工作完成于她在上海AI Lab實習期間,實習所在團隊以Agent-Ready的知識為核心,實現「提取->結構化->推理」全鏈路,包括基于MLLM的文檔理解、基于異質圖網絡的多模態知識表征、自主終身學習智能體等。論文共同第一作者、通訊作者沈宇帆就職于上海AI Lab,正在全身心探索下一代 MLLM 學習范式和高效的多模態智能體。論文的共同通訊作者于智是浙江大學 EagleLab 副教授,曾任浙大 ACM 教練并執教獲世界總冠軍。功成身退之后,長期致力于用 AI 改善殘障人群生活,在信息無障礙和人工智能領域有深厚造詣。

一個任務有多容易被 AI 解決?最終可能只取決于一個簡單的問題:它的答案有多容易被驗證?

這,就是驗證非對稱性(Asymmetry of Verification)—— 一個古老但正在重塑 AI 未來的深刻原則。它的核心思想是:對很多任務而言,驗證一個解的好壞,遠比從頭創造一個解要容易得多

這一思想,正是近期從 OpenAI 跳槽至 meta 的思維鏈(CoT)開山作者 Jason Wei 在其最新博客中提出的「驗證者法則」(Verifier's Law)的基石。他斷言:「所有可能被解決且易于驗證的任務,都將被 AI 解決。」

為什么?因為一個任務如果具備客觀真理、可快速驗證、可規模化驗證、低噪音、連續獎勵等特性,就相當于為強化學習(RL)創造了一個完美的訓練場。AI 可以在這個場中進行海量的、高效率的「猜測 - 檢驗」(guess-and-check),通過不斷的迭代優化,最終逼近最優解。

而這一法則的最佳實踐,已經悄然出現在了多模態領域。上海AILAB和浙江大學EagleLab的最新研究RRVF(Reasoning-Rendering-Visual-Feedback),就完美詮釋了如何利用「驗證的非對稱性」來攻克復雜的視覺推理難題。



論文標題:Learning only with Images: Visual Reinforcement Learning with Reasoning,Rendering,and Visual Feedback論文地址:https://arxiv.org/pdf/2507.20766

RRVF:Image2code 的「驗證者法則」訓練場

在傳統 AI 訓練中,我們依賴昂貴的「圖像 - 文本」配對數據來教模型進行視覺推理。這不僅成本高昂,而且很多時候限制了 AI 的創造力,例如使用特定的 code 來訓練還原 image。



圖 1: RRVF vs 通用訓練方法,只需輸入圖片,利用推理、渲染、反饋進行強化學習

RRVF 框架則另辟蹊徑,它沒有去教模型「怎么做」,而是構建了一個讓模型可以自我驗證的環境。RRVF 的全稱是「Reasoning-Rendering-Visual-Feedback」(推理 - 渲染 - 視覺反饋),這三個詞精準地概括了其核心工作流。它構建了一個端到端優化的閉環系統,讓模型在「自我糾正」中學習。



圖2: RRVF框架圖

第一步:迭代式視覺推理 (Iterative Visual Reasoning)

面對一張目標圖像(如數據圖表),它會進行迭代式多輪思考。在每一輪,模型都會在 < think > 中先寫下自己的思考過程,然后調用外部工具進行渲染和獲取反饋,在后續輪次中根據反饋修正自己的代碼。



圖 3: 迭代視覺推理算法

第二步:視覺反饋 (Visual Feedback)

外部工具(如 Matplotlib 或 Playwright 瀏覽器)執行代碼后,會渲染生成圖片。此時,一個更強大的「視覺裁判」模型(論文中使用了 72B 的 Qwen2.5-VL)會介入,對比渲染圖和原圖,并生成定性的、結構化的自然語言反饋,例如:「圖表類型正確,但顏色不匹配」、「網頁布局基本正確,但缺少了一個按鈕」。這些反饋會作為新的輸入,指導模型進行下一輪的代碼修正。

第三步:視覺裁判 (Visual Judge) & 混合獎勵

在整個迭代過程結束后,模型會輸出最終的代碼。此時,「視覺裁判」會再次出場,但這次它扮演的是「法官」角色,給出一個定量的視覺相似度分數R_vision。但僅僅有視覺分是不夠的。為了讓模型學得更好,研究者設計了混合獎勵函數 (Hybrid Reward Design)視覺相似度獎勵 (R_vision):核心獎勵,分數越高獎勵越大。格式正確性獎勵 (R_format):代碼能否跑通?思考和工具調用的格式對不對?如果出錯,直接給予懲罰。工具使用獎勵 (R_tool):為了鼓勵模型探索和使用反饋循環,每次成功的工具調用都會獲得少量獎勵,直到模型表現得足夠好(視覺分超過 0.95)或達到最大次數。

這三個獎勵通過加權組合(R = w_v * R_vision + w_f * R_format + w_t * R_tool),構成最終的驅動力。

最后一步:GRPO 算法優化

有了精確的獎勵信號,如何高效地更新模型?RRVF 采用了GRPO(Group Relative Policy Optimization)算法。相比傳統的 PPO,GRPO 更高效,它不需要一個獨立的價值函數,而是通過對一組(論文中是 8 個)候選答案進行比較和打分,直接優化策略。

這個設計,完美地將一個復雜的「代碼生成」任務,轉化成了一個極易被驗證(視覺相似度)和優化(混合獎勵 + GRPO)的工程問題。



圖 4:迭代推理的 case,模型一步步學會如何準確重建一張餅圖

實驗結果:驗證的力量,讓 7B 模型超越 72B 老師

RRVF 的實驗結果,有力地證明了「驗證者法則」的力量。模型基于Qwen2.5-VL-7B進行訓練,并在圖表生成(ChartMimic, Plot2Code)和網頁生成(WebSight)三個數據集上進行了全面評測。







1. 性能碾壓:SFT 學的是「模仿」,RRVF 學的是「理解」

在 ChartMimic 上,傳統的監督微調(SFT)雖然有標準代碼答案,但執行率只有 69.00%。而 RRVF 在沒有任何代碼答案的情況下,代碼執行率達到了97.83%,在其他各項指標上均有明顯提升。這證明了 RRVF 真正理解了圖像的結構,而非死記硬背。

2. 「學生」超越「老師」:自學習效應的驚人體現

出乎意料的是,通過 RRVF 訓練的 7B 模型,最終的綜合得分(64.36)不僅遠超其基礎模型(38.17),甚至超越了在訓練中為它提供反饋和評分的、更強大的 72B 模型(47.30)。這證明 RRVF 不是簡單的知識蒸餾,而是讓模型在自我探索中發現了比「老師」更優的策略,實現了能力的「進化」。

3. 泛化能力:真學霸從不畏懼新考卷

為了考驗模型是否真的學到了通用能力,研究者在未訓練的 Plot2Code 數據集上進行了零樣本測試。結果顯示,SFT 模型性能急劇下降(例如執行率從 69% 暴跌至 49%),暴露出其「偏科」和「過擬合」的本質。

相比之下,RRVF 模型的執行率幾乎沒有衰減(例如執行率從 97.83% 穩定在 96.21%)。這強有力地證明,通過視覺反饋學習到的,是可遷移的、底層的視覺到代碼的生成邏輯。

這項研究是「驗證者法則」的一次響亮宣告。它告訴我們,未來 AI 發展的瓶頸,可能不在于模型本身有多大,而在于我們能否為 AI 想解決的任務,設計出足夠簡單、高效的「驗證環境」。

一旦我們學會了如何將復雜問題轉化為易于驗證的問題,那么正如 Jason Wei 所預言的,一個智能的「鋸齒狀前沿」將會出現:在所有可被清晰驗證的領域,AI 將展現出超乎想象的強大能力。

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

一区二区日韩视频| 国产欧美精品一区二区三区-老狼 国产欧美精品一区二区三区介绍 国产欧美精品一区二区 | 欧美尤物巨大精品爽| 性色av蜜臀av浪潮av老女人| 亚洲成人精品一区| japanese在线视频| 91美女福利视频| 国产精品12345| 黄色成人av在线| 性欧美一区二区| 在线成人中文字幕| 一卡二卡在线观看| 成人区精品一区二区| 成人一区二区三区视频| 日韩精品不卡| 欧亚洲嫩模精品一区三区| 五月婷婷六月丁香激情| 亚洲成人a级网| 国产精品久久久久久久免费看| 91在线网站视频| av不卡免费电影| 欧美一级片黄色| 亚洲欧美国产高清va在线播| 国产高清免费av| 欧美日韩日本网| 日本黑人久久| 日韩欧美第二区在线观看| 久久久久久久久综合| 欧美日韩成人在线| www.com久久久| 色婷婷综合久久久中文一区二区 | 午夜精品久久久久久久99樱桃| 能直接看的av| 成人性生交大片免费看视频直播| 久久免费美女视频| 2025国产精品自拍| 26uuu国产精品视频| 国产精品私房写真福利视频| 手机在线看福利| 日韩在线国产精品| 国产亚洲综合色| 亚洲精品理论片| 亚洲精品免费在线视频| 亚洲婷婷在线视频| 国产三级av片| 91免费国产精品| 中文日韩在线视频| 中文字幕精品一区| 中文字幕 国产| 欧美做暖暖视频| 91av免费观看91av精品在线| av动漫一区二区| 永久免费看片直接| 日韩精品在线中文字幕| 国产成人精品日本亚洲| 欧美一区二区三区成人| 91久色porny| 亚洲图片中文字幕| 一级特黄曰皮片视频| 蜜臀精品一区二区| 国产欧美在线看| 日韩欧美一区二区免费| 久久蜜桃av一区二区天堂| 日韩网红少妇无码视频香港| 好色先生视频污| 九色91av视频| 欧美一级一区二区| 岛国精品一区二区| a视频免费在线观看| 制服丝袜av在线| 正在播放亚洲| 91精品国产91久久久久福利| 亚洲国产欧美在线| www国产精品av| av免费观看在线| 国产一国产二国产三| 亚洲 高清 成人 动漫| 国产在线精品一区二区三区| 九九热最新视频//这里只有精品 | 久久精品国产亚洲av久| 日本高清不卡一区二区三| 日韩有码片在线观看| 欧美xfplay| 亚洲综合精品自拍| 日本一区免费视频| 国产成人综合在线| 天堂在线观看av| 中文字幕在线一| 伊人网伊人影院| 亚洲熟妇一区二区| 精品国产成人av在线免| 欧美一级免费播放| 久久一区免费| 久久久精品动漫| 国产伦精品一区二区三区照片91 | 波多野结衣先锋影音| 色狠狠av一区二区三区香蕉蜜桃| 天天影视涩香欲综合网| 色综合久久六月婷婷中文字幕| 在线精品视频一区二区三四| 欧美性高潮在线| 亚洲欧美国产视频| 国产欧美一区二区三区四区| 国模精品一区二区三区| 天天干天天色天天爽| 国产精品欧美激情在线观看| 国内成人自拍视频| 国产18精品乱码免费看| 欧美天堂在线视频| fc2成人免费人成在线观看播放| 奇米一区二区三区四区久久| 日本精品视频在线观看| 99三级在线| 欧美做暖暖视频| 性猛交ⅹ×××乱大交| 国产亚洲无码精品| 国产乱国产乱老熟| 香蕉视频成人在线| 久久久精品人体av艺术| 亚洲精品综合在线| 欧美精品xxxxbbbb| 久热精品视频在线观看| 国产拍精品一二三| 男女啪啪免费观看| 国产精品综合激情| 麻豆精品一区二区三区| 亚洲摸下面视频| 国产拍精品一二三| 秋霞在线一区二区| 色欲av无码一区二区三区| 国产精品成人免费在线| 亚洲色图清纯唯美| 综合亚洲深深色噜噜狠狠网站| 亚洲精品视频二区| 成人av在线亚洲| 91蝌蚪视频在线| 亚洲av激情无码专区在线播放| 日韩欧美中文一区二区| 国产成人亚洲欧美| 91视频在线免费| 午夜影院免费视频| 欧美在线小视频| 91久久精品一区| 成人性生交视频免费观看| 一区二区三区黄| 欧美日韩在线另类| 成人免费看片视频| 国产日韩欧美久久| 99视频国产精品免费观看a| 亚洲制服丝袜av| 91精品视频免费看| 欧美 日韩 国产 一区二区三区| 国产一区在线观看视频| 亚洲人成网7777777国产| 在线播放 亚洲| 国产精品乱码一区二区| 欧美日韩中文在线观看| 国产成人精品网站| 亚洲AV无码国产精品| 免费成人av资源网| 自拍偷拍亚洲精品| 免费观看精品视频| 男女性色大片免费观看一区二区| 欧美精品一区二区三区久久久| 日韩欧美在线一区二区| 中文字幕在线字幕中文| 中文字幕佐山爱一区二区免费| 国产不卡精品视男人的天堂| 五月天激情小说| 国产欧美日韩视频在线观看| 成人国产精品久久久久久亚洲| 国产无套内射又大又猛又粗又爽| 欧美日韩免费高清一区色橹橹 | 亚洲高清视频免费观看| 精品国产乱码久久久久久久| 国产传媒免费观看| 一区二区欧美国产| 久久国产成人精品国产成人亚洲| 91视频一区二区三区| 色伦专区97中文字幕| 免费成年人高清视频| 国产 日韩 欧美 综合| 欧美日韩精品一区视频| 成人在线国产精品| 东京热无码av男人的天堂| 亚洲一二三四久久| 亚洲午夜精品久久久中文影院av| 国产一区二区麻豆| 在线视频欧美日韩精品| 欧美亚洲另类视频| 少妇极品熟妇人妻无码| 亚洲国产精品黑人久久久| 开心色怡人综合网站| 国产香蕉在线观看| 欧美一级淫片aaaaaaa视频| 久久久久成人精品无码中文字幕| 亚洲精选视频在线| 久久久久一区二区三区| 性欧美8khd高清极品| 久久国产精品视频| 欧美熟妇激情一区二区三区| 国产福利视频一区二区三区| 色综合久久悠悠| 一区二区三区人妻| 国产精品久久久久永久免费观看| 99视频在线| 无码国精品一区二区免费蜜桃| 精品国产视频在线| 久久免费视频6| 欧美欧美欧美欧美| 九九久久久久久| 欧美色播在线播放| 免费黄色a级片| 欧美喷潮久久久xxxxx| 日批在线观看视频| 日韩av一区在线| 免费又黄又爽又色的视频| 久久精品最新地址| 国产精品久久久久久久一区二区| 日本国产一区二区三区| 日韩一区免费视频| 五码日韩精品一区二区三区视频| 国产精品女主播在线观看| 国产又大又长又粗又黄| 亚洲va韩国va欧美va精品| 欧美性生交xxxxx| 亚洲人成电影在线观看天堂色| 成人免费毛片视频| 亚洲一区二区三区sesese| 9色porny自拍视频一区二区| 亚洲精品偷拍视频| 亚洲成av人片| 国产亚洲小视频| 91免费版网站入口| av色综合久久天堂av综合| 日韩av手机版| 久久亚洲欧美日韩精品专区| 在线观看av大片| 精品日韩欧美| 亚洲理论在线观看| 欧美激情国产精品免费| 正在播放国产精品| 中国av一区二区三区| 国产一区二区三区四区hd| 国产精品嫩草影院桃色| 色视频一区二区三区| 午夜国产不卡在线观看视频| 精品国产www| 欧美亚洲日本一区| 国产探花在线视频| 国产精自产拍久久久久久蜜| 免费观看在线色综合| 天天操精品视频| 国产精品久久久久久久久久尿 | 综合网日日天干夜夜久久| 天天综合在线视频| 亚洲精品综合在线观看| 免费久久99精品国产自| 精品人妻一区二区三区三区四区| 精品一区二区三区电影| 国产美女精品人人做人人爽| 日韩av电影免费观看高清完整版| 国产三级漂亮女教师| 91av手机在线| 国产精品九九九| 97在线免费视频| 日韩精品高清在线| 国产三级av片| 成年丰满熟妇午夜免费视频| 亚洲欧美三级伦理| 久久众筹精品私拍模特| 久久高清无码视频| 大j8黑人w巨大888a片| 久久男人资源视频| 国产日产欧美一区二区三区| 久久久久久久久久成人| 992tv人人草| 久99久在线| 亚洲第一网中文字幕| 中文成人综合网| 99免费在线视频| 永久免费av无码网站性色av| 97人人模人人爽人人喊38tv| 亚洲日本欧美日韩高观看| 亚洲精品久久嫩草网站秘色| 99国产揄拍国产精品| 一区二区三区国产好的精华液| 国模极品一区二区三区| 精品国产伦一区二区三区免费| 国产精品欧美久久久久无广告| 天堂成人在线观看| 香蕉av一区二区三区| 免费看特级毛片| 尤物tv国产一区| 日韩欧美在线视频免费观看| 国产精品国产精品国产专区不蜜 | 国产女主播一区| 亚洲18女电影在线观看| 亚洲乱码精品一二三四区日韩在线| 国产91在线观看丝袜| 日韩激情在线观看| www.色呦呦| 性色av蜜臀av| www.热久久| 天堂av手机版| 男女性色大片免费观看一区二区| 日本不卡的三区四区五区| 久久久久久黄| 久久影院午夜论| 成人免费不卡视频| 91在线精品一区二区三区| 91美女片黄在线观看| 国产精品三级电影| 亚洲综合在线五月| 自拍偷拍亚洲欧美日韩| 一区二区三区免费| 色婷婷av一区二区三区软件| 欧美四级电影网| 日韩精品高清在线| 中文字幕亚洲欧美日韩高清| 久久亚洲欧美日韩精品专区| 欧美肥臀大乳一区二区免费视频| 精品国内产的精品视频在线观看| 亚洲天堂开心观看| 国模私拍一区二区三区| 国产精品直播网红| 国产欧美一区二区在线播放| 亚洲高清在线观看一区| 国产成人精品免费看在线播放 | 欧美哺乳videos| 91美女片黄在线观| 国产日韩视频在线观看| 精品久久久三级| av片中文字幕| 东方av正在进入| 蜜臀精品一区二区三区在线观看| 中文字幕免费不卡| 亚洲精品自产拍| 国产经品一区二区| 日本高清免费观看| 中文字幕精品一区二区精| 久久99精品久久久久久动态图 | 日日狠狠久久偷偷四色综合免费| 国产在线a不卡| 91黄色小网站| 精品国产成人亚洲午夜福利| 亚洲专区第一页| 国产婷婷色一区二区三区四区| 在线亚洲高清视频| 久久久在线观看| 福利在线小视频| 91麻豆精品久久毛片一级| 天堂8在线视频| 色香蕉久久蜜桃| 国产成人精品久久二区二区91| 裸体大乳女做爰69| 中文字幕在线观看二区| 日韩av不卡在线观看| 91激情五月电影| 羞羞色国产精品| 999香蕉视频| 国产美女激情视频| 久久久噜噜噜久久人人看| 亚洲精品电影网站| 麻豆精品视频| 日韩免费av一区| 成人午夜免费电影| 欧美一级片在线观看| 91传媒视频在线观看| 成人h动漫精品一区| 日日夜夜精品免费视频| 欧美艳星brazzers| 久久爱av电影| 欧美极品aaaaabbbbb| 久久精品亚洲国产奇米99| 精品中文字幕乱| 免费成人黄色大片| 国产毛片一区二区| 一区二区欧美在线| 男人揉女人奶房视频60分| 国产av精国产传媒| 色噜噜久久综合| 欧美亚洲国产免费| 久久精品国产亚洲av麻豆色欲| 中文字幕一区二区三区色视频| 2019中文字幕在线免费观看| 国产原创精品在线| 六月丁香婷婷久久| www.亚洲成人| 亚洲视频在线播放免费| 91麻豆成人久久精品二区三区| 久久久久久中文| 亚洲精品国产精品国自| 亚洲一区二区在线免费看| 国产精品免费一区二区三区在线观看 | 亚洲自拍欧美另类| 国产精品suv一区二区| 欧美午夜在线观看| 拔插拔插海外华人免费| 免播放器亚洲一区| 97久久精品人搡人人玩| 一级片黄色录像| 欧美日韩中文字幕一区二区| 欧美这里只有精品| 92国产精品观看| 国产亚洲欧美一区二区三区| 91成人国产综合久久精品| 日韩中文字幕在线免费观看| 国产精品久久久久久久av| 欧美精品日韩一区|