亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

大模型無法真正理解視頻,GPT-4o正確率僅36%,南洋理工大團隊提出新基準

IP屬地 中國·北京 編輯:江紫萱 時間:2025-08-01 20:24:09

Video-TT團隊 投稿

量子位 | 公眾號 QbitAI

視頻大型語言模型(Video LLMs)的發展日新月異,它們似乎能夠精準描述視頻內容、準確的回答相關問題,展現出足以亂真的人類級理解力。

但有一個非常本質的問題始終縈繞著研究者的心頭:這些模型是真的“理解”了視頻,還是僅僅在進行一種高級的“模式匹配”?

為了解決上述問題,來自南洋理工大學S-Lab的研究者們提出了一個全新的、極具挑戰性的基準測試——Video Thinking Test(簡稱Video-TT)

其核心目標簡單而深刻:將“看”與“想”的能力分離,精準測量AI在視頻內容上的真實理解和推理水平。

研究團隊有三項關鍵發現:

(1)人類在視頻理解的“準確率”和“魯棒性”上遠超SOTA級模型(50%),差距顯著。

(2)開源模型在“魯棒性”上遠遜GPT-4o(SOTA模型之一)。

(3)GPT-4o的短板在于:對模糊或非常規內容識別能力弱;對多場景區分、定位、計算能力有困難;世界知識對應能力欠缺,無法理解意圖、社會動態等深層信息。

Video-TT圖靈測試集由南洋理工大學S-Lab科研團隊聯合獨立研究員共同研發完成。主要作者包括南洋理工大學博士生張元瀚、董宇昊,二人的研究方向聚焦多模態模型;通訊作者為南洋理工大學助理教授劉子緯。

Video-TT的問題定位

人類的智慧核心在于其正確性(Correctness)魯棒性(Robustness)

正確性意味著我們能準確地解讀信息,而魯棒性則保證了我們在面對信息干擾、歧義或不同表述時,依然能保持正確的判斷。這兩者結合,才構成了真正可靠的理解能力。

現有的視頻理解基準測試(Benchmark)在衡量AI是否達到人類級智慧上存在著一些根本性的缺陷。它們往往無法區分模型是因為“沒看清”而犯錯(即關鍵視頻幀采樣不足),還是因為“沒想明白”而出錯(即缺乏真正的推理能力)。

這種混淆使得我們很難評估AI在視頻理解上的真實水平。

在Video-TT出現之前,視頻理解領域已有相應的評測標準,但這些標準普遍存在一定局限性,導致AI的真實能力無法被準確衡量。

問題一:長視頻評測的“幀采樣悖論”

近期,許多研究都聚焦于長視頻理解。然而由于計算資源限制,模型無法處理視頻的每一幀,只能“跳著看”(稀疏采樣)。

這就帶來一個問題:當模型答錯時,我們無法確定是它能力不行,還是運氣不好,恰好錯過了包含答案的關鍵幀。

如下圖所示,在一些長視頻評測中(如VideoMME-Long),即便是強大的GPT-4o,其性能也可能因為采樣幀數的限制而大幅下降。這種下降反映的更多是“采樣策略”的失敗,而非“理解能力”的不足。

問題二:短視頻評測的“天花板幻覺”

與長視頻相對,短視頻評測(如VideoMME-Short)由于時長較短,模型可以幾乎“看完”所有幀。在這種情況下,一些頂尖模型的表現接近甚至達到了人類水平(上圖左側),這容易給人一種“短視頻理解問題已被基本解決”的錯覺。

然而,事實遠非如此。Video-TT的研究者們認為,即便在信息密集的短視頻中,依然存在大量需要深度推理和復雜認知才能解決的挑戰。簡單地提升準確率分數,并不能證明AI擁有了與人類同等的智慧。

Video-TT的破局創新點在于,它選擇了1000條全新的YouTube短視頻(避免數據污染),并精心設計問題的標注,確保答案能在有限的、統一的80幀內找到。

這樣一來,所有模型都在同一起跑線上“看”素材,評測的焦點便從“如何有效采樣”轉移到了“能否深刻理解”上,從而撥開迷霧,直擊AI的“思考”核心。

突出“思考”能力的問題設計

要衡量“思考”,就必須提出能夠激發“思考”的問題。Video-TT的設計原則是,一個復雜的問題并非由其類型決定(如“物體顏色”vs“情節理解”),而是由其背后的上下文、原因和場景決定。

研究團隊從“認知科學”和“影視敘事學”中汲取靈感,構建了兩個核心的復雜性維度:視覺復雜度和敘事復雜度。

維度一:視覺復雜度(Visual Complexity)

這部分關注的是視頻畫面的內在挑戰,共包含四個方面:

模糊與非常規內容(Unclear&Unusual Content)

視頻中是否存在干擾、模糊、遮擋,或者出現了與我們日常認知相悖的物體或現象?

運動速度(Movement Speed)

物體或鏡頭的移動是否過快,導致難以識別或追蹤?

時空布局(Spatial-temporal Arrangement)

場景中物體的位置關系和互動是否復雜?是否存在大量的時空信息需要處理?

視錯覺(Illusions)

視頻是否利用了拍攝技巧或內容本身來制造錯覺,挑戰觀眾的直覺?

維度二:敘事復雜度(Narrative Complexity)

這部分關注的是視頻作為一種“故事”的表達方式,其內在的邏輯和深度,同樣包含四個方面:

復雜情節(Complex Plot)

故事線是否存在反轉或意想不到的結局?

敘事剪輯(Narrative Editing)

是否使用了蒙太奇等復雜的剪輯手法來講述故事,而非平鋪直敘?

技術性剪輯(Technical Editing)

是否存在難以察覺的、與內容融為一體的特效或后期處理?

世界知識(World Knowledge)

理解視頻是否需要依賴超越畫面本身的世界常識、文化背景或社會規范?

例如,上圖中的Q-8提問“視頻中的女士在模仿什么行為?”,這需要觀眾擁有關于“特定活動”(被子彈擊中后倒下)的世界知識才能正確回答。這些問題迫使模型超越簡單的物體識別,進入真正的推理(Reasoning)層面。

AI思考的“魯棒”檢驗

擁有了能讓AI“思考”的難題還不夠,我們還需要知道它的思考有多“魯棒”(Robustness)。一個魯棒的模型,不應該因為用戶表述的方法稍有改變就給出截然不同的答案。

為此,Video-TT為每一個核心難題(Primary Question)都配備了四種“自然對抗性問題”(Natural Adversarial Questions),形成一套完整的測試體系。

這五種問題類型分別是:

核心問題(Primary Open

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

全站最新
久久精品第一页| 亚洲va电影大全| 97视频中文字幕| 综合视频在线观看| 美女一区二区三区视频| 中文字幕一区二区三区人妻电影| 国产大片中文字幕| wwwav网站| 国内一区二区在线| 国产精品盗摄一区二区三区| 欧美在线视频你懂得| 亚洲欧美日韩成人| 日韩av电影院| 日本一区二区三区视频在线观看| 91看片就是不一样| 中文字幕第20页| 三级网站在线播放| 日av在线不卡| 国产精品视频线看| 欧美日本一道本| 久久久精品2019中文字幕神马| 国产欧美精品一区二区| 香蕉精品视频在线| 青娱乐国产精品视频| 欧美人与禽zozzo禽性配| www夜片内射视频日韩精品成人| 国产高清精品在线| 亚洲成人免费av| 日韩大片免费观看视频播放| 日本久久久久亚洲中字幕| 日本高清不卡一区二区三| 国产精品第12页| 日本视频在线免费| 国产激情无套内精对白视频| 99久久免费视频.com| 色哟哟欧美精品| 日韩在线不卡视频| 国产乱码精品一区二区三区不卡| 国内自拍在线观看| 韩国三级hd中文字幕| 国产又粗又黄又爽视频| 成人av在线资源网| 欧洲亚洲国产日韩| 欧美乱人伦中文字幕在线| 国产在线精品一区二区三区》| 欧美日韩在线不卡视频| 欧美激情精品久久久久久免费| 亚洲精品18在线观看| 久久久99免费| 日韩欧美一区二区三区在线| 欧美亚洲第一区| 一级二级三级欧美| 日韩成人av一区二区| 做爰视频毛片视频| www.久久久久久久久| 精品视频全国免费看| 久久69精品久久久久久久电影好 | 欧美一级在线观看| 5278欧美一区二区三区| www亚洲国产| 波多野结衣办公室33分钟| 中文字幕制服诱惑| 久久久久久久久免费| 欧美一区二区三区公司| 国产999精品久久久| 97在线免费视频观看| b站大片免费直播| 99久久国产热无码精品免费| 国产三级久久久| 亚洲国产精品美女| 91最新在线免费观看| 日本熟妇人妻中出| 久久r这里只有精品| 日本va欧美va瓶| 午夜av一区二区| 欧美成人黄色小视频| 欧美最大成人综合网| 91精品啪在线观看国产| 国产男男gay体育生网站| 国产欧美一区在线| 亚洲精品视频久久| 国内视频一区二区| 中文字幕99页| 国产成人精品a视频| 国产精品久久久久久久岛一牛影视 | 日本丶国产丶欧美色综合| 国内精品久久久久久久| 欧美交换配乱吟粗大25p| 亚洲色图27p| 久久国产综合精品| 欧美三级午夜理伦三级中视频| 奇米4444一区二区三区| www在线观看免费| av资源吧首页| 成人免费黄色大片| 日韩欧美综合在线| 亚洲在线视频福利| 三日本三级少妇三级99| 亚洲一区二区天堂| 综合自拍亚洲综合图不卡区| 日韩一级黄色av| 一区二区三区视频| 羞羞在线观看视频| 国产一区二区三区免费观看| 欧美一区二区在线免费观看| 91久久精品国产| 天天久久综合网| 99热这里只有精品5| 亚洲激情五月婷婷| 久久久久久久网站| 国产午夜大地久久| 欧美一区二区三区网站| 日本一区二区成人在线| 最新日韩中文字幕| 一道本在线观看视频| 在线观看成人毛片| 97se亚洲国产综合自在线观| 日韩电影中文字幕av| 欧美日韩最好看的视频| 国产三级短视频| 国产美女视频一区| 亚洲精品一区二区三区蜜桃下载| 国产一区二区三区四区五区加勒比 | 精品1卡二卡三卡四卡老狼| 手机在线不卡av| 日本久久电影网| 国产美女扒开尿口久久久| 尤物国产在线观看| www.av网站| 欧美日韩中文在线| 国产精品视频精品视频| 亚洲日本黄色片| 欧洲精品久久一区二区| 欧美专区在线观看一区| 91在线视频一区| 午夜av免费看| 久久精品国产亚洲一区二区三区| 日韩一级高清毛片| 久久久久久国产精品一区| 日韩一级片在线免费观看| 国产经典欧美精品| 亚洲另类激情图| 国产高清免费在线| 国产香蕉视频在线| 中文字幕欧美一区| 97婷婷涩涩精品一区| 日韩福利视频在线| 亚洲精品国产精品国| 欧美午夜影院一区| 1卡2卡3卡精品视频| 在线免费观看日韩av| 国产剧情av麻豆香蕉精品| 日韩二区三区在线| 艳母动漫在线免费观看| av中文在线播放| 日韩理论片一区二区| 97在线日本国产| 在线看免费毛片| 久久免费高清| 日韩精品一区二区三区蜜臀| 日韩欧美亚洲区| 国产一级久久久| 中文字幕日本不卡| 日韩男女性生活视频| avtt中文字幕| 精品一区二区三区的国产在线播放 | 日韩一区免费观看| 国产一级视频在线观看| 日韩毛片精品高清免费| 国产成人精品久久二区二区91| 免费看91视频| 国产一区二区三区香蕉| 亚洲午夜国产成人av电影男同| 国产青草视频在线观看| 一本色道久久综合亚洲| 在线观看欧美日本| 久久国产一区| 国产亚洲欧美精品久久久久久 | 中文字幕一区二区三区免费看| 欧美日韩精品中文字幕| 99久久精品无码一区二区毛片 | 国产一线在线观看| 国产一区视频在线看| 揄拍成人国产精品视频| 欧美黄网站在线观看| 黄色成人一级片| 精品处破学生在线二十三| 中文字幕一区综合| wwwwww在线观看| 欧美综合欧美视频| 日本在线视频不卡| 台湾佬中文在线| 一本大道久久a久久综合| 精品国产乱码久久久久久久软件 | 精品性高朝久久久久久久| av在线免费观看国产| 国产美女免费视频| 欧美一区中文字幕| 亚洲啊啊啊啊啊| 99热这里精品| 精品国产91亚洲一区二区三区婷婷| 亚洲啊啊啊啊啊| 精品国产av一区二区三区| 日韩丝袜情趣美女图片| 成人手机视频在线| 91丨porny丨在线中文 | 2019中文字幕免费视频| 一本色道久久hezyo无码| 国产99久久久国产精品潘金| 欧美黑人又粗大| 美女黄色一级视频| 91网站在线播放| 欧美一区深夜视频| 双性尿奴穿贞c带憋尿| 日本一区二区综合亚洲| 国产精品免费视频久久久| 国产亚洲精品精品精品| 亚洲日本在线观看| 99国产在线视频| 国产精品不卡av| 欧美性猛交xxxx免费看| 日韩av不卡在线播放| 中文字幕制服诱惑| 精品久久一二三区| av黄色在线网站| 日本午夜一区二区| 俺去亚洲欧洲欧美日韩| 91av免费观看| 91一区二区三区在线观看| 日韩美女免费线视频| 亚洲欧美综合7777色婷婷| 一区二区三区欧美在线观看| 精品久久久久久亚洲| 无码日韩精品一区二区| 欧美日韩免费视频| 亚洲一区 在线播放| 噜噜噜久久,亚洲精品国产品| 亚洲精品日韩丝袜精品| 亚洲最大天堂网| av福利精品导航| 国产精品扒开腿爽爽爽视频| 国产色无码精品视频国产| 午夜天堂影视香蕉久久| 日韩精品久久久| 国产成人三级在线播放| 亚洲美女视频网站| 999久久久精品视频| 久久综合国产精品| 成人乱色短篇合集| 日本va欧美va国产激情| 欧美日韩高清影院| 国产婷婷一区二区三区| 麻豆成人久久精品二区三区小说| 精品中文字幕在线| 中文字幕网站在线观看| 亚洲综合免费观看高清完整版在线| 久久国产精品-国产精品| 国产又粗又长又大视频| 亚洲精品动漫久久久久| 日本中文字幕观看| 国产亚洲1区2区3区| av一区二区三区免费| 丁香社区五月天| 亚洲国产美女精品久久久久∴| 亚洲高清在线免费观看| av成人动漫在线观看| 国产主播在线一区| 精品不卡一区二区| 欧美精品一区二区蜜臀亚洲| 手机看片一级片| 91论坛在线播放| 91精品综合久久| 中文字幕人妻精品一区| 精品一区二区三区电影| 精品人妻一区二区三| 欧美国产激情一区二区三区蜜月| 国产精品视频福利| 国产三级伦理片| 色一区av在线| 亚洲人成人无码网www国产| 亚洲大片免费看| 警花观音坐莲激情销魂小说| 日韩一区欧美二区| 69av在线播放| 亚洲国产精品午夜在线观看| 日韩欧美中文一区二区| 亚洲美女爱爱视频| 国产精品人人做人人爽人人添| 久久综合色一本| 亚洲第一色视频| 欧美人成在线视频| 搜索黄色一级片| 欧美男同性恋视频网站| 538在线视频观看| 欧美激情综合在线| 欧美成ee人免费视频| 人人妻人人澡人人爽精品日本 | 亚洲综合激情小说| 中文字幕一区二区三区在线乱码| 麻豆国产一区二区| 国产精品网站视频| 中文字幕乱码人妻二区三区| 在线精品视频视频中文字幕| 免费看污片网站| 色8久久精品久久久久久蜜| 男女av免费观看| 国产婷婷色一区二区三区在线| 久久人人爽爽人人爽人人片av| 不卡的日韩av| 欧美精品久久久久| 国产精品9191| 日韩精品免费在线视频| av无码av天天av天天爽| 亚洲大片精品永久免费| 欧美一级免费播放| 26uuu亚洲综合色| 久久久久资源| 日韩av不卡一区二区| 国产精品一区二区三区在线播放 | 日本不卡中文字幕| 国产精品久久久久久久久久小说 | 亚洲精品中文字幕无码蜜桃| 久久国产免费视频| 蜜臀av中文字幕| 午夜精品久久久久久久白皮肤 | 在线综合+亚洲+欧美中文字幕| 亚洲欧美久久久久| 亚洲欧美视频在线观看视频| 国产手机视频在线观看| 国产成人超碰人人澡人人澡| 国产高清一区视频| 婷婷av一区二区三区| 国产成人精品在线观看| 亚洲天堂网在线视频| 欧美另类高清videos| xxxxxx国产| 亚洲色图综合网| 亚洲精品自拍视频在线观看| 精品国产乱码91久久久久久网站| 国产草草浮力影院| 欧美视频自拍偷拍| 中文字幕在线视频一区二区三区| 亚洲mv大片欧洲mv大片精品| 无码人妻丰满熟妇区五十路百度| 国产精品久久综合| 久久www视频| 国产亚洲精久久久久久| 综合网五月天| 99久久久国产精品| 亚洲精品一区二区三区av| 大美女一区二区三区| 欧美一区二区三区在线播放 | 超碰网在线观看| 亚洲摸摸操操av| 欧美s码亚洲码精品m码| 中文字幕一区二区三区蜜月| av日韩一区二区三区| 国产精品日韩成人| 国产二区视频在线| 日韩一区在线看| 国产一区二区网| 国产精品福利一区| 日韩国产欧美亚洲| 中文字幕一区二区三| 亚洲 高清 成人 动漫| 亚洲丝袜美腿综合| 99精品人妻少妇一区二区| 亚洲乱码国产乱码精品精的特点| 虎白女粉嫩尤物福利视频| 亚洲动漫第一页| 毛片毛片毛片毛| 色婷婷综合久久久久中文一区二区| 欧美国产在线一区| 欧美偷拍一区二区| 日本五十肥熟交尾| 欧美一区二区高清| 中文字幕成人动漫| 亚洲高清一二三区| 国产成人av免费在线观看| 国产亚洲精品高潮| 日韩av男人天堂| 欧美日韩第一页| 亚洲综合免费视频| 国产成人综合精品在线| 人妻无码中文字幕免费视频蜜桃| 成人夜晚看av| 美腿丝袜亚洲色图| 欧美精品亚洲精品| 99国产欧美另类久久久精品| 性生活免费观看视频| 国产精品国产三级国产有无不卡 | 国产成人av电影| 正在播放亚洲| 国产欧美日韩卡一| 91视频 -- 69xx| 午夜激情一区二区三区| 波多野结衣三级视频| 欧美一区二区播放| 自拍偷拍第9页| 日韩视频欧美视频| 中文字幕a级片| 国产精品视频大全| 蜜臀a∨国产成人精品| 日本一区免费| 欧美经典三级视频一区二区三区| 人妻熟女一二三区夜夜爱| 色久优优欧美色久优优| a毛片毛片av永久免费| 亚洲人成电影网站色www| 欧美日韩一级黄色片|