環(huán)球網(wǎng)
近日,飛捷科思智能科技(上海)有限公司(Fysics AI)與復(fù)旦大學(xué)認(rèn)知與智能技術(shù)實(shí)驗(yàn)室(CITLab)聯(lián)合推出了全球首個(gè)面向真實(shí)物理世界的統(tǒng)一全模態(tài)評測基準(zhǔn)——FysicsWorld。這一成果旨在解決當(dāng)前人工智能領(lǐng)域“偏科”嚴(yán)重的難題,為未來AI從“屏幕里的對話者”進(jìn)化為“真實(shí)世界的行動(dòng)者”提供一套全面嚴(yán)苛而精準(zhǔn)的“體檢標(biāo)準(zhǔn)”。
![]()
FysicsWorld全模態(tài)智能評測體系示意圖
AI進(jìn)化的新門檻:從“看圖說話”到“感知現(xiàn)實(shí)”
過去幾年,以ChatGPT、DeepSeek為代表的AI模型讓我們見證了人工智能在聊天對話上的驚人能力。然而,要讓AI真正理解并感知物理世界,僅憑“聊天能力”遠(yuǎn)遠(yuǎn)不夠。因此,更強(qiáng)的物理AI成為業(yè)內(nèi)共識。
眾所周知,現(xiàn)實(shí)物理環(huán)境中的信息并非以單一模態(tài)出現(xiàn),而是以圖像、聲音、視頻等多種信號交織存在:例如,根據(jù)真實(shí)場景畫面變化和環(huán)境音來辨別物體狀態(tài),判斷事件走向,或從連續(xù)視頻中理解物理過程與因果關(guān)系。AI需要像人類一樣,只有同時(shí)調(diào)用視覺、聽覺、語言等多種“感官”,去學(xué)習(xí)復(fù)雜的物理規(guī)律,感知真實(shí)現(xiàn)實(shí)環(huán)境,才可能真正理解物理世界中的復(fù)雜情況。目前的AI評測體系大多還停留在“紙上談兵”階段:要么只進(jìn)行文本內(nèi)容“閱讀理解”,要么僅針對圖片、視頻、聲音內(nèi)容進(jìn)行簡單考察,無法反映AI在現(xiàn)實(shí)場景下進(jìn)行綜合感知、物理理解與一致決策的能力。為了打破這一僵局,由英偉達(dá)PhysX物理引擎的主要奠基人與研發(fā)團(tuán)隊(duì)負(fù)責(zé)人張立華教授創(chuàng)辦的、國內(nèi)唯一擁有完全自主研發(fā)的可微分通用物理仿真引擎產(chǎn)品的企業(yè),飛捷科思智能科技推出了FysicsWorld。
FysicsWorld:一場從“教科書”走向“真實(shí)世界”的實(shí)地演習(xí)
如果說傳統(tǒng)的AI評測是考場里的“教科書筆試”,那么FysicsWorld就是一場把AI模型拉進(jìn)復(fù)雜真實(shí)世界中的“全能實(shí)地演習(xí)”。該基準(zhǔn)包含了視覺、聽覺、語言及其相互協(xié)作的16大類高難度綜合任務(wù),涉及上百種真實(shí)的物理生活場景。它不僅要求AI能看圖說話、看懂視頻、聽懂聲音,還要求AI必須像“福爾摩斯”一樣,整合視覺線索、聽覺信號和物理常識進(jìn)行深度推理。比如,在測試中,AI可能需要觀察一段無聲的物體碰撞視頻,并結(jié)合物理規(guī)律精準(zhǔn)預(yù)測它發(fā)出的聲音特征;或者在一段嘈雜的視頻中,通過聲音的變化反推畫面中沒有顯示的物體運(yùn)動(dòng)軌跡或預(yù)測人類運(yùn)動(dòng)行為。這些任務(wù)極大地考驗(yàn)了AI對真實(shí)物理世界規(guī)律的認(rèn)知深度。
獨(dú)創(chuàng)“防作弊”機(jī)制,拒絕AI走捷徑
在以往的眾多測試中,聰明的AI往往會(huì)通過“猜題”來拿高分,例如僅通過文字提示就猜出答案,而完全忽略了圖像信息。為了杜絕這種“偽智能”,F(xiàn)ysicsWorld創(chuàng)新性地引入了跨模態(tài)互補(bǔ)性篩選策略。這就好比在考試中設(shè)置了連環(huán)鎖:所設(shè)計(jì)的題目必須同時(shí)通過“看”和“聽”等多感官信息才能解開。如果AI試圖只用一只“眼睛”或一只“耳朵”去蒙混過關(guān),就會(huì)被FysicsWorld系統(tǒng)識別并判定失敗。這種嚴(yán)格的篩選機(jī)制,確保了只有真正具備多感官融合能力的AI模型才能通過測試。
通往真正具身智能的關(guān)鍵一步
研究顯示,即便是目前頂尖的AI模型,在面對FysicsWorld考核中復(fù)雜的真實(shí)世界場景理解推理任務(wù)以及人機(jī)交互任務(wù)時(shí),也暴露出了明顯的短板。這恰恰指明了下一代人工智能的進(jìn)化方向。FysicsWorld的發(fā)布,不僅為全球AI研發(fā)團(tuán)隊(duì)提供了一把精準(zhǔn)的物理“標(biāo)尺”來診斷模型缺陷,更將加速全模態(tài)智能時(shí)代的到來。
在此基礎(chǔ)上,飛捷科思智能科技還將以新一代物理仿真引擎 Fysics為核心,打造全球領(lǐng)先的物理智能關(guān)鍵技術(shù)與產(chǎn)品,推動(dòng)具身智能與人形機(jī)器人技術(shù)研發(fā)及應(yīng)用場景的快速落地,在高精度物理仿真引擎、高質(zhì)量具身智能仿真平臺(tái)、機(jī)器人敏捷運(yùn)動(dòng)與魯棒智能控制等領(lǐng)域處于行業(yè)領(lǐng)先水平,并向行業(yè)提供覆蓋“仿真-訓(xùn)練-部署-迭代”的全棧解決方案。依托自主可控的物理智能底座,公司持續(xù)賦能中國具身智能與機(jī)器人產(chǎn)業(yè)的發(fā)展。
飛捷科思智能科技創(chuàng)始人張立華教授表示,F(xiàn)ysicsWorld可為全球AI研發(fā)團(tuán)隊(duì)提供統(tǒng)一的“測試平臺(tái)”,加速全能型AI技術(shù)的升級,讓人工智能更安全、自然地融入工業(yè)制造、智能家居、機(jī)器人服務(wù)等真實(shí)場景,為我國智能產(chǎn)業(yè)發(fā)展打下更為堅(jiān)實(shí)的技術(shù)基礎(chǔ)。





京公網(wǎng)安備 11011402013531號