![]()
機器之心發(fā)布
具身智能通往通用性的征途,正被 “數(shù)據(jù)荒漠” 所阻隔。當模型在模擬器中刷出高分,卻在現(xiàn)實復雜場景中頻頻 “炸機” 時,行業(yè)開始反思:我們喂給機器人的數(shù)據(jù),是否真的包含人類操作的精髓?近日,深度機智在以人類第一視角為代表的真實情境數(shù)據(jù),筑牢物理智能基座,解決具身智能通用性難題的道路上又有重要舉措。
具身智能的 “數(shù)據(jù)之困”:從機械模仿到邏輯理解的鴻溝
具身智能的通用性突破,始終受限于物理世界交互數(shù)據(jù)的極度稀缺。盡管合成數(shù)據(jù)與離線遙操作提供了初步養(yǎng)料,但采集效率低、場景單一化、任務真實性弱等瓶頸,導致模型極易陷入過擬合的泥潭 —— 機器人往往只是學會了死記硬背特定的軌跡,而非習得舉一反三的操作邏輯。
這一行業(yè)痛點,正被深度機智一直倡導的 “第一視角人類經(jīng)驗” 的情境數(shù)采(In-Context Data Collection)模式所破解。這種模式主張:數(shù)據(jù)不應是孤立的動作切片,而應是帶有豐富環(huán)境語境與因果關系的邏輯流。
2025 年 12 月 17 日,一場關于數(shù)據(jù)范式的創(chuàng)新實踐在北京落地:深度機智(DeepCybo)與北京高校正式宣布聯(lián)合成立 “具身智能數(shù)據(jù)采集示范中心”。該中心旨在通過以人類第一視角(Egocentric View)為主、多視角輔助的真實情境多模態(tài)數(shù)據(jù)采集,為通用具身智能筑牢 “永不過時” 的數(shù)據(jù)根基。
![]()
情境數(shù)采:讓數(shù)據(jù)帶著 “場景記憶” 與 “遷移能力” 而來
這是本次合作最核心的技術增量。傳統(tǒng)的數(shù)采往往關注 “動作軌跡”,而情境數(shù)采(In-Context Data Collection)則更強調(diào)動作發(fā)生時的 “前因后果”。
示范中心依托自研的DeepAct 數(shù)據(jù)引擎,在實驗教學、工程實踐等真實工業(yè) / 生活場景中搭建了標準化采集體系。
多維感知融合: 以佩戴式第一視角設備為核心,協(xié)同環(huán)境中的多角度觀測位,同步采集各類模態(tài)信息。場景記憶植入: 每一幀數(shù)據(jù)不再是冰冷的坐標變換,而是通過 “情境標簽” 自帶場景背景與交互邏輯。例如,在實驗室抓取燒杯,數(shù)據(jù)會記錄環(huán)境光影、桌面材質(zhì)以及人類為了避開障礙物而刻意調(diào)整的路徑細節(jié)。這種帶有場景記憶的數(shù)據(jù),能讓模型理解動作背后的物理約束,實現(xiàn)真實物理世界的 World Context as prompt。
從數(shù)據(jù)到智能:解鎖機器人技能涌現(xiàn)的關鍵
這一數(shù)采范式的轉(zhuǎn)變,背后隱藏著 “全面向人類看齊” 的技術邏輯:要讓模型習得人類與物理世界交互的高效邏輯,核心在于高質(zhì)量、多樣化數(shù)據(jù)的規(guī)模化供給。
深度機智的內(nèi)部實驗結果表明:以大規(guī)模精細標注的第一視角人類經(jīng)驗數(shù)據(jù)來增強基座模型的物理智能,可以實現(xiàn)向機器人異構執(zhí)行器的高效遷移。 這一結論,與 Physical Intelligence (Pi) 在 12 月 17 日同步公布的最新研究發(fā)現(xiàn)不謀而合,雙方在不同地域、不同維度上共同驗證了 “人類經(jīng)驗數(shù)據(jù)驅(qū)動通用智能” 的可行性。
![]()
作為北京中關村學院和中關村人工智能研究院(以下簡稱中關村兩院)孵化的第一家高科技企業(yè),深度機智自去年底籌辦伊始,就在中關村兩院支持下深入開展以人類第一視角數(shù)據(jù)為核心的物理智能增強研究,目前已經(jīng)基本趟通人類數(shù)據(jù)驅(qū)動通用智能的技術全鏈路。此次共建的數(shù)采示范中心,正是這一邏輯的標準化實踐模板。深度機智團隊正通過其自研的 DeepAct 數(shù)據(jù)引擎,在全國十多個城市,數(shù)百個場景,大范圍采集真實情境人類數(shù)據(jù),持續(xù)擴大數(shù)據(jù)規(guī)模,為統(tǒng)一物理智能筑牢永不過時的數(shù)據(jù)基座。
結語
當帶著場景記憶的第一視角多模態(tài)數(shù)據(jù)持續(xù)積累,當全鏈路處理和模型創(chuàng)新讓數(shù)據(jù)價值最大化,具身智能的通用性突破將不再遙遠。機器人終將從 “機械模仿” 的桎梏中解脫,在 “情境數(shù)采” 的賦能下實現(xiàn)真正的技能涌現(xiàn),走向能夠舉一反三的通用物理智能新時代。





京公網(wǎng)安備 11011402013531號