當自動駕駛機器人行駛在城市的人行道場景,算法會有效還是失靈呢?
這是一種比行駛在道路上更復雜、更具有不可預測情況的現實場景:一方面,機器人面對使用電動輪椅的老人、遛狗的人、嬰兒推車、突然沖出馬路的孩子等復雜的情況;另一方面,人行道還可能出現坑洼、斜坡等路況。
最近,DeepTech 關注到美國加州大學洛杉磯分校(UCLA,University of California,Los Angeles)副教授周博磊加入美國機器人初創公司 Coco Robotics,并在該公司新成立的 Physical AI Lab 擔任首席 AI 科學家。我們通過與周博磊的交流,試圖從產學研方面揭開人行道自動駕駛的“神秘面紗”。
![]()
(周博磊)
![]()
從模擬到現實:讓自動駕駛走在人行道
周博磊先后在上海交通大學和香港中文大學獲得學士和碩士學位,然后在美國麻省理工學院獲得博士學位。此前,他曾在香港中文大學擔任助理教授,并憑借“使人工智能模型更易于人類理解和信賴”,成為 2020 年《麻省理工科技評論》“35 歲以下科技創新者”亞太區入選者之一。目前,周博磊實驗室的研究方向是計算機視覺和機器學習,致力于城市機器人交互,并于近期將研究方向聚焦于人行道自動駕駛方向。
他早期研究的類別激活映射(CAM,Class Activation Mapping)技術 [1] 和網絡剖析(Network Dissection)[2] 等一系列工作,可應用于自動駕駛、醫學影像診斷和醫療保健等領域,為目前的研究理念打下了堅實的基礎。無論是設計模型、部署模型,還是訓練模型,模型的可解釋性都是一個非常重要的因素。在機器人應用中,當機器人在現實生活中做出錯誤決策后,如何分析它的行為是值得深入研究的課題之一。
在如今的大模型研究中,可解釋性已自成體系,即訓練好大模型后,能否理解其學到的知識,以及為什么會輸出這樣的結果。周博磊對 DeepTech 表示:“我們希望在獲得 AI 模型后,能夠提升它的可解釋性。因為可解釋性不僅在于理解模型,還在于提升它與人類交互的能力。只有理解模型的運作,才能實現人與 AI 共同操作,從而達到更透明的相互理解與協作。”
在該實驗室最近的工作中,研究人員利用 Coco Robotics 贈予實驗室的送貨機器人小車做了相關研究工作。例如,發表在 CVPR 2025 的論文《Vid2Sim:基于視頻的逼真交互式城市導航模擬》(Vid2Sim: Realistic and Interactive Simulation from Video for Urban Navigation)[3]。通過拍攝一段視頻,可將其重建成一個交互式環境,然后在該環境中訓練 Coco 小車,進而能夠直接在現實生活中部署。結果顯示,Vid2Sim 顯著提高了數字孿生和現實世界中的城市導航性能,成功率分別提高了 31.2% 和 68.3%。
![]()
(https://arxiv.org/abs/2501.06693)
在另一項發表于 CVPR 2025 的論文《通過可擴展的城市模擬實現自主微移動》(Towards Autonomous Micromobility through Scalable Urban Simulation)中 [4],也研究了人行道機器人。研究人員利用 AI 代理協助人類操控小型出行設備(micromobility),為提升安全性和效率提供了一種可行的解決方案。他們構建了一種高性能機器人學習平臺 URBAN-SIM,用于在交互式城市場景中大規模訓練具身代理。此外,他們還針對四種機器人設計了涵蓋 8 個場景的三項任務,包括輪式機器人(Coco Robotics 的送貨機器人)、四足機器人(Unitree Go2)、輪腿機器人(Unitree B2-W)和人形機器人(Unitree G1)。
![]()
(https://arxiv.org/abs/2505.00690)
![]()
介于家庭機器人和車道自動駕駛之間的應用場景
Coco Robotics 以實現配送機器人“最后一公里”為目標,其成立于 2020 年,聯合創始人兼 CEO 扎克·拉什(Zach Rash)和聯合創始人兼 CTO 布拉德·斯奎恰里尼(Brad Squicciarini)都是 UCLA 的校友。該公司在種子輪融資時獲得了 OpenAI 的 CEO 山姆·奧特曼的支持,并與 OpenAI 一直保持數據方面的合作。在如今的大模型和 AI 浪潮中,Coco Robotics 的優勢之一在于,其基于自身機器人小車送餐業務能夠像特斯拉那樣每天積累大量新的視頻數據,而不是像其他大模型公司那樣下載通用的互聯網數據。
從美國市場來看,目前聚焦人行道自動駕駛機器人的主要公司“各有千秋”,除了 Coco Robotics 還包括 Starship Technologies 和 Serve Robotics。Starship Technologies 成立于 2014 年,專注于校園內餐廳的機器人配送業務,并在美國、英國、芬蘭等國家的相關城市開展業務。Serve Robotics 公司自 2021 年從 Uber 分拆而來,已于 2024 年在納斯達克上市。
周博磊與 Coco Robotics 的合作一方面源于雙方技術發展方向的契合,另一方面也基于他們此前的合作。
盡管周博磊實驗室之前做過自動駕駛的相關研究,但缺少自動駕駛真車,也沒有場地做真車實驗,更沒有數據和計算資源和大型自動駕駛公司競爭。因此,他們切換了研究場景,轉而研究人行道上的機器人——既能研究機器人學習課題,又可以在真實世界中做實驗。與此同時,Coco Robotics 正處于 AI 轉型階段,隨著其基于遠程遙控配送車的業務發展成熟,公司計劃向用 AI 模型補充和降低人工操作的方向轉型。
需要了解的是,機器人研究中常見的劃分方向是機械臂或家庭環境下的機器人方向,以及自動駕駛方向。現階段,特定場景下的道路自動駕駛技術已基本接近實現,人們可使用 Waymo 和蘿卜快跑等自動駕駛服務平臺在國內外的相關城市打車出行。而人行道自動駕駛是介于家庭機器人和車道自動駕駛之間的過渡場景。該場景下的機器人需要完成的不僅是簡單的視覺識別任務,還需要充分整合感知、理解、判斷、決策和行動,這也是決定著 AI 是否能走進現實世界的關鍵因素。更重要的是,其還需要機器人和人類進行更有效的安全交互。周博磊進一步說道:“如果能解決好人行道上的機器人技術問題,它也可以應用到送貨之外的其他方向,比如為人形機器人提供城市導航模塊,為電動輪椅提供自動駕駛能力等。”
為更好地解決上述問題,新成立的 Physical AI Lab 將圍繞三個方向開展研究:一是從數據層面,基于 Coco Robotics 累積的真實數據訓練出適用于城市人行道的、配送機器人的基礎模型或者移動性基礎模型。“這相當于特斯拉基礎款的 Autopilot 功能,它可以在高速等相對簡單的情況下實現自動駕駛,然后把這個模型整合到現有的操作流程中。”周博磊說。二是通過仿真重建出與真實情況高度契合的虛擬環境對模型進行訓練,以進一步提升機器人的決策和因果推斷能力。三是讓模型能從人類的操作中持續學習,將 AI 模型與人類操控者更好地協作整合
需要了解的是,這并不意味著在短時間內完全實現自動化,而是通過人機協作共同完成人行道導航任務:在較簡單的人行道情況下,由 AI 操作系統;而在過馬路等較復雜的情況下,則由人接手操作。他表示:“現階段的遙控操作是一個操作者對應操作一輛送貨車。我們希望在兩三年內可以發展到一個操作者結合 AI 模型能同時操作 3 到 4 輛送貨車,這將大大節省人力成本。”
![]()
產學研結合的雙贏路徑
從周博磊這次與 Coco Robotics 的攜手,我們可以看到產學研緊密結合的一種雙贏合作路徑:公司可提供資金、通過業務積累的海量數據和實驗平臺,但面臨招聘全職 AI 研究員工成本高和 AI 技術迭代慢的問題;而實驗室由于沒有真實數據,很難開展相關研究。通過合作,實驗室的學生們可利用公司提供的真實世界數據和硬件平臺開展研究、發表論文。尤為重要的是,相關研究成果開源發布后,能夠進一步促進和回饋整個社區的技術發展。
周博磊指出,城市人行道自動駕駛領域目前尚處于技術早期階段。在接下來的幾年中,隨著技術的發展、數據的積累和研究的深入,非常有可能有一條穩定的技術路線“突出重圍”。
參考資料:
1.https://arxiv.org/abs/1512.04150
2.https://arxiv.org/abs/1704.05796
3.https://arxiv.org/abs/2501.06693
4.https://arxiv.org/abs/2505.00690
5.https://techcrunch.com/2025/06/11/sam-altman-backed-coco-robotics-raises-80m/
6.https://www.cocodelivery.com/





京公網安備 11011402013531號