
曾是華為“天才少年”、現智元聯合創始人“稚暉君”彭志輝(央視網)
曾憑借華為“天才少年”計劃以201萬年薪加入、現任智元聯合創始人兼CTO的“稚暉君”彭志輝,日前在微博發布預告“下周智元機器人有好東西發布”。
3月10日上午,智元機器人正式發布首個通用具身基座模型——智元啟元大模型GO-1(Genie Operator-1)。
該模型基于Vision-Language-Latent-Action(ViLLA)框架,由VLM(多模態大模型)+MoE(混合專家)組成,具有采訓推一體,小樣本快速泛化、“一腦多形”的跨本體應用、持續進化、人類視頻學習等突出優勢,可以借助人類和多種機器人數據,賦予機器人革命性學習能力。
上述消息引發熱議。10日上午,、 等多個詞條登上了微博熱搜。
3月10日上午溝通會上,智元具身研究中心常務主任任廣輝對鈦媒體AGI等表示,截至目前,智元機器人已經量產下線1000臺機器人。他還透露,Go-1基于通用數據訓練,擁有非常強的泛化能力,在零數據下可以泛化到一個新場景、新任務,而基于該模型可以部署到各行各業當中,整體成本會比較低。
任廣輝強調,“具身智能”會向通用化、開放化和智能化邁進,走向開放世界,不再局限于實驗室了。
智元機器人合伙人、研究院執行院長、具身業務部總裁姚卯青表示,智元對于 AI 技術的投入是戰略級的,非常堅定,今年也將開始規模化的生產和交付,并不會去顯著將一些 AI 研發投入轉移到最終的終端售價上面。他認為,在智元啟元大模型GO-1下,智元機器人進入到G3-G4過程當中,能夠很好完成某一任務,同時也逐步具備這種通用能力。
“機器人公司如果不做大模型,那是屬于沒有未來的,機器人沒有智能化、沒有作業能力只是一個硬件,他能做的事情非常有限。”姚卯青對鈦媒體AGI等強調,未來,AI 能力一定是區分機器人產品競爭力的核心。硬件也許大家會有一些類似的方案逐漸收斂,供應鏈也會高度整合,那么在最后大家比拼一定是AI的能力,這對于機器人落地和自主作業能力至關重要。
據悉,成立于2023年的智元機器人,是當前國內人形機器人賽道頭部企業之一,其創始人之一彭志輝是坐擁250多萬粉絲的B站UP主“稚暉君”。
公司成立不到1個月,智元就完成天使輪融資、年內更斬獲4次融資,成立僅6個月就發布首款人形機器人,2024年還發布五款商用人形機器人新品,并且去年底開源百萬真實機器人數據集,以及年初率先達成1000臺機器人量產等,引發行業關注。
截至目前,智元機器人已完成天使輪、A1、A1+等多輪融資,累計募資總額超過16億元。
智元機器人共有三條主打產品線,分別是遠征、Genie和靈犀。
事實上,現有具身模型面臨多個落地困境,包括泛化性差,到新場景時成功率大幅下降;擴展新任務時需要大量數據,落地成本高;不同本體的數據無法共用,數據成本高;模型無法持續進化;DP/ACT等具身小模型技能單一且無法快速學習新技能,GR-1/2等模型無法構建通用的場景感知、指令理解等能力,語義指令泛化受限,以及小樣本泛化到新場景/新任務能力較弱等。

如今,智元希望解決上述一系列問題,并于今天發布了首個具身基座大模型Genie Operator-1 (GO-1)。
這是全球第一個基于大規模、高質量自有數據,基于自有機器人本體訓練并部署的機器人基座模型。
該模型開創性地提出了Vision-Language-Latent-Action (ViLLA) 架構,該架構由VLM(多模態大模型) + MoE(混合專家)組成,其中VLM借助海量互聯網圖文數據獲得通用場景感知和語言理解能力,MoE中的Latent Planner(隱式規劃器)借助大量跨本體和人類操作視頻數據獲得通用的動作理解能力,MoE中的Action Expert(動作專家)借助百萬真機數據獲得精細的動作執行能力,三者環環相扣,實現了可以利用人類視頻學習,完成小樣本快速泛化,降低了具身智能門檻,并成功部署到智元多款機器人本體。
Genie Operator-1有五大特點:采訓推一體,搭配智元軟硬件一體化框架,可以實現數據采集、模型訓練、模型推理的無縫銜接;小樣本快速泛化,具有強大的泛化能力,使得后訓練成本非常低,能夠在極少數據甚至零樣本下泛化到新場景、新任務;一腦多形,是一個通用機器人策略模型,能夠在不同機器人形態之間遷移,快速適配到不同本體;持續進化,搭配智元一整套數據回流系統,可以從實際執行遇到的問題數據中持續進化學習;人類視頻學習,可以結合互聯網視頻和真實人類示范進行學習,增強模型對人類行為的理解。
據智元介紹,相比已有的最優模型,GO-1平均成功率提高了32%(46%->78%)。其中,在執行“Pour Water”(倒水)、“Table Bussing”(清理桌面) 和 “Restock Beverage”(補充飲料) 任務表現尤為突出。
智元機器人方面表示,GO-1的出現,為機器人代替人類完成工作生活中的各種事情,提供了強大的腦力支持。從準備餐食、收拾桌面這樣的家庭場景任務,到接待訪客、發放物品這類辦公和商業場景的常見工作,再到工業等更多場景的其他操作任務,通用具身基座大模型都可以快速實現。這也意味著“具身智能”從單一任務到多種任務、從封閉環境到開放世界、從預設程序到指令泛化加速邁進,讓機器人走向更多不同場景、適應多變的真實世界。
此外,任廣輝透露,公司已與階躍星辰合作,后續圍繞階躍的多模態、推理和訓練、工程化等底層模型能力,進行深度的合作,將階躍星辰多模態等能力賦能到機器人上面。
在姚卯青看來,利用 AI 大模型,能夠助力機器人操作上手能力,從而加速進入工廠、零售、服務業等場景工作,長期還能進入家庭。“這才是機器人價值被充分發揮的時刻。”
談到最受關注的9.9萬元機器人話題,姚卯青對鈦媒體AGI獨家表示,9萬9的機器人只具備基礎運動能力,在本體、硬件、算法都還沒有收斂的情況下,大家急著“卷”價格戰,沒有什么意義。因此,姚卯青呼吁人形機器人產業需要看產品競爭力,如果都達不到給用戶創造價值的時候打9.9萬元,只會把整個行業變成一個很不健康的狀態。
姚卯青強調,未來1-2年,人形機器人能夠在局部工業場景應用落地,機器人走進家庭還需要5年左右的時間。此外,機器人實現像人一樣有通用能力的物理世界AGI(通用人工智能)還需要5-10年時間。
據鈦媒體AGI獨家了解,預計2025年第二季度,智元將會推出基于強化學習的仿真模型,今年下半年,智元機器人將發布X2等多個新款商用機器人產品,以及“靈巧手”等多個新技術,加速推進2025年智元10倍營收增長目標。
(本文首發于鈦媒體App,作者|林志佳)





京公網安備 11011402013531號