作 者:微瀾
來 源:正和島(ID:zhenghedao)
2025年,中國具身機器人賽道風起云涌。
從今年年初,宇樹科技的機器人登上春晚,正式拉開了中國具身智能機器人元年的大幕;
到今年年底,整個具身智能機器人行業百花其放,涌現出大量的明星企業,智元、眾擎、小鵬、優必選……
顯然,具身智能機器人賽道正在成為未來最具想象力的賽道。
根據摩根士丹利全球具身AI團隊在最新發布的《機器人年鑒》中預測,基準情形下,全球機器人硬件銷售額將從2025年的約1000億美元激增至2030年的5000億美元,2040年達到9萬億美元,并在2050年攀升至25萬億美元。這一預測僅涵蓋硬件銷售,若加上軟件服務、維護及供應鏈相關收入,市場規模可能成倍增長。
而今天,我們要分享的也正是一位當下機器人賽道炙手可熱的創業明星——首形科技的創始人胡宇航。
大多數人可能都沒太聽說過這個名字,但是,在具身機器人微表情領域,胡宇航和他創立的首形科技正在成為行業最受關注的標的之一。
從2019年成為哥倫比亞大學的研究生,正式進入到機器人領域的研究,到2024年創立首形科技,2025年博士畢業,胡宇航用了短短6年時間。
而憑借著首形科技,胡宇航也正在具身智能機器人行業上演一段精彩的創業故事,僅僅用一年多時間就斬獲5輪融資,受到螞蟻集團、雷軍創立的順為資本、招商局創投等基金的追捧,某種程度上來說,胡宇航的創業征程才剛剛開始。
![]()
哥大博士,干出一家機器人微表情公司
1997年,胡宇航出生于福建泉州,2015年其考上廈門大學嘉庚學院的機電工程學院。
和大多數上大學的人不同,在大學期間展現了高度的規劃性和自律性,這兩種品質也讓其成為了學校的風云人物:
連續八個學期專業排名第一,并成功考取全國CAD技能等級考試二級證書;
除了學業是一個典型的學霸,其在科技競賽領域也屢獲殊榮,拿下包括國家級獎項6次、省級獎項5次和校級獎項3次,同時還成功申請到多項個人專利;
此外,胡宇航還展露了創業的潛質,在大學期間他還參加了各類創業比賽,帶領團隊多次斬獲金獎。
事實上,在胡宇航最初的預設中,其將會在大學畢業后成為一個創業者,但隨著對當時國內創業形勢的深入了解,以及在自己創業實踐的過程中,胡宇航意識到,自己接觸的平臺比較小,只有擁有核心技術和人才,才能建立足夠高的技術壁壘,最終才有創業成功的機會。
也因此,在大學期間其確立了到美國TOP30的大學留學目標。
為此,胡宇航硬生生將過去一直存在的英語短板給生啃了下來,他考了9次托福,4戰GRE(美國研究生入學考試),在備考后期,胡宇航曾自我調侃,已經“學到入魔”:
“對任何娛樂都不感興趣。騎車不走路是為了在路上少花一些時間;走路不騎車是因為走路時可以拿起手機刷單詞。”
除了英語是出國留學的一個最大障礙石,胡宇航還需要去了解意向學校的課程、實驗室、教授研究方向等,針對這些書寫自己的申請文書。
為了備考成功,胡宇航甚至放棄了自己當時的創業項目,也放棄了諸多比賽。“很多人不理解,我為什么要放棄自己所擅長的,選擇和自己最弱的英語死磕到底。但我清楚地知道,既然選擇了就要堅持下去。”
也正是這份堅持和死磕,胡宇航最終成功拿下了哥大和加州大學圣地亞哥分校的研究生錄取通知書,最終,胡宇航選擇了哥倫比亞大學。
![]()
首形科技創始人胡宇航
2019年下半年,胡宇航正式踏上了前往哥大的留學之路,也就在這里,胡宇航與機器人正式結緣。
也就在2019年、2020年前后,人工智能研究開始突飛猛進,自然語言處理(NLP)和計算機視覺(CV)技術都得到了明顯的發展。
“未來AI能更深層次地理解人類語言背后的含義,并結合多模態技術,如語音、圖像、視頻等信息,全面感知和分析人類的情緒。”胡宇航曾說道。
這其中,人類的大多數感官都集中在頭部,人臉作為情緒和表達的聚焦點,是人與人之間最直接的連接方式。
在胡宇航看來,人類最偉大的能力并非冰冷的邏輯計算,而是豐富細膩的情感。一個有自然表情,能理解、傳遞情感的面孔,將賦予機器人“表達”這些人類體驗的能力,讓它真正融入我們的世界。
也因此,胡宇航踏上了研究人臉機器人的道路,從研究生到哥大博士生,基本每一天,胡宇航的大部分時間都在實驗室和機器人待在一起。
而在求學期間,熬夜、失眠、焦慮是常態,他開始大量掉發甚至還起了蕁麻疹。于是,為了緩解壓力,他開始拍起了短視頻,搞起了“抽象”。
2022年9月,胡宇航在抖音發布了第一個留學日記的視頻,在一開始拍抖音時,他并沒有打算做科技博主,而是選擇了成為一個“美食博主”。
當時大多數關注他的粉絲,更多也是把他看作一個“抽象帥哥”,作為“電子陪讀”,跟他一起“云讀博”。
直到他發視頻宣布先后拿下《科學—機器人學》《自然—機器智能》《NPJ—機器人學》等頂刊論文,粉絲們這才發現他是一位隱藏的科技大佬。
2024年6月,胡宇航重啟了自己的創業之路,創立了首形科技,英文名是AheadForm,既象征著機器人的頭部,也彰顯他勇往直前的態度。
![]()
翻越“恐怖谷”
時間來到2025年5月,當時,胡宇航發布了一段機器人“蘇醒”的視頻。
視頻中,一個皮膚白皙細膩的“女孩”睜開眼睛,打量周圍的世界,胡宇航打了個響指,指了指鏡頭,“女孩”好奇地抬眸,眼波流轉,神情困惑,仿佛真的有了生命。
視頻播放量很快突破百萬,引爆網絡。
有人直接問能不能眾籌,讓自己能夠成為原始股東;也有人贊嘆其打造了機器人界的“繆斯”,通過高度仿真的面部和靈動表情在一定程度上打破了“恐怖谷效應”,營造出了無限接近真人的外觀和互動效果,而這也正是視頻爆火的原因。
客觀上講,由于擬人捏臉技術仍在早期階段,不少人會因為“恐怖谷效應”而對仿生機器人敬而遠之。
什么是恐怖谷效應?
其由日本機器人專家森政弘提出,當機器人的外掛和動作接近人類,但仍有微小差異如僵硬的表情、不自然的瞳孔時,人類會產生強烈的不適感,也只有相似度超過某個臨界點時,恐懼感才會下降。
![]()
圖源:網絡
這種現象可以用一個曲線圖來表示:橫軸是物體的類人化程度,縱軸是人類對該物體的親近感。當類人化程度接近100%時,親近感會再次上升,但在接近的過程中,會形成一個明顯的“谷底”,這就是“恐怖谷”。
早在2016年,國外的漢森機器人就推出仿生人形機器人索菲亞,她的擬人性不僅來自以假亂真的橡膠皮膚與超62種微表情,更源于一套精密協同的“感知—認知—表達”閉環系統,通過面部識別與眼神交互,讓每一次對話都自然流暢。但也正是這種過于逼真卻又非人的特質,觸發了人們心底的“恐怖谷效應”。
而在“恐怖谷效應”的背后,更核心的問題是技術上的不成熟。
“如果我們有更好的技術和工程體系,就有可能解決恐怖谷效應。”在胡宇航看來,很少有人會害怕蠟像、雕塑、手辦,因為已經足夠逼真,“只要將機器人原本僵硬的動作變得絲滑、協調,就能大大減少人心中的恐懼”。
要解決這個問題,首先也是最關鍵的一點就是算法。
在傳統機器人領域中,關于仿生非線性的研究幾乎一片空白,無論是機械臂,還是四足機器人,動作大多依靠程序的指令,像個“提線娃娃”,呆板僵硬。
因此,要想動作流暢,機器人需要學會做表情。但光憑互聯網數據的訓練,機器人并不知道做出的表情是否自然。
為此,胡宇航和首形科技,自研了情緒基座模型,通過融合語言、表情、語音、語境等多模態信息,使機器人能夠理解和表達情緒。這不僅為當前的對話大模型提供了情感延伸能力,也為未來的具身智能提供了“情緒引擎”。
這里還值得一提的是,關于這個情緒基座模型的誕生,還有一個小插曲,當時苦于數據的不足,胡宇航突發奇想到了機器人可以嘗試對鏡學習。
于是,胡宇航把一面鏡子放到人臉機器人的面前。通過眼睛里的攝像頭,機器人能將電機指令和臉部表情相對應,匯總給AI模型,再對照互聯網數據,解讀不同表情的意義,構建起語音、語義、表情間的聯系,這才有了首形科技情緒基座模型的雛形。
其次,算法解決了,還要解決物理世界的問題。由于人臉是無數微動作的耦合,為了讓人臉機器人更加逼真,必須在柔軟、非線性的硅膠皮膚內塞進更多電機,以實現精準調控,同時不能破壞面部結構。
作為一個極其小眾又專業門檻極高的交叉領域,機器人人臉的表情理解和控制涉及了大量醫學、工程知識,要找一個對機器人感興趣的醫學生,或者找一個有醫學背景的工程師,都無比困難。
找不到同行者,胡宇航就決定自己獨自前行。沒有參考文獻,沒有工程先例,從算法、模型的開發,到實物的搭建、調優,全靠他一個人。
他經常一個人窩在實驗室,3D打印出零部件,跑代碼、建模型、搭實物,光是廢棄的“臉皮”就塞滿了一整箱,失敗了幾十次后,他多了兩個“搭子”——“冷酷”和“冷漠”,一個登上了《科學-機器人學》,一個參與了科幻電影Posthuman的拍攝。
![]()
“冷酷”與“冷漠”,圖源:U航視頻
2025年6月,28歲的胡宇航從哥倫比亞大學博士畢業。此時的他,已經兼具多個耀眼的光環:
擁有上百萬粉絲的科技博主;手握數篇頂級期刊的哥大博士,以及首形科技的創始人……
不僅如此,其創立的首形科技更是在一年多的時間里面狂攬5輪融資。在9月份的億元級融資引發螞蟻集團、招商局創投、順為資本等的激烈競爭后,12月份,首形科技再獲新一輪融資,由中國互聯網投資基金(中網投)與螞蟻集團聯合領投,其他投資人包括上海未來產業基金、東方富海,老股東招商局創投持續超額追投。
![]()
圖源:天眼查
事實上,當AI從工具演化為類人智能體,無數人應該都會產生一個好奇,它應當以怎樣的物理形態存在于人類世界?
而人形面部的情緒表達,其實承載著具身智能跨出關鍵一步的可能性:它不僅影響“看起來像不像人”,更決定了AI能否在真實世界中建立穩定的交互心智、觸達更高維度的體驗層。
某種程度上來說,從眼神到表情,從口型到微動作,這些看似細小的“類人線索”,本質上是未來智能體能否成為可信賴的交互主體的基礎設施。
也正如胡宇航在視頻中所期待的:讓人工智能和機器人不再是冰冷的工具,而是具備身體,自我認知與情感共鳴的新物種。
![]()
人臉機器人“Emo”,圖源:U航視頻
![]()
具身智能時代,中國創業者們百花齊放
“感謝大家的持久陪伴和寶貴建議,和我一起讓機器人擁有表情,理解情緒越來越接近生命體,你們不是看客,而是這個旅途中的同行者。”
2025年7月份,站在WAAIC的聚焦燈下,在機器人領域已摸索了5、6年的胡宇航仍保持著激情和謙遜。
對于胡宇航來說,在探索人工智能和機器人的路上,新的征程才剛剛開始。
而對于中國具身機器人產業而言,胡宇航與首形科技的崛起,無疑也是中國具身智能時代的一個縮影。
它標志著中國創業者們,正從以往的技術跟隨與應用創新,邁向前沿基礎研究與核心體驗定義的“無人區”。
過去很長一段時間,中國科技創業的經典敘事是“Copy to China”,即在成熟的商業模式或技術路徑上,結合本土市場進行快速迭代與規模化應用。然而,在具身智能——這個融合了人工智能、精密機械、材料科學、認知心理學等多學科的賽道,規則正在被改寫。
除了首形科技,中國具身機器人賽道正在呈現出“百花齊放”的繁榮景象:
宇樹科技的通用人形機器人以高動態運動控制能力驚艷春晚,智元機器人瞄準工業生產場景推動商業化落地,優必選在大型仿人服務機器人及教育領域持續深耕,小鵬等車企憑借在智能駕駛中積累的感知與控制能力跨界入局……
而在“百花齊放”的背后離不開幾點關鍵因素:
1.全產業鏈與極致工程化能力。中國擁有全球最完整、響應最快的機器人供應鏈體系。從無框力矩電機、諧波減速器,到各類傳感器、結構件,創業者能夠以極低的成本和極快的速度進行原型迭代。
2.超大規模市場與豐富的應用場景。從工業制造到家庭服務,從醫療康復到教育培訓,中國復雜多元的經濟社會結構,為具身機器人提供了海量的潛在應用場景和試錯空間。這不僅吸引了資本,更讓技術能在真實的反饋閉環中持續進化。
3.活躍的資本與投資者的參與。正如前文提到的,螞蟻集團、順為資本、招商局創投等兼具財務實力與產業生態資源的“聰明錢”紛紛重倉押注。它們帶來的不僅是資金,更是對技術路線的背書、產業資源的對接以及對長期主義的耐心。這形成了一個“頂尖學術人才+風險投資+產業資本” 的黃金三角,加速了實驗室技術向商業產品的轉化。
4.一代“科學家創業者”的集體登場。以胡宇航為代表的科技創業者,是新一代中國創新者的縮影。他們通常擁有世界頂級的科研訓練背景,在攻讀學位期間就已觸及領域前沿。這種“研而優則創”的模式,確保了創業公司的技術底蘊和創新銳度。
在1994年,張朝陽在他的第一份商業計劃書——“中國在線”的封面上,寫下來兩句英文:“Riding the waves of our times,one is the coming of age of the information superhighway,another is the mergence of China as a global power.(順應我們這個時代最偉大的兩個潮流,一是信息高速公路時代的到來,另一個是中國作為全球大國的崛起)”那時,張朝陽還不知道自己的創業能做什么。
而當時間來到當下這個節點,三十余年后的今天,我們發現,以胡宇航、王興興等為代表的中國具身智能創業者們,正在以穩健的步伐書寫一個關于“融合”的嶄新故事。
我們也期待著,在百花齊放之后,中國具身智能產業能夠孕育出引領下一個時代的參天大樹。
參考文獻:
[1].《給機器人做“臉”,28歲哥大博士收獲百萬粉絲》,科學網
[2].《為機器人“上妝”吸引百萬粉絲!小伙登上世界AI舞臺》,中國青年報
[3].《曾被100個投資人否決的人形項目,剛剛融資了!》,高工機器人
[4].《螞蟻、錦秋、順為、招商局創投聯合出手》,首形科技
[5].《新時代“嘉”人 | 胡宇航:科創達人考上哥倫比亞大學研究生》,廈門大學嘉庚學院
[6].《抖音養成系學霸登上世界AI舞臺,百萬云股東現已就位》,抖音和ta的朋友們
排版| 小元
審校| 微瀾輪值主編| 夏昆





京公網安備 11011402013531號