當大語言模型還在二維對話框里“打字”時,魔琺科技直接把它的骨骼、肌肉、聲帶一次生成。5月30日,這家公司發(fā)布全球首個面向開發(fā)者的3D數(shù)字人開放平臺“魔琺星云”,讓AI從“說話”進化到“做表情、打手勢、帶身體”。
平臺核心是一套3D多模態(tài)實時生成引擎:輸入任意文本,毫秒級輸出同步語音、微表情、肢體動作,并針對手機、平板、車載、電視等終端做了適配,刷新率保持在30fps以上,延遲低于100毫秒。開發(fā)者無需預(yù)錄動畫,也不用綁定高價GPU,一塊百元級別的入門級芯片即可本地驅(qū)動,云端只負責(zé)模型推理與更新。
魔琺科技CTO李豫介紹,秘訣在于“云-端拆分架構(gòu)”——把重算力的幾何建模與輕量級的渲染指令分離,終端只接收壓縮后的動作碼流,“就像在線看視頻,但流量只有普通視頻的1/10。”
落地場景已超出“ demo ”范疇:上海中心的一家智慧酒店把星云SDK接入前臺平板,數(shù)字前臺可實時解答入住、開發(fā)票、周邊餐飲問題;某省級政務(wù)大廳的導(dǎo)辦終端則通過該平臺生成手語版數(shù)字人,為聽障人士提供無障礙服務(wù);在招聘市場,星云與一家頭部HR SaaS合作,上線AI面試官,候選人完成語音回答后,數(shù)字面試官會基于語義即時點頭、記錄、追問,還原真實互動節(jié)奏。
平臺采用分層計費:基礎(chǔ)模型免費調(diào)用,高級情緒控制、行業(yè)知識包按量付費,企業(yè)私有化部署可一次性買斷。上線當天,已有超過2000名開發(fā)者申請內(nèi)測,覆蓋教育、醫(yī)療、零售、IoT四個賽道。
魔琺科技CEO柴金祥表示,下一步將開源部分動作驅(qū)動接口,并聯(lián)合芯片廠商推出“星云Ready”認證,“目標是一年內(nèi)在10億臺中低端設(shè)備上跑起來,讓具身智能成為默認交互方式,而不是高端展廳里的花瓶。”





京公網(wǎng)安備 11011402013531號