11 月 5 日消息,騰訊混元今日開源了 Hunyuan3D-1.0 大模型,官方稱這是首個同時支持文生和圖生的 3D 開源大模型。

▲ 文生模型

▲ 圖生模型
模型采用兩階段生成方法,官方表示在保證質量和可控的基礎上,10 秒即可生成 3D 資產:
第一階段,團隊采用了一種多視角擴散模型,輕量版模型能夠在大約 4 秒內生成多視角圖像。這些多視角圖像從不同的視角捕捉了 3D 資產的豐富的紋理和幾何先驗,將任務從單視角重建松弛到多視角重建
第二階段,團隊引入了一種前饋重建模型,利用上一階段生成的多視角圖像。該模型能夠在大約 3 秒內快速而準確地重建 3D 資產。重建模型學習處理多視角擴散引入的噪聲和不一致性,并利用條件圖像中的可用信息高效恢復 3D 結構
最終該模型可以實現輸入任意單視角實現三維生成

官方表示該模型的泛化能力和可控性強,可重建各類尺度物體,大到建筑,小到工具花草。

附相關鏈接如下:
Github:https://github.com/Tencent/Hunyuan3D-1
Huggingface:https://huggingface.co/tencent/Hunyuan3D-1
研究論文:https://3d.hunyuan.tencent.com/hunyuan3d.pdf





京公網安備 11011402013531號