5 月 16 日消息,騰訊混元圖像 2.0 模型(Hunyuan Image2.0)今日正式發布,在騰訊混元官方網站上線,并對外開放注冊體驗。
騰訊混元圖像 2.0 模型主要有兩大特點:實時生圖、超寫實畫質。

相比前代模型,騰訊混元圖像 2.0 模型參數量提升了一個數量級,得益于超高壓縮倍率的圖像編解碼器以及全新擴散架構,其生圖速度“顯著快于行業領先模型”,在同類商業產品每張圖推理速度需要 5 到 10 秒的情況下,騰訊混元號稱可實現毫秒級響應,支持用戶可以一邊打字或者一邊說話一邊出圖,改變了傳統“抽卡 — 等待 — 抽卡”的方式。

除了速度快以外,騰訊混元圖像 2.0 模型圖像生成質量提升明顯,通過強化學習等算法以及引入大量人類美學知識對齊,生成的圖像號稱可避免 AIGC 圖像中的“AI 味”。
在圖像生成領域專門測試模型復雜文本指令理解與生成能力的評估基準 Geneval(Geneval Bench)上,騰訊混元圖像 2.0 模型準確率超過 95%,遠超其他同類模型。

附圖片示例如下:

人像攝影風格

動物特寫

復古攝影

動漫風格

真實人物風格
本次模型升級還帶來了發布了實時繪畫板功能,基于模型的實時生圖能力,用戶在繪制線稿或調整參數時,預覽區同步生成上色效果,突破了傳統“繪制-等待-修改”的線性流程,可助力專業設計師的創作。

實時繪畫板支持多圖融合,用戶上傳多圖后,可將多個草圖疊加至同一畫布自由創作,經過 AI 自動協調透視與光影,按照提示詞內容生成融合圖像,進一步豐富了 AI 生圖的交互體驗。
騰訊混元原生多模態圖像生成大模型已經在路上,騰訊表示,新模型在多輪圖像生成、實時交互體驗等方面有突出表現。





京公網安備 11011402013531號