阿里通義萬相2.1版模型升級：視頻圖像生成能力顯著提升

IP屬地中國·北京 編輯：沈如風中關村在線 時間：2025-01-10 15:04:03

狼叫獸
通義萬相2.1版模型升級：視頻生成、圖像生成能力顯著提升
近日，阿里旗下通義萬相宣布推出2.1版本的模型升級。此次升級主要針對視頻和圖像生成兩大功能進行了改進和優(yōu)化。
在視頻生成方面，通義萬相2.1引入了自研的高效VAE和DiT架構，增強了時空上下文建模能力，并實現(xiàn)了中文文字視頻生成功能。該功能在VBench榜單中名列第一。
此外，通義萬相2.1還支持中英文視頻一鍵生成藝術字，并提供多種視覺效果選項，如過渡、粒子效果、模擬等。用戶可以根據自己的需求選擇合適的特效來增強視頻的表現(xiàn)力。
同時，在圖片生成方面，通義萬相2.1采用了IC-LoRA圖像生成訓練方法，并利用DiT架構來增強文本到圖像的上下文能力。通過多張圖像的拼接與聯(lián)合描述，可以實現(xiàn)關聯(lián)圖像間的組合生成，并保持特征穩(wěn)定連續(xù)。
總之，通義萬相2.1版模型升級在視頻和圖像生成領域取得了顯著進展，為用戶提供了更加優(yōu)質、多樣化的服務。期待通義萬相在未來能夠帶來更多令人驚喜的創(chuàng)新。

免責聲明：本網信息來自于互聯(lián)網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯(lián)系我們，本站將會在24小時內處理完畢。

同類資訊

消息稱某廠新機將全系搭載1216雙揚聲器等，或為榮耀WIN

閃電快訊｜摩爾線程GPU技術路線圖首次公開，展示全棧技術成果

香港創(chuàng)科局張曼莉最新發(fā)聲！

「真還傳」后，首次開講科技春晚，羅永浩要祭出什么大招？

字節(jié)跳動與手機廠商合作，AI手機的“鴻蒙智行”時代要來了？

消息稱蘋果為iPhone Fold嘗試UFG玻璃，技術難點待解

全站最新

消息稱某廠新機將全系搭載1216雙揚聲器等，或為榮耀WIN

閃電快訊｜摩爾線程GPU技術路線圖首次公開，展示全棧技術成果

香港創(chuàng)科局張曼莉最新發(fā)聲！

「真還傳」后，首次開講科技春晚，羅永浩要祭出什么大招？

熱門推薦

消息稱某廠新機將全系搭載1216雙揚聲器等，或為榮耀WIN

Altman直面1.4萬億美元質疑：只要算力還短缺，OpenAI就必須繼續(xù)燒錢

閃電快訊｜摩爾線程GPU技術路線圖首次公開，展示全棧技術成果

奧爾特曼腦機公司分拆獨立，要用超聲波“聽”你的想法

谷歌仍是最大威脅！奧爾特曼坦言OpenAI將常態(tài)化AI紅色警報

香港創(chuàng)科局張曼莉最新發(fā)聲！

「真還傳」后，首次開講科技春晚，羅永浩要祭出什么大招？

字節(jié)跳動與手機廠商合作，AI手機的“鴻蒙智行”時代要來了？

消息稱蘋果為iPhone Fold嘗試UFG玻璃，技術難點待解

QCY N20耳機開啟新品預約，129元享大動圈與50dB降噪

摩爾線程發(fā)布新一代GPU架構，打造MUSA生態(tài)對標英偉達CUDA

預售價9999元，摩爾線程發(fā)布AI算力筆記本

國產算力邁入“萬卡”時代：摩爾線程發(fā)布新一代GPU架構，中科曙光發(fā)布萬卡超集群

全球首臺商用超臨界二氧化碳發(fā)電機組成功商運

ESG戰(zhàn)略升級：AI與綠色金融賦能從成本壓力到全球競爭力