IT之家 12 月 25 日消息,阿里通義 Qwen 團隊于 12 月 23 日上線推出 Qwen-Image-Edit-2511 全新圖像編輯模型,在 Qwen-Image-Edit-2509 基礎上,減輕圖像漂移、提升人物一致性、集成 LoRA 能力、增強工業設計生成能力,以及強化幾何推理能力。
該模型作為通義家族在視覺生成領域的最新嘗試,專門針對“圖像編輯”場景進行了優化。不同于傳統的文生圖模型(Text-to-Image),該模型主要解決的是“在保持原圖主體結構不變的前提下,對特定區域進行精準修改”這一行業難題,為開發者和設計師提供了更高效的 AI 輔助工具。
Qwen-Image-Edit-2511 的最大亮點在于其強大的指令遵循能力(Instruction Following)。用戶無需掌握復雜的 Photoshop 圖層技術,也不必手動繪制選區,只需輸入類似“將畫面中的貓換成狗”或“移除背景中的路人”等自然語言指令,模型即可自動理解意圖并執行操作。
該模型通過深度融合視覺編碼器與語言模型,能夠精確識別圖像中的語義對象,確保在修改目標物體的同時,最大限度地保留原圖的光影、紋理及背景一致性。
Qwen-Image-Edit-2511 進一步改善人物一致性,保留主體的身份特征和視覺風格的情況下,能夠基于輸入的人像進行富有想象力的編輯。IT之家附上相關圖片如下:




新模型進一步增強了多人合影場景中的一致性表現 —— 能夠將兩張獨立的人物圖像高保真地融合為一張協調的群像照片:

Qwen-Image-Edit-2511 將部分精選的熱門 LoRA 直接集成到基礎模型中,無需額外微調即可啟用其效果。例如,光照增強 LoRA 下,用戶可開箱即用地實現逼真的光照控制:

Qwen-Image-Edit-2511 引入了更強的幾何推理能力,例如,可直接為設計或標注目的生成輔助構造線:






京公網安備 11011402013531號