3月25日,OpenAI對GPT-4o和Sora進行了重大更新,提供了全新文生圖模型。除了文生圖之外,該模型還支持自定義操作、連續發問、風格轉換、圖像PPT等超實用功能。

OpenAI首席執行官奧爾特曼在周二直播活動中宣布,正式推出基于GPT-4o模型的原生圖像生成功能,不再調用獨立的DALL-E文生圖模型。此前,ChatGPT于2022年底上線時僅支持文字聊天,約一年后集成DALL-E 3圖像生成模型,但二者系統獨立。而此前AI圖像生成器“理解提示詞能力差”“無法準確生成圖片中的文字”等問題,嚴重限制了其在教育、職場等領域的應用。

此次升級后,ChatGPT圖像生成功能進步顯著。它能大致準確按照提示詞生成圖像中的文本,在生成黑板板書、印刷體、科學常識繪圖等涉及圖像文字的場景中,從幾乎不可用達到接近商用水平。圖像編輯功能也更加實用,如可將合照轉化為動畫畫風,根據簡單提示詞生成相對論漫畫彩圖,還能根據漫畫草稿一鍵上色、更換主要角色。在商業應用方面,模型可根據用戶上傳照片和卡片模板自定義生成新卡片,還能基于聊天上下文生成具有一致性的系列圖像,這對游戲角色設計意義重大。
不過,OpenAI承認新圖像生成器存在局限性,會受到模型幻覺影響,在密集文字和非拉丁語文字圖像生成方面易出問題。自周二起,該功能向所有免費和付費用戶推出,未來幾周內開發者可通過API調用。此次升級無疑為ChatGPT的發展注入新動力,也讓人期待其在更多領域的應用表現。





京公網安備 11011402013531號