![]()
科技巨頭谷歌密集發布AI(人工智能)模型。
當地時間11月20日,谷歌旗下圖像生成模型Nano Banana在推出三個月后迎來重磅更新,基于谷歌最新大模型Gemini 3 Pro搭建的Nano Banana Pro正式亮相。同時,谷歌為用戶提供了更簡單的數字水印驗證方式,提高AI內容的透明度。
據介紹,Nano Banana Pro能夠“以空前的控制力、改進的文字呈現和增強的世界知識,將用戶的構想變成工作室級的設計”,不僅在細節表現力、圖像分辨率和文本渲染準確性方面均有升級,還能以不同風格、字體和語言生成文本。
首先,Nano Banana Pro的文字渲染能力獲得大幅提升。結合多模態理解能力,模型可以直接把圖片中的文字翻譯成其他語言,并保持原有的設計風格不變。
![]()
Nano Banana Pro的文字渲染能力獲得大幅提升。谷歌
此外,還改進了局部編輯功能,并加入互聯網搜索能力。用戶可以選擇、優化和調整圖像的任何部分,調整相機角度、改變焦點和色彩分級,甚至改變場景光照。Nano Banana Pro能夠生成分辨率高達2K和4K的圖像,并支持調整寬高比。
在一致性方面,Nano Banana Pro也實現了大幅提升,現在支持輸入最多14張圖片,在復雜場景的生成結果中也能保持一致性。該模型還能夠在生成結果中保持最多5位人物的一致性和相似度。
![]()
根據提示詞,Nano Banana Pro能夠在復雜構圖中保持多輸入的一致性。谷歌
同時,谷歌宣布,用戶將可以直接用Gemini鑒定一張圖片是否由谷歌AI生成。谷歌表示,所有由谷歌工具生成的媒介都嵌入了SynthID數字水印,用戶從現在起可以將圖片上傳到Gemini應用,輕松查詢圖片是否由Google AI生成,這項驗證方式將很快擴展到音頻和視頻。
目前,Nano Banana Pro已經在Gemini應用中開放使用,免費用戶擁有限定的使用次數,超出后會回到Nano Banana模型,Google AI Plus、Pro和Ultra訂閱用戶則享有更高的配額。該模型也從即日起在設計軟件Adobe Photoshop和Firefly中提供。
一經發布,Nano Banana Pro和Gemini 3一樣獲得了熱烈反響。兩天前,谷歌正式發布新一代多模態AI模型Gemini 3,包括Gemini 3 Pro和增強型推理模式Gemini 3 Deep Think兩個版本。該模型基于谷歌TPU(張量處理單元)進行訓練,不僅橫掃各大基準測試榜單,還展現了Gemini系列在多模態領域的一貫優勢。
在AI競賽中,谷歌一直在努力追趕OpenAI。分析指出,隨著Gemini 3的發布,兩家公司之間的競爭愈演愈烈。一周前,OpenAI發布了讓ChatGPT“更智能、對話感更強、更易于定制”的GPT-5.1。11月19日,OpenAI又毫無預告地發布了GPT-5.1 Pro和代碼模型GPT-5.1-Codex-Max。
在發布Gemini 3時,谷歌CEO桑達爾·皮查伊(Sundar Pichai)表示,目前每月有20億用戶使用AI概覽(谷歌搜索的AI Overviews功能),Gemini app的月用戶量已突破6.5億。
11月20日,受到大盤普跌的影響,谷歌(Nasdaq:GOOGL)跌1.03%收于每股289.98美元,總市值3.49萬億美元。今年以來,谷歌股價已漲超50%。





京公網安備 11011402013531號