旗下最強模型Gemini 3 Pro發布才過一個月,谷歌就進一步向OpenAI發起挑戰。
美東時間17日周三,谷歌宣布推出Gemini 3家族的新成員Flash。這款主打快速高效的新模型發布當天即取代Gemini 2.5 Flash成為Gemini App的默認模型,并同步成為谷歌搜索AI模式的默認驅動系統,標志著谷歌在AI競賽中的分發優勢正轉化為實質性的市場攻勢。
![]()
谷歌正將其最強AI能力以更低成本、更快速度推向全球數百萬用戶。谷歌DeepMind的Gemini產品管理高級總監Tulsee Doshi稱,谷歌將Flash定位為老黃牛式的模型。該模型保持了接近Gemini 3 Pro的推理能力,同時運行速度達到Gemini 2.5 Pro的三倍,成本僅為Gemini 3 Pro的四分之一。
Doshi表示:"幾周前我們發布了Pro,對市場反響感到興奮。通過Gemini 3 Flash,我們將這個模型帶給所有人。" 他還提到,評估代理編程能力的基準測試SWE-bench Verified顯示,Gemini 3 Flash性能還優于Gemini 3 Pro。
Gemini 3 Flash的發布正值谷歌與OpenAI競爭的日趨白熱化。谷歌11月18日發布的Gemini 3系列促使OpenAI本月初拉響紅色警報。上周報道稱,Gemini在每周移動應用下載量、月活躍用戶和全球網站訪問量等指標上的增長率最近均超過ChatGPT,但ChatGPT 11月下旬仍壟斷90%的移動端會話。上周OpenAI推出GPT-5.2迎戰,本周二又發布新的圖像生成模型GPT Image 1.5。
業內人士認為,這場日益演變為谷歌與OpenAI二元對抗的AI競賽不僅對人工智能(AI)技術本身,也對整個經濟產生重大影響。這種持續不斷的發布周期反映了模型競賽前沿領域殘酷的競爭本質,任何公司都可能迅速從領先者淪為陪跑者。雖然OpenAI擁有先發優勢,但Gemini在搜索和谷歌核心應用中的分發能力更為廣泛。自Gemini 3發布以來,谷歌API每天處理的token數量已超過1萬億。
性能持平旗艦模型 編程能力超越同門Pro
Gemini 3 Flash在多項基準測試中展現出接近甚至超越更大型模型的表現。
在SWE-bench Verified基準測試中,Gemini 3 Flash的解決率達到78%,僅次于GPT-5.2的80%,不僅超越Gemini 2.5系列,甚至優于同門的Gemini 3 Pro,Pro的準確率為76.2%。
![]()
在跨領域專業知識測試Humanity's Last Exam中,Gemini 3 Flash在不使用工具的情況下得分33.7%,雖低于Gemini 3 Pro的37.5%和GPT-5.2的34.5%,但遠超Gemini 2.5 Flash的11%。
在多模態推理基準測試MMMU-Pro中,Gemini 3 Flash以81.2%的得分超越包括Gemini 2.5和Gemini 3 Pro在內的所有競爭對手。
在博士級推理和知識基準GPQA Diamond上,Gemini 3 Flash的得分為90.4%。雖然低于GPT-5.2的92.4%和Gemini 3 Pro的91.9%,但其他對手得分還都不到90%。
![]()
Doshi對媒體表示:“我們將Flash定位為更像老黃牛的模型。從輸入和輸出價格來看,Flash從成本角度來說是便宜得多的產品,這實際上允許許多公司進行批量任務。”
成本優勢明顯 速度是2.5 Pro三倍
Gemini 3 Flash的定價為每100萬輸入token 0.50美元,每100萬輸出token 3.00美元。雖然略高于Gemini 2.5 Flash的每100萬輸入token 0.30美元和輸出token 2.50美元,但谷歌表示,新一代Flash模型性能超越Gemini 2.5 Pro,速度卻達到其三倍。
更重要的是,在處理需要思考的任務時,Gemini 3 Flash平均使用的token數量比2.5 Pro少30%。這意味著盡管單位價格略高,但在某些任務中用戶的總體token消耗量會減少,最終實現成本節約。
![]()
Gemini 3 Flash在Gemini API和Vertex AI平臺中還配備標準上下文緩存功能,能夠在重復使用token達到一定閾值的應用中實現高達90%的成本削減。
谷歌強調,Gemini 3 Flash能夠以不到Gemini 3 Pro四分之一的成本支持AI代理工作流,同時提供更高的速率限制。
![]()
全面覆蓋產品線 橋水、Salesforce等企業客戶已“嘗鮮”
Gemini 3 Flash即日起面向全球用戶推出,覆蓋消費者、開發者和企業三大群體。在Gemini App中,所有全球用戶可免費使用該模型,用戶仍可從模型選擇器中切換至Pro模型處理數學和編程問題。在谷歌搜索的AI模式中,Gemini 3 Flash成為默認模型,美國用戶還可訪問更強大的Gemini 3 Pro進行深度思考任務。
對于開發者,該模型已通過Google AI Studio、Gemini CLI、Vertex AI和上月發布的新代碼工具Antigravity提供預覽版本,也可通過Android Studio等開發工具訪問。企業用戶可通過Vertex AI和Gemini Enterprise獲取服務。
谷歌介紹,多家知名企業已開始使用Gemini 3 Flash進行業務轉型,并得到他們的熱烈反響,這些企業認可該模型的推理速度、效率和推理能力,認為它與更大的模型不相上下。
據谷歌,軟件開發公司JetBrains AI工具生態系統負責人Denis Shiryaev表示:"在我們的JetBrains AI Chat和Junie代理編程評估中,Gemini 3 Flash提供了接近Gemini 3 Pro的質量,同時推理延遲和成本顯著降低。"
全球最大對沖基金橋水(Bridgewater Associates)的AIA Labs負責人兼首席科學家Jasjeet Sekhon表示:“在橋水,我們需要能夠在不犧牲概念理解的情況下處理大量非結構化多模態數據集的模型。Gemini 3 Flash是第一個以我們工作流程所需的速度和規模提供Pro級深度的模型。”
Salesforce、Workday、Figma、Cursor、Harvey和Latitude等公司也已采用該模型。谷歌搜索產品副總裁Robby Stein表示,新Flash模型將幫助用戶處理具有多個條件的更精細搜索,例如查找適合有幼兒的父母的晚間活動。





京公網安備 11011402013531號