旗下最強(qiáng)模型Gemini 3 Pro發(fā)布才過(guò)一個(gè)月,谷歌就進(jìn)一步向OpenAI發(fā)起挑戰(zhàn)。
美東時(shí)間17日周三,谷歌宣布推出Gemini 3家族的新成員Flash。這款主打快速高效的新模型發(fā)布當(dāng)天即取代Gemini 2.5 Flash成為Gemini App的默認(rèn)模型,并同步成為谷歌搜索AI模式的默認(rèn)驅(qū)動(dòng)系統(tǒng),標(biāo)志著谷歌在AI競(jìng)賽中的分發(fā)優(yōu)勢(shì)正轉(zhuǎn)化為實(shí)質(zhì)性的市場(chǎng)攻勢(shì)。
![]()
谷歌正將其最強(qiáng)AI能力以更低成本、更快速度推向全球數(shù)百萬(wàn)用戶。谷歌DeepMind的Gemini產(chǎn)品管理高級(jí)總監(jiān)Tulsee Doshi稱,谷歌將Flash定位為老黃牛式的模型。該模型保持了接近Gemini 3 Pro的推理能力,同時(shí)運(yùn)行速度達(dá)到Gemini 2.5 Pro的三倍,成本僅為Gemini 3 Pro的四分之一。
Doshi表示:"幾周前我們發(fā)布了Pro,對(duì)市場(chǎng)反響感到興奮。通過(guò)Gemini 3 Flash,我們將這個(gè)模型帶給所有人。" 他還提到,評(píng)估代理編程能力的基準(zhǔn)測(cè)試SWE-bench Verified顯示,Gemini 3 Flash性能還優(yōu)于Gemini 3 Pro。
Gemini 3 Flash的發(fā)布正值谷歌與OpenAI競(jìng)爭(zhēng)的日趨白熱化。谷歌11月18日發(fā)布的Gemini 3系列促使OpenAI本月初拉響紅色警報(bào)。上周報(bào)道稱,Gemini在每周移動(dòng)應(yīng)用下載量、月活躍用戶和全球網(wǎng)站訪問(wèn)量等指標(biāo)上的增長(zhǎng)率最近均超過(guò)ChatGPT,但ChatGPT 11月下旬仍壟斷90%的移動(dòng)端會(huì)話。上周OpenAI推出GPT-5.2迎戰(zhàn),本周二又發(fā)布新的圖像生成模型GPT Image 1.5。
業(yè)內(nèi)人士認(rèn)為,這場(chǎng)日益演變?yōu)楣雀枧cOpenAI二元對(duì)抗的AI競(jìng)賽不僅對(duì)人工智能(AI)技術(shù)本身,也對(duì)整個(gè)經(jīng)濟(jì)產(chǎn)生重大影響。這種持續(xù)不斷的發(fā)布周期反映了模型競(jìng)賽前沿領(lǐng)域殘酷的競(jìng)爭(zhēng)本質(zhì),任何公司都可能迅速?gòu)念I(lǐng)先者淪為陪跑者。雖然OpenAI擁有先發(fā)優(yōu)勢(shì),但Gemini在搜索和谷歌核心應(yīng)用中的分發(fā)能力更為廣泛。自Gemini 3發(fā)布以來(lái),谷歌API每天處理的token數(shù)量已超過(guò)1萬(wàn)億。
性能持平旗艦?zāi)P?編程能力超越同門(mén)Pro
Gemini 3 Flash在多項(xiàng)基準(zhǔn)測(cè)試中展現(xiàn)出接近甚至超越更大型模型的表現(xiàn)。
在SWE-bench Verified基準(zhǔn)測(cè)試中,Gemini 3 Flash的解決率達(dá)到78%,僅次于GPT-5.2的80%,不僅超越Gemini 2.5系列,甚至優(yōu)于同門(mén)的Gemini 3 Pro,Pro的準(zhǔn)確率為76.2%。
![]()
在跨領(lǐng)域?qū)I(yè)知識(shí)測(cè)試Humanity's Last Exam中,Gemini 3 Flash在不使用工具的情況下得分33.7%,雖低于Gemini 3 Pro的37.5%和GPT-5.2的34.5%,但遠(yuǎn)超Gemini 2.5 Flash的11%。
在多模態(tài)推理基準(zhǔn)測(cè)試MMMU-Pro中,Gemini 3 Flash以81.2%的得分超越包括Gemini 2.5和Gemini 3 Pro在內(nèi)的所有競(jìng)爭(zhēng)對(duì)手。
在博士級(jí)推理和知識(shí)基準(zhǔn)GPQA Diamond上,Gemini 3 Flash的得分為90.4%。雖然低于GPT-5.2的92.4%和Gemini 3 Pro的91.9%,但其他對(duì)手得分還都不到90%。
![]()
Doshi對(duì)媒體表示:“我們將Flash定位為更像老黃牛的模型。從輸入和輸出價(jià)格來(lái)看,F(xiàn)lash從成本角度來(lái)說(shuō)是便宜得多的產(chǎn)品,這實(shí)際上允許許多公司進(jìn)行批量任務(wù)。”
成本優(yōu)勢(shì)明顯 速度是2.5 Pro三倍
Gemini 3 Flash的定價(jià)為每100萬(wàn)輸入token 0.50美元,每100萬(wàn)輸出token 3.00美元。雖然略高于Gemini 2.5 Flash的每100萬(wàn)輸入token 0.30美元和輸出token 2.50美元,但谷歌表示,新一代Flash模型性能超越Gemini 2.5 Pro,速度卻達(dá)到其三倍。
更重要的是,在處理需要思考的任務(wù)時(shí),Gemini 3 Flash平均使用的token數(shù)量比2.5 Pro少30%。這意味著盡管單位價(jià)格略高,但在某些任務(wù)中用戶的總體token消耗量會(huì)減少,最終實(shí)現(xiàn)成本節(jié)約。
![]()
Gemini 3 Flash在Gemini API和Vertex AI平臺(tái)中還配備標(biāo)準(zhǔn)上下文緩存功能,能夠在重復(fù)使用token達(dá)到一定閾值的應(yīng)用中實(shí)現(xiàn)高達(dá)90%的成本削減。
谷歌強(qiáng)調(diào),Gemini 3 Flash能夠以不到Gemini 3 Pro四分之一的成本支持AI代理工作流,同時(shí)提供更高的速率限制。
![]()
全面覆蓋產(chǎn)品線 橋水、Salesforce等企業(yè)客戶已“嘗鮮”
Gemini 3 Flash即日起面向全球用戶推出,覆蓋消費(fèi)者、開(kāi)發(fā)者和企業(yè)三大群體。在Gemini App中,所有全球用戶可免費(fèi)使用該模型,用戶仍可從模型選擇器中切換至Pro模型處理數(shù)學(xué)和編程問(wèn)題。在谷歌搜索的AI模式中,Gemini 3 Flash成為默認(rèn)模型,美國(guó)用戶還可訪問(wèn)更強(qiáng)大的Gemini 3 Pro進(jìn)行深度思考任務(wù)。
對(duì)于開(kāi)發(fā)者,該模型已通過(guò)Google AI Studio、Gemini CLI、Vertex AI和上月發(fā)布的新代碼工具Antigravity提供預(yù)覽版本,也可通過(guò)Android Studio等開(kāi)發(fā)工具訪問(wèn)。企業(yè)用戶可通過(guò)Vertex AI和Gemini Enterprise獲取服務(wù)。
谷歌介紹,多家知名企業(yè)已開(kāi)始使用Gemini 3 Flash進(jìn)行業(yè)務(wù)轉(zhuǎn)型,并得到他們的熱烈反響,這些企業(yè)認(rèn)可該模型的推理速度、效率和推理能力,認(rèn)為它與更大的模型不相上下。
據(jù)谷歌,軟件開(kāi)發(fā)公司JetBrains AI工具生態(tài)系統(tǒng)負(fù)責(zé)人Denis Shiryaev表示:"在我們的JetBrains AI Chat和Junie代理編程評(píng)估中,Gemini 3 Flash提供了接近Gemini 3 Pro的質(zhì)量,同時(shí)推理延遲和成本顯著降低。"
全球最大對(duì)沖基金橋水(Bridgewater Associates)的AIA Labs負(fù)責(zé)人兼首席科學(xué)家Jasjeet Sekhon表示:“在橋水,我們需要能夠在不犧牲概念理解的情況下處理大量非結(jié)構(gòu)化多模態(tài)數(shù)據(jù)集的模型。Gemini 3 Flash是第一個(gè)以我們工作流程所需的速度和規(guī)模提供Pro級(jí)深度的模型。”
Salesforce、Workday、Figma、Cursor、Harvey和Latitude等公司也已采用該模型。谷歌搜索產(chǎn)品副總裁Robby Stein表示,新Flash模型將幫助用戶處理具有多個(gè)條件的更精細(xì)搜索,例如查找適合有幼兒的父母的晚間活動(dòng)。





京公網(wǎng)安備 11011402013531號(hào)