“為速度而生的前沿智能”,12月18日凌晨,谷歌發(fā)布博客,官宣又一王炸Gemini 3 Flash,這是Gemini 3 系列速度最快、性價比最高的模型,也是但同時,這次被行業(yè)關(guān)注的點(diǎn)在于,這個Flash模型在做到又快又便宜的同時,部分性能甚至能比旗艦?zāi)P鸵谩?/p>
值得注意的是,這也是谷歌一個月內(nèi)在大模型領(lǐng)域的第四次動作更新。
![]()
谷歌CEO桑達(dá)爾·皮查伊(Sundar Pichai)發(fā)帖介紹,Gemini 3 Flash性能和效率均突破了帕累托極限,它的性能超越了上一代旗艦?zāi)P?.5 Pro,同時速度提升了 3 倍,而價格卻低得多。
“Gemini 3 Flash 證明,速度和規(guī)模無需以犧牲智能為代價。”在博客中,官方放出豪言。從評測數(shù)據(jù)來看確實如此。
在用于評估編程能力的基準(zhǔn)測試 SWE-bench Verified 中,Gemini 3 Flash 的得分高達(dá) 78%,超越了自家的旗艦?zāi)P虶emini 3 Pro和Anthropic旗下的Claude Sonnet 4.5;在多模態(tài)理解基準(zhǔn) MMMU-Pro 上,F(xiàn)lash得分81.2%,不僅超過 GPT-5.2(79.5%),還甩開 Claude Sonnet 4.5 十幾個百分點(diǎn)。
![]()
種種數(shù)據(jù)表明,這次的Flash模型進(jìn)步很大,突破了用戶印象里的輕量化模型:快、便宜,但是性能往往會打折。而Gemini 3 Flash做到了接近旗艦的能力,同時滿足效率和性價比。
根據(jù)大模型競技場Imarena.ai的數(shù)據(jù),目前Gemini 3 Flash在文本、圖像和編程領(lǐng)域排名前 5,數(shù)學(xué)和創(chuàng)意寫作類別排名第2,是性價比最高的前沿模型,輸入僅0.5 美元/百萬Tokens,輸出3美元/百萬Tokens。
作為對比,Claude Sonnet 4.5的輸出是15美元/百萬Tokens,GPT-5.2的輸出是14美元/百萬Tokens,是Gemini 3 Flash定價的近5倍。
谷歌表示,在最高思維水平下進(jìn)行處理時,Gemini 3 Flash 能夠靈活調(diào)整其思考時間。對于更復(fù)雜的應(yīng)用場景,它可能需要更長的思考時間,但根據(jù)典型流量的測試結(jié)果,它平均使用的令牌數(shù)量會比上一代的2.5 Pro 少 30%,從而以更高的性能更準(zhǔn)確地完成日常任務(wù)。
Gemini 3 Flash保留了Gemini 3 在復(fù)雜推理、多模態(tài)、智能體和編程任務(wù)方面的突破性性能,同時結(jié)合了 Flash級別的延遲、效率和成本優(yōu)勢相結(jié)合。“這是迄今為止在智能體工作流程方面最出色的模型。”谷歌稱。
一位開發(fā)者用Gemini 3 Flash和“兩個性價比之王”做了Python對比測試,其中一個是OpenAI的性價比版本GPT-5Mini、一個是國產(chǎn)開源之光DeepSeek-V3.2。
結(jié)果顯示,成本上三個模型差不多,但是速度上Gemini 3 Flash只要9秒,而GPT-5 Mini、DeepSeek-V3.2分別用了35秒和41秒,同時效果上Gemini 3 Flash勝出,這是一個平衡了速度和性能的模型。
“更快、更便宜、還能免費(fèi)用,這才是獨(dú)立開發(fā)者和小團(tuán)隊真正需要的東西。”一位獨(dú)立開發(fā)者發(fā)文表示,如果之前是用 GPT-4o或Gemini 3 Pro跑應(yīng)用,換成Gemini 3 Flash,成本預(yù)計能直接降50%-70%。
從今天起,Gemini 3 Flash將面向所有用戶推出,即便是免費(fèi)用戶也能用上,在Gemini App 里,Gemini 3 Flash 會替代2.5 Flash成為新的默認(rèn)模型,而Gemini 3 Pro則是留給用戶處理高難度數(shù)學(xué)和代碼問題的一個選擇。
上個月,谷歌推出了Gemini 3 Pro和Gemini 3 Deep Think,獲得了廣泛的市場認(rèn)可,并反超OpenAI成為大模型領(lǐng)域的領(lǐng)先者。博客提到,自發(fā)布以來,內(nèi)部的API 每天處理超過1萬億個tokens。用戶經(jīng)常使用 Gemini 3 進(jìn)行代碼模擬,學(xué)習(xí)復(fù)雜的主題,構(gòu)建和設(shè)計交互式游戲,并理解各種類型的多模態(tài)內(nèi)容。
憑借性價比和性能,此次推出的Flash預(yù)計將受到更大程度上的歡迎,谷歌表示,F(xiàn)lash一直是內(nèi)部最受歡迎的版本,此前的Flash 2和 Flash 2.5 處理著數(shù)百萬開發(fā)者構(gòu)建的數(shù)十萬個應(yīng)用程序中數(shù)萬億個tokens。
“Flash模型真正為開發(fā)者量身打造,而 Flash3則讓他們無需再在速度和智能之間做出妥協(xié)。”谷歌又一張王牌露出,留給OpenAI應(yīng)戰(zhàn)的時間不多了。





京公網(wǎng)安備 11011402013531號