“為速度而生的前沿智能”,12月18日凌晨,谷歌發布博客,官宣又一王炸Gemini 3 Flash,這是Gemini 3 系列速度最快、性價比最高的模型,也是但同時,這次被行業關注的點在于,這個Flash模型在做到又快又便宜的同時,部分性能甚至能比旗艦模型要好。
值得注意的是,這也是谷歌一個月內在大模型領域的第四次動作更新。
![]()
谷歌CEO桑達爾·皮查伊(Sundar Pichai)發帖介紹,Gemini 3 Flash性能和效率均突破了帕累托極限,它的性能超越了上一代旗艦模型2.5 Pro,同時速度提升了 3 倍,而價格卻低得多。
“Gemini 3 Flash 證明,速度和規模無需以犧牲智能為代價。”在博客中,官方放出豪言。從評測數據來看確實如此。
在用于評估編程能力的基準測試 SWE-bench Verified 中,Gemini 3 Flash 的得分高達 78%,超越了自家的旗艦模型Gemini 3 Pro和Anthropic旗下的Claude Sonnet 4.5;在多模態理解基準 MMMU-Pro 上,Flash得分81.2%,不僅超過 GPT-5.2(79.5%),還甩開 Claude Sonnet 4.5 十幾個百分點。
![]()
種種數據表明,這次的Flash模型進步很大,突破了用戶印象里的輕量化模型:快、便宜,但是性能往往會打折。而Gemini 3 Flash做到了接近旗艦的能力,同時滿足效率和性價比。
根據大模型競技場Imarena.ai的數據,目前Gemini 3 Flash在文本、圖像和編程領域排名前 5,數學和創意寫作類別排名第2,是性價比最高的前沿模型,輸入僅0.5 美元/百萬Tokens,輸出3美元/百萬Tokens。
作為對比,Claude Sonnet 4.5的輸出是15美元/百萬Tokens,GPT-5.2的輸出是14美元/百萬Tokens,是Gemini 3 Flash定價的近5倍。
谷歌表示,在最高思維水平下進行處理時,Gemini 3 Flash 能夠靈活調整其思考時間。對于更復雜的應用場景,它可能需要更長的思考時間,但根據典型流量的測試結果,它平均使用的令牌數量會比上一代的2.5 Pro 少 30%,從而以更高的性能更準確地完成日常任務。
Gemini 3 Flash保留了Gemini 3 在復雜推理、多模態、智能體和編程任務方面的突破性性能,同時結合了 Flash級別的延遲、效率和成本優勢相結合。“這是迄今為止在智能體工作流程方面最出色的模型。”谷歌稱。
一位開發者用Gemini 3 Flash和“兩個性價比之王”做了Python對比測試,其中一個是OpenAI的性價比版本GPT-5Mini、一個是國產開源之光DeepSeek-V3.2。
結果顯示,成本上三個模型差不多,但是速度上Gemini 3 Flash只要9秒,而GPT-5 Mini、DeepSeek-V3.2分別用了35秒和41秒,同時效果上Gemini 3 Flash勝出,這是一個平衡了速度和性能的模型。
“更快、更便宜、還能免費用,這才是獨立開發者和小團隊真正需要的東西。”一位獨立開發者發文表示,如果之前是用 GPT-4o或Gemini 3 Pro跑應用,換成Gemini 3 Flash,成本預計能直接降50%-70%。
從今天起,Gemini 3 Flash將面向所有用戶推出,即便是免費用戶也能用上,在Gemini App 里,Gemini 3 Flash 會替代2.5 Flash成為新的默認模型,而Gemini 3 Pro則是留給用戶處理高難度數學和代碼問題的一個選擇。
上個月,谷歌推出了Gemini 3 Pro和Gemini 3 Deep Think,獲得了廣泛的市場認可,并反超OpenAI成為大模型領域的領先者。博客提到,自發布以來,內部的API 每天處理超過1萬億個tokens。用戶經常使用 Gemini 3 進行代碼模擬,學習復雜的主題,構建和設計交互式游戲,并理解各種類型的多模態內容。
憑借性價比和性能,此次推出的Flash預計將受到更大程度上的歡迎,谷歌表示,Flash一直是內部最受歡迎的版本,此前的Flash 2和 Flash 2.5 處理著數百萬開發者構建的數十萬個應用程序中數萬億個tokens。
“Flash模型真正為開發者量身打造,而 Flash3則讓他們無需再在速度和智能之間做出妥協。”谷歌又一張王牌露出,留給OpenAI應戰的時間不多了。





京公網安備 11011402013531號