狙擊Open AI！谷歌一個月內連發“數彈”

IP屬地中國·北京 第一財經資訊 時間：2025-12-18 10:21:42

“為速度而生的前沿智能”，12月18日凌晨，谷歌發布博客，官宣又一王炸Gemini 3 Flash，這是Gemini 3 系列速度最快、性價比最高的模型，也是但同時，這次被行業關注的點在于，這個Flash模型在做到又快又便宜的同時，部分性能甚至能比旗艦模型要好。
值得注意的是，這也是谷歌一個月內在大模型領域的第四次動作更新。

谷歌CEO桑達爾·皮查伊（Sundar Pichai）發帖介紹，Gemini 3 Flash性能和效率均突破了帕累托極限，它的性能超越了上一代旗艦模型2.5 Pro，同時速度提升了 3 倍，而價格卻低得多。
“Gemini 3 Flash 證明，速度和規模無需以犧牲智能為代價。”在博客中，官方放出豪言。從評測數據來看確實如此。
在用于評估編程能力的基準測試 SWE-bench Verified 中，Gemini 3 Flash 的得分高達 78%，超越了自家的旗艦模型Gemini 3 Pro和Anthropic旗下的Claude Sonnet 4.5；在多模態理解基準 MMMU-Pro 上，Flash得分81.2%，不僅超過 GPT-5.2（79.5%），還甩開 Claude Sonnet 4.5 十幾個百分點。

種種數據表明，這次的Flash模型進步很大，突破了用戶印象里的輕量化模型：快、便宜，但是性能往往會打折。而Gemini 3 Flash做到了接近旗艦的能力，同時滿足效率和性價比。
根據大模型競技場Imarena.ai的數據，目前Gemini 3 Flash在文本、圖像和編程領域排名前 5，數學和創意寫作類別排名第2，是性價比最高的前沿模型，輸入僅0.5 美元/百萬Tokens，輸出3美元/百萬Tokens。
作為對比，Claude Sonnet 4.5的輸出是15美元/百萬Tokens，GPT-5.2的輸出是14美元/百萬Tokens，是Gemini 3 Flash定價的近5倍。
谷歌表示，在最高思維水平下進行處理時，Gemini 3 Flash 能夠靈活調整其思考時間。對于更復雜的應用場景，它可能需要更長的思考時間，但根據典型流量的測試結果，它平均使用的令牌數量會比上一代的2.5 Pro 少 30%，從而以更高的性能更準確地完成日常任務。
Gemini 3 Flash保留了Gemini 3 在復雜推理、多模態、智能體和編程任務方面的突破性性能，同時結合了 Flash級別的延遲、效率和成本優勢相結合。“這是迄今為止在智能體工作流程方面最出色的模型。”谷歌稱。
一位開發者用Gemini 3 Flash和“兩個性價比之王”做了Python對比測試，其中一個是OpenAI的性價比版本GPT-5Mini、一個是國產開源之光DeepSeek-V3.2。
結果顯示，成本上三個模型差不多，但是速度上Gemini 3 Flash只要9秒，而GPT-5 Mini、DeepSeek-V3.2分別用了35秒和41秒，同時效果上Gemini 3 Flash勝出，這是一個平衡了速度和性能的模型。
“更快、更便宜、還能免費用，這才是獨立開發者和小團隊真正需要的東西。”一位獨立開發者發文表示，如果之前是用 GPT-4o或Gemini 3 Pro跑應用，換成Gemini 3 Flash，成本預計能直接降50%-70%。
從今天起，Gemini 3 Flash將面向所有用戶推出，即便是免費用戶也能用上，在Gemini App 里，Gemini 3 Flash 會替代2.5 Flash成為新的默認模型，而Gemini 3 Pro則是留給用戶處理高難度數學和代碼問題的一個選擇。
上個月，谷歌推出了Gemini 3 Pro和Gemini 3 Deep Think，獲得了廣泛的市場認可，并反超OpenAI成為大模型領域的領先者。博客提到，自發布以來，內部的API 每天處理超過1萬億個tokens。用戶經常使用 Gemini 3 進行代碼模擬，學習復雜的主題，構建和設計交互式游戲，并理解各種類型的多模態內容。
憑借性價比和性能，此次推出的Flash預計將受到更大程度上的歡迎，谷歌表示，Flash一直是內部最受歡迎的版本，此前的Flash 2和 Flash 2.5 處理著數百萬開發者構建的數十萬個應用程序中數萬億個tokens。
“Flash模型真正為開發者量身打造，而 Flash3則讓他們無需再在速度和智能之間做出妥協。”谷歌又一張王牌露出，留給OpenAI應戰的時間不多了。

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

華為云城市峰會在烏蘭察布召開，當地已吸引67個數據中心項目

火山引擎的「火」，是怎么點起來的

馬斯克：非自動駕駛燃油車終將消亡最終的競爭力是智能化

XREAL 1S發布：3299元起，用一副眼鏡把500英寸巨幕“戴”在身上

歐洲頂尖神經學家：中國為科學家提供“絕佳機遇”

“元寶AI自動回復太像真人”引質疑騰訊為其發聲

全站最新

華為云城市峰會在烏蘭察布召開，當地已吸引67個數據中心項目

火山引擎的「火」，是怎么點起來的

馬斯克：非自動駕駛燃油車終將消亡最終的競爭力是智能化

XREAL 1S發布：3299元起，用一副眼鏡把500英寸巨幕“戴”在身上

熱門推薦

寒武紀增資至4.22億

大曉機器人正式發布行業首創的ACE具身研發范式

賽力斯公布車輛轉向防碰撞專利

邢自強：中國在人工智能上的投資十分有效

華為云城市峰會在烏蘭察布召開，當地已吸引67個數據中心項目

火山引擎的「火」，是怎么點起來的

馬斯克：非自動駕駛燃油車終將消亡最終的競爭力是智能化

XREAL 1S發布：3299元起，用一副眼鏡把500英寸巨幕“戴”在身上

歐洲頂尖神經學家：中國為科學家提供“絕佳機遇”

“元寶AI自動回復太像真人”引質疑騰訊為其發聲

2035年去月球“上班”！青年科學家蘇萌描繪未來圖景

中國氣象局：到2035年全面建成數值預報與人工智能優勢互補、融合統一的地球系統預報體系

電動巴士訂單排滿明年，比亞迪計劃在巴西擴建

海南封關首日iPhone最高可減2140元

中國氣象局：未來十年將在一批關鍵核心技術上實現突破