狙擊Open AI！谷歌一個月內(nèi)連發(fā)“數(shù)彈”

IP屬地中國·北京 第一財經(jīng)資訊 時間：2025-12-18 10:25:26

“為速度而生的前沿智能”，12月18日凌晨，谷歌發(fā)布博客，官宣又一王炸Gemini 3 Flash，這是Gemini 3 系列速度最快、性價比最高的模型，也是但同時，這次被行業(yè)關(guān)注的點(diǎn)在于，這個Flash模型在做到又快又便宜的同時，部分性能甚至能比旗艦?zāi)Ｐ鸵谩?/p>
值得注意的是，這也是谷歌一個月內(nèi)在大模型領(lǐng)域的第四次動作更新。

谷歌CEO桑達(dá)爾·皮查伊（Sundar Pichai）發(fā)帖介紹，Gemini 3 Flash性能和效率均突破了帕累托極限，它的性能超越了上一代旗艦?zāi)Ｐ?.5 Pro，同時速度提升了 3 倍，而價格卻低得多。
“Gemini 3 Flash 證明，速度和規(guī)模無需以犧牲智能為代價。”在博客中，官方放出豪言。從評測數(shù)據(jù)來看確實如此。
在用于評估編程能力的基準(zhǔn)測試 SWE-bench Verified 中，Gemini 3 Flash 的得分高達(dá) 78%，超越了自家的旗艦?zāi)Ｐ虶emini 3 Pro和Anthropic旗下的Claude Sonnet 4.5；在多模態(tài)理解基準(zhǔn) MMMU-Pro 上，F(xiàn)lash得分81.2%，不僅超過 GPT-5.2（79.5%），還甩開 Claude Sonnet 4.5 十幾個百分點(diǎn)。

種種數(shù)據(jù)表明，這次的Flash模型進(jìn)步很大，突破了用戶印象里的輕量化模型：快、便宜，但是性能往往會打折。而Gemini 3 Flash做到了接近旗艦的能力，同時滿足效率和性價比。
根據(jù)大模型競技場Imarena.ai的數(shù)據(jù)，目前Gemini 3 Flash在文本、圖像和編程領(lǐng)域排名前 5，數(shù)學(xué)和創(chuàng)意寫作類別排名第2，是性價比最高的前沿模型，輸入僅0.5 美元/百萬Tokens，輸出3美元/百萬Tokens。
作為對比，Claude Sonnet 4.5的輸出是15美元/百萬Tokens，GPT-5.2的輸出是14美元/百萬Tokens，是Gemini 3 Flash定價的近5倍。
谷歌表示，在最高思維水平下進(jìn)行處理時，Gemini 3 Flash 能夠靈活調(diào)整其思考時間。對于更復(fù)雜的應(yīng)用場景，它可能需要更長的思考時間，但根據(jù)典型流量的測試結(jié)果，它平均使用的令牌數(shù)量會比上一代的2.5 Pro 少 30%，從而以更高的性能更準(zhǔn)確地完成日常任務(wù)。
Gemini 3 Flash保留了Gemini 3 在復(fù)雜推理、多模態(tài)、智能體和編程任務(wù)方面的突破性性能，同時結(jié)合了 Flash級別的延遲、效率和成本優(yōu)勢相結(jié)合。“這是迄今為止在智能體工作流程方面最出色的模型。”谷歌稱。
一位開發(fā)者用Gemini 3 Flash和“兩個性價比之王”做了Python對比測試，其中一個是OpenAI的性價比版本GPT-5Mini、一個是國產(chǎn)開源之光DeepSeek-V3.2。
結(jié)果顯示，成本上三個模型差不多，但是速度上Gemini 3 Flash只要9秒，而GPT-5 Mini、DeepSeek-V3.2分別用了35秒和41秒，同時效果上Gemini 3 Flash勝出，這是一個平衡了速度和性能的模型。
“更快、更便宜、還能免費(fèi)用，這才是獨(dú)立開發(fā)者和小團(tuán)隊真正需要的東西。”一位獨(dú)立開發(fā)者發(fā)文表示，如果之前是用 GPT-4o或Gemini 3 Pro跑應(yīng)用，換成Gemini 3 Flash，成本預(yù)計能直接降50%-70%。
從今天起，Gemini 3 Flash將面向所有用戶推出，即便是免費(fèi)用戶也能用上，在Gemini App 里，Gemini 3 Flash 會替代2.5 Flash成為新的默認(rèn)模型，而Gemini 3 Pro則是留給用戶處理高難度數(shù)學(xué)和代碼問題的一個選擇。
上個月，谷歌推出了Gemini 3 Pro和Gemini 3 Deep Think，獲得了廣泛的市場認(rèn)可，并反超OpenAI成為大模型領(lǐng)域的領(lǐng)先者。博客提到，自發(fā)布以來，內(nèi)部的API 每天處理超過1萬億個tokens。用戶經(jīng)常使用 Gemini 3 進(jìn)行代碼模擬，學(xué)習(xí)復(fù)雜的主題，構(gòu)建和設(shè)計交互式游戲，并理解各種類型的多模態(tài)內(nèi)容。
憑借性價比和性能，此次推出的Flash預(yù)計將受到更大程度上的歡迎，谷歌表示，F(xiàn)lash一直是內(nèi)部最受歡迎的版本，此前的Flash 2和 Flash 2.5 處理著數(shù)百萬開發(fā)者構(gòu)建的數(shù)十萬個應(yīng)用程序中數(shù)萬億個tokens。
“Flash模型真正為開發(fā)者量身打造，而 Flash3則讓他們無需再在速度和智能之間做出妥協(xié)。”谷歌又一張王牌露出，留給OpenAI應(yīng)戰(zhàn)的時間不多了。

免責(zé)聲明：本網(wǎng)信息來自于互聯(lián)網(wǎng)，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點(diǎn)。其內(nèi)容真實性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系我們，本站將會在24小時內(nèi)處理完畢。

同類資訊

男女情感里，這一細(xì)節(jié)竟能暴露真心？

同事嫉妒你升職？這3種反擊策略，讓局面反轉(zhuǎn)！

婆媳相處的5種絕妙模式，第3種讓家庭氛圍超和諧！

婚姻里易被忽視的3個問題，第3個影響重大！

7 月 2 日十二生肖運(yùn)勢全解析，看看你的運(yùn)勢如何！

十二星座，7月2日運(yùn)勢揭秘，快來看看你的幸運(yùn)走向！

全站最新

華為云城市峰會在烏蘭察布召開，當(dāng)?shù)匾盐?7個數(shù)據(jù)中心項目

火山引擎的「火」，是怎么點(diǎn)起來的

馬斯克：非自動駕駛?cè)加蛙嚱K將消亡最終的競爭力是智能化

XREAL 1S發(fā)布：3299元起，用一副眼鏡把500英寸巨幕“戴”在身上

熱門推薦

人民幣對美元即期匯率升至7.04，創(chuàng)14個多月新高

9年換8帥！長城魏牌陷“換帥魔咒”

時隔16年，我國再次對鋼鐵實施出口許可證管理，商務(wù)部回應(yīng)

超9萬輛豐田車因軟件缺陷召回！涉及雷克薩斯、埃爾法等車型……

H股赴A雙重上市背后，百奧賽圖以創(chuàng)新底色描繪全球新藥發(fā)源地藍(lán)圖

谷歌披露“Project Suncatcher”計劃，中國企業(yè)如何接招？

不是假體檢！但愛康國賓的麻煩還沒完

商務(wù)部：強(qiáng)烈反對歐委會密集對中國企業(yè)發(fā)起調(diào)查

身負(fù)資金輸送“前科”，母公司爆雷祥源文旅能否幸免？

0票否決后萬科緊急加碼！補(bǔ)加增信措施欲打動債權(quán)人

70億豪擲瀘州！中科電氣投建鋰離子電池相關(guān)項目，年產(chǎn)量達(dá)30萬噸

花1億元買單陳年糾紛，重慶啤酒這事干的有格局？

港股尾盤走強(qiáng)！關(guān)注今晚大事件，明天日本央行或加息、股指期貨交割

絲芭傳媒維權(quán)風(fēng)波：偶像產(chǎn)業(yè)背后的法律與道德博弈

君禾股份：跨境電商突圍+倉儲網(wǎng)絡(luò)深耕，雙向拓寬銷售渠道