剛剛，讓谷歌翻身的Gemini 3，上線Flash版

IP屬地中國·北京 機器之心Pro 時間：2025-12-18 12:24:21

機器之心編輯部
OpenAI 還在卷跑分，谷歌已經打穿應用層了。
北京時間周四零點，Google 發布了高速、低成本模型 Gemini 3 Flash，作為其今年大模型領域的收官之作。
該模型基于上個月發布的 Gemini 3，明顯帶有搶 OpenAI 風頭的意味。與此同時，Google 還將 Gemini 3 Flash 設為 Gemini 應用和搜索 AI 模式中的默認模型。
這款新的 Flash 模型距離 Google 發布 Gemini 2.5 Flash 僅過去六個月，但在性能上實現了顯著躍升。基準測試顯示，Gemini 3 Flash 相比前代模型有大幅提升，并在部分指標上達到了 Gemini 3 Pro 和 GPT-5.2 等前沿模型的水平。
在智能 / 成本上，它成為了全球性價比最高的模型。

例如，在 Humanity’s Last Exam 基準測試中（該測試旨在評估模型在不同專業領域的綜合能力），在不使用工具的情況下，Gemini 3 Flash 取得了 33.7% 的成績。作為對比，Gemini 3 Pro 的得分為 37.5%，Gemini 2.5 Flash 為 11%，而新發布的 GPT-5.2 則為 34.5%。
與此同時，谷歌也將這款新模型在全球范圍內向數以百萬計的用戶開放，覆蓋以下渠道：
開發者：通過 Google AI Studio 中的 Gemini API、Gemini CLI，以及全新的智能體開發平臺 Google Antigravity所有用戶：通過 Gemini 應用，以及搜索中的 AI 模式（AI Mode in Search）企業用戶：通過 Vertex AI 和 Gemini Enterprise
Gemini 3 Flash 發布后，大家第一時間進行了使用測試，發現這個 AI 回答問題的響應速度基本都在 1 秒以內，的確是跟搜索引擎一樣快。而且它在回答問題的時候相比以前更加詳細，知識的覆蓋面、準確性也很高，看起來像是默認聯網的。
網友們猜測，Gemini 3 Flash 可以被谷歌用來代替搜索引擎，或是逐漸移植到移動端側。不論如何，新模型都預示著 AI 模型的新時代正在到來。
Gemini 3 Flash：規模化的前沿智能
Gemini 3 Flash 證明了，速度與規模并不必然以犧牲智能為代價。在多項博士級推理與知識基準測試中，例如 GPQA Diamond（90.4%）和 Humanity’s Last Exam（在不使用工具的情況下為 33.7%），Gemini 3 Flash 均展現出前沿級性能，可與更大規模的前沿模型相媲美，并在多項基準測試中顯著超越了此前最強的 2.5 代模型 ——Gemini 2.5 Pro。
同時，在多模態推理基準 MMMU Pro 上，Gemini 3 Flash 以 81.2% 的高分達到了當前最先進水平，其表現與 Gemini 3 Pro 不相上下。

從基準測試上可以看到，Gemini 3 Flash 性能強大，在各方面都超越了 Gemini 2.5 Pro，甚至在 ARC-AGI-2 和 SWE-Bench Verified 測試中勝過了 Gemini 3 Pro。
現在，精簡后的模型（體積縮小 3-4 倍）已經超越了 6 個月前的「前沿」模型。
除了具備前沿級的推理能力和多模態能力之外，Gemini 3 Flash 在設計之初就以極高的效率為目標，進一步推動了質量與成本、速度之間的帕累托前沿。
在最高思考等級下運行時，Gemini 3 Flash 能夠動態調節自身的思考深度：面對更復雜的使用場景，它會投入更長時間進行推理；而在處理日常任務時，則能以更高性能完成目標，同時在典型業務流量下，平均使用的 token 數量比 Gemini 2.5 Pro 減少約 30%。
這使得 Gemini 3 Flash 能夠在保證準確性的同時，以更低的成本和更高的效率完成日常任務。

Jeff Dean 表示：「我們再次突破了效率與智能之間的帕累托邊界。」
Gemini 3 Flash 的核心優勢在于其極致的原生速度，延續并強化了開發者和消費者早已青睞的 Flash 系列特性。根據 Artificial Analysis 的基準測試結果，Gemini 3 Flash 在性能上超越 Gemini 2.5 Pro 的同時，速度提升達到 3 倍，而成本僅為其一小部分。
在定價方面，Gemini 3 Flash 的費用為：
輸入：每 100 萬 token 收費 0.50 美元輸出：每 100 萬 token 收費 3 美元音頻輸入：仍為每 100 萬 token 收費 1 美元

Gemini 3 Flash 在速度和效率上均顯著優于 Gemini 2.5 Pro。在上一代模型尚未完成處理之前，Gemini 3 Flash 已經生成了復雜圖形、3D 模型以及一個 Web 應用。
面向開發者：始終跟得上節奏的智能
Gemini 3 Flash 專為高頻迭代開發而打造，在保持低延遲的同時，提供 Gemini 3 Pro 級別的代碼能力，能夠在高并發、快節奏的工作流中迅速進行推理并解決問題。
在用于評估代碼智能體能力的基準測試 SWE-bench Verified 上，Gemini 3 Flash 取得了 78% 的成績，不僅超越了 2.5 系列模型，也優于 Gemini 3 Pro。
這使 Gemini 3 Flash 在智能體編程（agentic coding）、生產級系統以及高響應性的交互式應用場景中，實現了性能、速度與成本之間的理想平衡。
Gemini 3 Flash 在推理能力、工具使用以及多模態能力方面的強勁表現，使其非常適合希望開展更復雜的視頻分析、數據抽取和視覺問答（Visual Q&A）的開發者。這也意味著，它能夠支撐更具智能水平的應用場景 —— 例如游戲內助手或 A/B 測試實驗，在這些場景中，既需要快速響應，又要求深度推理能力。

Gemini 3 Flash 在一款手勢追蹤的投球解謎游戲中實現了多模態推理，提供了近乎實時的 AI 輔助。

Gemini 3 Flash 能夠近乎實時地構建和進行 A/B 測試新的加載指示器設計，從而簡化了從設計到編碼的流程。
采用 Gemini 3 Flash 的企業反饋非常積極。包括 JetBrains、Bridgewater Associates 和 Figma 在內的多家公司，已經開始使用該模型推動業務轉型，并認可其在推理速度、效率以及推理能力方面的表現，能夠與更大規模的模型相媲美。
目前，Gemini 3 Flash 已通過 Vertex AI 和 Gemini Enterprise 正式向企業客戶開放。
Cursor 開發者體驗副總裁表示，他們的工程師發現，Gemini 3 Flash 與 Cursor 的 Debug Mode 配合使用效果非常出色。該模型在問題排查和定位 Bug 根本原因方面表現出速度快、準確性高的優勢。

面向所有人：Gemini 3 Flash 全球上線
Gemini 3 Flash 現已成為 Gemini 應用的默認模型，取代了 2.5 Flash。這意味著全球 Gemini 用戶都已能免費體驗 Gemini 3，從而大幅提升日常任務的處理效率。
憑借 Gemini 3 Flash 卓越的多模態推理能力，你可以利用它更快地查看、聆聽和理解各種類型的信息。例如，你可以讓 Gemini 理解視頻和圖像，并在短短幾秒鐘內將這些內容轉化為實用且可行的計劃。

或者，你無需任何編程知識，即可使用語音快速從零開始構建實用的應用程序。只需隨時隨地向 Gemini 發出語音指令，它就能在幾分鐘內將人們零散的想法轉化為功能完善的應用程序。
使用 Gemini 3 Flash 描述一個想法，并在幾分鐘內將其轉化為可行的原型。
Gemini 3 Flash 也正在逐步推廣，谷歌希望它能成為全球用戶使用的搜索功能中 AI 模式的默認模型。
基于 Gemini 3 Pro 的推理能力，搭載 Gemini 3 Flash 的 AI 模式能夠更有效地理解你問題的細微之處。它會考慮查詢的各個方面，提供全面的回復，以易于理解的方式呈現 —— 從網絡上提取實時本地信息和有用的鏈接。最終結果有效地將研究與實際行動相結合：生成條理清晰的分析以及具體的建議。最后，一切都以搜索的速度完成。
在處理需要考慮多個因素的復雜目標時，例如計劃一次說走就走的旅行，或快速學習復雜的教育概念，這項功能尤其出色。
谷歌表示，Gemini 3 Flash 現已通過 Google AI Studio、Google Antigravity、Vertex AI 和 Gemini Enterprise 中的 Gemini API 提供預覽版。你還可以通過其他開發者工具（例如 Gemini CLI 和 Android Studio）訪問新模型。此外，它也已開始在 Gemini 應用和搜索的 AI 模式中面向所有用戶推出。
參考鏈接：https://blog.google/products/gemini/gemini-3-flash/
文中視頻鏈接：
https://mp.weixin.qq.com/s/a47cr-7HwZ78gsFRaszEIg

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

AI投入再加碼，消息稱理想汽車在硅谷成立新研發中心

湖南電信與華為打造全國首個2.1GHz 8T8R 45MHz連片覆蓋5G網

曝蔚來推行新渠道合作模式：用戶開店、不涉及授權，派人現場賣車

對話火山引擎譚待：多數人低估了火山拿下 AI 云的決心

理論應用 | 知識經濟遇上AI變革（上）

“天才少女”羅福莉亮相背后：曾被雷軍親自點將，能成小米新王牌？

全站最新

AI投入再加碼，消息稱理想汽車在硅谷成立新研發中心

湖南電信與華為打造全國首個2.1GHz 8T8R 45MHz連片覆蓋5G網

曝蔚來推行新渠道合作模式：用戶開店、不涉及授權，派人現場賣車

對話火山引擎譚待：多數人低估了火山拿下 AI 云的決心

熱門推薦

AI投入再加碼，消息稱理想汽車在硅谷成立新研發中心

湖南電信與華為打造全國首個2.1GHz 8T8R 45MHz連片覆蓋5G網

曝蔚來推行新渠道合作模式：用戶開店、不涉及授權，派人現場賣車

對話火山引擎譚待：多數人低估了火山拿下 AI 云的決心

理論應用 | 知識經濟遇上AI變革（上）

“天才少女”羅福莉亮相背后：曾被雷軍親自點將，能成小米新王牌？

受半導體短缺影響，本田在華工廠被曝將停產數日

不要慌！大利好，來了！

曝蘋果放棄VR頭顯，轉向AI眼鏡！附未來兩年最全產品圖

OpenAI搶灘高校：ChatGPT許可在美公立大學賣出了70萬份，全球超100萬份

歐洲頂尖神經學家感慨：這就是中國的力量…

24小時蔬菜，7日鮮蛋明天，京東七鮮石家莊首店開業，刷新“新鮮”認知

從年初到歲末國產GPU為何刮起“上市風暴”？

韓副總理：中國或成為比美國更強的AI競爭對手

報告：2025年1-10月中國新能源乘用車L2級及以上輔助駕駛功能裝車率達87%