![]()
機器之心編輯部
OpenAI 還在卷跑分,谷歌已經打穿應用層了。
北京時間周四零點,Google 發布了高速、低成本模型 Gemini 3 Flash,作為其今年大模型領域的收官之作。
該模型基于上個月發布的 Gemini 3,明顯帶有搶 OpenAI 風頭的意味。與此同時,Google 還將 Gemini 3 Flash 設為 Gemini 應用和搜索 AI 模式中的默認模型。
這款新的 Flash 模型距離 Google 發布 Gemini 2.5 Flash 僅過去六個月,但在性能上實現了顯著躍升。基準測試顯示,Gemini 3 Flash 相比前代模型有大幅提升,并在部分指標上達到了 Gemini 3 Pro 和 GPT-5.2 等前沿模型的水平。
在智能 / 成本上,它成為了全球性價比最高的模型。
![]()
例如,在 Humanity’s Last Exam 基準測試中(該測試旨在評估模型在不同專業領域的綜合能力),在不使用工具的情況下,Gemini 3 Flash 取得了 33.7% 的成績。作為對比,Gemini 3 Pro 的得分為 37.5%,Gemini 2.5 Flash 為 11%,而新發布的 GPT-5.2 則為 34.5%。
與此同時,谷歌也將這款新模型在全球范圍內向數以百萬計的用戶開放,覆蓋以下渠道:
開發者:通過 Google AI Studio 中的 Gemini API、Gemini CLI,以及全新的智能體開發平臺 Google Antigravity所有用戶:通過 Gemini 應用,以及搜索中的 AI 模式(AI Mode in Search)企業用戶:通過 Vertex AI 和 Gemini Enterprise
Gemini 3 Flash 發布后,大家第一時間進行了使用測試,發現這個 AI 回答問題的響應速度基本都在 1 秒以內,的確是跟搜索引擎一樣快。而且它在回答問題的時候相比以前更加詳細,知識的覆蓋面、準確性也很高,看起來像是默認聯網的。
網友們猜測,Gemini 3 Flash 可以被谷歌用來代替搜索引擎,或是逐漸移植到移動端側。不論如何,新模型都預示著 AI 模型的新時代正在到來。
Gemini 3 Flash:規模化的前沿智能
Gemini 3 Flash 證明了,速度與規模并不必然以犧牲智能為代價。在多項博士級推理與知識基準測試中,例如 GPQA Diamond(90.4%) 和 Humanity’s Last Exam(在不使用工具的情況下為 33.7%),Gemini 3 Flash 均展現出前沿級性能,可與更大規模的前沿模型相媲美,并在多項基準測試中顯著超越了此前最強的 2.5 代模型 ——Gemini 2.5 Pro。
同時,在多模態推理基準 MMMU Pro 上,Gemini 3 Flash 以 81.2% 的高分達到了當前最先進水平,其表現與 Gemini 3 Pro 不相上下。
![]()
從基準測試上可以看到,Gemini 3 Flash 性能強大,在各方面都超越了 Gemini 2.5 Pro,甚至在 ARC-AGI-2 和 SWE-Bench Verified 測試中勝過了 Gemini 3 Pro。
現在,精簡后的模型(體積縮小 3-4 倍)已經超越了 6 個月前的「前沿」模型。
除了具備前沿級的推理能力和多模態能力之外,Gemini 3 Flash 在設計之初就以極高的效率為目標,進一步推動了質量與成本、速度之間的帕累托前沿。
在最高思考等級下運行時,Gemini 3 Flash 能夠動態調節自身的思考深度:面對更復雜的使用場景,它會投入更長時間進行推理;而在處理日常任務時,則能以更高性能完成目標,同時在典型業務流量下,平均使用的 token 數量比 Gemini 2.5 Pro 減少約 30%。
這使得 Gemini 3 Flash 能夠在保證準確性的同時,以更低的成本和更高的效率完成日常任務。
![]()
Jeff Dean 表示:「我們再次突破了效率與智能之間的帕累托邊界。」
Gemini 3 Flash 的核心優勢在于其極致的原生速度,延續并強化了開發者和消費者早已青睞的 Flash 系列特性。根據 Artificial Analysis 的基準測試結果,Gemini 3 Flash 在性能上超越 Gemini 2.5 Pro 的同時,速度提升達到 3 倍,而成本僅為其一小部分。
在定價方面,Gemini 3 Flash 的費用為:
輸入:每 100 萬 token 收費 0.50 美元輸出:每 100 萬 token 收費 3 美元音頻輸入:仍為每 100 萬 token 收費 1 美元
![]()
Gemini 3 Flash 在速度和效率上均顯著優于 Gemini 2.5 Pro。在上一代模型尚未完成處理之前,Gemini 3 Flash 已經生成了復雜圖形、3D 模型以及一個 Web 應用。
面向開發者:始終跟得上節奏的智能
Gemini 3 Flash 專為高頻迭代開發而打造,在保持低延遲的同時,提供 Gemini 3 Pro 級別的代碼能力,能夠在高并發、快節奏的工作流中迅速進行推理并解決問題。
在用于評估代碼智能體能力的基準測試 SWE-bench Verified 上,Gemini 3 Flash 取得了 78% 的成績,不僅超越了 2.5 系列模型,也優于 Gemini 3 Pro。
這使 Gemini 3 Flash 在智能體編程(agentic coding)、生產級系統以及高響應性的交互式應用場景中,實現了性能、速度與成本之間的理想平衡。
Gemini 3 Flash 在推理能力、工具使用以及多模態能力方面的強勁表現,使其非常適合希望開展更復雜的視頻分析、數據抽取和視覺問答(Visual Q&A) 的開發者。這也意味著,它能夠支撐更具智能水平的應用場景 —— 例如游戲內助手或 A/B 測試實驗,在這些場景中,既需要快速響應,又要求深度推理能力。

Gemini 3 Flash 在一款手勢追蹤的投球解謎游戲中實現了多模態推理,提供了近乎實時的 AI 輔助。

Gemini 3 Flash 能夠近乎實時地構建和進行 A/B 測試新的加載指示器設計,從而簡化了從設計到編碼的流程。
采用 Gemini 3 Flash 的企業反饋非常積極。包括 JetBrains、Bridgewater Associates 和 Figma 在內的多家公司,已經開始使用該模型推動業務轉型,并認可其在推理速度、效率以及推理能力方面的表現,能夠與更大規模的模型相媲美。
目前,Gemini 3 Flash 已通過 Vertex AI 和 Gemini Enterprise 正式向企業客戶開放。
Cursor 開發者體驗副總裁表示,他們的工程師發現,Gemini 3 Flash 與 Cursor 的 Debug Mode 配合使用效果非常出色。該模型在問題排查和定位 Bug 根本原因方面表現出速度快、準確性高的優勢。
![]()
面向所有人:Gemini 3 Flash 全球上線
Gemini 3 Flash 現已成為 Gemini 應用的默認模型,取代了 2.5 Flash。這意味著全球 Gemini 用戶都已能免費體驗 Gemini 3,從而大幅提升日常任務的處理效率。
憑借 Gemini 3 Flash 卓越的多模態推理能力,你可以利用它更快地查看、聆聽和理解各種類型的信息。例如,你可以讓 Gemini 理解視頻和圖像,并在短短幾秒鐘內將這些內容轉化為實用且可行的計劃。
![]()
或者,你無需任何編程知識,即可使用語音快速從零開始構建實用的應用程序。只需隨時隨地向 Gemini 發出語音指令,它就能在幾分鐘內將人們零散的想法轉化為功能完善的應用程序。
使用 Gemini 3 Flash 描述一個想法,并在幾分鐘內將其轉化為可行的原型。
Gemini 3 Flash 也正在逐步推廣,谷歌希望它能成為全球用戶使用的搜索功能中 AI 模式的默認模型。
基于 Gemini 3 Pro 的推理能力,搭載 Gemini 3 Flash 的 AI 模式能夠更有效地理解你問題的細微之處。它會考慮查詢的各個方面,提供全面的回復,以易于理解的方式呈現 —— 從網絡上提取實時本地信息和有用的鏈接。最終結果有效地將研究與實際行動相結合:生成條理清晰的分析以及具體的建議。最后,一切都以搜索的速度完成。
在處理需要考慮多個因素的復雜目標時,例如計劃一次說走就走的旅行,或快速學習復雜的教育概念,這項功能尤其出色。
谷歌表示,Gemini 3 Flash 現已通過 Google AI Studio、Google Antigravity、Vertex AI 和 Gemini Enterprise 中的 Gemini API 提供預覽版。你還可以通過其他開發者工具(例如 Gemini CLI 和 Android Studio)訪問新模型。此外,它也已開始在 Gemini 應用和搜索的 AI 模式中面向所有用戶推出。
參考鏈接:https://blog.google/products/gemini/gemini-3-flash/
文中視頻鏈接:
https://mp.weixin.qq.com/s/a47cr-7HwZ78gsFRaszEIg





京公網安備 11011402013531號