![]()
智東西
編譯 陳駿達
編輯 李水青
智東西12月18日報道,昨晚,谷歌發布了Gemini 3 Flash,旨在用更低的成本提供前沿的智能水平。
具體來看,它輸出每百萬token的價格僅為Claude Sonnet 4.5的20%、GPT-5.2的21%,卻能在基準測試上達到甚至超越這些旗艦級模型的水平。
即便是和Gemini 3 Pro相比,Gemini 3 Flash也極具性價比。Flash的價格僅為Pro的25%,卻在MMMU-Pro、SWE-bench Verified這些核心基準測試上,超過了Pro版本的模型。
![]()
此前發布的Gemini 3系列模型在復雜推理、多模態和視覺理解、智能體及Vibe Coding任務方面都展現出優勢,Gemini 3 Flash保留了這一基礎,將Gemini 3 Pro級別的推理能力與Flash級別的延遲、效率和成本相結合。
谷歌首席科學家Jeff Dean稱,Gemini 3 Flash不僅比2.5 Pro質量更高,速度也快3倍,而且價格僅為后者的幾分之一。以下是并排演示:
(視頻)
Gemini 3 Flash目前已經全面開放,開發者可通過Google AI Studio中的Gemini API、Gemini CLI以及智能體開發平臺Google Antigravity使用。而普通用戶能通過Gemini應用程序和谷歌搜索中的AI模式使用。
一、專為迭代式開發打造,還幫你用“嘴編程”
Gemini 3 Flash究竟能做什么?谷歌稱,這是一款專為迭代式開發打造的模型,能夠以低延遲提供接近Gemini 3 Pro級別的編程性能。
谷歌分享了多個案例。比如,Gemini 3 Flash可以在一個手部追蹤的“彈球解謎游戲”中實現多模態推理,提供近乎實時的AI輔助。
它還可以近乎實時地構建和A/B測試新的加載動畫設計,簡化了從設計到代碼的流程。
使用多模態推理,Gemini 3 Flash可快速分析帶有上下文UI覆蓋層的圖像,并生成字幕,最終將靜態圖像轉化為交互式體驗。
憑借在推理、工具使用和多模態能力方面的出色表現,Gemini 3 Flash 特別適合希望進行更復雜視頻分析、數據提取和視覺問答的開發者。
Gemini 3 Flash的多模態推理能力可用于幫助用戶看、聽和理解任何類型的信息。
用戶可以要求Gemini理解視頻和圖像,并在幾秒鐘內將該內容轉化為有幫助且可操作的計劃。
Gemini應用程序中的Gemini 3 Flash可以分析短視頻內容并給你一個計劃,比如如何改進你的高爾夫揮桿。
由于Gemini 3 Flash針對速度進行了優化,它可以在你仍在繪圖時就“看到”并猜出你畫的是什么。
你可以上傳一段錄音,Gemini 3 Flash將識別你的知識盲點,創建一個自定義測驗,并對答案給出詳細解釋。
或者,也可以嘗試“用嘴編程”,僅用語音輸入從零開始構建有趣、有用的應用程序。Gemini 3 Flash可以在幾分鐘內將非結構化的想法轉化為一個功能正常的應用程序。
二、多領域性能超越Pro級模型,可自動調節思考量
Gemini 3 Flash在基準測試上表現如何?它在GPQA Diamond(90.4%)和Humanity’s Last Exam(不使用工具時為33.7%)等博士級推理和知識基準測試中,可與更大的前沿模型相媲美,并且在多項基準測試中顯著優于Gemini 2.5 Pro。
在評估編碼智能體能力的基準測試SWE-bench Verified中,Gemini 3 Flash取得78%的成績,不僅超越了2.5系列,也超過了Gemini 3 Pro。
它還在MMMU Pro上達到了81.2%的分數,與Gemini 3 Pro相當,實現了最先進的性能。
在下圖中展示的基準測試中,Gemini 3 Flash在幾乎所有基準測試上都超過了Claude Sonnet 4.5、Gemini 2.5 Pro等模型。
![]()
除了前沿級別的推理和多模態能力外,Gemini 3 Flash的構建旨在實現高效率,推動了質量與成本、速度之間的帕累托邊界。下方散點圖顯示了多個語言模型的LMArena Elo得分與每百萬tokens價格的關系,其中一條線標出了穿過Gemini 3 Pro’、Gemini 3 Flash和Gemini 3 Flash Lite的帕累托邊界。
![]()
在思考預算拉滿時,Gemini 3 Flash能夠調節其思考量。對于更復雜的用例,它可能會思考更長時間。但根據典型流量測量,在以更高的性能準確完成日常任務的前提下,它平均比2.5 Pro少使用30%的tokens。
結語:Gemini 3模型版圖補全,有望深度嵌入日常應用
Gemini 3系列模型自發布以來就廣受好評,不過其高昂的成本讓不少用戶望而卻步。Gemini 3 Flash補全了Gemini 3家族在輕量化、高性價比方面的布局,回應了開發者在真實生產環境里的訴求。
從迭代式開發、Vibe Coding,到多模態應用、實時交互和智能體系統,Gemini 3 Flash所展現的更高性價比,有望幫助智能更廣泛地嵌入日常應用和商業系統之中。





京公網安備 11011402013531號