美東時間12月17日,谷歌官宣推出Gemini 3家族的新成員Gemini 3 Flash。這款主打快速高效的新模型發布當天即取代Gemini 2.5 Flash成為Gemini App的默認模型,并同步成為谷歌搜索AI模式的默認驅動系統。
據介紹,Gemini 3 Flash在多項基準測試中展現出接近甚至超越更大型模型的表現。在SWE-bench Verified基準測試中,Gemini 3 Flash的解決率達到78%,僅次于GPT-5.2的80%,不僅超越Gemini 2.5系列,甚至優于同門的Gemini 3 Pro,Pro的準確率為76.2%。
![]()
另外,3 Flash擁有前沿的智能技術,速度更快,價格卻遠低于同類產品。3 Flash 基于3 Pro 強大的多模態、編碼和智能體功能,在價格不到3 Pro 四分之一的情況下,提供了更強大的性能和更高的速率限制。新款3 Flash 在多項基準測試中超越了2.5 Pro,速度更快。模型還配備了我們最先進的視覺和空間推理功能,并新增了代碼執行功能,可用于縮放、計數和編輯視覺輸入。
在 Gemini API 和 Vertex AI 中,Gemini 3 Flash 的定價為每百萬個輸入令牌0.50美元,每百萬個輸出令牌3美元(音頻輸入仍為每百萬個輸入令牌1美元)。它標配上下文緩存,在令牌重復使用超過特定閾值的情況下,可節省90% 的成本。同樣,3 Flash 目前也適用于Batch API,可節省50% 的成本,并大幅提高異步處理的速率限制。對于同步和近實時用例,付費 API 客戶還可以使用生產就緒的速率限制。
谷歌DeepMind的Gemini產品管理高級總監Tulsee Doshi稱,谷歌將Flash定位為老黃牛式的模型。該模型保持了接近Gemini 3 Pro的推理能力,同時運行速度達到Gemini 2.5 Pro的三倍,成本僅為Gemini 3 Pro的四分之一。
在博士級推理和知識基準GPQA Diamond上,Gemini 3 Flash的得分為90.4%。雖然低于GPT-5.2的92.4%和Gemini 3 Pro的91.9%,但其他對手得分還都不到90%。
![]()
在保持智能的同時,3 Flash實現了極高的效率,突破了性能與效率的帕累托極限。它的性能超越了 2.5 Pro,速度提升了 3 倍(基于人工智能分析基準測試),而成本卻遠低于后者。即使在最低的智能水平下,3 Flash 的性能也常常優于之前版本在高智能水平下的表現。





京公網安備 11011402013531號