一個月前,谷歌發布了最新的 Gemini,從此我們進入了 Gemini 3 的時代。
那以后, Gemini 3 Pro 就成了我干活的主力。
但說實話,它反應是真慢,而且很多時候我只是問些簡單問題,完全沒必要深度思考。
所以,一直期待速度飛快的 Flash 系列重新回來。
終于,在今天,Gemini 3 Flash 來了!

圖:谷歌 CEO 宣布 Gemini 3 Flash 發布
谷歌這一波操作屬實把我驚到了。
官方號稱它“比快更快”,而且智商不減反增。
本來是一個“小弟”人設,但你看看它排名,居然僅次于OpenAI 最新的模型 GPT 5.2了。(就差 2 分
)
真讓人情何以堪吶?

圖:第三方機構評測 Gemini 3 Flash 的綜合指標
廢話不多說,咱們趕緊來扒一扒,這個新出的 Flash 到底香不香。
01 到底是個啥?
簡單來說:把 Pro 的腦子,裝進了 Flash 的身體里。
以前我們對“Flash(輕量級)”模型的印象是什么?
跑得快,便宜,但是……有點“笨”。處理復雜任務時經常翻車。
但這次 Gemini 3 Flash 徹底打破了這個刻板印象。
遇到閑聊、簡單查詢: 它就輕裝上陣,秒回,省流又省錢;
遇到燒腦難題: 它能立馬調動深層算力,像老教授一樣深思熟慮。
它大腦似乎有個變速箱。
它甚至在性能、成本和速度方面突破了帕累托極限。(AI 界的性價比極限)

圖:Gemini 3 Flash 在性能、成本和速度方面突破了帕累托極限
官方數據顯示,它的 Token 消耗比 Gemini 2.5 Pro 少了 30%,但智商卻在線。
說人話就是:多快好省!

圖:Token 消耗率對比
這種“該省省,該花花”的 AI,誰不愛?
02 憑數據說話:這波“以下犯上”有點狠
咱們不整那些虛頭巴腦的形容詞,直接看跑分數據,谷歌這次是真的下了血本。
我看了一眼實測數據,甚至有點不敢相信:它在很多任務上接近自家最強的模型 3 Pro,甚至有些指標還干掉了Pro 版。(這樣禮貌嗎?
)
特別是那個讓無數 AI 汗流浹背的 ARC-AGI-2 測試……
還讓人意想不到的是:Gemini 3 Flash 全面碾壓了上一代的旗艦版本 2.5 Pro。(前浪死在沙灘上
)

圖: Gemini 3 Flash 的各項指標
先說說這個 ARC-AGI-2。
之前 GPT 5.2 發布讓大家印象深刻,其中有一個原因就是這個指標碾壓所有模型。
老粉都知道,ARC 評測集是 AI 圈最難啃的骨頭,甚至沒有之一, 主要測試模型到底有沒有腦子。
它是由 Keras 之父 François Chollet 搞出來的,專門用來反死記硬背的。
比如這種題目:

圖:ARC-AGI 2 題目
以前的模型,MMLU 這種考試能拿 90 分,一碰到 ARC 這種需要“舉一反三”的智力題,立馬現原形,得分低得可憐。
這項指標 Flash 竟然超過了自己的 Pro 大哥,僅次于 GPT-5.2!
這個小弟,要造反了有點腦子!
在另一項指標: GPQA Diamond(研究生級別的專家推理測試)里,它拿了 90.4 分。
意思就是智商堪比博士。
看這個數字,它的推理能力已經和那些大塊頭的前沿模型(Pro 版)平起平坐了。
在著名的“Humanity's Last Exam(人類最后一場考試)”這種地獄級難度的測試里,Gemini 3 Flash 居然考出了 43.5% 的高分(Tools on 模式)。

圖:HLE 分數對比
它跟 GPT-5.2(45.5%)這種超級旗艦模型,只差了不到 2 分!
朋友們,別忘了,這可是一個 Flash 模型啊!
它的定位本來是“跑腿小弟”,結果一不小心把“業界大佬”們的飯碗給砸了。(面子?不存在的。
)
這哪里是“輕量版”,這分明是“披著閃電俠外衣的超人”。
在多模態測試(MMMU Pro)中得分 81.2%,看圖、看視頻的能力基本和 Gemini 3 Pro 五五開。
也就是,眼神兒更好使。

圖:MMMU-Pro 指標對比
最讓我意外的是這個——在 SWE-bench Verified(代碼智能體測試)中,它得分 78%。
直接超越了 Gemini 2.5 全系,甚至在某些這就需要改代碼的任務上,比 Gemini 3 Pro 還要好用!
本來以為它動動嘴還行,沒想到寫代碼更溜!
一句話總結:它不是“丐版”,它是“精簡版戰神”。
03 為什么我建議你立馬換用 Flash?
作為這一年多幾乎天天都在用 AI 的人,我覺得 Gemini 3 Flash 帶來的改變是肉眼可見的:
1. 真的太快了!??
根據第三方測評(Artificial Analysis),它的速度是 2.5 Pro 的 3 倍。
以前問 AI 一個問題,你可能還得切出去回個消息等它寫完。
現在?你字剛打完,它答案就懟到你臉上了。
這種“跟手”的感覺,對于我們需要快速寫文案、改代碼的人來說,簡直是救命。
2. 價格那是相當感人





京公網安備 11011402013531號