谷歌和 OpenAI 徹底殺瘋了,在 OpenAI 發(fā)布圖像模型的一天后,當(dāng)?shù)貢r間 12 月 17 日谷歌正式發(fā)布 Gemini 3 Flash,其宣傳語是“以極低的成本,實現(xiàn)速度極快的尖端智能”。
3 Flash 讓極速智能進(jìn)入了主力機時代,實現(xiàn)了 3 倍提速和成本驟降,零代碼也能造應(yīng)用,開啟了氛圍編程,實現(xiàn)了口述即原型。谷歌官方稱其速度堪比搜索引擎,它在保持 Pro 級智商的同時,將 tokens 消耗降低了 30%,旨在重塑大模型性價比天花板。
![]()
(資料圖)
在此時發(fā)布這樣一個快速且價格低廉的 3 Flash,或許意圖搶占 OpenAI 的圖像模型的風(fēng)頭。而在基準(zhǔn)測試中,3 Flash 大幅超越了其前代產(chǎn)品,并在某些方面與 Gemini 3 Pro 和 GPT 5.2 等其他前沿模型不相上下。
谷歌表示,3 Flash 擁有前沿智能,專為速度而生,可以幫助用戶更快地學(xué)習(xí)、構(gòu)建和規(guī)劃任何事物。它可以很好地識別多模態(tài)內(nèi)容,并據(jù)此給出答案。
例如,可以上傳一段匹克球短視頻并尋求技巧指導(dǎo);也可以嘗試?yán)L制一幅素描畫,讓模型猜猜你畫的是什么;或者可以上傳一段錄音以便獲得分析結(jié)果或者生成測驗。該模型可以更好地理解用戶查詢的意圖,并能生成包含圖像和表格等元素在內(nèi)的更具視覺沖擊力的答案。
其氛圍編程能力具體指的是,無需任何編程知識,就能用語音快速構(gòu)建應(yīng)用程序。只需對著 Gemini 進(jìn)行口述,就能在幾分鐘內(nèi)將零散想法轉(zhuǎn)化為一個功能齊全的應(yīng)用程序。
即使你沒有任何編程基礎(chǔ),也能快速從零開始構(gòu)建應(yīng)用程序,只需讓 Gemini 幫助迭代你的想法即可。用戶可以隨時隨地口述自己的靈感,并將其轉(zhuǎn)化為原型。
3 Flash 的 AI 模式能夠更有效地解析問題的細(xì)微差別。它會考慮用戶問題的每一個方面,并提供更全面、更易于理解的答案,比如它會從全網(wǎng)提取實時本地信息和實用鏈接。最終,它能讓用戶獲得一份條理清晰的分析報告和具體建議。
3 Flash 保留了 Gemini 3 的復(fù)雜推理、多模態(tài)/視覺理解以及在智能體/氛圍編程任務(wù)中的出色性能。3 Flash 在各方面都超越了 2.5 Flash,并且在多項基準(zhǔn)測試中顯著優(yōu)于 2.5 Pro。3 Flash 也與 3 Pro 性能相當(dāng),在 MMMU Pro、Toolathlon 和 MPC Atlas 等方面更勝一籌。
![]()
(資料圖)
在 GPQA 鉆石級(科學(xué)知識)上其準(zhǔn)確率達(dá)到 90.4%,在人類最后的考試(學(xué)術(shù)推理)上其在不使用工具時的得分為 33.7%,在 MMMU Pro(多模態(tài)理解和多模態(tài)推理上)其達(dá)到 81.2% 的正確率,在 SWE-Bench 驗證(代碼理解)上其達(dá)到 78% 的正確率,在工具競賽(長期真實世界軟件任務(wù))上其達(dá)到 49.4% 的正確率,在 MCP Atlas(使用 MCP 的多步驟工作流程)上其達(dá)到 57.4% 的準(zhǔn)確率。
![]()
(資料圖)
谷歌宣稱,F(xiàn)lash 3 的性能比 2.5 Pro 快 3 倍,成本卻低得多。并表示這種強大的產(chǎn)品邏輯、工具使用和多模態(tài)功能,可以為構(gòu)建客戶支持代理或游戲內(nèi)助手的第三方開發(fā)者帶來更復(fù)雜的視頻分析、數(shù)據(jù)提取和視覺問答功能。
其定價為每百萬個輸入 tokens 0.5 美元,每百萬個輸出 tokens 3 美元,音頻輸入仍為每百萬個輸入 tokens 1 美元。
但是谷歌聲稱,新模型的性能優(yōu)于 Gemini 2.5 Pro,速度也是后者的三倍。而且,在處理思維任務(wù)的時候,它平均比 2.5 Pro 少用 30% 的 tokens。這意味著,在某些任務(wù)中有望帶來 tokens 的節(jié)約。
Gemini 大模型高級總監(jiān)兼產(chǎn)品負(fù)責(zé)人圖爾西·多希(Tulsee Doshi)告訴媒體:“我們真正地將 Flash 定位為更加偏向主力機型的模型。如果看一下輸入價格和輸出價格,就會發(fā)現(xiàn) Flash 要便宜得多。因此,它可以幫助許多公司完成批量性的任務(wù)。”
3 Flash 現(xiàn)在已經(jīng)在 Gemini 應(yīng)用中推出,并將取代 2.5 Flash 成為默認(rèn)模型。值得注意的是,3 Flash 將在型號選擇中提供兩種選項:第一種是快速選項用于快速解答問題;第二種是思考選項用于解決復(fù)雜問題。它也允許用戶提出更細(xì)致的問題。
谷歌指出,JetBrains、Figma、Cursor、Harvey 和 Latitude 等公司已經(jīng)在使用 3 Flash 模型,該模型可以通過 Vertex AI 和 Gemini Enterprise 獲取。
與此同時,谷歌正在向所有美國用戶開放配備生成式用戶界面以及搭載了 Nano Banana Pro 的 Gemini 3 Pro。對于開發(fā)者而言,3 Flash 預(yù)覽版現(xiàn)已可通過 AI Studio、Google Antigravity、Gemini CLI 和 Android Studio 獲取。
事實上,自從發(fā)布 Gemini 3 以來,谷歌每天在其 API 上處理超過一萬億個 tokens,同時與 OpenAI 展開了激烈的發(fā)布進(jìn)度競爭和性能競爭。
本月初,由于谷歌在消費者市場上份額的上升,ChatGPT 的流量開始出現(xiàn)下滑,OpenAI CEO 山姆·奧特曼(Sam Altman)為此向 OpenAI 內(nèi)部發(fā)了一份內(nèi)部紅色警報備忘錄。
此后不久,OpenAI 發(fā)布了 GPT 5.2 和一個新的圖像生成模型。OpenAI 還宣稱其企業(yè)應(yīng)用日益增長,并表示自 2024 年 11 月以來,ChatGPT 的消息量增長了 8 倍。雖然谷歌沒有直接回應(yīng)與 OpenAI 的競爭,但其表示此次新模型的發(fā)布將促使所有公司進(jìn)行積極參與。
參考資料:
https://blog.google/products/gemini/gemini-3-flash/
排版:劉雅坤





京公網(wǎng)安備 11011402013531號