Gemini 3 封神了,純粹的強(qiáng)大

奧特曼發(fā)來賀電(說個八卦:Logan 以前是跟 Sam 的)
寫這篇文章前,我把這段 prompt 扔給了剛發(fā)布的 Gemini 3 Pro
prompt:
「編寫一個單文件 HTML 的擬真 GBA 模擬器,使用 CSS 繪制精致的紫色機(jī)身。游戲內(nèi)容為《口袋妖怪》中文版回合制戰(zhàn)斗(皮卡丘 VS 妙蛙種子),需引用 GitHub 原版像素素材并使用 Web Audio 合成音效」
沒有多輪對話,它吐出了一個完整的項目
當(dāng)然...世界還可以更癲狂,這個小學(xué)生練字 依然是一鍵出的
還有這樣的、更離譜的例子,來自 twitter
@YiTayML
@skirano
當(dāng)然了,你的提示詞也不必是文字
而下面這個,來自設(shè)計師藏師傅,:大廠前端,看著設(shè)計稿,figma 設(shè)計稿,他能寫成這樣,第一次走查的時候能寫成這樣,我就燒高香了

這就是今天凌晨,Google 發(fā)布的Gemini 3 。當(dāng)然也不止這個哈基米3
? Gemini 3 Pro:地表最強(qiáng)模型,支持多模態(tài)推理、長上下文、Agentic Coding
? Google Antigravity:一個原生支持 Agent 開發(fā)的平臺,管理 Agent 干活
? Generative UI:在 Google 搜索中,直接生成交互界面
? 全線落地:Android Studio、Firebase、Gemini CLI 全部接入,價格極其激進(jìn)
實打?qū)嵉臄?shù)值怪
先看下跑分吧,Gemini 3 Pro 在 LMArena Leaderboard 拿到了 1501 Elo,斷層領(lǐng)先

LMArena 大模型競技場
在各種榜單中,也是全面超越之前的王者

Gemini 3 跑分對比圖
同時的,對于更長時間跨度的規(guī)劃能力,Gemini 更是遙遙領(lǐng)先,比如這個 Vending-Bench 2 這個測試(你可以叫他做生意榜單)

Vending Bench 2
為了支撐這種執(zhí)行力,Google 將思維鏈(Chain of Thought)做了產(chǎn)品化封裝,引入了 Deep Think(深度思考) 模式:
? Thought Signatures(思維簽名):API 返回中包含加密的“思維過程”,模型在輸出前會多步推理、反思、驗證。這解決了長鏈路邏輯中模型容易“想偏”的問題
? Thinking Levels(思考等級):開發(fā)者在 API 中配置模型“想多久”。對于簡單任務(wù)選擇快速響應(yīng),對于復(fù)雜邏輯選擇深度思考

思考的結(jié)果
效果立竿見影:
? 在 Humanity’s Last Exam(人類終極考試)中,開啟 Deep Think 模式后,Gemini 3 Pro 的得分從 37.5% 飆升至 41.0%
? 在 GPQA Diamond 測試中更是達(dá)到了 93.8%。這是在沒有任何外部工具輔助下,純粹依靠模型推理達(dá)到的高度
Coding 工具
最近流行一個詞:Vibe Coding,你只需要描述你想要的“感覺”(Vibe)和功能,模型就能把它實現(xiàn)出來
目前,Gemini 3 Pro 也是最強(qiáng)的 Vibe Coding 模型

遙遙領(lǐng)先
更牛逼的是,Google 還為此交付了兩套重型生產(chǎn)力工具,Google Antigravity 和 Gemini CLI
全新的 Google Antigravity

Antigravity
這東西的定位,是 Agent 時代的 IDE,如果 VS Code 是為“人”設(shè)計的,Antigravity 就是為“人 + Agent”設(shè)計的
Antigravity 作為一個全新的開發(fā)平臺(MacOS/Windows/Linux 預(yù)覽版),它的底層邏輯完全不同于傳統(tǒng) IDE:
? 任務(wù)導(dǎo)向(Task-Oriented):操作單元從“文件”變成了“任務(wù)”。開發(fā)者在 Inbox 中下發(fā)需求
? 多 Agent 協(xié)同:系統(tǒng)支持多 Agent 并行。左邊開 Agent 寫前端,右邊開 Agent 寫后端測試,中間 Agent 查文檔
? 自主權(quán)(Autonomy):Agent 擁有編輯器、終端、瀏覽器控制權(quán)。它寫完代碼,自動跑終端,自動開瀏覽器測試,報錯自己修
? Artifacts(產(chǎn)物):Agent 交付的不僅是對話,它生成標(biāo)準(zhǔn)化的“產(chǎn)物”——任務(wù)列表、實施計劃、截圖、代碼變更
你成了 AI 的老板,去 Review 它的計劃,批準(zhǔn)它的操作,驗收它的成果
更新的 Gemini CLI

Gemini CLI
npm install -g @google/gemini-cli@latest
Gemini CLI,可以理解為 Google 家的類似 Claude Code/ OpenAI Codex,一個命令行 AI 工具:
? 自然語言轉(zhuǎn) Shell:輸入 gemini 找出上周我改壞的那個 git commit,它會自動解析并執(zhí)行 git bisect 流程
? 系統(tǒng)級操作:它可以讀寫本地文件,重構(gòu)代碼,甚至通過視覺能力,解析圖片并生成工程文件
Case:
官方演示中,開發(fā)者讓他來做個3d的金門大橋,于是...就做好了
Generative UI:搜索即應(yīng)用
Google Search 迎來了交互層面的重大升級
過去用戶搜索“房貸計算器”,得到的是十個鏈接。現(xiàn)在 Gemini 3 在 AI Mode 下,現(xiàn)場為你寫一個計算器

這被叫做 Generative UI(生成式用戶界面):
? 動態(tài)生成:模型根據(jù)具體問題,實時編寫 HTML/JS/CSS,并在前端直接渲染交互組件
? 千人千面:用戶問“比較 A 和 B 兩款車”,生成的是靜態(tài)對比表;用戶問“買哪款更劃算”,生成的是可篩選、排序、高亮的交互決策工具
? 復(fù)雜模擬:用戶問“三體引力如何作用”,模型直接生成物理模擬器,用戶可以拖動星球觀察軌道變化
話說,你覺得 Google 是不是看了我去年的文章啊
AI 的輸出,不應(yīng)是千篇一律的答案,而應(yīng)像變色龍般適應(yīng)環(huán)境。在手機(jī)上它是簡潔的決策助手,在電腦前它是全面的分析工具,在嘈雜環(huán)境它側(cè)重視覺,在運動場景它善用聲音——始終以最適合當(dāng)下場景的方式傳遞信息。
金色傳說大聰明,公眾號:賽博禪心人類的認(rèn)知協(xié)議
全棧生態(tài):Android Studio 與 Firebase
Google 最核心的優(yōu)勢,是其龐大的開發(fā)者基建,Gemini 3 這次完成了對 Google 開發(fā)生態(tài)的底層覆蓋。
Android Studio Otter
在最新的 Android Studio Otter 版本中,Gemini 3 Pro 被集成進(jìn)了 IDE 的核心工作流,被稱為 Agent Mode(代理模式)

Agent Mode
超越代碼補(bǔ)全,你可以直接下達(dá)“重構(gòu)登錄模塊以支持新的鑒權(quán)協(xié)議”這類模糊指令,Gemini 3 會分析整個項目結(jié)構(gòu),定位相關(guān)文件,并執(zhí)行跨文件的代碼修改。
生產(chǎn)級環(huán)境
為了支持 Agent Mode 的高頻調(diào)用和長上下文需求(最高支持 100 萬 Token),Google 允許開發(fā)者在 IDE 中直接綁定個人的 Gemini API Key

企業(yè)級管控
對于團(tuán)隊用戶,IT 管理員現(xiàn)在可以通過 Google Cloud 控制臺統(tǒng)一配置 Gemini 3 的訪問權(quán)限,確保代碼隱私符合企業(yè)合規(guī)要求
Firebase AI Logic
過去,移動端開發(fā)者要接入大模型,通常需要自己搭建后端服務(wù)來轉(zhuǎn)發(fā)請求(以隱藏 API Key 并處理鑒權(quán))。Firebase AI Logic SDK 的發(fā)布改變了這一架構(gòu)

Serverless 直連
開發(fā)者現(xiàn)在可以通過 iOS、Android、Flutter 或 Web 的客戶端 SDK 直接調(diào)用 Gemini 3 Pro Preview。Google 在 Firebase 層面托管了鑒權(quán)邏輯,開發(fā)者無需維護(hù)中間層服務(wù)器即可安全訪問模型。
新增 Thought Signatures 字段
SDK 會自動處理加密的 thought_signature 字段,確保在多輪對話中,模型能夠“記住”之前的推理路徑。開發(fā)者無需手動解析或傳遞這些復(fù)雜的上下文數(shù)據(jù),SDK 會在底層自動維護(hù)對話狀態(tài)
Firebase App Check
防止 API 被未授權(quán)的客戶端濫用;同時支持 Remote Config,允許開發(fā)者在不發(fā)版的情況下動態(tài)調(diào)整 prompt 或模型參數(shù)。此外,Google 提供了專門的 AI 監(jiān)控儀表盤,用于實時追蹤 Token 消耗、延遲和錯誤率
硬參數(shù):價格與規(guī)格
沒有廢話,直接看數(shù)字
模型版本
gemini-3-pro-preview
上下文窗口
上下文:100 萬 Token
最大輸出:64k Token
價格策略:
? 輸入:$2.00 / 100 萬 Token
? 輸出:$12.00 / 100 萬 Token
適用于 200k 以內(nèi)的上下文
多模態(tài)
原生支持文本、圖像、音頻、視頻、PDF
可用性:
? 開發(fā)者:Google AI Studio / Vertex AI 現(xiàn)已開放
? 企業(yè)用戶:Gemini Enterprise 集成
? 普通用戶:美區(qū) Google AI Pro/Ultra 訂閱用戶可在 Search 和 App 體驗
總結(jié):Google,牛逼!





京公網(wǎng)安備 11011402013531號