當(dāng)前位置：首頁 ? 資訊 ? 新科技 ? 正文

谷歌Gemini 3夜襲全球，暴擊GPT-5.1！奧特曼罕見祝賀

IP屬地中國·北京 編輯：吳俊新智元 時間：2025-11-19 08:07:13

導(dǎo)讀：凌晨，谷歌終極殺器Gemini 3重磅來襲，一出手就是Pro頂配版，號稱「史上最強(qiáng)推理+多模態(tài)+氛圍編程」三合一AI戰(zhàn)神！基準(zhǔn)測試橫掃全場，就連GPT-5.1也被斬于馬下，AI的下一個時代開啟。
它來了，它來了！
就在剛剛，萬眾期待的年度壓軸之王，谷歌新一代旗艦Gemini 3炸裂登場。
而且，一上來就是頂配的Gemini 3 Pro——
迄今推理最強(qiáng)，多模態(tài)理解最強(qiáng)，以及「智能體」+「氛圍編程」最強(qiáng)的模型！
強(qiáng)到什么程度？
發(fā)布一小時后，就連OpenAI CEO奧特曼，都親自發(fā)推表示祝賀！
而且，還是區(qū)分大小寫的版本。（不知道是不是親自試了一下）
從實測來看，也的確如此。
在眾多基準(zhǔn)測試中，Gemini 3 Pro一舉封神——
不僅相較于2.5 Pro實現(xiàn)了性能的全方位躍升，甚至直接把OpenAI剛上新的GPT-5.1甩出了好幾條街。
用谷歌的話來總結(jié)，Gemini 3 Pro頂尖的核心在于這三點(diǎn)——
霸榜LMArena（1501分）和WebDev（1487分）
人類最后考試（HLE）刷出45.8%最高分，人類博士級推理
長程任務(wù)規(guī)劃Vending-Bench 2上的王者
不僅如此，增強(qiáng)推理模式下的Gemini 3 Deep Think，更是在HLE拿下41%、GPQA 93.8%，以及ARC-AGI-2上45.1%的成績。
這一天，注定是被載入史冊的一天。Gemini 3一露面，全網(wǎng)徹底沸騰。
Gemini 3正開啟AI下一個時代，準(zhǔn)備好上車了嗎？
即日起，Gemini 3 Pro預(yù)覽版將全面上線。
而Deep Think模式還需要一段時日，才會向Google AI Ultra訂閱用戶開放。
三大重點(diǎn)（濃縮版）
Gemini 3的誕生，標(biāo)志著谷歌在通往AGI的道路上，邁出了又一大步！
首先，它思考能力特別強(qiáng)，能深入理解問題，回答更有見地。
尤其是，特別擅長回答各種復(fù)雜的科學(xué)問題。
用代碼構(gòu)建、解構(gòu)和重組詳細(xì)的3D體素藝術(shù)
其次，它有著世界領(lǐng)先的多模態(tài)理解力，不論是文字、視頻，還是代碼都不在話下。
比如解讀長視頻，或是把論文變成互動指南，Gemini3都可以接得住。
在氛圍編程上，Gemini 3直接刷爆了天花板。
簡單一句話，它就能做出一個美觀且靈動的應(yīng)用。而且，還能精準(zhǔn)get意圖，知道如何去實現(xiàn)。
同時，它的智能體編碼本領(lǐng)更強(qiáng)了，無縫銜接現(xiàn)有工具，與全新平臺Google Antigravity搭配，堪稱天作之合。
Gemini 3 Pro
博士級推理碾壓一切
憑借頂尖推理與多模態(tài)能力，Gemini 3 Pro可以將任何想法變?yōu)楝F(xiàn)實！
它全面碾壓前代2.5 Pro，所有核心基準(zhǔn)測試成績，斷層領(lǐng)先。
LMArena排行榜上名列榜首，狂攬1501 Elo突破性高分；
人類最后考試（HLE）上，在不使用任何工具的情況下拿下37.5%成績；
GPQA Diamond上斬獲91.9%的高分，展現(xiàn)出博士級的推理能力；
MathArena Apex上以23.4%刷新SOTA，在數(shù)學(xué)領(lǐng)域樹立新標(biāo)桿。
在一系列關(guān)鍵AI基準(zhǔn)測試中，Gemini 3遙遙領(lǐng)先
除了在文本測試中的優(yōu)異表現(xiàn)，Gemini 3 Pro還是多模態(tài)王者——
MMMU-Pro強(qiáng)勢斬獲81%高分，以及Video-MMMU更以87.6%成績，重新定義了多模態(tài)推理。
它還在SimpleQA Verified上獲72.1%業(yè)界領(lǐng)先分?jǐn)?shù)，在事實準(zhǔn)確性方面進(jìn)步巨大。
這意味著 Gemini 3 Pro具備超高可靠性攻克科學(xué)、數(shù)學(xué)等眾多領(lǐng)域的復(fù)雜問題的能力。
每一次交互，Gemini 3 Pro都帶著前所未有的「深度和細(xì)膩度」。
它的回答聰明、簡潔、直接，摒棄了陳詞濫調(diào)和奉承，提供真正的見解——告訴你需要聽到的，而不僅僅是你想聽到的。
它就像一位真正的思想伙伴，提供理解信息和表達(dá)自我的新方式。
不管是生成高保真可視化代碼，闡釋晦澀的科學(xué)概念，還是展開一場激發(fā)創(chuàng)造性的頭腦風(fēng)暴，Gemini 3 Pro都能做到。
Gemini 3可以編寫托卡馬克裝置中等離子體流動的可視化代碼，并寫一首捕捉聚變物理學(xué)精髓的詩
在Google AI Studio上，Gemini 3 Pro的API定價如下——
Gemini 3 Deep Think
智能新高峰
這一次，Gemini 3 Deep Think正式開啟「深度思考」新紀(jì)元，讓智能的邊界再次拓展。
它在Gemini 3推理和多模態(tài)理解能力的基礎(chǔ)上，實現(xiàn)了質(zhì)的飛躍，更能攻克復(fù)雜問題。
多項基準(zhǔn)測試中，Gemini 3 Deep Think表現(xiàn)超越Gemini 3 Pro：
在HLE和GPQA Diamond上，分別拿下了41%（不使用工具）和93.8%的優(yōu)異成績。
而且，更在ARC-AGI-2（帶代碼執(zhí)行，ARC Prize Verified）中創(chuàng)下45.1%歷史新高，一展應(yīng)對未知與新穎問題的強(qiáng)大能力。
Gemini 3 Deep Think在一些最具挑戰(zhàn)性的AI基準(zhǔn)測試中表現(xiàn)出色
重塑世界，新時代開啟
可以說，Gemini 3正式開啟了新一輪的全模態(tài)革命！百萬token，全模態(tài)爆發(fā)
從誕生之初，Gemini就為「跨多模態(tài)」而生，包括文本、圖像、視頻、音頻、代碼，能在各種信息形態(tài)中，自由穿梭。
Gemini 3更是實現(xiàn)了破級進(jìn)階，整合最先進(jìn)的推理、視覺和空間理解、領(lǐng)先的多語言性能，以及100萬token上下文。
它能夠幫助人們，以最適合自己的方式進(jìn)行學(xué)習(xí)。
假設(shè)你想學(xué)習(xí)家族傳統(tǒng)的烹飪方法，Gemini 3可以破譯并將不同語言的手寫食譜，翻譯成一本可共享的家庭食譜。
或是想要學(xué)習(xí)一個新主題，直接扔給它學(xué)術(shù)論文、長視頻講座或教程，Gemini 3自動生成交互式抽認(rèn)卡、可視化效果或其他格式的代碼。
它甚至可以分析匹克球比賽視頻，找出可以改進(jìn)的地方，并生成針對性的訓(xùn)練計劃以全面提升表現(xiàn)。
不僅如此，在搜索中的AI模式（AI Mode），現(xiàn)可用Gemini 3實現(xiàn)新的生成式UI體驗。
包括沉浸式視覺布局，以及交互式工具和模擬，所有這些都是根據(jù)查詢完全即時生成。
在搜索中的AI模式下，可通過生成式UI學(xué)習(xí)像RNA聚合酶如何工作這樣的復(fù)雜主題
氛圍編程，純靠嘴
在2.5 Pro成功的基礎(chǔ)上，Gemini 3兌現(xiàn)了——為開發(fā)者將任何想法變?yōu)楝F(xiàn)實的承諾。
它在零樣本學(xué)習(xí)（zero-shot）生成方面表現(xiàn)出色，并能處理復(fù)雜的提示詞和指令，以渲染更豐富、更具交互性的 Web UI。
如前所述，Gemini 3是谷歌迄今為止打造的最優(yōu)秀的「氛圍編程」和智能體編碼模型。
在WebDev Arena排行榜上，Gemini 3以1487 Elo高分強(qiáng)勢登頂。
它在Terminal-Bench 2.0上也獲得了54.2%高分，該測試衡量模型通過終端操作計算機(jī)的工具使用能力；
并且在衡量編碼智能體SWE-bench Verified測試上，以76.2%成績遠(yuǎn)超2.5 Pro。
接下來一波演示中，便可見識Gemini 3真正實力。
編寫一個復(fù)古3D太空飛船游戲，要有豐富的視覺效果，以及更強(qiáng)的交互性——沒問題。
借助著色器，構(gòu)建一個可玩的科幻世界——so easy。
自動播放
打造一個更豐富、更具交互性的Web UI和應(yīng)用程序——還是輕松搞定！
前端不再需要人類，是真的...
目前，全球開發(fā)者可在Google AI Studio、Vertex AI、Gemini CLI，以及全新智能體開發(fā)平臺 Google Antigravity中使用Gemini 3進(jìn)行構(gòu)建。
它也接入了多個第三方平臺，包括Cursor、GitHub、JetBrains、Manus、Replit等。
長程規(guī)劃，人類手替
自谷歌通過Gemini 2開啟智能體時代以來，一直在不斷進(jìn)化。
他們不僅提升了Gemini的編碼智能體能力，還提高了其在更長時間范圍內(nèi)可靠規(guī)劃未來的能力。
而這一切，剛剛在Vending-Bench 2排行榜上得到實力認(rèn)證——
Gemini 3以絕對優(yōu)勢登頂。
而這個測試，通過模擬運(yùn)營一個自動售貨機(jī)業(yè)務(wù)，深度考驗AI在復(fù)雜場景下的長程規(guī)劃能力。
令人欣喜的是，在整個模擬運(yùn)營年度中，Gemini 3 Pro通過保持一致的工具使用和決策，在不偏離任務(wù)的情況下，實現(xiàn)了更高的回報。
與其他前沿模型相比，Gemini 3 Pro展示了更好的長程規(guī)劃能力，從而產(chǎn)生顯著更高的回報
這意味著， Gemini 3能在日常生活中更好地幫人類完成任務(wù)。
它把更深度的推理與改進(jìn)、更一致的工具使用相結(jié)合，通過從頭到尾處理更復(fù)雜、多步驟的工作流來代表人采取行動。
就比如，幫你預(yù)定本地服務(wù)，或是整理收件箱。而人類，全程只需把控方向，下達(dá)指令。
自動播放
今天起，Google AI Ultra訂閱用戶可在Gemini應(yīng)用中，通過Gemini Agent搶先體驗智能體能力。
「谷歌反重力」
革命性智能體開發(fā)平臺
Gemini 3的問世，谷歌在智能體能力上已開始邁入一個新的階段：
模型能夠在多個平臺上長時間運(yùn)行，且無需人工干預(yù)。
雖尚未達(dá)到「完全無人干預(yù)+連續(xù)運(yùn)行數(shù)天」的程度，但谷歌正日益接近這樣一個世界——
不再通過單個提示詞或工具調(diào)用，而是在更高的抽象層面上與智能體進(jìn)行交互。
因此，谷歌智能體開發(fā)平臺Google Antigravity正式上線，一個讓開發(fā)者以「任務(wù)」為維度與智能體協(xié)同的全新平臺。
借助Gemini 3高級推理、工具使用和智能體編碼能力，Google Antigravity將AI輔助從開發(fā)者工具包中的一種工具，升級為全程參與的主動協(xié)作者。
在熟悉的AI IDE體驗基礎(chǔ)上，Google Antigravity為智能體開辟一個專用界面，可直接訪問編輯器、終端和瀏覽器。
現(xiàn)在，智能體可以代表你自主規(guī)劃并同時執(zhí)行復(fù)雜的端到端軟件任務(wù)，同時驗證其生成的代碼。
如下案例中，在Google Antigravity上，用Gemini 3驅(qū)動飛行跟蹤應(yīng)用程序的「端到端智能體工作流」。
該智能體獨(dú)立規(guī)劃、編寫應(yīng)用程序代碼，并通過基于瀏覽器的計算機(jī)操作驗證其執(zhí)行。
除了Gemini 3 Pro，Google Antigravity還與Gemini 2.5 計算機(jī)使用模型，以及圖像編輯模型Nano Banana（Gemini 2.5 Image）緊密集成。
網(wǎng)友玩瘋了
現(xiàn)在，Gemini 3承包了全網(wǎng)熱點(diǎn)，一系列驚艷實測demo全部放出了。
Google AI Studio負(fù)責(zé)人Logan進(jìn)行了彈跳球測試，并且難度提升了10倍。
結(jié)果，Gemini 3 Pro一次就完美搞定！（并非N選一，真的是第一個提示詞就生成了）
曾在Anthropic擔(dān)任AI工程師的MagicPath創(chuàng)始人Pietro Schirano，首先讓Gemini 3 Pro創(chuàng)建了一個3D樂高編輯器。
沒想到，它僅憑一次生成就完美實現(xiàn)了用戶界面、復(fù)雜的空間邏輯以及所有功能。
同時，Gemini 3 Pro在游戲開發(fā)方面的表現(xiàn)也令人驚嘆。
僅僅通過一個文本提示詞，它就重現(xiàn)了經(jīng)典的iOS游戲《荒謬釣魚》（Ridiculous Fishing），甚至包括了音效和背景音樂。
自動播放
此外，它還完成了一項之前大模型幾乎都做不到的任務(wù)——構(gòu)建一個功能完備的Game Boy模擬器。
而且沒錯，它甚至直接用SVG繪制出了Game Boy的外觀。
最值得一提的是，Gemini 3竟完全在谷歌TPU上完成訓(xùn)練。這就是谷歌的護(hù)城河。

標(biāo)簽：智能谷歌能力代碼視頻 規(guī)劃 工具 模態(tài) 基準(zhǔn) 模型 領(lǐng)先 長程人類編程游戲 任務(wù) 空間編碼問題 可視化 平臺全面氛圍方面高分 排行榜 全網(wǎng) 科學(xué) 深度博士 數(shù)學(xué) 成績語言

免責(zé)聲明：本網(wǎng)信息來自于互聯(lián)網(wǎng)，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點(diǎn)。其內(nèi)容真實性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系我們，本站將會在24小時內(nèi)處理完畢。

同類資訊

谷歌把AI大模型能力“壓縮”進(jìn)手機(jī)，以后玩游戲全靠“吼”

培訓(xùn)即上崗！一條閉環(huán)服務(wù)鏈，打通就業(yè)“最后一公里”

摩爾線程張建中：智算集群將做到50萬卡、100萬卡規(guī)模

科技前沿｜可控核聚變終極能源解決方案值得期待

摩爾線程，突發(fā)大消息！

中國社科院揭露11家冒名機(jī)構(gòu)期刊，有的曾舉辦大型發(fā)布會

全站最新

谷歌把AI大模型能力“壓縮”進(jìn)手機(jī)，以后玩游戲全靠“吼”

培訓(xùn)即上崗！一條閉環(huán)服務(wù)鏈，打通就業(yè)“最后一公里”

摩爾線程張建中：智算集群將做到50萬卡、100萬卡規(guī)模

科技前沿｜可控核聚變終極能源解決方案值得期待

熱門推薦

鞏固千元價格帶、重啟“小五糧”，五糧液系統(tǒng)布局三大戰(zhàn)略方向

央視《鴻蒙星光盛典》今晚播出

王力宏演唱會上！機(jī)器人高難度空翻獲馬斯克稱贊

摩爾線程，重大發(fā)布！

谷歌把AI大模型能力“壓縮”進(jìn)手機(jī)，以后玩游戲全靠“吼”

培訓(xùn)即上崗！一條閉環(huán)服務(wù)鏈，打通就業(yè)“最后一公里”

摩爾線程張建中：智算集群將做到50萬卡、100萬卡規(guī)模

科技前沿｜可控核聚變終極能源解決方案值得期待

巴西電動“飛行汽車”原型機(jī)完成首飛

摩爾線程，突發(fā)大消息！

中國社科院揭露11家冒名機(jī)構(gòu)期刊，有的曾舉辦大型發(fā)布會

華為鴻蒙電腦MateBook Pro推送HarmonyOS 6.0.0.120 SP1版本

NASA毅力號火星車完成自主長距離行駛：4個多小時走了412米

上半年虧超6億，又一國產(chǎn)GPU獨(dú)角獸沖刺港股IPO

豆包狂飆，字節(jié)AI再亮劍