![]()
新智元報道
編輯:元宇 好困
Google憑借Gemini 3、自研芯片、強大數據與研究團隊,正在重新超越OpenAI,并帶動市占與用戶活躍度快速提升。在Google與OpenAI的雙雄之爭中,辛頓押谷歌會贏。
「我猜,谷歌一定會贏」!
剛剛,辛頓發話:
Google已經開始超越OpenAI了。
![]()
「AI教父」辛頓(Geoffrey Hinton)
超越就算了,他還說了一句更讓OpenAI扎心的話:
我覺得更讓人意外的是,Google居然花了這么久才超越OpenAI。
3年前,ChatGPT的發布讓Google內部拉響了「紅色警報」。
如今,拉響警報的變成了OpenAI。
Google剛發布的Gemini 3版本獲得業內廣泛認可,有業內人士認為其表現已經超過OpenAI的GPT-5。
Nano Banana Pro圖像模型也非常受歡迎。
除了這些模型和產品之外,在辛頓看來,自研芯片也是Google的一個非常大的優勢。
此外,辛頓還提到Google擁有很多非常優秀的研究人員,以及大量數據和龐大的數據中心。
這些綜合優勢,讓辛頓認為Google會超越OpenAI并贏得最終勝利。
從市場反應來看,Gemini 3、Nano Banana Pro等模型的發布,AI與現有搜索產品的整合,以及TPU與meta達成價值十億美元的訂單,這些綜合優勢推動了谷歌母公司市值逼近4萬億美元大關。
Hinton在Google Brain任職期間幫助推動了早期的AI研究。
他提到,Google曾長期引領AI,但后來變得有所顧慮。
Google發明了Transformer,也比其他公司更早擁有自己的大型聊天機器人。
![]()
辛頓表示,當微軟2016年發布的「Tay」因發表極具種族歧視的推文而迅速下線后,Google開始變得格外謹慎。
Google一直有很好的品牌聲譽,他們擔心類似的事情如果發生會把名聲毀了。
此前,Google CEO Sundar Pichai也曾表示,公司之所以沒有更早推出聊天機器人,是因為當時的產品成熟度還不夠。
以往,Google也曾經歷一些不太順利的產品發布。
就在去年,Google因用戶抱怨其AI圖像生成器產出的部分歷史人物膚色錯誤、顯得過度政治正確,而不得不中止該功能。
其最初的AI搜索摘要,也曾給出荒唐建議,例如為了防止披薩上的芝士掉下來,可以在披薩上抹膠水。
Gemini 3 Pro視覺推理封神
在Google的官方介紹中,將Gemini 3 Pro稱為「我們迄今為止最強大的多模態模型」。
![]()
Google在介紹Gemini 3 Pro時,提到了一個重要的改變:
從「看見」,邁向了「理解」。
Gemini 3 Pro在文檔、空間、屏幕和視頻理解方面都實現了驚人的表現,實現了從簡單識別邁向真正視覺與空間推理的跨代提升。
Gemini 3 Pro在MMMU Pro和Video MMMU等復雜視覺推理基準上刷新紀錄,并在文檔、空間、界面以及長視頻理解等特定任務的測試中取得卓越成績。
文檔理解
現實世界的文檔往往混亂、缺乏結構、難以解析,通常包含交錯的圖像、難辨認的手寫字、嵌套表格、復雜數學符號和非線性布局。
Gemini 3 Pro在文檔處理能力上實現重大突破,從精準OCR到復雜視覺推理,都有顯著提升。
它不僅看懂「是什么」,還能看懂「為什么」和「怎么關聯」。
谷歌的一個核心能力叫「反渲染」(derendering):能將文檔畫面還原為結構化代碼(HTML、LaTeX、Markdown)。
例如,它能把18世紀商人日志轉換成復雜表格,也能將帶有數學標注的圖像精準恢復為LaTeX。
![]()
18世紀奧爾巴尼商人手冊中的手寫復雜表格
要真正理解一份文檔,模型需要準確識別文本、表格、數學公式、圖形和圖表,無論存在噪點還是格式混亂。
除了智能感知,還要具備高級推理能力。
Gemini 3能在長文檔中執行跨表格與圖表的多步復雜推理。
在CharXiv基準中,它甚至以80.5%的成績超過了人類基線。
舉例來說,用戶分析美國人口普查局62頁的《Income in the United States: 2022》報告時提出以下提示詞:
「比較2021–2022年貨幣收入與稅后收入的基尼指數變化百分比;并解釋是什么導致了稅后收入指標的偏離。另外,就貨幣收入而言,最低收入五分位的份額是上升還是下降?」
下方圖片展示了模型的逐步推理。
![]()
空間理解
空間理解,是讓模型真正開始理解「物理世界」。
Gemini 3 Pro可結合其推理能力更好地理解物理世界。
其中一項關鍵能力是指向坐標,即通過輸出像素級坐標,模型可精確指向圖像中的某個位置。
比如,可以估計人體姿態或分析動作軌跡。
多個二維點串聯起來,就能執行較復雜任務,這是2D圖像邁向「世界模型」的關鍵一步。
此外,還有開放詞匯指代,即模型能用開放詞匯識別物體及其意圖。
例如在機器人領域,用戶說桌子很亂,幫我設計一個垃圾分類的整理步驟。
模型不僅可以看到「物體」,還知道什么是垃圾,哪些要分類,應該如何整理它們。
這一能力也延伸至AR/XR設備,用戶可請求AI助手「根據用戶手冊指出螺絲的位置。」
![]()
![]()
![]()
左右滑動查看
屏幕理解
Gemini 3.0 Pro的空間能力在理解桌面與移動設備界面時表現尤為突出,讓計算機使用型智能體更加可靠,可自動化許多重復任務。
屏幕理解還能支持QA測試、用戶上手指導及UX分析。
視頻理解
視頻是最復雜的數據形式:信息密集、變化快速、多模態且背景豐富。Gemini 3 Pro在視頻理解上邁出巨大一步。
其中一個核心能力是高幀率理解,經優化后,模型在高于1 FPS的取樣下能更好地理解物體的快速運動。
例如以10 FPS處理視頻,Gemini 3 Pro可以捕捉每一次揮桿動作和重心轉移,從而支持深入的運動機理分析。
此外,「思考模式」下的視頻推理,能夠讓模型跟蹤復雜的因果關系。
不僅能「看到發生了什么」,還能理解「為什么發生」。
甚至能把長視頻總結成可執行的應用程序。
視頻不再是內容,而是知識源。
文檔理解,讓AI不僅可以識別字,更能理解內容;
空間理解,讓AI可以理解三維世界;
屏幕理解,讓AI可以看懂手機電腦屏幕正在發生什么;
視頻理解,讓AI看懂視頻里的動作、原因和邏輯。
Gemini 3 Pro讓AI第一次像一個「真正能看懂世界的人」一樣工作。
如果說GPT-4開啟了「語言智能」時代,那么Gemini 3 Pro正在開啟一個視覺與行動智能時代。
AI不再只會說話,而是開始理解世界。
ChatGPT增速放緩,Gemini快速追趕
在互聯網和AI行業,同樣遵循「飛輪效應」的經典模型,而用戶始終居于「飛輪效應」的核心位置。
谷歌正是靠著這個原則,才筑起了搜索帝國。
每一次搜索、每一次點擊,都會反哺它的反饋循環:用戶行為改進排序系統,排序系統讓結果更好,結果更好又吸引更多用戶。
時間一長,飛輪形成的正向循環就形成了難以攻破的護城河。
根據市場情報公司Sensor Tower的最新數據,ChatGPT的增長勢頭正在趨緩。
盡管它仍穩居行業第一,在移動端全球下載量中占50%,在全球月活用戶中占55%,但Gemini正在快速追趕,在下載增速、月活增速以及用戶使用時長增速方面全面超越ChatGPT。
從趨勢上看,在用戶數量和活躍度等方面,Gemini正在縮小與ChatGPT的差距。
截至2025年11月,ChatGPT的全球月活同比增長180%,而Gemini同比增長170%。
![]()
新數據顯示,ChatGPT的月活在8月到11月之間僅增長約6%,達到約8.1億。
Sensor Tower表示,這可能意味著ChatGPT正逐漸接近市場飽和。
相比之下,Gemini的全球月活在同期躍升約30%,主要受其新圖像生成模型Nano Banana推出后帶來的用戶激增影響。
報告還指出,在美國Android用戶中,通過系統內置Gemini使用服務的人數,是使用獨立Gemini應用的兩倍。
這可能讓Google在全球市場形成優勢,因為Android占據主導地位,意味著Gemini不再受限于移動App或網頁端使用。
在與ChatGPT、Copilot、Claude、Perplexity和Grok等應用的對比中,Gemini在整個市場的月活份額也在提升。
該機構估算,過去七個月(5月至11月),Gemini的全球月活市占率提升了3個百分點。
相比之下,ChatGPT的全球月活市占率在過去四個月(8至11月)下降了3個百分點。
來自Perplexity和Claude等競品的壓力也愈發明顯。
![]()
這兩款產品在2025年均迎來三位數增長:Perplexity同比上漲370%,Claude同比上漲190%。
ChatGPT截至11月的全球下載量同比增長85%,但仍落后于AI應用整體110%的平均增長速度。
其中,Perplexity與Gemini的下載量增速最高,分別達到215%和190%的同比增長。
此外,Sensor Tower表示,Gemini用戶的日均使用時長在過去幾個月翻倍增長。
截至11月,Gemini用戶日均使用時長達到11分鐘,比3月增長120%,很可能是受9月上線的圖像生成模型Nano Banana的帶動。
同期ChatGPT用戶的日均使用時長僅增長6%,且與7月相比,11月的使用時長下降了10%。
雖然目前的數據表明Google正在逼近市場領頭羊,但其近期的大部分增長主要來自Nano Banana的成功。
OpenAI還有勝算嗎?
龐大的用戶基數,以及對用戶心智的占領,一直是OpenAI強大的護城河,也是它領先其他競爭對手的重要資本。
因此,OpenAI能否在與谷歌的競爭中取勝,一個重要的指標就是看能否守住用戶基數上的優勢。
前段時間,OpenAI把攤子鋪得有點太大,勢必會放緩在模型產品上的迭代速度。
當面對Gemini 3、Claude Opus 4.5等模型在benchmark(基準測試)中突出表現時,必然會造成OpenAI用戶的流失。
用戶在選擇大模型時,更多是看模型的性能和體驗,而不是考慮用戶忠誠度。
前段時間,Salesforce CEO馬克·貝尼奧夫曾表示,在上手了Gemini 3兩小時后,立刻就拋棄了用了近三年的ChatGPT。
![]()
這才是真正讓奧特曼擔心的地方。
就在前幾天,奧特曼在致員工的備忘錄中發出「紅色警報」,稱要把精力拉回到提升ChatGPT上,其他優先級不高的項目暫時往后放。
現在,每周有接近十億的人在使用ChatGPT,龐大的用戶規模使得OpenAI擁有了一個前所未有的窗口,去洞察人類的意圖、好奇心和決策方式。
每個提示詞、每段對話,都能被喂回模型訓練、評估和強化學習,進一步強化這個可能是全球最強的AI反饋循環。
而奧特曼的「紅色警報」核心,就是要保護這個優勢。
如果ChatGPT變得更好用,人們用它的頻率就會更高,使用越多循環越強,循環越強產品又會變得更好——一個不斷自我加速的飛輪效應。
這也是OpenAI抵御谷歌進攻的強大堡壘。
如今,Gemini 3已經吸引了一波用戶,OpenAI強大的堡壘已經有了一些松動的跡象。
在這個節骨眼上,如果ChatGPT的質量有波動,或者界面變得雜亂,用戶跳去谷歌就更容易了。
此前,就不斷有用戶對OpenAI在其產品中推送商品信息的行為表示反感。
![]()
因此,就在外部緊盯OpenAI財務狀況的時候,奧特曼仍然決定先穩定自己的用戶飛輪,把上線廣告和賺錢的事情先放一放。
目前,OpenAI把希望押在新模型的發布上,以推動ChatGPT再次加速增長。
但AI的投入成本極高,OpenAI已經承諾要投入數千億美元來建設基礎設施,把ChatGPT推向真正的全球規模。
因此,商業化的事情也不能一直拖著。
先通過聚焦ChatGPT穩住用戶的基本盤,然后再探索廣告商業化機會,正是奧特曼在強敵壓境之下的重要考量。
如今,相比較OpenAI,Google在模型上已經趕上,在芯片、產品矩陣、商業化能力等方面不斷鞏固優勢。
奧特曼是否能有機會讓Google再次拉響「紅色警報」,可能要看新模型「Garlic」推出后的市場反應了。
參考資料:
https://www.businessinsider.com/ai-godfather-geoffrey-hinton-google-overtaking-openai-2025-12
https://blog.google/technology/developers/gemini-3-pro-vision/
秒追ASI
?點贊、轉發、在看一鍵三連?
點亮星標,鎖定新智元極速推送!





京公網安備 11011402013531號