新一代大模型Gemini 3自11月18日發布以來,由于前端開發和多模態理解兩項功能的顯著進步,橫掃各大基準測試,頻繁登上各大排行榜的榜首,獲得業界好評。
Gemini 3顯著提升的模型能力將利好Agent、AI科研、AI編程等AI應用方向。當前國內外頭部模型廠商陸續迭代AI大模型產品,隨著全球科技企業在大模型領域的競爭持續白熱化,AI應用商業化加速推進。
從各方反饋來看,Gemini 3的強化主要在于前端開發方面幾乎實現零代碼的AI編程,向GPT靠齊的文風和幾乎10倍于GPT的推理速度,以及視覺理解與推理的多模態能力。在LMArena排行榜上,Gemini 3以1501分登頂。在考察研究生水平科學問題理解能力的GPQA Diamond基準測試中,其得分高達91.9%。此外,在專門考察高難度數學問題求解的MathArena Apex測試中,Gemini 3取得了23.4%的成績,刷新了前沿模型在這一領域的紀錄。需要注意的是,Gemini 3仍存在幻覺,Agent能力相對不足,尚難以真正應用于生產與工作,但已在智能體能力上實現了飛躍。
此外,Gemini 3可以流暢引用搜索引擎的數據源,使用TPU(面向人工智能計算場景開發的專用芯片)的優勢顯著。Gemini 3的訓練可以全部或大部分使用TPU專用芯片,隨著部分廠商轉用TPU,市場預期包含算力租賃在內的云業務或將持續高速增長。
Gemini 3在大模型層面的突破,同時也顯示了TPU和搜索引擎的價值,加強了云和搜索業務的基本面,證明了硬件-技術-生態全棧能力的意義。與國外類似,國內互聯網大廠依托較為完善的應用生態,通過加大投入或緊密合作補足大模型能力,正在加速AI產品化與商業化,具備AI技術落地與應用場景適配的頭部企業。





京公網安備 11011402013531號