2025年,越來越多的人習慣讓AI干活了。
劉茹是一名大學教師,今年,她每天都會找豆包App解答問題,尤其喜歡在國外逛博物館時給豆包視頻通話,讓它實時講解。工作上,她還用智能體開發平臺扣子(Coze)搭建了一個科研助手智能體,讓它參與生成研究方案等。
最近,劉茹的工具庫又密集上新。11月中旬,谷歌(Google)發布Nano Banana Pro,能生成效果頂尖的視覺化信息圖;阿里巴巴推出千問App,她認為很適合寫辦公材料;螞蟻集團推出靈光App,她用文字描述出腦中靈感,就能迅速“手搓”出一個小應用或小游戲。
AI的干活能力日益精進的背后,是一個競爭激烈的全球大模型戰場。北京時間11月18日上午,埃隆·馬斯克(Elon Musk)旗下xAI發布Grok 4.1,緊接著,19日凌晨,谷歌新推出的Gemini 3 Pro。12月1日,DeepSeek發布DeepSeek-V3.2,在公開的推理類基準測試中達到GPT-5水平,略低于Gemini 3 Pro。
從普通人的工具包到科技巨頭的競技場,城頭何以頻換大王旗?
![]()
越來越多的人運用AI完成一些工作。圖/視覺中國
“覺醒”的大廠
11月中下旬,AI戰場的平靜驟然打破:谷歌與阿里幾乎同時向市場投下“重磅炸彈”。
北京時間11月19日,谷歌接連發布Gemini 3系列模型,同步上線Gemini 3 Pro預覽版。據谷歌技術報告,在一系列廣泛認可的核心基準測試中,Gemini 3 Pro的表現都優于GPT-5.1和Claude Sonnet 4.5,包括推理、多模態、代理工具使用、多語言性能和長上下文等。2天后,谷歌又推出基于Gemini 3 Pro打造的圖像生成模型Nano Banana Pro。
這讓谷歌完成了一次全方位“屠榜”。AI模型評測平臺LM Arena因其盲測機制和Elon評分系統受到業內認可,其評測分數顯示,截至目前,Gemini 3 Pro位列文本、視覺、搜索能力榜單首位;Nano Banana Pro和谷歌今年10月推出的Veo 3.1又分別占據了圖像生成類、視頻生成類榜單的首位。
此前很長一段時間里,谷歌陷在行業由OpenAI領跑的被動局面里,被業界評價為“沉睡的巨頭”,如今后發制人,攻防形勢逆轉。除技術領先,Gemini 3 Pro還被集成進谷歌搜索的AI 概覽功能和企業平臺Vertex AI,能迅速向全球數十億用戶普及。
地球的另一端,阿里也在“覺醒”。11月17日,阿里宣布千問App正式公測上線,對所有用戶免費開放,這標志著阿里確立了AI超級入口,全面進軍C端(消費級)市場。上線一周后,千問下載量突破1000萬。達成這一目標,DeepSeek在今年初用了約20天。
千問在發布后密集更新。12月3日,千問接入學習大模型Qwen3-Learning,新增拍照答疑、作業批改兩大功能。辦公功能也進一步細化,以AI寫作為例,用戶可以選擇論文、詩句、高情商回復等30余種場景,指定仿寫、潤色、擴寫等6種目標。
11月18日,螞蟻集團推出靈光App。靈光特別強調了創意生產的低門檻,用戶輸入一句話,“閃應用”功能最快能用30秒生成一個小應用或游戲。上線兩周后,靈光累計生成了330萬個“閃應用”。
阿里在C端的野心有些“姍姍來遲”。畢竟,早在今年2月“DeepSeek風暴”席卷后,字節跳動的豆包、騰訊的元寶就開啟了市場爭奪戰。據Quest Mobile數據,今年9月,豆包和元寶已分別達成1.72億、3286萬的月活躍用戶規模。
過去,阿里主要憑借通義千問(Qwen)模型家族在B端(企業級)市場建立優勢,模型和產品多以“通義”為名。此次明確將原生App更名“千問”,標志著阿里的技術優勢與品牌戰略完成關鍵整合。
談及千問的“技術底氣”,阿里千問相關負責人表示,今年9月,阿里云發布Qwen3-Max模型,基于通義大模型,該模型是最新的參數規模超萬億的旗艦模型,多模態能力和推理能力較此前有了很大提升。“阿里的大模型經過了3年的發展,才使得打造一款真正好用的AI助手成為可能。”
“過去半年,國內C端大模型的競爭異常激烈。這帶來了壓力,也為我們提供了很多提升產品和體驗的外部視角。”他對《中國新聞周刊》表示,市場從“技術演示期”快速進入了“體驗競爭期”,用戶對AI助手的期待值被迅速拉高。
“用戶希望AI能真正成為提升效率、解決問題的實用工具。”上述負責人表示,C端產品競爭最終比拼的是能力和體驗,一個合格的AI助手需要具備解決用戶真實需求的辦事能力,背后有真實的生態服務支撐,并做到體驗順暢、操作簡潔。
大廠爭奪AI超級入口的本質是生態之爭。千問正計劃接入地圖、外賣、訂票、辦公、學習、購物、健康等生活場景,并將在未來實現跨業務的任務執行與信息查詢,這依賴于阿里在電商、支付、生活服務、云計算等領域積累的生態資產。
近日,戰火再度升級。12月1日,字節聯合中興通訊推出一款搭載豆包手機助手的AI手機,擬實現跨應用自動操作能力。由于“觸發了常規安全機制”,微信將使用豆包操作的賬號判定為環境異常,限制其訪問。阿里系應用通過頻繁彈出人機驗證、觸發閃退和登錄攔截等應對這一自動化操作。
谷歌和阿里的“覺醒”只是序幕。技術、產品與商業的三重考驗橫亙于新的大模型戰場上,任何一處賽點都可能是反超或逆轉的關鍵。
![]()
![]()
![]()
![]()
圖/視覺中國
中國模型“上桌”
據悉,千問海外版也即將上線,以ChatGPT為全面競爭對手。2025年,中國大模型在技術性能方面實現了關鍵躍升,為出海提供了底氣。
據AI評測機構Artificial Analysis數據,今年1月,僅有1個中國模型進入其評定的全球模型綜合排名15強榜單,其余均為美國模型;到11月,中國模型則共占據5席。
在全球開源生態中,中國大模型地位的攀升更為突出。12月初,大模型API聚合平臺OpenRouter和風投機構a16z聯合發布《基于OpenRouter的100萬億詞元(Token)實證研究》,其中指出,自2025年年中開始,全球的開源生態結束了由DeepSeek一家壟斷的局面,競爭態勢多元化,詞元使用(Token Volume)均勻地分布在5—7個模型之間。
去年11月至今年11月,在開源模型中,DeepSeek系列模型使用了最多的詞元,達14.37萬億;其次是阿里的Qwen系列,達5.59萬億。再加上MiniMax(稀宇科技)、Z.ai(智譜)、Moonshot AI(月之暗面)的數據,中國開源模型的總使用量達23.32萬億,占前10名總使用量的71.1%。
報告還指出,今年,開源模型已成為創意角色扮演、編程輔助等特定場景的首選。在部分周內,中國開源模型的使用量一度達到全球總使用量的近三成。簡體中文成為全球第二大交互語言,占總使用量的近5%。
中國開源模型吸引了越來越多的全球工作者,尤其是在硅谷。例如,今年6月,亞馬遜新組建具身智能部門,其開發團隊宣布以Qwen3.0為基礎模型,結合DeepSeek蒸餾技術打造具身智能底座模型。
10月,美國公司愛彼迎(Airbnb)CEO布萊恩·切斯基(Brian Chesky)公開談論了技術團隊的選擇。據彭博社報道,愛彼迎于5月向美國用戶推出AI客服智能體,由13種AI模型構建,包括OpenAI、阿里、谷歌及其他開源模型。“我們在很大程度上依賴阿里的 Qwen模型,既出色又高效,成本還低。我們也使用 OpenAI 最新模型,但通常在生產中使用有限,因為還有更快、更便宜的模型。”切斯基說。
NBC采訪了超15位AI行業資深人士,他們表示,過去一年中,許多中國系統不僅接入成本更低、定制化程度更高,且性能已足以滿足多種使用場景的需求。
“通常,我們先用閉源模型實現某個功能,然后發現它太貴或太慢,于是會問:有什么辦法能讓它更快、更便宜?這通常意味著用等效的開源模型替代閉源模型,然后在我們自己的基礎設施上運行。”AI搜索初創公司Exa的機器學習負責人邁克爾·發恩(Michael Fine)說。
不過,美國頂尖模型仍然在性能上保持領先,且以閉源為主。金融機構高盛在11月28日發布的一則研報中指出,美國基礎文本和多模態模型在每次更新中持續保持領先地位,通常情況下,中國模型會在接下來的3—6個月內縮小差距,進行另一次升級更新。
零一萬物CEO、創新工場董事長李開復對《中國新聞周刊》說,如果堅持閉源,中國公司“很難打敗美國”。兩年前,頂尖閉源模型和開源模型之間的“技術時間差”很大,現在已縮小到半年左右。未來,開源模型、開源免費的應用,將大大幫助中國模型和軟件打開全球市場。不過,他也表達了擔憂。美國公司付費購買企業級產品的意愿更高,能夠促進應用、模型公司之間的良性循環,中國公司尚未建立起這一循環,相對滯后。
IDC中國人工智能研究總監盧言霞也提醒道:“性價比仍然是中國大模型出海的核心優勢。目前,全球頭部用戶具有付費能力,技術與競爭格局尚未完全成熟,靠低價取勝的策略能否長久取勝,仍是未知數。”
美國巨頭的“燒錢”規模也更龐大。據高盛研報,2022—2024年,美國五大云服務商亞馬遜、微軟、谷歌、meta和甲骨文的歷史資本支出達1570億—2560億美元,2025—2027年的預測支出將增至4380億—6850億美元。在中國,阿里、字節、騰訊和百度在過去三年共支出80億—360億美元,后三年預計支出590億—750億美元。
![]()
![]()
![]()
上圖:2025年11月6日,2025年世界互聯網大會“領先科技獎”在浙江嘉興烏鎮揭曉,阿里通義千問大模型獲獎。圖/新華
中圖:2024年12月18日,2024火山引擎冬季FORCE原動大會期間的豆包圖生圖模型、文生圖模型展區。圖/IC
下圖:2025年7月29日,2025世界人工智能大會上的可靈AI文生圖、文生視頻展區。圖/IC
更會“干活”的AI
全球大模型競爭持續提速的同時,底層技術的競爭焦點也發生轉移。
“大語言模型的競爭已步入相對成熟和收斂的階段,可以預見在數據使用方面會面臨越來越多的約束,模型性能提升的速率也明顯放緩。”北京智源人工智能研究院院長王仲遠對《中國新聞周刊》分析,全世界仍有海量圖像、音頻、視頻、3D及傳感器數據等多模態數據尚未被有效地開發訓練,多模態模型成為新的核心戰場,即如何在一個模型內實現跨模態的理解與生成。
今年下半年,多模態領域競爭提速。在LM Arena平臺的文生圖、圖片編輯榜中,谷歌Nano Banana Pro領跑,來自德國初創公司的flux模型以及騰訊、字節、阿里、OpenAI的最新模型居其后;在文生視頻、圖生視頻榜中,谷歌Veo-3.1領跑,來自OpenAI、阿里、快手和字節的最新模型,還有中國創業公司MiniMax的海螺2.3、生數科技的Vidu Q2居其后。
以視頻生成領域為例。“今年,視頻生成模型在畫面美學質量、鏡頭運動、理解復雜物理規律等方面都刷新了上限。”MiniMax副總裁時惜之告訴《中國新聞周刊》。她表示,AGI(通用人工智能)的交互應是多模態的,團隊正計劃盡快推出一個多模態融合的模型,對標OpenAI的Sora 2和谷歌的Veo 3。
行業的另一個競爭焦點在于智能體能力(Agentic AI),指的是模型主動規劃、調用工具、執行多步任務,并在一定程度上自主決策、與環境互動的能力。“在這種范式下,AI的角色不再局限于問答助手,而是升級為‘你定目標,我來完成’的執行伙伴。”峰瑞資本投資合伙人陳石表示。
據IDC統計,2025年,在行業企業中,已有近兩成客戶開始采用智能體平臺。其中,當下落地較多的應用場景有智能辦公助手、智能客服、對話式AI、市場營銷等。
以靈光App為例,記者向靈光提出了“幫我設計一個日常監督飲食攝入的應用”的指令。運行過程顯示,靈光首先定義了“飲食監督”的價值,確定應用核心指標、數據采集路徑和反饋機制,接著構建了應用的交互框架、結構框架,再注入交互與計算邏輯,驗證了關鍵路徑后,它完成應用部署并驗證可用性。最終,記者能在應用中選擇用餐類型和食物,實時記錄食物的營養成分數據。
今年,學界和產業界還提出了一個新的智能范式——世界模型(World Model)。過去幾年,隨著具身智能、智能駕駛等技術快速演進,除了理解文本、生成內容,AI還需要具備對真實世界感知和推理的能力。
今年10月底,智源研究院發布開源多模態世界模型“悟界·Emu3.5”,提出了世界大模型的一種構建路徑。Emu3.5展現的世界模型核心能力包括連貫地推演長時程的視覺敘事、在虛擬探索中保持時空一致性,甚至為開放世界中的具身智能體規劃行動。
王仲遠指出,世界模型的核心是完成下一狀態的預測(Next-State Prediction),傳統大語言模型停留于對下一詞元的預測(Next- Token Prediction)。“目前,世界模型的定義和技術路線都沒有形成共識,中國和美國的研究都處于極早期階段。”他說。
![]()
在大模型競技場,無論大廠還是創業公司,都很難有永恒的領先優勢。圖/視覺中國
行業洗牌持續
在大模型競技場,玩家間的“攻防易形”是一種常態。無論大廠還是創業公司,都沒有永恒的領先優勢。
即便是OpenAI也難以高枕無憂。今年7—10月,谷歌的月活躍用戶規模從4.5億增至6.5億。10月底,據Similar Web數據,Gemini在桌面和移動端的單次平均使用時長達7.2分鐘,首次超越了ChatGPT的6分鐘。
OpenAI內部已拉響警報。在10月的一份內部備忘錄中,CEO山姆·奧特曼(Sam Altman)提示員工,谷歌近期的進展“可能會給公司帶來一些暫時性的經濟阻力”。Gemini 3 Pro發布后,12月伊始,奧特曼宣布公司進入最高緊急狀態,要求員工暫停廣告、AI代理等多項非核心項目,將所有人力、算力與預算資源重新聚焦于ChatGPT的升級。近日,有消息人士披露OpenAI計劃在12月第二周提前發布GPT-5.2,以追平差距。
這一幕似曾相識。今年1月底,DeepSeek憑借性能、成本優勢和開源策略引爆全球關注,并在春節后迅速推動AI技術在國內各產業界落地。早在去年1月,MiniMax就發布了國內首個MoE大模型abab6,與DeepSeek架構一致。但當DeepSeek-R1掀起新一輪推理模型浪潮,MiniMax掉隊了。據MiniMax創始人兼CEO閆俊杰回憶,在老家過春節時,幾乎所有人,包括他的姥姥都問他:“你知道DeepSeek嗎?”
閆俊杰深受觸動。“為什么我們本來應該做到最好、最擅長的東西,反而容易出很大的問題?是因為降低了要求,還是沒有思考更深呢?或許我們在一些選擇上不夠堅定。”他說。
后來,MiniMax內部也糾正了一個誤區:大家原本以為用戶越多,模型能力提升越快,實際上,更好的模型才可以導向更好的應用。“我們更加堅定了技術驅動的決心,專注提升模型的全球競爭力,再通過產品設計將模型的智能傳遞給用戶。”時惜之說。
今年,零一萬物和百川智能相繼宣布退出通用大模型競爭。前者全面轉向為企業提供AI解決方案和“超級員工”Agent服務,后者選擇聚焦于醫療垂類模型。“AI六小虎”僅剩4席,各家公司內部都有管理層離職。
另一方面,創業公司還需應對大廠的降維打擊。11月5日,阿里巴巴董事會主席蔡崇信在香港大學接受訪談時表示,阿里“不從AI本身賺錢”,而是主要通過提供支撐AI運行的云基礎設施實現盈利。據阿里最新發布的2025年第二季度財報,7—9月,阿里云智能集團本季度收入達398.2億元,同比增長34%,創近三年增速新高。
創業公司的生存命題恰恰是如何“從AI本身賺錢”,面臨多重壓力。首當其沖的是資金環境收縮。據IT桔子信息,今年下半年,MiniMax和月之暗面分別完成一筆3億與6億美元的融資,估值均約40億美元。融資規模較2024年收縮近半。
李開復也認為,創業公司每年都要承擔比前一年多幾倍的基礎設施成本,才有可能做出更好的底層模型,加上持續開源,將面臨非常嚴峻的商業化考問。
但小型創業公司要想在基礎模型上取得突破性進展變得異常困難。與此同時,大量的創業公司集中在相似的應用領域,如智能客服、內容生成、圖像處理等,提供的服務高度同質化,缺乏真正的技術壁壘。
巨大的投入并未帶來普遍盈利,很多AIGC應用仍處于燒錢虧損狀態。行業分析機構QuestMobile數據顯示,曾以“黑馬”姿態席卷全球的DeepSeek,其月均下載量從2025年第一季度的8111.3萬驟降至第二季度的2258.9萬,降幅達72.2%;國際半導體研究機構Semianalysis的監測則顯示,其用戶使用率從年初的7.5%滑落至年中的3%。從行業整體來看,根據CB Insights統計,當前全球有498只AI獨角獸(即估值在10億美元以上的未上市公司),但這些AI初創公司當中,大部分未實現正向現金流。
“假如豆包是一個創業公司的產品,它已經花上了一個天文數字去得到用戶了。”李開復說,“相比之下,大廠仍然有實力投入基礎模型的研發,并將投入成本分攤到數十億用戶的身上。”李開復甚至預測,中國基座大模型最終大概率會收斂至3家主要公司——DeepSeek、阿里巴巴和字節跳動。他的判斷依據是“企業是否愿意且能夠持久投入,并擁有足夠的創新人才密度”。
(文中劉茹為化名)
記者:王詩涵(wangshihan@chinanews.com)
編輯:閔杰





京公網安備 11011402013531號