金磊 發自 拉斯維加斯
量子位 | 公眾號 QbitAI
從未見過如此凡爾賽的名場面。
云計算一哥亞馬遜云科技CEO Matt Garman,在自家年度盛宴re:Invent 2025中,因為還要發布的新產品太多了,于是他在現場來了一句:
我挑戰一下10分鐘內發布25個產品!

畢竟是聞所未聞的舉動,現場觀眾一下子就沸騰了起來。
然后,Garman真的就以24秒一個產品的速度,把新的計算、存儲、安全、數據庫和大數據相關的內容,一氣呵成地給發布了出來。
![]()
或許很多小伙伴要問了,要不要這么趕?會不會太兒戲了些?
趕,是真的得趕;但兒戲,卻絕非如此。
因為今年亞馬遜云科技在短短2個多小時的時間里,一共發布了近40個新品。
這并不意味著剛才的25項內容不重要,而是前面的新發布更加勁爆——
圍繞當下最火熱的AI Agent,從算力到模型,從平臺到應用,幾乎你能想到、用到的內容都涵蓋了進來。
若是用一個詞來總結縱觀整場發布會的感受,那或許就是
是能直擊你在用AI大模型、AI Agent過程中所有難題的“七寸”的那種。
接下來,我們就來一起看看前面的發布到底有多重磅。
(PS:先小小劇透一下,中國兩款大模型被云計算一哥高調點名了~)
劇透新芯片Trainium4,已是算力帝國之勢
AI的本質是算力密集型工程,而算力的性能、成本與部署靈活性,直接決定了企業能走多遠。
亞馬遜云科技深諳此道,在這場發布會上,它從三個維度徹底重構了AI算力的供給模式。
首先,是在芯片自研方面。
亞馬遜云科技自研的AI芯片Trainium,已經從概念產品成長為多億美元級業務。據Garman透露:
亞馬遜云科技已經部署了超過100萬顆Trainium芯片,并以比業界最快AI芯片快4倍的速度快速上量。
而就在今天,Trainium3 Ultra Servers正式全面可用。
![]()
這款基于3納米工藝的服務器,相較上一代Trainium2,在計算性能上提升4.4倍,內存帶寬提升3.9倍;更重要的是,在相同延遲下,每兆瓦電力可產出5倍以上的AI Tokens。
![]()
除此之外,亞馬遜云科技下一代的芯片也已經被曝光了出來——Trainium4
根據Garman介紹,Trainium4相較于上一代,將帶來每個維度上的巨大飛躍:FP4計算性能提升6倍,內存帶寬提升4倍,并擁有2倍于前代的高帶寬內存容量,專為全球最大的模型訓練需求而生。
![]()
與亞馬遜云科技合作了長達15年之久的英偉達,這一次同樣出現在了發布會中。
Garman強調,亞馬遜云科技是全球運行英偉達GPU最穩定、最可靠的云平臺。他們甚至會深入到BIOS層面進行調試,可以防止GPU意外重啟,這是其他云廠商所不具備的。
在此基礎上,亞馬遜云科技推出了搭載英偉達最新GB200 NVL72系統的P6e-GB300實例,專門為訓練超大規模模型的客戶提供頂級算力。
包括OpenAI在內的頂尖AI公司,正在亞馬遜云科技上運行由數十萬顆芯片組成的集群,來支持ChatGPT和下一代模型的訓練。
![]()
最后,還有一個徹底打破了公有云和私有數據中心邊界的新產品——AI Factories
它可以允許客戶在自己的數據中心內部署專屬的亞馬遜云科技AI基礎設施。客戶可以復用自己已有的機房空間和電力資源,同時無縫接入包括Trainium、英偉達GPU、SageMaker和Bedrock在內的全套亞馬遜云科技的AI服務。
![]()
這就意味著任何擁有自有機房的大型組織,都可以在不犧牲安全與控制權的前提下,享受到全球最頂尖的AI算力。
從Trainium的自研,到GPU超集群的運維,再到AI Factories的區域化復制,亞馬遜云科技在算力供應鏈上的掌控力,的確已經逼近算力帝國的描述。
而且這種領先可以說是全棧的那種:芯片、網絡、數據中心、一致性API、模型托管、Agent運行環境,每層都在構成自己的壁壘。
又有新模型發布,國產模型還被點名
如果說算力是土壤,那么我們可以把大模型比作是在此孵化的種子。
亞馬遜云科技在這一層面上的解法,是構建一個開放、靈活、可深度定制的模型平臺——Amazon Bedrock
Bedrock的核心哲學是“沒有一個模型能統治一切”,這也就是為什么亞馬遜云科技會不斷往里面擴中新大模型的原因了。
在這次發布會上,除了引入Google的Gemma、NVIDIA的Nemotron等業界知名模型外,一個細節尤其值得關注:
中國的KimiMiniMax,首次被納入Bedrock。
這標志著中國大模型正式通過亞馬遜云科技這一全球最大云平臺出海,進入全球開發者的視野。
![]()
在此生態之上,亞馬遜云科技也推出了自家新的自研大模型——Amazon Nova 2系列
整體來看,Amazon Nova 2主要包含三個不同的類型:
Nova 2 Light:主打高性價比與低延遲,在指令遵循、工具調用、代碼生成、文檔信息抽取等關鍵任務上,其性能可與Claude Haiku、GPT-4o-mini、Gemini Flash等業界標桿比肩,甚至超越,而成本更具優勢。Nova 2 Pro:面向高度復雜的任務,在需要深度推理和精準工具使用的場景,如構建高級Agent時,表現尤為出色。Garman稱其在多項AI分析基準測試中,超越了GPT-5.1、Gemini 3 Pro和Claude 4.5 Sonnet。Nova 2 Sonic:專注于實時、類人的語音對話交互,大幅優化了延遲,并支持更廣泛的語言。
![]()
如果說Nova 2解決了“多”和“快”的問題,那么Nova 2 Omni則是解決了“融”的問題。
它是業界首個支持文本、圖像、視頻、音頻四模態輸入,并能生成文本與圖像的統一推理模型。
這意味著,一個模型就能理解一場包含演講、PPT、演示視頻的完整發布會,并自動生成圖文并茂的摘要報告。
這種多模態融合能力,自然是構建真正理解復雜現實世界Agent的關鍵一步。
![]()
然而,所有這些通用模型的終極瓶頸在于:它們不了解你的企業,你的數據、流程、行業知識才是核心競爭力。
為此,亞馬遜云科技祭出了殺手锏——Amazon Nova Forge
![]()
Nova Forge引入了開放訓練模型(Open Training Models)的概念。
它允許企業客戶獲取Nova模型在不同訓練階段的檢查點(Checkpoint),將自己的私有數據(如產品設計文檔、失敗案例、制造約束等)與亞馬遜云科技的通用訓練數據集進行融合。
如此一來,就可以訓練出一個既保留了強大通用推理能力,又深度理解本企業獨特知識的專屬模型(Novella)。
![]()
Reddit的案例生動說明了其中所蘊含的價值。
通過在預訓練階段就融入其社區特定的內容安全數據,Reddit成功訓練出一個能精準識別違規內容的專屬模型,不僅達到了準確性目標,還大幅簡化了部署運維。
這就很好地解決了傳統微調中模型災難性遺忘的難題,讓企業真正擁有了自己的行業專家AI。
![]()
Agent,Agent,還得是Agent!
AI Agent,無疑是這次re:Invent中的關鍵詞之一。
亞馬遜云科技對此也是非常之重視,幾乎把非常大篇幅放在這里。Garman明確表示:
AI助手的時代正在被AI Agent取代;未來每家公司會運行數十億個Agent。
但企業要想真正把這些AI Agent給用透,就必須解決兩大難題:如何高效構建Agent?如何確保它們行為可控、結果可信?
為此,亞馬遜云科技給打了個樣。
在開發者層面,Garman先是針對其Kiro編程助手,推出了新的三個Agent。
![]()
首先是Kiro Autonomous Agent(自主Agent)。
它不再是一個簡單的代碼補全工具,現在可以充當一個能長期運行、自主規劃、并行執行復雜開發任務的“虛擬同事”。
例如,當需要升級一個被15個微服務共用的關鍵庫時,傳統方式需要開發者逐個倉庫操作。
而Kiro Autonomous Agent會自動分析所有依賴,生成15個經過完整測試、可直接合并的Pull Request。它會記住開發者的反饋,并在后續任務中持續學習和改進。
![]()
其次是AWS Security Agent(安全Agent)。
它將安全左移(Shift Left)做到極致,能主動審查設計文檔,在代碼提交(Pull Request)時掃描漏洞,并能按需發起一鍵式滲透測試。
這個Agent可以說是把過去昂貴、低頻、滯后的安全審計,變成了開發流程中實時、高頻、自動化的環節。
![]()
最后是AWS DevOps Agent(運維Agent),一個7x24小時在線的超級SRE。
當系統告警時,它能利用對應用拓撲和部署管線的深度理解,快速定位根因(例如,一個由CDK代碼錯誤導致的Lambda IAM策略問題),并提出修復建議,甚至能推薦預防措施,避免問題復發。
![]()
這三個Agent,覆蓋了軟件開發全生命周期,將開發者從重復、繁重、易錯的體力勞動中解放出來,讓他們能專注于更高價值的創造性工作。
內部數據顯示,一個6人團隊借助Kiro,僅用76天就完成了原本需要30人干18個月的架構重構項目(據說是重寫了一遍Bedrock)。
當然,并非所有企業都有能力從零構建Agent。為此,亞馬遜云科技提供了強大的平臺能力:
AWS Transform Custom,幫助企業消滅技術債。
開發者可以創建自定義的代碼轉換Agent,將任何老舊的代碼、框架、API(甚至是公司內部獨有的)自動遷移至現代化平臺。客戶QAD利用它,將原本需要2周的遷移工作壓縮到3天內完成。
![]()
Policy in AgentCore,這是解決Agent失控問題的關鍵。
它允許管理者用自然語言(如“禁止向退款金額超過1000美元的客戶退款”)定義策略。
這些策略會被轉化為安全的Cedar策略語言,在Agent每次嘗試調用工具或訪問數據前進行毫秒級實時校驗。這就像給Agent裝上了不可繞過的電子圍欄,讓它在擁有強大自主性的同時,行為邊界清晰可控。
![]()
AgentCore evaluations,解決了Agent不可信問題。
傳統上,評估Agent輸出質量(如準確性、無害性、品牌一致性)需要組建專業數據科學團隊構建復雜評估管線。
AgentCore evaluations將這一切自動化,提供13種預置評估器,并能將評估結果直接集成到CloudWatch中。企業可以持續監控Agent在生產環境中的表現,確保其輸出始終符合預期。
![]()
從構建、部署到治理、評估,亞馬遜云科技為Agent的全生命周期提供了閉環工具鏈,讓企業敢用、能用、用好Agent。
目標很明確:就是死磕怎么“用好”
回顧整場發布會,亞馬遜在AI大模型、AI Agent時代的發展路徑其實是非常清晰且樸素的——
如何把它們給用好。
即使把時間線再往回撥兩年,其戰略依舊是如此:從一開始就并沒有過度深入卷大模型,而是死磕底層架構和應用。
用亞馬遜云科技自己的話來說就是“客戶需要什么我就做什么”
算力成本與部署難題?用自研Trainium芯片、與英偉達的深度合作、以及開創性的AI Factories來解決。模型無法理解企業私有知識?用開放的Bedrock生態、強大的Nova系列,以及革命性的Nova Forge來解決。Agent不可控、不可信、難構建?用Kiro前沿智能體、Transform Custom、Policy和evaluations等一系列工具來解決。
這三層架構構成了一套組合拳,直擊AI價值落地的“七寸”。它所傳遞的核心信息同樣非常清晰:
AI的未來,不在于單點技術的突破,而在于一整套端到端、安全、可靠、可規模化的企業級基礎設施。
正如索尼和Adobe在演講中所分享的,真正的轉型成功,源于將數據和應用深度融入云平臺,從而獲得了應對不確定性的敏捷性和韌性。
這或許就是Garman在發布會中所提及的那個拐點:從AI的“技術時代”,正式邁入AI的“價值時代”。
One More Thing:
今年全球來到拉斯維加斯參加re:Invent的人數達到了6萬人!
光是今天主論壇現場,就已經人人人的狀態了,來感受一下這個feel:

錯過了今天re:Invent的精彩內容?
別急,亞馬遜云科技re:Invent 中國行即將啟幕!
四大城市巡演 + 北京主會場直播,無論你是云計算新手還是技術老兵,都將從高階演講、實戰內容、技術分享和專家互動中受益。立即注冊,搶占席位,把握Agentic AI時代的新機遇!
https://events.amazoncloud.cn/reinvent-online-20251218?trk=811631fa-539a-41c3-8fed-f23e4f9919dc&sc_channel=el





京公網安備 11011402013531號