美東時間12月2日周二,亞馬遜云計算部門AWS在年度云計算盛會re:Invent上推出新一代人工智能(AI)訓練芯片Trainium 3,預告了下一代產品Trainium 4的開發計劃,加大力度挑戰英偉達和谷歌在AI芯片市場的主導地位,同時推出Nova 2系列模型和全新AI服務,試圖在激烈的AI競爭中搶占更多市場份額。
AWS宣布,Trainium 3芯片已于近期部署至少數幾個數據中心,并從本周二當天起向客戶開放使用。AWS的副總裁Dave Brown表示:“進入明年初,我們將開始非常非常快速地擴大規模。”
![]()
這款芯片的推出速度超出業界常規。亞馬遜在部署前一代加速器約一年后便發布了Trainium 3,與英偉達承諾的每年發布新芯片的快節奏相當。
亞馬遜希望吸引尋求性價比的公司。公司宣稱,Trainium芯片能以比英偉達市場領先的圖形處理單元(GPU)更低廉和高效的方式,為AI模型背后的密集計算提供動力。Brown表示:"我們對Trainium實現正確的價格性能比的能力感到非常滿意。"
亞馬遜周二不僅發布了四款新模型,還推出了業內首創的"開放式訓練"服務Nova Forge,并發布了專注于瀏覽器任務自動化的代理服務Nova Act。此次發布的Nova 2家族涵蓋推理、多模態處理、對話式AI和代碼生成等多個領域,主打價格性能比優勢。
新AI芯片的消息公布后,亞馬遜股價逼近239美元刷新日高,日內漲幅擴大到將近2.2%,而盤初曾漲3.2%的英偉達股價進一步收窄漲幅,美股早盤尾聲時刷新日低,幾乎抹平所有漲幅。其競爭對手AMD的股價跌幅擴大、日內跌近1.7%。到收盤,亞馬遜漲逾0.2%,英偉達漲近0.9%,AMD跌近2.1%。
![]()
Trainium 3性能大幅躍升
AWS稱,其第四代 AI 芯片Trainium 3是首款3納米(nm)制程的AWS AI芯片,專為下一代智能體、推理和視頻生成應用程序App提供最佳代幣經濟效益而打造。
據AWS官方數據,搭載Trainium 3芯片的Trn3 UltraServer系統在訓練和推理性能上都實現了顯著提升。相比第二代產品,新系統速度提升超過4倍,內存容量增加4倍。
每顆Trainium 3芯片提供2.52千萬億次浮點運算(PFLOPs)的FP8算力,內存容量較Trainium 2增加1.5倍至144GB HBM3e,內存帶寬提升1.7倍至4.9TB/s。單臺完整配置的Trn3 UltraServer可容納144顆芯片,總算力達362 PFLOPs,并提供高達20.7TB的HBM3e內存和706TB/s的聚合內存帶寬。
能效提升同樣引人注目。AWS表示,Trn3 UltraServer的能效比前代產品提高40%,性能功耗比提升4倍。在Amazon Bedrock平臺上,Trainium 3成為AWS最快的加速器,性能較Trainium 2提升3倍,每兆瓦輸出token數量增加超過5倍,且延遲水平相當。
Brown在采訪中表示:"我們對Trainium在價格性能方面的表現非常滿意。"該系統還可在EC2 UltraClusters 3.0中擴展至數十萬顆芯片,AWS稱其目標是年底前為AI初創公司Anthropic提供100萬顆芯片。
Trainium 4將支持英偉達互聯技術
亞馬遜在會上還預告了正在開發中的Trainium 4芯片。這款下一代產品將帶來性能的重大躍升,并將支持英偉達的NVlink Fusion高速芯片互聯技術。
這一技術兼容性意味著,搭載Trainium 4的AWS系統將能夠與英偉達GPU互操作并擴展性能,同時仍使用亞馬遜自研的低成本服務器機架技術。這可能幫助AWS吸引那些基于英偉達GPU開發的大型AI應用遷移至亞馬遜云平臺。
值得注意的是,英偉達的CUDA架構已成為所有主流AI應用支持的事實標準。Trainium 4對NVlink的支持或將降低這些應用轉向AWS的技術門檻。
亞馬遜未公布Trainium 4的具體發布時間表。按照以往發布節奏,外界預計將在明年的re:Invent大會上獲得更多信息。
軟件生態仍是短板
盡管硬件性能強勁,亞馬遜芯片仍面臨生態系統挑戰。與英偉達相比,AWS芯片缺乏幫助客戶快速部署的深度軟件庫。
建筑設備自動駕駛公司Bedrock Robotics的首席技術官Kevin Peterson表示,雖然該公司在AWS服務器上運行基礎設施,但在構建指導挖掘機的模型時仍使用英偉達芯片。"我們需要它性能強大且易于使用,"Peterson說,"那就是英偉達。"
目前使用Trainium芯片的主要客戶是Anthropic,這些芯片分布在印第安納州、密西西比州和賓夕法尼亞州的數據中心。AWS今年早些時候表示,已將超過50萬顆芯片串聯起來幫助Anthropic訓練最新模型,,并計劃在年底前為這家OpenAI的勁敵提供100萬顆芯片。
不過Anthropic同時也在使用谷歌的TPU(張量處理單元),并在今年早些時候與谷歌達成協議,獲得價值數百億美元的計算資源。
除Anthropic外,亞馬遜公布的其他主要客戶寥寥,令分析師難以評估Trainium的實際效果。AWS表示,日本的LLM Karakuri、Splashmusic和Decart等客戶已在使用第三代Trainium芯片和系統,并顯著降低了推理成本。
AWS承諾通過AWS Neuron SDK和原生PyTorch集成,讓開發者無需更改任何模型代碼即可進行訓練和部署,試圖以此縮小與英偉達的軟件生態差距。
四款Nova 2模型各有側重
亞馬遜此次推出的四款Nova 2模型針對不同應用場景設計。Nova 2 Lite是一款快速、經濟的推理模型,專為日常工作負載設計,可處理文本、圖像和視頻并生成文本。在與競爭對手的基準測試對比中,該模型在15項測試中有13項表現優于或持平Claude Haiku 4.5,在17項測試中有11項優于或持平GPT-5 Mini。
Nova 2 Pro是亞馬遜最智能的推理模型,可處理文本、圖像、視頻和語音并生成文本,適用于代理編碼、長期規劃等高度復雜任務。該模型在與Claude Sonnet 4.5的16項基準測試中有10項表現更優或持平,與GPT-5.1的16項測試中有8項更優或持平,與Gemini 2.5 Pro的19項測試中有15項更優或持平。
![]()
Nova 2 Sonic是亞馬遜的語音到語音模型,統一了文本和語音理解及生成功能,支持實時、類人對話式AI。該模型擁有100萬個token的上下文窗口,支持擴展的多語言功能,并可與Amazon Connect、Vonage、Twilio等電話服務提供商無縫集成。
Nova 2 Omni是業內首款統一的多模態推理和生成模型,可處理文本、圖像、視頻和語音輸入,同時生成文本和圖像。該模型可同時處理多達75萬個單詞、數小時音頻、長視頻和數百頁文檔,一次性分析整個產品目錄、客戶評價、品牌指南和視頻庫。
Nova Forge開創"開放式訓練"模式
Nova Forge是AWS推出的首創服務,讓企業能夠構建自己的Nova模型定制版本——亞馬遜稱之為"Novellas"。該服務開創了"開放式訓練"模式,為客戶提供對預訓練、中期訓練和后訓練Nova模型檢查點的獨家訪問權限,使客戶能夠在模型訓練的每個階段將專有數據與亞馬遜Nova策劃的數據集混合。
這一服務解決了企業在將專有知識嵌入AI應用時面臨的三大難題:定制專有模型時整合深度有限、繼續訓練開源權重模型時缺乏原始訓練數據訪問權限,或從零開始構建模型成本高昂。
除了模型檢查點和數據混合能力,Nova Forge還提供三項核心功能:使用客戶自己的環境(稱為強化學習"gyms")訓練AI的能力,創建更小、更快模型的選項,以及實施安全控制的負責任AI工具包。
Reddit正在使用Nova Forge改進內容審核系統。Reddit首席技術官Chris Slowe表示:"我們正在用單一、更準確的解決方案替代多個不同的模型,使審核更加高效。用一種統一的方法替代多個專門的機器學習工作流程,標志著我們在Reddit上實施和擴展AI方式的轉變。"
Booking.com、Cosine AI、Nimbus Therapeutics、野村綜合研究所、OpenBabylon和索尼等公司也在使用Nova Forge構建自己的模型。客戶使用Nova Forge創建的模型可以部署在Amazon Bedrock上,享有與其他Bedrock模型相同的企業級安全性、可擴展性和數據隱私保護。
Nova Act實現瀏覽器任務自動化突破
Nova Act是AWS推出的新服務,用于構建和部署能在網絡瀏覽器中執行操作的高可靠性AI代理。該服務由定制的Nova 2 Lite模型驅動,為構建和管理自動化瀏覽器任務的代理提供最快、最簡便的路徑。Nova Act在早期客戶工作流程中實現了90%的可靠性,并在相關基準測試中表現優于競爭模型。
![]()
Nova Act通過強化學習訓練定制的Nova 2 Lite模型,在數百個模擬網絡環境中運行數千項任務,從而實現突破性可靠性。這種訓練方式使Nova Act在基于用戶界面的工作流程中表現出色,例如更新客戶關系管理系統中的數據、測試網站功能或提交健康保險索賠。
開發人員可以在幾分鐘內使用無代碼平臺通過自然語言提示開始原型設計,然后在VS Code等熟悉的集成開發環境中完善代理,最后部署到AWS。客戶在本地構建和測試的內容可以在生產環境中擴展,并通過Nova Act AWS控制臺獲得全面的管理工具和監控。
亞馬遜介紹,多家企業已經注意到Nova Act的成效。其中,初創公司Sola Systems集成Nova Act后,每月為客戶自動化數十萬個工作流程,涵蓋對賬支付、協調貨運和更新醫療記錄等關鍵業務任務。
1Password使用Nova Act減少用戶訪問登錄信息的手動步驟,只需一個簡單提示即可在數百個不同網站上自動工作。Hertz通過使用Nova Act自動化其租賃平臺的端到端測試,將軟件交付速度提高了5倍,消除了質量保證瓶頸,將原本需要數周的工作縮短至數小時。



京公網安備 11011402013531號