![]()
機器之心報道
編輯:澤南、陳陳
最先進的 Agentic AI,現在是做什么工作的?
在搞太空探索。
上個月,藍色起源「新格倫」重型運載火箭首次成功實現了一級回收,在與 SpaceX 的競爭中邁出了重要一步。Agent 在其中起到了舉足輕重的作用。據說,藍色起源全員都在用生成式 AI 工具提升效率,為此他們甚至構建了一個叫 BlueGPT 的內部平臺。

BlueGPT 背靠亞馬遜云科技的 AI 全家桶,有了它,藍色起源的工程師在用 Agent 寫代碼,新格倫火箭在用 Agent 加速火箭發射的審批流程,供應鏈在用 Agent 溝通物料修改,航電部門在用 Agent 開發飛控軟件……總體工程速度提升了 75%。原來貝索斯的新格倫追上馬斯克的獵鷹,背后原因竟是這樣。
這還只是新時代的冰山一角。今天凌晨,亞馬遜云科技一年一度的 re:Invent 大會上,全世界都見證了「云計算一哥」一個又一個重量級新發布,大部分都是面向 Agentic AI 的。
在昨天、今天的 Keynote 中,亞馬遜云科技向全球傳遞了一個明確信號:AI Agent(智能體)的時代已經全面開啟。現在不跟上,可就要落后了。
全流程短板補齊后
Agent 能力實現爆發
亞馬遜云科技認為,Agent 的出現正在讓我們的軌跡發生變化,它對業務產生的影響或許就像當年互聯網和云服務出現時一樣大。
Agent 與傳統大模型助手的根本區別在于其具有自主行動能力。它們不僅回答問題,還能主動幫用戶執行任務,讓工作流程自動化,并能在復雜環境中動態推理。如今在某些任務上,已有 AI Agent 將工作效率提高了 10 倍,這就讓人們有了更多的時間可以專注于創造性的工作。那么問題來了 —— 能讓所有工作都獲得這樣的效率提升嗎?Agent 又從何而來?
在當地時間周三 2025 re:Invent 的演講中,亞馬遜云科技 Agentic AI 高級副總裁 Swami Sivasubramanian 著重介紹了快速構建 Agent 的能力:
![]()
他先讓我們回憶了一下:你當初寫下第一行代碼時是怎樣的感覺?那時我們充滿創作欲,仿佛能做到任何事。Agent 時代,我們正在找回這種創作的自由。
想讓 Agent 真正落地到大規模生產階段,是一件很有挑戰的事。首先,如何快速、大規模地部署 Agent?
亞馬遜云科技發布了開源、模型驅動的 AI Agent 框架 Strands Agents SDK 的更新。首先,Strands Agents SDK 被引入了Typescript平臺,讓開發者能夠使用 Amazon CDK 在 Typescript 中構建完整的 Agent 堆棧。
Strands 同時新增了對邊緣設備的支持,人們現在可以在小型設備上運行自主的 AI Agent,覆蓋從汽車、游戲機到機器人等領域的大量應用場景。
全托管生成式 AI 服務 Amazon Bedrock 上,用于幫助開發者構建生產環境 Agent 的 AgentCore 新增了三大能力。
其中,Policy讓開發者可以使用自然語言為 Agent 操作設定清晰的邊界。evaluations則提供 13 個預置評估器,可評估 Agent 行為的正確性和安全性等維度,并持續對實時交互進行采樣,以便在性能下降時觸發警報,從而簡化日趨復雜的 Agent 行為監控。
如果想讓 Agent 更加實用化,邁過能執行復雜工作的門檻,一個必須要解決的問題在于長期的記憶能力。如何讓模型能夠記住過去的交互、學到的知識?
AgentCore Memory引入了全新的情景式功能,能夠幫助 Agent 從過往經驗中(上下文、推理、操作和結果)學習,讓 AI 隨著時間的推移逐步構建對用戶的連貫理解,進而輸出更加智能化的決策。
![]()
隨著 Agent 構建變得越來越容易,下一個重要問題將隨之而來:如何讓它們更高效?
解決這個問題要從構建定制化的模型開始,Swami 表示,「如今的基礎 AI 模型擁有足夠高的智商,能夠處理復雜易用、多步驟的推理以及突發情況,但它們并非總是最高效的。而 AI 的效率有關成本、規模、延遲與敏捷性。」
在他看來,能夠高效執行特定任務的定制化高質量模型將成為主流。為此,亞馬遜云科技推出了一系列旨在降低 AI 模型定制的復雜性和成本,同時「無需大量博士參與」的工具。
在 Amazon Bedrock 上,亞馬遜云科技提出了全新的模型定制工具,其中強化學習微調(RFT)后的模型與基礎模型相比準確率可提升 66%,大幅降低了模型定制化的門檻。針對特定任務的專業化訓練Model Distillation旨在創建更小更快的模型,能夠帶來 10 倍的速度提升,同時保留 95-98% 的性能。
![]()
無服務器模型的定制功能是 AI Agent 引導的定制體驗,只需自然語言交互即可定制模型。Amazon Nova Forge 開創了「開放式訓練」的先河。它讓企業能夠在模型訓練的每個階段直接將專有數據與 Amazon Nova 基礎模型原有的數據相融合。最終生成的定制模型不僅融合了 Amazon Nova 的全部知識和推理能力,還能深入理解了每個特定業務。
![]()
接下來還要支持的基礎模型還包括 DeepSeek、GPT-OSS、Llama 和千問。現在,模型定制可在數天內完成,而不再需要數月。
而 Amazon SageMaker HyperPod 則縮短了重啟周期,無需人工干預,幾分鐘內即可從模型訓練故障中恢復,在擁有數千個 AI 加速器的集群上能實現 95% 的訓練集群效率。Amazon SageMaker HyperPod 則簡化了模型訓練和部署的基礎設施管理,最多可降低 40% 的成本。
最后,在生產環境中大量部署的 Agent,如何才能減少幻覺,值得我們信任?
在 AI IDE Kiro 上,工程師們結合大語言模型和自動推理(Automated Reasoning)數學邏輯驗證的方法確保了 Agent 行為的正確性。
亞馬遜云科技還提出了一套用于構建和管理可靠 UI 工作流程 AI Agent 的全新服務 ——Nova Act。它由定制版 Amazon Nova 2 Lite 模型驅動,為構建和管理自動化瀏覽器任務的代理集群提供了最快捷、最簡便的途徑。Nova Act 在早期客戶工作流程中實現了高達 90% 的可靠性。
借助 Nova Act,開發者可以在幾分鐘內通過無代碼的自然語言 prompt 快速構建 Agent 原型,然后在熟悉的 IDE(例如 VS Code)中不斷完善,最后部署到云環境上。
有多可靠呢?亞馬遜云科技在現場展示了人機協作的反電詐,Agent 幫你識別信用卡盜刷:

在檢查信用卡交易的過程中,Agent 可以合理提出懷疑,收集證據進行推理,還能直接幫你報警。現在,你可以更加自然地相信 Agent 為你辦的事了。
從易用的 Agent 工具,高效率的模型定制化,到先進的可靠性技術,亞馬遜云科技提出的一系列 AI 工具已經實現了從「如何構建」到「如何快速構建」的轉變,讓開發者們能夠把寶貴的時間用在實踐想法,創造新事物上。可謂是給未來的全新生產環境打好了基礎。
這樣的能力背后,是從最底層硬件算力開始,打造的一整套完善且獨一無二的體系。
如何構建好 Agent?
分四步走
當地時間本周二,亞馬遜云科技首席執行官 Matt Garman 在 2025re:Invent 大會第一天的 Keynote 上,深入介紹了自家最近各個維度的創新突破。

在長達兩個小時十分鐘的 Keynote 上,Matt Garman 花費了 50% 時間都在講一件事:如何構建好 Agent。
在他看來,想要讓 Agent 形成生產力,整條技術棧主要分成四大部分:算力基礎設施、推理平臺、數據以及構建 Agent 的工具鏈。
![]()
首先是算力基礎設施。要構建最強大、最具擴展性的 AI 基礎設施,必須擁有高度可擴展且安全的云平臺。實現這一點并不容易,意味著需要在硬件和軟件的每一層持續優化,而這正是亞馬遜云科技的優勢。
亞馬遜云科技是目前運行 NVIDIA GPU 的最佳場所,在合作過程中,亞馬遜云科技積累了豐富的大規模 GPU 運行經驗。
在此基礎上,亞馬遜云科技進一步推出了 P6e 和 P6 兩個實例,其中 P6e GB200 超級服務器相比上一代 P5e,計算性能提升超過 20 倍。亞馬遜云科技還宣布推出全新的 P6e GB300,以滿足最苛刻的 AI 工作負載。
在芯片方面,亞馬遜云科技推出了最新的 Trainium 3 (首個云端 3nm 芯片)芯片實例,Trn3 UltraServers 正式全面可用。與上一代相比,新一代在關鍵性能上實現大幅躍升:計算能力提升 4.4 倍、內存帶寬提高 3.9 倍、每瓦可處理的 Token 數量增加 5 倍,為大規模 AI 訓練與推理帶來顯著的效率與能效優勢。
![]()
除此之外,亞馬遜云科技預告了全新的 Trainium4 芯片。作為最新一代 AI 加速芯片,它在關鍵性能指標上實現了大幅躍升:在 FP4 精度下提升 6 倍的算力,內存帶寬提升 4 倍,內存容量翻倍,并通過 NVlink Fusion 與 UAlink 支持更大規模的集群互聯。
第二是推理平臺。Amazon Bedrock 為用戶提供了豐富而多元的模型選擇,覆蓋開源模型、通用模型以及專用模型等多種類型。此次,Amazon Bedrock 引入了多款最新開源模型,包括谷歌的 Gemma、NVIDIA 的 Nemotron,以及來自 KIMI 和 Minimax 廠商的最新模型。Mistral AI 的兩款全新開源模型 Mistral Large 3 和 Ministral 3(3B、8B、14B)也已上線 Amazon Bedrock,從而為企業構建生成式 AI 應用帶來更廣泛、更靈活的選擇空間。
![]()
除了引入大量第三方模型外,Amazon Bedrock 還集成了自研的基礎模型系列 Amazon Nova。如今,Amazon Nova 家族全線迭代至 Amazon Nova 2,在延續強大智能能力的同時,將成本效率與低延遲表現大幅提升。當前,Amazon Nova 2 已推出四個版本:
Amazon Nova 2 Lite:快速、高效、經濟的推理模型,適用于多種通用工作負載;Amazon Nova 2 Pro:面向高度復雜任務,具備更強的推理能力,是迄今最智能的 Amazon Nova 推理模型,適用于高度復雜的工作負載;Amazon Nova 2 Sonic:下一代語音到語音模型,提供行業領先對話質量,改進延遲,大幅擴展語言支持;Amazon Nova 2 Omni:業界首個真正統一的多模態模型,支持文本、圖像、視頻、音頻輸入,并支持文本和圖像輸出。
![]()
在基準測試中,Amazon Nova 2 Lite 性能比肩 GPT-5 Mini、Claude Haiku 4.5 、Gemini Flash 2.5 等業界前沿模型。Amazon Nova 2 Pro 也表現亮眼,在指令遵循、Agentic 工具使用等基準上超越 GPT-5.1、Gemini 3 Pro Preview 以及 Claude Sonnet 4.5。
第三是數據。亞馬遜云科技推出的全新服務Amazon Nova Forge,提出了開放訓練模型的概念。
![]()
第四部分是構建 Agent 的工具鏈。亞馬遜云科技的先進 Agentic 平臺 Amazon Bedrock AgentCore,可以大規模地安全構建、部署和運行高性能 Agent。為了確保 Agent 行為的安全性與合規性,亞馬遜云科技開放了Policy、evaluations功能,可以助力開發者構建可用于生產環境的 Agent。
基礎搭好了,接下來是實踐。
亞馬遜云科技提出,要更快地把 Agent 加入到日常工作中來。Amazon Quick作為一款面向企業的智能 Agent 應用,不僅能夠幫助用戶進行深度分析、數據可視化和工作流自動化,還通過企業級的安全與隱私標準確保信息的可靠性與合規性。
![]()
在人們關心的 AI 編程領域上,亞馬遜云科技重點展示了構建、擴展、長期運行 Frontier Agent 能力。對此提出了三大 Agent:
Kiro Autonomous Agent:作為虛擬開發者,能夠獨立完成任務并在工作中持續學習;Amazon Security Agent:承擔虛擬安全工程師角色,在應用設計、代碼審查與滲透測試等環節充當安全顧問;Amazon DevOps Agent:幫助開發者,尤其是負責值班的工程師,主動發現系統故障或潛在缺陷。
從底層算力到推理平臺,從數據到 Agent 工具鏈,再到面向企業實際落地的現代化與生產力產品,亞馬遜云科技在今年 re:Invent 上勾勒出的,是一個面向 AI Agent 全面普及時代的完整藍圖。
數十億 Agent 的未來
來得會比我們想象要快
作為技術全球化的推動者,亞馬遜云科技每年的新發布都會受到開發者、企業的關注。在 AI 時代,其業務增長的速度也非常驚人。
2025 re:Invent 大會上,亞馬遜云科技給出了一串數字:作為云基礎設施的核心,Amazon S3 存儲了超過 500 萬億個對象,每秒平均處理 2 億次請求。而 AI 服務 Amazon Bedrock 目前為全球超過 10 萬家企業提供 AI 推理支持。由此推動,亞馬遜云科技的年收入已達 1320 億美元,相比去年增長了 20%。
這不只是業績展示,更是在指引 AI 時代的新方向 —— 當全球企業加速擁抱生成式 AI 時,這家云巨頭已經準備好了從芯片到應用的全套工具箱。在 Matt Garman 的想象中,未來每個公司、每個行業中都會活躍著數十億個 Agent,每個組織、每個人都能從人工智能那里獲得真實的價值。
新時代的大門已經打開,門后的世界,正在被重新定義。
2025 亞馬遜云科技re:Invent 中國行即將啟幕!12月18日開始,北京、上海、深圳、成都四城線下巡演及線上專場將同步開啟,無論你是云計算新手還是技術老兵,都將從高階演講、實戰內容、技術分享和專家互動中受益。立即注冊,搶占席位,把握Agentic AI時代的新機遇!
https://events.amazoncloud.cn/reinvent-online-20251218?trk=811631fa-539a-41c3-8fed-f23e4f9919dc&sc_channel=el





京公網安備 11011402013531號