從“會聊天”到“幹實事”,亞馬遜雲科技讓Agent“長出了手腳”_Amazon

美國西部時間12月2日的2025 亞馬遜雲科技re:Invent上,亞馬遜雲科技首席執行官Matt Garman在開場演講中拋出了一個觀點:AI Agent時代已來,未來將出現數十億AI Agent,為企業提效10倍以上!

現場興奮和焦灼情緒交織,數萬名開發者和企業高管都在等一個答案。

因為在很多人的印象裏,AI Agent的現實體感並不樂觀:開發門檻高、編排邏輯複雜、安全治理缺位、上下文記憶像金魚……導致了一個尷尬的行業現狀——90%的Agent項目停留在概念驗證階段。

想要從概念驗證走向生產可用,中間隔着的不僅僅是代碼行數,而是一道道深不見底的“工程鴻溝”。

懸念並未持續太久。

亞馬遜雲科技 Agentic AI副總裁Swami Sivasubramanian,在12月3日的主論壇上,用嚴謹且務實的演講給出了答案——怎麼把AI Agent從概念驗證推向生產環境。

01 對症下藥,解決POC到生產環境的五大頑疾

為什麼不少企業的Agent“看起來很美,用起來很廢”?

剝開光鮮的Demo外衣,在生產環境中面臨着五個棘手的痛點:

1、部署難、擴展難,一上生產就不穩定;

2、記憶缺失,Agent 無法跨任務學習,無法持續執行大型流程;

3、身份、權限、憑證管理太難,易出安全事故;

4、工具、數據、系統碎片化,集成成本極高;

5、無法觀測、無法調試,Agent成為黑箱。

Swami在演講中一針見血地指出:“大多數實驗和PoC並未按生產就緒的標準來設計。我們需要彌合這一差距,打破PoC的桎梏。”相對應的,亞馬遜雲科技對Agent在生產環境中遇到的頑疾,通過Amazon Bedrock AgentCore進行了對症下藥。

從“會聊天”到“幹實事”,亞馬遜雲科技讓Agent“長出了手腳”_數據_02

AgentCore Runtime提供了一個無服務器、強隔離、長時運行的環境,徹底讓開發者告別用拼湊的Lambda函數和腳本手搓的運行環境,實現了Serverless託管執行、強會話隔離、長時會話等能力,解決了“狀態管理”的老大難問題,讓Agent能夠像人類員工一樣長期在線,隨時待命。

AgentCore Memory構建了短期+長期+情景記憶的三層體系,讓Agent具備了“記住→學習→改進→再執行”的閉環能力。特別是“情景記憶”,可以讓Agent記住“發生過什麼事”以及“為什麼那次流程很混亂”,並自動學習策略、優化下一次行動路徑,實現企業Agent所需的“連續性”與“可學習性”。

AgentCore Identity賦予了Agent“可控、可審計、可授權”的企業級身份體系,實現從“人類身份體系”向“Agent 身份體系”的擴展。畢竟在真實的生產環境中,最可怕的不是Agent不工作,而是拿着CEO的權限去讀HR的數據庫,需要精準控制Agent的權限,把潛在的安全隱患鎖死在籠子裏。

AgentCore Gateway扮演了“協調樞紐”的角色,自動掃描分散在數據庫、SaaS應用、舊系統裏的數據,自動生成Agent的“工具地圖”,讓Agent能安全、智能、自動地“發現→連接→使用”所有工具與數據。

AgentCore Observability解決的是“黑盒”問題,讓企業能實時看到Agent的推理、工具調用、狀態流、錯誤、上下文與決策路徑等工作流程,提前驗證Agent會不會搞砸,避免出了問題卻找不到原因。

亞馬遜雲科技開出的“藥方”是否奏效呢?

可以佐證的是汽車服務與技術提供商Cox Automotive的例子,使用AgentCore搭建了一個名為Fleet Mate的Agent,原本需要2天時間的車輛評估被壓縮到了30分鐘。

02 瞄準靶心,讓模型定製成為產品化工程

解決Agent的工程落地只是第一步,大模型同樣是制約生產力的瓶頸,很多企業面臨的障礙不亞於生產環境。

譬如通用大模型不懂企業業務,而且模型參數規模大、推理成本高、延遲難以滿足業務要求;業務規則經常變、新場景不斷出現,導致模型上線後效果會衰退;模型定製需要MLOps、SRE、算法、數據團隊協作,需要專業的團隊才能做……能力強、速度快、成本低幾乎成了不可能三角。

監督微調、模型蒸餾、強化學習是業內公認的“三大法寶”,亞馬遜雲科技的解題思路也不例外。

不同的是,亞馬遜雲科技打出了一套組合拳,從“微調”到“預訓練”,把模型定製從玄學變成了工程學。

從“會聊天”到“幹實事”,亞馬遜雲科技讓Agent“長出了手腳”_生產環境_03

一是Amazon Bedrock強化微調。

傳統的微調(SFT)只是教模型“怎麼説話”,而強化學習(RL)是教模型“怎麼做對”。但強化學習需要構建複雜的獎勵模型,難度太大了。

亞馬遜雲科技的強化微調(RFT)功能,直接把強化學習的門檻踏平了,只需要提供數據,就能自動處理獎勵建模和策略優化,能夠將模型的準確性提升66%,讓一個小模型通過針對性的強化訓練,在特定任務上吊打通用大模型。

二是Amazon SageMaker AI無服務器定製。

以前訓練一個模型,需要配環境、調參、洗數據,準備工作就需要幾個月,Amazon SageMaker AI提出了新的思路——用AI來製造AI。

企業用自然語言描述需求,SageMaker內置的Agent會自動分析場景、推薦微調技術、甚至直接幫企業生成合成數據,然後自動跑完訓練流程。把“需要大團隊、長週期、重投入”的模型定製,變成了“幾天完成的自動化任務”。

三是Amazon Nova Forge。

像醫藥、金融等行業,不僅需要微調大模型,還要模型在底層就理解行業邏輯,但在傳統的流程裏,企業數據無法進入預訓練階段。

Amazon Nova Forge全球首創了“開放訓練模型”體系,允許企業在模型的“中途訓練階段”介入,注入自己的專有數據,不再是打補丁式的微調,而是讓企業以極低的成本,擁有了一個“流淌着自己血液”的預訓練模型。

四是Amazon SageMaker HyperPod無檢查點訓練。

在大模型訓練的過程中,斷點續訓一直是噩夢,一次GPU故障可能導致數小時的進度回滾,造成真金白銀的損失。

Swami在演講中提到了HyperPod無檢查點訓練的“黑科技”,通過實時保存模型狀態,在硬件故障時,能在幾分鐘內自動恢復,不需要回滾到幾個小時前的Checkpoints,大大降低了大規模訓練的沉沒成本。

做一個總結的話,亞馬遜雲科技開啓了一場從“把模型訓練好”,到“把模型訓練得起、用得好”的全鏈路效率革命,讓模型定製從技能工程,進化為可複製的產品化工程。

03 落地為王,打通可信、可靠、可協作閉環

企業把Agent推向生產環境後,CEO們最擔心的問題,可能不是“它能不能做”,而是“我敢不敢讓它做”。

擺在案頭的是更深層次的挑戰:Agent是否可信,在和客户溝通時會不會亂講?Agent是否可靠,業務成功率能否達到企業要求?Agent能否與人類協同,融入已有客服/運營/業務流程?

喊出“為企業提效10倍以上”的亞馬遜雲科技,不只要幫企業打造生產環境、訓練更聰明的大腦,還要打消“敢不敢用”的疑慮。亞馬遜雲科技沒有迴避,在主題演講中留出了相當長的篇幅。

首先是可信。

亞馬遜雲科技傑出科學家Byron Cook講了一個深刻的邏輯:大模型是基於統計學的,是概率性的,天生存在幻覺;而企業的規則(尤其是GDPR等合規要求的出海企業)是邏輯性的、是確定的。

從“會聊天”到“幹實事”,亞馬遜雲科技讓Agent“長出了手腳”_生產環境_04

怎麼解決這個矛盾呢?答案是神經符號AI。

簡單來説就是把“左腦的邏輯”和“右腦的直覺”結合起來。亞馬遜雲科技引入了“自動推理”技術,帶來了三大能力:

驗證輸出:自動推理工具驗證 LLM 的答案是否滿足邏輯和規則。

訓練結合:使用定理證明器訓練,使模型天然具備邏輯正確性。

約束解碼:推理層嵌入驗證器,使模型不能越界生成內容。

目前神經符號AI已經應用到Amazon Kiro、AgentCore Policy等產品中,讓 Agent既聰明又聽話。

然後是可靠。

Agent落地的最大障礙之一在於,“大腦”和“手腳”是分離訓練的,導致模型懂流程,但操作起來“笨手笨腳”。

從“會聊天”到“幹實事”,亞馬遜雲科技讓Agent“長出了手腳”_生產環境_05

亞馬遜雲科技正式發佈了Amazon Nova Act,一個專門為“行動”而生的模型,在訓練中進行了數百個環境+數千工作流程+數十萬交互的強化學習,進行了成千上萬次的試錯。結果超出了不少人的預期:在企業自動化工作流中,Amazon Nova Act實現了90%的成功率。

也就是説,企業可以放心地把點按鈕、填表單、跑流程這些活兒交給Agent,不必擔心它卡在某個彈窗時不知所措。

最終是可協作。

Agent的終局是什麼?是替代人類嗎?亞馬遜雲科技的回答是“Teammate”(隊友)。

從“會聊天”到“幹實事”,亞馬遜雲科技讓Agent“長出了手腳”_生產環境_06

折射到技術層面上,Amazon Connect新增了8項AI能力,包括讓AI像真人一樣説話的神經聲音集成(Sonic)、基於對話自動建議下一步的實時推薦Agent、結合點擊流數據個性化建議的AI驅動預測洞察等。

正如2025 亞馬遜雲科技re:Invent上所演示的:在一個信用卡盜刷的場景中,Agent不僅自動驗證了身份,還通過分析地理位置和交易模式,預判了欺詐風險,並在後台默默地為人類客服準備好了所有資料。人類客服接起電話的那一刻,問題已經解決了一半。

Agent不再只是工具,而是和人類一起協作的隊友。

04 寫在最後

2025年的亞馬遜雲科技re:Invent,更像是一個時代的分水嶺。

過去兩年裏,行業對Agent的熱情大多停在願景層;現在,亞馬遜雲科技給出了一套從基礎設施到模型、從安全到協作、從執行到治理的落地體系。

第一層:AgentCore(讓Agent能跑起來),解決了部署、管理、記憶、安全、工具接入、可觀測性等基礎工程問題。

第二層:模型定製(讓Agent跑得好),通過RFT、無服務器定製、HyperPod等把模型從“通用”變成“企業專屬”。

第三層:可信+可靠+協作(讓企業敢用),讓Agent變得可控、可靠、可協作,成為一個可託付的數字員工。

如果説2023年是生成式AI的元年,2024年是Agent的試驗期,2025年則正式宣告:AI Agent進入企業級生產階段的時代,已經到來。