云計(jì)算一哥,剛剛重新定義了AI Agent的玩法
80分鐘的會(huì),提了217次Agent!
金磊 假裝發(fā)自 紐約
量子位 | 公眾號(hào) QbitAI
80分鐘的一場(chǎng)活動(dòng),Agent的“出鏡次數(shù)”竟能高達(dá)217次。
解鎖平均20多秒就提一次Agent的,正是云計(jì)算一哥,亞馬遜云科技。
為何會(huì)如此?
因?yàn)榫驮趧倓偟募~約峰會(huì)上,亞馬遜云科技可以說是重新定義了部署AI Agent到生產(chǎn)環(huán)境中的方式——
正式發(fā)布Amazon Bedrock AgentCore,一個(gè)企業(yè)級(jí)的AI Agent搭建工具包。

如果說以往的AI Agent要部署到實(shí)際生產(chǎn)中,其結(jié)果更像是一個(gè)“毛坯房”,其間有太多問題亟需解決。
比如你想開發(fā)一個(gè)智能客服、個(gè)人助手或者業(yè)務(wù)流程自動(dòng)化工具,這個(gè)過程都需要整合大語言模型、連接數(shù)據(jù)庫、調(diào)用各種API,并讓系統(tǒng)能夠智能決策。
AgentCore就像是為這些應(yīng)用提供的“智能大腦”,可以幫你統(tǒng)一管理和協(xié)調(diào)所有組件,讓復(fù)雜的AI應(yīng)用開發(fā)變得簡(jiǎn)單高效。
之前的Amazon Bedrock提供的能力更加聚焦在基礎(chǔ)大模型本身,比如調(diào)用Claude、Meta、Nova、Mistral等大模型,有點(diǎn)類似于“租用大腦”。
而AgentCore則是在這個(gè)基礎(chǔ)上提供一個(gè)“智能體搭建工具包”,讓你能把這些大腦組合起來完成具體任務(wù)。
具體而言,它是涵蓋7大核心服務(wù)的一套組合拳,把部署AI Agent到生產(chǎn)過程中的各種細(xì)節(jié)內(nèi)容都照顧到位了,有一種直接“拎包入住精裝房”的感覺:

- AgentCore Runtime:
提供低延遲的無服務(wù)器環(huán)境,支持會(huì)話隔離,兼容任何代理框架(包括開源框架),能夠處理多模態(tài)工作負(fù)載和長(zhǎng)期運(yùn)行的Agent。通過AgentCore SDK在代碼中添加幾行代碼,指定入口點(diǎn)函數(shù),即可將代理部署到云端。
- AgentCore Memory:
管理會(huì)話和長(zhǎng)期記憶,為模型提供上下文信息,幫助Agent從過去的交互中學(xué)習(xí)。對(duì)于短期記憶,通過create_event存儲(chǔ)Agent交互,通過list_events加載最近的對(duì)話內(nèi)容;對(duì)于長(zhǎng)期記憶,支持語義記憶策略(如用戶偏好、總結(jié)和事實(shí)捕獲),數(shù)據(jù)以加密形式存儲(chǔ),并支持基于命名空間的數(shù)據(jù)分割。
- AgentCore Observability:
提供代理執(zhí)行的逐步可視化,包括元數(shù)據(jù)標(biāo)記、自定義評(píng)分、軌跡檢查和故障排除/調(diào)試過濾器。可以幫助開發(fā)者調(diào)試、審計(jì)和監(jiān)控Agent性能,內(nèi)置儀表板用于跟蹤關(guān)鍵操作指標(biāo)(如會(huì)話數(shù)、延遲、錯(cuò)誤率等),支持OpenTelemetry以集成現(xiàn)有可觀測(cè)性平臺(tái)。
- AgentCore Identity:
使AI Agent能夠安全地訪問亞馬遜云科技服務(wù)和第三方工具(如GitHub、Salesforce、Slack),支持基于用戶身份或預(yù)授權(quán)用戶同意的操作。通過創(chuàng)建工作負(fù)載身份和憑證提供者(如OAuth2、API密鑰),Agent可以使用這些憑證安全地訪問資源。
- AgentCore Gateway:
將現(xiàn)有的API和Lambda函數(shù)轉(zhuǎn)換為可用于代理的工具,提供跨協(xié)議(包括MCP)的統(tǒng)一訪問和運(yùn)行時(shí)發(fā)現(xiàn),提供雙重身份驗(yàn)證模型以確保安全。
- AgentCore Browser:
提供托管的網(wǎng)頁瀏覽器實(shí)例,擴(kuò)展Agent的Web自動(dòng)化工作流。可以用于訪問沒有程序化API的系統(tǒng)或需要通過Web界面訪問的資源。
- AgentCore Code Interpreter:
提供隔離環(huán)境以運(yùn)行代理生成的代碼。用于執(zhí)行需要計(jì)算的任務(wù),例如客戶支持Agent需要進(jìn)行的計(jì)算。

這些服務(wù)既可以單獨(dú)使用,也經(jīng)過優(yōu)化能夠無縫協(xié)作,開發(fā)者不用再花時(shí)間去拼湊各種組件了。
AgentCore是首個(gè)提供完全開發(fā)靈活性的企業(yè)級(jí)無服務(wù)器AI代理運(yùn)行時(shí)平臺(tái),支持任何框架、模型和協(xié)議,具備8小時(shí)工作負(fù)載支持、嚴(yán)格安全邊界和按需付費(fèi)的可組合服務(wù)架構(gòu)。
一言蔽之,再大規(guī)模的AI Agent,現(xiàn)在AgentCore這里,都可以安全操作和部署。
由此作為最為關(guān)鍵的發(fā)布,亞馬遜云科技在今天的活動(dòng)中,不論是在基礎(chǔ)設(shè)施、模型架構(gòu),亦或是應(yīng)用上,均圍繞著Agent來展開。

之所以如此,亞馬遜云科技Agentic AI副總裁Swami Sivasubramanian的話來說就是:
未來的關(guān)鍵在于讓所有Agents和工具協(xié)同工作。

不僅要方便,還要夠靠譜
為了更方便操作,基于AgentCore,亞馬遜云科技還推出了Marketplace中的AI Agents和工具,只需要通過自然語言搜索,客戶就可以輕松描述使用場(chǎng)景并找到相關(guān)解決方案(目前已經(jīng)有數(shù)百種)。

除此之外,亞馬遜云科技在Amazon SageMaker AI中還推出了Amazon Nova定制化的功能。
客戶現(xiàn)在可以在模型訓(xùn)練生命周期中對(duì)Nova Micro、Nova Lite和Nova Pro進(jìn)行定制,包括預(yù)訓(xùn)練、監(jiān)督微調(diào)和對(duì)齊。

據(jù)了解,這些技術(shù)作為現(xiàn)成的Amazon SageMaker配方提供,并支持無縫部署到Amazon Bedrock,滿足按需和預(yù)置吞吐量推理的需求。
針對(duì)AI Agent許多功能過分依賴API的問題,亞馬遜云科技還推出了Amazon Nova Act來打破這一局限——
創(chuàng)建能夠在網(wǎng)頁瀏覽器中執(zhí)行任務(wù)的AI Agent。

與此同時(shí),亞馬遜云科技一道還發(fā)布了Amazon Nova Act SDK的研究預(yù)覽版,用這個(gè)SDK,開發(fā)者就可以很方便地創(chuàng)建能夠自動(dòng)執(zhí)行網(wǎng)頁任務(wù)的AI Agent。
為了進(jìn)一步提高準(zhǔn)確性,SDK支持通過Playwright進(jìn)行瀏覽器操作、API調(diào)用、Python集成以及并行線程處理,以克服網(wǎng)頁加載延遲。
在內(nèi)部評(píng)估中,Amazon Nova Act針對(duì)特定能力取得了超過90%的高分,例如在ScreenSpot Web文本基準(zhǔn)測(cè)試中得分0.939。
由此可見,亞馬遜云科技在打造AI Agent這件事上,不僅追求可用度,更加注重可靠性。
數(shù)據(jù)庫也很AI Agent
亞馬遜云科技針對(duì)AI Agent這個(gè)主旋律,還在數(shù)據(jù)層上下足了功夫。
眾所周知,向量(Vectors)可以說是AI的語言,它可以把文字、圖像等內(nèi)容轉(zhuǎn)成大模型能理解的數(shù)字格式。
對(duì)于現(xiàn)代企業(yè)來說,AI Agent將向量用于兩個(gè)關(guān)鍵功能,一個(gè)是用于從過去的互動(dòng)中構(gòu)建上下文,另一個(gè)是發(fā)現(xiàn)海量數(shù)據(jù)集中的相似性內(nèi)容。
但現(xiàn)在面臨的一個(gè)問題是,目前的知識(shí)、數(shù)據(jù)規(guī)模變得越來越大,它們不再僅僅是臨時(shí)資源,更是必須長(zhǎng)期保存的戰(zhàn)略資源。
為此,亞馬遜云科技推出了Amazon S3 Vectors——首個(gè)原生支持存儲(chǔ)大規(guī)模向量數(shù)據(jù)集、并提供亞秒級(jí)查詢性能的云對(duì)象存儲(chǔ)服務(wù)。

它最大的亮點(diǎn),就是直接把上傳、存儲(chǔ)和查詢向量的總成本降低多達(dá)90%!

從技術(shù)角度來看,S3 Vectors推出了一種叫“向量桶”(vector buckets)的新存儲(chǔ)類型,它有專門的API接口,讓我們可以存儲(chǔ)、訪問和查詢向量數(shù)據(jù),而且不需要自己搭建任何基礎(chǔ)設(shè)施。
當(dāng)創(chuàng)建一個(gè)S3向量桶時(shí),我們的向量數(shù)據(jù)會(huì)被組織在“向量索引”(vector index)中,這樣就能很簡(jiǎn)單地對(duì)數(shù)據(jù)集進(jìn)行相似性搜索。
據(jù)了解,每個(gè)向量桶最多可以有10000個(gè)向量索引,每個(gè)向量索引可以存儲(chǔ)數(shù)千萬個(gè)向量。

在創(chuàng)建向量索引后,當(dāng)我們往索引里添加向量數(shù)據(jù)時(shí),還可以給每個(gè)向量附加一些元數(shù)據(jù)(以鍵值對(duì)的形式),這樣一來查詢時(shí)就能根據(jù)特定條件進(jìn)行過濾,比如按日期、類別或用戶偏好來篩選。
隨著時(shí)間推移,當(dāng)你對(duì)向量進(jìn)行寫入、更新和刪除操作時(shí),S3 Vectors會(huì)自動(dòng)優(yōu)化這些向量數(shù)據(jù),確保在向量存儲(chǔ)方面達(dá)到最佳的性價(jià)比,即使數(shù)據(jù)集規(guī)模不斷擴(kuò)大和變化也是如此。

S3 Vectors還與Amazon Bedrock Knowledge Bases(包括Amazon SageMaker Unified Studio)原生集成,用于構(gòu)建成本效益高的檢索增強(qiáng)生成(RAG)應(yīng)用。
通過與Amazon OpenSearch Service的集成,我們可以把不常查詢的向量放在S3 Vectors中來降低存儲(chǔ)成本,然后在需求增加時(shí)快速將它們轉(zhuǎn)移到OpenSearch,或者用于支持實(shí)時(shí)、低延遲的搜索操作。

亞馬遜云科技的AI Agent之道,已經(jīng)改變了AI編程
除了基礎(chǔ)設(shè)施和模型層面之外,亞馬遜云科技在應(yīng)用上還拿出了一款全新的免費(fèi)AI編程工具,Kiro。

若是用一句話概括Kiro的亮點(diǎn),那就是只要你有想法,它就能幫你把這個(gè)想法變成實(shí)際可用的軟件,而且是從項(xiàng)目啟動(dòng)、設(shè)計(jì)、編程到最終維護(hù),全程都有專業(yè)級(jí)的Agent深度參與。
例如我們要給電商網(wǎng)站添加一個(gè)評(píng)論系統(tǒng),現(xiàn)在就只需要三步即可。
第一步,把一句話需求變成詳細(xì)計(jì)劃:
為產(chǎn)品添加評(píng)論系統(tǒng)。

可以看到,Kiro秒懂了你的意圖,馬上把這句簡(jiǎn)單的話,分解成一個(gè)個(gè)具體的用戶場(chǎng)景和需求。
比如,它會(huì)想到“用戶要能看評(píng)論”、“用戶要能寫評(píng)論”、“用戶可以篩選評(píng)論”、“用戶可以給評(píng)論打分”等等。
并且,Kiro會(huì)把每個(gè)需求的驗(yàn)收標(biāo)準(zhǔn)都寫得清清楚楚,就像一份詳細(xì)的需求文檔,避免了后續(xù)理解上的偏差。
第二步,根據(jù)計(jì)劃自動(dòng)生成“施工圖紙”。
在咱們確認(rèn)了第一步的需求計(jì)劃后,Kiro就會(huì)自己去研究現(xiàn)有的項(xiàng)目代碼;然后,它會(huì)自動(dòng)生成一份技術(shù)“施工圖紙”。
這份圖紙非常專業(yè),包括數(shù)據(jù)怎么流動(dòng)、需要哪些新的數(shù)據(jù)接口和數(shù)據(jù)庫設(shè)計(jì)等等。
比如,它會(huì)設(shè)計(jì)好“評(píng)論”這個(gè)東西具體應(yīng)該包含哪些信息(如評(píng)論內(nèi)容、評(píng)分、用戶ID等)。

第三步,把“圖紙”變成一個(gè)個(gè)具體的“施工任務(wù)”。
在這個(gè)步驟中,Kiro會(huì)根據(jù)上一步的“施工圖紙”,把整個(gè)開發(fā)工作拆分成一個(gè)個(gè)小任務(wù),并且按照“先做什么后做什么”的依賴關(guān)系排好順序。
每個(gè)小任務(wù)都寫得非常具體,比如“寫單元測(cè)試”、“做集成測(cè)試”、“考慮加載時(shí)的頁面狀態(tài)”、“適配手機(jī)版”、“保證無障礙使用”等等。

或許此時(shí)你就要問了,Kiro和其它的編程AI有什么區(qū)別?
其實(shí)從剛才的展示過程中應(yīng)該也能或多或少地感受到,在亞馬遜云科技開辟的AI Agent新生產(chǎn)范式之下,正如網(wǎng)友所說:
Kiro規(guī)范化了AI編程的工作流程。

以上便是此次發(fā)布的主要內(nèi)容了,整體來看,亞馬遜云科技再一次從基礎(chǔ)設(shè)施、模型框架以及應(yīng)用三個(gè)層面來了個(gè)“大煥新”,而這一次的主角,毫無疑問就是AI Agent。
而這一切,所影射的實(shí)則是云計(jì)算一哥下的一盤大棋。
Why AI Agent?Why 亞馬遜云科技?
對(duì)于第一個(gè)問題,若是用Swami Sivasubramanian在現(xiàn)場(chǎng)所陳述的愿景來解釋,那就是:
讓亞馬遜云科技成為構(gòu)建世界上最有用的AI Agents的最佳場(chǎng)所。

在亞馬遜云科技看來,AI Agent的意義不僅僅是一個(gè)技術(shù)概念,更是企業(yè)組織效率的躍遷工具。
借助Agentic AI,企業(yè)可以將重復(fù)性強(qiáng)、邏輯明確的任務(wù)交由智能體完成,讓員工專注于更具創(chuàng)造力與戰(zhàn)略性的事務(wù)。
通過AI Agent,亞馬遜云科技可以幫助客戶簡(jiǎn)化流程、提升響應(yīng)速度,并釋放團(tuán)隊(duì)潛能,從而改變業(yè)務(wù)運(yùn)作方式。
而縱觀今天所有的新發(fā)布,雖然它們的細(xì)分功能各有側(cè)重,但小目標(biāo)均是劍指于此。
例如為了讓更多企業(yè)快速找到、試用并部署Agent,亞馬遜云科技在其Marketplace市場(chǎng)中新增了“AI Agents & Tools”分類。
再如為了解決許多AI Agent只能停留在原型驗(yàn)證階段,缺乏可擴(kuò)展性與安全保障的問題,亞馬遜云科技推出的Amazon Bedrock AgentCore就專門為生產(chǎn)級(jí)AI Agent而設(shè)計(jì)。
以及面向開發(fā)者,諸如Kiro這樣的AI編程應(yīng)用,更是重新規(guī)范了AI Agent在編程任務(wù)中的流程,目標(biāo)依舊是能夠保障“生產(chǎn)級(jí)”。
如此考量的背后,也有市場(chǎng)發(fā)展的預(yù)期所支撐。根據(jù)最新調(diào)查數(shù)據(jù),AI Agents正迅速成為企業(yè)主流應(yīng)用。
LangChain調(diào)查顯示,超過50%的公司已在生產(chǎn)環(huán)境中部署agent,近80%正在開發(fā)中。Gartner預(yù)測(cè)到2028年,33%的企業(yè)軟件將包含Agentic AI(相比2024年不到1%),15%的日常工作決策將由其自主完成,并將取代20%的人類店面互動(dòng)。
企業(yè)更青睞能查詢多個(gè)任務(wù)特定模型的Agentic AI功能而非單一基礎(chǔ)模型,這種多語言模型方法具有更強(qiáng)的跨領(lǐng)域擴(kuò)展性。目前,軟件開發(fā)、客戶服務(wù)、理賠處理和IT流程自動(dòng)化是Agentic AI的主要早期應(yīng)用場(chǎng)景。
并且從技術(shù)發(fā)展的角度來看,目前幾乎所有的生成式AI產(chǎn)品或應(yīng)用,均離不開AI Agent這個(gè)關(guān)鍵詞。
由此,就不難理解為什么亞馬遜云科技如此關(guān)注AI Agent了,正如CEO Matt Garman所說:
AI Agent將改變我們所有人的工作和生活方式,其影響力堪比互聯(lián)網(wǎng)的誕生。
大趨勢(shì)已經(jīng)指向AI Agent,科技巨頭又以“all in”之勢(shì)發(fā)力于此,雙重認(rèn)證之下已然證明了AI Agent的重要性;但更重要的一點(diǎn)是,云計(jì)算一哥已然給業(yè)界交付了“快好省”投入生產(chǎn)的新范式。
One More Thing:
上海峰會(huì)余溫猶在,紐約峰會(huì)新品已來。亞馬遜云科技已經(jīng)把兩場(chǎng)頂級(jí)盛會(huì)的精華內(nèi)容,濃縮進(jìn)城市限時(shí)巡演活動(dòng)中。8 月 8 日起,福州、合肥、青島、廣州、重慶、成都、長(zhǎng)沙七城聯(lián)動(dòng),每站駐留 3 小時(shí),聚焦最熱門的 AI 場(chǎng)景,現(xiàn)場(chǎng)拆解、即時(shí)體驗(yàn),為城市伙伴帶來零距離的前沿洞察。
感興趣的小伙伴可以前往亞馬遜云科技官方小程序注冊(cè)現(xiàn)場(chǎng)參會(huì)哦~
- 云計(jì)算一哥10分鐘發(fā)了25個(gè)新品!Kimi和MiniMax首次上桌2025-12-03
- Ilya剛預(yù)言完,世界首個(gè)原生多模態(tài)架構(gòu)NEO就來了:視覺和語言徹底被焊死2025-12-06
- 前端沒死,AI APP正在返祖2025-12-02
- 華為新架構(gòu)砍了Transformer大動(dòng)脈!任意模型推理能力原地飆升2025-12-06




