云計算一哥10分鐘發(fā)了25個新品!Kimi和MiniMax首次上桌
預(yù)覽了新芯片Trainium4
金磊 發(fā)自 拉斯維加斯
量子位 | 公眾號 QbitAI
從未見過如此凡爾賽的名場面。
云計算一哥亞馬遜云科技CEO Matt Garman,在自家年度盛宴re:Invent 2025中,因?yàn)檫€要發(fā)布的新產(chǎn)品太多了,于是他在現(xiàn)場來了一句:
我挑戰(zhàn)一下10分鐘內(nèi)發(fā)布25個產(chǎn)品!

畢竟是聞所未聞的舉動,現(xiàn)場觀眾一下子就沸騰了起來。
然后,Garman真的就以24秒一個產(chǎn)品的速度,把新的計算、存儲、安全、數(shù)據(jù)庫和大數(shù)據(jù)相關(guān)的內(nèi)容,一氣呵成地給發(fā)布了出來。

或許很多小伙伴要問了,要不要這么趕?會不會太兒戲了些?
趕,是真的得趕;但兒戲,卻絕非如此。
因?yàn)榻衲陙嗰R遜云科技在短短2個多小時的時間里,一共發(fā)布了近40個新品。
這并不意味著剛才的25項(xiàng)內(nèi)容不重要,而是前面的新發(fā)布更加勁爆——
圍繞當(dāng)下最火熱的AI Agent,從算力到模型,從平臺到應(yīng)用,幾乎你能想到、用到的內(nèi)容都涵蓋了進(jìn)來。
若是用一個詞來總結(jié)縱觀整場發(fā)布會的感受,那或許就是實(shí)用。
是能直擊你在用AI大模型、AI Agent過程中所有難題的“七寸”的那種。
接下來,我們就來一起看看前面的發(fā)布到底有多重磅。
(PS:先小小劇透一下,中國兩款大模型被云計算一哥高調(diào)點(diǎn)名了~)
劇透新芯片Trainium4,已是算力帝國之勢
AI的本質(zhì)是算力密集型工程,而算力的性能、成本與部署靈活性,直接決定了企業(yè)能走多遠(yuǎn)。
亞馬遜云科技深諳此道,在這場發(fā)布會上,它從三個維度徹底重構(gòu)了AI算力的供給模式。
首先,是在芯片自研方面。
亞馬遜云科技自研的AI芯片Trainium,已經(jīng)從概念產(chǎn)品成長為多億美元級業(yè)務(wù)。據(jù)Garman透露:
亞馬遜云科技已經(jīng)部署了超過100萬顆Trainium芯片,并以比業(yè)界最快AI芯片快4倍的速度快速上量。
而就在今天,Trainium3 Ultra Servers正式全面可用。

這款基于3納米工藝的服務(wù)器,相較上一代Trainium2,在計算性能上提升4.4倍,內(nèi)存帶寬提升3.9倍;更重要的是,在相同延遲下,每兆瓦電力可產(chǎn)出5倍以上的AI Tokens。

除此之外,亞馬遜云科技下一代的芯片也已經(jīng)被曝光了出來——Trainium4。
根據(jù)Garman介紹,Trainium4相較于上一代,將帶來每個維度上的巨大飛躍:FP4計算性能提升6倍,內(nèi)存帶寬提升4倍,并擁有2倍于前代的高帶寬內(nèi)存容量,專為全球最大的模型訓(xùn)練需求而生。

與亞馬遜云科技合作了長達(dá)15年之久的英偉達(dá),這一次同樣出現(xiàn)在了發(fā)布會中。
Garman強(qiáng)調(diào),亞馬遜云科技是全球運(yùn)行英偉達(dá)GPU最穩(wěn)定、最可靠的云平臺。他們甚至?xí)钊氲紹IOS層面進(jìn)行調(diào)試,可以防止GPU意外重啟,這是其他云廠商所不具備的。
在此基礎(chǔ)上,亞馬遜云科技推出了搭載英偉達(dá)最新GB200 NVL72系統(tǒng)的P6e-GB300實(shí)例,專門為訓(xùn)練超大規(guī)模模型的客戶提供頂級算力。
包括OpenAI在內(nèi)的頂尖AI公司,正在亞馬遜云科技上運(yùn)行由數(shù)十萬顆芯片組成的集群,來支持ChatGPT和下一代模型的訓(xùn)練。

最后,還有一個徹底打破了公有云和私有數(shù)據(jù)中心邊界的新產(chǎn)品——AI Factories。
它可以允許客戶在自己的數(shù)據(jù)中心內(nèi)部署專屬的亞馬遜云科技AI基礎(chǔ)設(shè)施。客戶可以復(fù)用自己已有的機(jī)房空間和電力資源,同時無縫接入包括Trainium、英偉達(dá)GPU、SageMaker和Bedrock在內(nèi)的全套亞馬遜云科技的AI服務(wù)。

這就意味著任何擁有自有機(jī)房的大型組織,都可以在不犧牲安全與控制權(quán)的前提下,享受到全球最頂尖的AI算力。
從Trainium的自研,到GPU超集群的運(yùn)維,再到AI Factories的區(qū)域化復(fù)制,亞馬遜云科技在算力供應(yīng)鏈上的掌控力,的確已經(jīng)逼近算力帝國的描述。
而且這種領(lǐng)先可以說是全棧的那種:芯片、網(wǎng)絡(luò)、數(shù)據(jù)中心、一致性API、模型托管、Agent運(yùn)行環(huán)境,每層都在構(gòu)成自己的壁壘。
又有新模型發(fā)布,國產(chǎn)模型還被點(diǎn)名
如果說算力是土壤,那么我們可以把大模型比作是在此孵化的種子。
亞馬遜云科技在這一層面上的解法,是構(gòu)建一個開放、靈活、可深度定制的模型平臺——Amazon Bedrock。
Bedrock的核心哲學(xué)是“沒有一個模型能統(tǒng)治一切”,這也就是為什么亞馬遜云科技會不斷往里面擴(kuò)中新大模型的原因了。
在這次發(fā)布會上,除了引入Google的Gemma、NVIDIA的Nemotron等業(yè)界知名模型外,一個細(xì)節(jié)尤其值得關(guān)注:
中國的Kimi和MiniMax,首次被納入Bedrock。
這標(biāo)志著中國大模型正式通過亞馬遜云科技這一全球最大云平臺出海,進(jìn)入全球開發(fā)者的視野。

在此生態(tài)之上,亞馬遜云科技也推出了自家新的自研大模型——Amazon Nova 2系列。
整體來看,Amazon Nova 2主要包含三個不同的類型:
- Nova 2 Light:主打高性價比與低延遲,在指令遵循、工具調(diào)用、代碼生成、文檔信息抽取等關(guān)鍵任務(wù)上,其性能可與Claude Haiku、GPT-4o-mini、Gemini Flash等業(yè)界標(biāo)桿比肩,甚至超越,而成本更具優(yōu)勢。
- Nova 2 Pro:面向高度復(fù)雜的任務(wù),在需要深度推理和精準(zhǔn)工具使用的場景,如構(gòu)建高級Agent時,表現(xiàn)尤為出色。Garman稱其在多項(xiàng)AI分析基準(zhǔn)測試中,超越了GPT-5.1、Gemini 3 Pro和Claude 4.5 Sonnet。
- Nova 2 Sonic:專注于實(shí)時、類人的語音對話交互,大幅優(yōu)化了延遲,并支持更廣泛的語言。

如果說Nova 2解決了“多”和“快”的問題,那么Nova 2 Omni則是解決了“融”的問題。
它是業(yè)界首個支持文本、圖像、視頻、音頻四模態(tài)輸入,并能生成文本與圖像的統(tǒng)一推理模型。
這意味著,一個模型就能理解一場包含演講、PPT、演示視頻的完整發(fā)布會,并自動生成圖文并茂的摘要報告。
這種多模態(tài)融合能力,自然是構(gòu)建真正理解復(fù)雜現(xiàn)實(shí)世界Agent的關(guān)鍵一步。

然而,所有這些通用模型的終極瓶頸在于:它們不了解你的企業(yè),你的數(shù)據(jù)、流程、行業(yè)知識才是核心競爭力。
為此,亞馬遜云科技祭出了殺手锏——Amazon Nova Forge。

Nova Forge引入了開放訓(xùn)練模型(Open Training Models)的概念。
它允許企業(yè)客戶獲取Nova模型在不同訓(xùn)練階段的檢查點(diǎn)(Checkpoint),將自己的私有數(shù)據(jù)(如產(chǎn)品設(shè)計文檔、失敗案例、制造約束等)與亞馬遜云科技的通用訓(xùn)練數(shù)據(jù)集進(jìn)行融合。
如此一來,就可以訓(xùn)練出一個既保留了強(qiáng)大通用推理能力,又深度理解本企業(yè)獨(dú)特知識的專屬模型(Novella)。

Reddit的案例生動說明了其中所蘊(yùn)含的價值。
通過在預(yù)訓(xùn)練階段就融入其社區(qū)特定的內(nèi)容安全數(shù)據(jù),Reddit成功訓(xùn)練出一個能精準(zhǔn)識別違規(guī)內(nèi)容的專屬模型,不僅達(dá)到了準(zhǔn)確性目標(biāo),還大幅簡化了部署運(yùn)維。
這就很好地解決了傳統(tǒng)微調(diào)中模型災(zāi)難性遺忘的難題,讓企業(yè)真正擁有了自己的行業(yè)專家AI。

Agent,Agent,還得是Agent!
AI Agent,無疑是這次re:Invent中的關(guān)鍵詞之一。
亞馬遜云科技對此也是非常之重視,幾乎把非常大篇幅放在這里。Garman明確表示:
AI助手的時代正在被AI Agent取代;未來每家公司會運(yùn)行數(shù)十億個Agent。
但企業(yè)要想真正把這些AI Agent給用透,就必須解決兩大難題:如何高效構(gòu)建Agent?如何確保它們行為可控、結(jié)果可信?
為此,亞馬遜云科技給打了個樣。
在開發(fā)者層面,Garman先是針對其Kiro編程助手,推出了新的三個Agent。

首先是Kiro Autonomous Agent(自主Agent)。
它不再是一個簡單的代碼補(bǔ)全工具,現(xiàn)在可以充當(dāng)一個能長期運(yùn)行、自主規(guī)劃、并行執(zhí)行復(fù)雜開發(fā)任務(wù)的“虛擬同事”。
例如,當(dāng)需要升級一個被15個微服務(wù)共用的關(guān)鍵庫時,傳統(tǒng)方式需要開發(fā)者逐個倉庫操作。
而Kiro Autonomous Agent會自動分析所有依賴,生成15個經(jīng)過完整測試、可直接合并的Pull Request。它會記住開發(fā)者的反饋,并在后續(xù)任務(wù)中持續(xù)學(xué)習(xí)和改進(jìn)。

其次是AWS Security Agent(安全Agent)。
它將安全左移(Shift Left)做到極致,能主動審查設(shè)計文檔,在代碼提交(Pull Request)時掃描漏洞,并能按需發(fā)起一鍵式滲透測試。
這個Agent可以說是把過去昂貴、低頻、滯后的安全審計,變成了開發(fā)流程中實(shí)時、高頻、自動化的環(huán)節(jié)。

最后是AWS DevOps Agent(運(yùn)維Agent),一個7×24小時在線的超級SRE。
當(dāng)系統(tǒng)告警時,它能利用對應(yīng)用拓?fù)浜筒渴鸸芫€的深度理解,快速定位根因(例如,一個由CDK代碼錯誤導(dǎo)致的Lambda IAM策略問題),并提出修復(fù)建議,甚至能推薦預(yù)防措施,避免問題復(fù)發(fā)。

這三個Agent,覆蓋了軟件開發(fā)全生命周期,將開發(fā)者從重復(fù)、繁重、易錯的體力勞動中解放出來,讓他們能專注于更高價值的創(chuàng)造性工作。
內(nèi)部數(shù)據(jù)顯示,一個6人團(tuán)隊借助Kiro,僅用76天就完成了原本需要30人干18個月的架構(gòu)重構(gòu)項(xiàng)目(據(jù)說是重寫了一遍Bedrock)。
當(dāng)然,并非所有企業(yè)都有能力從零構(gòu)建Agent。為此,亞馬遜云科技提供了強(qiáng)大的平臺能力:
AWS Transform Custom,幫助企業(yè)消滅技術(shù)債。
開發(fā)者可以創(chuàng)建自定義的代碼轉(zhuǎn)換Agent,將任何老舊的代碼、框架、API(甚至是公司內(nèi)部獨(dú)有的)自動遷移至現(xiàn)代化平臺。客戶QAD利用它,將原本需要2周的遷移工作壓縮到3天內(nèi)完成。

Policy in AgentCore,這是解決Agent失控問題的關(guān)鍵。
它允許管理者用自然語言(如“禁止向退款金額超過1000美元的客戶退款”)定義策略。
這些策略會被轉(zhuǎn)化為安全的Cedar策略語言,在Agent每次嘗試調(diào)用工具或訪問數(shù)據(jù)前進(jìn)行毫秒級實(shí)時校驗(yàn)。這就像給Agent裝上了不可繞過的電子圍欄,讓它在擁有強(qiáng)大自主性的同時,行為邊界清晰可控。

AgentCore Evaluations,解決了Agent不可信問題。
傳統(tǒng)上,評估Agent輸出質(zhì)量(如準(zhǔn)確性、無害性、品牌一致性)需要組建專業(yè)數(shù)據(jù)科學(xué)團(tuán)隊構(gòu)建復(fù)雜評估管線。
AgentCore Evaluations將這一切自動化,提供13種預(yù)置評估器,并能將評估結(jié)果直接集成到CloudWatch中。企業(yè)可以持續(xù)監(jiān)控Agent在生產(chǎn)環(huán)境中的表現(xiàn),確保其輸出始終符合預(yù)期。

從構(gòu)建、部署到治理、評估,亞馬遜云科技為Agent的全生命周期提供了閉環(huán)工具鏈,讓企業(yè)敢用、能用、用好Agent。
目標(biāo)很明確:就是死磕怎么“用好”
回顧整場發(fā)布會,亞馬遜在AI大模型、AI Agent時代的發(fā)展路徑其實(shí)是非常清晰且樸素的——
如何把它們給用好。
即使把時間線再往回?fù)軆赡辏鋺?zhàn)略依舊是如此:從一開始就并沒有過度深入卷大模型,而是死磕底層架構(gòu)和應(yīng)用。
用亞馬遜云科技自己的話來說就是“客戶需要什么我就做什么”:
- 算力成本與部署難題?用自研Trainium芯片、與英偉達(dá)的深度合作、以及開創(chuàng)性的AI Factories來解決。
- 模型無法理解企業(yè)私有知識?用開放的Bedrock生態(tài)、強(qiáng)大的Nova系列,以及革命性的Nova Forge來解決。
- Agent不可控、不可信、難構(gòu)建?用Kiro前沿智能體、Transform Custom、Policy和Evaluations等一系列工具來解決。
這三層架構(gòu)構(gòu)成了一套組合拳,直擊AI價值落地的“七寸”。它所傳遞的核心信息同樣非常清晰:
AI的未來,不在于單點(diǎn)技術(shù)的突破,而在于一整套端到端、安全、可靠、可規(guī)模化的企業(yè)級基礎(chǔ)設(shè)施。
正如索尼和Adobe在演講中所分享的,真正的轉(zhuǎn)型成功,源于將數(shù)據(jù)和應(yīng)用深度融入云平臺,從而獲得了應(yīng)對不確定性的敏捷性和韌性。
這或許就是Garman在發(fā)布會中所提及的那個拐點(diǎn):從AI的“技術(shù)時代”,正式邁入AI的“價值時代”。
One More Thing:
今年全球來到拉斯維加斯參加re:Invent的人數(shù)達(dá)到了6萬人!
光是今天主論壇現(xiàn)場,就已經(jīng)人人人的狀態(tài)了,來感受一下這個feel:

錯過了今天re:Invent的精彩內(nèi)容?
別急,亞馬遜云科技re:Invent 中國行即將啟幕!
四大城市巡演 + 北京主會場直播,無論你是云計算新手還是技術(shù)老兵,都將從高階演講、實(shí)戰(zhàn)內(nèi)容、技術(shù)分享和專家互動中受益。立即注冊,搶占席位,把握Agentic AI時代的新機(jī)遇!
https://events.amazoncloud.cn/reinvent-online-20251218?trk=811631fa-539a-41c3-8fed-f23e4f9919dc&sc_channel=el
- 前端沒死,AI APP正在返祖2025-12-02
- 北京產(chǎn)業(yè)國資領(lǐng)投,清微智能完成C輪融資2025-12-02
- 10000個代碼文件,我打幾把游戲的功夫就搞成Wiki了!2025-11-27
- 豆包語音對話功能更新,能講4種地道方言,具備思考能力2025-11-28




