如果説GPU是AI時代的加速器,那麼CPU依然是整個數字世界的基石。
如今,數字世界的基石因為ARM處理器的崛起而愈發光彩。在今天的亞馬遜雲科技re:Invent 2025大會上,亞馬遜雲科技正式推出Graviton 5處理器。Graviton 5採用 192 核設計和3nm製程工藝,面向通用、計算密集型和內存密集型工作負載,性能比上一代產品提升高達 25%。
此外,根據亞馬遜雲科技數據,連續第三年新增 CPU 容量中一半以上由 Graviton 提供支持,排名前 1000 的 EC2 客户中有 98%採用Graviton架構。
無疑,Graviton 5的發佈無疑具有標誌性的產業意義。它不僅意味着亞馬遜雲科技自研芯片每兩年一週期的成功,更標誌着數據中心算力結構發生了根本性轉變。
Graviton 5:性能再大幅提升
Graviton5 是亞馬遜雲科技迄今為止最為先進的自研定製CPU。
據悉,Graviton5 採用 3nm 工藝和裸芯片散熱設計,在降低熱阻和風扇功耗的同時兼顧性能和能效。Graviton5 主要面向通用、計算密集型和內存密集型等工作負載。
與上一代產品相比,基於全新 Graviton5的 M9g 實例的計算性能提升25%。Graviton5的L3 緩存容量提升 5 倍,每個核心的緩存容量比 Graviton4 提升 2.6 倍,內存速度更快。同時,實例的網絡吞吐量提升高達 15%,且在最大實例規格上,網絡帶寬翻倍。
亞馬遜雲科技副總裁、傑出工程師Ali Saidi介紹,Graviton5 覆蓋了多種工作負載,為用户帶來了極具性價比的服務。
同時,全新第六代 Nitro系統和 Nitro 隔離引擎,進一步提升Graviton 5的安全保障。 Nitro系統能虛擬化、存儲和網絡任務卸載到專用硬件上。Graviton5 引入Nitro 隔離引擎,通過使用形式化驗證來增強 Nitro 系統,從而確保工作負載彼此隔離和安全。全新Nitro隔離引擎使用精簡且經過形式化驗證的代碼庫,其中包含數學證明,以確保其行為完全符合定義。亞馬遜雲科技表示,這項技術為經數學驗證的雲安全樹立了新的標準。
根據亞馬遜雲科技介紹,基於Graviton5 的M9g 專為通用雲工作負載而設計,預覽版現已推出;面向計算密集型工作負載的 C9g 實例和麪向內存密集型工作負載的 R9g 實例計劃於 2026 年推出。
Ali Saidi認為Graviton每兩年一個版本的節奏,保證了每個版本的顯著增強,比較符合用户的預期和實際需求。
通用算力芯片在AI時代依然大有作為
在生成式AI爆發的初期,通用算力與AI算力往往被視為兩種獨立的資源,並且AI算力備受關注。Omdia最新《雲與數據中心AI處理器預測報告》顯示,2024年GPU和AI加速器出貨金額達1230億美元,預計到2030年將達2860億美元。
可以説,AI算力未來市場空間未來大巨大。但這是否意味着通用算力就此沉寂?
如今,隨着AI推理走向工業化、AI Agent大量涌現以及大量應用進行AI化改造,算力需求也在發生悄然變化。通用算力與AI算力不再是非此即彼和各自為戰;相反,通用算力與AI算力正全面走向深度融合與協同。
例如,在GPU等AI算力資源極其昂貴的背景下,通用CPU通過集成更多AI加速單元,用於處理中小規模的推理任務(Inference)。像亞馬遜雲科技Graviton就是目前市場的典型,通過增加BF16指令集支持,達到優化機器學習推理的目的。
亞馬遜雲科技副總裁、傑出工程師Ali Saidi認為,AI的快速發展,其實為通用計算帶來了更多機會,不僅大模型的構建、測試、部署和學習需要CPU參與,AI還會帶來更多軟件需求,進而帶動通用算力的需求。
事實上,從亞馬遜雲科技的芯片戰略也能看出通用算力與AI算力融合的重要趨勢。以今年大會上正式發佈上市的Trn3 UltraServer為例,其計算節點採用All AWS Sillicon的策略,將Graviton+Nitro+Trainium4芯片進行垂直整合,相比上一代,整體計算性能提升4.4倍。
具體來看,在Trn3 UltraServer中,Graviton用來處理IO任務,Nitro則提供極速網絡聯接,支持數量巨大的Trainium 3進行內存共享。
毫無疑問,作為雲服務一哥,亞馬遜雲科技深知要想在AI時代實現更低成本和更高性能,就必須將通用算力與AI算力進行協同融合,以達到整個算力服務的最佳。
根本性改變算力結構
過去十年,數據中心算力結構發生了根本性改變。
在Graviton出現之前,數據中心通用處理器是X86的天下。雖然也有像高通等廠商想推動ARM處理器進入到數據中心市場,但無不以失敗告終。
這十年所發生的巨大變化,要源自於亞馬遜在2015年以3.5億美元收購以色列芯片設計公司 Annapurna Labs。
2018年,亞馬遜雲科技發佈Graviton 1,並退出基於Graviton 1的EC2 A1計算實例,正式宣告開啓對數據中心算力結構的破局。Graviton 1的產業意義證明,Arm處理器在雲端運行的可行性。
2019年12月,基於Arm Neoverse N1核心和採用7nm製程工藝的Graviton 2發佈,其性能相比於上一代有着多大7倍的提升,標誌着Arm處理器開啓全面可用的階段,不僅僅適用於Web服務、數據庫、緩存等核心業務同樣勝任;
2021年11月,採用5nm製程工藝和Chiplet設計的Graviton 3正式問世,Graviton 3成為首個支持DDR 5內存的雲端處理器,內存帶寬提升50%,浮點運算性能翻倍,專門對機器學習等工作負載優化。
2023年11月,基於Arm Neoverse V2核心和採用4nm製程工藝的Graviton 4接踵而至,採用96個核心設計,內存帶寬提升75%,優化高性能數據庫、AI數據處理等工作負載。
再到今年大會上,Graviton 5的正式發佈,性能得到持續提升。根據亞馬遜雲科技數據顯示,其數據中心超過 50% 的 CPU 新增容量都部署在 Graviton 上。
事實上,Graviton的推出堪稱雲計算和半導體產業發展的一個分水嶺事件。亞馬遜雲科技用五代Graviton芯片證明了“雲服務商自研芯片”的商業閉環的成功,它不僅打破了x86架構在數據中心服務器市場的長期壟斷,更開啓了雲服務商“自研芯片”的時代。
此後,全球四大雲服務商全部佈局和推動自研芯片,進而導致數據中心算力結構在過去十年發生根本性變化。