本文基於RFC、draft及OCP 2024/2025峯會等為參考基準,深度解構SRv6的核心衝突——uSID(AI/DC陣營)與G-SID(運營商陣營)的“標準化休戰”,覆盤息壤SRv6、Meta(DSF/NSF)、阿里(HPN)、AWS(SRD)最佳實踐,看看SRv6如何助力實現OpenAI “星際之門”/馬斯克 xAI/Meta “Prometheus”等吉瓦級(GW)AI數據中心端到端互聯。

一、“超節點”之後,吉瓦級(GW)算力的Scale-Across困局

1.1 萬卡/十萬卡/百萬卡AI集羣時代:為何 SRv6 成為必然選擇?

隨着AI大模型廣泛採用MoE等並行計算架構,超節點規模的擴展正面臨機櫃互聯能力的嚴峻挑戰,非超節點的Scale-up組網也同樣諸侯各憑能力各佔山頭,唯一不變的主線是開放以太網生態持續向前迭代發展,若以太網路線的Scale-up網絡的演進主線為ESUN統一網絡層,傳輸層為ESUN-TUALink的兩強爭霸,那麼以太網的Scale-out網絡的Rocev2網絡顯得有點高處不勝寒,而以太網的Scale-accross網絡賽道也比較寬敞,畢竟只有SRv6一家。

接下來我們一起從SRv6的技術原理出發,結合RFC標準和Draft草案,以及SRv6在運營商、國內和國際知名大廠的AI落地實踐中看看SRv6如何定義確定性、無損、“AI+”的智能高速公路的。

二、SRv6架構解構——賦能吉瓦級(GW)Fabric的“智能API”

2.1 SRv6 基礎架構 (RFC 8402, 8754, 8986)

SRv6 的核心由三個關鍵 RFC 定義:

2.1.1 核心架構

 RFC 8402《Segment Routing Architecture》是SR的基本概念的綱領性文件 ——定義了Segment Routing (SR)、Segment ID (SID)、SR Domain、SR Policy等最核心的概念。另外也明確提出了SR架構可以應用於兩種數據平面:SR-MPLS (使用MPLS標籤作為SID)+SRv6 (使用IPv6地址作為SID);

2.1.2 分段路由報頭

RFC 8754《IPv6 Segment Routing Header》SRv6數據包格式和轉發行為的“黃金標準”,其核心內容是定義了SRv6的路徑轉發信息放置在一個全新的IPv6擴展頭(Routing Type 4)、規定了指針(Segments Left)執行動作和聯動路由器執行下一步封裝解封裝的動作。

2.1.3 “可編程”的靈魂(RFC 8986):

SRv6的革命性在於RFC 8986(SRv6 Network Programming)標準——RFC 8986 的核心是定義了 SID 的“可編程性”,它規定了128位SID必須遵循 {Locator:Function:Argument} 結構,其中“Locator”負責可達性,“Function”則定義了節點必須執行的具體網絡指令(如 End.X 的強制轉發或 End.DT4 的VPN解封裝),而‘Argument’則為這些指令傳遞可選參數。

深度解讀 SRv6 (uSID vs G-SID),揭秘息壤、阿里、Meta、AWS 的最佳實踐(上篇)_RFC

圖1:SRv6 報頭與可編程性示意圖

SRv6將網絡智能從核心交換機轉移到了源頭(主機/NIC/DPU),實現了真正的源路由(Source-Routing)

2.1.4 面向 AI 的關鍵 IETF 草案

draft-filsfils-srv6ops-srv6-ai-backend (SRv6 for Deterministic Path Placement in AI Backends) 是定義 SRv6 AI 集羣網絡架構中里程碑式草案,核心是規範了智能網卡 (NIC)  如何使用封裝行為(如H.Encaps.Red一種 RFC 8986 行為的變體)將 RoCEv2 流量封裝在 IPv6 報頭中),明確引用 uSID (Micro-Segment) 或其 IETF 標準名稱 NEXT-CSID作為在AI Fabric中實現確定性路徑的核心機制。

2.1.5 AI 集羣的 SID 組合拳:SRH-Less 架構

架構的核心是放棄SRH,轉而利用RFC 8986的 {LOC:FUNCT:ARG} 結構,將uSID(壓縮指令)編碼到128位IPv6目的地址的ARG字段中;這使得每一跳交換機能通過“移位”操作就地更新DA來執行下一跳指令,從而在零SRH開銷下實現完整的路徑編程

深度解讀 SRv6 (uSID vs G-SID),揭秘息壤、阿里、Meta、AWS 的最佳實踐(上篇)_uSID_02

圖2:uSID (NEXT-C-SID) SRH-less 轉發模型

深度解讀 SRv6 (uSID vs G-SID),揭秘息壤、阿里、Meta、AWS 的最佳實踐(上篇)_uSID_03

圖3:uSID 結構 (uSID Carrier)

在實際的 AI 集羣部署中(如微軟和阿里的案例所示)尤其是在AI Fabric內部流量並不會頻繁使用 RFC 8754 定義的龐大 SRH 報頭,相反採用一種高效的壓縮機制——核心是利用RFC 8986的ARG字段來“重載”攜帶後續的微指令(uSID),從而將完整的路徑指令壓縮並編碼到128位的IPv6目的地址(DA)中。

總體而言,在AI Fabric中,RFC 8986(網絡可編程性)與RFC 9800(壓縮SRH實現了SRH-less架構)的組合共同構成了SRv6的“殺手級應用”:一個標準的IPv6目的地址(DA)本身就是一個承載多跳確定性路徑的壓縮程序,完美的解決了ipv6可編程特性與SRH頭開銷大的問題。

在此基礎上,SRv6網絡利用BGP "Color"將業務“意圖”映射到SRv6 TE Policy (RFC 9256)實現意圖轉發,並結合SBFD提供(小於50ms的)電信級OAM故障檢測與保護倒換,同時依靠iFIT隨路遙測技術,通過“數據包即探針”的方式對真實業務流進行逐跳SLA性能(如時延、丟包)的可視化監控,這三者的協同共同構成了完整的、意圖驅動、高可靠且SLA可視的可運營SRv6服務體系。

2.2 開銷之辯(“AI Infra PM”的權衡):G-SID vs uSID

SRv6最大的爭議是其128位/跳的SRH(RFC 8754)報頭開銷,這對於AI(RoCEv2)和5G的小包負載是不可接受的。對此,2025年6月發佈的RFC 9800(壓縮編碼)極具智慧地定義了一個通用的C-SID(Compressed SRv6 Segment List Encoding)框架,最終形成了兩大陣營的“標準化休戰”。這不是技術優劣,而是“場景權衡”:NEXT-C-SID(源自uSID)和REPLACE-C-SID(源自G-SID)。

(1)G-SID (REPLACE-C-SID 風格):

華為、中國移動、中興陣營主導設計的一種專為運營商廣域網(5G/WAN)“替換”壓縮方案。G-SID的核心特點是始終需要SRH:將公共Locator前綴放在IPv6 DA中,而SRH列表僅攜帶壓縮後的G-SID。在SRv6數據包經過的每一跳,節點從SRH中取出G-SID“替換”DA的一部分,進而動態構造出下一個128位完整SID。G-SID的設計初衷是為了解決廣域網場景中路徑可能非常長(例如超過10跳)且需要使用SRH進行確定性路徑規劃的問題,通過最大化壓縮SRH列表本身來實現卓越的長路徑擴展性。

深度解讀 SRv6 (uSID vs G-SID),揭秘息壤、阿里、Meta、AWS 的最佳實踐(上篇)_G-SID_04

圖4:G-SID (REPLACE-C-SID) “替換”轉發模型

(2)uSID (NEXT-C-SID 風格)

思科、微軟、阿里巴巴等陣營推動設計的一種專為AI數據中心(AI Fabric)的“容器化”壓縮方案。uSID的核心特點是將多個16位或32位的uSID(微型分段)“打包”進一個128位的“容器”中。在數據中心這種短路徑(例如少於6跳)的特定場景下,這個128位的“容器”可以直接被用作IPv6的目的地址(DA),從而實現了完全不需要SRH擴展報頭(SRH-less)的架構。uSID的核心優勢在於一個40字節的標準IPv6報頭就能承載多達6跳的確定性路徑,對開銷和延遲極其敏感的RoCEv2流量場景極具誘惑性,加上uSID能夠與SONiC、eBPF等開放生態的深度集成,成為微軟和阿里AI Fabric的首選方案。

2.3 壓縮方案的SWOT戰略分析 (uSID vs G-SID)

技術選型是生態、成本和演進路徑的戰略問題。此SWOT分析旨在為決策者提供一個清晰的戰略對比框架。

維度

uSID (NEXT-C-SID)

G-SID (REPLACE-C-SID)

優勢 (Strengths)

1.SRH-less 極致效率:3-6跳內零開銷(40B IPv6頭);

2.高壓縮率:平均達 62%;

3.無狀態轉發:邏輯在包頭內(移位),節點無需維護狀態;

4.開放生態成熟:深度集成SONiC/eBPF,獲微軟/阿里採納。

1.長路徑擴展性:壓縮SRH列表,支持任意跳數,契合WAN;

2.地址規劃靈活:僅替換DA部分,對現有Locator規劃要求低;

3.運營商主導:中移動/華為推動,在電信骨幹網優勢明顯。

劣勢 (Weaknesses)

1.SRH-less 路徑受限:DA容器僅支持約6跳,超長仍需SRH;

2.地址規劃要求高:高壓縮率依賴嚴格的Block Prefix規劃。

1.強制SRH開銷:即使1跳也必須攜帶SRH,基礎開銷高;

2.壓縮率低:平均僅 29%-39%,低於 uSID;

3.有狀態:需分發和維護SID映射,控制平面複雜。

機會 (Opportunities)

1.AI/DC 事實標準:憑AI Fabric(低延遲/短路徑)壓倒性優勢;

2.邊緣與主機:SRH-less特性適合資源受限的主機(eBPF)和5G邊緣。

1.5G/算力骨幹網:“東數西算”等長距跨域場景的關鍵優勢;

2.SR-MPLS 遷移:操作模式近SR-MPLS,為運營商提供平滑遷移路徑。

威脅 (Threats)

1. 跨域複雜度:與G-SID等域互通時,邊界網關需重封裝。

1. 丟失 AI/DC 市場:因SRH開銷和低壓縮率,在DC競爭中處劣勢;

2. 開放生態滯後:G-SID更依賴私有實現,不如uSID開放(SONiC)。

RFC 9800 表面上是“統一標準”,實則是“標準化休戰”,也是兩種不同場景(AI/DC 場景 vs. Telco/WAN 場景)在網絡架構上的根本性分歧,這種分歧也體現在兩種不同的實現目標上:uSID 優化的是絕對開銷(40字節 vs >48字節)、G-SID 優化的是 SRH 列表擴展性(支持20跳 vs 6跳),也形成兩種市場分化陣營:uSID 陣營(Cisco/Microsoft/Alibaba)通過擁抱開源 (SONiC)獲得在增長最快的 AI/Cloud 市場獲得了事實上的主導地位;而 G-SID 陣營(China Mobile/Huawei)繼續鞏固傳統運營商優勢市場。這是否意味着未來網絡的異構組網呢?即uSID 主導 DC 內部,G-SID 主導 WAN 骨幹網,兩者在 DCI 網關處互通。