企業級數據訪問加速平台領導者 Alluxio 宣佈上線 Oracle 雲市場(Oracle Cloud Marketplace),正式成為 OCI(Oracle Cloud Infrastructure )全球合作伙伴之一。這一里程碑式的合作標誌着雙方將為共同客户提供更便捷的AI基礎設施解決方案,通過創新的數據加速技術徹底改變人工智能與機器學習工作負載的數據訪問範式。
Oracle與Alluxio簽署AI能力共建合作協議
甲骨文公司副總裁中國區董事總經理吳承揚與Alluxio中國區總經理王曉丹代表雙方簽署
在現代數據驅動型環境中,高性能計算集羣(尤其是在利用 GPU 時)面臨的挑戰主要來自數據訪問延遲和 I/O 吞吐量不足等問題。這種效率瓶頸不僅會導致寶貴的計算資源閒置,還並顯著增加企業運營成本。Alluxio 與 Oracle 此次牽手,通過構建基於分層的數據架構解決方案突破了這些瓶頸,從而提高了 GPU 利用率,也提升了雲基礎設施投資回報率。
在最新的基準測試中,Alluxio數據訪問加速層與 OCI 高性能裸金屬基礎設施的強強聯合被展露無遺:在 350 個加速器上實現了低於 1 毫秒的平均延遲、近線性可擴展性,以及超過 90% 的 GPU 利用率。
🔗 基準測試鏈接:https://blogs.oracle.com/cloud-infrastructure/alluxio-on-oci-submillisecond-latency-for-ai
Alluxio 銷售總監程亮表示:“我們非常高興能夠通過 Oracle 雲市場將 Alluxio 的高性能數據加速能力帶給全球的 OCI 用户。AI 時代的競爭本質上是數據效率與計算效率的競爭。Alluxio 與 OCI 的深度結合,將幫助客户徹底釋放其數據潛力,讓 GPU 每一秒都創造足量價值。”
“我們聽到客户最迫切的需求是:如何讓昂貴的 GPU 資源全力運轉,而不是等待數據。”甲骨文公司中國區雲工程部門總經理竇傑表示,“Alluxio 在 OCI 上的落地,正是對這一痛點的直接回應。通過將數據智能地緩存在計算側,我們已幫助客户將訓練效率提升了一倍以上。這項合作印證了我們的承諾:提供不只是基礎設施,更是真正解放生產力的解決方案。”
Alluxio 高性能緩存架構
Alluxio 作為貼近計算部署的數據加速層,位於計算層與OCI 對象存儲層之間,通過智能地管理跨內存與 NVMe 的數據,同時通過 POSIX 和 S3 API 嚮應用程序提供統一的命名空間。
Alluxio 在 OCI 支持兩種部署模式
- 獨立模式(Dedicated mode):Alluxio 運行在 DenseIO 節點集羣上,每個節點都配備 NVMe 硬盤和高網絡帶寬。該集羣為外部客户端提供所有必需的文件和對象服務,從而最大限度地提高大型多 GPU 集羣的吞吐量和一致性。
- 混合模式(Co-located mode):Alluxio 運行在 GPU 服務器上,使用閒置的 NVMe 硬盤,無需新增硬件。這種模式經濟高效,非常適合小型集羣或單租户工作負載。由於 Alluxio 服務和運行在同一節點上的用户應用程序共享 CPU 和緩存資源,其性能可能略低於獨立模式。
獨立模式(左)與混合模式(右)
這對你的團隊意味着什麼
假設一個機器學習團隊正在 OCI 上訓練一個大語言模型。由於昂貴的計算實例需要等待來自對象存儲的數據,團隊發現 GPU 利用率始終徘徊在 50% 左右。
無需更改任何一行應用程序代碼或添加新硬件,僅僅通過在現有 GPU 服務器上以混合模式部署 Alluxio 軟件, GPU 利用率可以立即提升到 95% 以上。這一簡單的改動就能將模型訓練時間縮短近一半,使機器學習團隊能夠更快地迭代,並提前將模型投入生產。
Alluxio 的架構為 OCI 用户帶來以下核心價值:
- 即插即用式集成:無需將數據從一個存儲遷移到另一個存儲,只需掛載你的 OCI 對象存儲桶;無需導入或重構;無需任何代碼更改,應用程序可以繼續使用相同的對象路徑。
- 高性能吞吐和低延遲:亞毫秒級數據訪問和 TB/ 秒吞吐量——近乎線性擴展,最高可達可用網絡帶寬的 80%。
- 一致性無鎖定: Alluxio 保留了 OCI 對象存儲的原生格式,並確保緩存和後端數據的一致性;不涉及任何專有格式或供應商依賴。
- 靈活部署多 GPU 雲:Alluxio 可無縫、自動地將正確的數據提供給每個 GPU,從而為應用程序提供低延遲和高帶寬的數據訪問。
將 OCI 對象存儲中的數據緩存或預熱到 Alluxio 後,後續讀取操作將直接從本地 NVMe 或內存中提供,延遲將降低幾個數量級。
基準測試結果
- 在 WARP 基準測試中,單節點部署實現 0.3 毫秒平均延遲;
- 在 MLPerf Storage 2.0 測試中,6 節點集羣吞吐量達 61.6 GB/s;
- 同時保持 GPU 利用率穩定在 90% 以上。
以上的基準測試結果充分證明,將 Alluxio 與 OCI 的高性能裸金屬基礎設施相結合,是消除 AI/ML 和大數據分析中數據訪問瓶頸的有效策略。通過在應用程序附近構建高性能緩存層,該解決方案能夠充分發揮 OCI 計算和 GPU 資源的潛力,從而大規模地實現速度和一致性。
對於希望最大限度地提高 OCI 計算效率、加速 AI 創新和簡化操作的組織而言,OCI 上的 Alluxio可幫助你消除數據孤島、數據拷貝及配置變更,以及提供經過驗證、用於生產環境的出色性能。
Alluxio-Oracle 雲市場入口
Alluxio 與 OCI 的聯合解決方案現已通過 Oracle 雲市場正式提供,客户可直接訂閲並快速部署,加速AI落地進程。
🔗 Alluxio-Oracle 雲市場入口:https://cloudmarketplace.oracle.com/marketplace/en_US/listing/198398958
🔗 瞭解更多,請訪問:https://www.oracle.com/cn/cloud/