Stories

Detail Return Return

雲棲實錄 | 駛入智駕深水區:廣汽的“數據突圍“之路 - Stories Detail

2024年,中國城市智駕迎來全面爆發。在這場高階智能駕駛的競速賽中,廣汽正以穩健而堅定的步伐,向行業第一梯隊邁進。

廣汽的“星靈智行” ADiGO 技術品牌,以AI重構智能汽車,全面推動AI賦能智能駕駛和智能座艙,加速汽車從“移動工具”,向“智能終端”進化。廣汽 GSD 智能輔助駕駛實現了對複雜城市場景的泛化理解能力。系統現已覆蓋至少35個主場景、357個子場景,在紅綠燈起停、擁堵博弈變道、待轉區左轉等高難度場景中表現遊刃有餘,城市場景覆蓋率超99%,被動接管率優於100公里/次。同時,廣汽成為全國首批 L3 自動駕駛准入的車企之一,達到行業領先水平。

而這背後,是一場關於“數據洪流”的硬仗。廣汽投入在端到端自動駕駛的訓練數據從PB級起步,並且已經逐步擴展到接近百PB規模,模型參數量規模從百兆起步,未來會要達到千兆以上,集羣規模從千卡起步,未來也會進階萬卡。

廣汽意識到:為滿足技術快速迭代的需求,對主機廠而言,打造一個高性能,穩定可靠的AI基礎設施至關重要。

於是,一場關於“自動駕駛數據、算力與工程體系”的攻堅戰悄然打響。

智能駕駛進入“深水區”,舊體系難以為繼

過去幾年,自動駕駛的技術路線經歷了深刻變革:從早期基於規則的模塊化架構,到如今主流的端到端大模型+VLA(視覺-語言-動作)範式,整個行業的研發邏輯正在被重塑。這一轉變帶來的最直接衝擊,是數據量的指數級增長。為了研發一款具備市場競爭力的自動駕駛產品,廣汽自動駕駛團隊每天要處理的數據量攀升至近百PB級:攝像頭圖像、激光雷達點雲、毫米波雷達信號、車輛狀態信息……這些原始數據需要經過解包、切幀、標註、清洗、訓練等多個環節,才能用於模型迭代。而在模型的訓練、推理和仿真環節,還要保證集羣運行的穩定性和資源的高利用率。

然而,在廣汽自動駕駛研發團隊的早期探索中,面臨到一個幾乎所有車企都會遇到的困局:數據多、流程散、效率低,傳統的自建研發架構逐漸暴露出瓶頸:

  • 單個clip(數據片段)處理耗時長達上百分鐘;
  • 百萬級任務調度延遲高,資源利用率不足40%;
  • 元數據分散在不同系統中,異常樣本溯源困難;
  • 模型訓練排隊嚴重,迭代週期長,難以應對複雜長尾場景。

與此同時,隨着端到端大模型成為行業主流,數據閉環的速度直接決定了技術演進的節奏。誰能把數據流轉得更快,誰就能在長尾場景覆蓋、模型泛化能力和用户體驗優化上建立代際優勢。

聯手阿里雲:打造屬於廣汽的“智能端到端數據底座”

面對這場系統性挑戰,廣汽沒有選擇簡單堆資源或者採購工具,而是決定與阿里雲展開深度協同,共同構建一套面向未來的“智能端到端數據底座”正值阿里雲大數據 AI 平台全面升級其智能輔助駕駛解決方案,該方案覆蓋從數據接入、處理、訓練到推理仿真的全生命週期管理。這對正處於轉型關鍵期的廣汽而言,恰逢其時。藉助阿里雲大數據 AI 平台能力,廣汽逐步構建起支撐智能駕駛業務可持續發展的技術底座。

“目前,廣汽與阿里合力打造的智駕雲已經高效穩定運行半年多。”廣汽集團自動駕駛首席科學家周寅分享,“在這個過程中,我們整個AI基礎設施的穩定性,資源利用率以及研發效率也取得了質的飛躍和提升。”
廣汽基於阿里雲大數據AI平台加速廣汽GSD智能輔助駕駛系統迭代
廣汽基於阿里雲大數據AI平台加速廣汽GSD智能輔助駕駛系統迭代

這不是一次簡單的工具替換,而是一次面向未來的端到端數據底座範式升級。

第一步:優化數據產線,讓數據真正“流動”起來

數據是燃料,但先要能“點燃”。廣汽首先聚焦數據處理環節,引入阿里雲 MaxCompute - MaxFrame 分佈式計算框架,結合 DataWorks 一站式智能數據開發治理平台實現海量數據全流程自動化管理。
image.png

效果立竿見影:

  • 單任務可調度數萬Core算力,最大20GB單文件處理,數據包處理效率相較自建方案提升10倍以上
  • 日均可處理數十萬級數據包,生成超過數百萬clips和數億訓練樣本;
  • 藉助 DataWorks 實現百萬級任務的一站式開發與調度管理;
  • 通過元數據血緣追蹤,異常 clip 可快速回溯至原始數據源,大幅提升可維護性;

“通過和阿里雲大數據 AI 平台的合作,把每天3個億樣本處理的週期,從周級別變成了天級別,保證了迭代的效率。”廣汽集團基礎架構負責人王麒鈞表示,“這讓我們可以把精力真正放在業務創新上。”

同時,平台採用彈性伸縮與按量付費模式,有效降低單個數據包的處理成本,顯著減輕長期運營的資源與財務壓力。

第二步:打通檢索瓶頸,讓“大海撈針”變得高效

在千億級訓練數據中精準定位特定場景(如雨天施工區、夜間行人橫穿),是提升長尾場景覆蓋率的關鍵。廣汽可基於阿里雲大數據 AI 平台的向量檢索引擎,構建高性能檢索能力:

  • 對文本、圖像、點雲等多模態混合檢索;
  • 實現 PB 級非結構化數據的毫秒級響應;

這項能力不僅能提升數據挖掘效率,也為後續大模型預訓練提供高質量語料基礎。

第三步:加速模型訓練,縮短從數據到決策的閉環週期

如果説數據是燃料,訓練就是燃燒過程。

廣汽依託於阿里雲PAI平台和靈駿集羣,支持千卡規模的訓練任務,穩定訓練4周以上不中斷。同時藉助PAI的企業級資源管理功能,廣汽目前智算資源利用率可以做到90%以上。

值得高興的是,廣汽在模型訓練效率上,成功應用了PAI Turbo-X的模型訓練加速方案,在系統側,數據側,模型側等多維度全方位加速:

  • 系統側:優化 CPU 親和性、垃圾回收機制、動態編譯、流水線並行和操作系統
  • 數據側:高性能的 DataLoader 引擎,優化數據預處理流程和實現智能訓練樣本分組
  • 模型側:算子、Module、優化器、優化策略、量化、CPU 和 GPU 設備的自動切換
    image.png

最終在單訓練任務數據規模增長了20倍,模型參數規模增長了10倍的情況下,取得了縮短訓練時長50%的可喜收益。版本模型2天迭代1次,這在智駕研發裏,是非常大的代際差距。

第四步:技術共創,探索AI基礎設施和模型訓練新範式

更值得期待的是,廣汽並未止步於“使用”,而是與阿里雲共同探索下一代AI基礎設施建設和模型訓練新範式。

雙方圍繞 Lance File ——一種新興的具有極致壓縮比的列式非結構化數據格式,開展技術共創試點。利用其極致壓縮比和內置索引能力,進一步降低存儲開銷、提升數據加載速度。

同時,探索結合阿里雲大模型訓練框架PAI-Megatron-Patch和強化學習框架PAI-ChatLearn等技術,進一步加速大模型模型訓練和推理的進程。

這些共創和嘗試,不僅是技術的優化,更是為未來大規模車雲協同訓練打下基礎。

邁向成熟:從“解決問題”到“構建能力”

如今,廣汽已將多條核心智駕數據產線建設在阿里雲大數據 AI 平台,建立起一套穩定、高效、可擴展的端到端數據智能研發體系

  • 數據閉環週期縮短 1倍
  • 數據處理效率提升 10倍
  • 模型訓練資源利用率翻番
  • 研發運維人力投入顯著降低

更重要的是,這套體系具備良好的延展性,能夠支撐廣汽在未來幾年內持續升級感知、規控等模塊的技術棧。

“我們會堅定的擁抱阿里雲這個合作伙伴,在 Data+AI 這一層做持續的深度建設。”廣汽集團基礎架構負責人王麒鈞指出,“這是廣汽在自動駕駛發展各種不確定因素中,最確定的一部分。”

image.png

廣汽集團基礎架構負責人王麒鈞在雲棲大會分享

結語:在深水區穩紮穩打,才是長遠之道

今天,超過80%中國車企的智駕跑在阿里雲大數據 AI 平台上。

這並非偶然,而是行業共識的體現:在AI驅動的時代,主機廠的核心競爭力,不再僅僅是“造車”,更是“造系統”。

今天的廣汽,已經找到了正確的方向:用先進的大數據 AI 平台,支撐持續打磨的技術底座和快速迭代的模型算法

在這條通往高階智能駕駛的路上,廣汽始終穩紮穩打,而阿里雲大數據 AI 平台也將作為廣汽的堅實後盾,持續陪伴廣汽一路前行。

user avatar mulavar Avatar deephub Avatar chaokunyang Avatar
Favorites 3 users favorite the story!
Favorites

Add a new Comments

Some HTML is okay.