Stories

Detail Return Return

吉利汽車攜手阿里雲函數計算,打造新一代 AI 座艙推理引擎 - Stories Detail

作者:蔣忠林,趙劍,謝東;洛浩、周華生

吉利汽車,是中國知名的自主汽車品牌,近年來通過技術創新和產品升級,在國內外市場取得了顯著成績。隨着 AI 浪潮的發展,吉利汽車也在不斷加強智能化的建設,尤其在新一代 AI 座艙的建設上,成為汽車主機廠的核心競爭力之一。當前吉利汽車研究院人工智能團隊承擔了吉利汽車座艙 AI 智能化的方案建設,在和阿里雲的合作中,基於星睿智算中心2.0的23.5EFLOPS強大算力,構建AI混合雲架構,面向百萬級用户的實時推理計算引入阿里雲函數計算的 Serverless GPU 算力集羣,共同為智能座艙的交互和娛樂功能提供大模型推理業務服務,涵蓋的場景如針對模糊指令的複雜意圖解析、文生圖、情感 TTS 等。尤其是在語音交互方面,吉利自研超擬人 TTS,採用大量微調和訓練,打造出了吉利汽車專屬的逼真、富有情感、自然生動又穩定一致的語音交互體驗。隨着功能的持續迭代,接入的車輛也越來越多,推理引擎的端到端高可用建設也變得越來越重要,吉利汽車研究院和阿里雲等合作伙伴不斷深入探索,共同為吉利汽車的新一代 AI 座艙打造大規模、高可用、高性能的推理引擎服務。

需求及挑戰

為了應對日益競爭激烈的市場環境,吉利汽車研究院牽頭打造吉利汽車新一代的 AI 座艙平台,需要具備:

  1. 百萬輛車接入:推理引擎需要具備大規模系統承載能力、擴展能力、高可用、以及故障逃逸能力。
  2. 面對 C 端場景,為了較好的用户體驗:座艙服務的推理引擎需要能針對不同場景,提供良好的推理效果,包含模型能力建設,以及工程化提供高性能、低延遲的鏈路建設。
  3. 端到端的可觀測能力建設。
  4. 針對模型推理的安全建設。

落地場景

吉利汽車研究院攜手阿里雲團隊及合作伙伴打造的吉利汽車全新一代 AI 座艙推理服務已經在今年 6 月份上車,剛剛上市的吉利銀河 M9 車型進行深度搭載。接下來在導航、車控兩大場景的推理服務上,以及情感TTS和文生圖(娛樂)兩大場景的複雜計算上做介紹。

DeepThink:模糊指令的複雜意圖推理

DeepThink是吉利汽車在銀河M9上推出的新一代超擬人智能體Eva的深思決控能力,這個能力使Eva不僅可以聊天交互,而且可以規劃和拆解任務、調用工具等。超擬人智能體Eva可以在用户出行場景中像人一樣幫你解決問題。

導航作為出行中最重要的使用場景之一。在過往的使用上,用户需要準確的輸入目的地、途經點。而此次吉利汽車研究院攜手阿里雲等合作伙伴,通過大模型調教,讓地圖交互更加智能。只需要説出模糊的目的地描述,通過大模型推理即可識別準確的目的地。如:“我的女朋友在上海外灘,現在幫我在中間位置找一家餐廳然後導航過去。”當語音指令被接收到後,大模型會進行意圖理解和複雜計算,對任務進行識別、規劃和拆解。第一步識別出該指令為導航域需求;第二步通過計算找到本車輛定位位置和上海外灘中間的位置;第三步,通過智能體記憶能力獲取我曾經提到過的“女朋友的”飲食偏好;第四步,在“中間位置”周邊找到符合“女朋友”飲食偏好的餐廳;第五步,拉起導航,設置該餐廳為目的地,並規劃最合適路線。同時對用户進行語音回覆。

在地圖導航中,如果用户需要添加途經點,也可以通過簡單的描述進行檢索添加,比如“幫我在途中找個給孩子買玩具的地方”“我要買花,給我找個地方”“我要上廁所,幫我找一下哪裏可以?”,過往在車輛行駛當中,添加途經點對用户來講,操作是比較不方便的,現在通過大模型調教就簡單多了,用户不需要明確的輸入途經點名稱,只需要説出需求即可快速達成目的。

車控是用户最常和最多在車上使用的,通過吉利新一代 AI 座艙推理引擎,大大提升了用户對車控使用的便捷性。比如用户説:“我的腰有點酸” ,大模型可推理出需要打開座椅按摩,並開啓腰部舒展。用户接着説:“給副駕也安排上”。大模型馬上通過上下文理解,知道説的還是“開啓座椅按摩並調到腰部舒展”這件事,並且馬上在副駕執行。當車輛行駛到高速收費站人工繳費通道時,大模型通過VLM識別,並進行復雜路況結算和意圖識別後,車窗自動降下。這些更加人性化的交互執行和主動智能,讓用户無論是開車的成年人,還是坐車的老人、小孩都能通過口語化的表達,輕鬆的安全控車。

TTS 語音交互

近年來,大模型參數規模和模型性能不斷創出新高,加速推進人工智能實用化、通用化和普惠化發展。大模型技術為語音服務帶來了革命性的升級,基於大模型的語音識別和語音合成能力,為用户提供更為精準、高效的服務體驗。

為了向車機用户提供逼真、富有情感、自然生動又穩定一致的語音交互體驗,提升車機系統的競爭力,滿足用户對於個性化和情感化服務的期望,同時支持針對不同車型品牌和用户的深度定製需求;吉利自研基於大語言模型基座的語音合成大模型,構建了海量的預訓練數據集,並投入資源製作了數萬小時的高質量、精標註 SFT(指令微調)數據,獲得了穩定、自然的音色和合成效果。模型針對複雜數字符號設計了文本歸一化模塊,覆蓋了日期、比例、特殊英文單位等高頻複雜場景;對多音字、變音字、中英文混讀、副語言表達等複雜場景進行了針對性的優化,並在多次反覆迭代後獲得了較為穩定自然的表達效果。在自然與正確的表達基礎之上,還針對車載場景適配了包含興奮、有趣、共情等多情感的表達能力以及針對兒童播報場景的兒童友好風格,實現了生動、多變的表現力。並且今年6月,吉利汽車參與中國信通院組織的可信 AI 中文語音合成基礎服務評估,其產品吉利星睿超寫實情感語音合成大模型順利通過中文語音合成基礎服務評估。

為了給用户帶來高效、實時的對話體驗,TTS 語音推理服務經過極致優化,端到端鏈路延遲控制在 100ms 以內,首包 TTFT 控制在 400ms 左右。在弱網或無網狀態下,通過汽車本地芯片算力計算,吉利自研離線超寫實語音合成模型,為用户提供全場景下的文本轉語音超自然語音播報。在汽車芯片模型部署加速側,吉利汽車人工智能團隊與阿里巴巴淘系技術開源的深度學習框架MNN團隊深度合作,解決了不同規格芯片場景下,低功耗、低延遲、高性能離線超寫實語音合成模型推理(MNN 是阿里巴巴淘系技術開源的深度學習引擎,支持了阿里巴巴70+場景下的AI應用)。隨着應用規模的擴大,吉利汽車研究院和阿里雲的函數計算研發團隊也會繼續從算法和工程化兩個維度繼續優化併發性能。

AIGC 生圖

為了給車機系統增加更好的交互體驗,吉利汽車研究院在車端打造了全場景 AI Agent,其中 AI 靈感畫師為座艙的使用增加了不少的趣味性。以 AI 靈感畫師為例,是基於 ComfyUI 進行深度定製設計的工作流,包含壁紙圖生圖、奇幻相機、AI 兒童樂園-萌寶穿越、AI 寫真、壁紙泡泡廣場等多種生圖場景。同時,針對不同的場景,為了保障生圖效果,還做了大量的 Lora 訓練和自定義節點,比如生圖的風格、分辨率保障等。不同場景的生圖工作流,分別由不同的函數承載,避免切換模型帶來的生圖 latency 抖動,任務調度延遲控制在 300ms 以內,單次生圖約為8~10s。另外在函數啓動的時候,通過模型預熱,可以保障在工作流更新的時候對用户的體驗也是無損的。

為了提升出圖的速度,函數計算側協助研究院一起驗證並部署了基於 ComfyUI 的模型推理加速方案,採用 DeepGPU + Teacash 方案,整體的出圖速度提升了50% 以上,並且是無損的效果。

落地方案及效果

端到端 AI 應用高可用建設需求

為了保障大規模的生產車輛接入和用户的極致使用體驗,座艙推理引擎服務對工程化也提出了極高的要求:

  1. 高可用

    1. 模型請求怎麼高可靠接入
    2. 推理服務怎麼做到高可靠
    3. 故障恢復策略
  2. 高性能(GPU 利用率提升,QPS 提升,降低延遲)

    1. 使用FC如何做到冷啓動低延遲和模型預熱
    2. 如何實現推理請求的批量執行
    3. PD分離與推理緩存
  3. 端到端的可觀測和告警機制(及時發現、及時處理)等

基於函數計算的落地方案

阿里雲基於函數計算 FC 協助吉利汽車研究院一起搭建座艙 AI 推理統一平台,提供面向 Serverless 化、高可用、高性能和低時延的算力集羣。同時阿里雲協助吉利汽車一起梳理優化座艙服務的全鏈路穩定性建設、模型工程化優化、模型推理高可用、模型推理加速等。

函數計算是阿里雲推出的 FaaS 服務平台,是典型的 Serverless 計算產品。Serverless 的技術理念可以總結為:Zero Server Ops(無需關注和維護服務器等基礎設施,具備自動彈性伸縮能力) + No Compute Cost When Idle。Serverless 技術可以讓企業和開發者更加專注業務,把更多的精力用在業務創新和業務迭代上,而云廠商來管理資源的維護工作,並提供資源的彈性伸縮能力、穩定性、以及按實際使用進行付費的能力。除此之外,藉助Serverless 的彈性和按量付費能力,在很大程度上還可以提升資源利用率,進而節省用雲的資源成本,而云廠商通過提供標準化的運行環境和聯動上下游產品的集成生態,可以最大程度上降低用雲的門檻和成本。

基於函數計算和 AI 網關、以及可觀測能力打造的 AI 原生應用架構,具備端到端的高可用、高性價比算力供給等特點:

  • 按量快照技術:函數計算提供按量快照技術,支持 24小時*30 天預留 GPU 卡使用,避免彈卡風險。在 GPU 卡沒有請求的時候,會轉為閒置狀態,費用降低為正常的 20% 左右(只計收內存和顯存狀態費用),極大降低了GPU的使用成本。
  • 一站式集成平台:函數計算有別於裸機,會提供全託管的容器實例,支持標準鏡像部署,內置資源調度、請求級別負載均衡、請求級別監控、日誌等能力,無需預購和維護虛擬機節點、集羣升級等。業務方可以聚焦關注代碼邏輯,同時運維打通 CICD、配置監控大盤、做好權限管理、告警管理、函數管理等即可穩定使用。
  • 模型優雅上下線:函數計算支持模型預熱、優雅輪轉、滾動重啓等能力機制,確保變更發佈時的請求無損。
  • 端到端高可用建設:函數計算平台在主流Region從接入層到調度層、算力層、網絡層,均提供至少 3AZ 的高可用能力建設,推理服務的入口具備全局可用性,能夠跨多個可用區分發流量,並能從後端故障中自動恢復。搭配端到端的 Trace 能力,能夠快速定位和解決問題。

基於函數計算的方案落地效果

  • 算力成本優化 33%: 基於推理業務的 C 端屬性,FC 的按量快照使用模式在保障用户使用體驗不變的情況下,相比 IaaS 資源供給,成本優化高達 33%。
  • 算力集羣簡化維護: 基於 Serverless 技術,提供“拎包入住”的使用體驗,極大釋放了運維側的資源維護壓力,由阿里雲 FC 團隊保障算力集羣的高可用和 GPU 算力的穩定供給,吉利汽車研究院的業務方專注模型服務,運維方專注業務高可用建設。
  • 端到端高可用 SLA 99.99%(持續建設中): 借鑑雲原生應用的高可用建設經驗,吉利汽車和阿里雲等合作伙伴一起推動 AI 推理引擎的端到端應用觀測、Trace 追蹤、灰度發佈、SRE 保障機制、大規模集羣高可用建設等,支持百萬車輛的穩定接入能力。

函數計算——打造 AI 應用時代最佳的運行時

隨着 Agent 的持續爆火,AI 應用落地呈現加速的趨勢,MCP 讓大模型可以更加標準的感知外部世界,極大擴展了大模型的能力。函數計算除了託管模型推理服務之外,還推出了 AI Studio 運行工作流、Sandbox 做強化學習和代碼沙箱環境、MCP Runtime 運行 MCP 服務等。至此,在函數計算上可以構建出完整的端到端 AI 應用,支持用户打造出全新的 AI 應用架構。

結語

吉利汽車研究院與阿里雲攜手,不僅為用户帶來了前所未有的智能座艙體驗,也為整個汽車行業樹立了新的標杆。未來,雙方將繼續深化合作,探索更多 AI 應用場景,推動智能出行的創新發展。

user avatar wangying_5e4b645338a98 Avatar cloudace Avatar yunxiao0816 Avatar renzhendebaowenbei Avatar neteaseyunxin Avatar automq Avatar
Favorites 6 users favorite the story!
Favorites

Add a new Comments

Some HTML is okay.