基本信息

標題:RiskNet: interaction-aware risk forecasting for autonomous driving in long-tail scenarios
「RiskNet:長尾場景下自動駕駛的交互感知風險預測」
作者:Qichao Liu, Heye Huang, Shiyue Zhao, Lei Shi, Soyoung Ahn, Xiaopeng Li

摘要

長尾場景挑戰:傳統自動駕駛系統在處理不確定性高、多智能體交互複雜的“長尾場景”(如行人突然闖入、高速緊急換道等)時存在困難 。

提出RiskNet,這是一種交互感知的多維風險預測框架,它將確定性評估與基於深度學習的概率預測相結合。 RiskNet 旨在有效捕獲長尾場景中自動駕駛汽車 (AV) 的駕駛風險,其中不確定性和複雜交互占主導地位。

RiskNet 的核心採用場論模型,通過交互場和力來捕獲自我車輛、周圍代理和基礎設施之間的交互。該模型支持跨不同場景(高速公路、交叉路口、環島)的多維度風險評估,並在高風險和長尾環境下表現出魯棒性。為了捕獲行為不確定性,我們採用了基於圖神經網絡(GNN)的軌跡預測模塊,該模塊可以學習多模式的未來運動分佈。與確定性風險場相結合,它可以實現跨時間動態、概率性風險推斷,從而實現不確定性下的主動安全評估。

數據集:highD、inD 和 roundD

引入

研究背景

  1. 自動駕駛對風險感知與量化的迫切需求
  • 基礎地位:風險感知與量化是自動駕駛系統 (ADS) 確保在真實交通條件下安全可靠的核心模塊。
  • 現實挑戰:真實世界環境包含高度不確定的行為、異構的參與者(如車輛、行人、騎行者)以及非結構化的道路特徵。
  1. 對美國FARS數據庫的統計分析發現:
  • 高風險道路與模式:死亡事故在兩車道非分隔道路(4924例)和三車道道路上最為頻發 ;乘用車與輕型卡車的正面碰撞是最高發的致命事故模式(均超過7000例)。
  • 風險的複雜耦合:分析表明碰撞風險源於道路基礎設施、車輛特徵和碰撞行為等多種異構來源的相互作用 。風險呈現出多源、多維度的耦合結構。
  1. “長尾場景”帶來的嚴峻挑戰
  • 定義:長尾場景指那些在歷史數據中極少出現,但一旦發生就構成實質性安全威脅的極端工況 。
  • 特徵:具有高度的行為不確定性、非標準道路配置、困難的感知條件以及複雜的多智能體交互(如高速緊急換道、被遮擋的行人突然出現等) 。
  1. 現有評估指標的侷限性與技術缺口
  • 傳統指標失靈:TTC (碰撞時間)、THW (車頭時距) 和 RSS 等傳統指標多基於確定性假設,難以適應真實交通中隨機、多模態的行為特徵 。
  • 技術鴻溝:雖然深度學習在軌跡預測方面已有進展,但如何將概率性的預測輸出映射為結構化、可操作的風險衡量標準,仍然存在關鍵缺口 。

主要貢獻

相關工作

  1. 風險評估 (Risk Assessment)
    自動駕駛汽車(AVs)的安全性受到多種風險源的影響,包括主車控制的不確定性、周圍交通參與者的交互、道路環境的複雜性以及系統級的魯棒性 。目前的風險評估方法主要分為三類:
  • 基於運動學和動力學的方法:這類方法依賴於預定義的運動假設(如恆定速度 CV、恆定加速度 CA 等),並根據時間或空間邏輯計算風險指標 。常見指標包括碰撞時間(TTC)、車頭時距(THW)、轉向時間(TTS)和後侵入時間(PET) 。
    優點:計算直接、物理可解釋性強,在高速公路等結構化環境中表現良好 。
    侷限性:在非結構化或高度互動的城市設置中,難以應對行為多樣性和長尾場景帶來的挑戰 。
  • 基於碰撞概率的方法:通過預測交通參與者的未來軌跡分佈,計算與主車發生碰撞的可能性 。通常涉及基於採樣的預測、概率密度估計和軌跡重疊檢測 。
    優點:理論上能整合行為和環境的不確定性 。
    侷限性:計算成本高,且嚴重依賴密集準確的軌跡數據,限制了其實時應用的擴展性 。
  • 基於人工勢場(APF)的方法:將風險模擬為物理力場,其他車輛、行人和障礙物對主車施加斥力或引力 。例如,駕駛安全場模型整合了動能、勢能和行為場,用於描述複雜的“人-車-路”交互 。
    優點:在捕捉實時交互特性和空間衝突區域方面非常有效 。
    侷限性:在複雜環境中容易陷入局部最優,且缺乏對人類隨機行為和策略不確定性的建模能力 。

總結:雖然現有方法在結構化環境中表現強勁,但在面對不確定性和複雜交互時,仍難以實現良好的泛化和擴展 。

  1. 軌跡預測
    在動態交通環境中,AVs 需要預測周圍代理的未來運動,以預判未來危害 。軌跡預測方法大致分為基於模型和數據驅動兩類:

基於模型的方法:依賴於預定義的運動學或動力學假設(如 CV、CA、CTRV 等)來推斷未來軌跡 。
優點:計算效率高,適用於短時預測 。
侷限性:難以處理長期預測,也無法捕捉城市交通中普遍存在的行為複雜性和交互動態 。

數據驅動的方法(深度學習):顯示出從數據中學習複雜運動模式和社交交互的強大潛力 。

循環神經網絡(LSTM):廣泛用於時間建模 ,但由於往往依賴固定的單峯分佈假設(如高斯分佈),限制了其表示多峯行為的能力 。

生成對抗網絡(GANs):被用於生成社會和物理上合理的軌跡 ,但在訓練穩定性、概率可解釋性和對生成輸出的控制方面仍存在挑戰 。

GNN 與 Neural ODE 結合(如 MTP-GO):這是一個更具原則性的框架,利用時間圖神經網絡(GNN)建模交互,並使用神經常微分方程(Neural ODEs)進行連續時間狀態演化 。

總結:RiskNet 借鑑了 MTP-GO 的理念,其軌跡預測模塊集成了 GNN,能夠捕捉離散的社交依賴和連續的運動演變 。這種架構能夠生成帶有校準不確定性的多峯軌跡,對於下游的魯棒風險評估至關重要 。

RiskNet框架的整體架構

方法

  1. 確定性交互感知風險建模
    該部分基於場論(Field Theory),將風險表示為一種連續的空間 hazard,捕捉“人-車-路”系統的耦合動力學 。

1.1 相互作用場與力的建模

定義場景中所有智能體的集合為