地平線智駕開發者 -
PTQ 量化數值範圍與優化
一、PTQ 模型量化問題
1.1、模型問題
基於公版模型訓練,沒有對模型做範圍做約束,weight\_decay=1e-6, 訓練出的 float 模型數值分佈很大,如圖 2,可以看到模型的後面幾層數據分佈範圍很廣,最大閾值超過了 8000,對我們量化來説並不友好。
1.2、算子問題
如圖 2,基於全 int16 算子配置量化,當前版本 resize 算子有約束(請查閲工具鏈算子支持情況),只能支
自動駕駛
,
算法
地平線智駕開發者 -
征程 6P/H 計算平台部署指南
1.前言
本文旨在提供 征程 6H/P 計算平台的部署指南,將會從硬件、軟件兩部分進行介紹,本文整理了我們推薦的使用流程,和大家可能會用到的一些工具特性,以便於您更好地理解工具鏈。某個工具具體詳 l 細的使用説明,還請參考用户手冊。
2.征程 6H/P 硬件配置
2.1 BPU®Nash
2.2 硬件規格
BPU
DSP
算
自動駕駛
,
算法
地平線智駕開發者 -
開發者 | 2025 智能駕駛開發者系列培訓在京順利召開!
11 月 30 日,由地平線、中國汽車工程學會主辦,聯合中國智能網聯汽車產業創新聯盟打造的 2025 智能駕駛開發者系列培訓在北京圓滿落幕。本次培訓吸引了北京理工大學、吉林大學、長安大學、一汽、廣汽、比亞迪、蔚來汽車、賽力斯、中信科智聯、北斗智聯、億咖通等 60 餘家來自全國高校、科研機構以及整車與零部件企業的廣泛參與。累計參與人數超 400 人,106 位專業學員參與線下實踐,現場氣氛熱
自動駕駛
,
算法
地平線智駕開發者 -
征程 6 | linear 高精度輸出配置方式
1. 常規情況
基礎知識:
考慮到模型輸出位置量化損失對模型精度的影響較大,工具鏈推薦模型以 linear/conv 結尾,此時支持高精度 int32 輸出(在 quantized.onnx 中,轉定點為 int32,在前面 calib+qat 階段都是 float32),這幾乎可以做到無損。
征程 6 工具鏈量化 setter 模板支持自動設置高精度輸出,前提是 conv 輸出直接 接 d
自動駕駛
,
算法
地平線智駕開發者 -
征程 6 | QAT 新版 qconfig 量化模板使用教程
1.前言
隨着 征程 6 芯片家族的陣容不斷壯大,算法工具鏈在量化精度方向的優化也在持續深入,具體體現在兩個方面:
征程 6P 與 征程 6H 工具鏈已陸續進入發佈和試用階段,在此背景下,QAT(量化感知訓練)需要以更高效的方式適配算子的浮點計算能力,以確保量化精度和用户的使用體驗;
MatMul、Conv、Linear 等 Gemm 類算子目前已正式支持雙 int16 輸入,這一改進有助於
自動駕駛
,
算法
地平線智駕開發者 -
LLM 訓練基礎概念與流程簡介
1. LLM 訓練基礎概念
1.1 預訓練(Pretrain)
LLM 首先要學習的並非直接與人交流,而是讓網絡參數中充滿知識的墨水,“墨水” 理論上喝的越飽越好,產生大量的對世界的知識積累。 預訓練就是讓 Model 先埋頭苦學大量基本的知識,例如從 Wiki 百科、新聞、書籍整理大規模的高質量訓練數據。 這個過程是“無監督”的,即人類不需要在過程中做任何“有監督”的校正,而是由模型自己從大量文
自動駕駛
,
算法
地平線智駕開發者 -
Camsys 時間戳信息簡介
不同平台時間戳介紹
1.征程 3 平台
其中 u64 timestamps: 硬件時間戳,是跟 CPU 一起用的 64 bit system counter,1s 是 24M 個 clock。 FS 的時候從硬件寄存器讀取。讀取的值除以 24000 是毫秒,除以 24000000 是秒。
struct timeval tv; 系統時間, SIF FS 的時候獲取 do\_gettimeofday。
自動駕駛
,
算法
地平線智駕開發者 -
征程 6 | 多任務 不同幀率 部署方案
1.方案描述
推理多任務模型時,可能會有不同任務分支 部署不同幀率的需求,例如 BEV 動態任務 20 幀,靜態任務 10 幀這種情況。
最簡單的方式是編譯兩個模型,分開推理:
模型 1:backbone+neck+ 動態 head
模型 2:backbone+neck+ 靜態 head
此時,重複的公共部分 backbone+neck 會重複佔用內存與存儲,且 backbone+
自動駕駛
,
算法
地平線智駕開發者 -
mul 與 reduce_sum 的優化實例
一、基礎介紹
什麼是 mul 與 reduce\_sum?
mul 通常指元素級乘法(Element-wise Multiplication),它將兩個形狀相同的張量中對應位置的元素相乘,返回一個與原張量形狀相同的新張量。
reduce\_sum 是一種規約操作(Reduction Operation),它沿指定維度對張量的元素求和,從而 “壓縮” 或 “減少” 張量的維度。如果不指定維度,則對所
自動駕駛
,
算法