|
申請號
|
202311601629.7
|
|
公開號(公開)
|
CN 117710683 A
|
|
申請日
|
申請日 2023.11 .27
|
|
申請人(公開)
|
超音速人工智能科技股份有限公司(833753)
|
|
發明人(公開)
|
張俊峯(總) 楊培文(總) 沈俊羽 張小村
|
原文摘要
本發明涉及一種基於分類模型的輕量級工
業圖像關鍵點檢測方法,包括以下步驟:將待檢
測圖像輸入特徵提取網絡,通過特徵提取網絡提
取關鍵點的圖像特徵;將圖像特徵輸入網絡輸出
頭中,通過網絡輸出頭輸出關鍵點的預測橫坐
標、預測縱座標和預測可見性;在待檢測圖像上
標註關鍵點,並將關鍵點映射到橫座標軸和縱坐
標軸上,計算關鍵點的橫座標與預測橫座標的第
一損失值、縱座標與預測縱座標的第二損失值以
及真實可見性信息與預測可見性的第三損失值。
本發明能滿足低算力設備的實時運行需求,並基
於分類模型消除基於熱圖模型的理論誤差下界,
通過增加關鍵點的可見性損失函數,避免檢測出
不存在的關鍵點。
步驟
包括以下步驟:
一,將待檢測圖像輸入特徵提取網絡,通過特徵提取網絡提取關鍵點的圖像特徵;
二,將圖像特徵輸入網絡輸出頭中,通過網絡輸出頭輸出關鍵點的預測橫座標、預測縱坐
標和預測可見性;
三,在待檢測圖像上標註關鍵點,並將關鍵點映射到橫座標軸和縱座標軸上,計算關鍵點
的橫座標與預測橫座標的第一損失值、縱座標與預測縱座標的第二損失值以及真實可見性
信息與預測可見性的第三損失值,根據第一損失值、第二損失值和第三損失值總損失值,並
判斷總損失值能否通過閾值,若不能則篩選掉該關鍵點。
四,提取網絡包括步長為1的卷積和MobileNetV3smal l中的一層倒殘差結構。
五,輸出頭包括縱座標分類頭、橫座標分類頭和可見性分類頭,所述縱座標分類頭
預測關鍵點的縱座標,所述橫座標分類頭預測關鍵點的橫座標,所述可見性分類頭預測關
鍵點的可見性。
六,縱座標分類頭預測關鍵點的縱座標包括以下步驟:
將圖像特徵經過橫座標方向步長為2、縱座標方向步長為1的二維卷積和ReLU激活函數
後,得到圖像特徵y1;
將特徵y1經過橫座標方向步長為2、縱座標方向步長為1的二維卷積和ReLU激活函數
後,得到圖像特徵y2;
將特徵y2橫座標方向的特徵進行全局池化後,得到特徵y3;
將特徵y3經過一維反捲積後,得到特徵y4;
將特徵y4經過一維反捲積和ReLU激活函數後,得到關鍵點的預測縱座標。
七,橫座標分類頭預測關鍵點的橫座標包括以下步驟:
將圖像特徵經過橫座標方向步長為1、縱座標方向步長為2的二維卷積和ReLU激活函數
後,得到圖像特徵x1;
將特徵x1經過橫座標方向步長為1、縱座標方向步長為2的二維卷積和ReLU激活函數
後,得到圖像特徵x2;
將特徵x2縱座標方向的特徵進行全局池化後,得到特徵x3;
將特徵x3經過一維反捲積後,得到特徵x4;
將特徵x4經過一維反捲積和ReLU激活函數後,得到關鍵點的預測橫座標。
八,可見性分類頭預測關鍵點的可見性包括以下步驟:
將圖像特徵經過兩次橫座標方向和縱座標方向均為4的卷積,使圖像特徵的長寬變為
原來的1/64,再將卷積後的圖像特徵進行全局化和全連接操作後,得到關鍵點的預測可見
性。
九,根據權利要求1所述的基於分類模型的輕量級工業圖像關鍵點檢測方法,其特徵在
於,計算關鍵點的橫座標與預測橫座標的第一損失值和縱座標與預測縱座標的第二損失
值,包括以下步驟:
將關鍵點映射到橫座標軸和縱座標軸後,形成橫座標方向上的one‑hot編碼和縱座標
方向上的one‑hot編碼,再用交叉熵損失函數計算橫座標方向上的one‑hot編碼與橫座標預
測的第一損失值,和縱座標方向上的one‑hot編碼與縱座標預測的第二損失值。
十,計算關鍵點真實可見性信息與預測可見性的第三損失值的方法包括:
用二值交叉熵損失函數計算關鍵點真實可見性信息和預測可見性的第三損失值。
十一.根據權利要求1所述的基於分類模型的輕量級工業圖像關鍵點檢測方法,其特徵在
於,總損失值為第一損失值、第二損失值和第三損失值的加權和,第一損失值、第二損失值
和第三損失值的權重分別根據橫座標、縱座標和可見性的預測難度確定,預測難度與權重
成正比。
操作系統:win7 開發環境: VS2019 C++17
或者 操作系統:win10 開發環境: VS2022 C++17
如無特殊説明,本算法用**C++**實現。