|
申請號
|
CN202310942633.3
|
|
公開號(公開)
|
CN116777899A
|
|
申請日
|
申請日 2023.07.28
|
|
申請人(公開)
|
超音速人工智能科技股份有限公司(833753)
|
|
發明人(公開)
|
張俊峯(總); 沈俊羽; 楊培文; 張小村
|
原文摘要
本發明公開了一種基於迴歸模型的工業圖像關鍵點檢測方法、系統及平台,本發明通過方法獲取與工業圖像關鍵點相對應的圖像數據,並結合特徵提取網絡,實時生成與工業圖像關鍵點相對應的特徵圖;通過卷積處理實時壓縮所述特徵圖的特徵信息,其中,所述卷積為1×1卷積;構建迴歸模型,並結合迴歸模型,實時生成與工業圖像關鍵點相對應的檢測數據,以及與所述方法相應的系統、平台以及存儲介質;可以保留特徵的全局空間信息,提高關鍵點預測的空間泛化性和穩定性。而且會可以實現關鍵點回歸模型添加每個點的可見性功能。
AI摘要
問題: 傳統方法空間信息丟失、過檢率高、訓練狀態不直觀。
方案核心:
結構創新: 提出FCNeck結構(1×1卷積+展平)替代全局池化,保留空間信息。
功能創新: 在迴歸模型中增加關鍵點“可見性”預測功能,通過額外標誌位判斷關鍵點是否存在,降低過檢率。
訓練創新: 使用複合損失函數(均方誤差+交叉熵+殘差似然估計),提升精度並使訓練過程更穩定、直觀。
效果: 提升了工業圖像關鍵點檢測的準確性、穩定性和實用性。
我的理解
本發明提供了一種基於迴歸模型的工業圖像關鍵點檢測方法,所述的方法包括如下步驟:
一、獲取與工業圖像關鍵點相對應的圖像數據,並結合特徵提取網絡,實時生成與工業圖像關鍵點相對應的特徵圖;
二、通過卷積處理實時壓縮所述特徵圖的特徵信息,其中,所述卷積為1×1卷積;
a、卷積壓縮所述特徵圖的特徵信息,生成與特徵圖相對應的具有通道數的特徵圖;
b、歸一化處理所述具有通道數的特徵圖,並激活Relu激活函數,以及展平處理所述特徵圖的特徵。
所述通過卷積處理實時壓縮所述特徵圖的特徵信息,其中,所述卷積為1×1卷積,還包括:
c、判定是否存在不可見的關鍵點,若存在,則結合關鍵點閾值,去除不可見的關鍵點;否則,執行下一步驟;
d、根據判定結果數據,實時生成與特徵圖相對應的關鍵點信息。
三、構建迴歸模型,並結合迴歸模型,實時生成與工業圖像關鍵點相對應的檢測數據。
a、實時獲取與特徵圖相對應的關鍵點信息;並對所述關鍵點信息於全連接層的輸出層數量加二處理;
b、生成帶有至少兩個標誌位數據的關鍵點,其中,一個標誌位表示關鍵點存在,第二個表示不存在;
c、對標誌位的值進行softmax歸一化處理,並生成與關鍵點相對應的索引。
所述構建迴歸模型,並結合迴歸模型,實時生成與工業圖像關鍵點相對應的檢測數據,還包括:
d、生成與關鍵點相對應的位置數據,以及關鍵點存在與否的數據信息。
所述構建迴歸模型,並結合迴歸模型,實時生成與工業圖像關鍵點相對應的檢測數據,還包括:
e、結合均方誤差損失函數數據,實時生成模型預測值和真實值之間像素差的平方和數據;
f、根據損失函數值數據,判斷迴歸模型於訓練過程中的收斂狀態。
所需硬件
工控機(工業電腦)、工業相機(攝像頭)、光源。
測試環境
操作系統:win7 開發環境: VS2019 C++17
或者 操作系統:win10 開發環境: VS2022 C++17
如無特殊説明,本算法用**C++**實現。