4/29/2021

產品化物件偵測技術

徐宏民,產品化物件偵測技術 (一),電子時報,2021-04-07

幾十年來電腦視覺研究試著在這關鍵的物件偵測技術上帶來突破。可以想像一下,電腦如何在由一堆影像畫素值中標定可能的物件?框列出可能位置,再逐一判斷是否有物件存在,是工程上「較容易」實現的方式。一般而言有三個主要步驟:候選區域(region proposal)計算、物件分類、以及後處理。 

徐宏民,產品化物件偵測技術(二),電子時報,2021-04-13

最關鍵的問題是正確率。正確率的描述非常籠統,一般我們會更細分為precision(P)以及recall(R),前者代表所回報的物件中有多少比例是正確的,比如說畫面中框列了10輛車子,有幾輛是對的;後者代表實際的物件標的中找到多少比例,例如畫面中有10輛車子,實際框列了幾台。...

我們很難設計單一演算法P跟R都是完美無缺。一般在檢測環境(AOI、自駕時)中比較在乎recall,所以會刻意將所有可能物件挑出,但是會造成P下降(多了假警報),解決方法是接續使用其他演算法再進行過濾,剔除誤判,或是利用其他訊號源再確認,比如說使用雷達訊號標定可能物件之後,再使用攝影機辨認是否為車輛。

在某些應用中比較在乎precision,可以犧牲recall。例如搜尋系統中。尋找大量照片時,因為使用者不清楚有多少真實標的(例如:狗)存在,我們只需將有把握的標的呈現出來,並按照信心度排序,就能滿足使用者的需要。一般推薦系統也是採用這樣的策略,確保使用者的滿意度。...

解決anchor在實際場域上的限制,可以試著修改或是增減需要的anchor種類。不過另一種常見的作法是直接使用anchor-free的策略(如FCOS),不使用預設模板,在偵測時,以某個基準點,往外推估可能物件的長寬,在實際使用上有不錯的效能。


沒有留言:

張貼留言