2016-08-04 112 views
1

我只是從伊森Rublee Official Paper讀ORB的官方文件,有點我覺得很難理解的部分「4.3學習的好二進制功能」ORB特徵描述信息官方給出解釋

我是衝浪在互聯網上深入挖掘並找到下面的段落。我還沒有得到這個實際的解釋。你們中的任何一個人都可以用簡單的語言來解釋這一點「給定一個大小爲m×m的局部圖像塊,並且假設用於強度測試的本地窗口 (即,在BRIEF中使用的箱式濾波器)的大小爲r×r,則存在N =(m - r)2個這樣的本地窗口

它們每兩個都可以定義一個強度測試,所以我們有C2N位特徵。在ORB的原始實現中,m被設置爲31,產生228,150個二進制測試。我們最終得到一組205,590個候選比特特徵,根據一個訓練集,ORB根據貪婪算法選擇至多256比特「

從官方文件和上面的段落得到的是這樣的結論。

我們有一個31X31的補丁大小,並選擇一個5X5的大小..我們將有N =(31-5)^ 2 = 676可能的子窗口。我沒有得到以粗體標出的線條。刪除重疊的測試意味着什麼,我們可以獲得205,590位特性?

回答

2

想象一個尺寸爲31x31(補丁)和一個小的5x5窗口的小圖像。這個窗口可以放置在圖像中多少個不同的位置?如果你將它滑動1乘1像素,那麼它可以放置在(31-5)^ 2 = 676個不同的位置,對吧?只有676個窗口的中心像素由2個元素組合,纔有676!/(2!*(676-2)!)= 228,150個組合。在ORB描述符的情況下,他們對以1個像素爲單位滑動窗口不感興趣,由於某些窗口之間的重疊(它們非常接近),可能會噪聲太大。然後,他們刪除重疊的窗口,將它滑動5乘5像素,並使用它們的中心像素創建二進制測試,將總組合減少到205,590。