2016-08-09 34 views
0

我已閱讀論文(Human activity recognition with metric learning)並試圖實施它。如何計算輪廓的直方圖?

作者使用通道(輪廓,光流),然後,他計算每個通道的直方圖,如附圖所示。

我已經計算了視頻的輪廓和光流。但問題是,

1-提到的直方圖的重點是什麼?是否以合適的形式表示要素?

2-與HOG相同。

3-如何實現所提到的直方圖?它只是劃分邊框? .. 非常感謝。

抱歉不便

問候

+0

你在問一個關於沒有命名紙張的文章(更不用說放入鏈接)然後問一個在[Wikipedia]中描述的算法(https:/ /en.wikipedia.org/wiki/Lucas%E2%80%93Kanade_method)? –

+0

我不是在問這個算法,我問的是在不同論文中使用的直方圖的好處! – Mammo

+0

要獲得有意義的答案,您可能需要重新解釋您的問題:您嘗試過什麼?你怎麼看?你指的是哪些論文? Stackoverflow在[如何問]上有一個特殊的部分(http://stackoverflow.com/help/how-to-ask)。 –

回答

1

我會盡力回答各種不同的問題,採用僞碼後者。

1-作者的最終目的似乎是獲得一個描述符窗口,他們是跟蹤(我猜是跟蹤,我沒有看過這篇論文)。因此,在計算剪影SFxFy頻道之後,作者有一個MxMx3的窗口,3個頻道通過追加[S, Fx, Fy]。這不是表示窗口的非常適合的形式,因爲(1)維度很高(MxMx3可能變量爲M),(2)不是比例或方向不變的,(3)它不是一個強健的描述符。作者僅使用直方圖方法(類似於HoG中的方法但不相同)將MxMx3通道轉換爲216維描述符(MxMx3 -> 216,與M無關)。

2-上述那種答案吧。不是HoG,而是類似於HoG,SIFT和其他特徵提取方法。如果我不明白它的錯誤(有那麼幾位信息),只需將邊界框劃分爲2×2網格(4個方塊/子窗口)即可。對於每個子窗口,將其分成20個18度的切片(這不是直接向前的,但是知道像素相對於子窗口中心的位置,則可以計算角度,並因此計算其中的餅圖切片它落在

然後,將具有像素p屬於子窗口(i,j)(與0 <= i,j < 2)和圓形切片k,添加其值(在每個通道中)到直方圖:

hist(i, j, k, c) += data(p, c) 

其中c是頻道(3個頻道[S, Fy, Fx]),而data(p, c)是您的3頻道數據,像素爲p和頻道c

您將以2x2x18x3 = 216描述符結束。,美所提供的提取物中沒有提到任何關於該標準化描述,但我想,如果它不出聲,這將是剛:

hist(i, j, k, c) /= sum(abs(flatten(hist))) 

或許正常化每個子窗口和渠道分開(如在豬中執行):

hist(i, j, k, c) /= sum(abs(hist(i, j, :, c)) # summing over the 3rd axis `k` 
+0

非常感謝,這篇論文是針對活動識別的。他剛剛提到了關於邊界框的歸一化,而不是關於直方​​圖。你是否建議可以縮短維度的其他描述符?非常感謝 – Mammo

+0

@Mammo如果你發現答案有幫助,考慮upvoting它!至於其他descrptors,HoG描述符(針對每個通道)的連接應該也很好,如在文章「用於人類檢測的定向梯度直方圖」中那樣。大概看看你提到的那個作品,你會發現其他用過的描述符或特徵。 –