如何計算輪廓的直方圖？

我已閱讀論文（Human activity recognition with metric learning）並試圖實施它。如何計算輪廓的直方圖？

作者使用通道（輪廓，光流），然後，他計算每個通道的直方圖，如附圖所示。

我已經計算了視頻的輪廓和光流。但問題是，

1-提到的直方圖的重點是什麼？是否以合適的形式表示要素？

2-與HOG相同。

3-如何實現所提到的直方圖？它只是劃分邊框？ .. 非常感謝。

抱歉不便

問候

來源

2016-08-09 Mammo

你在問一個關於沒有命名紙張的文章（更不用說放入鏈接）然後問一個在[Wikipedia]中描述的算法（https：/ /en.wikipedia.org/wiki/Lucas%E2%80%93Kanade_method）？ –

我不是在問這個算法，我問的是在不同論文中使用的直方圖的好處！ – Mammo

要獲得有意義的答案，您可能需要重新解釋您的問題：您嘗試過什麼？你怎麼看？你指的是哪些論文？ Stackoverflow在[如何問]上有一個特殊的部分（http://stackoverflow.com/help/how-to-ask）。 –

我會盡力回答各種不同的問題，採用僞碼後者。

1-作者的最終目的似乎是獲得一個描述符窗口，他們是跟蹤（我猜是跟蹤，我沒有看過這篇論文）。因此，在計算剪影S和Fx和Fy頻道之後，作者有一個MxMx3的窗口，3個頻道通過追加[S, Fx, Fy]。這不是表示窗口的非常適合的形式，因爲（1）維度很高（MxMx3可能變量爲M），（2）不是比例或方向不變的，（3）它不是一個強健的描述符。作者僅使用直方圖方法（類似於HoG中的方法但不相同）將MxMx3通道轉換爲216維描述符（MxMx3 -> 216，與M無關）。

2-上述那種答案吧。不是HoG，而是類似於HoG，SIFT和其他特徵提取方法。如果我不明白它的錯誤（有那麼幾位信息），只需將邊界框劃分爲2×2網格（4個方塊/子窗口）即可。對於每個子窗口，將其分成20個18度的切片（這不是直接向前的，但是知道像素相對於子窗口中心的位置，則可以計算角度，並因此計算其中的餅圖切片它落在

然後，將具有像素p屬於子窗口(i,j)（與0 <= i,j < 2）和圓形切片k，添加其值（在每個通道中）到直方圖：

hist(i, j, k, c) += data(p, c)

其中c是頻道（3個頻道[S, Fy, Fx]），而data(p, c)是您的3頻道數據，像素爲p和頻道c。

您將以2x2x18x3 = 216描述符結束。，美所提供的提取物中沒有提到任何關於該標準化描述，但我想，如果它不出聲，這將是剛：

hist(i, j, k, c) /= sum(abs(flatten(hist)))

或許正常化每個子窗口和渠道分開（如在豬中執行）：

hist(i, j, k, c) /= sum(abs(hist(i, j, :, c)) # summing over the 3rd axis `k`

來源

2016-08-18 15:04:05

非常感謝，這篇論文是針對活動識別的。他剛剛提到了關於邊界框的歸一化，而不是關於直方圖。你是否建議可以縮短維度的其他描述符？非常感謝 – Mammo

@Mammo如果你發現答案有幫助，考慮upvoting它！至於其他descrptors，HoG描述符（針對每個通道）的連接應該也很好，如在文章「用於人類檢測的定向梯度直方圖」中那樣。大概看看你提到的那個作品，你會發現其他用過的描述符或特徵。 –

如何計算輪廓的直方圖？

回答

相關問題