我已閱讀論文(Human activity recognition with metric learning)並試圖實施它。如何計算輪廓的直方圖?
作者使用通道(輪廓,光流),然後,他計算每個通道的直方圖,如附圖所示。
我已經計算了視頻的輪廓和光流。但問題是,
1-提到的直方圖的重點是什麼?是否以合適的形式表示要素?
2-與HOG相同。
3-如何實現所提到的直方圖?它只是劃分邊框? .. 非常感謝。
抱歉不便
問候
我已閱讀論文(Human activity recognition with metric learning)並試圖實施它。如何計算輪廓的直方圖?
作者使用通道(輪廓,光流),然後,他計算每個通道的直方圖,如附圖所示。
我已經計算了視頻的輪廓和光流。但問題是,
1-提到的直方圖的重點是什麼?是否以合適的形式表示要素?
2-與HOG相同。
3-如何實現所提到的直方圖?它只是劃分邊框? .. 非常感謝。
抱歉不便
問候
我會盡力回答各種不同的問題,採用僞碼後者。
1-作者的最終目的似乎是獲得一個描述符窗口,他們是跟蹤(我猜是跟蹤,我沒有看過這篇論文)。因此,在計算剪影S
和Fx
和Fy
頻道之後,作者有一個MxMx3
的窗口,3個頻道通過追加[S, Fx, Fy]
。這不是表示窗口的非常適合的形式,因爲(1)維度很高(MxMx3
可能變量爲M
),(2)不是比例或方向不變的,(3)它不是一個強健的描述符。作者僅使用直方圖方法(類似於HoG中的方法但不相同)將MxMx3
通道轉換爲216維描述符(MxMx3 -> 216
,與M
無關)。
2-上述那種答案吧。不是HoG,而是類似於HoG,SIFT和其他特徵提取方法。如果我不明白它的錯誤(有那麼幾位信息),只需將邊界框劃分爲2×2網格(4個方塊/子窗口)即可。對於每個子窗口,將其分成20個18度的切片(這不是直接向前的,但是知道像素相對於子窗口中心的位置,則可以計算角度,並因此計算其中的餅圖切片它落在
然後,將具有像素p
屬於子窗口(i,j)
(與0 <= i,j < 2
)和圓形切片k
,添加其值(在每個通道中)到直方圖:
hist(i, j, k, c) += data(p, c)
其中c
是頻道(3個頻道[S, Fy, Fx]
),而data(p, c)
是您的3頻道數據,像素爲p
和頻道c
。
您將以2x2x18x3 = 216
描述符結束。,美所提供的提取物中沒有提到任何關於該標準化描述,但我想,如果它不出聲,這將是剛:
hist(i, j, k, c) /= sum(abs(flatten(hist)))
或許正常化每個子窗口和渠道分開(如在豬中執行):
hist(i, j, k, c) /= sum(abs(hist(i, j, :, c)) # summing over the 3rd axis `k`
非常感謝,這篇論文是針對活動識別的。他剛剛提到了關於邊界框的歸一化,而不是關於直方圖。你是否建議可以縮短維度的其他描述符?非常感謝 – Mammo
@Mammo如果你發現答案有幫助,考慮upvoting它!至於其他descrptors,HoG描述符(針對每個通道)的連接應該也很好,如在文章「用於人類檢測的定向梯度直方圖」中那樣。大概看看你提到的那個作品,你會發現其他用過的描述符或特徵。 –
你在問一個關於沒有命名紙張的文章(更不用說放入鏈接)然後問一個在[Wikipedia]中描述的算法(https:/ /en.wikipedia.org/wiki/Lucas%E2%80%93Kanade_method)? –
我不是在問這個算法,我問的是在不同論文中使用的直方圖的好處! – Mammo
要獲得有意義的答案,您可能需要重新解釋您的問題:您嘗試過什麼?你怎麼看?你指的是哪些論文? Stackoverflow在[如何問]上有一個特殊的部分(http://stackoverflow.com/help/how-to-ask)。 –