0

我正在構建一個軟件來分類顯微鏡拍攝的圖像中的細胞。關於從培訓的圖像中提取的特徵的數量

我有一個數據集的圖像的細胞作爲訓練數據集使用 - 我已經從每個圖像提取關鍵點使用ORB - 這是我的問題 - 一些圖像產生了很多關鍵點和一些關鍵點。因此產生的描述符載體是不同的lentgh。所以當我嘗試從它們中構建一個訓練矩陣時,我必須「歸一化」從每個圖像中選擇的關鍵點的數量,以便描述符向量的長度將相同。

我應該挑選多少個關鍵點?哪些?如何選擇'最佳'關鍵點? (當我想要預測一個我想分類的對象時,這個問題也會增加)是否有已知的解決這個問題的方法? 此致敬禮。

回答

0

你可以用一袋詞的方法來分類你的圖片。您首先必須收集所有關鍵點描述符並將它們聚集到一定數量的組中。每個組(羣)都是你的話。描述符對應於一個詞。對於現在的每個圖像,您可以通過計算單詞的出現來構建直方圖。然後,您可以對直方圖進行歸一化,以消除不同圖像中不同數量關鍵點的影響。

使用空間金字塔匹配可能是另一種解決方案。

+0

謝謝你的迴應。我會嘗試這些替代方案並返回反饋。 – Nimrodshn

0

最簡單的方法,如通過阿賈伊所描述的,是羣集的關鍵點到Ñ簇,然後定義Ñ二進制功能,使得對於給定的樣品,設有等於1,如果該樣品顯示出關鍵點在集羣i中,否則爲0。

另一種方法是使用內核分類器,如支持向量機(SVM),並使用接受可變長度向量(例如Fisher內核)的內核。