2010-04-04 62 views
6

不好意思問這種問題,但是因爲我真的很需要一些關於如何使用多探針LSH的指導,所以我自己並沒有做過多的研究。我意識到有一個實現該算法的lib調用LSHKIT,但我無法弄清楚如何使用它。 現在,我有幾千個特徵矢量296尺寸,每個代表一個圖像。該矢量用於查詢用戶輸入圖像,以檢索最相似的圖像。我用來推導矢量之間距離的方法是歐氏距離。關於多探針局部敏感散列的問題

我知道這可能是一個相當低調的問題,但你們是否知道我該如何實現多探頭LSH?我非常感謝任何答覆或回覆。

- 更新 -

試圖建立爲我與所提供的工具fitdata數據的模型,但它似乎並沒有對我的文件。我用於輸入的格式是這種格式,浮點大小:4,數據數量:20,維度:297,和我的數組297 dimenison浮點數組。但它給我這個錯誤

gsl: init_source.c:29: ERROR: matrix dimension n1 must be positive integer 
Default GSL error handler invoked. 
Aborted 

你們有什麼想法如何爲fitdata創建一個輸入?

- 更新 -

對不起,我遲到更新後,嘗試LSH。您可以使用text2bin格式化fitdata的數據。文本文件包含圖像或音頻文件的特徵向量,每行代表一個向量。之後,使用mplsh-tune獲取M和W參數。 要構建索引,可以使用掃描工具對一組必需的查詢進行採樣,並且可以使用mplsh-run獲取索引。 現在我想弄清楚如何使用索引以及如何將庫鏈接到我的編碼中。任何機構對此有任何想法?

回答

6

讓我來指點一下spectral hashing,這會讓LSH的屁股時間大打折扣。獎勵:他們有matlab代碼on their website,您可以使用或驗證您自己的實施。而且,實施起來也更容易。

+0

感謝您的指導!我會看到我可以用它做什麼,因爲我不知道matlab = x – Yijinsei 2010-04-04 20:05:01