similarity

    3熱度

    4回答

    我有一個包含數千條記錄的大型數據庫。每次用戶發佈他的信息時,我都需要知道是否已經有相同/相似的記錄。有沒有任何算法或開源實現來解決這個問題? 我們使用的是中國,什麼「相似」指的是記錄具有最相同的內容,可能是80%-100%是相同的。每個記錄不會太大,大約2k-6k字節

    9熱度

    2回答

    本文中所描述的想法的實現:http://www2007.org/papers/paper215.pdf 我只是想知道是否有文件第三章的任何實現。我的意思是在大數據集中查詢,而不僅僅是simhash(很容易找到simhash實現)。 謝謝〜

    4熱度

    4回答

    我正在閱讀有關模式識別的東西。最近,我想對方法進行調查,以評估媒介的相似性。據我所知,有歐氏距離,馬氏距離和餘弦距離。任何人都可以提供更多的名稱或關鍵字來搜索?

    2熱度

    3回答

    假設我有「peachz」作爲字符串,「eachzp」和「pahezc」作爲嘗試用於比較。 我正在尋找一種算法,輸出陣列無序的水平,關於事件的相對順序。 在下面的例子中,我用當前算法來描述問題。我總結了每個角色在原始字符串上的嘗試位置的差異。 下面是一個例子圖像: http://i51.tinypic.com/1zz2c10.png http://i51.tinypic.com/1zz2c10.pn

    2熱度

    4回答

    我正在努力比較多個圖像。我將這些圖像數據作爲稱爲「圖像」的矩陣的列向量。我想通過首先計算它們的Eucledian距離來評估圖像的相似性。然後我想創建一個矩陣,我可以執行多個隨機遊走。現在,我的代碼如下: % clear % clc % close all % % load tea.mat; images = Input.X; M = zeros(size(images, 2), s

    0熱度

    2回答

    我有兩個G729編碼文件,我把它們的pcm版本。我想測量這兩個文件之間的相似度。這些文件是二進制文件,所以如何測量二進制文件之間的相似性,我在C中編寫了一個代碼,它從第一個文件中獲取模式並在第二個文件中搜索相似的代碼,但是我想要有一個相似性度量。我在文獻中搜索了很多,我發現了jaccard和其他人,但仍然無法確定他們哪一個符合我的情況。 提前感謝您的幫助..

    0熱度

    1回答

    我已經做了這一行代碼,使單詞,搜索,增強。 $tekst = preg_replace("/($searchstr)/i", '<span style="color: 8fb842; font-weight: bold;">$1</span>', $tekst); 但我的問題是,當我提出$字符串searchstr = '?';它在$ tekst字符串中的每個字母之間進行設置。 整個腳本是: /

    1熱度

    1回答

    我試圖找到最好的方式來確定一組物品(在這個例子中;在鱷梨食譜配方)是如何相似的所有組的項目(食譜在一個表;鏈接到另一個成分表)。 例如;我有以下的鱷梨食譜: 3鱷梨 1葡萄成熟的西紅柿 1紅洋蔥 3胡椒 1海鹽 1辣椒 我想運行通過這個食譜我所有食譜的表格,以確定是否有另一個類似於它的食譜(基於成分和數量),按照它的相似程度排序。另外,我希望能夠確定它們之間的差異(無論是成分計數差異還是不同成分)

    14熱度

    5回答

    我會解釋我的問題: 我有一個數據庫表country。它有兩列:ID和name。 當我要搜索'paris',但拼錯字:'pares'('e'而不是'i'),我不會得到任何DB結果。 我希望系統建議可能有助於搜索的類似詞彙。 所以,我尋求幫助寫一個腳本,它從數據庫中包含像類似的話建議:

    6熱度

    6回答

    給定兩個獨立的計算機,如何確保每個屏幕上的顏色投影大致相同? IE,一個畫面可能具有50級%的亮度比另一種更,所以顏色出現在一個屏幕上消光劑。一臺電腦上的一位藝術家可能會看到不同於另一臺電腦的圖片,重要的是他們看到的是相同的級別。 是否有某種通過軟件可以實現的校準技術?任何技術?或者是唯一的硬件解決方案?