similarity

3熱度

4回答

我有一個包含數千條記錄的大型數據庫。每次用戶發佈他的信息時，我都需要知道是否已經有相同/相似的記錄。有沒有任何算法或開源實現來解決這個問題？我們使用的是中國，什麼「相似」指的是記錄具有最相同的內容，可能是80％-100％是相同的。每個記錄不會太大，大約2k-6k字節

9熱度

2回答

有「爬行檢測NearDuplicates爲Web」

本文中所描述的想法的實現：http://www2007.org/papers/paper215.pdf 我只是想知道是否有文件第三章的任何實現。我的意思是在大數據集中查詢，而不僅僅是simhash（很容易找到simhash實現）。謝謝〜

4熱度

4回答

我們可以使用多少種距離功能？

我正在閱讀有關模式識別的東西。最近，我想對方法進行調查，以評估媒介的相似性。據我所知，有歐氏距離，馬氏距離和餘弦距離。任何人都可以提供更多的名稱或關鍵字來搜索？

2熱度

3回答

有關子串序列和順序的字符串混亂的算法（相同長度，相同字符，獨特字符，沒有詞彙含義的字符串）

假設我有「peachz」作爲字符串，「eachzp」和「pahezc」作爲嘗試用於比較。我正在尋找一種算法，輸出陣列無序的水平，關於事件的相對順序。在下面的例子中，我用當前算法來描述問題。我總結了每個角色在原始字符串上的嘗試位置的差異。下面是一個例子圖像： http://i51.tinypic.com/1zz2c10.png http://i51.tinypic.com/1zz2c10.pn

2熱度

4回答

如何在MATLAB中創建一個相似矩陣？

我正在努力比較多個圖像。我將這些圖像數據作爲稱爲「圖像」的矩陣的列向量。我想通過首先計算它們的Eucledian距離來評估圖像的相似性。然後我想創建一個矩陣，我可以執行多個隨機遊走。現在，我的代碼如下： % clear % clc % close all % % load tea.mat; images = Input.X; M = zeros(size(images, 2), s

0熱度

2回答

測量兩個二進制文件之間的相似性？

我有兩個G729編碼文件，我把它們的pcm版本。我想測量這兩個文件之間的相似度。這些文件是二進制文件，所以如何測量二進制文件之間的相似性，我在C中編寫了一個代碼，它從第一個文件中獲取模式並在第二個文件中搜索相似的代碼，但是我想要有一個相似性度量。我在文獻中搜索了很多，我發現了jaccard和其他人，但仍然無法確定他們哪一個符合我的情況。提前感謝您的幫助..

0熱度

1回答

preg_replace和？（問號） - 該怎麼辦？

我已經做了這一行代碼，使單詞，搜索，增強。 $tekst = preg_replace("/($searchstr)/i", '<span style="color: 8fb842; font-weight: bold;">$1</span>', $tekst); 但我的問題是，當我提出$字符串searchstr = '？';它在$ tekst字符串中的每個字母之間進行設置。整個腳本是： /

1熱度

1回答

尋找類似的分組;包括差異和得分（即類似食譜）

我試圖找到最好的方式來確定一組物品（在這個例子中;在鱷梨食譜配方）是如何相似的所有組的項目（食譜在一個表;鏈接到另一個成分表）。例如;我有以下的鱷梨食譜： 3鱷梨 1葡萄成熟的西紅柿 1紅洋蔥 3胡椒 1海鹽 1辣椒我想運行通過這個食譜我所有食譜的表格，以確定是否有另一個類似於它的食譜（基於成分和數量），按照它的相似程度排序。另外，我希望能夠確定它們之間的差異（無論是成分計數差異還是不同成分）

14熱度

5回答

如何在PHP中爲拼寫錯誤的單詞找到相似的單詞？

我會解釋我的問題：我有一個數據庫表country。它有兩列：ID和name。當我要搜索'paris'，但拼錯字：'pares'（'e'而不是'i'），我不會得到任何DB結果。我希望系統建議可能有助於搜索的類似詞彙。所以，我尋求幫助寫一個腳本，它從數據庫中包含像類似的話建議：

6熱度

6回答

如何讓一個屏幕上的顏色看起來與另一個屏幕上的顏色相同

給定兩個獨立的計算機，如何確保每個屏幕上的顏色投影大致相同？ IE，一個畫面可能具有50級％的亮度比另一種更，所以顏色出現在一個屏幕上消光劑。一臺電腦上的一位藝術家可能會看到不同於另一臺電腦的圖片，重要的是他們看到的是相同的級別。是否有某種通過軟件可以實現的校準技術？任何技術？或者是唯一的硬件解決方案？