similarity

    4熱度

    3回答

    查找與比較矢量圖形相關的任何信息/算法。例如。說有兩個點集合或矢量文件有兩個幾乎相同的數字。我想確定第一個數字與第二個數字相似約90%。

    1熱度

    2回答

    我有一個函數,它需要兩個包含兩個文本的標記/詞的數組,並給出顯示兩個文本之間關係的餘弦相似度值。 該函數需要一個數組$ $ tokensA(0 => house,1 => bike,2 => man)和一個數組$ tokensB(0 => bike,1 => house,2 => car)並計算作爲浮點值給出的相似度。 function cosineSimilarity($tokensA, $to

    4熱度

    3回答

    我正在使用TF/IDF來計算相似度。例如,如果我有以下兩個文檔。 Doc A => cat dog Doc B => dog sparrow 這是正常的它的相似性是50%,但是當我計算它的TF/IDF。它是作爲按照 TF值文件甲 dog tf = 0.5 cat tf = 0.5 TF爲文件B值 dog tf = 0.5 sparrow tf = 0.5 進行DOC IDF值甲

    2熱度

    5回答

    我有一堆類Puzzle的對象。我已覆蓋equals()和hashCode()。當需要向用戶展示解決方案時,我想篩選出所有「相似」的謎題(按我定義的標準),因此用戶只能看到其中的一個。 相似性是可傳遞的。 實施例: Result of computations: A (similar to A) B (similar to C) C D 在這種情況下,僅A或d和B或C將被呈現給用戶的 -

    5熱度

    3回答

    我計算了兩個文檔的tf/idf值。下面是TF/IDF值: 1.txt 0.0 0.5 2.txt 0.0 0.5 的文件是這樣的: 1.txt = > dog cat 2.txt = > cat elephant 如何使用這些值來計算餘弦相似? 我知道我應該計算點積,然後找到距離併除以它的點積。我如何使用我的值來計算此值? 還有一個問題:重要的是兩個文件應該有相同數量的單詞嗎?

    1熱度

    5回答

    您是否知道Java中的PHP similar_text函數的任何嚴格等效實現?

    4熱度

    5回答

    假設有4組集合: s1 = {1,2,3,4}; s2 = {2,3,4}; s3 = {2,3,4,5}; s4 = {1,3,4,5}; 是否有任何標準度量來呈現這組4組的相似度? 謝謝Jaccard方法的建議。但是,它似乎配對。 如何計算整組集合的相似度?

    0熱度

    1回答

    我正在尋找一個可以在50個文檔的語料庫上使用的軟件包(任何語言),以執行各種度量標準中的文檔間相似度測試,如tfidf, okapi,語言模型,lsa等。 我想要一個文檔相似度矩陣,即doc1與doc2等於x%類似......這是爲了研究目的,而不是爲了生產。我特別想要doc相似性矩陣,因爲我想將它與人的評分關聯起來。 預先感謝您!

    2熱度

    3回答

    我有一組2D座標集(在每組中有100K-500K點的比例),我正在尋找測量1組相似度的最有效方法到另一個。我知道常用的東西:餘弦,Jaccard/Tanimoto等。但是我希望對任何快速/有效的測量相似性的建議,尤其是那些可以通過相似性進行聚類的測量。 編輯1:圖像顯示我需要做什麼。我需要它們的形狀/ orientatoin到羣集中的所有紅色,藍色和綠色等 alt text http://img4

    6熱度

    4回答

    我有一個字符串數組,不是很多(可能是幾百),但通常很長(幾百個字符)。 這些字符串通常是無意義的,而且與其他字符串不同......但是在一組字符串中,可能有300箇中有5個字符,它們之間有很大的相似性。實際上它們是相同的字符串,不同之處在於格式化,標點符號和幾個字。 我該如何計算出該組字符串?順便說一句,我用紅寶石編寫,但如果沒有別的算法在僞代碼將罰款。 謝謝