fuzzy

0熱度

1回答

我正在讀取2個hive表中的數據。令牌表具有需要與輸入數據匹配的令牌。輸入數據將包含說明欄和其他欄。我需要拆分輸入數據，並且需要將每個拆分元素與令牌表中的所有元素進行比較。目前我正在使用me.xdrop.fuzzywuzzy.FuzzySearch庫進行模糊匹配。下面是我的代碼snippet- val tokens = sqlContext.sql("select token from tok

0熱度

1回答

模糊匹配更快For循環

下面是我寫的模糊匹配的簡單腳本。輸入文件中有大約24,000個關鍵字，主列表中大約有900,000個。目前需要花費很長時間來處理24,000個關鍵字。任何想法，我可以消除for循環，以更快的東西的青睞？ > #=====Install Packages====# library(stringdist) > > #=====Import Master List======# master

0熱度

1回答

解析正則表達式模糊邏輯規則

還有像一些模糊邏輯字符串規則： IF Input1.A和Input2.B然後Output1.A IF Input1.A AND（NOT Input2.B） AND Input3.C Then Output1.A 我想在AND和after之後捕獲組。並且還用括號捕獲（NOT Input2.B）。以及IF之後。

1熱度

1回答

在Emacs中是否有任何擴展模糊完成，因爲您鍵入的類似於Sublime

我試過自動完成模式。但建議是不模糊，它需要完全匹配。也嘗試過（全局設置密鑰（kbd「M-C-I」）'ac-fuzzy-complete），但這需要觸發器（而不是您輸入的內容）。以下是Sublime的截圖。即使'HW'表明的helloWorld在Emacs類似的東西嗎？

0熱度

1回答

模糊查找轉換連接SSIS中的Excel文件

我無法找到一個參考，它告訴我如何將SSIS中的模糊查找連接到Excel文件而不是數據庫。在網上搜索我發現了這個技巧：Excel Source as Lookup Transformation Connection，但它提供了一個使用查找而非模糊查找的解決方案。任何人都可以幫我設置模糊查找與Excel數據源嗎？

0熱度

1回答

如何使用Solr的

比如我實現模糊搜索，我有跟名字，中間名和姓的名稱。我需要搜索名字的不同組合，如{名，中間名，姓氏}，{中間名，名，姓}等等（6種組合）。同時，名字也必須用語音搜索。就像名字「John」一樣，它必須選擇「Jonn」。亦作「穆罕默德」，必須會一炮打響「穆罕默德」或「Mouhammed」這個拼音搜索是適用於所有名的三個部分。

0熱度

1回答

如何連接PHP和Python

我有2個系統，我用PHP構建的界面和機器是用python構建的，因爲我在python中使用模糊。我必須嘗試讓與PHP的具體數據和工作，我已經做出與Python的功能，收到一個變量，而該工作但是我有一個問題的問題是，如何使用PHP從MySQL中拋出一個變量並用python處理它？完成該過程後，如何將結果返回給PHP，然後發送到mySQL數據庫？在這樣的PHP代碼，該代碼是從SQL fun

1熱度

1回答

與agrep匹配的模糊字符串

由於數據在遺留系統中存儲錯誤，因此我使用R和agrep（）來匹配公司名稱列表 - 因爲數據在傳統系統中存儲錯誤 - 沒有第四種常規格式，公司在同一級別上錄製作爲客戶，這意味着每個新客戶都有一個新的公司條目，這導致一家公司擁有許多不同的公司名稱 - 這在很多情況下都能正常工作。有時，特別是對於短字符串，我得到的 - 至少對我來說 - 奇怪的比賽，例如（ABC是第一家名稱）： ABC ABAXIS

0熱度

1回答

SOLR eDismax短語的打字錯誤容忍度

如何建立查詢來搜索精確的短語以及帶有一些拼寫錯誤的短語？我被困在這一點上，看起來我正朝着錯誤的方向前進。例如，我有一個字段在我edismax查詢： q=apple iphone 它的工作原理，但現在我需要，使其更耐錯別字。更新我的查詢，現在它返回相同的結果，甚至當用戶類型的故障前： q=aple~2 iphane~2 接下來，我發現現在準確的查詢匹配什麼並不總是第一頁（例如，我真的有產品

1熱度

1回答

stringdist_join結果在NAs

我正在試驗stringdist軟件包以便進行模糊連接，並遇到一個我不明白的問題，但未能找到答案。我想用「dl」方法連接這兩個數據表，它會產生一個NA，我完全不明白。也許你們其中一個對此有解釋。代碼： library(fuzzyjoin) test1<-as.data.frame(test1<-c("techniker")) test2<-as.data.frame(test2<-c("te