fuzzy

    0熱度

    1回答

    我正在讀取2個hive表中的數據。令牌表具有需要與輸入數據匹配的令牌。輸入數據將包含說明欄和其他欄。我需要拆分輸入數據,並且需要將每個拆分元素與令牌表中的所有元素進行比較。 目前我正在使用me.xdrop.fuzzywuzzy.FuzzySearch庫進行模糊匹配。下面 是我的代碼snippet- val tokens = sqlContext.sql("select token from tok

    0熱度

    1回答

    下面是我寫的模糊匹配的簡單腳本。輸入文件中有大約24,000個關鍵字,主列表中大約有900,000個。 目前需要花費很長時間來處理24,000個關鍵字。 任何想法,我可以消除for循環,以更快的東西的青睞? > #=====Install Packages====# library(stringdist) > > #=====Import Master List======# master

    0熱度

    1回答

    還有像一些模糊邏輯字符串規則: IF Input1.A和Input2.B然後Output1.A IF Input1.A AND(NOT Input2.B) AND Input3.C Then Output1.A 我想在AND和after之後捕獲組。 並且還用括號捕獲(NOT Input2.B)。 以及IF之後。

    1熱度

    1回答

    我試過自動完成模式。但建議是不模糊,它需要完全匹配。 也嘗試過(全局設置密鑰(kbd「M-C-I」)'ac-fuzzy-complete),但這需要觸發器(而不是您輸入的內容)。 以下是Sublime的截圖。即使'HW'表明的helloWorld在Emacs類似 的東西嗎?

    0熱度

    1回答

    我無法找到一個參考,它告訴我如何將SSIS中的模糊查找連接到Excel文件而不是數據庫。 在網上搜索我發現了這個技巧:Excel Source as Lookup Transformation Connection,但它提供了一個使用查找而非模糊查找的解決方案。 任何人都可以幫我設置模糊查找與Excel數據源嗎?

    0熱度

    1回答

    比如我實現模糊搜索,我有跟名字,中間名和姓的名稱。我需要搜索名字的不同組合,如{名,中間名,姓氏},{中間名,名,姓}等等(6種組合)。同時,名字也必須用語音搜索。就像名字「John」一樣,它必須選擇「Jonn」。亦作「穆罕默德」,必須會一炮打響「穆罕默德」或「Mouhammed」這個拼音搜索是適用於所有名的三個部分。

    0熱度

    1回答

    我有2個系統,我用PHP構建的界面和機器是用python構建的,因爲我在python中使用模糊。 我必須嘗試讓與PHP的具體數據和工作 ,我已經做出與Python的功能,收到一個變量,而該工作 但是我有一個問題 的問題是,如何使用PHP從MySQL中拋出一個變量並用python處理它? 完成該過程後,如何將結果返回給PHP,然後發送到mySQL數據庫? 在這樣的PHP代碼,該代碼是從SQL fun

    1熱度

    1回答

    由於數據在遺留系統中存儲錯誤,因此我使用R和agrep()來匹配公司名稱列表 - 因爲數據在傳統系統中存儲錯誤 - 沒有第四種常規格式,公司在同一級別上錄製作爲客戶,這意味着每個新客戶都有一個新的公司條目,這導致一家公司擁有許多不同的公司名稱 - 這在很多情況下都能正常工作。 有時,特別是對於短字符串,我得到的 - 至少對我來說 - 奇怪的比賽,例如(ABC是第一家名稱): ABC ABAXIS

    0熱度

    1回答

    如何建立查詢來搜索精確的短語以及帶有一些拼寫錯誤的短語?我被困在這一點上,看起來我正朝着錯誤的方向前進。 例如,我有一個字段在我edismax查詢: q=apple iphone 它的工作原理,但現在我需要,使其更耐錯別字。更新我的查詢,現在它返回相同的結果,甚至當用戶類型的故障前: q=aple~2 iphane~2 接下來,我發現現在準確的查詢匹配什麼並不總是第一頁(例如,我真的有產品

    1熱度

    1回答

    我正在試驗stringdist軟件包以便進行模糊連接,並遇到一個我不明白的問題,但未能找到答案。 我想用「dl」方法連接這兩個數據表,它會產生一個NA,我完全不明白。也許你們其中一個對此有解釋。 代碼: library(fuzzyjoin) test1<-as.data.frame(test1<-c("techniker")) test2<-as.data.frame(test2<-c("te