string-matching

    0熱度

    1回答

    我需要解決此問題。 我需要從兩個數據框構建一個完整的數據框,但如果需要,只包含來自第二個數據框的某些信息。 例: DF1: MATERIAL_N° Description DATE DUE 0 123123300 Lightbulb X 01/05/2018 1 220466 Lightbulb Y 04/04/2018 2 220000 Lightbulb Z 07/07/2018

    0熱度

    1回答

    我有一個非常有趣的問題。 我有一組字符串,我想知道如何最好地匹配這些字符串組合在另一個字符串對最大化函數。 就是一個例子。說我有一組: ['aabbcaa', 'bbc'] 和我有串 'fgabbcdaabbcaaef' ,爲此可能的匹配爲: fga[bbc]daadaa[bbc]aaef 或 fga[bbc]daad[aabbcaa]ef 現在,給定一個簡單的最大化函數,我會說t

    1熱度

    1回答

    我有HTML鏈接的列,例如返回結果, Sheet 1, Column A: a href="http://junk.com"> a href="http://example.com"> a href='/relative-link/' target=''> 我想比較字符串的列表答:在另一張紙上,並返回B:B中的值。 因此,例如,我的另一片名單可能爲:

    1熱度

    1回答

    我有一個問題,我們可以通過將e.d值除以兩個字符串的長度來規範levenshtein編輯距離嗎? 我在問這個,因爲如果我們比較兩個不等長的字符串,那麼兩者的長度之間的差異也會被計算在內。 例如: ed('has a','has a ball')= 4 and ed('has a','has a ball is is round')= 15 如果我們增加字符串的長度,即使它們相似,編輯距離也會增加。

    1熱度

    4回答

    我的目標是檢測2個字符串是否相同,但順序不同。 Example "hello world my name is foobar" is the same as "my name is foobar world hello" 我已經試過的是將兩個字符串拆分成列表並在循環內進行比較。 text = "hello world my name is foobar" textSplit = text.

    1熱度

    1回答

    程序的任務是檢查字符串s2是否是給定長度相等的s1和s2的另一個字符串(s1 + s1)的子字符串。例如:[s1,s2] = [「abc」,「bca」]應該返回true,而[s1,s2] = [「abc」,「bac」]應該返回false。 並且兩個字符串的長度限制是10^5。使用(s1+s1).find(s2) == string::npos約需0.1秒完成。 我實現它在一個複雜的O(n * m)

    0熱度

    1回答

    之前,提交假設我們有一個hosts文件: 10.10.10.10 test1.domain test1 20.20.20.201 test2.domain test2 30.30.301.30 test3.domain test3 40.40.40.40 test4.domain test4 注意的IP地址與3個位數主機標識符,考慮到這一點,每條線的結構略有不同,因爲具有2位數的那些線在

    1熱度

    2回答

    我有一個包含URL格式列表的REST文檔。 /com/shop/product/{product_id} /com/shop/{shop_id} /com/city/{city_name}/shop/{shop_id}/details 等。 和動態的URL類似於下面 /com/shop/product/0ab12h /com/shop/j8khdj /com/city/bangalor

    1熱度

    1回答

    由於數據在遺留系統中存儲錯誤,因此我使用R和agrep()來匹配公司名稱列表 - 因爲數據在傳統系統中存儲錯誤 - 沒有第四種常規格式,公司在同一級別上錄製作爲客戶,這意味着每個新客戶都有一個新的公司條目,這導致一家公司擁有許多不同的公司名稱 - 這在很多情況下都能正常工作。 有時,特別是對於短字符串,我得到的 - 至少對我來說 - 奇怪的比賽,例如(ABC是第一家名稱): ABC ABAXIS

    1熱度

    1回答

    目前,我正在使用Pythons BeautifulSoup Library來檢索報紙文章的網頁。這些文章存儲在對象「細節」中。 然後我有幾個存儲在對象「行」中的各種街道名稱。現在我想搜索「行」中包含的街道名稱的文章。 如果其中一個街道名稱是其中一篇文章的一部分,我想在數組中保護街道名稱。 如果沒有匹配項目(所選文章不包含任何街道名稱),那麼數組中應該有一個空元素。例如,假設對象「線」由(「Abbe