我需要爲CPV(共同採購詞彙)代碼搜索相當長的字符串。最有效的方法去確定python中的字符串中的子字符串?
此刻我與一個簡單的for循環和str.find()這樣
的問題是,如果CPV代碼已經在一個稍微不同的格式已經上市,該算法將無法找到它。
什麼是搜索字符串內代碼的所有不同迭代的最有效方法?是否僅僅是重新格式化每個最多10,000個CPV代碼併爲每個實例使用str.find()?
不同的格式的一個示例可以是如下
30124120-1
301241201
30124120 - 1
30124120 1
30124120.1
等
謝謝:)
+1爲正常化。不過,我建議使用`r`字符串前綴來代替`\\\ t`。 – 2011-01-13 12:36:31