所以我想用空格將文本與標點符號分開。Python如何從文字中分離標點符號
my_text = "!where??and!!or$$then:)"
我想要有一個! where ?? and !! or $$ then :)
作爲結果。
我想要的東西就像使用Javascript,在那裏你可以使用$1
來得到你的匹配字符串。我迄今爲止嘗試:
my_matches = re.findall('[!"\$%&\'()*+,\-.\/:;=#@?\[\\\]^_`{|}~]*', my_text)
這裏my_matches是空的,所以我不得不從表達中刪除\\\
:
my_matches = re.findall('[!"\$%&\'()*+,\-.\/:;=#@?\^_`{|}~]*', my_text)
我有這樣的結果:
['!', '', '', '', '', '', '??', '', '', '', '!!', '', '', '$$', '', '', '', '',
':)', '']
所以我刪除所有冗餘條目是這樣的:
my_matches_distinct = list(set(my_matches))
和我有一個更好的結果:
['', '??', ':)', '$$', '!', '!!']
然後我通過自己和空格替換每一場比賽:
for match in my_matches:
if match != '':
my_text = re.sub(match, ' ' + match + ' ', my_text)
當然它不工作!我試圖把這個匹配作爲一個字符串來投射,但它不能正常工作......當我嘗試直接放置字符串來替換它的工作。
但我認爲我沒有做對,因爲我會遇到'!'的問題。 et'!!'對?
謝謝:)
建議定義一個正則表達式時使用原始字符串字面量。另外,不要在字符類中逃脫任意符號,只有''''''必須總是被轉義,而其他符號可以被放置,以便它們不需要轉義。此外,你的正則表達式匹配一個空字符串 - 它確實 - 由於「*」。用'+'量詞替換。 –
如果你想從你的字符串中刪除這些符號,爲什麼要使用're.findall'呢? –
因爲我想把空間放在前面和這些符號組之後,我不知道如何存儲它? – MlleStrife