2017-02-20 144 views
0

我試圖刪除由反斜線標識的文本中的標籤。例如,對於短語'Hello \ tag world',我想返回'Hello world'這個短語。我試過以下,但它沒有擺脫'\標籤'。正則表達式Python - 反斜槓

print re.sub('\\[A-Za-z]+',' ',text) 

我確定這是簡單的,但我似乎無法弄清楚。

感謝您的幫助!

+1

使用正則表達式的原始字符串。 '''''在你的正則表達式中放置一個文字反斜線,但是正則表達式中的文字反斜線與'text'中的文字反斜線不匹配 - 它被正則表達式引擎處理爲轉義字符。您需要額外的原始字符串提供的轉義層。 – user2357112

回答

2

必須是:

re.sub('\\\\[A-Za-z]+',' ',text) 

否則,'\\'作爲regex的特殊轉義字符處理。

+1

雖然這是一個有效的選項,但原始字符串表示法通常更方便。 – user2357112

+1

@ user2357112這完全是一個意見問題。這個答案是完全有效的,[this](http://stackoverflow.com/questions/33582162/backslashes-in-python-regular-expressions)會是一個更好的重複問題。 – miken32

相關問題