檢索內部＃{}文字

我有以下文字：檢索內部＃{}文字

#{king} for a ##{day}, ##{fool} for a #{lifetime}

而下面的（碎）的正則表達式：

[^#]#{[a-z]+}

我想匹配所有＃{字}而不是＃＃{words}（加倍'＃'就像轉義一樣）。

今天我注意到，我有的正則表達式忽略了第一個單詞（拒絕匹配＃{king}，但正確地忽略了## {day}和## {fool}）。

>>> regex = re.compile("[^#]#{[a-z]+}") 
>>> regex.findall(string) 
[u' #{lifetime}']

有關如何改進當前正則表達式以適應我的需求的任何建議？我想這個問題是[^#] ...

來源

2011-08-19 Andrei Ciobanu

你必須使用「負向後斷言」正確的正則表達式應該是這樣的：

import re 
t = "#{king} for a ##{day}, ##{fool} for a #{lifetime}" 
re.findall(r'(?<!#)#{([a-z]+)}', t)

['king', 'lifetime']

說明：

的(?<!prefix)pattern表達式匹配pattern只有當它不是由prefix preceeded。

來源

2011-08-19 12:02:45 MatToufoutu

你的解決方案更好，我忘記了負面的後顧之憂。 – grep

很酷的功能？這是蟒蛇正則表達式具體？ –

@Andrei，不，它似乎不是python特有的（根據[this site]（http://www.regular-expressions.info/lookaround.html）），但他們說：「像JavaScript，Ruby和Tcl這樣的風格可以做盡管它們確實支持lookahead，但根本不支持lookbehind。「 – MatToufoutu

試試這個：

re.compile('^#\{[\w]+\}')

來源

2011-08-19 12:01:52 prince

你試過了嗎？它僅匹配'＃{king}'，但不匹配'＃{lifetime}'。 – hughdbrown

我改正了它，它現在應該工作 – prince

使用回顧後建設：

>>> s='#{king} for a ##{day}, ##{fool} for a #{lifetime}' 
>>> r=re.compile(r'(?:^|(?<=[^#]))#{\w+}') 
>>> r.findall(s) 
['#{king}', '#{lifetime}'] 
>>>

來源

2011-08-19 12:01:57 grep

>>> regex = re.compile("(?:^|[^#])#{[a-z]+}") 
>>> regex.findall(string) 
['#{king}', ' #{lifetime}'] 
>>>

來源

2011-08-19 12:04:01 Dogbert

值得注意的是，這個解決方案的問題（不使用否定後置斷言）是不適用於'＃{king}＃{blah}' - 'findall'返回非重疊匹配。 –

將其替換爲(?:^|[^#])。就像你推斷的那樣，只有[^#]表示一個不是＃的字符，這顯然沒有在行首。

來源

2011-08-19 12:05:07 tripleee

檢索內部＃{}文字

回答

相關問題