2011-08-31 197 views
0

我想在字符串中SEACH爲標題標籤,我正在尋找一個正則表達式找到像何標題標籤出現在文檔中的索引,所以東西:Python的正則表達式

str.index('<h*>') 

在哪裏*代表只有1個字符,即。 1,2,3等消除任何頭標籤或html標籤

任何幫助將不勝感激。

+0

你可以使用''或'] +>'如果你想匹配''(例如:它有其他屬性 – NullUserException

+0

謝謝大家 – Ruth

回答

1
import re 

matches = re.finditer('<h[1-6]>', your_text) 
for match in matches: 
    print match.start() 
0

您所需要的正則表達式是這樣的:

<h.> 

這將匹配<h1>, <h2>, <hr>,等等...如果你只想匹配標題標籤,使用:

<h\d> 
+0

水平規則不是標題。 – NullUserException