2011-09-15 245 views
3

如何獲得標籤後的文本中找到如何獲得標籤後的文本

例子:

#!/usr/bin/env python 
import lxml.html 

html = """ 
<b>Point1:</b> Text1 <br> 
<b>Point2:</b> Text2 <br> 
... 
<b>PointN:</b> TextN 
<b>PointN+1:</b> TextN+1<br> 
""" 
dom = lxml.html.document_fromstring(html) 
el = dom.xpath('//b[text()="PointN:"]') 
print el 

標籤EL與文本焦點N發現瞭如何獲取文本TextN?

回答

3

由於TextN如下,你已經找到了<b>,您可以使用XPath following軸:

dom.xpath('//b[text() = "PointN:"]/following::node()')[0] 
3

另一種方法是:

el = dom.xpath('//b[text()="PointN:"]')[0] 
print el.tail