2010-10-24 61 views
4

我使用下面的代碼來定位一個div:如何從lxml獲取原始XML?

parser = etree.HTMLParser() 
tree = etree.parse(StringIO(page), parser) 

div = tree.xpath("//div[@class='content']")[0] 

我唯一的問題是,這樣做後,我不想依靠LXML提取表示div的內容:我只是想找回div包含的原始XML。這是可行的還是我必須完全放棄這種方法?

回答

6

我認爲你正在尋找:

etree.tostring(div) 
+0

您是對的:謝謝! – akosch 2010-10-24 00:18:18

2

你嘗試tostring

raw_xml = etree.tostring(div)