2017-10-16 81 views
0

我想解析XML文件。這是確定的,如果我的文件是這樣「file.xml」從網頁解析XML

我用這個命令在Python:

from lxml import etree 

tree = etree.parse("C:/file.xml") 

不過,我有一個新的目標,現在,目標是Web服務器。該服務器生成一個帶有curent值的XML文本。可能是來自URL的問題,因爲它沒有以「.xml」結尾? 該URL類似於「http://ip/xml_render」。

但是,在Python,我有錯誤:

lxml.etree.XMLSyntaxError: Start tag expected, '<' not found, line 1, column 1 

事實上,我的網頁不是完全地像一個源代碼,它看起來像這樣:

enter image description here

所以,問題是關於URL還是網頁?

謝謝。

+0

的是你的瀏覽器是如何顯示XML。您可以使用「查看源代碼」查看原始XML。 – jordanm

回答

1

您需要首先從網上抓住它,試試這個

from urllib.request import urlopen 

xml = urlopen('www.yourwebsite.com') 
tree = etree.parse(xml)