2016-03-15 108 views
2

我剛開始爲我的新工作學習python,所以對我來說一切都很困難,即使這個任務聽起來很直截了當。用python提取多個xml文件中的數據

我想提取多個XML的文件幾個節點,最好把信息轉化爲最終的Excel文件。每行應該包含來自一個xml文件的信息,這些列應該代表我正在尋找的特定節點,比如「Zip-code」「town」。並不是所有的xml文件都包含所有的節點,所以它會是完美的,如果節點「Zip-code」不存在,它只會將單元格留空。

可能有人請指出一些提示如何開始與這個或,這也是可能的,一個特殊的PROGRAMM,這是很容易學習和使用?我的公司和我只需要爲約2000個文件做一次。

非常感謝你=)

+1

使用BeautifulSoup4 –

+0

和使用openpyxl – Jay

回答

2

爲了打開文件,並得到他們的內容,你可以使用Python函數:Documentation

XML解析,我總是用Beautiful Soup。這是一個具有良好文檔的HTML/XML解析器,大部分「正常工作」。

有關創建Excel文件,你可以使用Xlsxwriter

+0

謝謝丹尼爾的回答。如果我有更具體的問題,我會嘗試這些提示,如果可能的話,會回覆給你=) –

相關問題