我有一個XML文件,大約30MB,其中大約有300000個元素。使用太多的RAM處理python中的XML文件
我使用下面的代碼來處理這個文件。
xmldoc=xml.dom.minidom.parse("badges.xml")
csv_out=open("badge.csv","w")
for badge in xmldoc.getElementsByTagName("row"):
some processing here
csv_out.write(line)
的文件只有30MB,但是當我在我的MBP(10.7,8G RAM),運行此腳本,它幾乎使用3GB內存。爲什麼這麼簡單的腳本和這麼小的文件使用這麼多的內存?
最好的問候,
您如何測量內存使用情況? – tMC
用像lxml這樣的合理解析器來嘗試一下。 –
minidom不是解析器,它是原型級廢話 –