我想解析在xml.etree.ElementTree模塊中使用iterparse的Medline xml文檔。除了一些文本包含非ascii字符之外,所有操作都很好。我沒有看到使用findtext處理unicode的方法。有什麼建議麼?xml.etree.ElementTree和unicode findtext
2
A
回答
2
你有沒有試着用UTF8編碼FLAH打開文件:
fd = open('some.xml', mode='r', encoding='utf-8')
xml.etree.ElementTree.iterparse(fd)
或者使用解碼:
fd = open('some.xml', mode='r')
sio = StringIO(fd.read().decode("utf-8"))
xml.etree.ElementTree.iterparse(sio)
0
這是除了上面的回答一個非常有用的帖子。
相關問題
- 1. py2app和xml.etree.ElementTree
- 2. xml.etree.ElementTree for chinese
- 3. 使用xml.etree.ElementTree解析XHTML
- 4. ElementTree findtext找不到葉節點
- 5. Google Apps腳本findtext searchpattern格式?
- 6. 模塊xml.etree.ElementTree和xml是如何關聯的?
- 7. 如何使用xml.etree.ElementTree編寫XML聲明
- 8. Python的xml.etree.ElementTree等效於C++ XML庫
- 9. python的xml.etree.ElementTree是否支持DTD?
- 10. UILabels和Unicode
- 11. BlueCloth 2和unicode
- 12. CMemFile和Unicode
- 13. python和unicode stderr
- 14. Solr和Unicode
- 15. wWinmain,Unicode和Mingw
- 16. python-re.sub()和unicode
- 17. ICU,Unicode和庫
- 18. Python re.sub()和unicode
- 19. Python和Unicode
- 20. python:csv.reader&unicode(和postgres)
- 21. JSONEncoder和Unicode(Django)
- 22. VB.NET,MySQL和Unicode
- 23. C++ UNICODE和STL
- 24. Python,mysqldb和unicode
- 25. FastCGI和Unicode
- 26. iOS,CoreText和Unicode
- 27. GCC,Unicode和__FUNCTION__
- 28. Blogger和unicode?
- 29. Java和Unicode
- 30. Unicode和Android NDK
我認爲這應該工作,但我仍然得到錯誤。下一步是驗證編碼是否確實是UTF-8 – seandavi
第二個解決方案可以正常工作 –