我想將word文檔轉換爲文本。所以我使用了一個腳本。在Python中解析Word文檔
import win32com.client
app = win32com.client.Dispatch('Word.Application')
doc = app.Documents.Open(r'C:\Users\SBYSMR10\Desktop\New folder (2)\GENERAL DATA.doc')
content=doc.Content.Text
app.Quit()
print content
我有folllowing結果:
現在我想這個文本轉換成其中包含了所有項目的列表。我用
content = " ".join(content.replace(u"\xa0", " ").strip().split())
編輯
當我這樣做,我得到:
它不是一個列表。問題是什麼?那個大點的字符是什麼?
什麼不起作用?你得到了什麼? – 2011-12-27 08:08:55
「它沒有工作」是什麼意思? – eumiro 2011-12-27 08:09:01