2016-10-10 95 views
1

我在Microsoft Outlook中收到一封包含html表的郵件。我想解析一下熊貓的數據框。以html格式閱讀outlook郵件

我已經寫了一個腳本,使用美麗的湯來解析HTML文本到數據框中。但我首先在閱讀html中的電子郵件時感到很困難。

找到消息我正在使用下面的代碼將其讀入到文本文件中。但它正在將文本寫成一個/ n分隔的字符串,而不是像我期待的那樣的數據。這意味着我不能使用美麗的湯將其轉化爲數據框。

我發現了很多關於如何編寫和發送html郵件的例子,但沒有發現如何以html格式讀取。有任何想法嗎?

contents = msg.Body.encode('ascii', 'ignore').decode('ascii') 
contents_file = open("U:\body.txt", "w") 
contents_file.write(contents)    
contents_file.close() 

回答

2

自己找到答案。我應該用msg.HTMLBody而不是msg.Body