2011-01-31 100 views
1

我正在考慮對包含大於4年的通信的一組大型個人.pst文件執行一些文本挖掘。文本挖掘Outlook電子郵件存檔

最初,我想提取標題信息以識別社交網絡,但最終希望開始根據關鍵詞對電子郵件進行分類或創建一些結構化輸出以支持進一步的分析。

有沒有人有什麼建議從哪裏開始?

回答

2

您應該檢查在公開可用的Enron Email Dataset上完成的研究 - >該頁面鏈接到一些有趣的論文