1
我一直在關於Dspace的一個項目 我一直在使用安然郵件語料庫(從CMU源下載)。Dspace Enron搜索工具
我的問題是:
- 我想利用600K電子郵件整個集合,然後生成一個倉庫使他們的搜索
每封郵件的手動進元是不是一個可行的選擇因爲它們是數百萬人! Dspace中的導入工具可以提供任何幫助嗎?或者是否有要編輯的文件?
我需要一些可行和快速的方法:我該怎麼做才能給系統提供這麼多郵件?
- 第二個問題:可以將任何集合中的附加文件編入索引嗎?我的意思是我可以搜索文件搜索工具的內容嗎?