2015-04-05 86 views
1

我想幫助我的朋友分析社交網絡(Facebook,Twitter,Linkdin等)以及多個博客和網站上的帖子。存儲巨大的數據;數據庫,XML或純文本?

談到存儲數據,我沒有大量數據的經驗。哪一個最適合每天發佈一千篇文章,推文和文章:數據庫,XML文件,純文本?如果數據庫,哪一個?

P.S. 我要開始編程的語言是Python。

回答

2

這取決於您想要使用數據的方式。如果你有結構化的數據,並希望在不同的程序之間進行交換,xml可能是一個不錯的選擇。如果您進行批量處理,純文本可能是一個不錯的選擇。如果你想過濾數據,數據庫可能是一個不錯的選擇。