2016-08-21 28 views
0

新手在這裏。我設法制作了一個腳本,用於從網站上刪除一些信息。這種情況每天都會發生,數據保存在csv文件中。每個文件的內容與此類似:python - 分析抓取數據時的最佳方法

date, ticker, company name, momentum indicator, other ratios.... 
2016-08-19, GSK, GlaxoSmithKline, 42, .... 
2016-08-19, RDSB, Royal Dutch Shell, 98, ..... 
.... 

我累計了3個月的日常數據,所以大概有80個文件。 (文件中的每一行都有相同的日期,然後是不同的份額)。 我現在想要做的就是按份額基礎來檢查動量指標和其他比率的變化。

例如,我想我應該有一系列的列表,如

GSK_momentum_indicator = (42, 43, 38, 47,...) 
RDSB_momentum_indicator = (98, 91, 77, 79,...) 

現在結束了,作爲一個新手,我有2個問題: 1)你認爲什麼是最好的方法這個?它是使用列表,字典還是其他? 2)如何你決定以上?有哪些策略可以使用的指導方針?有沒有一個很好的資源,我可以作爲一個新手瞭解更多關於這個問題?

謝謝!

PS。如果它有所作爲,我使用python 3.5.2。

+1

看看['pandas'](http://pandas.pydata.org)。 – MattDMo

+0

是的。熊貓絕對是方向。我給你一個upvote。但我有時會感到困惑,我們如何回答這些問題。離開「檢查熊貓」,將被其他人大規模地投票... – stanleyxu2005

回答

1

爲了處理您收集的數據,您可以使用其中一個Python模塊csvpandascsv模塊用於從/向csv文件讀取/寫入數據,然後您可以將數據轉換爲python列表和字典並相應地使用。有關詳細文檔,請轉至here

但是,如果你有大的數據集,那麼你應該去pandas這是一個專門的數據分析工具。 pandas.read_csv函數將csv文件的名稱作爲參數,並返回一個DataFrame對象,您可以在其中執行各種操作。有關詳細文檔,請轉至here