2017-09-13 51 views
0

我是熊貓的新手,我嘗試總結我的csv文件。我創建了我的csv,其中包含Country和Count列,並使用熊貓來計算每個國家的總數。我也不確定我的csv格式是否正確轉換或不正確。這是我的代碼當我嘗試使用熊貓來總結csv文件時,它不起作用

import pandas as pd 
df =pd.read_csv ("/Users/mani/Desktop/finalgeocount.csv") 
print df.groupby(['COUNTRY']).sum() 

這是我的原始csv文件數據

COUNTRY COUNT 

China 1 
China 1 
China 1 
China 2 
Ireland 1 
China 3 
Moldova 1 

我需要這樣的輸出:

China   8 
Ireland   1 
Moldova   1 

但我的輸出顯示如下圖所示:

      Unnamed: 2 Unnamed: 3 Unnamed: 4 
COUNTRY              
Albania       NaN   NaN   NaN 
Algeria       NaN   NaN   NaN 
Angola        NaN   NaN   NaN 
Anguilla       NaN   NaN   NaN 
+0

df.columns的輸出是什麼? – Vaishali

+0

你的代碼應該可以工作。確切的問題是什麼? –

+0

@TedPetrou我已在我的帖子中更新了當前的輸出內容。請檢查 – Angeline

回答

1

您所擁有的原始數據sted是製表符分隔的,這是一種CSV格式。讀取文件時,有助於指定分隔符:

>>> df = pd.read_csv('/Users/mani/Desktop/finalgeocount.csv', delimiter='\t') 
>>> df 
    COUNTRY COUNT 
0 China  1 
1 China  1 
2 China  1 
3 China  2 
4 Ireland  1 
5 China  3 
6 Moldova  1 
>>> df.groupby('COUNTRY').sum() 
     COUNT 
COUNTRY  
China  8 
Ireland  1 
Moldova  1 

N.B.我不得不整理一些原始數據,以便從第二個空白行刪除一些零散的字符。

相關問題