2012-09-18 66 views
0

我正在使用熊貓函數read_csv來讀取沒有索引列的CSV。熊貓read_csv索引異常

read_csv("file.csv", header=1) 

我期待,大熊貓將產生基於該documentation

index_col每一行的索引:列數,列名或列編號/名稱的列表作爲索引使用(行標籤)生成的DataFrame。默認情況下,它將對行進行編號而不使用任何列,除非有多個數據列比標題多,在這種情況下,第一列將作爲索引。

然而,在加載它拋出的文件,

Exception: Reindexing only valid with uniquely valued Index objects 

而且我想不通爲什麼會出現這種情況。什麼導致這種異常?

我也試過通過skiprowsnrows併發生同樣的異常。

+0

你能給一個數據的例子嗎? – BrenBarn

+0

它到處都是。字符串,整數,浮點數,日期。但我沒有試圖將其解析爲特定的數據類型。 – milkypostman

+0

我的意思是你需要舉一個具體的例子。就像提供一個實際導致錯誤的示例數據文件。這個問題幾乎肯定與該文件格式化的具體細節以及它包含的數據有關。 – BrenBarn

回答

1

問題是header參數不是True/False類型的參數。而是指定標題的行號。由於它指定爲1它使用標題的第二行,並且考慮到該行包含實際數據,所以這些值不是唯一的。

更改命令

read_csv("file.csv") 

read_csv("file.csv", header=0) 

修復該問題。這是一個「嘟嘟嘟嘟」的時刻,但被用來R我錯誤地認爲header=1指定讀取標題。啊。

以供將來參考,異常

Reindexing only valid with uniquely valued Index objects 

涉及不是唯一的報頭值。

+0

您使用的是什麼版本的熊貓? 'read_csv'似乎可以在我使用非唯一頭文件的幾個玩具示例上正常工作。我不知道你是否可以想出一個特定的數據集來重現問題,而不會泄露你想要保密的數據。 –

+0

版本是'0.8.1' – milkypostman