2016-12-27 81 views
1

我想讀取Python(2.7.13)中的excel文件。爲此,我創建了一個示例文件,第一冊,具有以下條目 -無法讀取所需的excel文件作爲Python輸出

enter image description here

import pandas as pd 
import numpy as np 

Book1 = pd.read_excel("D:\Python\Book1.xlsx") 

print(Book1.head()) 

寫上面的程序,並在PowerShell中執行它後,我得到了下面的輸出,我不明白。

enter image description here

什麼是第一列,爲什麼0,1,2從7喲7.1改變Ë單元格的值?誰可以給我解釋一下這個?程序有問題嗎?

如果上傳的圖片在這裏不合適,我表示歉意。我不知道任何其他方式來輸入這些數據。

回答

6

0,1,2是行索引,因爲您沒有傳遞標頭,所以第一行已自動轉換爲標頭。現在

,我們不能有兩列具有相同的名稱,所以第二個7已經轉換爲7.1

爲了解決這個問題,你可以嘗試:

no_of_columns = 5 Book1 =pd.read_excel("D:\Python\Book1.xlsx",header=None,name=range(no_of_columns))

注你需要知道列的數量才能做到這一點。

4

熊貓正在讀取第一行作爲標題列。由於它想避免命名列中的衝突,因此第一個7列將保留其原始名稱。第二個7會產生碰撞,因此熊貓將其更改爲7.1

設置header=None。有關參數的完整說明,請參閱docs

您可以按如下方式指定列的names

Book1 = pd.read_excel("D:\Python\Book1.xlsx", header=None, 
         names=['col1', 'col2', 'col3', 'col4', 'col5']) 

0,1和2是行的索引。你可以使用這些數字來引用一行。

>>> Book1[0] 
1 3 7 2 7.1 <- column names 
2 2 3 2 1 <- values in row 0