我知道這種類型的問題一直在問。但是我很難找出最好的方法來做到這一點。使用熊貓在Python中循環使用多個excel文件
我寫了一個腳本,使用pandas重新格式化一個excel文件。 它很好用。
現在我要遍歷多個 Excel文件中,預製品相同的格式化,並把新格式化的數據從每個在底部,一個又一個Excel工作表。
我相信第一步是製作目錄中所有excel文件的列表。 有很多不同的方法可以做到這一點,所以我很難找到最好的方法。
以下是我當前用於導入多個.xlsx並創建列表的代碼。
import os
import glob
os.chdir('C:\ExcelWorkbooksFolder')
for FileList in glob.glob('*.xlsx'):
print(FileList)
我不確定前面的glob代碼是否實際創建了我需要的列表。
然後我無法理解從那裏去哪裏。 下面的代碼在pd.ExcelFile(File)
失敗我beleive我失去了一些東西....
# create for loop
for File in FileList:
for x in File:
# Import the excel file and call it xlsx_file
xlsx_file = pd.ExcelFile(File)
xlsx_file
# View the excel files sheet names
xlsx_file.sheet_names
# Load the xlsx files Data sheet as a dataframe
df = xlsx_file.parse('Data',header= None)
# select important rows,
df_NoHeader = df[4:]
#then It does some more reformatting.
'
任何幫助是極大的讚賞
檢查您的縮進。空格和縮進在Python中很重要。另外,你應該避免在Python中使用'File'或'file'作爲任何類型的變量名,因爲'file'是一個內建的。 – jonchar
謝謝!這是一個問題。 – brandog