我有Excel電子表格,我想連接成熊貓數據框,但輸入到電子表格中的表格範圍是不規則的。輸入的數據可能開始於每個電子表格中的C5,D8,G4等。下面的例子顯示它從B5開始。在python中對齊數據
我不知道表格在每個電子表格中的開始位置,或者指定每個工作簿中的哪個表格,因爲有幾百個表格。我打算將所有表單編譯成一個數據框,然後提取我需要的數據行。數據大部分採用相同的格式,但我也需要記住電子表格中的任何註釋。
如果每個電子表格中的數據對齊在一起,那麼會更簡單,然後我可以提取索引標籤所需的行。是否有辦法將每個電子表格中的所有數據對齊,以便在每個電子表格的第一列中開始?
這是我到目前爲止有:
import os
import pandas as pd
import glob
import numpy as np
path =r'dir'
allFiles = glob.glob(path + "/*.xlsx")
frame = pd.DataFrame()
list_ = []
for file_ in allFiles:
df = pd.read_excel(file_,index_col=None, header=0)
list_.append(df)
frame = pd.concat(list_)
print(list_)
這樣做的竅門,謝謝。 – Iwan