我有一個由多個.fits文件組成的Pandas Dataframe,每個文件包含多個帶有單獨標籤的列。我想提取一列並創建包含該列的第一行和最後一行的變量,但我很難完成個別.fits文件而不是整個數據幀。任何幫助,將不勝感激! :)在Pandas數據框中查找單個文件的第一行和最後一行
這是我在文件中如何閱讀:
path = '/Users/myname/folder/'
m = [os.path.join(dirpath, f)
for dirpath, dirnames, files in os.walk(path)
for f in fnmatch.filter(files, '*.fits')]
^^^這個遞歸搜索通過我的包含很多子多.fits文件的目錄。
dataframes = []
for ii in range(0,len(m)):
data = pd.read_csv(m[ii], header = 'infer', delimiter = '\t')
d = pd.DataFrame(data)
top = d['desired_column'].head()
bottom = d['desired_column'].tail()
First_and_Last = pd.concat([top,bottom])
我嘗試使用熊貓Dataframes的。頭和.tail命令,但我不確定如何正確地使用它爲我的願望。對於我如何閱讀適合文件,以下代碼給出了前幾行和最後幾行(5與頭尾的默認值爲5一樣),如下所示:
0 2.456849e+06
1 2.456849e+06
2 2.456849e+06
3 2.456849e+06
4 2.456849e+06
1118 2.456852e+06
1119 2.456852e+06
1120 2.456852e+06
1121 2.456852e+06
1122 2.456852e+06
我想要做的是嘗試獲取每個.fits文件的第一行和最後一行,以獲取特定的列,而不僅僅是包含.fits文件的Dataframe。通過我在.fits文件中閱讀的方式,Dataframe似乎將所有文件連接在一起。有關如何完成此目標的任何提示?
爲了澄清,你說你正在獲取整個數據幀的第一個和最後5個。它由幾個合適的文件組成。但是你的代碼會建議First_and_Last只包含你讀到的最後一個文件的第一個和最後5個。也許你沒有發佈你的所有代碼? –