我有一個數據幀,看起來像這樣:重新取樣大熊貓數據幀只需要知道結果測量計數
Trial Measurement Data
0 0 12
1 4
2 12
1 0 12
1 12
2 0 12
1 12
2 NaN
3 12
我想重新取樣我的數據,使每個試驗只有兩個測量 所以我想將它變成什麼像這樣:
Trial Measurement Data
0 0 8
1 8
1 0 12
1 12
2 0 12
1 12
這並不常見任務,從我的數據對刺激呈現的部分故意抖動的事實造成的。
我知道大熊貓有一個二次採樣函數,但我不知道如何將它應用到我的第二級指標,同時保持在不同的類別中的數據基礎上,一級指標:(
另外,我想要迭代,在我的一級指標,但顯然
for sub_df in np.arange(len(df['Trial'].max()))
不會因爲工作,因爲'Trial'
是一個索引大熊貓不能找到它。
如何(0,1 )變成8而不是12,但(2,1)變成6(以NaN爲零而不是丟失的數據)?你的重採樣規則是什麼?數據前半部分的平均值和最後一部分的平均值,允許重疊,並將NaN設置爲0? – DSM
我沒有預先定義的重採樣規則,我必須堅持。我舉了一個例子,因爲它看起來很直觀。的確,然而,最好將NaN視爲缺失的數據。是的,由於重疊,第一個值變爲8。我仍然認爲這是最好的方法。每次試用我都有〜256個值,所以一個值的重疊在任何情況下都不會有什麼區別。 – TheChymera
你是否需要像這樣編制索引,它可能更容易,因爲只是列和使用groupby –