好吧,我難住這個我已經看過熊貓文檔,但我無法弄清楚正確的方式來做到這一點,我想我只是做一個爛攤子。基本上我有數據是numpy數組,例如如何使用熊貓與多列Numpy陣列
data = numpy.loadtxt('foo.txt', dtype=str,delimiter=',')
gps_data = numpy.concatenate((data[0:len(data),0:2],data[0:len(data),3:5]),axis=1)
gps_time = data[0:len(data),2:3].astype(numpy.float)/1000
GPS_DATA基本上看起來像這樣
array([['50.3482627', '-71.662499', '30', 'network'],
['50.3482588', '-71.6624934', '30', 'network'],
['50.34829', '-71.6625077', '30', 'network'],
...,
['20.3482488', '-78.66245463999999', '9', 'gps'],
['20.3482598', '-78.6625174', '30', 'network'],
['20.34824943', '-78.6624565', '10', 'gps']],
dtype='|S18')
和gps_time
array([[ 1.16242035e+09],
[ 1.26242036e+09],
[ 1.36242038e+09],
...,
[ 1.32330411e+09],
[ 1.16330413e+09],
[ 1.26330413e+09]])
我試圖做的是使用數據框帶來另一個容貌相似陣列稱爲acc_data與它相結合gps_data,然後返回並填寫不同的缺失數據時間。例如。這就是我一直在試圖
df1 = DataFrame(gps_data,index=gps_time,columns=['GPS'])
,它給這個錯誤
ValueError: Shape of passed values is (4, 35047), indices imply (1, 35047)
,我不知道如何處理,如果我能找到周圍的天賦,我認爲下一個步DF2但acc_data將正常工作,然後我可以做
p = Panel({'ACC': df1, 'GPS': df2})
任何幫助,將不勝感激被難倒這對最後幾個小時。
甜蜜的感謝,雖然現在當我做p = Panel({'GPS':df1,'ACC':df2})時,它抱怨緩衝區有錯誤的預期維數1找到2。 – eWizardII 2014-10-06 18:28:07
沒問題。你的'df2'是什麼?它是什麼形狀? – 2014-10-06 18:33:39
DF2爲[7111排3列(對不起,我不知道該怎麼辦的意見正確格式化)但基本上DF2的樣子: XYZ 1.362420e + 09 -0.249893 4.125504 9.105667 1.362420e + 09 -2.738571 5.260941 8.285629 – eWizardII 2014-10-06 18:35:21