與數據替換丟失的數據I具有非regulirased數據在這樣一分鐘的間隔:熊貓 - 重新取樣非正規化數據一個分鐘間隔在3個小時的間隔和在一個時間範圍
Date Vel Dir
14-11-2001 17:55:00 14.1 35
14-11-2001 17:56:00 10.4 52
14-11-2001 17:57:00 14.8 19
14-11-2001 18:04:00 11.4 54
14-11-2001 18:05:00 7.6 13
我想在,例如,如果在18小時和00分鐘的數據缺失的方式來重新取樣該數據爲3小時(0,3,6,9,12,15,18,21)的間隔,我用在00分鐘之後或之前五分鐘範圍內最近的數據替換它。在這個例子中,我的17 57的時間接近18比00 18 04,所以我用的17 57這樣的數據替換數據丟失時間18 00:
14-11-2001 15:00:00 5.8 43
14-11-2001 18:00:00 14.8 19
14-11-2001 21:00:00 17.4 68
,如果我不
14-11-2001 15:00:00 5.8 43
14-11-2001 18:00:00 NaN NaN
14-11-2001 21:00:00 17.4 68
我試圖與.resample做到這一點('3H:後或00分鐘之前,我沒有完成丟失的數據離開小時與南這樣有五分鐘的時間間隔數據')熊貓命令,但我不知道如何去做,用5分鐘範圍內最近的數據替換缺失的值。
我嘗試使用np.searchshorted但我不能夠建立與它五分鐘範圍內,所以我放棄這個想法。
我的代碼現在的問題是很簡單的,我只是讀取數據的文本文件,並重新取樣,在3個小時的間隔,不替換數據,所以我的數據是這樣看的時候我解壓,因爲我的文本文件:
Date Vel Dir
14-11-2001 15:00:00 5.8 43
14-11-2001 18:00:00
14-11-2001 21:00:00 17.4 68
的代碼是:
import numpy as np
import pandas as pd
dateparse = lambda x: pd.datetime.strptime(x,'%d %m %Y %H %M')
vento= pd.read_csv('vento.txt',header=0, delim_whitespace= True, parse_dates = [['Dia', 'Mes', 'Ano', 'Hora','Minuto']], index_col = 0, date_parser = dateparse)
vento_2=vento.resample('3H')
vento_2.to_csv(r'data.txt',index=True, index_label=None, sep='\t')