如何限制熊貓數據幀中的NaN填充

-1

我有三個熊貓數據框，其中包含三種類型的索引，分別爲15分鐘，1分鐘和15秒，我在數據框中添加了NaN s，並在同一圖中繪製了主題。如何限制熊貓數據幀中的NaN填充

圖： Graph1

現在我想更換數據框NaN S的一個，我用ffill()，它的工作，但我需要限制填充NaN，我不需要什麼我標記爲紅色。

Graph2：

Graph2

我的情節似乎應該是這樣的：

NOAA http://www.ndbc.noaa.gov/plot_dart.php?station=23227&uom=M&width=400&height=220&start=20140830000000&end=20140903235959

Dataframes：

http://bayanbox.ir/id/1324113030042053806?download

http://bayanbox.ir/id/774076250887409862?download

http://bayanbox.ir/id/6217190851751601245?download

來源：

import matplotlib.pyplot as plt 
import pandas as pd 
import numpy as np 
# 1 minutes recorded data 
data = pd.read_csv('1m.csv', parse_dates=True, index_col='time') 
# 15 minutes recorded data 
data2 = pd.read_csv('15m.csv', parse_dates=True, index_col='time') 
# 15 seconds recorded data 
data3 = pd.read_csv('15s.csv', parse_dates=True, index_col='time') 

del data['Unnamed: 0'], data2['Unnamed: 0'], data3['Unnamed: 0'] 

def add_nan(DF, T): 
    start = DF.time[len(DF)-1] 
    stop = DF.time[0] 
    rng = pd.date_range(start, stop, freq=T) 
    DF = DF.drop_duplicates('time').set_index('time').reindex(rng) 
    return DF 

data = pd.DataFrame({"1-min":np.array(data.Height[:]), "time":data.index}) 
data2 = pd.DataFrame({"15-min":np.array(data2.Height[:]), "time":data2.index}) 
data3 = pd.DataFrame({"15-sec":np.array(data3.Height[:]), "time":data3.index}) 

data = add_nan(data, '1min') 
data2 = add_nan(data2, '15min') 
data3 = add_nan(data3, '1S') 

ax = data.plot(color='g', figsize=(10, 6)) 
data2.plot(ax=ax, color='b') 
data3.plot(ax=ax, style='.-r') 

plt.savefig('plot.png')

來源

2014-09-03 Moradi

你是什麼意思「不顯示正確的陰謀」？如果你缺少數據（以'NaN'的形式，那麼它不會繪製任何東西。 – Ffisegydd 2014-09-03 15:14:55

「data2」數據框有點不對勁，情節應該看起來像是NOAA情節，我認爲'NaN'比'它應該是 – Moradi 2014-09-03 15:21:41

據熊貓documentation，極限參數應該設置True

DataFrame.ffill(axis=0, inplace=False, limit=None, downcast=None) 
Synonym for NDFrame.fillna(method=’ffill’)

enter image description here

這是函數添加NaN個數據到數據幀，用於限制NaN填充limit=True應在數據幀設置：

def add_nan(DF, T): 
    start = DF.time[len(DF)-1] 
    stop = DF.time[0] 
    rng = pd.date_range(start, stop, freq=T) 
    DF = DF.drop_duplicates('time').set_index('time').reindex(rng) 
    return DF.ffill(limit=True)

來源

2014-09-04 13:27:07 Moradi

如何限制熊貓數據幀中的NaN填充

回答

相關問題