2017-07-18 79 views
1

我的數據是從現在開始n(或與未來某個日期相關)的某些日子的投影,並且具有(x,y)對作爲投影。所以我總共有(x,y,n) = (x,y,z)或3-D數據。使用Python建模4-D數據(帶時間戳)

現在,我也有歷史測量。 y維度具有「深度」,但x是固定的。所以我有(x,y,z,t)其中tdatetime.datetime對象。目前

我的實際數據是:

data = [(x, [(y0, t0),(y1, t1),(y2, t2),...,(yn,tn), z] 

我的問題:(1)是否有蟒蛇自然的方式來存儲數據的這種格式?或者,(2)是否過度設計了這個問題,並且存在這種類型的數據存儲的自然數據庫解決方案?

回答

3

使用pd.MultiIndex來表示各種尺寸

data = [('x', [('y0', 't0'), ('y1', 't1'), ('y2', 't2'), ('yn', 'tn')], 'z')] 
d = [[x, y, z, t] for x, ys_ts, z in data for y, t in ys_ts] 
d 

[['x', 'y0', 'z', 't0'], 
['x', 'y1', 'z', 't1'], 
['x', 'y2', 'z', 't2'], 
['x', 'yn', 'z', 'tn']] 

然後製作成數據幀

df = pd.DataFrame(d, columns=list('xyzt')).set_index(list('xzt')).y.unstack() 
df 

t t0 t1 t2 tn 
x z     
x z y0 y1 y2 yn