2016-03-03 127 views
0

我有一個對象表示爲嵌套字典\數組 該集合中的所有對象都具有相同的架構,儘管數組中的條目數量可能因對象而異有所不同 我正在尋找一種存儲此數據的好方法,這將允許簡單的批量操作。 特別是,快速訪問列\列作爲numpy數組很重要(這是不使用一個簡單的對象列表的主要原因)什麼是表示分層對象向量的好方法?

熊貓與MultiIndex是我的第一個想法,但我不相信它可以支持可變長度陣列

+0

你能提供一個數據的例子嗎? – Colin

+0

例如: {'name':'john','cars':[{'make':'mazda','licence_plate':123},{'make':'ford','licence_plate':456} ]} –

+0

然後你會得到這些字典的列表?只是一個DataFrame pd.DataFrame([''john','mazda',123),('john','ford',456)],columns = ['name','make','license_plate 「])'? – Colin

回答

2

pytables是這個用例的一個非常可靠的選項。它支持可變長度數組。

+0

你確定陣列支持一個字段嗎?我找不到這方面的參考 –

相關問題