2017-03-05 126 views
0

我有一些代碼將嵌套的json字典放到dataframe中。 這不是非常有效,並且想知道在創建數據框之前是否需要使用numpy數組 進行存儲。 字典大小爲100萬,item是JSON字符串。從字典到熊貓dataframe

ALL=dict() 
    ALL[0]= """{id1: 'Big_JSON' }""" 
    for k_id, dd in ALL.items() : 

    ii+=1 
    if ii > -1 : 
    dfi= pd.io.json.json_normalize(dd) 

    if ii == 0 : 
     ALL_df= dfi  
    else: 
     ALL_df= pd.concat((ALL_df, dfi), axis=0)  
     print ii, 

是否有一種快速轉換爲數據框的方式?

+0

這個問題可能會從受益[最小,完整,可驗證](http://stackoverflow.com/幫助/ mcve)的例子,這使我們更容易幫助你。 –

回答

0

而不是使用CONCAT低效,試圖在同一時間將所有類型的字典的:

ALL_df = pd.io.json.json_normalize(ALL.values()) 
+0

因爲所有JSON文件都有不同的鍵......(有時候,鍵可能會丟失......對於一行),那麼列的鍵需要什麼呢? – Tensor