2017-09-05 50 views
0

我試圖在dask數據框中添加一列,但它不讓我添加列表類型的列,所以我達到了一點點,發現它會添加一個dask系列。但是我無法將我的列表轉換爲dask系列。你能幫我嗎?初始化一個dask系列

+2

這將是更好,如果你給你所期望的工作,在它失敗的方式代碼的全部細節:代碼和錯誤/追溯。 – mdurant

回答

0

您可以將列表轉換爲大熊貓數據幀,如果它能夠裝入內存:

import pandas as pd 
import dask.dataframe as dd 
import numpy as np 

df = pd.DataFrame(np.random.random_integers(0,6,size=(20, 6)), 
columns=list('ABCDEF')) data = dd.from_pandas(df, npartitions = 2) 

listadd = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17,18, 19, 20] 
listadd = pd.DataFrame(listadd) 

data[['G']] = listadd 

print data.compute() 
+0

是的,但它不適合。 :/ –

+0

該列表適合但Dataframe不適用? – user48944

+0

是的,列表幾乎不佔用內存的75%左右,但使用熊貓時數據框不會顯示。 –