2016-11-09 65 views
0
熊貓據幀

我期待找到大規模的在Python.I N維空間中心與K列一個數據框(一些包含文本和一些包含數字)中心質量在Python中

{X1 ...值Xk} ... {Z1..Zk}

K> 10000

我需要計算質量中心在數據幀的所有數值。

這樣做的最佳方法是什麼?

+0

是否每一行都是一個重點?大量的點是一樣的嗎?在這種情況下,只需刪除字符串列並計算點的平均值。有可能是有這種功能的庫。 –

回答

0

質量中心僅僅是在每個維度值的平均值,而你只是想計算它在非對象列,所以:

df.ix[:,df.dtypes != 'O'].mean() 

編輯:雖然OP只提到「text」和「numbers」,下面的替代方案確實比較一般(謝謝MaxU):

df.select_dtypes(include=['number']).mean() 
+0

我覺得有點robuster版本是'df.select_dtypes(包括= ['數字'])。mean()',因爲也有'datetime','category'等等dtypes ... – MaxU

+0

謝謝,那工作 – DTML