2016-05-01 36 views
0

這是一個數據框,顯示一些信息,如計數,平均值,標準偏差和一些百分點。你能解釋一下如何使用這些數據來理解df/a系列。大熊貓描述功能和如何使用它的統計學意義是什麼?

  losses  wins   year 
count 8.000000 8.000000  8.000000 
mean 6.625000 9.375000 2011.125000 
std  3.377975 3.377975  0.834523 
min  1.000000 4.000000 2010.000000 
25%  5.000000 7.500000 2010.750000 
50%  6.000000 10.000000 2011.000000 
75%  8.500000 11.000000 2012.000000 

有人可以請解釋每一個如何計數,平均值,標準,分鐘,。 &這些百分位數用於瞭解數據嗎?

回答

3

這些是一些統計數據,它們給出了關於數據分佈性質的一些觀點。

  • mean是平均值,是分配的「預期」值。平均而言,你期望得到這個數字。

  • std告訴你數據相對於mean有多大的波動。具體而言,其meanmean的平方偏差。

  • 50%也是中位數,它與mean的區別給出了分佈偏斜的信息。這也是平均值的另一個定義,它對數據中的異常值很有效。

  • 25% & 75%給出峯度的透視圖。而且,所有百分位數對於異常值通常更健壯。

  • minmaxmax - min75% - 25%都替代角度上的數據有多大波動的花費相對mean

  • count較大的這個數字,更多的信譽所有的統計數據都。