2013-04-11 121 views
0

考慮以下幾點:平均值與fivenum:不同的結果?

> foo 
[1] 0 0 159 24 0 829 0 157 46 12 5 5 166 166 5 12 5 5 166 166 5 35 
> mean(foo) 
[1] 89.45455 
> summary(fivenum(foo)) 
    Min. 1st Qu. Median Mean 3rd Qu. Max. 
     0  5  12  201  159  829 

什麼SMEG?我不明白爲什麼fivenum會計算與「mean」不同的數字。我想問題是我,但我無法弄清楚我做錯了什麼。

回答

4

你爲什麼打電話summaryfivenum

比較:

foo <- c(0, 0, 159, 24, 0, 829, 0, 157, 46, 12, 5, 5, 166, 166, 5, 12, 
     5, 5, 166, 166, 5, 35) 
> mean(foo) 
[1] 89.45455 
> summary(foo) 
    Min. 1st Qu. Median Mean 3rd Qu. Max. 
    0.00 5.00 12.00 89.45 158.50 829.00 
> fivenum(foo) 
[1] 0 5 12 159 829 
> mean(fivenum(foo)) 
[1] 201 
> summary(fivenum(foo)) 
    Min. 1st Qu. Median Mean 3rd Qu. Max. 
     0  5  12  201  159  829 

fivenum返回長度五個的載體「返回Tukey的5號摘要(最小,低鉸鏈,中位數,上部鉸鏈,最大),用於將輸入數據」。。請注意,在此處沒有提及mean :)

因此,當您做summary(fivenum(foo))時,您正在計算矢量c(0, 5, 12, 159, 829)的彙總統計。對於那個矢量,mean確實是201.

+0

+ 1 - 還提到'fivenum'也不計算平均值。 – mnel 2013-04-11 06:11:43

+0

@ mnel,完成。正在編輯我的答案以顯示幫助頁面的第一行。 – A5C1D2H2I1M1N2O1R2T1 2013-04-11 06:12:49

+0

* headlap *非常愚蠢。謝謝! – Daniel 2013-04-11 06:14:20

1

我想在這裏添加幾個更多的觀點,因爲我在彙總()和fivenum()給出的四分位數之間看到了一些混淆。

首先 - 摘要()給出以下彙總統計: [最小] [第一四分位] [平均] [平均數] [第三四分位] [最大]

其中如,

fivenum()返回Tukey的五個號碼摘要,即 [最小] [下鉸鏈] [中位數] [上鉸鏈] [最大]

這裏是混亂 - 四分之一和下/上鉸鏈之間有什麼區別?

讓我用一個例子解釋 - R中試試這個:

首先 - (在這個例子中5)用向量「Y」奇數值的

> > y=c(2, 5, 8, 15, 8) 
> > summary(y) Min. 1st Qu. Median Mean 3rd Qu. Max. 
>  2.0  5.0  8.0  7.6  8.0 15.0 
> > fivenum(y) [1] 2 5 8 8 15 

正如你所看到的除了summary()給出的平均值以及fivenum()顯示的內容之外,結果是相同的。

現在我只包含一個變量(新值:12)並將此向量定義爲「z」;需要注意的是矢量計數爲偶數(6個值)

> z=c(2, 5, 8, 12, 15, 18) 
> summary(z) 
    Min. 1st Qu. Median Mean 3rd Qu. Max. 
    2.00 5.75 10.00 10.00 14.25 18.00 
> fivenum(z) 
[1] 2 5 10 15 18 

現在看到的區別 - 而彙總()給你的四分位數(以四分位數或百分公式計算值),這是fivenum()不 - 使它很簡單 - 你可以不用數學計算:fivenum()輸出的

說明:

首先,分鐘,平均&最大值由fivenum()給出的直 前進!值的

下鉸鏈=中間值到小於10 =中間值的 (2,5,8)= 5

上的值的(ALL 值的中位數)=中位數的左側鉸鏈中的值的中位數=對屬於 (12,15,18)大於10 =中間值的值的(ALL 值的中位數)=中位數的右側= 15