我想了解如何劃分和創建區間;試過?削減但無法弄清楚如何削減在r工程。
這裏是我的問題:R怎樣在R中工作
set.seed(111)
data1 <- seq(1,10, by=1)
data1
[1] 1 2 3 4 5 6 7 8 9 10
data1cut<- cut(data1, breaks = c(0,1,2,3,5,7,8,10), labels = FALSE)
data1cut
[1] 1 2 3 4 4 5 5 6 7 7
1.爲什麼8,9,10不包括在data1cut結果呢?
2.爲什麼摘要(data1)和摘要(data1cut)產生不同的結果?
summary(data1)
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.00 3.25 5.50 5.50 7.75 10.00
summary(data1cut)
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.00 3.25 4.50 4.40 5.75 7.00
我應該如何更好地利用削減,這樣我可以創造說的4個倉基於摘要(數據1)的結果嗎?
bin1 [1 -3.25]
bin2 (3.25 -5.50]
bin3 (5.50 -7.75]
bin4 (7.75 -10]
謝謝。
你爲什麼認爲某些值不包括在內? 「剪切」結果你期望什麼?也許可以對不是第一個整數的值進行剪切以避免混淆,並仔細閱讀段落** Value ** from'cut':*返回一個因子,除非labels = FALSE,這會導致整數向量爲級別代碼。* – Cath
可能是我對'cut'的理解非常有限。當我做'cut'時,我的期望是在創建的範圍中創建一個bin,並在bin中創建相應的值(因子)?那麼,假設的分佈度量結果如「summary(data1cut)」和「summary(data1)」是否相似? – deepseefan
什麼切確實把你的數據放入垃圾箱,並且對於你的每個矢量值,它給出了相關垃圾箱的「代碼」。你可以通過'table(data1,data1cut)'來更好地理解哪個值落入哪個bin – Cath