這是問題的擴展,我在這裏問: Getting Factor Means into the dataset after calculation規模 - 復位值誤差
現在,我基本上已經標準化的一切,我很感興趣,使用 我的統計資料想要搜索與這些相交的人的數據集。因此,我正在尋找這樣的數據集:
base3[((base3$ScaledAVG>2)&(base3$ScaledOBP>2)&(base3$ScaledK.AB<.20)),]
尋找有三個的那些東西真的球員,但是當我運行這個它重置縮放K.AB值要麼3.5,1或2然後不使用該參數進行搜索。以這種方式搜索數據集有沒有問題,或者是否有更好的方法來以同樣的方式在數據集中查找人員?
下面是一些示例數據,但它並沒有同樣的問題,當我走出去到4000條記錄,我有:
AVG = c(.350,.400,.320,.220,.100,.250,.400,.450)
Conf = c("SEC","ACC","SEC","B12","P12","ACC","B12","P12")
OBP = c(.360,.420,.360,.260,.160,.260,.460,.410)
K.AB = c(.11,.10,.09,.25,.20,.19,.05,.09)
Conf=as.factor(Conf)
d<- data.frame(Conf, AVG,OBP,K.AB)
dd <- do.call(rbind, by(d, d$Conf, FUN=function(x) { x$Scaled <- scale(x$AVG); x}))
dd <- do.call(rbind, by(d, d$Conf, FUN=function(x) { x$Scaled <- scale(x$OBP); x}))
dd <- do.call(rbind, by(d, d$Conf, FUN=function(x) { x$Scaled <- scale(x$K.AB); x}))
dd[((dd$ScaledAVG>2)&(dd$ScaledOBP>2)&(dd$ScaledK.AB<.20)),]
謝謝!
您提供的示例數據幾乎沒用 - 什麼是base3?你有'confName'和'Conf',並且沒有'Scaled'任何東西。請重現這一點。 – 2013-03-24 00:14:53
最終的函數不會對這些數據做任何事情,但假設你是否有一堆,並且值高於平均值2 sds,這是達到它們的最佳方式還是有更好的方法來做到這一點? – BaseballR 2013-03-24 00:39:45
而且我重寫了樣本數據,我很抱歉沒有讓它重現!除了最後一部分之外,這應該都是有效的。 – BaseballR 2013-03-24 00:40:43