正如你對針對數據分析DSL期待,R處理缺少/不完整的數據非常好,比如:在R中處理丟失/不完整的數據 - 是否有掩蓋但不移除NAs的功能?
許多R的功能和有na.rm標誌,當設置爲TRUE ,除去在NAS:
>>> v = mean(c(5, NA, 6, 12, NA, 87, 9, NA, 43, 67), na.rm=T)
>>> v
(5, 6, 12, 87, 9, 43, 67)
但是如果你想前處理的NA 函數調用,你需要做的是這樣的:
從矢量中刪除每個「NA」:
vx = vx[!is.na(a)]
從向量刪除的每個「NA」和替換它瓦特/「0」:
ifelse(is.na(vx), 0, vx)
以去除整個各行包含「NA」從數據幀:
dfx = dfx[complete.cases(dfx),]
所有這些功能永久除去「NA」或行與他們的「NA」。
有時候這並不完全符合你的想法 - 使工作流中的下一步需要數據框的'NA'刪除副本,但在後續步驟中,您經常需要這些行返回(例如,爲先前調用'complete cases'但該列中沒有'NA'值導致缺少行的列計算列逐列統計量。
儘可能什麼我要找的是明確的:蟒蛇/ numpy的有一個類,屏蔽數組,具有面具方法,它可以讓你隱瞞 - 但不是remove--在函數調用期間的NA。 R中有類似的功能嗎?
您到動物園的鏈接已損壞。 [Here](http://cran.r-project.org/web/packages/zoo/zoo.pdf)是我能找到的最新文檔(.pdf警告)的鏈接,[Here](http:/ /cran.r-project.org/web/packages/zoo/index.html)是我認爲是動物園最新總結的鏈接。 – deadstump 2012-11-02 14:40:12
URL中的錯誤複數'',因爲它是'package = ...',而不是'packages = ...'。現在修好了,謝謝。 – 2012-11-02 14:50:36