2016-11-16 149 views
1

我正在使用R的cor()找到除了對角線條目之外的所有NA值。我成對刪除了NAs。當我明確刪除了NAs後,我得到了期望的結果。我誤解了論據嗎?沒有得到預期的相關值 - R cor()

我試圖

> c <- Result_table[,.SD,.SDcols=c("organic_account_countsession", "organic_account_countsession")] 
> b <- cor(c, use="pairwise.complete.obs") 

          organic_account_countsession organic_account_countsession 
organic_account_countsession       1       NA 
organic_account_countsession       NA       1 

也試過這個

> b <- cor(c, na.rm=TRUE) 

還是得到了相同的結果。

只有當我做

c <- c[complete.cases(c)] 
b <- cor(c) 

          organic_account_countsession organic_account_countsession 
organic_account_countsession       1       1 
organic_account_countsession       1       1 

我得到全1。 我希望得到所有1,因爲我正在找到變量與自身的關聯。

(注:變量具有方差,NA是不是由於沒有方差)

回答

1

事實證明,這是一個不同的誤差完全在我的部分。

我已經將h2o包與stats包一起導入。 原因h2o中有一個cor()函數以及不同的行爲。

cor <- stats::cor 

解決了這個問題。