2017-03-08 32 views
-1

我有一個數據,包括不同的類型:如何找到一個混合數據的相關性,包括在R連拍,類別和日期類型

a <- data.frame(x=c("a","b","b","c","c","c","d","d","e","f"),y=c(1,2,2,2,3,1,4,7,10,2),m=c("a","d","ab","ac","ac","vc","ed","ed","e","df"),n=c(2,1,5,3,3,2,8,10,10,1)) 

實際上,該數據比這更復雜,可能包括日期,以及。此外,這是一個無人監督的問題。所以這裏沒有「班級標籤」。所以我不能使用方差分析等方法。那麼,我怎麼能找到每兩列之間的相關性?

P.S.我在psych package中找到一個名爲mixed.cor的函數,但無法理解如何使用它。

此外,相關性僅表示線性關係。如果我想知道每一列的重要性,我應該使用什麼函數?

回答

2

對於分類數據,未定義大多數人用於數字變量(即Pearson相關)的相關度量。如果您想測量數值變量和分類變量之間的關聯,則可以使用方差分析。如果您想測量兩個分類變量之間的關聯,則可以使用卡方檢驗。如果您的分類變量是有序的(例如低,中,高),則可以使用Spearman等級相關性。

+0

非常感謝。這有很大幫助。 –

相關問題