2016-10-02 166 views
-2

我有一個名爲「煙霧」的表,包含300行(每個主題一行)和兩個變量(「組」和「種族」)。小組將「吸菸者」,「不吸菸者」或「退出」的值視爲「白色」,「黑色」,「西班牙裔」,「亞洲人」。描述兩個分類變量之間的關係?

我想寫一行R代碼,這將產生一個適當的描述吸菸組和種族之間的關係。

+4

這是不是一個很好的特定的編程問題 - 也不是你在研究工作的方式展示多(你嘗試過什麼,爲什麼?你對結果不滿意嗎?),這有時可以幫助解決質量問題。你想要一張桌子給交叉表嗎?使用'table()'。你想適合一個模型,也許是一個多項GLM?如果因爲結果而不知道自己想要什麼,那麼首先需要弄清楚。 – Gregor

回答

1

對於兩個分類變量的關聯獨立性的典型統計檢驗,其中兩個分類變量都沒有我認爲是自然排序的情況,這將是對獨立性的卡方檢驗。

with(dataset, chisq.test(smoke, Group)) 

來看看剛剛的實際值:

with(dataset, table(smoke, Group)) 
# OR 
with(dataset, prop.table(table(smoke, Group)))