2016-12-13 164 views
-1

我是R的新手,對lm()函數有疑問。我有一個柱Ratings其範圍內的連續的屬性0到5當我調用lm()命令爲:lm in R - 用於表示連續值預測變量的表面上的分類值

lm(some_overall_rating ~ Rating, data = Ratings) 

我得到的輸出等:

enter image description here

我的問題是爲什麼我有這麼多係數?我理想地爲ratings$rating專欄尋找一個合作效率。

+2

請查閱'factor'的'R'幫助頁面。 – whuber

+0

在'rooms_rating'列中的某處,您有一個字符'NULL'。當您導入數據時,該列將被轉換爲「因子」。你會想(可能)想將NULL值轉換爲NA值(缺失值),然後轉換爲數字值。 –

+0

有點困惑,爲什麼你有'評級'作爲你的迴歸,但輸出結果是'收視率$ rooms_rating2','收視率$ rooms_rating3'等。不應該是'Rating2','Rating3','Rating4 '等等?你確定這是你的代碼'lm(some_overall_rating〜Rating,data = Ratings)'的輸出嗎? – useR

回答

2

您的評分​​正在被視爲factor變量。如果您運行

class(ratings$rooms_rating) 

它將返回factor。要轉換爲數字變量,請嘗試以下操作(具體取決於dplyrreadr包)。

ratings = ratings %>% 
    mutate(rooms_rating = parse_number(rooms_rating)) 

現在,重新運行你的模型。

+0

注意'lm'輸出中的'NULL'。他們可能必須首先處理。 –