-1
我是R
的新手,對lm()
函數有疑問。我有一個柱Ratings
其範圍內的連續的屬性0到5當我調用lm()
命令爲:lm in R - 用於表示連續值預測變量的表面上的分類值
lm(some_overall_rating ~ Rating, data = Ratings)
我得到的輸出等:
我的問題是爲什麼我有這麼多係數?我理想地爲ratings$rating
專欄尋找一個合作效率。
我是R
的新手,對lm()
函數有疑問。我有一個柱Ratings
其範圍內的連續的屬性0到5當我調用lm()
命令爲:lm in R - 用於表示連續值預測變量的表面上的分類值
lm(some_overall_rating ~ Rating, data = Ratings)
我得到的輸出等:
我的問題是爲什麼我有這麼多係數?我理想地爲ratings$rating
專欄尋找一個合作效率。
您的評分正在被視爲factor
變量。如果您運行
class(ratings$rooms_rating)
它將返回factor
。要轉換爲數字變量,請嘗試以下操作(具體取決於dplyr
和readr
包)。
ratings = ratings %>%
mutate(rooms_rating = parse_number(rooms_rating))
現在,重新運行你的模型。
注意'lm'輸出中的'NULL'。他們可能必須首先處理。 –
請查閱'factor'的'R'幫助頁面。 – whuber
在'rooms_rating'列中的某處,您有一個字符'NULL'。當您導入數據時,該列將被轉換爲「因子」。你會想(可能)想將NULL值轉換爲NA值(缺失值),然後轉換爲數字值。 –
有點困惑,爲什麼你有'評級'作爲你的迴歸,但輸出結果是'收視率$ rooms_rating2','收視率$ rooms_rating3'等。不應該是'Rating2','Rating3','Rating4 '等等?你確定這是你的代碼'lm(some_overall_rating〜Rating,data = Ratings)'的輸出嗎? – useR