我試圖分析R中的數據集,其中我有一段時間的項目銷售額,我想了解分類變量對銷售數量的影響。R - 分析連續變量的分類變量的影響
library("data.table")
qty <- c(100,10000,100,200,150,9000)
flavour <- c("Mint","Herb","Mint","Mint","Herb","Fruit")
category <- c("Multiple","Multiple","White","Multiple","Other","White")
sales_data <- data.frame(qty,flavour,category)
str(sales_data)
'data.frame': 6 obs. of 3 variables:
$ qty : num 100 10000 100 200 150 9000
$ flavour : Factor w/ 3 levels "Fruit","Herb",..: 3 2 3 3 2 1
$ category: Factor w/ 3 levels "Multiple","Other",..: 1 1 3 1 2 3
我一直在尋找多個壓力和簡單的線性迴歸,但我覺得我可能在錯誤的軌道上。我的理解是,我可以使用簡單的線性迴歸來確定2個連續變量之間的關係。我可以看到有一種方法可以使用多個迴歸來理解分類變量和連續變量之間的關係,但我發現的例子似乎停止在二進制值。例如,有人吸菸或不吸菸。鑑於我對每個分類變量都有多個值,多重回歸是正確的方式還是我完全偏離了軌道?
我的實際數據集有大約10個分類變量,其中一些與位置有關,其他與品牌有關。
任何幫助將不勝感激。並道歉,如果這是錯誤的地方,或者我錯過了一些明顯的東西 - 我正在學習統計數據和R在同一時間,所以很快變得困惑
您需要查看建模分類數據。大多數廣義線性模型的教科書/在線課程都會告訴你這個問題,它在R中的作用很小(只需在公式的RHS上加上你的變量)。 – Spacedman
您聲明'隨時間推移項目的銷售額',您示例中的哪個變量隨時間而變化? – vincentmajor
謝謝@Spacedman,我在使用什麼樣的搜索條件時迷路了 - 在許多兔子洞裏。我會查找的,謝謝。 – user7863288