2017-08-02 48 views
1

如何對這類數據執行迴歸(隨機森林,神經網絡)?預測建模

數據中包含的功能,我們需要根據每週預測銷售數量和屬性

1

這裏我附上樣本數據 Here we are trying to predict sales quantity based on other attributes

+0

請分享'dput(head(data.frame))'。有多種類型的迴歸?你有哪一個想法?在跳轉到迴歸之前,您需要先執行EDA。 – TUSHAr

+0

謝謝@Tushar根據您的要求我上傳了示例數據圖片 –

回答

0

多元線性迴歸

假設

  • 輸入變量X [] [](每一行對應於一個樣本,每列對應於一個變量如星期幾,季節,..)
  • 預期輸出y [](儘可能多的行爲x)
  • 參數被學習THETA [](多達有輸入變量+ 1)

您正在優化函數h:

H =總和爲{X [j]的的所有的j [I] * p [i] - y [j]}最小

這可以很容易地通過gra下降。你也可以包含參數的組合(並且簡單地包括那些僞參數的更多的theta)

我有一些代碼躺在GitHub存儲庫中,執行基本的多元線性迴歸(對於我有時教的課程)。

https://github.com/jorisschellekens/ml/tree/master/linear_regression

+0

謝謝@Joris 我的意思是有任何關於準備數據和我們需要執行什麼類型的數據轉換的建議。我們做了諸如編碼的分類變量和正常化數據等。 –

+0

我添加了一個代碼鏈接(因爲這對於這個特定的帖子來說太多了)。如果您贊同我的回答,請將其標記爲已接受的答案(這樣我可以獲得聲望點)。 –

+0

它不是關於如何執行線性迴歸。我們試圖優化我們的預測任務的性能。我們沒有嘗試通過使用隨機森林和神經網絡嘗試任何線性迴歸。希望你得到它 –