我試圖理解來自predict()的輸出,以及瞭解這種方法是否適合於我試圖解決的問題。預測區間沒有道理給我,但是當我繪製這在散點圖它看起來像一個很好的模式:瞭解'預測'的輸出在R
我創造交易規模($)的簡單線性迴歸模型用公司的銷售量作爲預測變量。該數據是僞造的,交易規模是銷量加上或減去一些噪音的倍數:
Call:
lm(formula = deal_size ~ sales_volume, data = accounts)
Residuals:
Min 1Q Median 3Q Max
-19123502 -3794671 -3426616 4838578 17328948
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.709e+06 1.727e+05 21.48 <2e-16 ***
sales_volume 1.898e-01 2.210e-03 85.88 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 6452000 on 1586 degrees of freedom
Multiple R-squared: 0.823, Adjusted R-squared: 0.8229
F-statistic: 7376 on 1 and 1586 DF, p-value: < 2.2e-16
的預測是正是如此產生:
d = data.frame(accounts, predict(fit, interval="prediction"))
當我繪製sales_volume與deal_size上的散點圖,並將迴歸線與預測區間疊加,看起來很不錯,除了少數區間跨度爲銷售額接近於零的負值。
我明白擬合預測值,但什麼是LWR和UPR?他們是否以絕對項(y座標)定義間隔?間隔似乎是極寬,寬於纔有意義,如果我的模型是一個不錯的選擇:
sales_volume deal_size fit lwr upr
0 0 3709276.494 -8950776.04 16369329.03
0 8586337.22 3709276.494 -8950776.04 16369329.03
110000 549458.6512 3730150.811 -8929897.298 16390198.92
也許看看'?predict.lm' –
完成後僅code.With輸出我們沒有任何幫助確定問題的方式。 –
我已經放在一起顯示兩個時間間隔工作的短文檔。 http://rpubs.com/RomanL/7024 –