我想創建一個線性迴歸模型來預測使用兩個不同係數的輸出,這個係數根據數據中的某個閾值。例如: df:開啓和關閉係數R線性迴歸
Value Temperature
8.2 70
3.2 51
5.8 54
7.2 61
等等。對於這個數據,我想弄清楚如何進行以下模型:
值= B0 + B1(HighTemp)+ B2(LowTemp)
其中,B1是0,如果溫度低於55,和B2是0是溫度高於55 我試過如下:
fit = lm(Value ~ I(Temperature > 55), data = df)
fit2 = lm(Value ~ Temperature * I(Temperature > 55), data = df)
fit
只給我當溫度高於55的係數,並給出了fit2
輸出,我不完全理解。我還在考慮創建第三列HighorLow
,並使用指示變量(1或0)確定溫度是高還是低。我會:
fit = lm(Value ~ Temperature:HighorLow, data = df)
有沒有人有任何輸入?我將不勝感激任何幫助。
這將給出截距和Temp_thresholdTRUE的值。我假設當溫度大於55時,溫度項的係數。但是對於低於55的項,係數如何?我認爲可能有一個根本的概念,我沒有抓住。 – 2015-02-06 18:25:06
你可能想要閱讀一些迴歸。簡短的回答 - 既然你有兩組要比較(Temp_thresholdTRUE和Temp_thresholdFalse),迴歸會隱式計算一個相對於另一個的coeff,沒有兩個係數。因此,Temp_thresholdTRUE的係數將TemperatureTRUE與TemperatureFALSE(假定其對簡單性沒有影響)相比的效果進行量化。 – keegan 2015-02-06 19:17:03