我正在使用37個變量運行迴歸,並且我使用stepAIC
來執行模型選擇。我不想要一個預測模型。我只想找出哪些變數具有最好的解釋力。如何將具體條件添加到stepAIC
我當前的代碼看起來像:
fitObject <- lm(mydata)
DEP.select <- stepAIC(fitObject, direction = 'both', scope= list(lower = ~AUC), trace = F, k = log(obs))
# DEP is my dependent variable, and AUC is an independent variable I was want to have in my model.
的問題是,我的很多變量有較高的相關性,結果stepAIC
給了我一些含有這些高度相關的變量。請注意,我已經在模型中強制AUC,多重共線性是一個問題,特別是當這些變量與AUC高度相關時,在模型中選擇。
有沒有辦法在函數中指定一些相關係數的閾值或p值?
或者其他可以解決我的問題的方法的任何意見都是值得歡迎的。
謝謝!
你甚至沒有在lm中指定一個模型? – rawr
這是爲了迴歸數據框第一個變量上的所有變量。與fitObject < - lm(mydata [,1]〜。,data = mydata)相同' – lareven
我明白,但它很容易出現各種不需要的東西。但要回答你的問題,不,你正在使用AIC作爲模型選擇,所以pvalues是無關緊要的。僅僅因爲一些變量是共線的並不意味着它們是無用的。你的目標是什麼?你是否在尋找預測模型?你是否知道模型中應該包含哪些變量,即使它們的p值不夠「夠好」?這些機械模型選擇算法通常不是很好 – rawr