2014-12-02 157 views
2

我有一個包含約1000個特徵和約30,000行的數據集。大部分數據是0。我目前將這些信息存儲在一個稀疏矩陣中。現在我想要做的是執行列明智邏輯迴歸 - 每個功能與因變量。R - Logistic迴歸 - 稀疏矩陣

我的問題是你如何對稀疏矩陣進行邏輯迴歸。我偶然發現了glmnet包,但那需要最少2列。這裏是一些示例代碼

require(glmnet) 
x = matrix(rnorm(100*1),100,1) 
y = rnorm(100) 
glmnet(x,y) 

這給了我一個錯誤。我想知道是否有其他任何我可能錯過的套餐?

任何幫助將不勝感激。謝謝全部

+0

爲什麼不使用'lappy'?會有用嗎? – LyzandeR 2014-12-02 15:30:03

+0

我想我的問題不清楚。我已經重述了它。對於混淆的道歉 – Abhi 2014-12-02 18:58:03

+0

它可能發生在sparse.model.matrix中,但我不知道這是否是您要查找的內容。 – LyzandeR 2014-12-02 22:36:50

回答

1

這是比解決方案更多的解決方法。您可以添加一列(1)(cbind(1, x))到一列矩陣。這個新列將用於估計截距。因此,您必須使用參數intercept = FALSE

glmnet(cbind(1, x), y, intercept = FALSE)