2016-09-06 92 views
0

我有一個約300000個例子和約50-60功能的訓練集,它也是一個多類約7類。我有我的邏輯迴歸函數,用梯度下降找出參數的收斂性。我的梯度下降算法以矩陣形式查找參數,因爲它在矩陣形式中比在循環中單獨和線性地執行更快。 例如: 矩陣(P)< - 矩陣(P) - LearningRate(T(矩陣(X))*(矩陣(H(X))矩陣(Y)))隨着大數據漸變下降的邏輯迴歸

對於小的訓練數據,這是相當快,並給出正確的值,最大迭代大約爲1000000,但是有了這麼多的訓練數據,速度非常慢,大約500次迭代需要18分鐘,但是梯度下降有很多迭代,成本仍然很高,它不能正確預測課程。

我知道,我應該實現可能的功能選擇或功能縮放,我不能使用提供的軟件包。使用的語言是R.如何在不使用任何庫包的情況下實現功能選擇或縮放。

回答