隨着大數據漸變下降的邏輯迴歸

我有一個約300000個例子和約50-60功能的訓練集，它也是一個多類約7類。我有我的邏輯迴歸函數，用梯度下降找出參數的收斂性。我的梯度下降算法以矩陣形式查找參數，因爲它在矩陣形式中比在循環中單獨和線性地執行更快。例如：矩陣（P）< - 矩陣（P） - LearningRate（T（矩陣（X））*（矩陣（H（X））矩陣（Y）））隨着大數據漸變下降的邏輯迴歸

對於小的訓練數據，這是相當快，並給出正確的值，最大迭代大約爲1000000，但是有了這麼多的訓練數據，速度非常慢，大約500次迭代需要18分鐘，但是梯度下降有很多迭代，成本仍然很高，它不能正確預測課程。

我知道，我應該實現可能的功能選擇或功能縮放，我不能使用提供的軟件包。使用的語言是R.如何在不使用任何庫包的情況下實現功能選擇或縮放。

來源

2016-09-06 Sera_Vinicit

根據link，您可以使用Z分數標準化或最小最大標定方法。兩種方法都將數據縮放到[0,1]範圍。 Z-score normalization作爲

Min-max scaling method計算被計算爲：

來源

2016-12-12 16:12:20

隨着大數據漸變下降的邏輯迴歸

回答

相關問題