2017-09-06 89 views
-1

我正在爲相當標準的任務構建ML預測:特徵數量= 30,我必須預測的結果值是介於0和1之間的實數。分析數據後,我發現數據看起來在範圍[0,2.2),[0.2,0.4] ... [0.8,1]中完全不同。我提出了構建5個模型的想法,每個模型都有一個模型,並將它們結合起來以獲得更好的預測結果。爲了檢測使用哪種模型,我將建立另一個模型(可能用NN,SVC或其他)來預測該值的範圍(上述5個範圍),然後相應地應用五個模型中的一個。根據預測值組合機器學習模型

這裏出現兩個問題: 1.有意義嗎?它可以提高預測質量嗎? 2.我不認爲這個想法是獨特的,我是第一個。有人能指點我相同/相似的方法嗎?

+0

是的,我認爲這種方法可以給你一些更好的結果。一種可能的方法是使用kmeans聚類,然後任何好的模型,如神經網絡,樹型模型等 –

回答

-1

當我使用這類數據時,我也面臨同樣的問題.i將0到1之間的所有特徵標準化,並且使用任何模型進行標準化,您將獲得良好的分類。

+0

謝謝,但這不是關於這一點。我想爲不同的範圍建立不同的模型,因爲它們看起來很不相同 – Vitaliy