2016-12-07 60 views
0

我有一個程序,可以在已知的數據集上完美地工作,如乳腺癌威斯康星州的數據。我創建了一個新的數據集,其中包含100個城市當前的空氣壓力和股票價格的未來走勢。所以大約100個維度加上-1或1的分類器。大約有350個數據實例。該算法顯示大約80%的準確度。KNN只預測一個類。使用Python和sklearn

我的問題是,當我輸入舊數據進行預測時,它只能預測1,而不是-1。當訓練數據包含-1分類器時,情況更是如此。任何想法都非常感謝!

回答

1

KNN對最近的n個鄰居進行投票。所以n = 5你需要3個鄰居投票-1。如果-1很少發生並且-1不聚集在一起,這可能永遠不會。建議您嘗試其他算法。

+0

謝謝,這是有道理的:) –