初學者RapidMiner問題在這裏。假設我已經完成了通過例如開發預測kNN模型的工作。交叉驗證,我現在想用這個模型對我所做過的整個數據集(訓練和測試集)進行預測,這是如何完成的?我已經試過如下:在RapidMiner的整個數據集中應用kNN模型
但隨後的每個對象的「標籤」已包含在它自己的最近鄰所以如果k = 1的預測誤差= 0,這顯然是不應該的。
初學者RapidMiner問題在這裏。假設我已經完成了通過例如開發預測kNN模型的工作。交叉驗證,我現在想用這個模型對我所做過的整個數據集(訓練和測試集)進行預測,這是如何完成的?我已經試過如下:在RapidMiner的整個數據集中應用kNN模型
但隨後的每個對象的「標籤」已包含在它自己的最近鄰所以如果k = 1的預測誤差= 0,這顯然是不應該的。
你是對的,將模型應用於它所訓練的相同數據是錯誤的。通常情況下,誰會設置一部分數據用於訓練模型,然後是另一部分(不參與訓練)用於測試。請記住,交叉驗證通常不是培訓的一部分,而是一種確保您的模型穩定並且不會對所呈現的數據進行過度訓練的方法。
我可以推薦看看applying,testing和validating上的RapidMiner教程視頻。
也可隨時在RapidMiner community forum中進一步詢問或重新發布問題。
啊,對不起,如果我把你的問題弄錯了。順便說一句,分享RapidMiner流程的XML文件非常方便。 – David
沒有probs感謝煩擾回答。它有點棘手的問題,因爲kNN是一個特殊的情況下,當涉及到培訓/測試有一個有趣的討論在這裏:https://stackoverflow.com/questions/10814731/knn-training-testing-and-validation – Johan