我正在使用Weka gui在數據集上訓練SVM分類器(使用libSVM)。在.arff文件中的數據是使用Weka預測測試數據集中的文本數據標籤?
@relation Expandtext
@attribute message string
@attribute Class {positive, negative, objective}
@data
我把它變成文字的袋字符串到字向量,運行SVM和得到一個體面的分類率。現在我有我的測試數據,我想預測他們的標籤,但我不知道。再次它的報頭信息是相同的,但對每個類別它標記有一個問號(?),即
'Musical awareness: Great Big Beautiful Tomorrow has an ending\u002c Now is the time does not', ?
再次我預先進行處理,字符串到字向量,類是在相同的位置作爲訓練數據。
我進入「分類」菜單,加載我的訓練SVM模型,選擇「提供的測試數據」,加載測試數據,右鍵單擊「重新評估當前測試集上的模型」的模型,但是它給了我測試和訓練不兼容的錯誤。我不知道爲什麼。
我該怎麼辦這個錯誤的方式來標記測試數據?我究竟做錯了什麼?