2014-11-02 81 views
1

我已經使用了Weka的LibSVM包裝併成功地爲新聞分類(體育和商業)構建了一個分類器。我使用交叉驗證方法對其進行了評估,並且接受了準確性。所以現在我需要使用模型來分類新的新聞報道。在將它提供給分類器之前,我需要使用weka中的StringToWordVector過濾器將其轉移到特徵向量。我需要如何使用我用於訓練數據的相同過濾器。我怎樣才能做到這一點?如何使用相同的StringToWordVector過濾器來訓練數據和看不見的數據

回答

1

我們可以使用批量過濾選項,如下,

StringToWordVector filter = new StringToWordVector(); //initialise the filter 
//set filter options 
filter.setInputFormat(trainingData); //set input format to filter using training data 
Instances trainingDataFiltered = Filter.useFilter(trainingData, filter); // filter training data 
Instances testDataFiltered = Filter.useFilter(trainingData, filter); // filter test data 
相關問題