2017-02-23 39 views
0

無論如何,我可以使用10倍交叉驗證將文本分類後的預測結果發回原始評論嗎?如何鏈接10-fcv weka預測結果返回文本分類的原始評論

從類非國資委和國資委的意見2000結果:

inst#,actual,predicted,error,prediction 
1,2:non-sarc,2:non-sarc,,1 
2,2:non-sarc,1:sarc,+,1 
3,2:non-sarc,2:non-sarc,,1 
4,2:non-sarc,2:non-sarc,,1 
5,2:non-sarc,2:non-sarc,,1 
. 
. 
101,1:sarc,1:sarc,,1 
102,1:sarc,2:non-sarc,+,1 
103,1:sarc,1:sarc,,1 
104,1:sarc,1:sarc,,1 
105,1:sarc,1:sarc,,1 
. 
. 

它看起來像秧雞已經重新安排我上課分裂評論抱出用於訓練和測試之前。我怎樣才能將這個結果引用到原始評論中,而這些評論不是按照順序排列的(不像10-fcv之後)?我嘗試重新安排非sarc和sarc的課程順序的評論,但是我首先混淆了哪一種測試/培訓,首先是第一次摺疊測試,還是先進行摺疊測試,還是其他任何測試?

在此先感謝。

回答

0

由於沒有人回答我的問題,我想我自己,希望這將有助於其他人,如果面臨同樣的問題。

  1. In Preprocess;過濾器>無監督;將屬性添加到第一個位置。這將使ID爲每個原始標籤的[IDIndex:首先]

1.Add IDIndex

  • 在分類;選擇分類器。對於測試選項,組10-FCV,並在更選項,設置屬性爲1,並選擇用於鏈路和輸出格式預測結果[屬性:1]
  • 2.Attribute and Output

  • 開始/運行預測。輸出顯示實際的標籤和預測。錯誤是用+標記,ID在預測之前指的是原始標籤。
  • 3.Output

    所有最優秀的!