2012-10-31 61 views
1

我有三個與特定文件關聯的值。每個文件都屬於特定的家庭。我需要改進Weka的「交叉驗證」,以瞭解這三個值是否能夠識別家庭。現在哪些步驟可以創建我必須在Weka上打開的Csv或Arff文件?我的txt有這種格式。Weka文件「交叉驗證」

File_Family_1值1,值,值3

File_Family_1值1,值,值3

File_Family_2值1,值,值3

File_Family_2值1,值,值3

File_Family_3值1,值2,值3

File_Family_3值1,值2,值3

回答

1

我用Excel解決了這個問題。在第一行中,您必須編寫標籤,但所有標籤均以逗號分隔。

Family, Attribute1, Attribute2, Attribute3 

在其他行中,總是位於第一列並以逗號分隔,因此必須編寫標籤值。

File_Family1, Value1, Value2, Value3 
File_Family2, Value1, Value2, Value3 
File_Family3, Value1, Value2, Value3 
...... 

保存爲「.Csv」後,不用擔心Excel的警報。打開Weka並點擊資源管理器。所以使用「打開文件」並選擇剛剛創建的Cvs,一旦打開進入Classify。最後點擊「選擇」使用特定的樹。如果啓動按鈕被禁用,則需要選擇「(Nom)」屬性來執行「交叉驗證」。