我有我的featuresets
爲包含在表單元素的字典:如何實現交叉驗證和隨機森林分類定功能集作爲字典?
({0: 0.48447204968944096,
1: 0.035093167701863354,
2: 0.07453416149068323,
3: 0.046583850931677016,
4: 0.0,
5: 0.09316770186335403,
...
162: 1,
163: 1.0}, 'male')
當我嘗試實現從sklearn庫cross_val_score
或cross_val_predict
,它總是會導致顯示一些錯誤說
「浮點值不能是字典「。
可能有人請幫助我實現使用線性SVC和隨機森林分類Python中的交叉驗證?
我曾試圖在此之前:
train_set, test_set = featuresets[1:1628], featuresets[1630:3257]
np.asarray(train_set)
np.asarray(test_set)
clf = SVC(kernel='linear', C=5)
predicted = cross_val_predict(clf, train_set, test_set, cv=10)
metrics.accuracy_score(test_set, predicted)
而且,我沒有得到如何在這裏實現kfold交叉驗證。
轉換您的數據,以numpy的陣列,就是所有 – lejlot
你上面顯示的數據是有兩個元素的元組:第一是快譯通,另一個是字符串。字符串是你想要預測的目標變量。你的'cross_val_predict'的用法也是錯誤的。 –
'featuresets'是什麼類型? – Tonechas