2
我使用銀行數據來預測每天的票數。我正在使用堆棧來獲得更準確的結果,並使用庫。蟒蛇 - 堆疊分類器:適合數據時的IndexError
以下是重要特徵的樣本數據集:
[] 這裏是目標屬性樣品:
[]
這裏是代碼:
from stacked_generalization.lib.stacking import StackedClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.linear_model import LogisticRegression, RidgeClassifier
# Stage 1 model
bclf = LogisticRegression(random_state=1)
# Stage 0 models
clfs = [RandomForestClassifier(n_estimators=40, criterion = 'gini', random_state=1),
gbm,
RidgeClassifier(random_state=1)]
sl = StackedClassifier(bclf, clfs)
sl.fit(training.select_columns(features).to_dataframe().as_matrix(), np.array(training['class']))
這裏是訓練數據格式:
[[ 21 11 2014 46 4 3]
[ 22 11 2014 46 5 4]
[ 24 11 2014 47 0 4]
...,
[ 30 9 2016 39 4 5]
[ 3 10 2016 40 0 1]
[ 4 10 2016 40 1 1]]
不過,我比較我與庫中給出的示例代碼,但還是無法弄清楚我在哪裏我錯了。請幫助我。
什麼是培訓對象的格式? – Prophecies
更新了我的答案,首先它是在sframe中,然後我將它轉換爲numpy nd數組 – user1584253
錯誤與數組索引有關。 c.classes_是嵌套列表或除整數或布爾值之外的列表。他們有沒有機會? – Benjamin