2016-12-16 79 views
0

我有這樣一個數據集獨立變量預測和分類設定值:通過使用Python

y1 | y2 | y3 | x1 | x2 | x3 | x4 | ..... xn| 
1 | 0 | 0 | 1 | 1 | 0 | 1 | ..... 1 | 
1 | 0 | 1 | 1 | 0 | 0 | 0 | ..... 0 | 
1 | 1 | 0 | 0 | 1 | 1 | 1 | ..... 0 | 

使用上面的數據,我有自變量X1,X2 ... Xn和因變量Y1, y2,y3。我想運行一些(機器學習)算法,它不僅可以對一個因變量進行分類,還可以對一組因變量進行分類。一種方法是逐個爲每個因變量學習模型,但這可能太耗時,因爲最初我有超過50個因變量。有沒有關於該算法的任何建議,可以以更快的速度爲我做到這一點?謝謝。

回答

1

從官方scikit-learn documentation

多輸出分類支持可被添加到 MultiOutputClassifier任何分類。該策略包括爲每個目標擬合一個 分類器。這允許多個目標變量 分類。此類的目的是將估計量擴展到 能夠估計在單個X預測器矩陣上訓練的一系列目標函數(f1,f2,f3 ...,fn),以預測一系列的 響應( Y1,Y2,Y3,...,YN)。

因此,你可以使用這個幻想圖書館來爲你做工作:)