2017-10-19 98 views
0

我正在研究分類問題,在Python中使用邏輯迴歸模型(scikit learn)。我的特點之一是性別。在原始數據集中,這個變量是一個字符串(男,女)。我使用了熊貓的get_dummies方法,並創建了2個具有0,1值的列。每個班級一個。2個類別的虛擬變量。它應該是單列還是多列?

我的問題是,我應該使用2個不同的列,還是像男性(0,1)這樣的單個列?

回答

相關問題