2017-10-29 222 views
0

我有一個數據集,包括7個不同的協變量和輸出變量,'成功率'。 我試圖找到預測成功率的重要因素。我的數據集中的一個協變量是一個分類變量,它需要700個值(0-700),每個值表示它們來自的區域的ID。 在進行邏輯迴歸時,我應該如何處理這個變量? 如果我製作700個虛擬列,我怎樣才能更容易地解釋結果? 我正在使用Python和statsmodels。Logistic迴歸 - 在Python中使用分類變量?

+1

添加數據。我們不需要解釋。我們需要數據。如果不知道數據的外觀如何,我們可以建議什麼? – Dark

回答

1

您可以應用分組,然後對每個組進行邏輯迴歸。或者你把它當作多標籤分類器並做「Softmax迴歸」。