file = pd.DataFrame({'name':['s', 'k', 'lo', 'ki'] , 'age':[12, 23, 32, 22], 'marks':[34, 34, 43, 22], 'score':[1, 1, 0, 1]})
我想運行使用下面的命令迴歸:logistic迴歸分析,測試設置和火車站設置
import statsmodels.formula.api as smf
logit = smf.logit('score ~ age + marks', file)
results = logit.fit()
但我得到一個錯誤:
"statsmodels.tools.sm_exceptions.PerfectSeparationError:
Perfect separation detected, results not available".
我會還將數據分成訓練集和測試集,我該如何做?此後我必須使用預測命令。
R中的「glm」命令比Python更容易。