隨着eli5庫(免責聲明:我是作者之一),你可以做這樣的:
# the original example:
from sklearn.feature_selection import SelectKBest, f_regression
from sklearn import svm
from sklearn.datasets import make_classification
from sklearn.pipeline import make_pipeline
import pandas as pd
X, y = make_classification(n_features=5, n_informative=5, n_redundant=0)
df_train = pd.DataFrame(X, columns=['A', 'B', 'C', 'D', 'E'])
df_train_y = pd.DataFrame(y)
anova_filter = SelectKBest(f_regression, k=3)
clf = svm.SVC(kernel='linear')
anova_svm = make_pipeline(anova_filter, clf)
f_reg_features = anova_svm.fit(df_train, df_train_y)
然後:
import eli5
feat_names = eli5.transform_feature_names(anova_filter, list(df.columns))
它的工作原理類似於維韋克方式庫馬爾的建議;優點是統一的API - 不需要記住每個變壓器的這些片段。
如果您要更換SVC與sklearn.linear_model.LinearSVM(應該也快得多)(內核=「線性」),你可以這樣做:
eli5.show_weights(anova_svm, feature_names=list(df.columns))
,並得到像這樣的表:
所以,你想要從SelectKBest中選擇的特性傳遞到svm上嗎? –
正確,但我一直無法獲得其他方法的工作。 – dasvootz
'df_train.columns [anova_svm.steps [0] [1] .get_support()]' –