有沒有辦法檢索用於訓練分類器的特徵名稱列表,一旦已經使用fit
方法進行了訓練?我希望在應用不可見的數據之前獲取這些信息。 用於訓練的數據是熊貓DataFrame
,在我的情況下,分類器是RandomForestClassifier
。從分類器中檢索訓練特徵名稱列表
0
A
回答
1
根據文檔和以前的經驗,無法獲得至少在其中一個拆分處考慮的功能列表。
您是否擔心您不希望將所有功能用於預測,而只是實際用於培訓的功能?在這種情況下,我建議在擬合後列出feature_importances_
,並消除看似不相關的功能。然後訓練一個只有相關特徵的新模型,並將這些特徵用於預測。
1
您不需要知道爲培訓選擇了哪些功能。在預測步驟中,請確保在學習階段期間使用相同功能。
隨機森林分類器將只使用它進行拆分的功能。這些將與第一階段學到的相同。其他人不會考慮。
如果形狀您測試數據的是不一樣的訓練數據它會拋出一個錯誤,即使測試數據包含用於您決策樹的分裂的所有功能。
因爲隨機森林做出的特點隨機選擇的決策樹(稱爲estimators
在sklearn
)的所有功能很可能是至少使用一次更重要的是,。
然而,如果你想知道使用的功能,你可以調用屬性n_features_
和feature_importances_
您分類一次安裝。
你可以看看here看看你如何檢索你使用的最重要的功能的名稱。
相關問題
- 1. 如何獲得經過訓練的LDA分類器的特徵權重
- 2. 連接SURF特徵和氡特徵來訓練SVM
- 3. 機器學習 - 特徵選擇和訓練數據
- 4. Haar級聯分類器訓練問題
- 5. Tensorflow線性分類器未訓練
- 6. nltk貝葉斯分類器訓練
- 7. 如何增量訓練nltk分類器
- 8. Accord.NET:如何訓練Boost分類器
- 9. 如何使用附加的分類/數字特徵來訓練CNN模型?
- 10. 訓練分類模型Opennlp
- 11. Tensorflow分類圖像訓練
- 12. 如何使用列表功能列表來訓練分類器Python
- 13. 預分類訓練的推特評論分類
- 14. 分類特徵
- 15. 在SQLite中檢索表列名稱
- 16. 適合後檢索訓練數據
- 17. 從數據庫表中檢索主鍵,標識列和特定名稱列
- 18. Tensorflow python分類訓練與子類別
- 19. SQLite - 從表中檢索一組名稱
- 20. 用於二進制分類的訓練多級分類器
- 21. Python中特定類名稱的列表
- 22. 特徵與Keras預先訓練CNN模型
- 23. 使用Opencv的特徵臉的訓練時間C++
- 24. 特徵臉方法是否使用無監督訓練
- 25. 特徵向量:訓練對測試集的權重計算
- 26. IBM Watson檢索和排名:Ranker訓練失敗
- 27. 如何使用PoS標籤作爲Naive Bayes分類器訓練數據的特徵?
- 28. 如何使用具有不同特徵維度的數據集來訓練sklearn分類器?
- 29. 在MYSQL結果中從表中檢索父類別名稱
- 30. 從列表中刪除特定名稱
您建議的解決方案只返回功能的數量而不返回它們的名稱。我知道在預測階段,不需要提供名稱,但只需提供相同的功能。但是,就我而言,我並不知道培訓中選擇的功能是什麼(如果這一點很重要的話,還有專欄順序)。 – user6903745
@ user6903745:您爲什麼想知道選擇用於培訓的功能? – MMF
我正在創建一個函數,它將一個分類器作爲參數。爲了不硬編碼我先前可能不知道的變量列表,或避免輸入錯誤或只是輸入無窮無盡的變量列表,最好將它存儲在分類器本身中。 – user6903745