2017-10-20 78 views
0

我有一個ML語言識別項目(Python),需要具有高維特徵輸入的多類分類模型。機器學習,特徵工程和呈現模型的常用技術是什麼?

目前,我所能做的所有改善準確性的方法都是通過追蹤和錯誤。無意識地將可用的特徵提取算法和可用的ML模型相結合,看看我是否幸運。

我在問是否有一個普遍接受的工作流程系統地查找ML解決方案。

這個想法可能是天真的,但我想如果我能以某種方式想象這些高維數據和我的模型的決策邊界。希望這個可視化可以幫助我做一些調整。在MATLAB中,經過訓練後,我可以在所有特徵中選擇任意兩個特徵,MATLAB將相應地給出一個決策邊界。我可以用Python做到這一點嗎?

此外,我正在尋找一些類型的圖表,我可以在演示文稿中使用它來介紹我的模型和功能。該領域使用的最常見的圖表是什麼?

謝謝

+2

「我在問是否有一個通用工作流程可以系統地查找ML解決方案「。不,沒有。如果有的話,你可以被程序取代。也許不久的一天,但還沒有。 –

+0

自動化自動化,但我同意@ juanpa.arrivillaga它取決於你的問題。深度學習的全部目標是特徵提取的自動化,並且某些超參數調整庫不僅使用網格搜索,而且還作爲優化問題處理,您可以說有一種自動化方法。但是,您的問題旨在對高維數據進行可視化。有許多降維技術可映射高維數據,例如T-SNE。 – Zephro

+0

@Zephro如何繪製尺寸縮小數據的決策邊界?我應該根據尺寸縮小的數據來訓練分類器嗎? –

回答

1

特徵工程更多的是藝術而不是技術。這可能需要領域知識,或者您可以嘗試添加,減去,劃分和乘以不同的列以使特徵不在其中,並檢查它是否爲模型增加了值。如果您正在使用線性迴歸,那麼調整的R平方值必須增加或在樹模型中,您可以看到該特徵的重要性等。