2016-08-24 150 views
0

我正在努力尋找兩個概念之間的差異。從我的理解都指的是將原始數據轉換爲更全面的功能來描述手頭的問題。它們是一樣的嗎?如果沒有人可以提供兩個例子嗎?當原始數據是非常不同的特徵工程和特徵提取有什麼區別?

+0

這些術語通常是同義詞。特徵工程和特徵選擇(構建幫助機器學習方法學習的高級統計模式與刪除一些不太有用的特徵)之間更有用的差異化。我在這裏寫了一篇關於這個主題的入門書:https://www.featurelabs.com/blog/feature-engineering-vs-feature-selection/ – bschreck

回答

8
  1. 特徵提取通常使用。特別是當你不能使用原始數據時

    E.g.原始數據是圖像。您可以提取紅色值或圖像中對象形狀的描述。這是有損的,但至少你現在得到了一些結果。

  2. 特點工程是小心預處理成更有意義的功能,即使如果您也可以使用舊數據

    E.g.而不是使用變量x,y,z您決定使用log(x)-sqrt(y)* z代替,因爲您的工程知識告訴您,此派生數量對解決您的問題更有意義。你會得到比沒有更好的結果。

0

特點工程 - 是將原始數據轉變的特徵/屬性,更好地代表你的數據,通常由領域專家來完成的底層結構。

特徵提取 - 正在將原始數據轉換爲所需的形式。