from sklearn.preprocessing import LabelEncoder as LE, OneHotEncoder as OHE
import numpy as np
a = np.array([[0,1,100],[1,2,200],[2,3,400]])
oh = OHE(categorical_features=[0,1])
a = oh.fit_transform(a).toarray()
讓我們假設第一列和第二列是分類數據。此代碼執行一個熱門編碼,但對於迴歸問題,我想在編碼分類數據後刪除第一列。在這個例子中,有兩個,我可以手動完成。但是如果你有很多明確的特徵,你會如何解決這個問題呢?使用sklearn的OneHotEncoder去除色譜柱
是的,這會消除第一個分類集的第一列。但是如果我有1000個類別,並且我需要在一個熱門編碼之後刪除每個第一列? – Makaroniiii
這個概念仍然是一樣的,你可以像這樣擴展到第三個維度:'a [:,:,1:]' –
再次抱歉,但是我收到這個錯誤:builtins.IndexError:數組索引太多 – Makaroniiii