2016-09-30 61 views

回答

2

在預處理(CsvFeatures),使用:

features.categorical(「passenger_count」)

也可以通過在一個頻率閾值,以避免在發生過少一個熱編碼值數據。

4

請注意,您需要多一點選擇您想要的表示方式 - k(或單熱)或稀疏表示之一。

features.categorical('passenger_count').one_of_k() 

側面說明,你可能也有興趣在數值列,並應用日誌通過裝桶或離散(常常是數量型的特徵時有用)的能力。

相關問題