2016-07-27 60 views
1

libsvm中是否存在可以自動編碼字符串/分類特徵的類。我找到了一個名爲libsvmstringoutcomedatawriter的東西。上面使用哪種類型的編碼?一個熱門的編碼?在libsvm中編碼分類變量

+0

Cleartk libsvm有ibsvmstringoutcomedatawriter類。 –

回答

0

您的功能應如何針對LibSVM進行編碼取決於您在SVM中使用的內核。例如,字符串內核允許您直接使用字符串作爲SVM的功能。 LibSVM FAQ討論了可以與LibSVM一起使用的字符串內核的實現。我也發現了一個string kernel implementation in Python,雖然沒有測試過它。

關於分類特徵,那些特徵可以與LibSVM中可用的標準內核一起使用。編碼分類特徵的典型方法是將它們轉換爲二元特徵,其中每個分類值表示爲特定特徵的值1。例如,對於特徵color={red, green, blue},我們可以具有3個特徵red={0,1},green={0,1},blue={0,1}。然後,諸如高斯/ RBF的內核應該能夠處理數據而沒有問題。

+0

但是,我必須手動執行此編碼嗎?我正在嘗試對POS標籤的功能進行編碼。他們的任何細節? –