2017-04-13 45 views

回答

0

您正在使用Java,因此請使用簡單的字符串操作來簡化它。

要刪除拉丁文字母和數字(其中英語使用):

String cleaned = input.replaceAll("[a-zA-Z0-9]", ""); 

的「表情」的定義是鬆散的,但他們也刪除嘗試:

String cleaned = input.replaceAll("[a-zA-Z0-9]|[:;]-?[()ODp]", ""); 
+0

感謝您的答覆,我會試試這個,但是因爲我必須在清理完成之後在訓練數據集上構建分類器,這是從「實例」類型中清除的,我該怎麼做? –