2017-05-30 95 views

回答

3

使用正則表達式來刪除不需要的字符,例如:

dataset$textcolumn <- gsub("[^\\w\\s]", "", dataset$textcolumn, perl=TRUE) 

去除除了字字符和空格一切。要做更復雜的替換,請查看幫助主題?regexp

也看看編碼(Encodingiconv在這裏很有幫助。),也許文本是正確的,但假定錯誤的編碼。