2016-03-02 57 views
0

當我在某些文字中刮過「Ã」後,會在文字中的某些詞語和數字後加上。要刪除不需要的「Ã」,我做了幾個gsub。如何從R中的文本中刪除「Ã」?

text <- gsub("Ã", " ", text) 
text <- gsub("Â", " ", text) 
text <- gsub(",", "", text) 
text <- gsub(" ", " ", text) 

這在除去特殊字符A的工作,但逗號不會被取出。

gsubs之前的文字看起來像什麼。

ALBANY OFF REBOUND BY #43 STIRE  #43 STIRE is not commented out 

gsubs後面是什麼文字。

ALBANY ‚ OFF ‚ REBOUND BY #43 ‚ STIRE  #43 ‚ STIRE is not commented out 

我想文什麼的樣子:

ALBANY OFF REBOUND BY #43 STIRE     #43 STIRE is not commented out 

任何幫助將不勝感激。請讓我知道是否需要更多信息。

+0

只需要在1'gsub()':'gsub(「Ã」,「」「,」ALBANYÃOFF OFF, REBOUND BY「)中做到這一點' – MrFlick

+3

取而代之,你有沒有考慮過你你的代碼中有一些編碼錯誤? –

回答

1

你可以使用library(stringr)

text <- "ALBANYÃ, OFFÃ, REBOUND BY" 

library(stringr) 
str_replace_all(text, "Ã,Â", "") 
#> [1] "ALBANY OFF REBOUND BY" 

gsub

gsub("Ã,Â","",text) 
#> [1] "ALBANY OFF REBOUND BY" 

不過,我認爲這是擺在首位的編碼問題。 此外gsubstr_replace_all的結果可能與編碼不同,這可能是爲什麼您的text <- gsub(",", "", text)不起作用。

您可以使用Encoding來檢查編碼。