我試圖在河中刪除特定的多字節字符正則表達式刪除特定的多字節字符中的R
Multibyte <- "Sungpil_한성필_韓盛弼_Han"
的Multibyte
的語言結構「English_Korean_Chinese_English」我想刪除的是隻有韓語單詞或中文單詞(不是兩個)。
,期望的結果可以是:
Sungpil_한성필__Han # Chinese characters were removed.
或
Sungpil__韓盛弼_Han # Korean characters were removed.
有一個簡單的方法,通過使用gsub
辦呢?我只知道一種獲取純英文字符的方法。
gsub("[^A-Za-z_]", "", Multibyte)
[1] "Sungpil___Han"
你想刪除/保留哪些字符? –
正則表達式處理字符,而不是字節。你有沒有嘗試過使用你需要的實際角色? –
@TimBiegeleisen我指定了問題。謝謝。 –