兩個字符串之間的差異(「相對補」),我無法找到一個方法來做到這一點...提取r中
raw_string <- "\"+001\", la bonne surprise de M. Jenn M. Ayache http://goo.gl/3EXxy6 via @MYTF1News"
clean_string <- "+001, la bonne surprise de Jenn Ayache"
desired_string <- "\"\"M. M. http://goo.gl/3EXxy6 via @MYTF1News"
我不知道如何把這種轉變。我會說「差異」(如在集合論中,反對「工會」和「交集」)。更好的名字可以是「相對補充」(http://en.wikipedia.org/wiki/Complement_(set_theory)#Relative_complement)。
我想要的字符串中只有和所有缺少的字符都在clean_string中,按順序排列,每次出現都有一次,包括空格,標點符號和所有內容。
我能夠做到的最好的不夠好:
> a <- paste(Reduce(setdiff, strsplit(c(raw_string, clean_string), split = " ")), collapse = " ")
> a
[1] "\"+001\", M. http://goo.gl/3EXxy6 via @MYTF1News"
謝謝,但我不明白爲什麼它不會與這兩個字符串工作:'raw_string < - 「\」 Tranquille酒店,196個卷宗德détenustrouvés丹斯德拉魯(LES上一個)\」 HTTP: //rue89.nouvelobs.com/2014/09/02/tranquille-196-dossiers-detenus-trouves-rue-les-a-254557 via @ Rue89「'and'clean_string < - 」Tranquille,196 dossiers dedétenustrouvésdans la rue(on les a)「' –
似乎工作它給了'」\「\」http://rue89.nouvelobs.com/2014/09/02/tranquille-196-dossiers-detenus-trouves-ru e -les-a-254557 via @ Rue89「' – konvas
你是對的:我在將函數應用到字符串列時出錯,問題必須出現在我的for循環中!我再次檢查 –