我正在處理大量舊的文本材料。 OCR過程經常會提出「。」總之,例如「t.h.i.s i.s a test」。我想用空白的空格替換這些點「」。但我不想擺脫表示句子結束的點。所以我正在尋找一個尋找字母/點/字母的正則表達式,然後將其替換爲無。R:如何替換字符串中兩個字符之間的點
test <- "t.h.i.s i.s a test."
gsub(test, pattern="\\w[[:punct:]]\\w", replacement="")
不過這是結果
". a test."
任何建議表示讚賞。
這種方法不好:如果有'5.6'會怎麼樣? –
From [here](http://stackoverflow.com/questions/8747671/regex-remove-all-matches-leaving-the-last):'gsub(「[\\。](?!\\ d * $ )「,」「,test,perl = TRUE)'的作品。熟悉正則表達式的人可以解釋爲什麼嗎? (我不能) –