我想要清理文件中的文本的最佳方式。所以我想要做的是,給定一個輸入文件,匹配相似的單詞並替換它們。因此,如果蘋果和ApPle在文件中,ApPle將被蘋果取代。有沒有辦法清理文本文件(擺脫類似的話)? (不使用嵌套for循環)
有沒有辦法做到這一點不使用兩個像這樣的循環:我總是猶豫不決,嵌套的for循環,所以我只是想知道如果有一個更優雅的解決方案使用
for $word in @file
for $word2 in @file
if $word matches $word2
replace $word2 with $word
end
end
end
。另外,如果你想知道爲什麼它是僞代碼,那是因爲我還沒決定編寫這個程序。 (對於那些不知道@file的人是一個單詞列表,$ word是一個非空白字符串)。
哪裏的正則表達式來發揮作用? – krlmlr 2012-02-02 23:15:32
@ user946850將「匹配」替換爲我決定使用的任何正則表達式。我並不擔心我希望它如何匹配以及如何迭代數據。 – varatis 2012-02-02 23:21:17
使用正則表達式對您的示例中的兩個單詞執行一些「查找」或「替換」操作嗎?這可以作爲一個非單射散列函數肯定:-) – krlmlr 2012-02-02 23:27:03