我有幾個文本文件,有很多文本之間的換行,我想正常化,但沒有模式例如達到文本之間的新行: Text
Some text
More text
More
more
所以我想改變其中換行的數量大於X到Y,所以我們可以說,當有5個連續的換行符時,它變成了2,10它變成了3. 我目前的問題是我不知道應該如何去確定哪條線將不得不正常化。 我知道我可以指望採用分體式的
我正在使用Ruby的StringScanner來標準化一些英文文本。 def normalize text
s = ''
ss = StringScanner.new text
while ! ss.eos? do
s += ' ' if ss.scan(/\s+/) # mutiple whitespace => single space