我發現這裏安靜一些職位提出解決辦法使用awk
和sed
,但他們都不似乎做的工作。要麼整條線被刪除,要麼根本沒有被刪除。我也不是命令行wizzard,我的知識有限,所以我決定在這裏尋求幫助。它並不重要的解決方案,無論是awk
,grep
,sed
......老實說,我不能在這種情況下,任何差別,所以這將是任何你覺得它在這種情況下所困擾。如何從包含字符的X個文本文件中刪除字?
我所擁有的是幾個文件以幾百萬行,文件/線是這個樣子:
50somethingcharactergibberish shortrword
50somethingcharactergibberish shortrword
50somethingcharactergibberish shortrword
50somethingcharactergibberish shortrword
50somethingcharactergibberish shortrword
50somethingcharactergibberish shortrword
這也適用於數百萬行。我需要做的,是去除50somethingcharactergibberish,只留下shortword。問題也在於沒有模式,有時候長字有時以字母開頭,有時以數字開頭。所以我認爲我最終必須對角色進行計數。
是否有始終只有兩個文件中的所有行這樣的話? – Inian
謝謝你的回覆。是的,每條線上只有tho字。冷杉和第二個詞之間有一個空格。否則同樣的事情上百萬次。 – mrBlob