如何從包含字符的X個文本文件中刪除字？

我發現這裏安靜一些職位提出解決辦法使用awk和sed，但他們都不似乎做的工作。要麼整條線被刪除，要麼根本沒有被刪除。我也不是命令行wizzard，我的知識有限，所以我決定在這裏尋求幫助。它並不重要的解決方案，無論是awk，grep，sed ......老實說，我不能在這種情況下，任何差別，所以這將是任何你覺得它在這種情況下所困擾。如何從包含字符的X個文本文件中刪除字？

我所擁有的是幾個文件以幾百萬行，文件/線是這個樣子：

50somethingcharactergibberish shortrword 
50somethingcharactergibberish shortrword 
50somethingcharactergibberish shortrword 
50somethingcharactergibberish shortrword 
50somethingcharactergibberish shortrword 
50somethingcharactergibberish shortrword

這也適用於數百萬行。我需要做的，是去除50somethingcharactergibberish，只留下shortword。問題也在於沒有模式，有時候長字有時以字母開頭，有時以數字開頭。所以我認爲我最終必須對角色進行計數。

來源

2016-12-23 mrBlob

是否有始終只有兩個文件中的所有行這樣的話？ – Inian

謝謝你的回覆。是的，每條線上只有tho字。冷杉和第二個詞之間有一個空格。否則同樣的事情上百萬次。 – mrBlob

最起碼awk，可以爲你工作是一樣的東西： -

awk '!($1="")' million-line-file

來源

2016-12-23 17:13:58 Inian

非常感謝Inian！這正是我一直在尋找的:)我接受了你的回答，但它沒有標記，因爲我的聲望很低。但正如我所說，這是我尋找的解決方案。再次感謝！ – mrBlob

@mrBlob：通過閱讀[什麼意思，當答案是「接受」？]（http://stackoverflow.com/help/accepted-answer） – Inian

謝謝伊安，顯然我投票而不是接受它。現在接受！ :) – mrBlob

AWK是矯枉過正這種嘗試cut

cut -f2 -d ' ' 2col.list > 2ndcol.list

說cut第二場-f2考慮的空間，在輸入文件中的每個行字段分隔符-d ' '和第二場重新定向到輸出文件

來源

2016-12-24 02:50:04 tomc

如何從包含字符的X個文本文件中刪除字？

回答

相關問題