2016-12-23 49 views
0

我發現這裏安靜一些職位提出解決辦法使用awksed,但他們都不似乎做的工作。要麼整條線被刪除,要麼根本沒有被刪除。我也不是命令行wizzard,我的知識有限,所以我決定在這裏尋求幫助。它並不重要的解決方案,無論是awkgrepsed ......老實說,我不能在這種情況下,任何差別,所以這將是任何你覺得它在這種情況下所困擾。如何從包含字符的X個文本文件中刪除字?

我所擁有的是幾個文件以幾百萬行,文件/線是這個樣子:

50somethingcharactergibberish shortrword 
50somethingcharactergibberish shortrword 
50somethingcharactergibberish shortrword 
50somethingcharactergibberish shortrword 
50somethingcharactergibberish shortrword 
50somethingcharactergibberish shortrword 

這也適用於數百萬行。我需要做的,是去除50somethingcharactergibberish,只留下shortword。問題也在於沒有模式,有時候長字有時以字母開頭,有時以數字開頭。所以我認爲我最終必須對角色進行計數。

+0

是否有始終只有兩個文件中的所有行這樣的話? – Inian

+0

謝謝你的回覆。是的,每條線上只有tho字。冷杉和第二個詞之間有一個空格。否則同樣的事情上百萬次。 – mrBlob

回答

0

最起碼awk,可以爲你工作是一樣的東西: -

awk '!($1="")' million-line-file 
+0

非常感謝Inian!這正是我一直在尋找的:)我接受了你的回答,但它沒有標記,因爲我的聲望很低。但正如我所說,這是我尋找的解決方案。再次感謝! – mrBlob

+0

@mrBlob:通過閱讀[什麼意思,當答案是「接受」?](http://stackoverflow.com/help/accepted-answer) – Inian

+1

謝謝伊安,顯然我投票而不是接受它。現在接受! :) – mrBlob

0

AWK是矯枉過正這種嘗試cut

cut -f2 -d ' ' 2col.list > 2ndcol.list 

cut第二場-f2考慮的空間,在輸入文件中的每個行字段分隔符-d ' '和第二場重新定向到輸出文件

相關問題