2015-05-09 89 views
0

如何僅對其中包含單詞的行進行數字計數?在下面的例子中,我有4行字在其中:只計算包含單詞的行

100314:Status name one: 15 
24 1 7 5 43 13 24 64 10 47 31 100 22 20 38 63 49 24 18 82 66 22 21 77 52 8 6 11 50 20 5 1 0 
101245:Status name two: 14 
2 10 2 2 25 53 3 31 30 1 21 41 9 14 18 40 6 10 18 72 20 16 33 29 19 18 12 60 48 12 8 50 43 13 
103765:Yet another name here: 29 
45 29 29 475 63 69 47 94 65 65 69 55 53 905 117 57 42 92 90 59 91 52 79 101 192 87 144 74 115 82 78 109 12 96 64 78 111 106 84 19 0 7 
102983:Blah blah yada yada: 82 
41 37 40 60 82 72 17 41 17 19 43 3 

我已經採用的wc -lgrep/uniq不同管的組合試過。我也試着只計算奇數行(在MWE中工作),但我正在尋找一些更通用的用於大型非結構化數據集的東西。

回答

1

這取決於你如何定義一個詞。如果,例如,它的任何兩個連續的字母,你可以使用類似:

grep -E '[a-zA-z]{2}' fileName | wc -l 

可以取決於你如何定義一個字(即一個我提供不會挑簡單的調整正則表達式例如「A」或「I」或「I'm」),但概念將保持不變

+0

我無法關閉您的「 - l」而不是「-l」之間的距離...你能否在你的文章中解決這個問題?我不能自己做這個編輯,因爲它太少字符:) – warship

+0

感謝你,@軍艦,現在修復。 – paxdiablo