我想要統計文檔中的行數並按前綴詞對它進行分組。前綴是由第一個下劃線分隔的一組字母數字字符。我不關心排序他們,但很高興列出他們降序出現的次數。計數行和組按前綴詞
文件看起來是這樣的:
prefix1_data1
prefix1_data2_a
differentPrefix_data3
prefix1_data2_b
differentPrefix_data5
prefix2_data4
differentPrefix_data5
輸出應該如下:
prefix1 3
differentPrefix 3
prefix2 1
我已經這樣做在python,但我很好奇,如果有可能做到這一點更有效使用命令行或bash腳本? uniq
命令有-c
和-w
選項,但前綴的長度可能會有所不同。
'cut -d'_'-f1