我有一個帶有製表符分隔的大量數據的文本文件。我想查看數據,以便我可以在列中看到唯一值。例如,如何統計製表符分隔文本文件中字段唯一值的數量?
Red Ball 1 Sold
Blue Bat 5 OnSale
...............
所以,它就像第一列的顏色,所以我想知道有多少不同的唯一值在該列在那裏,我希望能夠做到這一點的每一列。
我需要在Linux命令行中這樣做,所以可能使用一些bash腳本,sed,awk或其他東西。
附錄:感謝大家的幫助,我可以再問一件事嗎?如果我想要計算這些獨特的值,該怎麼辦?
我想我沒有把第二部分清楚。我想要做的是計算這些獨特值的「每個」不知道有多少獨特值。例如,在第一列中,我想知道有多少個紅色,藍色,綠色等有色物體。
'uniq -c'每個項目的計數。 – 2010-08-17 13:15:53
@丹尼斯謝謝,這是我需要的。我真的很喜歡Linux命令行的強大而簡單。需要開始正確學習:)。 – sfactor 2010-08-17 13:38:02