我有兩個CSV文件計數模式
文件
ID
1
2
3
文件B
ID
1
1
1
1
3
2
3
我想要做的是算文件A中的ID出現在文件B中多少次,然後將結果保存在新的文件C中(格式爲csv)。例如,1文件所以在新文件中的C顯示了在文件B. 4次,我應該有類似
File C
ID,Count
1,4
2,1
3,2
本來我想用的「grep -f」,但現在看來似乎只適用於.txt格式。不幸的是,文件A和B都是csv格式。所以現在,我想也許我可以使用for循環來單獨獲取文件A中的ID,並使用grep -c來計算它們中的每一個。任何想法都會有所幫助。
在此先感謝!
優秀的答案!它做了這項工作。但是想知道{freq [$ 1] ++}中的$ 1是做什麼的?特別是什麼?這是一個列表或什麼? –
'a'是一個關聯數組,它由'fileA'中的'id'填充。然後,'1中的$ 1檢查數組'a'中是否存在'fileB'中的'$ 1'。如果它確實存在,那麼填充並增加另一個數組'freq' – anubhava
,這樣它們就是自定義數組。非常感謝! –