0
我有csv文件,有近300k條記錄。它看起來像這樣如何從文件檢索特定限制數據
Id, Name, City
1 Alex New York
2 Alex Florida
3 John New York
...
300k Alex New York
那麼,我需要解析它,並創建2個單獨的文件與500個最頻繁的列(名稱和城市)。例如,在300K記錄,我有20K克斯(名稱),1K約翰(名稱),25K弗雷德(名稱),並單獨的CSV文件,遞減
Id, Name
1. Fred
2. Alex
3. John
同樣的500名最常見的名字與城市 如何做到最好?
你必須使用地圖值,並不斷更新與計數地圖發生,然後在那之後根據比較結果 –