我在試圖讓一個看似簡單的事情完成的過程中陷入困境。我有一個文件和一個換行符分隔的字符串列表。將文件與變量列表進行比較AWK
文件:
DAT1 LOC1
DAT2 LOC1
DAT3 LOC1
DAT4中Loc2
DAT5中Loc2
我的列表是這樣的:
DAT1
DAT2
DAT3
DAT4
我所試圖做的是列表中的數據文件進行比較並計算出現的唯一Loc的數量。我只對最大的數字感興趣。在上面的例子中,列表進行比較,以該文件的情況下,我想主要爲:
DAT1 MATCHED Loc1Count = 1
DAT2 MATCHED Loc1Count = 2
DAT3 MATCHED Loc1Count = 3
Dat4 MATCHED Loc2Count = 1
Return:Loc1 if Loc1Count /名單> 50%
現在的長度,
我知道AWK 1文件將逐行讀取一個文件行。此外,我知道「echo」$ LIST「| awk'/搜索包含這個/的行」將返回與該內部字符串匹配的行。我還沒有能夠成功地將這些想法作爲嵌套的awk結合起來,更不用說如何計算「loc1」與「loc2」(順便說一句,這將是隨機字符串,而不是形式標準)
我覺得這很簡單,但我把頭撞在牆上。有任何想法嗎?這是否足夠清楚?
你正在尋找被稱爲關聯數組(如** ghostdog74的**回答所示)的功能。 – 2010-01-18 23:50:50