我有一個非常大的csv文件,該文件太大而無法在此操作的Excel中打開。使用另一個csv文件在csv文件中查找和替換多個模式
我需要更換特定字符串爲約6000記錄了在CSV的1.5mil的,字符串本身是像這樣的逗號分隔格式:
ABC,FOO.BAR,123456
兩邊有其他列那沒有關係。我只需要足夠的數據來確保最終的數據字符串(數字)是唯一的。
我與串另一個文件替換和替換字符串等(上述):
"ABC,FOO.BAR,123456","ABC,FOO.BAR,654321"
因此,在上述情況下123456是由654321替換一個簡單的(但令人極其慢)方法是在記事本++中打開兩個文檔,然後找到第一個字符串,然後用第二個字符串替換,但是有超過6000個記錄,這不是很好。
我希望有人可以提供腳本解決方案的建議?例如:
$file1 = base.csv
$file2 = replace.csv
For each row in $file2 {
awk '{sub(/$file2($firstcolumn)/,$file2($Secondcolumn)' $file1
}
雖然我不是完全確定如何適應AWK做這樣的操作..
編輯:對不起,我本來應該更具體,在我更換CSV數據只有兩個列;兩個原始字符串!
剩下的問題:做'ABC,FOO.BAR,123456'在_data_文件('base.csv')表示_3_場抑或是被封閉在一個'場_single_的內容「......」 _在文件_中? – mklement0