我有一個文件(文件大小很大),其中包含行,每行都有一些以逗號分隔的字段。使用awk實用程序實現的場景
從這個文件中,我必須提取幾個字段並將它們轉儲到一個新行。但這裏的複雜性在於,最後一個字段(列)本身包含逗號,但該特定字段由雙引號「some,thing」(可以說)標識。
讓我舉一個例子: -
the, quick, brown, fox, jumps, right, over, the little, "lazy,dog"
有很多這樣的線路在此文件,該文件是逗號分隔的。
有可能是最後一列中的許多逗號,
現在我需要提取一些列出來,對於這最後一個肯定是我想提取。
我想過使用awk,但看起來awk並沒有限制跨越分隔符的分割。
python有一個split()函數,我們可以限制no。的分裂和字符串進入最後的索引。 ['the','quick','brown','fox','jumps','right','over','little','lazy,dog']。
此外,雙引號應從最終輸出中刪除。
我正在嘗試使用awk,因爲在大文件處理上awk似乎更快。但是有可能實現這樣的事情,或者我需要循環和分裂的pythonic方式,它似乎有點慢。
注: 1)No。的列是固定的。
請建議。
當你擺脫「懶惰,狗」中的',',你想這仍然是最後一列,或兩個?此外,作爲一個旁邊,是有問題的文件變量或固定的列數? – Levon 2012-04-18 16:04:22
您的標題'使用awk實用程序實現的場景'與您的允許使用python解決方案的問題不匹配。 – MattH 2012-04-18 16:08:44