2016-12-05 73 views
0

我有很多巨大的CSV文件,其中一些包含編碼錯誤的字符:在vi中,例如,我看到諸如「< 8f>」或「< 8e>」等例如。 首先,我想搜索並替換所有字符(:%s),但這將是一個非常漫長的過程,因爲每次必須處理文件時我都必須這樣做,而且我並不總是確定是否新增字符在這裏。 是否有可能檢測到這些字符,以便我可以提取包含編碼錯誤字符的行? 可能存在一個簡單的命令,將一個文件作爲參數並創建一個僅包含具有問題的行的文件。在Linux上的文件中搜索生病編碼的字符

我不知道我是否很好地解釋了我... 在此先感謝!

+2

請發佈你的代碼,但首先看看[如何完成一個最小,完整和可驗證的例子](/ help/mcve) –

+0

我不知道還有什麼要說的,我沒有任何代碼,這就是我的問題的重點,我可以舉例說明我使用「六」命令: 「vi file.csv」給我這個: 'NOMS PR <8f> NOMS',我想檢測這個<8f>。 – djcaesar9114

回答

0

你可以使用:克/炭/ P [VIM]打印指定文件中的所有行,或在bash實用的grep:

grep -lr 'char1\|char2\|char2' . 

將輸出所有包含任何目錄中的文件你列出的字符(-r使其遞歸,-l只列出文件名,而不是所有的行匹配。)

+0

感謝F比格斯花時間回覆。 我發現了一些其他的東西,我會在幾個小時後發佈我的github並在此處發佈鏈接。 – djcaesar9114