在Linux上的文件中搜索生病編碼的字符

我有很多巨大的CSV文件，其中一些包含編碼錯誤的字符：在vi中，例如，我看到諸如「< 8f>」或「< 8e>」等例如。首先，我想搜索並替換所有字符（：％s），但這將是一個非常漫長的過程，因爲每次必須處理文件時我都必須這樣做，而且我並不總是確定是否新增字符在這裏。是否有可能檢測到這些字符，以便我可以提取包含編碼錯誤字符的行？可能存在一個簡單的命令，將一個文件作爲參數並創建一個僅包含具有問題的行的文件。在Linux上的文件中搜索生病編碼的字符

我不知道我是否很好地解釋了我... 在此先感謝！

來源

2016-12-05 djcaesar9114

請發佈你的代碼，但首先看看[如何完成一個最小，完整和可驗證的例子]（/ help/mcve） –

我不知道還有什麼要說的，我沒有任何代碼，這就是我的問題的重點，我可以舉例說明我使用「六」命令：「vi file.csv」給我這個： 'NOMS PR <8f> NOMS'，我想檢測這個<8f>。 – djcaesar9114

你可以使用：克/炭/ P [VIM]打印指定文件中的所有行，或在bash實用的grep：

grep -lr 'char1\|char2\|char2' .

將輸出所有包含任何目錄中的文件你列出的字符（-r使其遞歸，-l只列出文件名，而不是所有的行匹配。）

來源

2016-12-07 01:34:52

感謝F比格斯花時間回覆。我發現了一些其他的東西，我會在幾個小時後發佈我的github並在此處發佈鏈接。 – djcaesar9114

在Linux上的文件中搜索生病編碼的字符

回答

相關問題