1
我收到用戶使用屏幕截圖填充Excel電子表格的管道分隔文本文件,因此數據很混亂。它隨機填寫^M (carriage returns)
和<96> (windows en dash)
,導致導入不完整。如何在導入到sas之前從文本文件中移除^ M和<96>
我試過dos2unix
,並且收到轉換出現問題的錯誤。我用這個解決方案我在此網站上發現刪除了所有^M
:
tr -d '\r' <infile> outfile
的<96>
字符保持。對於這些破折號,可比較的'/r'
是什麼?或者也許有更好的解決方案?如果可能,我實際上希望用「好」破折號代替「壞」破折號。
你能分享一個文本文件的樣本和期望的輸出嗎? –