我有一個包含兩種不同編碼的大文件。 「main」文件是UTF-8,但某些字符如is32xx(isoxxx中的)或<9F>
(isoxxx中的)使用ISO-8859-1編碼。我可以用這個來代替無效字符:使用兩個單獨的編碼在Ruby上加載文件
string.encode("iso8859-1", "utf-8", {:invalid => :replace, :replace => "-"}).encode("utf-8")
的問題是,我需要這個錯誤編碼的字符,所以更換爲「 - 」是沒用的我。我怎樣才能修復與紅寶石的文檔中錯誤的編碼字符?
編輯:我已經試過了:fallback
選項,但沒有成功(其中再沒替換):
string.encode("iso8859-1", "utf-8",
:fallback => {"\x80" => "123"}
)
備用將只有沒有其他選項。看到我之前發佈的鏈接。 – phoet 2012-07-10 07:45:32
不,我已經嘗試了沒有額外的選項,並沒有工作:( – Fu86 2012-07-10 13:28:33