我有一個長文本文件,它在隨後的文本塊(iso或utf-8)中使用明顯不同的編碼。這是使用>> file.bib
附加文本並從不同來源(網頁)複製和粘貼的結果。修復非統一編碼文本文件的編碼
塊可以爲他們bibtex
項
@article{key, author={lastname, firstname}, ...}
我想因爲它似乎崩潰我的中文提供瀏覽器(kbibtex)將它轉換成一個連貫的UTF-8文件中的原則加以區分。我知道我可以使用iconv
轉換整個文件的編碼,但我想知道是否有辦法在不損壞某些條目的情況下修復我的文件。
提供更多的細節,請參見[在Perl中將混合編碼文件轉換爲UTF8的問題](http://stackoverflow.com/questions/6897982/questions-about-converting-a-mixed-encoding-file- to-utf8-in-perl)進行比較,信息是有用的。 – daxim
您應該首先將文件分割成單獨的HTML文檔。然後,您可以檢查每個文檔的BOM和HEAD元素中的字符集。 – ikegami