2011-01-25 52 views
0

我們有一個網絡應用程序,用於存儲和處理字符編碼爲UTF-8的數據。使用utf-8編碼下載CSV文件

當我打開從我們的系統導出的CSV文件時,我遇到了麻煩,因爲有些程序會將CSV解釋爲不同的字符編碼,並開始出現有趣的符號。

我試過發送http://en.wikipedia.org/wiki/Byte_order_mark#UTF-8,但OpenOffice似乎並不尊重這一點。

有沒有辦法強制文件使用UTF-8編碼?

我可以將文件保留爲UTF-8格式,並依靠我們的用戶對其進行排序 - 但我們的用戶不會特別注意技術,因此我不確定這是否明智。

更安全的方法就是在導出之前將數據轉換爲基本字符集?

回答

2

前段時間我們有類似的問題。適用於所有應用程序的解決方案是使用BOM發送UTF-16LE編碼數據。

+0

這似乎適用於OpenOffice 3.2和Excel 2002導入嚮導(我們唯一的完整版本的Excel我們已經躺在!)謝謝。如果有人想看,我們的代碼位於http://elastik.svn.sourceforge.net/viewvc/elastik/trunk/includes/CSVBuilder.class.php?view=markup。在接受答案之前將會開放幾天以查看是否有其他人做出了貢獻...... – James 2011-01-26 11:17:05