當數據框中存在UTF-8字符時,將無法正確顯示。R在Windows平臺上的data.frames中打印UTF-8代碼Rstudio
例如,以下是正確的:
> "\U6731"
[1] "朱"
但是,當我把在數據幀並將它打印出來,那就是:
> data.frame(x="\U6731")
x
1 <U+6731>
因此,我認爲這有什麼好與編碼問題有關。
是否有任何直接打印方式朱
而不是<U+6731>
。
我必須在公司使用Windows,所以使用Linux可能對我來說不太可行。
謝謝。這真的有幫助。順便說一下,「語料庫」中是否有任何功能可以使用正確的編碼將語料庫框架保存爲CSV文件? – John
對不起,沒有。這在Windows上可能是不可能的。嘗試使用換行符分隔的JSON,使用'jsonlite :: stream_out'來寫入,並使用'jsonlite :: stream_in'或'corpus :: read_ndjson'來讀取 –