This SO post有一個服務器的示例,該服務器用byte order mark生成json。 RFC7159說:刪除R/C中的字節順序標記
實現絕不能在JSON文本的開頭添加一個字節順序標記。爲了互操作性,解析JSON文本的實現可以忽略字節順序標記的存在,而不是將其視爲錯誤。
當前yajl因此jsonlite在物料清單上窒息。我想遵循RFC建議並忽略來自UTF8字符串的BOM(如果存在)。什麼是有效的方法來做到這一點?一個天真的實現:
if(substr(json, 1, 1) == "\uFEFF"){
json <- substring(json, 2)
}
然而substr
是大串有點慢,我不知道這是做到這一點的正確方法。如果存在,在R或C中是否有更有效的方法去除BOM?
的BOM的UTF-8表示將EF BB BF。 – borrible 2014-11-04 22:50:37