有人可以確認中文中的所有漢字字符都是UTF-8中的3個字節長嗎?UTF-8中的所有漢字字符都是3字節長嗎?
17
A
回答
27
常用的漢字/漢字字符在U + 4E00和U + 9FFF之間的「CJK統一表意文字」區塊中,UTF-8佔用3個字節。 (日本平假名和片假名字符也需要3個字節。)
但是,也有在「CJK統一漢字擴展B」一些非常很少使用的字符和「CJK兼容表意文字補編」塊,其採取4個字節在UTF-8。
另請注意,中文文本通常包含ASCII字符,如數字0-9。
2
是的,漢字是U + 4e00到U + 9faf,UTF8 3字節是U + 0800到U + FFFF。
相關問題
- 1. UTF8中的漢字?
- 2. 多字節的UTF8字符
- 3. 是否有用於UTF8字符的分隔符字節?
- 4. unicode字節中的特殊字符比iso字節長嗎?
- 5. 刪除4個字節的UTF8字符
- 6. 如何強制yaml中的所有節點都是字符串
- 7. 字符串的所有字符都屬於一個集合嗎?
- 8. php可以檢測4字節編碼的utf8字符嗎?
- 9. 將字節[]轉換爲UTF8字符串
- 10. UTF8字節到字符串和Winsock GetStream
- 11. 獲取UTF8中字符串的長度
- 12. mysql可以正確顯示utf8中的所有字符嗎?
- 13. 的Javascript所有的話是3個字符或更長
- 14. 閱讀UTF8字符使用的innerHTML返回0xfffd所有字符
- 15. 如何從字符串中替換所有漢字?
- 16. 所有非打印字符是否都控制字符?
- 17. 在Haskell中,如何獲得UTF8字符串中的字節數?
- 18. UTF8 mysql數據庫中長於255個字符的關鍵字
- 19. 根據字節長度縮短UTF8字符串的最佳方法
- 20. 如何使用javascript計算包含UTF8字符的字節長度?
- 21. 獲取字符串的字節長度
- 22. 一個字符串的字節長度
- 23. 字符串長度Winsock + UTF8 +「ç」
- 24. PHP:strlen返回字符長度而不是字節長度
- 25. 字符串限制字 - UTF8
- 26. Java中的字符是1個字節還是2個字節?
- 27. 確定是否所有字節都在流中
- 28. 如何將Unicode字符與漢字/漢字結合使用?
- 29. 獲取長字符串中的所有數字
- 30. 以字節爲單位的Unicode字符長度 - 總是一樣嗎?
+1哇,顯然我們有中文使用者在計算器上。酷:-)。 – sleske 2010-09-10 09:17:11
源自Shift-JIS的日文文本也可能包含映射到雙字節序列的其他非漢字,非ASCII字符。然後,我們很快就會有表情符號與之競爭,這也在基礎多語言平面之外,所以4字節... – bobince 2010-09-10 11:28:30
@sleske:不,我不會說*中文。我在字符編碼方面做了太多工作。 – dan04 2010-09-10 13:17:17