2012-01-04 136 views
-1

我需要從某些授權位置獲取UTF-8字符集的完整列表。從哪裏獲得UTF-8字符集

我試過看Unicode.org,但沒有信息。

+2

「UTF-8 charset」是什麼意思*完全相同? UTF-8是*編碼* - 用於將Unicode字符表示爲字節序列。 – 2012-01-04 17:46:30

+0

請閱讀維基百科:http://en.wikipedia.org/wiki/UTF-8 – rkosegi 2012-01-04 17:48:49

回答

2

的字符集所能表述的UTF-8是完全一樣的Unicode字符集。

權威是Unicode聯盟。如果您特別想要一個列表,那麼您可以訪問鏈接到Unicode字符數據庫的http://www.unicode.org/ucd/,其中包含大型列表http://www.unicode.org/Public/UNIDATA/UnicodeData.txt。然而,這並不是完全明確的列表,因爲一些寬範圍被指示爲範圍,例如,

AC00;<Hangul Syllable, First>;Lo;0;L;;;;;N;;;;; 
D7A3;<Hangul Syllable, Last>;Lo;0;L;;;;;N;;;;; 

這意味着從AC00到D7A3字符都被定義爲韓文音節字符(其名稱被構造了算法)。

+0

請參閱http://stackoverflow.com/questions/8732025/why-degree-symbol-differs-from-utf-8-from-unicode因爲我非常非常困惑! – 2012-01-04 18:34:07