我需要如http://www.unicode.org/Public/5.1.0/ucd/UCD.html#Alphabetic中定義的統一碼字符範圍列表Alphabetic
。但是,無論我如何搜索它們,我都無法在Unicode字符數據庫中找到它們。有人可以提供它們的列表,或只是提供具有指定Unicode屬性的字符的搜索工具嗎?統一碼字母字符列表
回答
派生核心屬性可以從其他屬性計算。
字母屬性定義爲:生成來自:魯+ 11 + LT + Lm的+羅+ NL + Other_Alphabetic
所以,如果你走在路中,L1,LT,LM,羅所有的字符, N1和所有帶有Other_Alphabetic屬性的字符,您將擁有字母字符。
引文從源:Generated from: Lu + Ll + Lt + Lm + Lo + Nl + Other_Alphabetic
這些縮略語似乎解釋here。
Unicode字符數據庫包含分佈中的所有文本文件。它不僅僅是一個很久以前的單個文件。
字母屬性是派生屬性。
你真的不想爲此使用代碼點範圍。您想正確使用。那是因爲它們太多了。使用unichars script,我們瞭解到,有一萬多隻在基本多文種平面單獨不計數漢或韓文:
$ unichars '\p{Alphabetic}' | wc -l
10052
如果我們包括其他16個星光層,現在我們十四歲千:
$ unichars -a '\p{Alphabetic}' | wc -l
14736
如果我們包括漢,韓文,這實際上是按字母順序財產呢,我們只是吹響了屋頂一十萬碼點:
$ unichars -ua '\p{Alphabetic}' | wc -l
101539
我希望你能看到你做的不是想專門枚舉這些使用代碼點範圍。那條路就是瘋狂。
順便說一下,如果您發現unichars script有用, 您可能也喜歡或uninames script。
我真的很喜歡你的腳本!他們將是非常有用的解決[我問題](http://stackoverflow.com/questions/6246651/generate-uri-friendly-unicode-code-points-from-integer-counter)我有。非常感謝他們。問題:當我剛剛運行上面的最後一個命令(`unichars -ua'\ p {Alphabetic}'| wc -l`)時,我得到了94332行而不是101539。任何可能的原因是什麼? – 2011-06-13 00:13:03
@Abe:Prolly因爲你還沒有運行Unicode 6.0.0。你正在運行什麼版本的Perl? `corelist -a Unicode`將向您顯示Perl版本與Unicode版本的配對。順便說一句,我現在已經在我的[Unicode toolchest](http://training.perl.com/scripts/)中有了更多的內容。 – tchrist 2011-06-13 00:42:56
我發現了UniView網絡應用程序,它提供了一個很好的搜索界面。搜索信件屬性(與未選中的本地)給出14723結果...
- 1. 字母表字符串代碼,循環
- 2. 字符統一碼值
- 3. 將一個字符串製成一個字母列表
- 4. 將一個字符串分解爲一個數組/列表bij字母和非字母字符
- 5. C#字母順序號碼列表
- 6. 正則表達式字母數字字符串+特殊字母
- 7. 「找字符」代碼找到一個字中的字母數量
- 8. 解碼字符串列表
- 9. 按字母順序排列字符串中的字母 - SAS
- 10. C#生成下一個字母數字字符串序列
- 11. 正則表達式表達字母字符匹配的第一個字符,其餘字母
- 12. MySQL截斷命令 - 統一碼字符
- 13. 在列表中找到一個字母
- 14. 列表中的每一個字母? LISP
- 15. 更換給定的字符串以字母在字母表
- 16. Python:在字符串中移動字母表中的字母
- 17. C源代碼將字符串中的第一個字母從小寫字母改爲大寫字母
- 18. 非字母字符
- 19. 如何修整字符串直到字母數字字符串中的第一個字母表?
- 20. 將字母數字字符串轉換爲亂碼條形碼?
- 21. 解碼輸入的字符串或字母表
- 22. 正則表達式接受至少一個字母字符和數字字符
- 23. 按字母順序排列不包含字母的列表
- 24. 如何用一系列字母數字創建列表?
- 25. 查詢在非字母數字列中搜索字母數字字符串
- 26. 錯字母列表 - Prolog的
- 27. 列表按照字母
- 28. 用字母積累列表
- 29. xsl遍歷字母列表
- 30. 滾動到列表中的字母表(ArrayCollection dataProvider)(字母跳轉)
如果你看我的答案,我已根據你的請求提供了一個搜索工具,爲具有指定的Unicode屬性的字符[我的unichars腳本](http://training.perl.com/scripts/unichars)。請享用! – tchrist 2011-01-30 15:46:22