解析PDF文件時,遇到預定義的CMap(UniCNS-UTF16-H,您可以在這裏找到http://sourceforge.net/projects/cmap.adobe/files/cmapresources_cns1-6.tar.z/download)。當我研究它時,我發現單個CID可以被引用到多個unicode中。單個CID引用多個Unicode編碼
我的問題是,這是什麼目的?我怎麼知道我應該映射我的角色的unicode?
cid2code.txt文件的標題說:「在單個CMap文件中的多個編碼點中可能會引用單個CID,這些情況在逗號分隔的同一列中。但它沒有說明爲什麼。
我看了技術筆記#5080「CID鍵字體的Adobe-CNS1-6字符集」,但沒有找到我的答案。所以如果有人能指出我解釋這個問題的地方以及如何處理它,我將不勝感激。