2012-02-21 75 views
4

我在我的Perl應用程序中使用PDF::API2將OCR 輸出嵌入到相應圖像的後面,從而允許搜索產生的PDF,因爲OCR 輸出可以用pdftotext提取。如何判斷特定字體是否包含PDF中的特定字符:: API2

目前,只要應用程序在 OCR輸出中看到非ASCII字符,就會從PDF核心字體切換到TTF。但是,這個 真的很不好,因爲核心字體包括大多數西歐 字符。 TTF僅僅需要希臘語,俄語,日語, 等

我怎樣才能知道特定字體是否包含特定字符 (包括CMAP表,以便與 pdftotext作品即提取)?

+0

你看過[Font :: TTF :: Font](http://search.cpan.org/perldoc?Font::TFF::Font)嗎? – tchrist 2012-03-03 02:00:25

回答

相關問題