如何判斷特定字體是否包含PDF中的特定字符:: API2

我在我的Perl應用程序中使用PDF::API2將OCR 輸出嵌入到相應圖像的後面，從而允許搜索產生的PDF，因爲OCR 輸出可以用pdftotext提取。如何判斷特定字體是否包含PDF中的特定字符:: API2

目前，只要應用程序在 OCR輸出中看到非ASCII字符，就會從PDF核心字體切換到TTF。但是，這個真的很不好，因爲核心字體包括大多數西歐字符。 TTF僅僅需要希臘語，俄語，日語，等

我怎樣才能知道特定字體是否包含特定字符（包括CMAP表，以便與 pdftotext作品即提取）？

你看過[Font :: TTF :: Font]（http://search.cpan.org/perldoc?Font::TFF::Font）嗎？ – tchrist 2012-03-03 02:00:25

您是否嘗試過特定於字形的方法？

做不到這一點，也許字形渲染（到一個單獨的文件），並測量它？

2012-07-09 13:06:32 LeeGee

回答