2012-11-17 113 views
0

我有一個項目,我必須從PDF文件(而不是metaData)中獲得標題,作者信息。所以我嘗試從給定的座標讀取PDF文本,並嘗試獲取文本的字體。Pdf文本座標/字體

有沒有辦法做到這一點,任何人都可以提供建議?還是有另一種解決方案來做我的項目?

感謝您與我分享的每一個幫助和想法。

回答

0

有多個用於Java的PDF庫,允許您提取文本,我最喜歡的文本是iText,作爲文本解析的示例,請參閱iText in Action第2版的第15章的ExtractPageContentArea和其他examples

目前沒有使用字體信息的例子,但是信息可用於RenderListeners。