2010-02-19 93 views

回答

3

來自Zend背景,我通常推薦使用Zend_Search_Lucene。 XPDF的例子非常簡單,看起來很簡單。 XPDF被授權爲GPL - 如果這符合您的需求,請參加#1!

ZF很容易集成到您的Symfony項目中,例如,爲Twitter Call

2

有很多從PDF中提取文本內容的庫。有了這些,你就需要創建一個包含內容的lucene文檔。最有用的將是那些已經有lucene集成。

阿帕奇PDFBox可以create a lucene文件直接從PDF文件。它將包含PDF元數據字段以及文本內容。