我是Symfony開發人員,我的Web服務器是Linux。我已經使用sfLucene插件。使用Lucene爲Symfony索引PDF文件
索引PDF文件在Linux PHP服務器上搜索的最簡單方法是什麼?
謝謝!
我是Symfony開發人員,我的Web服務器是Linux。我已經使用sfLucene插件。使用Lucene爲Symfony索引PDF文件
索引PDF文件在Linux PHP服務器上搜索的最簡單方法是什麼?
謝謝!
來自Zend背景,我通常推薦使用Zend_Search_Lucene。 XPDF的例子非常簡單,看起來很簡單。 XPDF被授權爲GPL - 如果這符合您的需求,請參加#1!
ZF很容易集成到您的Symfony項目中,例如,爲Twitter Call。
有很多從PDF中提取文本內容的庫。有了這些,你就需要創建一個包含內容的lucene文檔。最有用的將是那些已經有lucene集成。
阿帕奇PDFBox可以create a lucene文件直接從PDF文件。它將包含PDF元數據字段以及文本內容。