0
A
回答
2
0
PDF不只是一個二進制表示。把它看作一個對象樹,其中一個對象節點有一些元數據和一些內容信息。其中一些對象有字符串數據,有些則不。其中一些甚至被加密,有些被壓縮。所以,你的字符串查找程序很難在任何PDF上運行。
2
回答this question中提到的組件/庫應該做你需要的。
1
我只是在做一個這樣的項目。我使用的方法是將PDF文件轉換爲純文本(使用pdftotext.exe),並在結果文本上創建一個索引。我們對word和其他辦公文件也做同樣的工作,效果很好!
直接從德爾福(沒有外部應用程序)直接搜索pdf文件是我覺得更困難。如果您發現任何問題,請在此更新,因爲我也會對此感興趣!
1
我使用的一個選項是使用微軟的ifilter技術,這是用於Windows桌面搜索和許多其他產品,如SharePoint和SQL Server全文搜索。
它支持幾乎任何類似office/office的文件格式,甚至包括dwg,msg,pdf和zip/rar歸檔文件。
最簡單的使用方法是在任何文件上運行FiltDump.exe,然後索引文本輸出。
要了解安裝在PC上的過濾器,可以使用ifilter explorer。 維基百科的ifilters page有一些鏈接。
1
快速PDF庫的GetPageText功能可以爲您提供PDF格式的文字以及頁碼和這些文字的座標 - 有時用於突出顯示。
相關問題
- 1. 在pdf文件中搜索字符串
- 2. 文本搜索PDF
- 3. pdf文件文本閱讀和搜索
- 4. 搜索PDF文本文本
- 5. Drupal 7索引pdf文件搜索
- 6. 根據字數搜索多個pdf文件中的單詞和索引pdf
- 7. 可搜索的PDF文件(圖像+文本PDF)驗證
- 8. 在文本文件中搜索數字?
- 9. SQL Server PDF全文搜索無法使用FileStream PDF文件
- 10. PDF文本搜索C#
- 11. Marklogic PDF文檔搜索
- 12. 在SharePoint上搜索PDF文件
- 13. 使用Zend Lucene搜索PDF文件
- 14. 使用PHP搜索PDF文件
- 15. 腳本來搜索文件夾OCR的PDF文件
- 16. 搜索文本文件的字符串
- 17. PHP搜索文件中的字符串
- 18. 在SQL Server 2005中對PDF文件使用全文搜索
- 19. 如何在pdf文件中搜索特定文本
- 20. 搜索chrome中的文字
- 21. 在iphone中搜索文本pdf
- 22. 搜索文件夾中的文件
- 23. 搜索和突出顯示IPad文本的PDF文件
- 24. 在搜索文本功能的網頁上顯示pdf文件
- 25. Xcode中的搜索文件
- 26. 的Aptana文件中搜索
- 27. 搜索中的Java文件
- 28. C++中的文件搜索
- 29. 使用搜索文件夾搜索正文字段
- 30. 搜索文件
-1是一個工具。 – alamodey 2009-02-18 00:38:49