5
A
回答
4
您可以使用Docotic.Pdf(我爲Bit Miracle工作)。
下面是如何在PDF文本搜索的例子:
PdfDocument doc = new PdfDocument("file.pdf");
string textToSearch = "some text";
for (int i = 0; i < doc.Pages.Count; i++)
{
string pageText = doc.Pages[i].GetText();
int count = 0;
int lastStartIndex = pageText.IndexOf(textToSearch, 0, StringComparison.CurrentCultureIgnoreCase);
while (lastStartIndex != -1)
{
count++;
lastStartIndex = pageText.IndexOf(textToSearch, lastStartIndex + 1, StringComparison.CurrentCultureIgnoreCase);
}
if (count != 0)
Console.WriteLine("Page {0}: '{1}' found {2} times", i, textToSearch, count);
}
你可能想,如果你想進行區分大小寫的搜索刪除第三個參數爲IndexOf
方法。
3
你檢查過itextsharp了嗎? http://itextsharp.sourceforge.net/
編輯: 爲了闡述,在TOC中,我看到了一個部分上: 15.3.3:與PdfReaderContentParser和PdfTextExtractor
提取文本而下PdfReaderContentParser: http://api.itextpdf.com/com/itextpdf/text/pdf/parser/PdfReaderContentParser.html 有一個選項來處理每頁的pdf內容。
因此,它似乎是一個關於方式的過程,但是您可以遍歷每個頁面,在內容中搜索所需的單詞,然後返回您找到的單詞。
相關問題
- 1. 文本搜索PDF
- 2. 搜索PDF文本文本
- 3. pdf文件文本閱讀和搜索
- 4. 使用C#搜索OCR(可搜索)PDF
- 5. PDF視圖 - 如何搜索文本?
- 6. 在iphone中搜索文本pdf
- 7. PDF文本搜索和分庫
- 8. Datagrid文本框搜索C#
- 9. 可搜索的PDF文件(圖像+文本PDF)驗證
- 10. 如何檢測pdf是文本搜索還是非文本搜索?
- 11. Marklogic PDF文檔搜索
- 12. C#在文本文件中搜索
- 13. Drupal 7索引pdf文件搜索
- 14. 搜索文本
- 15. 調用從shell腳本彈性搜索索引pdf文檔
- 16. 搜索pdf文件中的文字
- 17. 搜索和突出顯示IPad文本的PDF文件
- 18. 腳本來搜索文件夾OCR的PDF文件
- 19. 如何編程文本搜索並替換爲PDF文件
- 20. 如何在pdf文件中搜索特定文本
- 21. 如何使用石英搜索pdf文檔中的文本
- 22. 在搜索文本功能的網頁上顯示pdf文件
- 23. 如何搜索PDF?
- 24. 通過文本框搜索datagridview c#.NET
- 25. C#文本框搜索自動完成
- 26. 文件搜索C++
- 27. 文本搜索Mysql索引
- 28. jquery文本搜索
- 29. 搜索文本geonames
- 30. jquery文本搜索
我沒有看到搜索選項itextsharp文檔。 – Shoban 2011-02-04 02:24:44
@Shoban編輯答案是更多的信息。我沒有嘗試過自己,只是建議讓OP開始。 – Joe 2011-02-04 02:32:01