如何從C＃中調用Acrobat功能OCR？

我想編寫一個可以在Adobe Acrobat中使用OCR功能的C＃應用程序。我怎麼稱呼這個？是否有公共API？如何從C＃中調用Acrobat功能OCR？

2009-07-03 subprime

我相信這是Adobe Reader軟件的一部分，不能通過API訪問。根據格式規範，有一個API和庫用於構建PDF文檔，但OCR是關注讀者而不是格式的東西。恐怕你要麼必須使用另一個庫，要麼自己實現它。

2009-07-03 11:24:20 Slavo

確保樣品溶液~/Samples/Tesseract.Samples.sln？因爲我只需要它的形式：makeOCR（file）; 然後他打開文件，並做一個OCR – subprime 2009-07-03 11:50:56

沒有適用於.net的直接Adobe OCR API。儘管如此，還是有一些可供選擇的方案，用於實現您的目標。在GitHub上有一個開放源代碼的.Net包裝器，用於Google的開放源碼Tesseract OCR：https://github.com/charlesw/tesseract。這應該讓你在C＃中使用OCR功能。

從文檔：

快速入門

從Package Manager Console運行Install-Package Tesseract添加Tesseract NuGet包。

確保您擁有的Visual Studio 2012的x86 & 64的運行時間從tesseract-ocr安裝正方體3.02

下載語言數據文件，並將它們添加到您的項目，確保「複製到輸出目錄」設置爲始終。

檢查出工作示例

來源

2015-06-09 17:45:22

如何從C＃中調用Acrobat功能OCR？

回答

相關問題