2009-07-03 165 views

回答

0

我相信這是Adobe Reader軟件的一部分,不能通過API訪問。根據格式規範,有一個API和庫用於構建PDF文檔,但OCR是關注讀者而不是格式的東西。恐怕你要麼必須使用另一個庫,要麼自己實現它。

+0

確保樣品溶液~/Samples/Tesseract.Samples.sln?因爲我只需要它的形式:makeOCR(file); 然後他打開文件,並做一個OCR – subprime 2009-07-03 11:50:56

0

沒有適用於.net的直接Adobe OCR API。儘管如此,還是有一些可供選擇的方案,用於實現您的目標。在GitHub上有一個開放源代碼的.Net包裝器,用於Google的開放源碼Tesseract OCR:https://github.com/charlesw/tesseract。這應該讓你在C#中使用OCR功能。

從文檔:

快速入門

  1. Package Manager Console運行Install-Package Tesseract添加Tesseract NuGet包。
  2. 確保您擁有的Visual Studio 2012的x86 & 64的運行時間從tesseract-ocr安裝正方體3.02
  3. 下載語言數據文件,並將它們添加到您的項目,確保「複製到 輸出目錄」設置爲始終。
  4. 檢查出工作示例