2012-07-27 77 views
-1

我開發了一個需要OCR引擎的ANPR應用程序。我正在嘗試使用tesseract作爲OCR引擎。但我真的找不到一個適當的一步一步教程或指導如何將tessnet2它包括在我的C#.Net項目中。我已經培訓過tesseract v3.01。有人可以幫助解決這個問題嗎?如何整合Tesseract?

感謝

+0

查看Subtitle Edit的源代碼。這是一個C#應用程序,它利用Tesseract來處理OCR的位圖字幕。 http://www.nikse.dk/SubtitleEdit/ – 2012-07-27 08:25:45

+0

它看起來有點複雜,我沒有看到這個項目使用了什麼DLL? – 2012-07-27 08:40:12

回答

1

你不能用正方體2.04引擎使用3.01的數據 - 它們沒有Tesseract Wiki狀態兼容。你需要Tesseract 3.0x引擎。有一個3.01的.NET包裝:tesseract-ocr-dotnet

+0

嗨,感謝您的回覆我只是想通了,我發送了一個dll文件,我可以包括在我的項目中,但我仍然沒有得到什麼文件後,爲我自己的字體類型培訓tessreact包括。我應該使用tesseract 3.01v培訓後使用tessdata文件夾中生成的所有文件嗎?另一部分我沒有得到是爲什麼你投下我的問題大聲笑 – 2012-07-28 16:45:29

+0

順便說一句我試了幾件事情與文件似乎我得到正確的文件int他tessdata文件夾。但它會拋出此運行時exeption「試圖讀取或寫入受保護的內存,這通常表示其他內存已損壞。」我的系統是64位可以這是一個問題?並且它被扔在Init().. – 2012-07-28 17:15:28

+0

它可能是你的圖像或項目設置。看看VietOCR.NET(http://vietocr.sf.net)應用程序的一個使用上述DLL的工作示例。 – nguyenq 2012-07-28 17:51:35