2010-12-06 92 views
4

我正在做一些OCR的東西和屏幕抓取。我最終得到了很多像這樣的文件。.NET中簡單的OCR問題C#

alt text

alt text

alt text

所有我需要做的是在C#中對這些文件的一些非常基本的OCR。我一直在拉我的頭髮,試圖讓不同的庫發揮作用(Tessnet2,Puma,MODI),並且遇到很多不同的問題,讓他們甚至可以在C#中運行。

你們爲什麼推薦這麼簡單的東西?

謝謝!

+0

Tessnet2被認爲是最好的之一。你有什麼問題?他們根本沒有工作,或者你沒有能夠讓他們正確處理? – 2010-12-06 02:14:34

回答

1

OCR程序並非設計用於讀取低分辨率屏幕截圖。即使是一些最好的商業OCR引擎也無法閱讀屏幕截圖。

即使在正常情況下,Tesseract也需要良好的清晰圖像以獲得體面的結果。可能有一些原因會導致您的結果不佳。如果您張貼一些樣本圖片和輸出結果,那麼我們可能會更好地解釋結果。問題包括彩色背景,文本分區錯誤,小字符,人工製品....

顯然,如果您使用要讀取的字體進行訓練,Tesseract將獲得更好的結果。