9
我正在嘗試使用leptonica處理以下圖像以提取帶有tesseract的文本。帶leptonica的OCR圖像處理(反色文本)
原始圖像:
正方體的原始圖像上產生這樣的:
i s l
D2J1FiiE-l191x1iitmwii9 uhiaiislz-2 Q ~37
Bottom linez
With a little time!
you can learn social media technology
using free online resources-
And if you donity
youlll be at a significant disadvantage
to
other HOn-pFOiiTS-
不是很大,尤其是頂部的背景。因此,使用leptionica我使用背景去除算法(模糊,差,閾值,反轉),以獲得下面的圖片:
但正方體不會用它做的工作:
@@r-mair [email protected] [email protected] [email protected] [email protected] [email protected] [email protected]@ll
mm Mime
VWU1 a Mitt-Jle time-
@1m [email protected]@Wn Om @@@lh1
using free onhne resources-
Andifyoudoni
9110 ate a $0 D
to other non-profrts
I
的主要的問題似乎是,現在所有的文字都被概述了,而不是堅實的。如何調整我的算法或我可以添加哪些內容以使文本變爲固定?
這很好。在我接受答案之前,你不會碰巧知道這個算法的實現嗎? – jasonlfunk 2012-08-01 01:45:36
不,不幸的是我不知道是否存在實現。 – sastanin 2012-08-01 16:17:15
我用python和opencv做了一個實現。謝謝! https://github.com/jasonlfunk/ocr-text-extraction – jasonlfunk 2012-08-04 20:37:32