帶leptonica的OCR圖像處理（反色文本）

我正在嘗試使用leptonica處理以下圖像以提取帶有tesseract的文本。帶leptonica的OCR圖像處理（反色文本）

原始圖像： original image

正方體的原始圖像上產生這樣的：

i s l 
D2J1FiiE-l191x1iitmwii9 uhiaiislz-2 Q ~37 
Bottom linez 
With a little time! 
you can learn social media technology 
using free online resources- 
And if you donity 
youlll be at a significant disadvantage 
to 
other HOn-pFOiiTS-

不是很大，尤其是頂部的背景。因此，使用leptionica我使用背景去除算法（模糊，差，閾值，反轉），以獲得下面的圖片： processed image

但正方體不會用它做的工作：

@@r-mair [email protected] [email protected] [email protected] [email protected] [email protected] [email protected]@ll 
mm Mime 
VWU1 a Mitt-Jle time- 
@1m [email protected]@Wn Om @@@lh1 
using free onhne resources- 
Andifyoudoni 
9110 ate a $0 D 
to other non-profrts 
I

的主要的問題似乎是，現在所有的文字都被概述了，而不是堅實的。如何調整我的算法或我可以添加哪些內容以使文本變爲固定？

來源

2012-07-26 jasonlfunk

似乎提出了一種解決問題了一個二值化方法：

ŤKasar，J Kumar和A G萊瑪克里斯南。 Font and Background Color Independent Text Binarization。（2007）

Kasar etal method performance

來源

2012-07-27 22:17:57 sastanin

這很好。在我接受答案之前，你不會碰巧知道這個算法的實現嗎？ – jasonlfunk 2012-08-01 01:45:36

不，不幸的是我不知道是否存在實現。 – sastanin 2012-08-01 16:17:15

我用python和opencv做了一個實現。謝謝！ https://github.com/jasonlfunk/ocr-text-extraction – jasonlfunk 2012-08-04 20:37:32

帶leptonica的OCR圖像處理（反色文本）

回答

相關問題