2013-04-03 160 views
1

我正在使用PIL,OpenCV和OCR閱讀器來閱讀來自圖像的文本。我面臨的最大問題是涉及到圖像處理,使文本足夠清晰,以便通過OCR閱讀器進行簡單/準確的提取。爲此,我想增加對比度/亮度,並使用PIL進行直方圖均衡化,但這並沒有幫助原因。如何讓圖像中的文字更清晰地使用PIL?

那麼,你會建議如何使文本顯示更清晰的文字提取?

回答

2

PIL有sharpen and edge enhancing filters。這是你想要的嗎?顯示您正在處理的示例圖像會很有幫助。

您的圖像背景顏色不均勻,可能會導致問題。試着看看this solution創建一個很好的平坦b & w圖像。

但黑領也會造成問題,你應該看看它的方式。

這麼說,我得到一個簡單的PIL銳化濾鏡合理的改進:

銳化濾鏡後

正方體結果:

從我學到的東西找裏面的人,^我決定人類 衆生在颶風與冰塊之間}某些 方面,永久神祕,但在其他地方 - 具有足夠的科學 和仔細probingefullyly'scrutablerr這將是愚蠢的 認爲我們已經達到了人類知識的極限因爲它是t認爲我們可以知道一切。仍然有足夠的空間讓 變得更好,問我甚至死亡的問題,從 知道我們什麼時候我的簡單確定性是錯誤的。

和結果不帶過濾器:

從我瞭解到lnnkmg韋德楓} FVE deculed lunnuan WLNG ;. el'。 .y.w.r-a'是between a luurrlctuvr null llva la全部。'一個。 I ll respects, permanently unyst:-rwnt Ml ln ms。與足夠的scaena) 和turutul pmlulng lm.rely謹慎。這將是他作爲loallsla 感謝我們已經達到了人類知識llmlts作爲我們認爲 我們可以知道一切。我們還有足夠的空間讓 更好,問問「甚至死亡的人」,當我們簡單的證書是錯誤的時候知道知道的。

+0

我處理像這樣的文本中提取出的圖像:http://distilleryimage5.s3.amazonaws.com/f7d64cc299d111e2b82c22000a1fbca3_7.jpg我使用的Tesseract,但它的精確度是非常少的,這一點我相信可以通過更好地處理圖像來改善,並且可以銳化形成文字的線條。 – Hick

+0

@Hick看我的更新。您應該在提交的問題的文本中包含這些額外的細節(圖片和您正在使用Tesseract的事實)。 – Paul