2012-03-22 113 views
2

我需要一種方法來增強降級的歷史文檔圖像中的文本。閾值文檔圖像

enter image description here

我試着用大津算法和一些閾值技術,但有wasnt在質量上有較大提升。有人可以告訴最好的方式去解決這個問題。謝謝

+1

你可以顯示一些示例圖像? – vini 2012-03-22 16:39:51

+0

如果圖像中的光照不均勻,您可以嘗試基於本地鄰域的閾值方法,而不是整個圖像。 – Maurits 2012-03-22 21:59:05

+0

這就是它的樣子:http://i44.tinypic.com/nqd6au.jpg – NeedHelp 2012-03-23 10:53:53

回答

3

我會使用顏色處理和本地閾值的組合。 作爲第一步,看看價值(HSV)的平面,提取它,因爲col上的黑色很容易被提取出來。我做了一些查找(一種對數灰度乘法),以使背景和文本之間的對比度更高。我使用了一種稱爲Niblack的局部閾值方法來提取文本,最後使用一些形態來去除微小的文物。 enter image description here

掩蓋了整個事情,並平滑了一下(低通)。


編輯:我被要求添加引用Niblack。它通常是在1986年的教科書他寫的引用,但爲了更好的可訪問性,我將指向你一份文件,還介紹了算法,並給出瞭如何用這個進行一些耐人尋味:

這些改進的算法是針對特定問題的,原來Niblack仍然是我轉到開始時,我想本地化的閾值。

+0

非常感謝!這真的很有幫助。請您發佈代碼,以便我可以參考它? – NeedHelp 2012-03-25 02:50:00

+0

對不起,我沒有真正的代碼,我只是用IMAQ/Vision Assistant做了一個快速算法草圖。我可以給你vscr-File,但它可能不會幫助你使用任何其他語言。但是沒有必要,我提到的東西應該在大多數圖書館中實施。 – 2012-03-26 01:53:08

+0

但我只是做屏幕截圖的步驟: http://imgur.com/a/8PGX2 1:價值平面 2:查找(sorta對數=調整亮度,對比度,伽馬改善) 3:Niblack 4:去除小顆粒(形態學) 5:逆(好,只是爲了讓它看起來更好) 6:平滑(低通)。 你應該可以自己做掩模。看看這些高分辨率的照片,看看我做了什麼。 – 2012-03-26 02:07:16

0

從我所看到的文字是黑色和背景是棕色的。嘗試不僅使用亮度,而且使用顏色進行分割。