2011-02-18 59 views
3

基本上我正在使用tessract OCR閱讀車輛牌照,但是儘管能夠通過改變對比度足夠輕鬆地強調文本,減少噪音等,車輛的某些「零件」仍保留在該圖像確實會導致OCR投擲不良結果。圖片OCR - 過濾不需要的數據

例如採取:

enter image description here

我可以改變這一點很容易不夠,如:

enter image description here

我期待消除掉每塊板的邊緣,這裏的另一個例如:

enter image description here

我可以使用像素操作算法去除邊緣,但是我不覺得這是正確的方法,並且會導致很多問題。

我一直在使用以下應用程序來測試各種方法,如形態學和消除不需要的數據,到目前爲止我還沒有成功。

http://www.codeproject.com/KB/GDI-plus/Image_Processing_Lab.aspx

但是有人用這方面的知識可以在文章使用上面的應用,實現要我想,可以隨意給它一個嘗試。

謝謝

+0

[`這algorithm`](http://stackoverflow.com/questions/4777677/license-plate-recognition-determining-color-範圍爲像素比較/ 4778495#4778495)似乎能夠隔離您的盤子文字...:D – 2011-02-18 20:10:19

回答

0

我已經做了這樣的算法。我可以說它效果很好。祕訣在於,你需要知道光源也許只是來自一側。僅使用一個閾值就無法將圖像設置爲「黑/白」。

檢測圖像各部分的平均亮度,並使用此亮度計算來設置每個區域的閾值。

例如,如果左上角較輕,則需要較低的閾值才能使這些部分不亮。如果右下方光線較暗,則需要將閾值設置得更高才能接收所有現有的光照信息。

然後,你只需要使用方法駛入從兩側的圖像:

IsPixelAboveThreshold ? 

如果低於,你在邊境上,如果是上面,你可以說你是在更多亮度的圖像中間。

Regards

1

請嘗試使用筆畫寬度轉換概念。

此概念使用從自然圖像段文本.....