2010-04-07 78 views
3

我得到了廉價的相機拍攝的灰度圖像,我需要製作一個程序OCR。 主要問題是噪音或對象不是文字,但它們以二值圖像呈現。 現在我想起從圖像中提取文本。圖像的文本檢測

我需要一些很好的算法。 你能提出一個非常好的建議嗎? 例如,如果圖像包含黑色文本和類似黑線 的東西,那麼該算法將只選擇沒有行的文本。

+1

OCR已經有一段時間了。你需要*建立自己的任何理由,而不是尋找現有的工具?至於算法,我相信有很多。通常情況下,您需要具有您正在搜索的字符的現有模板,然後讓程序查看圖像中是否存在任何這些模板。 – FrustratedWithFormsDesigner 2010-04-07 15:30:18

+0

其他工具如果圖像包含明文 ,即使手寫文本的ocr對於該圖像也不太好。 我試過tesseract google,gocr。 你是什麼意思的字符模板? – maximus 2010-04-07 15:39:26

+0

@ maxiumus:OCR系統需要一些參考點,它需要知道什麼是合適的「A」,然後才能識別出*可能是「A」的圖像。可能有不止一種方法來實現這一點,建議只會是其中一種方式。 – FrustratedWithFormsDesigner 2010-04-07 15:42:53

回答

2

您將描述要刪除的兩種類型的噪音。 (順便說下,wikipedia page對於降噪並不差,請看「圖片」部分)。

一種是奇點噪聲。這通常被稱爲「斑點」或「鹽和胡椒」噪聲,通常通過某種平均濾波器來去除。有一個很好的網頁在mathworks上描述了一些算法。

第二種是線條。這很難,我不會真的把它描述爲噪聲,它會依賴於你的輸入圖像類型。 This paper似乎是合適的,但它不可用於免費在線,所以你可能需要購買它或去當地的大學圖書館。

你可能也想看看this,這是可以從很多地方下載,但真正用於電影(視頻),所以可能不是你想要的。