2013-03-27 87 views
15

我打算開發一個應用程序,如Word Lens。任何人都可以建議我可以使用的好的圖書館嗎?或任何一個解釋Word Lens App背後的技術?它是卷軸時間圖像匹配還是OCR?我知道像OpenCv,tesseract一些圖像處理庫...任何幫助,非常感謝...真正的TIme圖像處理(OCR)

回答

42

我是Word Lens的創造者之一。雖然有一些OCR庫(如tesseract),但我們決定自己設計,以獲得更好的結果和性能。我們一般的算法是這樣的:

  1. 複製圖像從相機,並得到其灰度成分
  2. 水平出圖像,從而使文本明確站出來反對的背景
  3. 抽獎箱周圍的東西,看起來像字符&句子
  4. do OCR:將每個框中的像素與字符數據庫相匹配 - 這實際上很難!
  5. 收集字符成詞,在字典中查找(這是很難得的,因爲會出現在OCR錯誤)
  6. 得出結果返回到圖像

圖像匹配本身是不夠好,因爲那裏有各種各樣的字體,文字和語言。

OpenCV是一個很棒的圖書館,可以幫助您學習和了解更多關於計算機視覺的知識。我會建議建立他們的例子,並在那裏玩耍。玩的開心!

+0

你會以某種方式結合4和5獲得更好的結果嗎?作爲OCR的局外人,在我看來,你已經通過「5」丟失了信息,這在困難的情況下可能有用。 – 2013-03-28 13:14:32

+1

馬丁:很對;例如,'O'非常類似於'0',甚至'8'和'B',所以它有助於保持可能性列表,然後在更多明確的信息可用時在以下階段進行修剪(一種簡單的反饋) – 2013-03-28 17:36:43

+0

@jd。感謝您的評論..我可以知道創建Word Lens需要多長時間嗎?你會爲OCR建議好的教程嗎? – 2013-04-01 06:22:12