2010-12-21 100 views
2

我在哪裏可以找到整體詞彙識別的算法細節?我需要在硬件(實際上是FPGA)中構建一個簡單的OCR系統,科學雜誌看起來很抽象?詳細整體詞彙識別算法

是否有任何開源(開放核心)代碼整體的單詞識別?

感謝

+0

@Joe Blow:FPGA是現場可編程門陣列。而且它們只是可以由用戶配置的集成電路。 – Lukasz 2010-12-22 10:44:25

+0

@Joe:現場可編程門陣列是「可編程硬件」 - 它是一個具有一堆邏輯門(AND,OR等)的設備,您可以通過編程方式「連線」,無論您想要什麼(有點像上傳固件),使用,然後「重新佈線」以獲取其他內容。 – 2010-12-22 10:45:21

回答

4

一種算法是非常適合FPGA實現的(易並行)你可能看:

http://en.wikipedia.org/wiki/Cross-correlation

它是快速,且易於實現。

唯一的一點是:它識別一個形狀(在你的情況下一些文本)依賴於旋轉和大小/拉伸/歪斜等。但如果這不是問題,它可以非常快速並且相當強大。你應該只注意與相似字符的解釋問題(如o和c)。

我用它在掃描的表格上找到默認文本,以獲得感興趣區域的方位,並且在這些圖像(6M像素)中搜索只需要約15 ms,而我們在單個線程的Core2 CPU上執行。