2010-09-18 55 views
2

我希望能夠在用戶搜索該單詞時突出顯示文檔圖像中的單詞。完全像Google Books那樣 here。據我所知,Tesseract和其他開源OCR程序不支持這種功能,所以有人有任何想法如何可以做到這一點?如何突出顯示圖像中的單詞?

回答

2

是的,他們「支持」它。有點。

他們給你一個矩形,告訴你這個單詞在哪裏。使用該方法,使用color blending mode(例如,保持亮度不變並僅改變色度)在圖像上填充所選顏色的矩形。這適用於大多數書籍的B/W和灰度圖像,並且對於大多數彩色字體也是足夠的(除了彩色背景中的圖像)。解決這個問題的方法是顛倒顏色,而不是突出顯示顏色,這是在許多應用程序中完成的(福昕閱讀器讓人想起)。

+0

謝謝。也許我不太瞭解Tesseract。我只是認爲它輸出了一個文本文件。我在哪裏可以找到這些矩形? – Judson 2010-09-18 13:46:41

+0

請看這裏:http://www.pixel-technology.com/freeware/tessnet2/它是一個開源的C#包裝器。 – 2010-09-18 23:50:26