2013-03-26 110 views
0

從圖像中分離圖像和文本區域是一個非常古老的問題,許多論文都是關於它的。最近的一個可以找到here從圖像代碼中分離文本和圖像區域

但我沒有找到任何現有的代碼。在實施之前,我認爲向SO社區詢問是否有人知道現有社區是個好主意。

如果您知道,請指點我現有的代碼(最好是Java)。

+0

http://stackoverflow.com/questions/1813881/java-ocr-implementation – 2013-03-27 07:43:41

+0

@的重複medPhys-PL:我不認爲這是一個重複的。 rivu正在尋求一種分割算法,而不是一個完整的OCR。 – rold2007 2013-03-27 20:53:34

回答

0

我還沒有完整閱讀你的PDF,但是從我看到的你可以找到類似的算法在C#中實現的AForge.Net。將代碼轉換爲Java應該不是什麼大問題。

HorizontalRunLengthSmoothing ClassVerticalRunLengthSmoothing Class

+0

謝謝。我發現我需要做的最接近的可能是在leptonica中實現的:http://tpgit.github.com/UnOfficialLeptDocs/leptonica/document-image-analysis.html?highlight = page%20分段 – rivu 2013-03-27 23:49:53