從圖像中分離圖像和文本區域是一個非常古老的問題,許多論文都是關於它的。最近的一個可以找到here。從圖像代碼中分離文本和圖像區域
但我沒有找到任何現有的代碼。在實施之前,我認爲向SO社區詢問是否有人知道現有社區是個好主意。
如果您知道,請指點我現有的代碼(最好是Java)。
從圖像中分離圖像和文本區域是一個非常古老的問題,許多論文都是關於它的。最近的一個可以找到here。從圖像代碼中分離文本和圖像區域
但我沒有找到任何現有的代碼。在實施之前,我認爲向SO社區詢問是否有人知道現有社區是個好主意。
如果您知道,請指點我現有的代碼(最好是Java)。
我還沒有完整閱讀你的PDF,但是從我看到的你可以找到類似的算法在C#中實現的AForge.Net。將代碼轉換爲Java應該不是什麼大問題。
見HorizontalRunLengthSmoothing Class和VerticalRunLengthSmoothing Class
謝謝。我發現我需要做的最接近的可能是在leptonica中實現的:http://tpgit.github.com/UnOfficialLeptDocs/leptonica/document-image-analysis.html?highlight = page%20分段 – rivu 2013-03-27 23:49:53
http://stackoverflow.com/questions/1813881/java-ocr-implementation – 2013-03-27 07:43:41
@的重複medPhys-PL:我不認爲這是一個重複的。 rivu正在尋求一種分割算法,而不是一個完整的OCR。 – rold2007 2013-03-27 20:53:34