從圖像代碼中分離文本和圖像區域

從圖像中分離圖像和文本區域是一個非常古老的問題，許多論文都是關於它的。最近的一個可以找到here。從圖像代碼中分離文本和圖像區域

但我沒有找到任何現有的代碼。在實施之前，我認爲向SO社區詢問是否有人知道現有社區是個好主意。

如果您知道，請指點我現有的代碼（最好是Java）。

來源

2013-03-26 rivu

http://stackoverflow.com/questions/1813881/java-ocr-implementation – 2013-03-27 07:43:41

@的重複medPhys-PL：我不認爲這是一個重複的。 rivu正在尋求一種分割算法，而不是一個完整的OCR。 – rold2007 2013-03-27 20:53:34

我還沒有完整閱讀你的PDF，但是從我看到的你可以找到類似的算法在C＃中實現的AForge.Net。將代碼轉換爲Java應該不是什麼大問題。

見HorizontalRunLengthSmoothing Class和VerticalRunLengthSmoothing Class

來源

2013-03-27 20:51:07 rold2007

謝謝。我發現我需要做的最接近的可能是在leptonica中實現的：http：//tpgit.github.com/UnOfficialLeptDocs/leptonica/document-image-analysis.html？highlight = page％20分段 – rivu 2013-03-27 23:49:53

從圖像代碼中分離文本和圖像區域

回答

相關問題