2014-09-21 125 views
3

是否有可能通過使用Tesseract OCR來OCR圖片並識別不同的字體大小的圖片。如果是,我是否需要使用任何其他第三方庫或可以使用純Java。例如,檢測Tesseract OCR Java實現的大小字體大小

我想通過使用字體大小來檢測報紙的標題和內容。

任何關於此事的幫助將不勝感激。

回答

0

Tesseract的hOCR輸出包括可用於確定大小的行和字的邊界框,並且可以通過打開配置變量hocr_font_info來配置字體的點大小。