是否有可能通過使用Tesseract OCR來OCR圖片並識別不同的字體大小的圖片。如果是,我是否需要使用任何其他第三方庫或可以使用純Java。例如,檢測Tesseract OCR Java實現的大小字體大小
我想通過使用字體大小來檢測報紙的標題和內容。
任何關於此事的幫助將不勝感激。
是否有可能通過使用Tesseract OCR來OCR圖片並識別不同的字體大小的圖片。如果是,我是否需要使用任何其他第三方庫或可以使用純Java。例如,檢測Tesseract OCR Java實現的大小字體大小
我想通過使用字體大小來檢測報紙的標題和內容。
任何關於此事的幫助將不勝感激。
您可以使用ResultIterator.WordFontAttributes API方法(example in Java using Tess4J)來檢索識別文本的字體信息,包括字體名稱和大小。
Tesseract的hOCR輸出包括可用於確定大小的行和字的邊界框,並且可以通過打開配置變量hocr_font_info
來配置字體的點大小。