2016-12-29 137 views
-1

我在Windows 7中通過命令行使用tesseract.exe,並在掃描OCR圖像時,以連續行顯示輸出。我希望它能夠完全按照它在圖像中的方式進行換行。有沒有這種變化的命令行參數?任何幫助將不勝感激。Tesseract命令行上的OCR換行符

回答

1

這是因爲Tesseract在行的末尾放置了換行符,而不是像Windows'記事本所預期的那樣回車+換行符。一個簡單的方法就是將結果輸出到標準輸出,這輸出重定向到一個文件:的

tesseract.exe eurotext.tif - > result.txt 

代替

tesseract.exe eurotext.tif result 
+0

嘗試過。 它創建2個文件。 -.txt與它中的數據相同,即全部在單行和result.txt中,這是一個空文件 –

+0

- 適用於版本爲3.05的我。你也可以嘗試stdout而不是 - 。或者,您可以通過'TYPE result.txt |在Windows中將LF轉換爲CR + LF FIND「」/ V> result1.txt'。 – Stef