Q
開源OCR
15
A
回答
1
Cuneiform是免費的,做一個體面的工作。你可以調用它作爲一個子程序,但沒有語言的結合,我知道的。它不會直接讀取PDF文件,但你可以很容易地拆開是養活他們楔形文字掃描圖像序列的PDF文件。還有一些腳本來重新組裝圖像和文本返回到一個可搜索的PDF。
12
正方體是一個非常好的OCR引擎:https://github.com/tesseract-ocr/tesseract
該項目已通過惠普實驗室推出,現在由谷歌繼續和贊助(對於谷歌圖書!)。它在Apache許可證下發布,並在Linux上運行。它使用Tiff或PNG文件;對於PDF文件,您將需要轉換爲這些格式之一。我想沒有綁定,所以你應該調用這個軟件作爲子程序...
0
嘗試tesjeract,它使用JNI調用Tesseract OCR API。
對於PDF,你需要首先轉換成圖像,使用GhostScript的,例如。
相關問題
- 1. 開源的Windows Mobile OCR庫
- 2. C#OCR算法或開源庫
- 3. C#中的開源OCR好嗎?#
- 4. 阿拉伯語開源OCR庫
- 5. 阿拉伯語的開源OCR
- 6. 開源OCR系統,用於FPGA
- 7. 在eclipse上的JAVA OCR API開源
- 8. 在Windows XP上運行的開源OCR庫
- 9. 開源辦法實時圖像處理OCR應用程序?
- 10. 可以將OCR文本插入源PDF的OCR庫
- 11. 任何開源/免費的OCR(模式識別)軟件? (用於移動平臺?)
- 12. OCR Actionscript
- 13. 開源開發
- 14. PHP中的OCR,OCR-B字體?
- 15. OCR for android
- 16. OMR/OCR on android
- 17. Tesseract OCR相機
- 18. Opencv與Android- OCR
- 19. Android OCR庫
- 20. Blackberry的OCR庫
- 21. Google API Java OCR
- 22. Microsoft OCR Library
- 23. iPhone Abbyy OCR
- 24. Tesseract和Php ocr
- 25. OCR識別 - gocr
- 26. OCR與javacv
- 27. OCR庫.NET
- 28. testcomplete中的OCR
- 29. GeoJSON開源庫
- 30. 開源mini-heroku?
已檢查該文本是不是在PDF已經上市,對不對? (我依稀記得,PNG,可能還需要存儲文本的能力,但我可能是錯那裏)。 – 2011-05-15 23:37:12
http://www.roncemer.com/software-development/java-ocr – Trick 2012-08-28 08:49:30