1
A
回答
0
有一個叫Kantu已經做了你需要什麼,PDF scraping with OCR的軟件組件。因此,您的代碼會將PDF發送到Kantu,並將數字返回給您的代碼。
創建模板(=在這裏你標記出的發票號碼是發票的面積小圖像)和Kantu提取這個數字。
另一種選擇是通過使用OCR軟件(如Tesseract)或在線API(如OCR.space(支持PDF)或Google Cloud Vision)自行構建類似內容。
0
基於該文檔樣本,可能的解決方案是使用與Python
OpenCV
,或pallow
和tesseract
實施若干掃描應用程序。
- 使用網絡攝像機來錄製文件並捕獲幀圖像。
- 裁剪感興趣的區域,即只有12位數字的右上角區域。
- 傳遞裁剪後的圖像用於OCR。
- 將掃描的號碼追加到文件中。
希望得到這個幫助。
相關問題
- 1. 使用WIA掃描多個文檔
- 2. 使用C#將掃描文檔讀取到數據庫字段
- 3. JAVA +掃描文檔
- 4. 表掃描匹配其中一個字段 - 或多個語句
- 5. OCR文檔掃描.NET SDK
- 6. Android文檔掃描儀
- 7. 掃描多個文件標題
- 8. 如何將文檔掃描整合到Qt應用程序中?
- 9. 掃描單個字符C
- 10. 如何將一個掃描儀用於整數和文本?
- 11. 掃描儀不會掃描一些字母文本文件
- 12. 一個接一個地計算多個正弦掃描
- 13. 一個Zend_Translate掃描翻譯文件
- 14. 掃描一個目錄樹並將.csv文件讀入一個數據框(Python)
- 15. Altbeacon - 掃描陣列中的多個UUID
- 16. 在多個類中使用掃描器
- 17. boost :: iostream zlib將多個文件壓縮到一個存檔中
- 18. 如何將多個文件夾壓縮到一個存檔中?
- 19. 掃描一個有效的整數
- 20. 掃描一個數字並返回輸入流中的lexeme-Java?
- 21. SonarQube掃描儀在AST掃描期間卡在一個java文件中
- 22. 這是使用掃描儀掃描多個輸入的方式
- 23. 如何掃描多個字符串的文本?
- 24. 掃描儀只是一個文件VS掃描儀用的FileReader和文件
- 25. Java的Web掃描到一個文本文件
- 26. 將中綴轉換爲Postfix時掃描多位數字
- 27. 如何將多個庫檔案(.a)打包到一個檔案文件中?
- 28. 將字符掃描到C中的數組中
- 29. 掃描儀方法得到一個字符
- 30. 將文件掃描到嵌套結構
這些打印的文件數量很大,因此將它們掃描爲PDF需要很長時間。如果我有PDF,我可以使用Adobe DC閱讀器。我需要的是具有網絡攝像頭或智能手機的電腦上的軟件,或QR或條形碼閱讀器般的設備,它可以即時掃描文檔中的內容 –
任何要顯示的示例文檔?您可以隱藏除數字區域之外的信息。 OpenCV和Tesseract可以使用正確安裝的攝像頭作爲視頻掃描儀來完成這項工作。 – thewaywewere
不是代言,只是一個建議http://www.irislink.com/EN-GB/c973/IRISPen-Executive-7---Pen-scanner.aspx –