2017-04-22 82 views
1

我有很多打印文檔的右上角有12位數字。什麼是使用應用程序或設備將這些數字掃描到新行中每個數字的單個文檔的最快方法。任何其他解決方案的問題將不勝感激。將多個數字掃描到一個文檔中

預先感謝您

+0

這些打印的文件數量很大,因此將它們掃描爲PDF需要很長時間。如果我有PDF,我可以使用Adobe DC閱讀器。我需要的是具有網絡攝像頭或智能手機的電腦上的軟件,或QR或條形碼閱讀器般的設備,它可以即時掃描文檔中的內容 –

+0

任何要顯示的示例文檔?您可以隱藏除數字區域之外的信息。 OpenCV和Tesseract可以使用正確安裝的攝像頭作爲視頻掃描儀來完成這項工作。 – thewaywewere

+0

不是代言,只是一個建議http://www.irislink.com/EN-GB/c973/IRISPen-Executive-7---Pen-scanner.aspx –

回答

0

有一個叫Kantu已經做了你需要什麼,PDF scraping with OCR的軟件組件。因此,您的代碼會將PDF發送到Kantu,並將數字返回給您的代碼。

You create a template (mark the area of the the invoice where the number is) and Kantu extracts this number.

創建模板(=在這裏你標記出的發票號碼是發票的面積小圖像)和Kantu提取這個數字。

另一種選擇是通過使用OCR軟件(如Tesseract)或在線API(如OCR.space(支持PDF)或Google Cloud Vision)自行構建類似內容。

0

基於該文檔樣本,可能的解決方案是使用與PythonOpenCV,或pallowtesseract實施若干掃描應用程序。

  1. 使用網絡攝像機來錄製文件並捕獲幀圖像。
  2. 裁剪感興趣的區域,即只有12位數字的右上角區域。
  3. 傳遞裁剪後的圖像用於OCR。
  4. 將掃描的號碼追加到文件中。

希望得到這個幫助。