ocr

    5熱度

    6回答

    當谷歌在新窗口中顯示gmail中的PDF附件時,我觀看了流量。內容作爲每個PDF頁面的PNG圖像。其文本可以被選中。 Google在服務器端使用什麼來爲PDF文件中的特定頁面生成PNG文件? png文件上文本的選擇是如何工作的?有任何想法嗎?

    2熱度

    3回答

    我有55000圖像文件(在JPG和TIFF格式),這是圖書從圖書。 每個頁面的結構是這樣的: 一些文本 ---(水平線)--- 若干 一些文本 ---(水平線)--- 另一個號碼 一些文本 可以有從零到4的水平線任何給定網頁上。 我需要找到數字是什麼,就在水平線的下方。 但是,數字嚴格遵循對方,從第一頁開始,所以爲了找到數字,我不需要讀它:我可以檢測到水平線的存在,這應該是兩個比嘗試對頁面進行OC

    0熱度

    1回答

    我的問題與this one 842986/how-to-read-text-written-on-a-image類似,但我正在尋找一種以編程方式執行此操作的方法。 從本質上講,有沒有人知道一個好的,簡單的.NET兼容庫,能夠接受位圖對象或圖像對象,並將該圖像上的任何文本都還給我? 歡呼

    39熱度

    4回答

    我想建立一個Android應用程序,通過一個OCR庫,應該掃描圖片從中提取文本。 我應該使用哪個Java庫?

    1熱度

    1回答

    我正在使用WPF InkCanvas控件來捕獲Tablet PC應用程序中的簽名。 我的一個要求是驗證應用程序是否真的「簽名」。現在我通過檢查InkCanvas的Strokes集合來做到這一點 - 如果有0個筆畫,那麼我知道用戶沒有「簽名」。 但是,如果用戶輸入一個斜槓,甚至單個點,則這將算作筆畫,並且我的驗證測試將通過,即使簽名不是真正有效。 有關如何爲此構建更好測試的任何想法?當然,對於什麼是

    3熱度

    2回答

    我想編寫一個可以在Adobe Acrobat中使用OCR功能的C#應用​​程序。我怎麼稱呼這個?是否有公共API?

    1熱度

    1回答

    我不想知道它說了什麼,它不會處理像驗證碼一樣的任何失真,我只想知道圖像的一堆是否包含任何文本。 這是在一些空閒的Linux服務器上運行的東西,一個cron作業會每天處理大量的圖像。 我想在這個過程中要做的事情之一就是放棄任何帶有文本的圖像。我不介意一些誤報,但是當涉及識別應儘可能丟棄文本的圖像時,我希望能達到零失敗率。

    2熱度

    5回答

    我們需要一個大容量的掃描和OCR解決方案 我們在說什麼數字化約4000記載了一天,並將其保存爲帶有OCR PDF文件(隱藏文本)... 的解決方案應該讓運營商掃描文檔並自動將文件保存到特定的網絡資源,將要採取的,它上傳到數據庫的應用程序... 我們正在評估從的Kofax http://www.kofax.com/ 的企業解決方案等什麼你知道哪些產品? 有類似要求的任何經驗嗎? 任何開源(或至少可訪

    4熱度

    2回答

    我試圖通過捕獲屏幕截圖來創建一個自動化PC的軟件,然後OCR(光學字符識別)它尋找一個特定的按鈕來點擊(用於例)。我有鼠標和鍵盤控制部分,但現在,我需要一個OCR來處理屏幕截圖。我發現的是,Tesseract OCR似乎不能很好地處理屏幕上的文字。文字要麼太小,要麼文字似乎是連接的,比如K和X.我應該怎麼做呢? p/s:這是一個自動化測試程序。

    8熱度

    7回答

    我想用MODI來OCR一個窗口的程序。它工作正常的我搶編程方式使用截圖win32的互操作是這樣的: 該圖像,然後保存到一個文件並運行通過MODI像這樣: private string GetTextFromImage(string fileName) { MODI.Document doc = new MODI.DocumentClass(); doc.Crea