我需要實時識別iPhone上相機圖像中的數字。我知道圖像上不會超過5位數字。iPhone上的號碼識別可能是實時的嗎?
鑑於iPhone的計算規格,這個問題是否現實可以解決? 有沒有人有使用Tesseract OCR庫的經驗,你認爲可以通過使用它來解決嗎?
我需要實時識別iPhone上相機圖像中的數字。我知道圖像上不會超過5位數字。iPhone上的號碼識別可能是實時的嗎?
鑑於iPhone的計算規格,這個問題是否現實可以解決? 有沒有人有使用Tesseract OCR庫的經驗,你認爲可以通過使用它來解決嗎?
它應該是計算上可能的。有些應用程序可以實時獲取條形碼,還有一個可以實時翻譯的應用程序。 (Word鏡頭)。不過,我不確定他們使用了哪些庫。
這取決於您對「實時」的定義,但是,應該可以對iPhone 4上的數字0-9進行相對快速的識別,特別是如果您可以字體,照明條件等。他們將出現在。
我強烈建議使用iPhone攝像頭閱讀關於how Sudoku Grab does its recognition of puzzles的文章。在他們的情況下,一個訓練有素的神經網絡被用來識別數字,這在現代iOS硬件上應該是相當簡單和快速的。
當前的識別庫,如OpenCV,將使用iPhone的CPU進行處理。我聽說他們可以完成更復雜的任務,如面部識別,足以快速使用視頻源,同時顯示最少量的口吃。
爲了獲得更好的性能,我相信新款iOS設備上的可編程GPU具有很多潛力。在my benchmarks中,當使用iPhone 4的GPU進行簡單圖像處理時,我看到了14X - 28X的加速。雖然現在很少有人正在看這個,但像Sudoku Grab的神經網絡這樣的東西應該是一個並行的過程,可以從GPU上運行中受益。
是。 Bender可以幫助你。它可以讓你在iOS上構建和運行神經網絡。由於它在引擎蓋下使用了金屬材質,因此它運行得非常快速且平穩。它還支持直接運行TensorFlow模型。
所以,你可以在本德爾運行TensorFlow現有模型訓練的數字識別Handwritten Digit Recognition using Convolutional Neural Networks in Python with Keras如果您需要幫助
免責聲明:我曾在這個項目上。
有免費的SDK:http://rtrsdk.com/支持iOS和Andorid,實時工作,幫助您捕捉任何文本,數字不應該是一個問題。
聲明:我ABBYY工作
的
可能重複:http://stackoverflow.com/questions/3140455/training-tesseract-to-use-with-iphone – 2011-02-03 14:26:50
@Daniel:雖然這個問題是問如何使用Tesseract讀取任何靜止圖像中的數字,這正在研究從現場視頻流中進行這種處理的可能性。我相信這裏有足夠的區別來證明一個新問題的合理性。 – 2011-02-03 16:32:16