2011-02-03 42 views
9

我需要實時識別iPhone上相機圖像中的數字。我知道圖像上不會超過5位數字。iPhone上的號碼識別可能是實時的嗎?

鑑於iPhone的計算規格,這個問題是否現實可以解決? 有沒有人有使用Tesseract OCR庫的經驗,你認爲可以通過使用它來解決嗎?

+0

可能重複:http://stackoverflow.com/questions/3140455/training-tesseract-to-use-with-iphone – 2011-02-03 14:26:50

+0

@Daniel:雖然這個問題是問如何使用Tesseract讀取任何靜止圖像中的數字,這正在研究從現場視頻流中進行這種處理的可能性。我相信這裏有足夠的區別來證明一個新問題的合理性。 – 2011-02-03 16:32:16

回答

1

它應該是計算上可能的。有些應用程序可以實時獲取條形碼,還有一個可以實時翻譯的應用程序。 (Word鏡頭)。不過,我不確定他們使用了哪些庫。

11

這取決於您對「實時」的定義,但是,應該可以對iPhone 4上的數字0-9進行相對快速的識別,特別是如果您可以字體,照明條件等。他們將出現在。

我強烈建議使用iPhone攝像頭閱讀關於how Sudoku Grab does its recognition of puzzles的文章。在他們的情況下,一個訓練有素的神經網絡被用來識別數字,這在現代iOS硬件上應該是相當簡單和快速的。

當前的識別庫,如OpenCV,將使用iPhone的CPU進行處理。我聽說他們可以完成更復雜的任務,如面部識別,足以快速使用視頻源,同時顯示最少量的口吃。

爲了獲得更好的性能,我相信新款iOS設備上的可編程GPU具有很多潛力。在my benchmarks中,當使用iPhone 4的GPU進行簡單圖像處理時,我看到了14X - 28X的加速。雖然現在很少有人正在看這個,但像Sudoku Grab的神經網絡這樣的東西應該是一個並行的過程,可以從GPU上運行中受益。

0

有免費的SDK:http://rtrsdk.com/支持iOS和Andorid,實時工作,幫助您捕捉任何文本,數字不應該是一個問題。

聲明:我ABBYY工作