2012-08-08 483 views
0

我在我的應用程序中使用tesseract庫進行圖像掃描。我已經在某處看到該庫爲圖像提供了超過100 DPI的良好性能。我正在使用iPhone 4和iPad捕獲照片並將其作爲tesseract庫的輸入。但仍然存在庫給出不可讀的輸出。什麼是iPhone的DPI或iPad相機?我如何提高tesseract庫的性能?什麼是在iPad或iPhone相機拍攝的照片的DPI?

+3

每英寸點數取決於相機距離拍攝對象的距離。這不是一個恆定的價值。 – 2012-08-08 07:24:44

+0

「image> 100 DPI」提示必須來自不瞭解DPI措施實際含義的人。我懷疑tesseract會識別以600 DPI顯示的圖像上的3像素字符。你需要知道的是人物應該在圖像中有多大,這與DPI無關。 @robmayoff給了這個問題唯一合理的答案。 – Pascal 2012-08-09 03:25:12

回答

4

獲取一個12英寸的尺子和一個捲尺。把統治者放在桌子上。將手機放在標尺上方,將相機對準標尺。使用捲尺測量從標尺到相機的距離。拍一張尺子的照片。

在圖像查看器或編輯器中打開照片。 (例如,您可以在Mac上使用「預覽」。)使用圖像查看器/編輯器以像素爲單位測量標尺的大小。

將尺子的尺寸(以像素爲單位)除以12.這就是標尺圖片的每英寸像素數(即每英寸點數或DPI),此數值取自用捲尺測量的距離。

關於需要100 DPI的一點是,OCR庫需要足夠的分辨率來識別字母。它可能希望字母是15-20像素高(我猜)。如果字母太小,則圖像可能沒有足夠的信息供OCR庫使用。字母也可能太大 - 圖書館可能沒有編程查找100像素高的字母。如果這些字母大小適中,但模糊不清,OCR庫可能無法識別它們。

這可能只是因爲您正在嘗試拍攝太小的文字圖片,所以當您將相機握得足夠近以使字母尺寸合適時,相機無法對焦且照片模糊不清。在這種情況下,您可能無法解決這個問題(除了讓手機配備更好的相機)。

0

它具有72個dpi的,至少這是它存儲在EXIF enter image description here

+0

這只是一個佔位符。它不代表照片中每個物理英寸的像素。 – 2012-08-08 07:25:38

+0

@robmayoff:那我的照片是由iPhone拍攝的DPI是什麼 – 2012-08-08 07:36:06

+1

@VXtreme我回答說,在我的評論你的問題。 – 2012-08-08 07:37:27

相關問題