2017-08-26 102 views
0

Following up on this post改善圖像的DPI

你好社區。我試圖解決上述帖子中提到的同樣的問題。我想在將圖像發送到OCR之前對圖像進行預處理,以便我可以獲得體面的輸出。出於這個原因,我想增加圖像的DPI,建議的解決方案是使用Imagemagik。有人可以幫助我如何使用Imagemagick重新採樣圖像。它有很多重採樣濾波器,我不確定如何進一步處理。 以下是ImageMagick重新採樣頁面Resampling的鏈接。

我是新來的信號處理和計算機視覺。我希望有一位大師能夠告訴我做什麼和如何做。

+0

DPI是一個非常隨意的測量,它只是一個可以隨意更改的元數據。你想要做的是真正放大圖像(相同物理尺寸的更多像素:更多DPI)。但恕我直言,這種方式添加像素將無法正常工作。 OCR軟件需要更多的DPI,因爲它通常意味着需要處理更多信息(在300DPI時,小寫字符大約爲20x20像素)。但是,當您放大圖片時,您不會在圖片中添加信息(實際效果是放大的圖片要麼是像素化的,要麼是模糊的,取決於所使用的算法),而OCR不會獲取更多的數據來縮小圖片。 – xenoid

+0

@xeniod您的回覆在這裏應該是一個答案! – dlemstra

+0

@xenoid所以你建議遠離重採樣?此外,我打算使用維納濾鏡來銳化圖像。我以爲我會先進行重採樣,然後使用scikit Image中的維納濾鏡去除增加的模糊。就像我提到的,我是這個領域的新手,並且高度重視您的意見。 – Random

回答

4

DPI是一個非常隨意的測量,它僅僅是一個可以隨意更改的元數據。你想要做的是真正放大圖像(相同物理尺寸的更多像素:更多DPI)。

但恕我直言,添加像素的方式將無法正常工作。 OCR軟件需要更多的DPI,因爲它通常意味着需要處理更多的信息。在300DPI下,10點小寫字符大約是20x20像素(400像素),在100DPI時,它只有7x7。

當您放大圖片時,您不會在圖片中添加信息。新像素只是從現有的像素計算而來。實際效果是,放大的圖像要麼是像素化的,要麼是模糊的,這取決於所使用的算法,而OCR並沒有真正獲得更多的數據。

TL; DR:您可以嘗試重新採樣,但它不太可能工作。

在水獺手上DPI在這裏沒有意義。它僅在掃描通常尺寸(大約10個點)的打印文本時用作指示,真正計數的是字符的大小(以像素爲單位)。如果它們已經在20x20左右(高DPI的小字體或低DPI的大字體),那麼你應該沒問題。