2013-03-27 71 views
1

我想從包含幾個不同單詞的圖像中提取帶圓圈的單詞。如何使用PHP檢測圖像中的連續形狀?

例如,在此圖像中:因爲它的盤旋

Words

的 「MAMBAHUNT」 字應被提取。

Extracted word

我的策略到目前爲止是找到圖像中的直線。一旦我有了直線,我就可以找到它們的交點來找到角點並提取所需的圖像。

我一直試圖獲得直線的方式是循環遍歷每個像素,並找出其中連續幾個具有相同顏色的位置。但是,這給出了誤報,因爲一些詞將符合這個標準。

有沒有更好的方式來找到使用PHP的圖像中的直線?或者提取圈出的單詞的不同策略?

+0

有一些PHP的OCR庫,但我從來沒有嘗試過它們,不知道它們是否很好,例如http://ocrsdk.com/documentation/quick-start/text-fields /?utm_source=stackoverflow.com&utm_medium=comment&utm_campaign=smm – herrjeh42 2013-03-27 06:55:28

+0

我使用Tesseract進行OCR,實際上相當不錯。但是,我試圖在通過OCR運行之前獲取圈選區域。否則所有其他的話會通過。 – dangson 2013-03-27 13:09:19

+0

這篇文章提到了一些算法來檢測行http://stackoverflow.com/questions/11307219/recognize-pattern-in-images,還有一次特定於PHP:http://stackoverflow.com/questions/4142271/如何檢測一個部分垂直水平線在圖像 – herrjeh42 2013-03-27 14:16:11

回答

2

試圖藐視驗證碼? :)

您可以使用相同的算法來查找圖像中的所有白線,並檢查每條灰線是否與白線相鄰。當它不是;這是一個誤報。雖然效率不是很高。

+0

僅用於教育目的:)感謝您的建議。我會嘗試一下。 – dangson 2013-03-27 13:09:47