2009-09-16 60 views
9

我對這article的閱讀表明,ReCAPTCHA的好處是它可以讓人類驗證在OCR /圖書數字化中未識別的單詞。它是通過在「你是人類嗎?」中使用這些詞來實現的。試驗。所以ReCAPTCHA一石二鳥殺死了兩隻鳥。大!ReCAPTCHA如何工作?

但我沒有明白。如果數字化過程無法識別這個單詞,那麼由所謂的人類輸入的輸入是否經過驗證?這個怎麼用?

回答

23

它顯示兩個單詞。其中一臺計算機已經知道,另一臺則沒有。它假設如果你知道一個正確的,你必須知道另一個。

你不知道哪兩個是已知的,所以你理論上不能欺騙它。此外,它還會將多個人的單詞重新發送給獨立確認,然後將其發回給源(報紙公司,圖書掃描組)作爲有效答案。

但是,如果計算機無法讀取這樣的 CAPTCHA,系統怎樣知道 正確答案的謎題?這裏的 如何:通過OCR無法正確讀取的每個新詞 都會給 的用戶提供,而另一個詞則爲 ,答案是已知的。然後要求 用戶閱讀這兩個詞。 如果他們解決了 答案已知的問題,那麼系統會假定他們的答案對於新的 答案是正確的,即 。然後系統給出新的 圖像給其他一些人,以 確定,具有較高的置信度, 原始答案是否爲 正確。

http://recaptcha.net/learnmore.html

+0

我會注意到,ReCAPTCHA的工作原理是顯示兩個詞,一個知道,另一個不知道。你只需要得到一個正確的。然而,他們重新提交他們不會多次的提議,直到他們獲得高比例,在他們吸收之前是正確的。 – 2009-09-16 22:00:03

+0

好點,這個系統不是簡單的,雖然它很聰明。它讓我想起了Google的Image Labeler遊戲,它遵循相同的原則,讓不知名的人爲圖片添加標籤:http://images.google.com/imagelabeler/ – 2009-09-16 22:03:25

+0

Imagelabeler和ReCapcha是由同一個人:Luis von Ahn。他確實率先使用人類來解決困難問題。 – 2009-09-16 22:09:42

2

LEARN HOW reCAPTCHA WORKS

報價,但如果計算機無法讀取這樣的CAPTCHA,系統怎樣知道正確答案的謎題?方法如下:OCR中的每個新單詞都不能被正確讀取,並與另一個已知答案的單詞一起提供給用戶。然後要求用戶閱讀這兩個詞。如果他們解決了答案已知的問題,那麼系統會假定他們對新問題的答案是正確的。然後系統給其他一些人提供新的圖像,以更高的置信度確定原始答案是否正確。