ものがたり(旧)

atsushieno.hatenablog.com に続く

reCAPTCHA

うちの、じゃなかった、GoogleインターンBenが(というかCMUが)、何か楽しい物を公開している。

http://recaptcha.net/

CAPTCHAでわれわれ人類がキーボードを叩く10秒程度の作業も、スキャンした古い書籍類をデジタル化する時間にしたら、1日に約160,000時間もの作業量になる! というわけで、これでCAPTCHAの代わりにしてくれたら、その完全な代替とは言わないまでも、それに近いものになってくれるんじゃないか、という発想で作られたサービスがこのreCAPTCHAだ。

reCAPTCHAを出すと、入力テキストが2つ出てくる。このうち、「正解」をもっているのは1つだけだ。もう1つは、OCRでスキャンした時に判別できなかったテキストだ。reCAPTCHAは、1つの(正解のある)単語を正しく入力したユーザーエージェントは、もう1つの単語についても正しく入力した人間であろう、という推測を行って、その単語の翻訳の確度を高める。

reCAPTCHAをdocument.write()するJavascriptを返すAPIも公開されている。

実に面白い。

追記: 日本でも取り上げるところが出てきた http://labs.cybozu.co.jp/blog/akky/archives/2007/05/recaptcha-human-group-ocr.html http://www.itmedia.co.jp/enterprise/articles/0705/25/news023.html http://itpro.nikkeibp.co.jp/article/NEWS/20070525/272324/?ST=security