こんにちは。
よく、WEBサイトの会員登録などをする際、フォームで文字認証を求められますよね。
これは「CAPTCHA」と呼ばれており、画像に書かれている歪んだ単語を入力させることで、入力者が実際の人間であり、大量にフォームを送信するようなプログラムではないことを確認しています。
これが結構読み取りづらかったりして、フォームにあると面倒に思ってしまいがちですが、実はこのCAPTCHAには、スパム対策以外にも重要な役割があるのだそうです。
近年、本のデジタル化が進んでいることは皆さんすでにご存じのことと思います。
古い本は当然印刷物でしか残っていないので、それをスキャンしデータとして取り込むことになるわけですが、その際文字の解読にOCRという技術が使われます。
しかしOCRの性能も完璧ではなく、インクが消えかかっていたりするとその単語を読み込むことが不可能です。
50年以上前に書かれた本は、約30%もの単語を認識することができないんだとか・・・
そこで、CAPTCHAを利用しているわけです。
実際にCAPTCHAの認証用画像として使われているのは、デジタル化された本の中のコンピュータが認識できなかった単語です。
わたしたちがそれを読み取ってフォームで送信することで、その単語のデジタル化に一役買っているということなんですね。
そう考えると、面倒なことに変わりはありませんが、もっと真面目に文字認証と向き合おうという気になりました。笑
最近電子書籍リーダもシャープやソニーなどから続々と発売されています。
技術の進歩によって、古く希少な本でも手軽に読めるようになるのはうれしいことですね。