Почти каждому пользователю интернета приходилось хотя бы однажды решать в онлайне примитивные задачи - определять, какие цифры скачут на экране, записывать слова и цифры, изображенные в плохом качестве на грязном фоне, и т.д. Такие задачи приходится решать в процессе заполнения анкеты, например, во время регистрации в почтовой службе. Они имеют одну цель - предотвратить автоматическое заполнение анкет компьютерными программами, то есть обеспечить гарантию, что анкету заполняет именно человек.
Тест CAPTCHA (Completely Automated Public Turing Test to Tell Computers and Humans Apart) - это компьютерная задача, которую может решить человек, но не программа. Полное название таких тестов переводится как "полностью автоматизированный публичный тест Тьюринга для различия компьютеров и людей". Такие задачи частенько называют обратными тестами Тьюринга, потому что они используют идею знаменитого математика Алана Тьюринга тестировать компьютерные программы на "человечность", но предназначены, наоборот, для тестирования людей (с той же целью). Этот способ был изобретен учеными из университета Карнеги-Меллона в 2001 г.
В тестах CAPTCHA используются известные недостатки искусственного интеллекта, который пока не научился эффективно анализировать аналоговую информацию. Например, самый распространенный тест Gimpy представляет собой картинку с изображениями семи искаженных слов, случайным образом выбранных из словаря. Буквы накладываются друг на друга, и на сегодняшний день ни одна известная программа не способна определить хотя бы три слова, изображенные на картинке, хотя для человека это не представляет никакого труда.
Упрощенная версия Gimpy (с одним трудно читаемым словом или цифрами на сложном фоне) является частью процесса регистрации во многих почтовых службах, например, Yahoo! Mail или на "Яндекс.Почте". Внедрение тестов в регистрационный процесс позволяет полностью избавиться от автоматических регистраций, которые выполняют спамерские роботы для проведения анонимных массовых рассылок. Лишь недавно появились эффективные программы (www.cs.berkeley.edu/~mori/gimpy/gimpy.html), созданные в учеными из Университета Беркли и Кембриджа, способные решить от 83% до 93% простых вариантов теста Gimpy, но у спамеров пока нет такого софта.
Еще один тест, Sounds, состоит из искаженных, сгенерированных компьютером звуков, которые образуют слово или последовательность чисел. Человек должен распознать звуки и написать результат. Программа на это не способна. Всего на сайте проекта CAPTCHA (www.captcha.net) выложены пять разработанных учеными тестов: Gimpy, Bongo, Pix, Sounds и Byan, причем бета-тестирование одного из них (Pix) пока не закончено.
Важной особенностью тестов CAPTCHA является то, что все они автоматически генерируются компьютерами, то есть оптимизированы для использования в интернет-приложениях. Для непосвященного человека может показаться странным, что компьютер способен составить тест, но не способен его решить. На самом деле здесь нет ничего удивительного. Программа может сгенерировать тест и выложить его в интернет, собрать у людей результаты и оценить правильность ответов, но самостоятельно решить задачу она не способна.
Анатолий АЛИЗАР
Горячие темы