Самое практичное применение распознавания речи

Со стен каждой площадки, прямо напротив дверей лифта, на него глядело огромное лицо. Это было одно из тех изображений, где глаза специально нарисованы так, чтобы их взгляд все время следил за вами. "БОЛЬШОЙ БРАТ ВИДИТ ТЕБЯ", - было написано на плакате снизу.

Джордж Оруэлл, "1984"

Изобретательность человека - вещь неистребимая и поистине дьявольская. Что бы один человек ни придумал для облегчения своей жизни, обязательно найдется другой, который применит это изобретение для облегчения процесса расставания с оной. Колесо превратилось в смертоносную колесницу с косами на ступицах, праздничная шутиха - в несущую разрушение через океаны стратегическую ракету. Извечная мечта человека - крылья - стала бомбардировщиком, лишающим людей крова, работы и, опять же, жизни.

Казалось бы, до чего мирная штука - распознавание речи. Технология, созданная из гордого стремления уподобить компьютер человеку, создать рукотворное разумное существо, последние пять лет искала себе достойное применение. И нашла, да только не то, о котором думали ее создатели.

Голосовой интерфейс так и остался сказкой из "Космической Одиссеи 2001" - как и виртуальная реальность, он сначала казался невозможным, а потом - ненужным. Набирать текст и управлять компьютером руками, посредством клавиатуры, мыши, или, на худой конец, сенсорного экрана, оказалось гораздо удобнее, чем орать на всю комнату: "Запусти Эксель. Эк-сель! Открыть. Файл. Ой, отменить. Отменить, дура кремниевая!". А мест, где никакой другой интерфейс не подходит, не так уж много.

Зато Агентство национальной безопасности США довольно быстро нашло область, автоматизация которой просто невозможна без распознавания речи. Приложение это специфическое, но как нельзя более распространенное - любое уважающее себя государство занимается наблюдением за своими гражданами, что включает в себя и прослушивание телефонов. И если раньше количество прослушиваемых телефонов было ограничено тем, что за каждым разговором должен был следить живой человек, то внедрение технологий распознавания речи и эвристического полнотекстового поиска позволяет свести вмешательство человека к просмотру транскриптов всех имевших место в заданный период времени телефонных разговоров, в которых шла речь, скажем, о терроризме, политических акциях, президенте, или манипуляциях акциями некоторой компании.

Чтобы не быть голословным, перейду к фактам. Первый из них - зарегистрированный АНБ в 1997 и подтвержденный американским Патентным Бюро в августе 1999 года патент на использование в подслушивании поиска по текстовым документам, в том числе и "речи, записанной машиной" (machine-transcribed speach). Таинственным образом этот патент получил огласку в ноябре, за которой последовал резкий всплеск интереса Европарламента к проекту "Эшелон", о котором я упоминал в "КВ"-9/1999. Настолько резкий, что парламентарии даже рассматривают возможность эмбарго на ввоз в Европу процессоров Intel Pentium III, буде в создании серийных номеров оных поучаствовали АНБ и ФБР.

Подстегивает страх Европы перед "Эшелоном", используемым ЦРУ не только для политического, но и для промышленного шпионажа, и технология Semantic Forests, вот уже три года тестируемая американскими военными, и разработанная не без помощи того же АНБ. "Семантические леса" представляют собой программный комлекс интеллектуального поиска по все тем же машинным записям человеческой речи, понимающий запросы на человеческом языке. Свое название программа получила за то, что при разборе текста она каждому слову ставит в соответствие дерево взвешенных смысловых значений. В работах, опубликованных на Text Retrieval Conference (TREC) в 1997 и 1998 годах, утверждается, что за год удалось увеличить долю релевантных (отвечающих запросу) документов в результатах поиска с 19 до 27% - гораздо лучше теперешних интернетовских поисковых машин.

Наконец, третий факт был упомянут Иваном Жилиным в "КВ"-44/1999 в статье про морских коней. Создана технология распознавания, выделяющая человеческую речь из 560-кратного белого шума. Иван явно исполнен восторга перед этим потрясающим изобретением, я же предвижу, что раньше всех остальных на разработку калифорнийских ученых наложит лапы все то же АНБ. Это же очевидно - прочие приложения меркнут перед революцией, которую совершит выделение речи из белого шума в методах внешнего наблюдения. Достаточно будет одного жучка на целый дом, чтобы выделять и записывать все разговоры, семантика которых удовлетворяет сформированным на обычном языке запросам.

Такая перспектива внушает мне поистине вселенский оптимизм - государство, вооруженное подобными технологиями, неуязвимо для внутренней угрозы. А если оно к тому же обладает и ядерным оружием, оно защищено и от атаки извне. Я не имею в виду исключительно США - в Советском Союзе технологии распознавания с самого начала курировались КГБ, и можно предполагать существование советских разработок того же уровня, что и технологии АНБ.

А значит, с некоторым опозданием, но все же оправдывается прогноз Оруэлла о создании безупречного государства - неуязвимого и справедливого, всеведающего и управляющего сознанием своих граждан для формирования и поддержания гармоничного общества. В будущем компьютер будет с точностью более 95% определять людей, угрожающих государству, и предлагать оптимальную методику перевоспитания.

Дмитрий БОРОДАЕНКО,
[email protected]

Версия для печатиВерсия для печати

Номер: 

48 за 1999 год

Рубрика: 

Размышлизмы
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!