Компания Google получила патент на голосовой интерфейс. Это уже не первая попытка совместить технологии распознавания и синтеза речи с поиском в интернете.
Американский патент №7,027,987, зарегистрированный на корпорацию Google, описывает "речевой интерфейс для поисковой системы". В нем рассказывается о методе "использования лингвистической модели, фонетического словаря и акустических моделей для того, чтобы сервер генерировал список n-лучших гипотез или словарную диаграмму".
Патент был опубликован только на прошлой неделе, но заявка на него была подана еще в феврале 2001 г. Это значит, что Google, возможно, работает над этой технологией уже довольно долгое время. Об этом свидетельствует и тот факт, что на сайте Google Labs уже давно размещена демо-версия голосового поиска Google Voice Search (labs1.google.com/gvs.html). Эта система позволяет продиктовать поисковый запрос по телефону и сразу же увидеть результат на экране компьютера. Специалисты из компании Google еще в 2002 г. публиковали в соавторстве научные статьи (www.cs.berkeley.edu/~milch/papers/gvs.pdf) о технологиях для голосового поиска.
Два года назад технический директор Google Крейг Сильверштейн делал прогноз, что очень скоро поисковые системы начнут говорить на человеческом языке, а в будущем и вовсе смогут подключиться напрямую к человеческому мозгу. В то же время о голосовом интерфейсе он упомянул практически как о свершившемся факте.
В связи с публикацией нового патента представители Google объяснили, что он не является описанием некоего конкретного продукта. Это совокупность разнообразных идей. Некоторые из них могут найти воплощение в реальных разработках, а другие - нет.
Демо-версия Google Voice Search распознает голосовой запрос и показывает результат на экране компьютера. В коммерческом приложении результаты этого поиска можно отправлять на экран мобильного телефона или на автомобильный компьютер. Как вариант - отправлять их на синтезатор речи и диктовать по телефону в ответ.
Интеграция речевых интерфейсов с поисковым движком - это весьма перспективное направление развития современных технологий. Например, в мае 2005 г. команда израильских ученых под руководством д-ра Мейрав Тайеб-Маймон (Dr. Meirav Taieb-Maimon) объявила о создании полноценного голосового интерфейса Maestro для поиска в интернете.
В Америке уже появились несколько стартапов, которые специализируются на рынке мобильного поиска - по прогнозу Piper Jaffray, этот рынок в 2008 г. вырастет до $11 млрд. Например, компания 4INFO обрабатывает поисковые запросы по SMS и делает это лучше, чем Google. Другие сервисы, вроде PromptU, частично используют голосовые технологии. Много шуму вызвала демонстрация на последней выставке CTIA технологии от компании V-Enable (www.v-enable.com/ctia), способной обрабатывать голосовые поисковые запросы с точностью 90% и отправлять их обратно на мобильник в течение одной секунды.
Анатолий АЛИЗАР
Горячие темы