Театр одного актера (КВ-Лайт)

Если вы относитесь хотя бы к одному делу не в шутку, а всерьез, то наверняка страдаете от жесткого дефицита времени. Причем, времени не хватает не только на обдумывание, реализацию и доводку проектов, но и на самое элементарное - пополнение своей личной профессиональной "базы знаний". Что уж говорить о таких "излишествах", как знакомство с новинками художественной литературы: многие могут позволить себе эту роскошь только в отпуске.

Если вышесказанное относится и к вам, предлагаю воспользоваться отработанной технологией. Каждый день ваш мозг вынужденно "простаивает" много минут, а то и часов: например, когда вы убираете квартиру, находитесь за рулем автомобиля, в трамвайной давке, в очереди к зубному врачу и т.п. Использовать это время для потребления полезной информации помогут программы синтеза речи, многие из которых обладают функцией записи в mp3-формат (а дальше - дело техники: сбросить полученные аудиодокументы или аудиокниги на карманный компьютер или mp3-флэш плеер).

Еще несколько лет назад, когда я только увлекся темой синтеза речи, пользователи высказывались на форумах единодушно: лучше программы "Говорилка" (www.vector-ski.ru/vecs/govorilka) не найти. К сожалению, эта программа уже несколько лет не поддерживается (хотя на днях ее автор пообещал в письме представить публике новую версию в обозримой перспективе). Свято место пусто не бывает, и в ходе недавнего поиска по теме синтеза речи я обнаружил, что у народа появились новые фавориты. В частности, многие пользователи рекомендуют друг другу программу Mp3book2005 (www.mp3book2005.narod.ru). Она пришлась многим по душе благодаря уникальной особенности: умению автоматически менять темп, тембр и высоту речи в зависимости от контекста. Благодаря этому созданные с ее помощью аудиокниги избавлены от традиционной монотонности компьютерного синтезатора речи. Компьютер превращается в театр одного актера, создающего целые аудиопостановки со множеством героев.

Давайте познакомимся с программой и ее разработчиком подробнее.


Владимир Шойтов-Харитановский. 45 лет. Образование высшее. Живет и работает в г.Курске (РФ). Голосовыми технологиями занимается почти 10 лет, сначала как пользователь, а потом и как разработчик.


- Владимир Юрьевич, что Вас заставило заняться непростой темой синтеза речи?

- Одно из моих постоянных увлечений - фантастика. Я человек ленивый, поэтому всегда хотел, чтобы книжку мне кто-нибудь читал. Когда около десяти лет назад на свет появилась программа "Говорящая Мышь для дома", я в ней нашел то, что так долго искал! Но с точки зрения создания аудиокниг эта программа была несовершенна: она, например, не воспринимала текстовые файлы больше 40 килобайт. А запись аудиофайлов в ней отсутствовала вообще. Не вполне устроила меня и замечательная программа Антона Рязанова Govorilka_CP. Я понял, что с достаточно специфической проблемой записи аудиокниг могу справиться и сам, причем гораздо лучше.

- Как Вам пришла в голову идея, так сказать, режиссирования аудиокниг? Есть ли у нее аналоги?

- Идея приблизить звучание компьютера к нормальной человеческой речи возникла сразу после знакомства с "Говорящей Мышью". В ней заложена возможность с помощью расстановки служебных команд создавать своего рода радио-спектакли - с музыкой, песнями и другими эффектами. Оставалось сделать программу, которая будет сама анализировать текст и автоматически расставлять нужные команды в нужных местах, разбивая текст на блоки и программно меняя параметры голоса в диалогах. Поначалу я создал свою программу для собственных нужд, но затем решился ее опубликовать. В 2003 году появилась бесплатная MP3book, в 2005-м - платная MP3book2005. Еще в прошлом году моя разработка достаточно долго оставалась единственной на рынке программой, способной автоматически разбивать текст книги на интонационные фрагменты и анализировать диалоги. Но затем идея настолько увлекла массы, что отдельные программисты стали использовать ее в собственных разработках. С некоторыми авторами (например, с Олегом Подленко - www.kom-pas.narod.ru, создавшим программу Аudiobook) у меня сложились очень хорошие творческие отношения: мы регулярно обмениваемся идеями и новой информацией по голосовым технологиям.

- Каковы достоинства и недостатки Mp3book2005, по сравнению с конкурирующими продуктами?

- Когда я найду программу, которая будет полностью отвечать всем моим запросам, то, наверное, перестану развивать свой проект. Есть платная MaxReader (maxreader.narod.ru), но разрабатывалась она для незрячих пользователей, а для нормальных людей очень неудобна. Есть бесплатная "Говорилка", по-прежнему одна из лучших программ синтеза речи, но она практически непригодна для записи аудиокниг. Обе программы поддерживают только старый стандарт SAPI-4, и новые разработки голосовых движков им недоступны. Есть бесплатный Audiobook, поддерживающий новый стандарт SAPI-5, но он, как и предыдущие программы, не анализирует диалоги и речь получается монотонной. Иностранные программы практически непригодны для использования русскоязычной аудиторией, поскольку в них всегда возникают проблемы с голосовым движком: например, Digalo2000 отказывается произносить букву "ч" в любых словах! Возможно, ситуация изменится, когда азиатские производители бытовых устройств, которые уже начали встраивать в свои изделия чипы синтеза речи, смогут обеспечить качественный синтез русской речи. Но вернемся к Mp3book2005. Ее преимущества: ускоренная запись в аудиофайл, поддержка форматов для мобильных телефонов и расширенные сервисные функции. Очень низкая загрузка процессора при работе программы позволяет создавать аудиокниги в фоновом режиме. Недостаток - отсутствие оперативного контроля процесса записи аудиокниги: остановить запись можно только с помощью пресловутой комбинации клавиш Ctrl+Alt+Del и диспетчера задач Windows. Но это проблема не столько самой программы, сколько голосового интерфейса SAPI-5 от Microsoft. Возможно, в будущем я перейду на голосовой модуль сторонних производителей, в котором такой проблемы нет - по крайней мере, первые эксперименты меня очень обнадежили.

- Каков отклик пользователей на Вашу программу?

- Mp3book2005 доступна в интернете почти год. За это время ее скачало более тысячи пользователей популярных download-порталов (GetSoft.ru, Download.ru и др.). Но основной поток закачек идет с моего сайта www.mp3book2005.narod.ru - в среднем, его посещают четыре тысячи пользователей в месяц. Незарегистрированной версией можно бесплатно пользоваться неограниченное время - ее функции урезаны незначительно. Среди зарегистрированных пользователей есть спецбиблиотека для слепых Барнаула и организация общества слепых Одессы. Для студии звукозаписи аудиокниг "КРОТ" города Железногорска сделана специальная версия с их рекламными вставками. Индивидуальные пользователи - это, в основном, люди старше 25 лет, которые на MP3-плеере слушают не только музыку. Восторженных откликов не много (в основном, от женщин, в силу их эмоциональности). Как правило, мне приходят письма с положительной, в целом, оценкой программы и просьбой реализовать в будущих версиях какую-то конкретную функцию. Если эти просьбы не идут вразрез с моей концепцией развития программы, я обязательно иду навстречу "пожеланиям трудящихся". Помимо пожеланий, многие пользователи оказывают практическую помощь. Особенно я благодарен Владимиру Николайчуку за присланную информацию по голосовым движкам и помощь в тестировании программы, а также профессору Г.Н. Сердюкову - за предоставленные электронные словари и практические идеи по оптимизации озвучивания омографов (слов с одинаковым написанием, но различным, в зависимости от контекста, произношением).

- Каковы сферы возможного применения программы?

- Основная - заполнение бесцельно растрачиваемого времени приятным или полезным занятием. Имею в виду прослушивание аудиокниг (художественных произведений, учебной литературы и др.) в тех жизненных ситуациях, когда время попросту теряется, а читать обычную книгу или неудобно, или вообще невозможно. Это могут быть тренировка в спортзале и домашние хлопоты, стояние в очередях и сидение в транспорте, отдых и монотонная физическая работа. С помощью Mp3book можно производить аудиокниги в промышленных масштабах - благо, в программе есть возможность многокомпьютерной обработки, которая пропорционально увеличивает производительность. Для серьезных студий аудиозаписи это возможность оперативно выпустить "сигнальный" тираж перед студийной актерской записью с целью оценки покупательского спроса (по аналогии с видео: сначала - пиратская "экранка", потом - лицензионный DVD).

- Много ли времени Вы уделяете своему проекту?

- Голосовые технологии - это мое хобби, и поэтому, естественно, я занимаюсь этим в свободное от работы время, иногда даже в ущерб семье. Именно поэтому программа MP3book2005 относится к категории условно-бесплатных - чтобы хоть как-то оправдать мое увлечение компьютерным синтезом речи перед моими близкими.

- И традиционный вопрос - плагиаторы, очнитесь! - о Ваших творческих планах...

- Естественно, буду заниматься дальнейшим развитием программы и, в первую очередь, исправлением недоработок майкрософтовского SAPI-5. Есть еще несколько идей, о которых пока скромно умолчу. Конкуренты на самом деле никогда не дремлют! Кстати, к конкурентам отношусь очень благожелательно. Их наличие - дополнительный стимул для совершенствования программы! А вот к плагиаторам отношение - как у любого нормального человека: это неудачники, пытающиеся вскарабкаться на чужие плечи. Хотя наличие плагиата - тоже в какой-то мере подтверждение популярности и высокого уровня программы.

Беседовал Юрий СМИРНОВ

Версия для печатиВерсия для печати

Номер: 

08 за 2006 год

Рубрика: 

Эксклюзивное интервью
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!

Комментарии

Аватар пользователя Константин
Очень своевременная статья! Благодаря КВ я узнал о такой замечательной программа MP3воок2005. Прикольно - сайт Белорусский, значит программу в Белоруссии знают, а в России она практически неизвестна. Молодцы белорусы! Так держать руку на пульсе компьютерных новостей!

Константин из Смоленска