Если вы относитесь хотя бы к одному делу не в шутку, а всерьез, то наверняка страдаете от жесткого дефицита времени. Причем, времени не хватает не только на обдумывание, реализацию и доводку проектов, но и на самое элементарное - пополнение своей личной профессиональной "базы знаний". Что уж говорить о таких "излишествах", как знакомство с новинками художественной литературы: многие могут позволить себе эту роскошь только в отпуске.
Если вышесказанное относится и к вам, предлагаю воспользоваться отработанной технологией. Каждый день ваш мозг вынужденно "простаивает" много минут, а то и часов: например, когда вы убираете квартиру, находитесь за рулем автомобиля, в трамвайной давке, в очереди к зубному врачу и т.п. Использовать это время для потребления полезной информации помогут программы синтеза речи, многие из которых обладают функцией записи в mp3-формат (а дальше - дело техники: сбросить полученные аудиодокументы или аудиокниги на карманный компьютер или mp3-флэш плеер).
Еще несколько лет назад, когда я только увлекся темой синтеза речи, пользователи высказывались на форумах единодушно: лучше программы "Говорилка" (www.vector-ski.ru/vecs/govorilka) не найти. К сожалению, эта программа уже несколько лет не поддерживается (хотя на днях ее автор пообещал в письме представить публике новую версию в обозримой перспективе). Свято место пусто не бывает, и в ходе недавнего поиска по теме синтеза речи я обнаружил, что у народа появились новые фавориты. В частности, многие пользователи рекомендуют друг другу программу Mp3book2005 (www.mp3book2005.narod.ru). Она пришлась многим по душе благодаря уникальной особенности: умению автоматически менять темп, тембр и высоту речи в зависимости от контекста. Благодаря этому созданные с ее помощью аудиокниги избавлены от традиционной монотонности компьютерного синтезатора речи. Компьютер превращается в театр одного актера, создающего целые аудиопостановки со множеством героев.
Давайте познакомимся с программой и ее разработчиком подробнее.
Владимир
Шойтов-Харитановский. 45 лет.
Образование высшее. Живет и
работает в г.Курске (РФ). Голосовыми
технологиями занимается почти 10
лет, сначала как пользователь, а
потом и как разработчик.
- Владимир Юрьевич, что Вас
заставило заняться непростой темой
синтеза речи?
- Одно из моих постоянных увлечений - фантастика. Я человек ленивый, поэтому всегда хотел, чтобы книжку мне кто-нибудь читал. Когда около десяти лет назад на свет появилась программа "Говорящая Мышь для дома", я в ней нашел то, что так долго искал! Но с точки зрения создания аудиокниг эта программа была несовершенна: она, например, не воспринимала текстовые файлы больше 40 килобайт. А запись аудиофайлов в ней отсутствовала вообще. Не вполне устроила меня и замечательная программа Антона Рязанова Govorilka_CP. Я понял, что с достаточно специфической проблемой записи аудиокниг могу справиться и сам, причем гораздо лучше.
- Как Вам пришла в голову идея, так сказать, режиссирования аудиокниг? Есть ли у нее аналоги?
- Идея приблизить звучание компьютера к нормальной человеческой речи возникла сразу после знакомства с "Говорящей Мышью". В ней заложена возможность с помощью расстановки служебных команд создавать своего рода радио-спектакли - с музыкой, песнями и другими эффектами. Оставалось сделать программу, которая будет сама анализировать текст и автоматически расставлять нужные команды в нужных местах, разбивая текст на блоки и программно меняя параметры голоса в диалогах. Поначалу я создал свою программу для собственных нужд, но затем решился ее опубликовать. В 2003 году появилась бесплатная MP3book, в 2005-м - платная MP3book2005. Еще в прошлом году моя разработка достаточно долго оставалась единственной на рынке программой, способной автоматически разбивать текст книги на интонационные фрагменты и анализировать диалоги. Но затем идея настолько увлекла массы, что отдельные программисты стали использовать ее в собственных разработках. С некоторыми авторами (например, с Олегом Подленко - www.kom-pas.narod.ru, создавшим программу Аudiobook) у меня сложились очень хорошие творческие отношения: мы регулярно обмениваемся идеями и новой информацией по голосовым технологиям.
- Каковы достоинства и недостатки Mp3book2005, по сравнению с конкурирующими продуктами?
- Когда я найду программу, которая будет полностью отвечать всем моим запросам, то, наверное, перестану развивать свой проект. Есть платная MaxReader (maxreader.narod.ru), но разрабатывалась она для незрячих пользователей, а для нормальных людей очень неудобна. Есть бесплатная "Говорилка", по-прежнему одна из лучших программ синтеза речи, но она практически непригодна для записи аудиокниг. Обе программы поддерживают только старый стандарт SAPI-4, и новые разработки голосовых движков им недоступны. Есть бесплатный Audiobook, поддерживающий новый стандарт SAPI-5, но он, как и предыдущие программы, не анализирует диалоги и речь получается монотонной. Иностранные программы практически непригодны для использования русскоязычной аудиторией, поскольку в них всегда возникают проблемы с голосовым движком: например, Digalo2000 отказывается произносить букву "ч" в любых словах! Возможно, ситуация изменится, когда азиатские производители бытовых устройств, которые уже начали встраивать в свои изделия чипы синтеза речи, смогут обеспечить качественный синтез русской речи. Но вернемся к Mp3book2005. Ее преимущества: ускоренная запись в аудиофайл, поддержка форматов для мобильных телефонов и расширенные сервисные функции. Очень низкая загрузка процессора при работе программы позволяет создавать аудиокниги в фоновом режиме. Недостаток - отсутствие оперативного контроля процесса записи аудиокниги: остановить запись можно только с помощью пресловутой комбинации клавиш Ctrl+Alt+Del и диспетчера задач Windows. Но это проблема не столько самой программы, сколько голосового интерфейса SAPI-5 от Microsoft. Возможно, в будущем я перейду на голосовой модуль сторонних производителей, в котором такой проблемы нет - по крайней мере, первые эксперименты меня очень обнадежили.
- Каков отклик пользователей на Вашу программу?
- Mp3book2005 доступна в интернете почти год. За это время ее скачало более тысячи пользователей популярных download-порталов (GetSoft.ru, Download.ru и др.). Но основной поток закачек идет с моего сайта www.mp3book2005.narod.ru - в среднем, его посещают четыре тысячи пользователей в месяц. Незарегистрированной версией можно бесплатно пользоваться неограниченное время - ее функции урезаны незначительно. Среди зарегистрированных пользователей есть спецбиблиотека для слепых Барнаула и организация общества слепых Одессы. Для студии звукозаписи аудиокниг "КРОТ" города Железногорска сделана специальная версия с их рекламными вставками. Индивидуальные пользователи - это, в основном, люди старше 25 лет, которые на MP3-плеере слушают не только музыку. Восторженных откликов не много (в основном, от женщин, в силу их эмоциональности). Как правило, мне приходят письма с положительной, в целом, оценкой программы и просьбой реализовать в будущих версиях какую-то конкретную функцию. Если эти просьбы не идут вразрез с моей концепцией развития программы, я обязательно иду навстречу "пожеланиям трудящихся". Помимо пожеланий, многие пользователи оказывают практическую помощь. Особенно я благодарен Владимиру Николайчуку за присланную информацию по голосовым движкам и помощь в тестировании программы, а также профессору Г.Н. Сердюкову - за предоставленные электронные словари и практические идеи по оптимизации озвучивания омографов (слов с одинаковым написанием, но различным, в зависимости от контекста, произношением).
- Каковы сферы возможного применения программы?
- Основная - заполнение бесцельно растрачиваемого времени приятным или полезным занятием. Имею в виду прослушивание аудиокниг (художественных произведений, учебной литературы и др.) в тех жизненных ситуациях, когда время попросту теряется, а читать обычную книгу или неудобно, или вообще невозможно. Это могут быть тренировка в спортзале и домашние хлопоты, стояние в очередях и сидение в транспорте, отдых и монотонная физическая работа. С помощью Mp3book можно производить аудиокниги в промышленных масштабах - благо, в программе есть возможность многокомпьютерной обработки, которая пропорционально увеличивает производительность. Для серьезных студий аудиозаписи это возможность оперативно выпустить "сигнальный" тираж перед студийной актерской записью с целью оценки покупательского спроса (по аналогии с видео: сначала - пиратская "экранка", потом - лицензионный DVD).
- Много ли времени Вы уделяете своему проекту?
- Голосовые технологии - это мое хобби, и поэтому, естественно, я занимаюсь этим в свободное от работы время, иногда даже в ущерб семье. Именно поэтому программа MP3book2005 относится к категории условно-бесплатных - чтобы хоть как-то оправдать мое увлечение компьютерным синтезом речи перед моими близкими.
- И традиционный вопрос - плагиаторы, очнитесь! - о Ваших творческих планах...
- Естественно, буду заниматься дальнейшим развитием программы и, в первую очередь, исправлением недоработок майкрософтовского SAPI-5. Есть еще несколько идей, о которых пока скромно умолчу. Конкуренты на самом деле никогда не дремлют! Кстати, к конкурентам отношусь очень благожелательно. Их наличие - дополнительный стимул для совершенствования программы! А вот к плагиаторам отношение - как у любого нормального человека: это неудачники, пытающиеся вскарабкаться на чужие плечи. Хотя наличие плагиата - тоже в какой-то мере подтверждение популярности и высокого уровня программы.
Беседовал Юрий СМИРНОВ
Комментарии
Константин из Смоленска