Обзор голосовых движков, поддерживающих русский язык и программ для преобразования текста в аудио.
Обилие
книг в электронном виде, доступных для скачивания в Интернете или
распространяемых на CD-дисках, подводит пользователя к необходимости
поиска новых способов восприятия подобной информации. Если читать эти
книги с экрана, то рано или поздно можно посадить зрение. Печатать
тексты на принтере для последующего прочтения - довольно затратное и
хлопотное дело, увеличивающее горы макулатуры. Отличной альтернативой
традиционным способам прочтения текстов является их озвучивание с
помощью компьютерных чтецов. Здесь собраны практически все
русскоязычные голосовые движки когда-либо созданные и программы для
создания аудиокниг. Немного теории для начала. Text-to-speech
engine или движки синтеза речи (голосовые движки) - это программы,
выполненные в виде системного драйвера, предназначенные для
преобразования текста в речь. Движки синтеза речи не имеют внешнего
интерфейса, поэтому для того, чтобы Ваш компьютер заговорил, не
достаточно установить только движок. Для использования движка
необходима программа синтеза речи, которая выполняет роль интерфейса,
позволяет работать с движком, изменять его настройки, звучание речи,
использует дополнительные возможности. Настроек поддерживаемые движками
немного: скорость речи (speed), высота голоса (тембр, pitch), громкость
(volume) и ускоренный режим записи (т.е. режиме при котором запись идет
в несколько раз быстрее, чем проигрывание полученного аудиофайла в
реальном времени).
ГОЛОСОВЫЕ ДВИЖКИ
Название SAPI Автор Microsoft Сайт http://www.microsoft.com/reader/developers/downloads/tts.asp Описание Для
работы функций голосового сопровождения требуется установленный в
системе голосовой движок Microsoft Speech API (SAPI). На данный момент,
существует две версии SAPI: SAPI 4 и SAPI 5. В Windows XP голосовой
движок SAPI 5 установлен по умолчанию, а в и Windows 2000 только SAPI
4. Разница между версиями для конечного пользователя заключается в
наличии и поддержке голосов. Дело в том, что SAPI 5 не поддерживает
голосов для SAPI 4 и наоборот. При этом, для обеих версий выпущено
достаточно много голосов. SAPI 5 позволяет добиться более качественного
произношения, однако для нее меньше бесплатных голосов. Таким образом,
для полноценной поддержки речевого синтеза, рекомендуется иметь в
системе SAPI 5 и SAPI 4. Также необходимы голоса чтецов
(Text-To-Speech), которые определяют язык, тембр и другие особенности
произношения. По умолчанию с SAPI 5 идет голос на английском Microsoft
Sam.
Назавание L&H TTS 3000 Russian Автор Lernout&Hauspie (L&H) Сайт http://www.lhs.com Дата 1997 Поддержка SAPI 4 Описание
Так себе движек, с не очень хорошим качеством синтеза русской речи.
Отчетливо слышен акцент. Есть два голоса мужской (Boris) и женский
(Svetlana). Совместим со многими программами синтеза речи.
Название Orator Автор Петр Головин Сайт нет Дата 2003 Поддержка SAPI нет Описание Предназначена
для "чтения" русских текстов с помощью своего собственного синтезатора
речи. Под DOS. Запись в wav. Качество произношения наихудшее из всех.
Речь еле различима.
Название Speaking Mouse Автор Научный парк МГУ Сайт нет Дата 1995 Поддержка SAPI нет Описание Работает
под всеми Windows, но создан он под Win95; под другими Windows работает
непредсказуемо и окно открывается не полностью. Записи в аудиофайл нет.
Соответственно и произношение хуже, чем у L&H.
Название ElecGeste TTS Voice Автор ElecGeste Сайт http://www.elecgeste.ru Дата неизвестно Поддержка SAPI 5 Описание Мужской механический голос, наподобие голосов от L&H.
Название Sakrament TTS Engine Автор Sakramanet Сайт www.sakrament.com Дата 2006 Поддержка SAPI 5 Описание Русскоговорящий
движок Sakrament версии 2.1 от белорусской фирмы Sakrament с программой
для чтения текстов Рассказчiк v2.0 и русскими голосами в комплекте. На
сайте представлена версия 3.0, но скачать даже демо оттуда нельзя.
Голоса конечно не фонтан, но лучше чем у L&H. Поддерживает
ускоренную запись.
Название Digalo 2000 Nicolai TTS Автор Acapela Сайт http://www.digalo.com Дата 2000 Поддержка SAPI 4 Описание Этот
русский модуль представлен голосом «Николая» - Digalo Russian Nikolai.
Более качественный движок по сравнению с вышеперечисленными, но имеющий
несколько недостатков, главный из которых невозможность записывать
синтезированную речь в аудиофайл в ускоренном режиме.
Название Acapela Elan Speech Cube Telecom RUS (Nicolai). Автор Acapela Сайт http://www.elantts.com Дата 2005 Поддержка SAPI 4 и 5 Описание Еще
один русский модуль голосового движка версии 5.1 от Acapela, это новый
синтезатор речи TTS из серии "digalo". Голос тот же, «Николая» - Speech
Cube Russian(Nicolai 16khz). Качественно само произношение практически
не изменилось, но излечился от некоторых старых болезней: теперь не
сбоит на глючных словах и длинных паузах, позволяет записывать речь с
ускорением, намного шире диапазон настраиваемых параметров речи.
Значительно расширен и частотный диапазон нового "Николая": от голоса
человека, перенесшего трахеотомию, до кастрированного в раннем детстве
старика. Возможность подключения других словарей.
Название ScanSoft RealSpeak Russian Voice (Katerina) Автор ScanSoft (сейчас это Nuance Communications) Сайт http://www.nuance.com/realspeak/ Дата 2005 Поддержка SAPI 5 ОписаниеЖенский
голос «Катерины» при скорости по умолчанию больше напоминает
истерическую алкоголичку, но при этом более «человеческий», чем у
«Николая». Поддерживает ускоренную запись. Правда есть несколько
недостатков: движок не поддерживает тембр голоса, невозможно подключать
словари к нему и иногда прорывается некоторый гул.
ПРОГРАММЫ ДЛЯ ПРЕОБРАЗОВАНИЯ ТЕКСТА В АУДИО
Все
программы в этом обзоре созданы (или имеют как функцию) для
преобразования текста в аудио с помощью установленных голосовых
движков, поэтому в описании буду указывать их особенности и личное
мнение. Уточню некоторые нюансы. Программа может работать с голосовыми
движками под SAPI 4 или 5, либо с обеими. Например, если только под
SAPI 4, то с движками Digalo и Acapela. Текст. форматы – читаемые
программой текстовые файлы. Аудио – поддерживаемые программой формат
записи аудиофайлов. Интонация – набор настроек голосового движка. В
стандартной «комплектации» (без интонации) можно изменять скорость,
тембр и громкость речи только для всего текста, однако некоторые
программы выделяют диалоги, повествования, комментарии и т.д., для
каждой из них можно определить свой набор настроек(скорость, тембр и
громкость). Это (то, что выделяют программы из текста) и буду указывать
в пункте «Интонация».
Название Aboo Версия 0.7.0 Дата 11.2006 Автор Петрухин Д. Сайт http://parovoz.com.ua/aboo/ Язык русский Поддержка SAPI 5 Текст.форматы txt,html,htm,rtf,doc Аудио mp3 Интонация обычный, диалог, примечание Описание Компактная программка с необходимым минимумом функций. Работа со словарями на зачаточном уровне. Работы с буфером обмена нет.
Название AudioBook Версия 1.3.2 Дата 12.2006 Автор Podlenko O.N. Сайт http://kom-pas.narod.ru/audiobook_net.htm Язык русский Поддержка SAPI 4 и 5 Текст.форматы txt,html,htm,rtf,doc Аудио wav,mp3,wma,ogg,vox,au,aiff Интонация автор, речь,реч м.,реч ж.,англ Описание Компактная
программа; возможности редактора словаря слабые; иногда «глючит»; не
работает без .NET Framework версии 2.0.50727; может автоматически
очищать текст от ошибок с произношением типа "ПРОСТРАНСТВА" на Digalo и
Elan; автоматически разбивает книгу на фрагменты при записи
Название AudioBookMaker Версия 1.5.2 Дата 2004 Автор Anton Ryazanov Сайт http://www.audiobookmaker.com/ Язык русский Поддержка SAPI 4 Текст.форматы txt,html,htm,shtml,rtf,doc Аудио mp3 Интонация нет Описание Устаревшая
уже программа, которая не имеет возможность выбора ускоренной записи;
не регулируются настройки движка Elan (Nikolai16).
Название Govorilka Версия 2.06 Дата 2006 Автор Anton Ryazanov Сайт http://www.vector-ski.com/vecs Язык русский Поддержка SAPI 4 Текст.форматы txt,html,htm,shtml,rtf,doc Аудио mp3 Интонация нет Описание.
Это обновленный AudioBookMaker, с улучшенным интерфейсом и работы со
словарями, но не работает настройка громкости; открывает большие файлы
в DOS и Windows кодировке; чтение текста из буфера обмена.
Название KooBAudio Версия 0.7.07 Дата 2006 Автор Павлов М.Д. Сайт http://www.koobaudio.narod.ru/ Язык русский Поддержка SAPI 5 Текст.форматы txt,html,htm,rtf,doc,fb2 Аудио mp3 Интонация повествование,речь,речь2, комментарии Описание Неплохая
программа, которая разработана и "заточена" специально под движок ELAN
Speech Cube Russian Nikolai; пакетная обработка; широкие возможности
работы со словарями; собственный алгоритм обработки текста словарями
для исправления произношения ударений движком; можно настроить
форматирование имени и тэгов MP3 файлов; есть возможность разделения
книги по оглавлению.
Название MP3Book2005 Версия 340 Дата 2006 Автор Шойтов-Харитановский В.Ю. Сайт http://mp3book2005.narod.ru Язык русский Поддержка SAPI 5 Текст.форматы txt Аудио wav,mp3,wma,ogg,amr,vmo Интонация обычный, диалог, примечание Описание Добротная
программа, с приятным интерфейсом; неплохие возможности работы со
словарями; пакетная обработка; используемый алгоритм кодирования в MP3
позволяет полностью избавиться от неприятного "металлического"
звучания; интегрированная система поиска "Библиотекарь" позволит очень
быстро и просто найти нужное произведение; предварительная обработка
текста с использованием функции "Поиск новых слов " позволит исключить
их неправильное произношение в тексте произведения; функция "Поиск
омографов" (слов с одинаковым написанием, но разным произношением).
Название 2nd Speech Center Версия 3.00.050818 Дата 2006 Автор Zero Lee Сайт http://www.zero2000.com/ Язык английский Поддержка SAPI 4 и 5 Текст.форматы txt,html,htm,rtf,doc,eml,pdf Аудио wav,mp3 Интонация нет Описание Мощная
на первый взгляд, но слабая по возможностям программа. Грузит процессор
по полной. Работы со словарями нет. Ошибки при работе с движками. Есть
работа с буфером.
Название ICE Book Reader Pro Версия 8.7.1 Дата 2006 Автор ICE Graphics Сайт http://www.ice-graphics.com Язык русский Поддержка SAPI 4 и 5 Текст.форматы txt,rf,doc,htm,shtml,xml, xhtml,pdb,prc,tcr,lit,chm, fb2,xml Аудио wav,mp3 Интонация нет Описание Это
мощная читалка электронных текстов (книг), с возможностью записи
аудиокниг. Минимум настроек; резкие скачки громкости голоса Katerina в
полученном аудиофайле.
Название TextAloud Версия 2.221 Дата 2006 Автор NextUp Technologies Сайт http://www.nextup.com/ Язык английский Поддержка SAPI 4 и 5 Текст.форматы txt,html,rtf,doc,pdf Аудио mp3 Интонация нет Описание Программа читает тексты, письма, Web страницы и документы которые Вы хотели бы услышать. Работы со словарями нет.
Название Balabolka Версия 1.8.0.231 Дата 01.2007 Автор FunnyWords (Ilya Morozov) Сайт http://www.cross-plus-a.com Язык русский Поддержка SAPI 4 и 5 Текст.форматы txt,html,rtf,doc,pdf Аудио mp3 Интонация нет Описание Вполне
качественная программа без особых «изысков»; проверка орфографии,
словарь ударений для Katerina; ошибки при использовании словарей от
движка Elan.
Название ABMSubtitles Версия 1.5 Дата 2005 Автор Anton Ryazanov Сайт http://www.vector-ski.com/vecs Язык русский Поддержка SAPI 4 Текст.форматы txt,srt Аудио wav Интонация нет Описание
Программа для чтения субтитров голосом и записи в wav. Немного сырая и
малопригодная для этих целей, т.к. длинные фразы в диалогах не успевает
проговорить и начинает следующую.
Выводы Лучшие
на данный момент голосовые движки ScanSoft RealSpeak Russian Voice
(Katerina) и Acapela Elan Speech Cube Telecom RUS (Nicolai). Для работы
с Nikolai, по моему мнению, лучше подходят MP3Book2005 и KooBAudio, за
счет широких возможностей настройки голоса и редактирования словарей.
Эти же программы поддерживают и Katerina, однако Balabolka, несмотря на
свои недостатки, имеет собственный словарь для этого движка и
подключаемый модуль проверки орфографии.
|