Автор/Источник: Константин» 25.02.2007 23:50, просмотров сегодня: 1, всего: 27765
статья размещена в группе: Программы
оценка: 4.27, 41 голос
Я давно занимаюсь созданием аудиокниг на «большом брате»
(обычный ПК) и прослушиваю их на своем HP IPAQ h6340 через наушники во
время езды по городу, в очередях, на прогулках и т.д. Уже настолько
привык, что скучаю и не знаю, чем себя занять в свободные минуты, если
нет под рукой покета или свежей аудиокниги. Предполагаю, что не я один
такой, и среди счастливых обладателей КПК найдется много моих
единомышленников. У меня уже есть определенный опыт создания аудиокниг,
и я захотел поделиться им и наработками, своими и найденными в инете. Так
родилась эта статья.
Уже давно я пользуюсь программой MP3book2005 от
Шойтова-Харитановского В. Ю. (сайт — http://www.mp3book2005.narod.ru),
даже некоторое время переписывался с автором, пытался помочь ему
улучшить программу, чтобы все пользователи mp3book, и я в частности,
работали с действительно хорошей программой, наиболее качественно
создающей аудиокниги... Последняя версия программы действительно
хороша, я думаю лучшая на сегодняшний день, по сравнению с говорящими и
записывающими программами других авторов (это не реклама программы, я
не имею отношения к ее продаже, это моё личное мнение). Конечно,
недостатков и глюков хватает, программа ещё далеко не идеальна, но
основные моменты сделаны, думаю, что автор продолжает работать по ее
совершенствованию. Есть еще одна неплохая программа — KooBAudio (сайт — http://www.koobaudio.narod.ru),
но автор бросил ее, и сейчас она сильно отстала
от MP3book2005,
поэтому
мы не будем здесь ее обсуждать.
Пользуюсь я голосовым движком
Acapela-Elan-TTS-SpeechCube-5.1-RUS-Nicolai (найти в Google).
В указанной версии сняты все ограничения и можно использовать до 255
каналов (200 КБ чистого текста записываются за 3-4 минуты!!!), спасибо
программистам, сделавшим это... С MP3book2005 +
Acapela-Elan-TTS-SpeechCube-5.1-RUS-Nicolai стало работать очень
приятно, но это еще далеко не все…
Итак, с чего начать, однозначно начнем сначала…
Скачиваем и устанавливаем движок (все параметры оставляем по
умолчанию), затем инсталлируем MP3book2005 версии 340 и выше
с сайта разработчика (также все по умолчанию). Именно версия
340 и будет рассматриваться в статье, при работе с более ранними
версиями MP3book2005 и с другими голосовыми движками, могут
быть
«несоответствия» с моим рассказом.
Программу лучше зарегистрировать (по желанию и возможностям),
так как в незарегистрированной версии есть довольно неприятные
ограничения. Далее я буду говорить только о
зарегистрированной MP3book2005
версии 340 и выше, в которой нет ограничений на
использование некоторых функций.
Перед началом работы рекомендую зайти на страницу программы и
внимательно изучить «вид и описание программы» (http://www.mp3book2005.narod.ru/9.htm)
и «FAQ» (http://www.mp3book2005.narod.ru/5.htm).
Далее копируем файл exc_rus.txt из папки «C:/Program
Files/Acapela Telecom TTS/Data» (куда установлен голосовой
движок), в директорию с программой MP3book2005 (по умолчанию
«C:/Program Files/MP3book2005»). Об этом написано в инструкции по работе
с MP3book2005 на сайте разработчика и в хелпе самой программы.
При желании, регистрируем программы на странице
http://www.mp3book2005.narod.ru/10.htm
и получаем код,
снимающий все ограничения.
Если все верно сделано, то программа готова к первому запуску.
Запускаем MP3book2005, идем в «Настройки
программы» и выбираем голосовой движок
SpeechCube-5.1-RUS-Nicolai и проверяем его звучание. Если «не
звучит», то внимательно изучаем «FAQ» и
«Гостевую книгу», там же можно задать вопросы
автору.
-обращаю ваше
внимание на
эту кнопку.
Желательно выбрать максимальный отступ от края страницы, это
позволит
функции «Поиск омографов» работать лучше. Пока
примите на веру, далее поясню.
Рис. 1
Рис. 2
Рис. 3
Еще один момент: путь к каталогу с аудиокнигами (в окошке
«Рабочий каталог») следует указывать с
«нижним подчеркиванием» вместо пробелов, иначе программа будет
«ругаться» табличками с напоминаниями об этом (рис. 2).
На рисунках приведен, как пример вариант моих настроек
программы. Можно
его использовать.
— если все сделано, то
жмем эту кнопку.
Программа настроена, далее приступаем, собственно, к самому
процессу
подготовки текста аудиокниги к записи.
Открываем директорию с текстовыми файлами книг (у меня это
D:/MY_DOC/Электронные_книги), находим нужный файл и делаем его
копию. Обязательно нужно сделать копию, так как после
обработки «вордом» и программой MP3book2005 текст файла несколько
изменится. Далее мы будем работать с
этой копией, а оригинал останется нетронутым.
Загружаем Microsoft Word, WordPad или подобный текстовый
редактор,
открываем TXT-файл книги и с помощью меню
«Правка» и пунктов «Найти» и
«Заменить» удаляем из текста все кавычки и круглые
и квадратные скобки. Как показывает практика, они частенько влияют на
произношение слова или слов, заключенных в них. Это связано с тем, что
SpeechCube-5.1-RUS-Nicolai воспринимает скобки или кавычку и само
слово, как одно целое, и совершенно непредсказуемо меняет ударение.
Кроме того, при чтении (записи) текста «Николаем», произношение знака
«кавычка» или «скобка» — не отличается от чтения пробела между словами.
Можно также произвести общее форматирование и очистку
текста от
ненужных, на ваш взгляд, различных значков технического назначения и
прочего «мусора», могущего вызвать зависание
голосового движка, хотя в самой программе MP3book2005 есть
автоматическая и ручная очистка и форматирование текста.
Рекомендуется разбить текст на куски по 50 страниц
(конечный MP3-файл будет в таком случае «весить» примерно 50-60 МБ), но
это по желанию.
Если все сделано, то можно сохранить полученные TXT-файлы
(именно в формате TXT, то есть голый текст без форматирования) и
закрыть
Microsoft Word, он нам больше не понадобится.
Далее, загружаем MP3book2005 и открываем с помощью меню
«Файл» подготовленный и сохраненный ранее файл.
Нажимаем «Поиск новых слов» в пункте
«Обработка текста», и выбираем один из предложенных
пунктов, если что-то непонятно, нажимаем «знак
вопроса» — .
Я всегда выбираю первый пункт. В конце поиска получите список
«новых слов», примерно, как на рис.4.
Рис. 4
На этом этапе нужно знать следующее: в голосовом движке есть
два словаря, они находятся в директории
«Data» (по умолчанию «C:/Program Files/Acapela
Telecom TTS/Data»), это файл «словаря ударений»
exc_rus.txt и файл словаря «цифр, аббревиатур и
сокращений» — abb_rus.txt. В директории программы MP3book2005
(обычно «C:/Program Files/MP3book2005»), есть еще два файла
влияющих на правильное произношение «Николаем» слов, это файлы
homograph.txt и Nicolai.dic. О них поговорим позже.
В файл exc_rus.txt (или словарь ударений) можно добавлять
слова и
словосочетания. Для более удобной работы с этим словарем,
автором MP3book2005
разработан достаточно функциональный «Редактор словаря
ударений» (рис.5).
Рис. 5
Для занесения «обычных» слов в «словарь
ударений» — используем редактор на рис. 5. Настоятельно рекомендую
заглянуть в файл справки (пункт меню «Помощь»). Не буду пересказывать
его содержимое, обращу ваше внимание только на
некоторые моменты. Не забывайте «отжимать» знак регистра
«/i», если вносите в словарь различные имена и
названия, которые пишутся с большой буквы (не путайте со словами, с
которых начинается предложение), и «нажимать», если
вносите слова с маленькой буквы.
В левом окошке «Добавление новых слов» пишется
слово, как оно написано в тексте, а в правом — как оно
произноситься Николаем, поэтому здесь, для правильного произношения
слов допускается свободная
«транскрипция» слов, чтобы звучание было
естественным. На рисунке 6 изображен пример.
Рис. 6
Если вы вставляете в левое окошко «Добавление новых
слов» слово из текста, то проследите, чтобы перед
копированием в буфер обмена, значок языка в трее, показывал русский
язык «RU», иначе при вставке в окошке появятся
только знаки вопроса «????????«. Это касается
любого копирования слов в буфер.
Не следует, добавлять в словарь цифры в «чистом виде»,
такие например как 1965, 16-123 и др., сокращения с точками, например:
«т.д.», «проф.» и другие, на
мой взгляд, не стоит так же, «загрязнять» его
сокращениями, аббревиатурами типа «ФК-12«,
«АК-47», «Кбайт»,
«СССР», иностранными словами типа
«CD-ROM», «High-End» и прочими,
а так же словосочетаниями типа «анализ крови»,
«взлетно-посадочной полосы» и тому подобными, так
как для этого, предусмотрен другой словарь. Добавленные «слова» из
списка выше либо не сохраняются в словаре, либо «вешают» голосовой
движок при воспроизведении.
Следует помнить, что пропущенное вами слово с «неправильным
ударением» в окне «Поиска новых слов» не
будет снова там появляться. Если такое случилось — редактируйте файл already_listened.txt в директории программы (удалите
от туда ненужные слова).
Помните, что занесение слов в словари — достаточно
ответственная процедура, так как слова с ошибкой и
«неправильным» ударением будут в дальнейшем
постоянно «искажать» записанные вами аудиокниги.
Проверить занесенные в «Словарь ударений»
слова, можно в файле Added_Words_in_exc_rus.txt в папке MP3book2005.
Нужно обратить внимание на слова с «Е» и
«Ё». Слова содержащие «Е»
(особенно ударные) и «Ё», частенько произносятся «Николаем» неверно, то
есть, вместо «Ё»
произноситься «Е», значительно реже — наоборот, но тоже бывает. Для гарантированно-правильного произношения,
слова с «Ё» в «словарь
ударений» заносятся так:
алтарем : <алтарём> /i
Причем обратите внимание на то, что после «Ё» знак
ударения «<» — не ставиться, так
как «Ё» сама по себе ударная.
Слова с «Е» для гарантированно-правильного
произношения «Николаем» заносятся так:
девятнадцатилетний : <девятнадцатилеъ<тний> /i
Обратите внимание на твердый знак «Ъ» после буквы
«Е», он служит гарантией правильного произношения
«Е» в слове.
Рекомендуется регулярно использовать в «Редакторе словаря
ударений» пункты содержащиеся в меню
«Проверка» для «чистки» и
сортировки словаря. Вообщем, будьте внимательны при работе со словарями.
Для добавления цифр, дат, аббревиатур, сокращений, иностранных
слов и
имен, предусмотрен другой словарь — abb_rus.txt. К сожалению, для
работы
с ним нет удобного редактора, более того, в программе MP3book2005 есть
недоработки или глюки, не позволяющие ей правильно работать с
этим словарем. Программа работает со всем содержимым этого словаря,
кроме сокращений типа «т.к.»,
«т.п.», «стр.»,
«проф.» и так далее. Создается впечатление, что
автор недооценил, либо игнорирует значение этого словаря в озвучивании
текстов программой MP3book2005. Есть надежда, что в дальнейшем этот
глюк MP3book2005 будет успешно устранен.
Возвращаясь к словарю сокращений, я лично пополняю его
следующим образом: если в окне
«Поиска новых слов» есть слово, которое мне нужно
занести в этот словарь, то я нажимаю кнопку «Найти в
тексте», копирую слово в буфер обмена и делаю вставку в конце
списка в файле abb_rus.txt (по умолчанию в папке «C:/Program
Files/Acapela
Telecom TTS/Data»).
При этом следует знать правила занесения слов в этот словарь.
Они
простые: разделяется слово и его произношение — пробелом.
Например:
FineReader Файн-ри<дэр
Кбит/с килоби<т в секунду
То есть, слово FineReader — через один пробел — его произношение Файн-ри<дэр. Поэтому в этот словарь
нельзя вставлять словосочетания из 2-х и более слов, так как пробел
отделяет слово от его транскрипции. Но можно
внести такое словосочетание, как Corporation Apple, следующим
образом:
Corporation корпорэ<йшин
Apple эй<пл
Вообщем, откройте файл abb_rus.txt и посмотрите внимательно,
как внесены туда слова, и делайте также.
для правильного их произношения «Николаем». Сюда я, также, добавляю
слова с комбинацией цифр и букв, например:
62-миллиметрового
шести<десятидвух-миллиметро<вого
63б шестьдеся<т-три-бэ
800-миллиметровой восемьсот-миллиметро<вой
9-миллиметровая девяти-миллиметро<вая
9-миллиметрового девяти-миллиметро<вого.
Мы закончили с «Поиском новых слов» и переходим к
следующему пункту «Поиск омографов».
Рис. 7
После работы программы поиска омографов мы видим слова
окрашенные в 3
основных цвета: красный, желтый и зеленый (настало время поговорить о
2-х файлах homograph.txt и Nicolai.dic, которые принадлежат самой
MP3book2005 и существенно влияют на
«качество» записанной аудиокниги).
Красные — это слова которые содержаться в файле
homograph.txt
(по умолчанию в папке «C:/Program Files/MP3book2005»). Можно пополнять
данный файл, точно так же как и словарь abb_rus.txt. Я также вношу в
словарь homograph.txt и слова, которые не являются омографами,
но на
которые хотел бы «обратить внимание»,
если таковые имеются в тексте. Например, слово
«чем-то». Иногда в тексте его нужно произносить
слитно: «че<мто озабочен», а иногда
раздельно: «че<м то<, что у тебя
есть».
Желтые — это слова из «словаря ударений»,
найденные в тексте… Я не знаю, зачем мне на них
смотреть…
Зеленые — это словосочетания из файла Nicolai.dic. В
сущности
это файл «автозамены». В него я заношу
словосочетания содержащие омографы, но в которых эти самые омографы
произносятся однозначно, например:
аромат моря=аромат мо<ря
ароматические свечи=ароматические свеъ<чи
ароматом духов=ароматом духо<в
асфальту дороги=асфальту доро<ги
африканские вороны=африканские во<роны
африканские голоса=африканские голоса<
африканские земли=африканские зеъ<мли
бамбуковые леса=бамбуковые леса<
В этот словарь я также заношу года, дни, месяцы и тому
подобное, например:
1305 года=ты<сяча три<ста пя<того
го<да
1305 году=ты<сяча три<ста пя<том
году<
130-го=сто тридца<того
130-й=сто тридца<той
003=ноль ноль три<
004=ноль ноль четы<ре
1 августа=пе<рвого а<вгуста
1 апреля=пе<рвого апре<ля
1 год=пе<рвый год
При работе программы «поиска омографов» цифры в
тексте, должны заменяться их словесным выражением, для правильного
прочтения.
Небольшие рекомендации по функции поиск омографов. Выбирайте
максимальный отступ от левого края рабочего окна
программы. Я уже говорил об этом выше. Объясняется это моим
наблюдением за работой функции «автозамены» при
поиске омографов в программе MP3book2005. Рекомендую также «прогонять»
«поиск
омографов» 2-3 раза. Не могу доказать это, но при
повторном запуске «Поиска омографов» часто помечаются
«красным» слова, не найденные при первом проходе.
Ну вот, кажется все основные моменты перечислил. Не
забывайте регулярно сохранять копии словарей движка и вышеперечисленных
файлов в «надежном месте» на всякий пожарный случай.
Прилагаю комплект вышеперечисленных файлов (скачать файл Slovar.rar), дополненных частично
автором MP3book2005, частично мною. Для получения «максимального
эффекта», рекомендую использовать эти словари только целиком, с
указанной версией программы и с указанным голосовым движком.
Если есть вопросы по данной статье, пишите:
karina_karina[собака]inbox.ru
|