Сборники тезисов • Информационные и интеллектуальные системы и технологии • Речевые информационные системы
Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, 2018.
Пример заполнения выходных данных:
Мирзаянова С.В., Затворницкий А.П. Исследование системы сквозного нейросетевого синтеза речи на основе системы Tacotron // Сборник тезисов докладов конгресса молодых ученых. Электронное издание [Электронный ресурс]. - Режим доступа: ссылка на страницу с тезисом, своб.
Исследование системы сквозного нейросетевого синтеза речи на основе системы Tacotron
УДК: 004.934.5
Аннотация:
Система Tacotron на базе рекуррентной нейросети преобразует последовательность символов текста в последовательность спектрограмм. Необходимо подобрать эмпирическим путем необходимые параметры и обучить систему синтеза речи на открытой базе данных на английском языке. Сравнить полученные результаты с результатами, представленными разработчиками. Необходимо научиться обучать модель до получения сравнимых результатов. В исследовании используется модель Tacotron2 c блоком генерации звука WaveNet. Для оценки результатов работы системы синтеза речи используется средняя экспертная оценка MOS (Mean Opinion Score) с 5-бальной шкалой оценок категорий.