Поиск

Сборники тезисовИнформационные и интеллектуальные системы и технологииРечевые информационные системы

Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, 2018.

Пример заполнения выходных данных:
Мирзаянова С.В., Затворницкий А.П. Исследование системы сквозного нейросетевого синтеза речи на основе системы Tacotron // Сборник тезисов докладов конгресса молодых ученых. Электронное издание [Электронный ресурс]. - Режим доступа: ссылка на страницу с тезисом, своб.

Исследование системы сквозного нейросетевого синтеза речи на основе системы Tacotron

УДК: 004.934.5

Аннотация:

Система Tacotron на базе рекуррентной нейросети преобразует последовательность символов текста в последовательность спектрограмм. Необходимо подобрать эмпирическим путем необходимые параметры и обучить систему синтеза речи на открытой базе данных на английском языке. Сравнить полученные результаты с результатами, представленными разработчиками. Необходимо научиться обучать модель до получения сравнимых результатов. В исследовании используется модель Tacotron2 c блоком генерации звука WaveNet. Для оценки результатов работы системы синтеза речи используется средняя экспертная оценка MOS (Mean Opinion Score) с 5-бальной шкалой оценок категорий.

Авторы:

Мирзаянова Светлана Владимировна

Руководители:

Затворницкий Александр Петрович

Скачать PDF-файл

Яндекс.Метрика