Сборники тезисов • Информационные и интеллектуальные системы и технологии • Речевые информационные системы
Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, 2018.
Пример заполнения выходных данных:
Верхоляк О.В., Карпов А.А. Моделирование временного контекста для распознавания эмоций в диалоговой речи // Сборник тезисов докладов конгресса молодых ученых. Электронное издание [Электронный ресурс]. - Режим доступа: ссылка на страницу с тезисом, своб.
Моделирование временного контекста для распознавания эмоций в диалоговой речи
УДК: 004.934.2
Аннотация:
Моделирование временных зависимостей играет важную роль при обработке голосовых сигналов, так как речь представляет собой непрерывный сигнал, распространяющийся во времени, каждое значение которого в определенный момент времени зависит от предыдущих и влияет на последующие значения в будущем. Эмоциональная окраска является важной нестационарной характеристикой голосового сигнала, которая также изменяется во времени, однако ее изменения по сравнению с речевыми характеристиками проявляются на более длительных, супрасегментных участках времени. Таким образом, способность моделировать длительные временные зависимости помогает добиться лучших результатов распознавания за счет использования не только акустических признаков и их функционалов, а также дополнительной информации о динамике развития акустических характеристик во времени. В данной работе предлагается использовать каскадное контекстное моделирование: во-первых, на уровне высказываний, а во-вторых, на уровне всего диалога. Для этой цели используется рекуррентная нейронная сеть с длинной кратковременной памятью (RNN-LSTM), которая широко известна своей возможностью эффективно моделировать сколь угодно длинные последовательности данных. Основное преимущество предлагаемой системы заключается в том, что двухуровневое моделирование позволяет выявить более сложную структуру сигнала, чем одноуровневое моделирование контекста, а также использование бесконтекстного (функционального) моделирования.