Поиск

Сборники тезисовИнженерные системы и приборостроениеРечевые технологии

Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, 2016.

Задача аудиовизуального распознавания слитной русской речи

УДК: 004.02

Аннотация:

Приведен аналитической обзор, охватывающий последние результаты, достигнутые в области аудиовизуального (АВ) объединения (интеграции) многомодальной информации. Рассмотрены основные проблемы и обсуждены методы их решения. Одной из важнейших задач АВ интеграции является понимание того, как именно модальности взаимодействуют и влияют друг на друга. В данной работе этот вопрос рассматривается в контексте АВ обработки речи, и, в особенности, распознавания речи. Приведены выводы и предложена оценка будущего развития области. В ходе дальнейших исследований планируется реализация системы аудиовизуального распознавания слитной русской речи с применением современных методов объединения многомодальной информации.

Авторы:

Иванько Денис Викторович

Руководители:

Карпов Алексей Анатольевич

Скачать PDF-файл

Яндекс.Метрика