Сборники тезисов • Информационные и интеллектуальные системы и технологии • Информационные системы и технологии
Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, 2015.
Статистические методы формирования фонетических транскрипций
УДК: 519.688
Аннотация:
В речевых технологиях, в частности в системах синтеза и распознавания речи, большую роль играют методы, устанавливающие соответствие между орфографической (написание) и фонетической (произношение) формами слова. Эту задачу можно решать несколькими способами, в том числе составлением словаря, или созданием правил преобразования написания в произношение. В любом случае это требует больших трудозатрат и специальных лингвистических знаний. Особенно эта проблема актуальна при внедрении новых языков, если специалистов по ним достаточно трудно найти. Здесь особое значение приобретает использование статистических методов формирования фонетических транскрипций. В работе проведен анализ двух наиболее часто используемых подходов к статистическому транскрибированию. Приведены результаты экспериментов для трех языков: русского, английского и казахского.