Сборники тезисов • Информационные и интеллектуальные системы и технологии • Информационные системы и технологии
Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, 2016.
Модуль предварительной обработки текстов на естественном языке для системы семантического анализа
УДК: 004.043:004.622
Аннотация:
В работе описан процесс создания модуля приведения текстовых документов к единому формату для последующей обработки информации системой семантического анализа. Перечислены основные этапы разработки и технические решения, использующиеся на каждом шаге. Для реализации модуля было использовано решение, применяемое в текстовом процессоре LibreOffice Writer при работе с различными форматами документов.