Поиск

Сборники тезисовИнформационные и интеллектуальные системы и технологииИнформационные системы и технологии

Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, 2016.

Модуль предварительной обработки текстов на естественном языке для системы семантического анализа

УДК: 004.043:004.622

Аннотация:

В работе описан процесс создания модуля приведения текстовых документов к единому формату для последующей обработки информации системой семантического анализа. Перечислены основные этапы разработки и технические решения, использующиеся на каждом шаге. Для реализации модуля было использовано решение, применяемое в текстовом процессоре LibreOffice Writer при работе с различными форматами документов.

Авторы:

Аслами Камилла Зарифовна

Руководители:



Скачать PDF-файл

Яндекс.Метрика