Поиск

Сборники тезисовИнформационные и интеллектуальные системы и технологииИнформационные технологии

Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, 2017.

Пример заполнения выходных данных:
Слапогузов А.П., Цопа Е.А. Анализ тематической структуры текстов с ошибками // Сборник тезисов докладов конгресса молодых ученых. Электронное издание [Электронный ресурс]. - Режим доступа: ссылка на страницу с тезисом, своб.

Анализ тематической структуры текстов с ошибками

УДК: 004.852

Аннотация:

Работа посвящена анализу тематической структуры текстов с ошибками и является частью исследования о применении тематического моделирования для оценки качества распознанного текста. Чтобы понять, как ошибки влияют на тематическую структуру текста, с помощью библиотеки BigArtm и корпуса текстов "OpenCorpora" была обучена тематическая модель. Данная модель использовалась для получения тематической структуры текстов с ошибками и без ошибок. На основе полученных данных была выявлена следующая закономерность: тексты с большим количеством ошибок имеют более равномерную тематическую структуру.

Авторы:

Слапогузов Александр Петрович

Руководители:

Цопа Евгений Алексеевич

Скачать PDF-файл

Яндекс.Метрика