Поиск

Сборники тезисовИнформационные и интеллектуальные системы и технологииТехнологии высокопроизводительных вычислений и компьютерного моделирования: технологии прикладного искусственного интеллекта

Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, 2018.

Пример заполнения выходных данных:
Гусаров А.С., Калюжная А.В., Утеуов А.К., Калюжная А.В. Тематическое моделирование финансовых привычек и интересов пользователей в социальных сетях // Сборник тезисов докладов конгресса молодых ученых. Электронное издание [Электронный ресурс]. - Режим доступа: ссылка на страницу с тезисом, своб.

Тематическое моделирование финансовых привычек и интересов пользователей в социальных сетях

УДК: 004.912

Аннотация:

В данной работе рассматривается технология тематического моделирования текстовых данных, заключающаяся в разделении документов на интерпретируемые темы. Были проанализированы тексты постов известной социальной сети и MCC кодов транзакций. Использовались модели LDA, PLSA и ARTM. Проведено сравнение распределения тем в текстах русскоязычной социальной сети, текстов электронной энциклопедии, текстов научно-популярных статей и MCC кодах банковских транзакций. Предлагается методика оценки качества тематического моделирования. Эксперименты показывают, что лучшие результаты для выделения тем дает переход от слов к словосочетаниям по два слова на этапе подготовки текста. Таким образом выделяются частые словосочетания (термины), характеризующие данную тему. По показателям скорости обработки текстовых документов из реализаций выбранных моделей лучше всего себя проявила библиотека BigARTM.

Авторы:

Гусаров Антон Сергеевич, Калюжная Анна Владимировна, Утеуов Амир Куатович

Руководители:

Калюжная Анна Владимировна

Скачать PDF-файл

Яндекс.Метрика