Сборники тезисов • Информационные и интеллектуальные системы и технологии • Технологии программирования, искусственный интеллект, биоинформатика
Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, 2016.
Методы оценки качества работы алгоритмов в рекомендательной системе алгоритмов выбора признаков для задач кластеризации
УДК: 004.85
Аннотация:
Рост числа алгоритмов машинного обучения опережает рост экспертных знаний о них, поэтому автоматизация выбора алгоритмов машинного обучения становится все более актуальной задачей. В частности, отсутствует система выбора алгоритмов выбора признаков. Подходом к автоматизации решения данной проблемы является разработка системы рекомендации алгоритмов выбора признаков для нового набора данных, наиболее перспективным подходом является применение мета-обучения. Оценку качества работы алгоритмов выбора признаков можно получить только через оценку качества работы алгоритма кластеризации, который будет применен к измененному набору данных. В рамках работы проведены исследования, в результате которых выявлено, что единой метрики оценки качества для всех типов данных разработать невозможно. Предлагается предсказывать метрику оценки алгоритма кластеризации и сам алгоритм кластеризации, на основе метаинформации в каждом наборе данных. Также, на основе этого, в рамках работы предложена трехуровневая система рекомендации алгоритмов выбора признаков для задач кластеризации на основе мета-обучения.