Воронцов Константин Вячеславович

д.ф.-м.н., профессор РАН, научный руководитель Центра исследования больших данных
Направления работы

09.06.01 Информатика и вычислительная техника

Профиль

Системный анализ, управление и обработка информации

Область научных интересов (научная тематика)

«наука о данных» (data science), «интеллектуальный анализ данных» (data mining) и «машинное обучение» (machine learning): распознавание образов, прогнозирование, математическая статистика, дискретная математика, численные методы оптимизации, аналитика больших данных, а также практический анализ данных в разнообразных областях (медицина, техника, биоинформатика, экономика, лингвистика, интернет).

Основные исследовательские проекты:
  • теория и методы аддитивной регуляризации тематических моделей (ARTM);
  • разработка BigARTM — библиотеки с открытым кодом для тематического моделирования больших коллекций;
  • автоматическое выделения терминов-словосочетаний в текстах;
  • тематические модели последовательного текста, тематической структуры и сегментации текстов;
  • мультимодальные тематические модели, классификация и регрессия с текстовыми и разреженными признаками;
  • иерархические тематические модели и категоризация текстов;
  • методы визуализации тематических моделей;
  • методы автоматического именования тем;
  • проблемы сходимости и устойчивости численных методов матричных и тензорных разложений;
  • проблемы интерпретируемости тем;
  • мультиязычные тематические модели;
  • тематические модели транзакционных данных или гиперграфов;
  • анализ тональности и разделение тем на полярные мнения;
  • динамические тематические модели;
  • тематические модели, учитывающие авторство и ссылки;
Научное признание, экспертиза, исследования
  • Преподаватель Школы анализа данных Яндекс, зам. директора по науке ЗАО «Форексис», один из идеологов и Администраторов ресурса MachineLearning.RU.
  • Автор более 157 статей из них более 30 статей в зарубежных научных журналах.
  • Индекс Хирша — 10
Научное руководство :

Выпустил 14 кадидатов наук:

Публикации в СМИ (примеры):