В Университете МИСИС будут готовить цифровых лингвистов и NLP-разработчиков

В 2023/2024 учебном году в НИТУ МИСИС появятся две магистерские программы на пересечении лингвистики и ИТ. Магистратура «Обработка естественного языка», которая откроется в Институте информационных технологий и компьютерных наук, больше подойдет студентам, которые хотят специализироваться на компьютерной обработке текста и речи путем применения алгоритмов искусственного интеллекта и машинного обучения. Программа «Цифровая лингвистика и локализация» Института базового образования поможет классическим лингвистам расширить свои возможности в новом цифровом мире благодаря навыкам работы с системами синтеза и распознавания речи, машинного перевода, а также с различными типами нейросетей.

В современном мире объемы информации увеличиваются с каждым годом, поэтому многие компании занимаются созданием инструментов для фильтрации, генерации и распознавания информационных потоков. Развитие технологий обработки естественного языка (NLP) помогает бизнесу решать задачи по анализу и компьютерной обработке текста и речи путем применения алгоритмов искусственного интеллекта и машинного обучения. При этом востребованность классических лингвистов снижается. На смену людям приходят голосовые помощники, автоматические субтитры, платформы машинного перевода, системы генерации текста.

Новые междисциплинарные магистерские программы Университета МИСИС направлены на решение этих проблем как со стороны разработчиков, так и со стороны лингвистов.

Обучаясь на программе , студенты освоят основные разделы традиционной лингвистики, прикладные алгоритмы анализа данных, получат необходимые навыки программирования, а также научатся создавать системы распознавания речи и цифровых помощников, таких как Алиса, Маруся, Siri. На реальных проектах от ведущих ИТ-компаний студенты научатся применять новые технологии и методики в теории машинного обучения, семантическом анализе, работе нейронных сетей, визуализации, работе с базами данных и SQL. Выпускники смогут обрабатывать большой поток запросов и документов, выявлять спам, определять эмоциональную окраску текста. После выпуска молодые специалисты смогут работать как в крупных IT-компаниях, так и в небольших стартапах, занимающихся анализом данных.

Программа подойдёт выпускникам бакалавриата компьютерных и аналитических специальностей, а также опытным разработчикам, владеющих базовыми подходами ML (Machine learning) и DL (Deep learning), но желающих получить углубленную специализацию в NLP-направлении. Для поступления необходимы базовые знания Python и математики.

«Обработка естественного языка — это направление, которое находится на стыке лингвистики и машинного обучения. Данная магистратура направлена на изучение русского или иного естественного языка как со стороны лингвистики и её подходов (морфологический, семантический анализ и т.д.), так и со стороны компьютерных наук и искусственного интеллекта, рассматривающих язык в качестве системы, для которой можно использовать математические модели. Мир активно меняется, язык трансформируется вместе с ним. Данные изменения диктуют новые требования и возможности для работы с языком и информацией. Диалоговое системы (чат-боты), голосовые помощники — это те технологии, которые созданы на методах обработки естественного языка», — отметил к.т.н., руководитель программы «Обработка естественного языка», сертифицированный тренер Huawei в рамках AI, заместитель директора ИТКН Илья Конов.

Слушатели программы «Цифровая лингвистика и локализация» научатся создавать системы синтеза и распознавания речи, кастомизировать системы машинного перевода, работать с различными типами нейросетей, а также получат навыки разметки данных, генерации текста, субтитрирования и др. Выпускники смогут работать в связке с ИТ-специалистами в профильных компаниях в России и за рубежом. Преимущество программы — возможность изучать китайский язык, что позволит выпускникам стать конкурентными специалистами в бизнесе, ориентированном на партнерство со странами Азии.

Программа будет интересна выпускникам бакалавриата классических лингвистических направлений; специалистам, работающим в профильных лингвистических компаниях, стремящимся получить знания и навыки работы с компьютерными технологиями; специалистам сферы ИТ, желающим научиться обработке естественного языка и углубиться в лингвистическое направление.

«Коллеги из Института информационных технологий и компьютерных наук на нашей программе ведут такие дисциплины, как „Основы программирования“, „NLP-аналитика“, „Основы машинного обучения“ и „Обработка естественного языка“. Они обучают наших магистрантов говорить с программистами на их языке и работать в одной команде. Мы гармонично дополняем друг друга: программа ИТКН нацелена на подготовку девелоперов, умеющих создавать NLP-продукты, в то время как мы помогаем расширить возможности применения себя в качестве классических лингвистов в новом цифровом мире. Выпускники смогут работать с продуктами, созданными разработчиками, смогут работать с ними в одной команде, а помимо этого — получат навыки в локализации в самом широком смысле этого слова. Мы уже не говорим о навыках проектной деятельности и проведения научных исследований, чему мы априори готовим специалистов на всех наших программах магистратуры. В настоящее время в компании приходят специалисты, умеющие работать с одной из перечисленных областей. Однако полноценного сквозного охвата, позволявшего бы „под ключ“ создавать и дорабатывать цифровые продукты с точки зрения бизнес-проекта, у молодых специалистов не наблюдается. Нужные знания и навыки приходят с опытом. Но далеко не каждый работодатель готов рискнуть и дать сотруднику время на то, чтобы всему научиться», — пояснил руководитель магистерской программы «Цифровая лингвистика и локализация», переводчик и языковой тренер Михаил Гилин.

Программа создана с учетом бизнес-задач профильных компаний, таких как Yandex Cloud, PROMT, а также лингвистических компаний, широко использующих программные продукты: ТрансЛинк, ПрофПеревод, что позволяет студентам изучать и применять лучшие практики индустрии. В ходе обучения магистранты будут работать над такими проектами, как: локализация игр и программного обеспечения, создание систем распознавания речи, совершенствование голосовых помощников, создание чат-ботов и систем синтеза речи, автоматическое субтитрирование, создание систем мгновенного перевода и генерации текста.

Обучающиеся обеих программ смогут совмещать работу с учебой, так как занятия проводятся преимущественно в вечернее время. Молодые специалисты после выпуска смогут уверенно претендовать на зарплату от 100 000 рублей и выше.

Поделиться