Лаборатория занимается подготовкой специалистов, владеющих ИИ-технологиями анализа и обработки естественного языка (NLP, LLM), разметки речевых данных для исследований, преподавания и работы с текстом и звучащей речью, создания лингвистических датасетов на основе мультимодальных корпусов для целей машинного обучения.
Задачи лаборатории
Осваивать методы сбора и анализа речевых данных.
Создавать речевые базы данных и приводить их к формату документированного речевого корпуса.
Проводить научные исследования на основе больших лингвистических данных.
Разрабатывать учебно-методические материалы с использованием корпусных технологий.