При участии школы лингвистики вышла новая версия Universal Dependencies
Опубликованная коллекция включает синтаксические корпуса для 50 языков, размеченные в едином формате Universal Dependencies ("универсальных зависимостей"). В числе новых ресурсов — пилотные корпуса белорусского и литовского языков, подготовленные в школе лингвистики.
Особенность выпуска UD 2.0 в том, что его данные станут основой для проведения крупного международного соревнования CoNLL 2017 Shared Task, посвященного мультиязычной синтаксической обработке текстов. Магистранты программы "Компьютерная лингвистика" и студенты бакалавриата школы лингвистики принимали участие в подготовке данных для русского языка.
Данные UD 2.0 вывешены в открытом доступе на сайте проекта. Подробнее о Universal Dependencies можно узнать из доклада профессора школы лингвистики Ольги Ляшевской на научном семинаре школы.