Новые бакалаврские мастерские: от Яндекс.Навигатора до древненемецкого
Проектная работа — одна из ключевых особенностей обучения в школе лингвистики НИУ ВШЭ. Участие в разработке электронных ресурсов, сборе и обработке данных, совершенствовании различных приложений позволяет студентам не только пополнить запас лингвистических знаний и прикладных умений. Помимо этого участники мастерских получают опыт работы в настоящем «боевом» проекте, навыки командного взаимодействия и менеджмента, привыкают нести личную ответственность за результат.
В этом году студентам были представлены 16 проектов. Традиционно их спектр достаточно широк и охватывает как теоретическую, так и прикладную лингвистику, а в некоторых случаях выходит за пределы одной дисциплины.
Теоретическую часть спектра на этот раз представляли проекты по созданию базы данных исторических изменений XIX века, разработке методов автоматического сбора лексико-типологических данных, пополнению единой базы звуковых изменений (создана преподавателем школы Георгием Морозом), исследованию омофонии и омографии систем письменности в различных языках, обогащению типологического атласа языков Дагестана (разрабатывается сотрудниками Лаборатории языков Кавказа и участниками НУГ «Языки Дагестана»). Проекты по преобразованию в новый формат базы данных «Языки мира» и обновлению базы семантических переходов «DatSemShift» были представлены сотрудниками Института языкознания РАН, который является разработчиком обоих ресурсов.
Сотрудник Института языкознания РАН Вадим Дьячков представляет базу «Языки мира»
К прикладным проектам можно отнести участие в разработке лингвистического обеспечения для Яндекс.Навигатора (проект курирует сотрудник Яндекса), создание и пополнение электронных словарей НИУ ВШЭ (проект «Вышка.Словари»), разработку семантического анализатора для русского языка и учебного корпуса древненемецких текстов.
Преподаватели Илья Чечуро и Эльмира Мустакимова представляют проект «Вышка.Словари»
В отдельную группу можно выделить проект, связанны с автоматизацией загрузки оцифрованных дневников для ресурса «Прожито». Этот ресурс — пример успешного межсдисциплинарного сотрудничества исследователей из различных областей знания, в том числе и лингвистики, которую в команде «Прожито» представляет студентка магистратуры школы лингвистики и член Центра цифровых гуманитарных исследований НИУ ВШЭ Наташа Тышкевич.
Наташа Тышкевич и Михаил Мельниченко представляют проект «Прожито»
Сайт «Прожито» уже стал заметным явлением в русскоязычном Интернете, получил долю внимания медиа и исследовательского сообщества, привлек несколько сотен волонтеров к работе над оцифровкой письменных свидетельств прошедших эпох.
За два года работы мы сумели сделать корпус, где через расширенный поисковый интерфейс люди могут работать не только с конкретными дневниками, но и со всем массивом текстов эпохи. Например, посмотреть по тому или иному ключевому слову, что записано в личных дневниках жителей Киева 1 сентября 1939 года…
В результате сейчас команда не справляется с потоком данных и ищет возможности для автоматизации процесса, для чего и будут привлечены студенты школы лингвистики.
Историк Михаил Мельниченко представляет проект «Прожито»
После выбора мастерской студенты встречаются с кураторами и совместно разрабатывают план работы. Участие в проектах рассчитано на полугодовой цикл, в конце которого происходит представление результатов мастерских. Кроме того регулярной практикой является выступление с промежуточными итогами проектной работы на научных конференциях и подготовка публикаций.
Михаил Мельниченко
Историк, основатель проекта «Прожито»