Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

  • A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Предновогодний отчет о работе проекта "Развитие онлайн-платформы для изучения языков Памира"

Завершились первые полгода работы над нашим проектом. За это время мы успели выполнить работы в двух направлениях: разработка сайта и работа над корпусом.

Разработка сайта

Во-первых, была разработана и внедрена на сайт (pamiri.online) система CSM. Система позволяет создавать и публиковать новости на отдельной странице, собирать статистические данные по темам, создан механизм редактирования личных страниц участников проекта, созданы и отображаются личные страницы участников проекта. Результаты работы можно увидеть в разделе «Команда исследовательского проекта».

Другой разработанной для pamiri.online системой стал тасктрекер, или система отслеживания лексикографических задач. Она позволяет создавать и отслеживать задачи, изменять исполнителя, добавлять к задачам комментарии. Скриншоты с примером отображения задачи можно увидеть ниже.

Дмитрий Новокшанов

Работа над корпусом

Основной задачей в работе над корпусом шугнанского языка является поморфемная разметка текстов с помощью специальных грамматических тегов - глосс, а также специальных тегов для частей речи. На текущий момент в рамках проекта было размечено пять устных текстов. Было проведено три встречи, на которых обсуждались текущие вопросы разметки. Скриншот с одной из встреч можно увидеть ниже.

Дмитрий Новокшанов

Для удобства глоссирования текстов был разработан и адаптирован для работы с файлами формата Elan токенизатор для текстов на шугнанском языке. Также страница корпуса в интернете была адаптирована к дизайну pamiri.online.