• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Встреча в коворкинге START HUB

Участники научно-учебной группы добавили новые классические тексты в корпус русской драмы.

В этот день мы забронировали рабочую комнату в коворкинг пространстве  START HUB, сделано это было лишь с одной целью - увеличить количество пьес в нашем корпусе русской драмы.

Мы обсудили методы и проблемы, с которыми можно столкнуться  при извлечении пьес, а
затем разделили работу между несколькими группами, которые занимались скачиванием русских пьес из бесплатных он-лайн источников (rvb.ru, Wikisource и  ilibrary.ru). Но самая главная задача - 
конвертировать пьесы в формат научного стандарта TEI.

После этого мы можем автоматически извлекать нужные нам данные и анализировать их, что даёт возможность сконцентрироваться на разработке сетевых метрик для нашего Russian Drama Corpus (RusDraCor). Корпус будет в открытом доступе, поэтому любой сможет анализировать и извлекать из него полезные данные. Мы также планируем сотрудничать с другими научными группами, занимающимися похожей темой.

Поскольку в нашем корпусе до сих пор отсутствовали некоторые важные канонические пьесы, мы особенно тщательно работали с классическими авторами: Ломоносовым, Грибоедовым, Сухово-Кобылиным и Л. Толстым. Для примера можно посмотреть граф пьесы Сухово-Кобылина «Дело» (впервые напечатан 1869):


Занимаясь цифровыми проектами важно не только проводить исследования, но и продолжать расширять цифровые источники, поэтому регулярное обновление базы данных нашего корпуса - одна из приоритетных задач участников НУГа!