Встреча в коворкинге START HUB
Участники научно-учебной группы добавили новые классические тексты в корпус русской драмы.
В этот день мы забронировали рабочую комнату в коворкинг пространстве START HUB, сделано это было лишь с одной целью - увеличить количество пьес в нашем корпусе русской драмы.
Мы обсудили методы и проблемы, с которыми можно столкнуться при извлечении пьес, а
затем разделили работу между несколькими группами, которые занимались скачиванием русских пьес из бесплатных он-лайн источников (rvb.ru, Wikisource и ilibrary.ru). Но самая главная задача -
конвертировать пьесы в формат научного стандарта TEI.
После этого мы можем автоматически извлекать нужные нам данные и анализировать их, что даёт возможность сконцентрироваться на разработке сетевых метрик для нашего Russian Drama Corpus (RusDraCor). Корпус будет в открытом доступе, поэтому любой сможет анализировать и извлекать из него полезные данные. Мы также планируем сотрудничать с другими научными группами, занимающимися похожей темой.
Поскольку в нашем корпусе до сих пор отсутствовали некоторые важные канонические пьесы, мы особенно тщательно работали с классическими авторами: Ломоносовым, Грибоедовым, Сухово-Кобылиным и Л. Толстым. Для примера можно посмотреть граф пьесы Сухово-Кобылина «Дело» (впервые напечатан 1869):
Занимаясь цифровыми проектами важно не только проводить исследования, но и продолжать расширять цифровые источники, поэтому регулярное обновление базы данных нашего корпуса - одна из приоритетных задач участников НУГа!