Где кутил Чайковский? Мастер-класс по культурным GIS от St.Retrospect
14 декабря перед студентами магистратуры «Цифровые методы в гуманитарных науках» факультета гуманитарных наук НИУ ВШЭ выступила Антонина Пучковская — основатель международной DH Lab в Университете ИТМО, руководитель магистратуры «Data, Culture and Visualization» того же университета. Антонина рассказала о том, как делаются цифровые культурные проекты, связанные с картографией/GIS и поделилась собственным опытом и набитыми шишками. Во второй части занятия студенты попрактиковались с живыми данными в боевом проекте, который скоро выйдет в релиз.
Флагманский проект лаборатории DH Lab в ИТМО — St.Retrospect, ретроспективная цифровая карта Санкт-Петербурга с возможностями умного поиска. Карта еще не выпущена официально (будет мобильное приложение и сайт), но мы уже видели ее в работе. У St.Retrospect можно спросить, куда ходил гулять Пушкин или, например, «где кутил Чайковский» — и получить результат:
Информация добывается из корпуса исторических источников. Антонина Пучковская рассказала о том, какие сложности сопровождали разработку проекта, как непросто было договариваться с библиотеками о предоставлении оцифрованных текстов, как по-разному понимали задачи руководители проекта — и специалисты по машинному обучению, которым предстояло добывать из корпуса информацию (структурированные данные).
В результате далеко не все части процесса удалось автоматизировать так глубоко, как хотелось бы. Особенную трудность представляла разметка кореферентности (связывание цепочек «Чайковский — он — композитор — Петр Ильич») — актуальная задача компьютерной лингвистики, пока еще никем не решенная с приемлемым качеством. Для дополнительной ручной разметки данных DH Lab проводила «дататон» с призами. Теперь, несмотря на все трудности, проект разработан, функционирует и готовится к выпуску.
Отдельную сложность представлял выбор технологий и фреймворков. С одной стороны, было желание использовать готовые, протестированные решения для геоинформационных систем. В числе прочих команда St.Retrospect изучала известный в DH-среде сервис Omeka, а также сервсисы Cartaro и Carto. Однако в конечном счете предпочтение было отдано собственной разработке, опирающейся на свободные карты от OpenStreetMap и фреймворк MapBox для JavaScript.
Во второй части мастер-класса студенты сами поработали с данными St.Retrospect и обогатили проект новой информацией. В базу были занесены известные петербуржцы (Виктор Цой, Александр Невзоров, Виктор Шкловский, Александр Васильев) — и связанные с ними места.