Цифровые гуманитарии из Вышки выступили в Принстоне
Сотрудники Центра цифровых гуманитарных исследований НИУ ВШЭ Франк Фишер и Борис Орехов провели в Принстонском университете мастер-класс «Русская филология в цифровую эпоху» (Russian Literary Studies in the Digital Age). Мероприятие включало в себя лекции об истории и современном состоянии цифровых гуманитарных исследований (Digital Humanities, DH) в России, а также дискуссии и практическую часть.
В первой лекции представители DH-центра Вышки рассказали о становлении количественных, а затем и компьютерно-цифровых методов в гуманитарных исследованиях в России. Упоминались поэт Андрей Белый и его подсчеты метрических структур стиха, формалистское движение, Московский лингвистический кружок, филолог-инноватор Борис Ярхо, математик Андрей Колмогоров, информатик Андрей Ершов, а также ассоциация «История и компьютер».
Далее американских коллег познакомили с современным состоянием цифровых гуманитарных исследований в России. В этой части перечислялись современные проекты, инициативы и сообщества внутри «русских DH»: поэтический подкорпус НКРЯ, проекты Толстой.Digital (цифровое издание полного собрания сочинений Л.Н. Толстого) и «Живые страницы», многочисленные онлайн-библиотеки, Российская ассоциация цифровых гуманитарных исследований, ставшая в 2017 году членом Европейской ассоциации, проект «Прожито», издание «Системный Блокъ».
Франк Фишер рассказывает о DH-центре Вышки / Фото: © Shelley M. Szwast
Во многих упомянутых проектах участвует Центр цифровых гуманитарных исследований НИУ ВШЭ — о нем коллегам из Принстона рассказали в деталях. Центр проводит конференции, устраивает хакатоны, лекции, публичные выступления в музеях и библиотеках, а также легендарную Московско-тартускую школу по цифровым гуманитарным исследованиям. Поскольку в Digital Humanities распространение (dissemination) и популяризация научного знания ценится не меньше, чем его непосредственная добыча, Центр вкладывает много сил в медийную активность: рассылка, телеграм-канал «Digital Humanities в Вышке», присутствие в научно-популярных СМИ (примеры раз, два, три, четыре, пять, шесть, семь).
Помимо Толстой.Digital, внутри центра зародился и уже несколько лет развивается корпус русской драмы «RusDraCor». Ему — и сформулированной на его опыте общей концепции т.н. «программируемых корпусов» (programmable corpora) — было посвящено второе занятие мастер-класса в Принстоне.
На третьем занятии Борис Орехов рассказывал о проекте «91-й том» — это своего рода спин-офф проекта Толстой.Digital. 91-й том — это именной указатель к полному 90-томному собранию сочинений Л.Н. Толстого. В нем содержатся указания на те тома и страницы, где Толстым упоминаются имена известных людей, топонимы, книги и другие именованные сущности и культурные объекты.
Борис Орехов рассказывает о проекте «91-й том» / Фото: © Shelley M. Szwast
Оцифровка этой информации позволяет создать нечто вроде базы знаний, своеобразной «википедии» Толстовского мира — и использовать эти данные в сочетании с новыми методами анализа. Например, совместные появления каких-то людей и топонимов можно представить в виде сети (графа) — и обнаружить в нем разные тесно связанные группы.
Заключительная часть мастер-класса была посвящена применению искусственных нейронных сетей для порождения поэтических текстов. Тема «творчества искусственного интеллекта» сегодня вызывает интерес — но есть ли в этом научная ценность? Борис Орехов рассказал, как нейросети расширяют горизонты филологического исследования.
Судя по отзывам участников, мастер-класс удался. Особенно ценным результатом кажется вывод, который сделала по его итогам докторант Принстонского университета Ольга Золотарева: «Мастер-класс показал, что цифровые гуманитарные исследования не просто обещают сделать наши преподавательские, учебные и научные практики более разносторонними — они уже выполняют это обещания».
Франк Фишер и Борис Орехов выполнили обещание и довольны / Фото: © Shelley M. Szwast
Бонус: презентации с мастер-класса
Осторожно, они нелинейные. Лучше листать так: пробел — вперед, shif+пробел — назад.
- The State of Digital Humanities in Russia
- Programmable Corpora: A New Infrastructural Concept for Digital Literary Studies
- Tolstoy Everywhere: Unleashing the Information Hidden in the 90-Volume Collected Works
- Neural Network Poetry Meets Distant Reading: Analysing Computer-Generated Echoes of Russian Literary History
Фишер Франк