В гуманитарных науках развивается новое направление — Digital Humanities. Что это вообще такое?
Научный ландшафт меняется на наших глазах. Науки переплетаются друг с другом, образуя иногда очень неожиданные сочетания — например, Digital Humanities, цифровые гуманитарные науки. Направление бурно развивается: проводятся конференции, летние школы, а в Вышке недавно прошла целая неделя Digital Humanities. Что это за направление? Рассказываем.
На вопросы отвечают аспирант школы по филологическим наукам Даниил Скоринкин и доцент факультета гуманитарных наук Анастасия Бонч-Осмоловская.
Судя по названию, это какой-то гибрид «гуманитариев» с «технарями». Я прав?
Да. Но не в том смысле, что гуманитарии вдруг решили заняться физикой. Главное слово тут все равно humanities, то есть классические гуманитарные науки — филология, история, философия, культурология. Только изучать их предлагается по-новому — перестав игнорировать тот факт, что мир переходит в цифру.
Раньше у исследователей были под рукой десятки, сотни, в лучшем случае тысячи книг — сегодня речь идет о миллионах. Как изучать их, если на прочтение не хватит и тысячи лет? Раньше десятки тысяч рукописей пылились в архивах и были доступных лишь избранным — теперь они оцифровываются, снабжаются «умной» разметкой и инструментами интеллектуального поиска. Как анализировать и делать выводы из этого богатства данных? Раньше картография была уделом избранных — теперь расставить свои координаты на интерактивном глобусе может каждый. Как с помощью Google Maps узнать новое о торговле в античном мире, распространении чумы в средневековой Европе или авиаперевозках в послевоенном СССР? Все эти вопросы заставили гуманитарных исследователей освоить совершенно нехарактерные для них навыки и знания — анализ данных, data science, автоматическую обработку текста (text mining), теорию сетей, геоинформатику. Так и появились «цифровые гуманитарии».
А дать исчерпывающее определение Digital Humanities почти невозможно. На сайте whatisdigitalhumanities.com есть 817 разных вариантов — можете просто обновлять страницу в браузере и читайте один за другим:) Кстати, наше любимое определение звучит так: «DH is taking tools built by warmongers, oil companies, spy agencies & investment bankers and using them to study literature, philosophy, culture and the classics».
На самом деле формальные исследования гуманитарных объектов имеют богатую историю в XX веке — это и стиховедение, и исторические базы данных, и стилометрия. Для лингвистов же работа с корпусами текстов и статистическими данными давно стало мейнстримом. Фактически новый расцвет интереса к точными методам в гуманитарных областях связан с появлением новых возможностей — доступностью электронных текстов, развитием методов их автоматического анализа, новыми мощностями хранения и обработки, новыми инструментами работы с данными.
«Цифровые гуманитарии» создают интерактивные карты переписки французских просветителей, строят по письмам и дневникам социальные сети великих поэтов, конструируют 3D-модели Древнего Рима и автоматически превращают в изображения тексты голливудских сценариев.
Социальные сети поэтов? Это еще зачем?
Анализ сетей (и в первую очередь социальных) — развитая область науки с богатой историей и довольно сложной математикой под капотом. Представив объект исследования в виде сети, можно понять про него много нового и неочевидного, потому что сеть (в том числе и ваша личная сеть контактов в Facebook, например) — это строгая математическая абстракция, для которой придуман ворох разных формальных метрик, алгоритмов выделения сообществ, параметров значимости каждого конкретного узла и т.д. Всё это применяется в диапазоне от физики до социологии, и литературоведы тоже не остались в стороне. Хотя, конечно, в Digital Humanities есть элемент «we did it for fun», особенно когда речь идет о визуализациях сетей.
Получается, теперь каждый филолог или историк должен быть еще и программистом?
Не обязательно, хотя такие случаи встречаются всё чаще: например, доцент школы лингвистики Борис Орехов защищал диссертацию по лирике Тютчева, а теперь одновременно преподает программирование на Python и анализ текстов Шекспира. Но можно быть классическим филологом или историком и участвовать в Digital Humanities.
Как и всякая междисциплинарная область исследований, цифровые гуманитарные науки располагают к командной и проектной работе. Здесь мало исследователей-одиночек, зато много небольших research groups и research projects с разделением труда. Например, в составе Центра цифровых гуманитарных исследований НИУ ВШЭ есть и компьютерщики, и лингвисты, специалисты по text mining, и филологи, и историки с философами. То же можно сказать и о научно-учебной группе «Цифровые исследования литературы».
А какие-нибудь открытия в этой области уже были?
Их довольно много. Например, именно цифровые гуманитарии с помощью статистики раскрыли Джоан Роулинг, когда та выпустила книжку под мужским псевдонимом. Оказалось, что атрибуция (определение авторства) художественного текста на основе частотностей слов работает удивительно хорошо. Писатель может подписаться чужим именем, но изменить свой стиль так, чтобы обмануть компьютер, оказывается не так-то просто.
А исследуя социальные сети персонажей, удалось установить, что плотность сети в комедии, например, устойчиво выше, чем в трагедии. И это хорошо согласуется с догадками литературоведов о том, что комическое больше нуждается в речевом выражении, чем трагическое (убивать, страдать и умирать можно и молча; а вот смеяться и высмеивать — едва ли).
Как становятся «цифровыми гуманитариями»?
Очень разными путями, и об этом как раз говорил наш коллега Франк Фишер в недавнем интервью. Среди «цифровых гуманитариев» можно встретить кого угодно: программистов и филологов, лингвистов и философов, математиков и историков, педагогов и журналистов. Главное, что все в какой-то момент осознали потенциал компьютерных методов в гуманитарных областях. Сам Франк просто не мог выбрать между computer science и литературой, в итоге изучал в университете и то, и другое. И только потом узнал, что он, оказывается, «цифровой гуманитарий».
Я терпеть не могу математику и программирование. Что мне делать?
Знание математики всегда полезно, но серьезная математика в Digital Humanities нужна далеко не везде. А что касается программирования — конечно, некоторый навык иметь желательно, но прелесть жизни в XXI веке заключается в том, что очень многое уже сделано за нас и остается только нажимать кнопочки. Например, для определения авторства и стилеметрии создан прекрасный инструмент под названием Stylo. Это программный пакет для языка R, но благодаря графическому интерфейсу его могут использовать и непрограммисты. Ну и не стоит забывать о возможностях стандартных всем известных инструментов анализа и обработки данных. До появления Stylo те же самые методы определения авторства успешно применяли в Excel.
Хорошо, а в Вышке этому учат?
Да. Курс по Digital Humanities читается на магистерской программе «Компьютерная лингвистика» с самого начала. С этого года идет минор «Современные методы в гуманитарных науках» для студентов факультета гуманитарных наук. А группа студентов (из разных школ и факультетов, в том числе и с матфака) работает в научно-учебной группе «Цифровые исследования литературы».
Бонч-Осмоловская Анастасия Александровна
Доцент Школы лингвистики
Орехов Борис Валерьевич
Доцент Школы лингвистики
Скоринкин Даниил Андреевич
Преподаватель Школы лингвистики
Фишер Франк
Доцент Школы лингвистики