Цифровые методы от Платона до Тарантино
Участники минора «Современные методы в гуманитарных науках» изучают новые, в первую очередь цифровые подходы к традиционно гуманитарным областям — литературоведению, истории, культурологии. Первые занятия минора были посвящены обзору всей междисциплинарной сферы Digital Humanities, а затем студенты познакомились и освоили на практике несколько конкретных методов и инструментов цифровых исследований. В частности, были проведены практикумы по стилеметрическому пакету stylo (реализован на языке R), программе для тематического моделирования Mallet, а также корпусным исследованиям.
После освоения этих инструментов участники минора применяли их в собственных исследовательских работах. Студентам было предложено собрать свой текстовый корпус (в него могли входить как художественные тексты, так и записи в социальных сетях, дневники, сценарии фильмов, тексты субтитров) и исследовать его с применением изученных программ или подходов.
Разнообразный состав участников минора, среди которых есть представители почти всех школ факультета гуманитарных наук, обеспечил широкий спектр объектов исследования — в диапазоне от переводов Платона и Аристотеля до версий сказки о красавице и чудовище в разных странах и от дневника Анны Франк до публичных записей преподавателей факультета в Facebook.
Среди исследований, посвященных стилеметрии, можно выделить работу представителей школы философии Максима Коняева и Артёма Колганова. Авторы применили методы стилеметрии к перевода Платона и Аристотеля на русский язык, сделанным различными авторами. Проанализировав переводы с помощью иерархического кластерного анализа в stylo, исследователи показали, что переводы действительно классифицируются по авторам на основе количественных параметров стиля.
Студенты представили несколько ярких работ по тематическому моделированию текстов. Так, студенты школы истории Александра Рябиченко и Кирилл Кантер попытались выделить темы в субтитрах к фильмам Квентина Тарантино. Часть выделенных ими тем («деньги», «убийства»), ожидаемо распределились между всеми фильмами, тогда как другие были сконцентрированы в одной-двух лентах («нацизм» в «Бесславных ублюдках», «семья» в «Убить Билла» и «Убить Билла — 2»).
Оба подхода объединили в своем исследовании представители школы лингвистики Устинья Кошелева, Анна Кондратьева, Дарья Максимова и Евгений Лапин. Они выбрали для анализа тексты современных российских писателей. В стилеметрической части исследования удалось показать, например, сходство стилей Людмилы Улицкой и Дины Рубиной, а в части, посвященной тематическому моделированию, — выделить в произведениях темы государства, войны, литературного творчества, а также тему, условно названную «темой России».
Презентации исследований доступны на сайте Центра цифровых гуманитарных исследований НИУ ВШЭ. Коллоквиум с докладами проводили преподаватели школы лингвистики Франк Фишер, Борис Орехов и Даниил Скоринкин.