• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Всех поименно назвать: идентификация персоналий и машиночитаемое описание биографий в мемориальных исторических базах

Мы занимаемся интеграцией и последующим исследованием методами анализа данных миллионов записей из нескольких ключевых исторических баз XX века. Речь идет, во-первых, о базах данных Международного Мемориала: трехмиллионная база жертв политических репрессий base.memo.ru, а также менее объемные базы сотрудников НКВД (nkvd.memo.ru) и мемуаров (memoirs.memo.ru). Связи между упоминаниями одного и того же человека в этих базах сейчас установлены лишь частично, очень много дублирующих друг друга упоминаний.

Вторая группа источников относится к электронным архивам, связанным с Великой Отечественной войной: «ОБД Мемориал», «Память народа» и «Подвиг народа». Эти цифровые архивы имеют еще более впечатляющий объем: так, число записей военно-пересыльных пунктов в базе «ОБД Мемориал» превышает 26,5 млн., и это лишь один тип документов. Однако установить, какое именно количество людей упоминается в базе, пока невозможно, что признают и сами разработчики системы. В базе также огромное количество дублей и частично пересекающихся записей, посвященных одному и тому же человеку.

Наша магистральная задача состоит в разработке системы указателей, или своего рода маршрутизирующей «сверх-базы», которая свела бы все упоминания одного лица в разных базах и привязала к одному общему идентификатору. Далее на основе такой системы указателей можно развивать множество тем, значимых для истории XX века: от социологии репрессий и призыва, до вопросов ономастики и национальной политики. Особенно интересным представляется перспектива анализа пересекающегося подмножества двух баз, т.е. репрессированных, оказавшихся на фронтах Великой Отечественной войны. 

Новости проекта:

  • 21 октября 2021: команда проекта выступила на международной научной конференции «Историко-культурное наследие в цифровом измерении» (программа)
  • 15 октября 2021: команда проекта провела публичный доклад в Центре цифровых гуманитарных исследований НИУ ВШЭ
  • 1 сентября 2021: опубликован первый прототип веб-сервиса по поиску упоминаний людей в разных базах
  • 29 апреля 2021: команда проекта сделала доклад во время всемирного Day of Digital Humanities 
  • 23 апреля 2021: отправлена статья в журнал «Вестник Пермского университета. История» (индексируется Scopus)

Команда проекта:

Скоринкин Даниил Андреевич

Школа лингвистики: доцент; руководитель проекта

 
Махалова Ирина Андреевна

Школа исторических наук: старшая преподавательница; Международный центр истории и социологии Второй мировой войны и ее последствий: Младшая научная сотрудница; соруководительница проекта

 

 

Янина Полина Николаевна

Международный центр изучения институтов и развития: стажерка-исследовательница; курирует унификацию данных в проекте

 
 
Подрядчикова Мария Владимировна

ИППИ РАН, научная сотрудница; в проекте руководит группой извлечения и обработки данных

 
Крюков Артем Игоревич

разработчик/аналитик; в проекте занимается обработкой данных и взаимодействием с сообществом исследователей-историков

 
Казакова Лилия Ильдаровна

full-stack разработчица; в проекте ведет разработку прототипа веб-сервиса

 
Воробьева Виктория Александровна

студентка магистратуры Digital Humanities, в проекте занимается извлечением и обработкой данных

 
Левина Анна Викторовна

студентка магистратуры Digital Humanities, в проекте занимается извлечением и обработкой данных

 
Воронцов Илья Евгеньевич

 биоинформатик; технологический ментор проекта, тимлид веб-группы

 

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.