• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Всех поименно назвать: идентификация персоналий и машиночитаемое описание биографий в мемориальных исторических базах

Мы занимаемся интеграцией и последующим исследованием методами анализа данных миллионов записей из нескольких ключевых исторических баз XX века. Речь идет, во-первых, о базах данных Международного Мемориала: трехмиллионная база жертв политических репрессий base.memo.ru, а также менее объемные базы сотрудников НКВД (nkvd.memo.ru) и мемуаров (memoirs.memo.ru). Связи между упоминаниями одного и того же человека в этих базах сейчас установлены лишь частично, очень много дублирующих друг друга упоминаний.

Вторая группа источников относится к электронным архивам, связанным с Великой Отечественной войной: «ОБД Мемориал», «Память народа» и «Подвиг народа». Эти цифровые архивы имеют еще более впечатляющий объем: так, число записей военно-пересыльных пунктов в базе «ОБД Мемориал» превышает 26,5 млн., и это лишь один тип документов. Однако установить, какое именно количество людей упоминается в базе, пока невозможно, что признают и сами разработчики системы. В базе также огромное количество дублей и частично пересекающихся записей, посвященных одному и тому же человеку.

Наша магистральная задача состоит в разработке системы указателей, или своего рода маршрутизирующей «сверх-базы», которая свела бы все упоминания одного лица в разных базах и привязала к одному общему идентификатору. Далее на основе такой системы указателей можно развивать множество тем, значимых для истории XX века: от социологии репрессий и призыва, до вопросов ономастики и национальной политики. Особенно интересным представляется перспектива анализа пересекающегося подмножества двух баз, т.е. репрессированных, оказавшихся на фронтах Великой Отечественной войны. 

Участники проекта:

Скоринкин Даниил Андреевич

Школа лингвистики: Старший преподаватель

 
Махалова Ирина Андреевна

Международный центр истории и социологии Второй мировой войны и ее последствий: Младший научный сотрудник

 

 

Янина Полина Николаевна

Международный центр изучения институтов и развития: стажер-исследователь

 
 
Подрядчикова Мария Владимировна

ИППИ РАН, научная сотрудница

 

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.