• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Елена Пенская и Леонид Местецкий — о прорывных методах расшифровки исторических рукописей

В интервью для «Коммерсантъ Наука» ординарный профессор НИУ ВШЭ, руководитель Центра цифровых архивных исследований ФГН Елена Наумовна Пенская и ведущий научный сотрудник ИРИИ ФГН, профессор ВМК МГУ Леонид Моисеевич Местецкий рассказали о совместной работе на стыке математики и гуманитаристики. Учёные объяснили, как даже «неидеальная» машинная расшифровка открывает новые горизонты в изучении архивных документов, и поделились результатами проекта по работе с наследием Александра Сухово-Кобылина.

Леонид Местецкий | Елена Пенская

Леонид Местецкий | Елена Пенская
МГУ | Из личного архива

В публичном пространстве всё чаще появляются сообщения о прорывах в расшифровке рукописей благодаря искусственному интеллекту. Однако за громкими презентациями стоит кропотливая совместная работа математиков и гуманитариев. В интервью «Ъ-Наука» Елена Наумовна Пенская и Леонид Моисеевич Местецкий поговорили о реальных возможностях и трудностях этого направления.

Ключевая проблема, как отмечают эксперты, заключается в том, что современные алгоритмы распознавания рукописного текста (так называемая «слабая расшифровка») далеки от идеала и могут содержать до 5–10% ошибок. Это связано с огромным разнообразием почерков, старой орфографией и дефектами документов. Тем не менее учёные отмечают, что даже такой результат является мощным инструментом для исследователя — слабая расшифровка служит основой для получения точной. Эксперт-гуманитарий, хорошо знающий контекст и почерк автора, не начинает с чистого листа, а правит готовый машинный текст, экономя время и силы. Более того, иногда алгоритм может прочитать то, что с первого взгляда неразборчиво для человеческого глаза.

Ярким примером успешного симбиоза технологий и экспертного знания стала работа с неопубликованными дневниками драматурга и философа Александра Сухово-Кобылина из РГАЛИ (35 тетрадей, несколько тысяч страниц). С помощью программы «Подстрочник» удалось не только начать расшифровку, но и провести сложную исследовательскую работу. Был реконструирован круг общения Сухово-Кобылина, восстановлены датировки событий, детали быта и коммуникационные сети внутри нескольких известных семейных кланов. Это позволило по-новому взглянуть на театральную трилогию «Картины прошедшего» и на философскую систему «Всемир», которую автор создавал полвека.

Таким образом, союз «слабой» машинной и «точной» экспертной расшифровки открывает качественно новые горизонты для историков, филологов и литературоведов, позволяя работать с большими массивами данных и ставить более масштабные исследовательские задачи.