Елена Пенская и Леонид Местецкий — о прорывных методах расшифровки исторических рукописей
В публичном пространстве всё чаще появляются сообщения о прорывах в расшифровке рукописей благодаря искусственному интеллекту. Однако за громкими презентациями стоит кропотливая совместная работа математиков и гуманитариев. В интервью «Ъ-Наука» Елена Наумовна Пенская и Леонид Моисеевич Местецкий поговорили о реальных возможностях и трудностях этого направления.
Ключевая проблема, как отмечают эксперты, заключается в том, что современные алгоритмы распознавания рукописного текста (так называемая «слабая расшифровка») далеки от идеала и могут содержать до 5–10% ошибок. Это связано с огромным разнообразием почерков, старой орфографией и дефектами документов. Тем не менее учёные отмечают, что даже такой результат является мощным инструментом для исследователя — слабая расшифровка служит основой для получения точной. Эксперт-гуманитарий, хорошо знающий контекст и почерк автора, не начинает с чистого листа, а правит готовый машинный текст, экономя время и силы. Более того, иногда алгоритм может прочитать то, что с первого взгляда неразборчиво для человеческого глаза.
Ярким примером успешного симбиоза технологий и экспертного знания стала работа с неопубликованными дневниками драматурга и философа Александра Сухово-Кобылина из РГАЛИ (35 тетрадей, несколько тысяч страниц). С помощью программы «Подстрочник» удалось не только начать расшифровку, но и провести сложную исследовательскую работу. Был реконструирован круг общения Сухово-Кобылина, восстановлены датировки событий, детали быта и коммуникационные сети внутри нескольких известных семейных кланов. Это позволило по-новому взглянуть на театральную трилогию «Картины прошедшего» и на философскую систему «Всемир», которую автор создавал полвека.
Таким образом, союз «слабой» машинной и «точной» экспертной расшифровки открывает качественно новые горизонты для историков, филологов и литературоведов, позволяя работать с большими массивами данных и ставить более масштабные исследовательские задачи.