Александр Пиперски выступил на семинаре по теоретической семантике в ИППИ РАН
Преподаватель школы филологии НИУ ВШЭ, научный сотрудник лаборатории лингвистической конфликтологии и современных коммуникативных практик выступил с докладом: «Разные методы сравнения корпусов на основе частотных словарей»
Организатором семинара выступил академик Юрий Апресян.
Оценка близости корпусов на основе мер частотности активно разрабатывается в корпусной лингвистике уже два десятилетия, В докладе была предложена оценка существующих мер (хи-квадрат, коэффициент корреляции Спирмена, сумма минимальных частот, близость по ключевым словам) с помощью корпусов известной степени сходства (Known-Similarity Corpora), а также обсуждалось, на единицах какого уровня (символьные n-граммы, словоформы, леммы) сравнение оказывается наиболее качественным. В качестве примера исследования, для которого полезно измерять близость корпусов, был проведён анализ языка русской поэзии: для сравнения брались корпуса различных русских поэтов, а полученный результат сопоставлялся с известными данными из истории литературы.
Пиперски Александр Чедович