Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

  • A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Александр Пиперски выступил на семинаре по теоретической семантике в ИППИ РАН


Преподаватель школы филологии НИУ ВШЭ, научный сотрудник лаборатории лингвистической конфликтологии и современных коммуникативных практик выступил с докладом: «Разные методы сравнения корпусов на основе частотных словарей»

Организатором семинара выступил академик Юрий Апресян.

Оценка близости корпусов на основе мер частотности активно разрабатывается в корпусной лингвистике уже два десятилетия, В докладе была предложена оценка существующих мер (хи-квадрат, коэффициент корреляции Спирмена, сумма минимальных частот, близость по ключевым словам) с помощью корпусов известной степени сходства (Known-Similarity Corpora), а также обсуждалось, на единицах какого уровня (символьные n-граммы, словоформы, леммы) сравнение оказывается наиболее качественным. В качестве примера исследования, для которого полезно измерять близость корпусов, был проведён анализ языка русской поэзии: для сравнения брались корпуса различных русских поэтов, а полученный результат сопоставлялся с известными данными из истории литературы.


 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

По всем вопросам обращайтесь по телефону

+7 495 772-95-90 *22161

или пишите на почту

fgn@hse.ru

Адрес для корреспонденции:

101000, Москва, ул. Мясницкая 20