• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Проект "База данных русских идиом"

Мотивация исследования

 

  • В работе над проектом в 2020-2021, посвященном усвоению идиом в речи нестандартных носителей, мы анализировали различные подходы к классификации идиом для разработки дизайна эксперимента. 

  • В русскоязычной литературе для описания идиом используется классификация (В.В. Виноградов, 1986, Н.М. Шанский, 1985), разработанная для описания фразеологизмов, многие из которых уже выходят из узуса. Более того, в самой классификации авторы приводили лишь несколько примеров каждого типа, не предлагая общий ресурс с разметкой всех идиом русского языка. 

Наш проект стремится заполнить эту лакуну (отсутствие комплексной семантической классификации идиом + размеченного корпуса),  путем создания базы данных русских идиом.

Цели проекта

  • разработка структурно-семантической классификации идиом;

  • проведение эксперимента с носителями русского языка: оценка стимулов по параметрам familiarity, compositionality, predictability, literality;

  • создание аннотированной базы идиом.

Этапы

Выполнено:

  • Поиск и анализ литературы: выявление актуальности создания корпуса идиом (при анализе англоязычной литературы на предмет классификации идиом мы обнаружили, что существует в том числе деление идиом в зависимости от степени их фигуративного значения (Beck, Weber, 2016b, 2020; Titone, Libben, 2014; Holsinger, Kaiser, 2013). В русскоязычной литературе такой подход не применяется, т.к. нет критериев => классификации. 

  • Поиск и анализ литературы на предмет классификации идиом: возможные критерии, методика, подходы (Debra A. Titone & Cynthia M. Connine, 1994) (Добровольской и Баранова: классификация русской фразеологии), (Titone, Libben, 2008).

  • Поиск и анализ текущих проектов, связанных с некомпозициональными  конструкциями и / или корпусами / базами (база данных английских идиом Beck and Weber, 2016, Конструктикон, База вербальных стимулов Юлии Акининой);

  • Работа с тезаурусами идиом и / или фразеологизмов (словарь Добровольского и Баранова, база проекта “Конструктикон”);

  • Обработка данных из различных баз (база данных английских идиом Beck and Weber, 2016);

  • Разметка идиом по частотности (по данным НКРЯ, Araneum, Sketch Engine).

 

В процессе работы: завершение до конца календарного года:

  • Выборка идиом (учёт частотности в корпусах, тематического поля, регистра, типа вершины, синтаксической роли составляющей и др.) (частично выполнено);

  • Подготовка анкеты для опроса носителей;

  • Работа с информантами (носителями русского языка) : проведение опроса (не менее 30) для разметки идиом на предмет степени их фигуративного значения с опорой на критерии familiarity, compositionality, predictability, literality;

  • Поиск конференций и подготовка тезисов (частично выполнено). Возможные конференции: РГГУ СКИЛ, AMLaP (Architectures and Mechanisms for Language Processing).

 

Второй семестр:

  • Работа с носителями русского языка - информантами: проведение опроса (не менее 30) для разметки идиом на предмет степени их фигуративного значения;

  • Межэкспертная оценка;

  • Работа с массивом данных (корпус идиом, собранный с помощью НКРЯ, носителей, лингвистов): анализ данных и статистика.

  • Разработка критериев степени фигуративности идиом.

  • Классификация идиом, 1 этап: первичная классификация; межэкспертная оценка;

  • Классификация идиом, 2 этап: доработка классификации с учетом различий в межэкспертной оценке; финальная оценка классификации.

Верифицируемые результаты - 2022 год

Июнь:

  1. Участие в российской и / или международной конференции;
  2. Проведение воркшопов по современной русской идиоматике для студентов - иностранцев, изучающих РКИ (L2);
  3. Проведение семинаров и практики для студентов - лингвистов (бакалавриат и магистратура).

Сентябрь:

  1. База данных русских идиом (открытый онлайн-ресурс);
  2. Статья на английском или русском языке в журнале из белого списка НИУ ВШЭ;
  3. Проведение семинаров и практики для студентов - лингвистов (бакалавриат и магистратура).

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.