Проект "База данных русских идиом"
Мотивация исследования
-
В работе над проектом в 2020-2021, посвященном усвоению идиом в речи нестандартных носителей, мы анализировали различные подходы к классификации идиом для разработки дизайна эксперимента.
-
В русскоязычной литературе для описания идиом используется классификация (В.В. Виноградов, 1986, Н.М. Шанский, 1985), разработанная для описания фразеологизмов, многие из которых уже выходят из узуса. Более того, в самой классификации авторы приводили лишь несколько примеров каждого типа, не предлагая общий ресурс с разметкой всех идиом русского языка.
Наш проект стремится заполнить эту лакуну (отсутствие комплексной семантической классификации идиом + размеченного корпуса), путем создания базы данных русских идиом.
Цели проекта
-
разработка структурно-семантической классификации идиом;
-
проведение эксперимента с носителями русского языка: оценка стимулов по параметрам familiarity, compositionality, predictability, literality;
-
создание аннотированной базы идиом.
Этапы
Выполнено:
-
Поиск и анализ литературы: выявление актуальности создания корпуса идиом (при анализе англоязычной литературы на предмет классификации идиом мы обнаружили, что существует в том числе деление идиом в зависимости от степени их фигуративного значения (Beck, Weber, 2016b, 2020; Titone, Libben, 2014; Holsinger, Kaiser, 2013). В русскоязычной литературе такой подход не применяется, т.к. нет критериев => классификации.
-
Поиск и анализ литературы на предмет классификации идиом: возможные критерии, методика, подходы (Debra A. Titone & Cynthia M. Connine, 1994) (Добровольской и Баранова: классификация русской фразеологии), (Titone, Libben, 2008).
-
Поиск и анализ текущих проектов, связанных с некомпозициональными конструкциями и / или корпусами / базами (база данных английских идиом Beck and Weber, 2016, Конструктикон, База вербальных стимулов Юлии Акининой);
-
Работа с тезаурусами идиом и / или фразеологизмов (словарь Добровольского и Баранова, база проекта “Конструктикон”);
-
Обработка данных из различных баз (база данных английских идиом Beck and Weber, 2016);
-
Разметка идиом по частотности (по данным НКРЯ, Araneum, Sketch Engine).
В процессе работы: завершение до конца календарного года:
-
Выборка идиом (учёт частотности в корпусах, тематического поля, регистра, типа вершины, синтаксической роли составляющей и др.) (частично выполнено);
-
Подготовка анкеты для опроса носителей;
-
Работа с информантами (носителями русского языка) : проведение опроса (не менее 30) для разметки идиом на предмет степени их фигуративного значения с опорой на критерии familiarity, compositionality, predictability, literality;
-
Поиск конференций и подготовка тезисов (частично выполнено). Возможные конференции: РГГУ СКИЛ, AMLaP (Architectures and Mechanisms for Language Processing).
Второй семестр:
-
Работа с носителями русского языка - информантами: проведение опроса (не менее 30) для разметки идиом на предмет степени их фигуративного значения;
-
Межэкспертная оценка;
-
Работа с массивом данных (корпус идиом, собранный с помощью НКРЯ, носителей, лингвистов): анализ данных и статистика.
-
Разработка критериев степени фигуративности идиом.
-
Классификация идиом, 1 этап: первичная классификация; межэкспертная оценка;
-
Классификация идиом, 2 этап: доработка классификации с учетом различий в межэкспертной оценке; финальная оценка классификации.
Верифицируемые результаты - 2022 год
Июнь:
- Участие в российской и / или международной конференции;
- Проведение воркшопов по современной русской идиоматике для студентов - иностранцев, изучающих РКИ (L2);
- Проведение семинаров и практики для студентов - лингвистов (бакалавриат и магистратура).
Сентябрь:
- База данных русских идиом (открытый онлайн-ресурс);
- Статья на английском или русском языке в журнале из белого списка НИУ ВШЭ;
- Проведение семинаров и практики для студентов - лингвистов (бакалавриат и магистратура).
Команда проекта
Гриднева Екатерина Михайловна
Руководитель проекта
Грабовская Мария Андреевна
Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.