• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Асимметрии в кодировании пространственных значений в языках мира

Асимметрии в кодировании пространственных значений в языках мира

В типологической литературе о грамматике пространственных выражений обсуждается множество разных асимметрий в выражении аргументов Цели движения и Источника движения. Например, кросс-лингвистическая тенденция к более простому и короткому грамматическому кодированию Цели по сравнению с Источником, а также более частое выражение аргументов Цели в дискурсе анализируются как демонстрирующие эту универсальные асимметричные предпочтения человеческого языка (англ. Goal-bias)

В ряду остальных феноменов обсуждается, что выражения Цели как правило имеют более точно заданное топологическое отношение Фигуры и Фона, чем выражения Источника. Часто цитируемым примером является французский язык, в котором используются три различных предлога для обозначения движения к Цели, на поверхность Цели или вовнутрь Цели (à, sur и dans соответственно) и один-единственный предлог de для описания движения от или изнутри Источника. 

В данном исследовании мы стремимся расширить эмпирическую базу таких обобщений. Мы проверяем наличие этого типа асимметричного маркирования в зависимостном кодировании Целей и Источников. Мы исследуем выборку из 50 генетически и ареально разнообразных языков, используя описательные грамматики в качестве основного источника данных. Мы фокусируемся на базовых непроективных топологических отношениях В, НА, ПОД и РЯДОМ, поскольку ожидаем, что именно эти конфигурации чаще всего будут различать роли местоположения (Место) и направления (Цель и/или Источник).

Разработка системы аннотации и выборки

На первом этапе работы участниками группы было проведено пять семинаров, в ходе которых были приняты решения о языковой выборке, использующейся для данного исследования, а также был утвержден и описан порядок аннотации языковых данных.

Был составлен алгоритм подбора языков, учитывающий не только генеалогические и ареальные параметры варьирования, но также и библиографическую информацию о разных идиомах. При помощи этого алгоритма была составлена репрезентативная сбалансированная выборка из 50 языков с достаточно полными грамматическими описаниями, подходящими для целей данного проекта.

Языковая выборка, используемая в данном проекте
М. В. Попова

Методология данного проекта предполагает семантическую и морфосинтаксическую разметку языковых данных, приведенных авторами грамматических описаний. На первом этапе работы участники проекта выработали унифицированную систему аннотации языковых данных. Описание системы аннотации можно найти по ссылке.

Разметка

После создания системы аннотации, была выполнена обработка данных пяти языков согласно правилам аннотации. После начала работы над конкретно- языковыми данными аннотация дополнительно корректировалась, был проведен специальный семинар, посвященный проблемным местам шаблона для разметки данных.

По результатам анализа размеченных данных, был написан первый драфт текста про пространственные асимметрии в одном из языков выборки и сформулирован ряд уточнений к исходной гипотезе. Обработанные данные можно найти по ссылке.

Второй этап работы проекта

В июне мы закончили второй этап работы над проектом "Асимметрии в кодировании пространственных значений в языках мира". На данном этапе работы мы занимались решеним трех задач. Во-первых, разработанный на первом этапе работы метод сэмплирования был реализован в виде программы на Python, находящейся в открытом доступе (https://github.com/vantral/genera_and_sampling). Данная программа может быть использована типологами для составления любых выборок, позволяя одновременно контролировать степень описанности языков, попадающих выборку, а так же их генеалогические и географические характеристики.

Вторая задача, которую мы решили — описание данных, которые были аннотированы на первом этапе работы проекта. В нашей базе данных содержатся примеры выражения двигательных событий для шести языков из выборки. Для каждого из этих языков была дана интерпретация распределения маркеров пространственного кодирования в корпусе. Изученные данному моменту языки неоднозначно ведут себя в отношении нашей гипотезы.

Третьей задачей, которую мы решили на данном этапе работы, является создание удобного интерфейса для работы с базой примеров. Интерфейс был разработан с учетом специфики данных, с которыми мы имеем дело в нашем проекте. Разработка интерфейса облегчит дальнейшую работу по интерпретации и описанию данных. Интерфейс доступен по ссылке: https://asimmetry.pythonanywhere.com

Участники проекта

Алексеева Анастасия Павловна

Стажер-исследователь

Бузанов Антон Олегович

Стажер-исследователь

Попова Маргарита Владимировна

Приглашенный преподаватель

Филатов Константин Вадимович

Стажер-исследователь


 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.