19 марта 2024, вторник, 10:27
TelegramVK.comTwitterYouTubeЯндекс.ДзенОдноклассники

НОВОСТИ

СТАТЬИ

PRO SCIENCE

МЕДЛЕННОЕ ЧТЕНИЕ

ЛЕКЦИИ

АВТОРЫ

24 сентября 2016, 08:28
Анна Дыбо

Языки южной Сибири в синхронии, диахронии и взаимодействии

Анна Дыбо
Анна Дыбо
Наташа Четверикова

Одним из победителей пятого конкурса мегагрантов стала доктор филологических наук, главный научный сотрудник и заведующая отделом урало-алтайских языков Института языкознания РАН, член-корреспондент РАН, профессор Центра компаративистики Института восточных культур и античности РГГУ Анна Владимировна Дыбо. Публикуем короткое интервью после объявления победителей. Вопросы задавала Наталия Демина.

Уважаемая Анна Владимировна, поздравляем с мегагрантом! Подскажите, как родилась идея проекта – идея сотрудничества с коллегами из Томска? Является ли проект общероссийским или международным?

Идея работы с Томском скорее почти случайная. Дело в том, что в позапрошлый розыгрыш мегагрантов грант с томскими этнологами получил Д.А. Функ – зав. кафедрой этнологии на истфаке МГУ, с которым мы постоянно сотрудничаем по тематике языков и фольклора тюркских народов Южной Сибири. И там сейчас получилась сильная этнологическая лаборатория.

С другой стороны, в Томске еще продолжает действовать школа описания сибирских языков А. П. Дульзона, с представителями которой я все время тоже работаю, там, в частности, гигантский архив материалов, еще не опубликованный, и, в частности, по уже вымершим языкам. Когда томские филологи ко мне обратились, я посоветовалась с Функом и да, мы решились. Я думаю, мы будем привлекать и специалистов не из России по мере надобности и если они будут заинтересованы.

Это первый проект по лингвистике, получивший мегагант? Были ли вы удивлены итогами конкурса?

Кажется, да. Да, я была очень удивлена; тем более, что я была отчасти знакома с еще парой проектов по лингвистике, и мне не казалось, что они хуже этого. Может быть, правда, он более актуален – из-за задач документации малых языков, которые в нем заявлены.

Расскажите, пожалуйста, о целях и задачах проекта. Будет ли в Томске создана новая лаборатория?

Цель – описать языки южной Сибири в синхронии, диахронии и взаимодействии, обращая внимание на максимальное количество важных параметров. Задачи, которые при этом встают:

а) выявить эти самые важные параметры, т.е систему существенных признаков, и добрать по ним материал Тут понадобится полевая и архивная работа. У меня большая часть этой работы уже придумана, но пока мы только подбирались к ней, вот я сейчас руковожу проектом РГНФ, в котором делаются диалектологические опросники нового типа – такие, чтобы вытащить все  параметры, существенные для генеалогической классификации и для установления межидиомных расстояний. У нас заложено несколько корпусных проектов, проект этимологической базы данных и т.д. Это все надо будет сделать.

б) В процессе работы предполагается обработка больших массивов языковых данных. Для этого, кроме формы записи этих данных, необходима вообще разработка программной оболочки, сейчас эта деятельность начата с помощью, в частности, специалистов из Института системного программирования РАН. Они сделали сейчас оболочку для связных иерархических словарных баз данных, в которые можно легко добавлять фонетические файлы с реальным звучанием (нарезанные из экспедиционных материалов), а также сделанные по ним в программе Praat спектрограммы, это улучшает возможности фонетического анализа.

В рамках корпусного проекта Президиума РАН мы разработали морфологический парсер для языков алтайского типа – непарадигматических, его осуществил для одного из тюркских сибирских языков мой сын – Фил Крылов (в порядке родственной взаимопомощи), но, правда, никак не допишет к нему форму, в которой лингвист сможет сам вставлять модули для разных языков.

Сейчас программисты ИСП РАН разрабатывают удобное хранилище для звучащих текстовых корпусов с парсингом – на основе имеющейся оболочки ELAN, но такое, чтоб туда можно было удобно подгружать и править результаты нашего парсинга с помощью упомянутой программы. Разрабатываются также синтаксический и семантический модули разметки, в основном, ради создания автоматических фильтров на пути парсинга.

Нужно еще множество всяких инструментов, например, для измерения фонетических расстояний не по Левенштейну (буквенные замены), а, во-первых, на основании разложения фонем как пучков фонетических признаков; во-вторых, на основании акустических характеристик фонов, репрезентирующих эти фонемы. Получив эти инструменты, мы сможем, наконец, обосновать и исчислить механизмы фонетических изменений.

Чтобы всё это довести до ума, надо, чтоб лингвисты регулярно и в большом объеме использовали соответствующие программные средства и, находя недостатки, несли их программистам, а те бы их правили, лингвисты бы опять несли и т.д. Еще планируется исследование речи билингвов, для чего тоже надо будет составлять корпуса и ловить существенные параметры. И да, для решения всех этих задач в Томске будем делать лабораторию.    

Какими вы видите итоги проекта, если всё будет получаться и финансирование не будет запаздывать?

Ну, написали мы вот что:

Ожидаемые результаты:

1. Будут собраны лингвистические данные, релевантные для лингвогеографической, этнокультурной и социолингвистической классификации языков и диалектов региона. Данные будут представлены в виде связанных баз данных, а также визуализованы на электронной карте региона с возможностью построения изоглосс различного типа.

2. Будут созданы психолингвистические базы данных, отражающие когнитивные аспекты этноязыковой специфики идиомов и результаты их взаимодействия между собой и русским языком ((не менее 150 000 реакций на каждый) язык: шорский, хакасский)

3. Будут созданы / расширены имеющиеся корпусы идиомов Южной Сибири ( в том числе звучащие корпуса), в частности, чулымского, телеутского, шорского, хакасского и иных тюркских языков региона – за счет работы с архивными материалами и полевых экспедиционных исследований, – доведя каждый из подкорпусов до 500 тыс. – 1 млн. словоупотреблений.

4. Для корпусного представления текстов будет разработана классификационная схема, позволяющая автоматическое/полуавтоматическое извлечение сопоставительного материала из корпусов.

5. Будет создан корпус образцов устной и письменной русской речи билингвов Южной Сибири с использованием разработанной методики, корпус русско-тюркского билингвизма объемом до 500 000 словоупотреблений (телеутский, шорский, хакасский).

6. Будут описаны механизмы взаимодействия языков в речи билингвов изучаемых идиомов (на семантическом, грамматическом, концептуальном уровнях) посредством серии психолингвистческих экспериментов (9 поведенческих экспериментов с использованием программного обеспечения E-Prime и устройства для записи движения глаз eye-tracker), выявляющих такое взаимодействие в ходе процессов порождения, восприятия речи, чтения, решения когнитивных задач с лингвистическим компонентом

7. Будут разработаны этимологические словари в форме реляционных баз данных, на основании которых будут построены генеалогические деревья языков и диалектов.

8. Будут выявлены корреляции между различными исследуемыми классификационными языковыми и психолингвистическими признаками и сделаны выводы о действии основных этногенетических тенденций в регионе

9. Будет разработана рабочая модель корпусного планирования во всех субъектах РФ в Южной Сибири для имплементации её в процессе ревитализации локальных этнических языков, находящихся под угрозой исчезновения.

Чтобы выявить корреляции, конечно, нужны не только деньги, но и корреляции, так что тут абсолютной уверенности быть не может.

Борис Штерн, описывая итоги первого конкурса мегагрантов 2010 года, написал: «Дурные деньги достались достойнейшим». Вы согласны с его оценкой, если проецировать её на конкурс этого года?

Да, очень на то похоже. Во всяком случае, доклады на конференции мегагарантников в Казани были в основном очень интересные.

Спасибо за интервью!


ПОДГОТОВКА ИНТЕРВЬЮ: Наталия Демина

Редакция

Электронная почта: polit@polit.ru
VK.com Twitter Telegram YouTube Яндекс.Дзен Одноклассники
Свидетельство о регистрации средства массовой информации
Эл. № 77-8425 от 1 декабря 2003 года. Выдано министерством
Российской Федерации по делам печати, телерадиовещания и
средств массовой информации. Выходит с 21 февраля 1998 года.
При любом использовании материалов веб-сайта ссылка на Полит.ру обязательна.
При перепечатке в Интернете обязательна гиперссылка polit.ru.
Все права защищены и охраняются законом.
© Полит.ру, 1998–2024.