19 марта 2024, вторник, 14:41
TelegramVK.comTwitterYouTubeЯндекс.ДзенОдноклассники

НОВОСТИ

СТАТЬИ

PRO SCIENCE

МЕДЛЕННОЕ ЧТЕНИЕ

ЛЕКЦИИ

АВТОРЫ

Лекции
хронология темы лекторы

Как создается единая классификация языков мира

Мы публикуем расшифровку лекции старшего научного сотрудника Центра компаративистики, заведующего кафедрой истории и филологии Дальнего Востока Института восточных культур и античности Российского государственного гуманитарного университета, соруководителя международного проекта «Эволюция языка» (Evolution of Human Language; Институт Санта-Фе, Нью-Мексико) Георгия Старостина, прочитанной 16 декабря 2010 года в Политехническом музее в рамках проекта "Публичные лекции Полит.ру". 

Текст лекции

Георгий Старостин (фото Наташи Четвериковой)
Георгий Старостин (фото Наташи Четвериковой)

Большое спасибо всем, кто пришел сегодня. Наверняка здесь есть большое количество постоянных слушателей «Полит.ру» поэтому я для них хочу напомнить, что тема моей сегодняшней лекции будет довольно сильно пересекаться с тем, что уже было, с тем уже рассказывал Олег Алексеевич Мудрак, когда он выступал на тему истории языков, но это было 5 лет назад, с тех пор много воды утекло. Тем не менее, я не хотел бы повторять слово в слово то, что рассказывал предыдущий докладчик, а предпочту сконцентрироваться в большей степени на методологическом аспекте нашей работы, работы компаративиста, так сказать, на кухне сравнительно-исторического языкознания, показать не столько к каким результатам мы пришли, хотя это тоже будет в какой-то степени, сколько - как, собственно, мы это делаем, что умеем, а чему еще предстоит научиться. Поэтому лекция называется «Как создается единая классификация языков мира», а не «Как выглядит единая классификация языков мира».

Для чего классифицировать языки

Для чего вообще нужно классифицировать языки? Начнем с азов. На земном шаре существует несколько тысяч разных языков. Точное количество никто не определял, и определить невозможно - в первую очередь, потому что очень тяжело провести границу между языком и диалектом. Есть такая система международный проект «Этнолог» который работает над инвентаризацией и сбором сведений по языкам мира.

В системе «Этнолог» перечислены основные семьи, понятно, что ничего разобрать невозможно, но это, я надеюсь, будет вывешено в сеть, и можно будет внимательнее все разобрать. «Этнолог» насчитывает ровным счетом 6909 языков, но это личное мнение «Этнолога», другие при желании могут насчитать их 2 тысячи, а могут насчитать 60 тысяч - в зависимости от того, как проводить границу между языком и диалектом. В любом случае, очень много, и, конечно, будет гораздо больше, если к живым на сегодняшний день языкам присовокупить еще данные по вымершим языкам - даже только тем вымершим языкам, от которых до нас дошли какие-то сведения, потому что, понятное дело, было огромное количество вымерших языков, по которым никакой информации у нас вообще не осталось.

Какие цели преследует классификация языков? Во-первых, как классификация любых объектов, в первую очередь, в целях, так сказать, гармонических, эстетических - навести порядок в этом хаотическом нагромождении языковых структур, что, в общем-то, свойственно человеку в принципе. Другая цель – аналитическая. Если мы раскладываем все известные нам языки по полочкам, мы получаем ключ к изучению устройства языка как такового, Языка с большой буквы. Не расклассифицировав языки, мы даже не можем попытаться объяснить, почему языки оказываются такими разными – или, наоборот, такими похожими. Третья, с моей точки зрения как специалиста в соответствующей дисциплине, самая важная - это историческая цель: классификация языков просто-напросто проливает очень важный необходимый свет на лингвистическую предысторию человечества, а вместе с лингвистической предысторией – на историю человечества как такового.

Эволюционная модель языкового развития - основная на сегодняшний день - предполагает, что основная причина языкового разнообразия в дивергенции в происхождении.

Как в одной из возможных схем классификации индоевропейских языков, которые здесь представлены, постепенно расселяясь по разным территориям, люди, которые первоначально говорили на одном и том же языке, утрачивают постоянный контакт друг с другом - и языки их начинают расходиться, изменяться в разных направлениях. Чем больше проходит времени, тем больше изменяется язык, и получается, что чем более один язык похож на другой, тем ближе к нашему времени существовал общий для них язык-предок. Группируя языки по степени их сходства, мы получаем примерную схему того, как языки развивались сотни и даже тысячи лет тому назад.

Как классифицируют языки

Какие классификации существуют в современной лингвистике? Если проводить аналогию с биологическими науками, то, наверное, ближе всего к биологии классификации, которые стали разрабатываться относительно недавно на серьезном научном уровне. Во всяком случае, носители научного уровня - это типологические классификации, которые подразделяют языки на группы или типы в зависимости от того, как в них реализуется то или иное свойство человеческого языка вообще. Простейший пример: в любом языке есть гласные и согласные, это универсальное свойство языка, но пропорциональное соотношение гласных и согласных бывает разное от языка к языку. В шведском мы имеем 18 согласных, на которые приходится 17 гласных, а в абхазском мы имеем 60 согласных и на них всего 2 гласных. Один вариант - классифицировать языки по пропорциональному соотношению, более сложная классификация - по тому, какие конкретно типы гласных и согласных представлены в языках. Признаков таких существует огромное количество. Можно выбирать морфологические, грамматические признаки, состав грамматических категорий. В языке бывает число, падеж, время, наклонение и так далее. Бывают синтаксические критерии: порядок слов в предложении, способы образования сложных предложений и тому подобное.

Сейчас существует несколько глобальных типологических проектов, и из них самым известным (картинку с сайта я показываю) является так называемый World atlas of linguistic structures – мировой атлас лингвистических структур, который в Лейпциге в институте Макса Планка подготовил большой коллектив ученых под руководством Мартина Хаспельмата и Бернарда Комри.

Это огромная база данных, которая охватывает почти половину всех известных языков мира, и для каждого из них там отмечены лингвистические значения примерно по 140 признакам. Есть другой подход, который больший упор делает на количество признаков. В институте языкознания Академии Наук у нас создается база, которая называется «Языки мира», и там языков сильно меньше, примерно 400 языков охвачено, но зато по каждому языку отмечено порядка 4000 разных признаков. Эта картинка из World atlas of linguistic structures отражает разного рода системы вокализма в языках мира. Синим отмечены бедные системы гласных, белым - средние, красным - богатые системы гласных, и мы можем смотреть, как этот признак ведет себя по языкам мира.

Поскольку языковые изменения давно сравниваются с биологическими, то можно развивать эту аналогию - сравнивать типологические признаки, например, с разными биологическими признаками, на основании которых можно строить так же, как и в биологии, классификации. Самое простое, грубое решение вопроса возможно такое: языки, у которых много признаков совпадают между собой, мы будем считать близкими родственниками, на этом основании классифицировать их по группам, потом - по семьям и так далее. Все эти типологические базы компьютеризированы, информация обрабатывается в них автоматически, и в результате, просчитав, обследовав большое количество признаков, можно на этом основании построить разные типологические деревья, точнее, обычно строят не деревья, а сети networks – это графы более сложной структуры без единой вершины, которые позволяют наглядно определить позицию одного элемента относительно всех остальных. Вот пример такой сети, построенной как раз по нескольким языкам Евразии и Африки на материале мирового атласа языковых структур.

Диаграмма типологической близости языков Евразии и Африки по WALS

Если посмотреть на такую сеть, то окажется, что, в общем, информация, которая на ней представлена, неплохо соотносится с реальной исторической информацией, которая нам известна по другим методикам. В частности - в нижней части, хотя это плохо видно, кучкуются индоевропейские языки близко друг к другу, вместе объединяются языки уральской семьи, вместе - языки австронезийской семьи и так далее.

Чего не улавливает типология

Если проводить более пристальный анализ, то оказывается, что внутри этих пучков проскальзывают какие-то связи, абсурдным образом устанавливаемые. Какую бы типологическую модель мы ни брали, она на 20-30% будет давать заведомо абсурдные результаты. На этой же диаграмме, например, языки хинди и армянский, вполне классические индоевропейские языки, отрываются от индоевропейской семьи и уходят куда-то в Северную Африку. Если брать другие диаграммы, диаграмму по языкам мира, которая была недавно составлена, там ирландский язык (классический индоевропейский язык) оказывается слева от кетского – это язык изолят в Сибири - и справа от бурушаски – это тоже язык изолят в горах Памира, - и совершенно нечего между ними делать ирландскому, но хорошо, что это индоевропейские языки — про индоевропейские языки мы много знаем из разных источников, и можно сразу определить ошибки, а представьте себе, если здесь на месте индоевропейских языков окажутся папуасские языки, по которым мы не знаем ровным счетом ничего, никакой исторической информации нет, и серьезную и грубую ошибку сделать очень легко.

С чем связана такая ситуация? Почему типологический анализ может давать и все время дает в определенных случаях неверные результаты? Дело в том, что мы не разграничиваем при построении такой модели два очень важных и разных механизма. Языковые изменения, как известно, в языке происходят, во-первых, в ходе так называемой вертикальной передачи, вертикальной трансмиссии от старшего поколения к младшему и, во-вторых, что очень важно, в ходе горизонтальной передачи – передачи элементов из одного языка в другой в ходе межъязыковых контактов. В отличие от биологической эволюции, где такая горизонтальная трансмиссия - вещь довольно редкая, в языке она совершенно естественна и происходит все время. Язык не существует в изоляции, межъязыковое общение происходит все время. Можно себе представить ситуацию, когда колония в 10-15 человек высаживается на необитаемый остров, где ей не с кем контактировать, и тут язык будет развиваться без трансмиссии. Во всех остальных случаях контакты практически неизбежны. Самый тривиальный вид горизонтальной трансмиссии - это лексические заимствования – слова, заимствующиеся из одного языка в другой, но бывают и катастрофические ситуации, когда заимствуются целые большие структуры из одного языка в другой, и тогда обычно происходит ситуация смены языка.

Эта ситуация очень естественна и для древнего мира, и даже во многих уголках современного мира. Например, население завоеванной страны начинает в срочном порядке учить язык завоевателя, или другая, более хитрая ситуация: мигрирует в какую-то часть континента какая-то часть мужского населения начинает там активно общаться с местным населением, брать в жены девушек из местного народа, те перенимают с некоторыми неизбежными ошибками язык своих мужей, а поскольку язык в первую очередь передается от матери, то и дети их начинают говорить так же, как говорили они. Что происходит? То же самое, что и с нами происходит, когда мы изучаем иностранный язык. Если у нас нет языковых сверхспособностей, если мы сами над собой жесточайший контроль и самодисциплину не осуществляем, то мы всегда на изучаемом языке говорим с ошибками - и не просто с ошибками, а нормы изучаемого языка подменяем нормами собственного языка. Когда русский человек изучает английский язык, что обычно падает первой жертвой? Артикли, которые с большим трудом даются русскому человеку. Если большая русская колония перейдет на английский язык разом, то без очень жесткого контроля артиклям придется явно плохо, они, скорее всего, просто отомрут. И, тем не менее, в ситуации, когда сталкиваются две языковые традиции, почти неизменно верх одерживает какая-то одна, смешения 50 на 50 практически никогда не происходит. То есть плохо выученный русифицированный английский все равно остается английским языком. Когда кельтские племена Европы после римского завоевания переходили на латынь, они ее тоже выучивали с ошибками, но, тем не менее, она оставалась видоизмененной латынью. Или, скажем, какие-нибудь австроазиатские племена в Южном Китае в ходе китайской экспансии активно осваивали китайский язык – то же самое происходило – они проводили некоторую подрывную работу по изменению китайского языка, тем не менее, язык в основе своей оставался китайским.

Почему? Причина простая. Язык на самом деле передается от поколения к поколению или от учителей к ученикам, условно говоря, в первую очередь не через типологические признаки, а через конкретные формы слова и грамматические показатели, которые, я чуть позже об этом скажу, на самом деле - те же самые слова. Человек, который заучил, сколько в русском языке падежей и как они называются, на русском не заговорит. Человек, который выучил много слов русского языка, но толком не освоил падежную сочетаемость и будет говорить с ошибками, его будет понять сложно, иногда смешно, но, тем не менее, можно будет добиться некоторого понимания. Те же самые австроазиатские племена в Южном Китае на протяжении многих веков осваивали китайский язык и утрачивали собственные языки, а китайские слова произносили в соответствии с теми произносительными нормами, которые у них были родными, унаследованными от матерей. Например, они упрощали сложное сочетание согласных, подставляли свои тональные характеристики. Все знают, что в современном китайском языке есть смыслоразличительные тоны, но в древнекитайском языке этих тонов не было. Откуда они появились? В результате того, что огромное количество людей, говоривших на тональных языках, перешли на китайский язык и принесли эти тоны с собой. Какие-то элементы китайского языка трансформировались в их произношении тонами, но слова при этом честно учили китайские. Отдельные слова из старых языков тоже проникали, но основной словарный фонд все равно оставался китайским. То же самое с латинским языком и огромным бесчисленным количеством языков по всем уголкам планеты.

Почти неизбежное явление. Если языки имеют разное происхождение, но при этом исторический процесс забросил их носителей в один и тот же культурно-географический ареал, то они рано или поздно образуют так называемый языковой союз, и главная, первоочередная задача компаративиста (исторического лингвиста) - не спутать языковой союз с настоящей языковой семьей. Например, современный грузинский язык по очень большому количеству типологических признаков такой же, как находящиеся рядом с ним языки Чечни и Дагестана, но исторически, если и связан с ними родством, то это сверхдальнее родство. На самом деле более близким историческим родственником для дагестанских языков являются сино-тибетские языки, которые включают китайский, а наоборот, если мы будем смотреть на современный китайский, то он по форме гораздо больше, чем любой язык Дагестана, похож на вьетнамский язык, а с ним он связан очень древним родством, если вообще таковое есть.

Типологическая классификация всех этих глубоких тонкостей не чует, поэтому значимость ее для реконструкции исторического процесса на самом деле довольно низкая. Конечно, конкретные формы, слова тоже заимствуются и передаются не только вертикальным, но и горизонтальным образом - нередко в огромных количествах. Классические хрестоматийные примеры - это колоссальный процент китайской лексики в японском языке, например, или французской лексики в английском языке. Поэтому важно учитывать, что для классификации годятся далеко не любые слова, а только определенная категория слов, но об этом я скажу чуть позже.

Языковое родство

Теперь отмотаем пленку чуть-чуть назад, в прошлое. Я говорил о типологической классификации, но эта затея совсем недавняя, даже самые заядлые типологи не претендуют сегодня на то, что типологическая классификация может заместить более традиционную генетическую классификацию, а для этой классификации можно вести отсчет с разных хронологических точек. Один возможный вариант - это статья выдающегося индоевропеиста Августа Шлейхера, написанная в 1853 году, в ней он впервые ввел метафору эволюционного дерева по отношению к языкам, что было за 6 лет до выхода в свет дарвиновского «Происхождения видов».

Беда в том, что за самими терминами «типологическая классификация» и «генетическая классификация» стоит разный смысл. Типологическая классификация - в первую очередь методологическая; ее понятно, как строить, – отбираешь какое-то количество признаков (10, 20, 50, 100, 400) и по ним строишь типологическое дерево или типологическую сеть, как угодно ее можно назвать, но при этом совершенно непонятно, что реально отражает, какой исторический смысл лежит за этой классификацией, в каком случае она показывает историческую связь и родство языков, а где она показывает ареальные языковые союзы, а где она показывает случайные совпадения.

Генетическая классификация языков, наоборот, имеет совершенно прозрачную историческую интерпретацию. Генетическая классификация - это классификация языков по признаку наличия или отсутствия у них ближайшего общего предка. Языки, представляющие собой результат исторического развития из одного праязыка после того, как его носители расходятся в разные стороны, попадают в одну группу, и типологическая классификация (очень важна типологическая характеристика языка) может измениться со временем, при этом очень значительно, а генетическая классификация языка неизменна. Языку для того, чтобы сменить свою генетическую классификацию, остается только умереть. С другой стороны, вопрос о том, как строить генетическую классификацию, точнее, как правильно ее строить, чтобы в результате появлялась максимально правдоподобная картинка, намного сложнее, чем вопрос построения классификации типологической.

В принципе, сравнительно-историческое языкознание хорошо знает, как обосновывать родство языков с помощью установления между ними регулярных фонетических соответствий как вот здесь, если видно, - на примере нескольких соответствий между близкородственными друг другу английским и немецким языком и чуть дальше родственным с ними русским языком. Определяются звуковые законы, по которым изменялись слова от праязыка к языкам-потомкам. Один и тот же звук, одна и та же фонема, в каком бы слове она ни встречалась, должна в другом языке соответствовать точно определенной фонеме. Например, английское «t» всегда соответствует немецкому «z» и русскому «д» - это в очень грубых терминах.

Сейчас нет времени подробно повторять все азы компаративистики, главное - то, что нам важны систематические закономерности, которые повторяются из раза в раз. И по этим закономерностям мы восстанавливаем для праязыка - для общего предка этих языков - общий корпус корневых морфем и служебных морфем, лексических и грамматических. На слайде указано внизу, где все перечисленные слова возводятся к их праиндоевропейским приблизительным реконструкциям под звездочкой. Как быть дальше?

Георгий Старостин (фото Наташи Четвериковой)
Георгий Старостин (фото Наташи Четвериковой)

Предположим, у нас группа из 20 или 200 языков. Между всеми этими языками мы можем установить соответствие, показать, что они родственны друг другу – такая большая дружная семья, но языков очень много, и как внутри этой семьи устанавливаются взаимоотношения, в каком порядке эти языки располагаются на ветвях дерева? Интуитивно кажется, что чем более похожи друг на друга языки, тем ближе они должны располагаться. Если мы сравниваем русский, польский, испанский, итальянский, то, наверное, каждый из нас, даже без серьезной языковой подготовки, только чуть-чуть познакомившись с этими языками, поймет, что русский ближе к польскому, испанский - к итальянскому, чем русский к испанскому или польский к итальянскому, но, во-первых, это не всегда работает, это не всегда правда, потому что, в общем и целом, языки могут меняться с разной скоростью в зависимости от разных и обычно непредсказуемых обстоятельств, например, во многих отношениях современный немецкий язык больше похож на современный шведский, чем на современный английский – при том, что все германисты, тем не менее, сходятся на том, что шведский – это одна скандинавская подветвь германской группы, а английский и немецкий – другая.

Во-вторых, простой, но неизбежный вопрос: как считать сходства и различия, и какие сходства и различия важнее других, чему при подсчете сходств отдавать предпочтение - количеству совпадающих слов, звуковым изменениям, грамматическим парадигмам? Самое тяжелое - это ситуации, когда граница между языками или языковыми группами размыта и не бросается в глаза. Например, индоевропейские языки худо-бедно ко всеобщему удовлетворению поделили примерно на 10-15 групп: есть славянские языки, германские, романские, индийские, иранские, греческие, армянский и другие, а дальше, как на этой диаграмме, которая консервативна и осторожна, оказывается, что все эти группы примерно в одинаковой степени удалены друг от друга, но трудно себе представить, что исторически так оно и было, что в один прекрасный момент был праиндоевропейский язык, а потом люди встали и одним прекрасным утром разошлись в 15 разных сторон. Скорее всего, процесс был более сложным, и какие-то из этих групп все-таки имеют непосредственных общих предков внутри индоевропейского древа, но какие? Это стандартный бич индоевропеистики и вообще любой области компаративистики. Наверное, я не сильно покривлю душой, если скажу, что сколько индоевропеистов, столько и моделей классификации индоевропейской семьи, а это наиболее тщательно исследованная, изученная изо всех языковых семей мира. Что говорить о других семьях, где данных меньше, а мнений еще больше?..

Как найти дальних родственников

Самый тяжелый случай - это классификация языков на глубоком уровне, когда мы из области обычной традиционной компаративистики перемещаемся в область макрокомпаративистики. Это направление сравнительно новое, во многом противоречивое, спорное, и здесь еще добавляется дополнительная проблема - скудность сопоставительного материала. Согласно классической теории, которую разработал отечественный лингвист Владислав Маркович Иллич-Свитыч, индоевропейская семья, о которой мы только что говорили, на более глубоком уровне, условно скажем, 12 тысяч лет назад, входит в так называемую ностратическую макросемью, ее основные ветви разными цветами указаны на диаграмме, на карте, туда же входят алтайские языки, уральские языки, дравидийские языки в Индии и картвельские языки – маленькое пятнышко на Кавказе отмечено.

Как установить внутреннюю классификацию ностратических языков, какие из этих больших семей ближе связаны друг с другом в рамках ностратической семьи? Очень тяжело определить, потому что за истекшие 12 тысяч лет общее ностратическое наследие в этих семьях поистрепалось настолько, что с большим трудом вообще удается установить звуковые законы, разработать надежный корпус этимологии, и строгой оценки языковых расстояний пока не существует; критерии не разработаны.

Под вопросом даже состав ностратической макросемьи, потому что Иллич-Свитыч включал в нее еще, помимо перечисленных мною только что, - отмечено светло-голубым светом - огромную семито-хамитскую или афразийскую семью языков. На ней говорит семитское население Азии и большое количество языковых групп в Африке, а позже Сергей Анатольевич Старостин выдвинул контргипотезу, согласно которой афразийская семья, столь огромная, - на самом деле таксономическая единица такого же хронологического уровня, как и ностратическая, то есть является сестрой, а не дочерью ностратической, и тот же праафразийский язык должен был существовать примерно 12 тысяч тому назад. Убедить всех в правильности этой гипотезы им не удалось, и есть некоторое количество сторонников ностратической гипотезы, которые до сих пор придерживаются более старой версии, что афразийская семья - это дочерняя ветвь ностратической.

Уточню, что когда я говорю о классификациях, может показаться, что я смешиваю две разные задачи. Потому что, во-первых, есть вопрос внешней классификации языка: найти для языка А его ближайшего родственника Б, или образуют ли языки А и Б единую таксономическую единицу - это вопрос корректного обоснования языкового родства и вопрос доказательства языкового родства (я слово «доказательство» не очень люблю применительно к этой теме). И есть вопрос внутренней классификации для родственных языков: А, Б и В - мы показали, что они родственны, и для языков А, Б и В определить, кто ближе из них родствен: А и Б против В, или А и В против Б, или, может, все три равноудалены друг от друга. Здесь мы доказываем не факт родства, а степень родства. Это две несколько разные задачи, но методы их решения во многом схожи. Во многих случаях первую задачу нельзя решить до конца, не решив одновременно с ней и вторую.

Чтобы на научном уровне обосновать факт родства между А и Б, нужно показать наличие между ними неслучайных сходств. Случайные сходства находятся между любыми языками, и горе-языковеды от Фоменко до Задорнова этим активно пользуются. Важно показать систематические неслучайные корреляции между языками. Регулярные соответствия - как то, которое было между английским немецким и русским языками, – это простейший и одновременно важнейший пример такой корреляции. Сопоставляются лексические и грамматические корпуса языков, на их базе устанавливаются закономерные соответствия, и это доказывает родство, но тут есть свои подводные камни.

Мнимое родство

Во-первых, довольно часто можно установить такие соответствия между языками не родственными, а связанными ареальными связями горизонтальной трансмиссии, например, между китайским и японским, или, еще ближе к нам, - между французским и английским языком. На схеме сверху синим цветом представлены слова, которые были заимствованы из французского в английский, а снизу красным цветом выписаны слова которые не заимствованы, а восходят к общему индоевропейскому предку французского и английского языка.

Где проще установить фонетические соответствия? В верхней группе, потому что слова гораздо более похожи друг на друга, но установив между ними соответствия и сказав, что мы установили соответствия и доказали родство английского и французского языка, мы попадем в ловушку, потому что мы контактные связи примем за родственные связи. А родственные связи у нас внизу, и они гораздо хитрее и сложнее, и хорошо что у нас есть данные о древних предках французского и английского языков, где эти слова выглядят гораздо более похоже друг на друга, чем они выглядят сегодня. Здесь мы знаем реальную историю языков. А как нам быть в ситуации, где у нас нет исторических сведений, где были бесписьменные языки, записанные 50 или 20 лет назад, и там тоже много похожих слов? Что это - горизонтальная или вертикальная трансмиссия? Так сразу иногда не разберешься.

Во-вторых, бывает определенный тип лингвистических работ, где выдумываются псевдосоответствия, и это обычно получается, если очень много внимания обращать на звуковую сторону языка и очень мало - на семантическую, на смысловую сторону сравниваемых слов, потому что все знают, что значения слов, так же, как и звучание, со временем меняются - а как? Строгих закономерностей пока никто не предложил.

Пример. Есть один известный африканист, фамилию которого я называть не буду, он опубликовал целую серию этимологических словарей для разных африканских семей, и там все очень хорошо со звуковой стороной, но если смотреть на то, какие слова сравниваются, то на каждом шагу встречаются замечательные перлы: сравнивается в одном языке слово со значением солнце, в другом оно значит дым, а в третьем оно значит птица - и восстанавливается общее значение - парить в небе. Или в одном языке слово хороший, а в другом языке слово пиво и устанавливается значение сладкий. Или в одном языке – мед, а в другом языке, прощу прощения – блевотина, и восстанавливается нечто липкое. С такой семантикой можно придумать и обосновать любые регулярные соответствия. На таких же псевдосоответствиях держатся несколько имеющих активное хождение в научном мире гипотез. Например, гипотеза о родстве дравидийских языков Южной Индии с вымершим древневосточным эламским языком, теория, запущенная в свое время американским лингвистом Дэвидом Макальпином, по-видимому, тоже подделанная система, очень плохая с семантической точки зрения.

Сам факт наличия системных соответствий между языками недостаточен; нужно еще что-то. Есть широкое представление, что этим чем-то должна быть грамматика, что родство языков и классификационная принадлежность языков должны обосновываться на примерах системных соответствий грамматических парадигм: склонение, спряжение и так далее. Действительно, грамматические морфемы очень редко и неохотно заимствуются из языка в язык, поэтому когда мы сравниваем грамматические морфемы, мы избегаем риска принять горизонтальную передачу за вертикальную. Беда в том, что, во-первых, грамматические морфемы обычно очень короткие, состоят из одного-двух звуков, значения сложные, часто размыты, и очень большое пространство для развития личной фантазии.

Недавно прошла очередная сенсация, что якобы доказано близкое родство североамериканских языков группы на-дене с кетским языком Западной Сибири, так называемая дене-енисейская теория, и это было доказано на основании систематических корреляций в морфологических системах этих языков. На самом деле, языки действительно родственны, по-видимому, в рамках большой дене-кавказской макросемьи, сама идея довольно старая, но грамматические параллели, которые автор этой гипотезы приводил, на поверку оказываются фиктивными, плодом его исследовательской фантазии.

Часто приходится слышать утверждения, что грамматика языка более стабильна, чем лексика, что она устойчивее по отношению к заимствованиям, чем лексика, и это, наверное, правда, но, тем не менее, насчет грамматики как идеального показателя родства все не так просто. На близких хронологических расстояниях грамматика обычно хорошо работает. Если мы возьмем, к примеру, грамматику русского языка и сопоставим ее с польской грамматикой, этого будет достаточно для того, чтобы показать их генетическое родство. А как насчет русского и английского языка, которые, безусловно, родственны, но общих грамматических морфем по памяти я могу восстановить буквально 2-3, а это, как вы понимаете, может быть плодом случайного совпадения? Если бы мы не знали истории английского языка и истории русского языка, никакая грамматика не помогла бы. Или, например, как быть с языками, в которых грамматики, морфологии, систем склонения, спряжения нет вообще, так называемыми изолирующими языками, которые очень широко распространены в Юго-Восточной Азии, - тот же китайский или вьетнамски?. Там грамматика вообще не может служить критерием.

Как меняются языки

Что касается лексики как возможного показателя языкового родства, у нее есть одно очень важное свойство, которое, по-видимому, и должно служить решающим аргументом. Изо всех языковых уровней - фонетика, грамматика, лексика, синтаксис и так далее – лексика - это единственный слой языка, который в нем изменяется примерно (не буду говорить - всегда и железно, но примерно) с одинаковой скоростью – это принцип, который был эксплицитно сформулирован еще в 50-е годы американским лингвистом Моррисом Сводешем, хотя идея носилась в воздухе задолго до его публикации.

Идея очень многих раздражает - потому что как же так? У нас перед глазами пример английского языка - он несколько столетий менял свою лексику, словарный состав, медленно, аккуратно, осторожно, а потом пришли норманны, завоевали Англию - и прямо тут же, буквально за сто лет огромное количество французских лексических элементов появилось в английском языке.

Это чистая правда, и таких ситуаций очень много, но важно учесть одну важную поправку. Когда мы говорим о постоянной скорости изменения лексики, речь идет о так называемых внутренних изменениях лексики, изменении словарного состава от поколения к поколению без существенного влияния со стороны внешних соседей. Внутреннее изменение - это когда слова внутри языка изменяют свое значение, не когда они не выкидываются или проникают в язык в результате заимствований, а когда было в русском языке слово живот в значении жизнь, а потом оно стало значить часть тела – это внутреннее изменение, и речь идет о скорости внутренних изменений, а совершенно не о внешних. Внешние изменения могут иметь любую скорость. Один язык столкнулся с другим - и взял у него в один день тысячу слов (фигурально).

Те изменения, которые происходят не в результате контактов, происходят примерно с одинаковой скоростью, и, подсчитав проценты лексических совпадений между родственными языками, там, где дело касается только внутренних изменений, мы можем по некоторой формуле высчитать даже примерную дату их происхождения – это так называемый глоттохронологический метод, который как раз и придумал Сводеш по аналогии с радиоуглеродным методом датирования, и называется это глоттохронология или лексикостатистика.

Сравнение ядра

Лексикостатистикой нужно пользоваться очень аккуратно, тут можно легко наделать ошибок. Лексический фонд любого языка огромен; если оперировать с ним без строгих правил, то можно дооперироваться до любых желаемых результатов, поэтому правила следующие: во-первых, слова нужно выбирать базисные. Базисная лексика – это лексика, максимально независимая от культурной или ареальной характеристики говорящих, в первую очередь - это так называемый список Сводеша. Изначально он состоял из двухсот элементов, потом сокращен до сотни, можно его сокращать и дальше.

Сейчас мы оперируем сверхустойчивой половиной из пятидесяти элементов. Это универсальный список, понятия обнаруживаются практически во всех языках мира, и он очень показателен.

Если мы между двумя языками видим много сходств в лексике, но при этом не видим сходств в стословном списке, то это почти однозначно указывает на то, что мы видим между ними горизонтальную контактную связь. Если мы сравним английскую и французскую лексику, то в стословном списке, притом какое огромное количество галлицизмов в английском языке, в стословном списке их два – это слова гора (mountain) и круглый (round); все остальное – свое, не французское. Похожая ситуация с японским и китайским, с персидским и арабским, с дравидийскими языками и санскритом. Во всех ситуациях, где высокоразвитый в крупном плане культурный язык оказывает сильное давление на своих соседей, они все равно перенимают у него в первую очередь культурную, а не базисную лексику, и чтобы обосновать родство между языками А и Б, необходимо найти между ними хотя бы минимальное число параллелей в списке Сводеша, которое бы превышало порог случайности. Цифра варьируется в зависимости от конкретного устройства языка. Условно говоря, хотя бы 10% должно быть обязательно для очень глубокого родства, а для неглубокого родства любые два современные индоевропейских языка имеют порядка 25-30% совпадений в списке Сводеша.

Во-вторых, для сравнения очень важно, чтобы полностью совпадали значения сравниваемых языков. Например, при глоттохронологических подсчетах мы для русского языка бы берем слово глаз, не берем архаичное слово око, хотя именно око отражает старый индоевропейский корень, до сих пор присутствующий в английском слове - eye или во французском - oeil. В русском языке произошла замена, око вытеснялось словом глаз, по-видимому, диалектно-жаргонного происхождения. Этот критерий нам очень важен, потому что если мы будем допускать семантическую слабину, то это может плохо закончиться, будут очень размыты стандарты, и мы открываем двери для большого количества случайных совпадений.

В-третьих, что еще более важно, этот же список Сводеша, из каких бы элементов он ни состоял, может и должен быть ранжирован. Каждое слово обладает некоторым индексом стабильности по терминологии Сергея Анатольевича Старостина, который разрабатывал методику такой среднестатистической степени устойчивости, которую мы вычисляем на эмпирической основе. Если мы берем семью из 10 языков, то слово глаз будет в ней, скорее всего, очень устойчивым. Мы, может быть, найдем 1-2 разных корня, которые представляют значение слова глаз в этой семье, наоборот, если мы возьмем слово маленький или слово желтый, то для этих слов почти 100%, если не в каждом языке будет свой корень, то, по крайней мере, 5-6 разных корней точно будет представлено – эти слова гораздо чаще меняют свое значение, чем слово глаз.

На эмпирической основе список Сводеша можно хорошо разделить на сильно устойчивую половину и слабо устойчивую половину. Мы тестируем два языка на родство: в какой половине списка Сводеша у нас больше совпадений – в сильно устойчивой или слабо устойчивой? Должно быть обязательно в сильно устойчивой, а если в слабо устойчивой, это опять пахнет горизонтальными контактами, потому что странно, что между этими двумя языками заменились устойчивые слова и, наоборот, не заменились неустойчивые слова.

Реконструкции праязыков

И, наконец, самое важное требование, если мы хотим использовать лексику как критерий для построения общей мировой классификации, - чем выше по стволу дерева мы поднимаемся, тем важнее вместо стословных списков, составленных по современным языкам, использовать прасписки, реконструированные для их ближайших предков. Почему? Предположим, мы хотим обосновать родство двух больших языковых семей, например, индоевропейской семьи языков и уральской семьи языков. В индоевропейскую семью входит 300 языков, в уральскую входит 20-30 языков. Какова вероятность того, что мы для каждого элемента из списка Сводеша хотя бы в одном индоевропейском языке найдем красивую фонетическую-семантическую параллель хотя бы в одном уральском языке? Это можно вычислить математическими методами, а можно посмотреть на практике: навскидку взяты несколько слов, несколько элементов из списка Сводеша. Просто пройдясь по тому, как они звучат в разных индоевропейских языках, мы получаем, что для хотя бы одного языка можно найти очень похожую на индоевропейскую форму хотя бы в одном уральском языке.

Глаз в белуджском, иранском языке будет čamm, в мансийском языке будет sam; ухо будет на санскрите karna, а на финском языке будет korva; зуб будет на армянском - atam, на селькупском – timi и так далее. Доказывает ли это, что индоевропейские и уральские языки родственны? Нет, не доказывает. Для любых двух семей такого объема мы что-нибудь подобное обязательно обнаружим. А теперь заменим эти восемь сходств на восемь реконструкций, подставим вместо слов из современных языков реконструкции для прандоевропейского и прауральского языков, полученные традиционными, достаточно надежными компаративистскими средствами.

Реконструкции для праиндоевропейского и прауральского, как видите, там, где в уральском я заменил цвет на синий, там всякое фонетическое сходство благополучно исчезло, и это значит, что в первых пяти случаях сходство, которое было на предыдущей странице, было абсолютно случайным. Что касается сходств 6, 7 и 8 для корней слышать, вода и имя, оно не исчезло, реконструкции остались и на праиндоевропейском и прауральском уровне. Это сходство не исчезло, и, более того, здесь приведен не полный список, к ним добавилось еще некоторое количество сходств на прауровне, и, что интересно, при переходе от современного уровня к уровню праиндоевропейскому или уровню прауральскому число этих сходств значительно возросло. Если мы возьмем русский и финский языки, то между ними будет, может 3-4 случайных, похожих друг на друга корня, а между праиндоевропейским и прауральским в стословнике насчитывается от 15 до 20 элементов, которые не просто сходны друг с другом, а можно пытаться на их основе установить регулярные фонетические соответствия между языками. Главный принцип: если мы хотим уйти далеко в прошлое, мы не имеем права сопоставлять современные языки, мы должны применять так называемый ступенчатый принцип реконструкции, переходить от русского к славянскому, от славянского к индоевропейскому, от финского к прибалтофинскому, от прибалтофинского к прауральскому - и смотреть, что происходит с лексикой при переходе с одного уровня на другой.

Границы применения

Я уже завершаю, и два слова о границах применения методологии. Мы имеем лексические списки по любым современным языкам (индоевропейским, уральским, сино-тибетским, африканским, каким угодно). Вычленяя мелкие близкородственные группы, мы отсеиваем, так сказать, шелуху, лексические инновации и превращаем стословные списки современных языков в прасловники, опираясь на аппарат сравнительно исторического языкознания. Потом мы сравниваем между собой эти прасловники и переходим все глубже и глубже от русского к праславянскому, от праславянского - к праиндоевропейскому, от праиндоевропейского - к ностратическому и так далее.

Вопрос: как далеко мы можем идти, можем ли мы на основе анализа базисной лексики построить общемировое древо языков – или, наоборот, показать на основе анализа базисной лексики, что все макросемьи мира все-таки невозможно свести к единому праязыку? Ответ на этот вопрос я не дам в первую очередь потому, что не закончен этап обработки первичного материала, а во вторую - по теоретически пока не решенной проблеме утраты информации. Стандартная претензия, которую скептики предъявляют к макрокомпаративистике такова: вы говорите, что 12-14 тысяч лет тому назад существовала ностратическая макросемья. Как же можно это доказать, если за этот период все ее потомки изменились настолько, что сегодняшнее сходство между ними уже неотличимо от случайных? Тот же самый список Сводеша за 12-14 тысяч лет изменяется в среднем на 90-95%. Во многом мы эту проблему снимаем, опираясь на вышеупомянутый ступенчатый принцип реконструкции. Разные языки утрачивают разные элементы праязыка, и реконструкция тем и ценна, что она собирает воедино раскиданные по разным уголкам кусочки этого пазла. Если у современных языков 5-6% совпадений, мы проделываем реконструкции и видим, что в каких-то случаях количество совпадений возрастает между реконструкциями до 12-14-15%. Это верный показатель того, что макросемья, которую мы восстанавливаем, действительно реальна, но, тем не менее, даже этот ступенчатый признак тоже нельзя считать универсальной панацеей.

Ностратическое и сино-кавказское деревья по данным 50-словных списков (проект «Эволюция языка»)

То, что здесь нарисовано, – это дерево, которое построено методом анализа списка Сводеша, точнее, пятидесятисловника, самой стабильной части Сводеша для двух больших макросемей: сверху это дене-кавказские языки, в которые входят северокавказские, синотебетские, енисейские, на-дене языки, и снизу большая ностратическая макросемья Илич-Свитыча. Внутри этих семей лексикостатистика, глоттохронология показывают, что связи очень прочные. Обе они расходятся на части примерно 12 тысяч лет тому назад, дата вполне приемлемая, а дальше, если мы пытаемся свести их вместе, то дерево там, где стоят вопросительные знаки, объединяет их на хронологической глубине примерно 24 тысячи лет. В терминах лексических совпадений это эквивалентно диапазону совпадений от 0% между языками, то есть вообще отсутствие совпадений. До 3-5% - это число, не отличимое от случайных совпадений.

Означает ли это, что мы показали, что эти две макросемьи не имеют общего предка? Неизвестно. В худшем случае - может быть, да, означает, что они не имеют общего предка; в лучшем случае это может означать, что жесткие стандарты лексикостатистики для такого глубокого уровня не срабатывают, и методы нужно делать более гибкими - может быть, тогда все будет показано лучше. Например, пожертвовать принципом семантической тождественности – это жесткие подсчеты по отношению к значениям. Для слова, которое в праностратическом реконструируется со значением огонь, мы смотрим слово со значением огонь в прадене-кавказком, и только со значением огонь. Может быть, имеет смысл делать систему более гибкой и позволять некоторые симпатические расхождения, например, слово со значением огонь сравнивать со словами со значением солнце или жаркий, а слово со значением вода - со значениями река или мокрый. Это примеры очень частотных, естественных и хорошо засвидетельственных во многих языках мира семантических переходов, это не полет фантазии - как солнце, дым и птица, таких переходов на самом деле не бывает.

И, тем не менее, для того, чтобы эту гибкую методику применять, все равно должны быть разработаны довольно четкие объективные правила, не зависящие от личной воли, фантазии исследователя, которые, к сожалению, пока не разработаны, но которые мы в нашем проекте «Эволюция языка» пытаемся сегодня разработать. И вся кухня, которую я сегодня показал, довольно успешно работает на глубинах хронологических примеров 10-12 тысяч лет, а для того, чтобы она работала дальше, и для того, чтобы мы могли точно создать единое древо для всех языков – или, наоборот, показать, что его невозможно создать, - должно быть усовершенствование методики, которое, я надеюсь, в ближайшее десятилетие появится. На этом я закончу. Спасибо.

Обсуждение лекции

Борис Долгин: Не получается ли у нас некоторого замкнутого логического круга со списками - хоть со стословником, хоть с пятидесятисловником. На основании информации о языковом родстве мы выделяем наиболее стабильны элементы, а потом на основании представления того, что эти элементы наиболее стабильны, мы еще раз проверяем информацию о языковом родстве. Соответственно, вычленив – неважно, из стословника, пятидесятисловника - как бы более стабильный корпус, исходя из нашего представления о том, как менялись языки. Мы теперь уже на основании этого видим…

Георгий Старостин (фото Наташи Четвериковой)
Георгий Старостин (фото Наташи Четвериковой)

Георгий Старостин: это хороший часто звучащий вопрос, но на самом деле он разрешается в ходе практической работы, потому что на начальном этапе, когда мы устанавливаем родство между близкими языками, нам вообще не обязательно оперировать терминами стабильности-нестабильности. Во-первых, есть разные другие способы: та же самая грамматика, про которую я говорил, хорошо показывает родство на близких расстояниях, во-вторых, даже не ранжируя тот же самый список Сводеша, не предъявляя к нему никаких специальных требований, мы все равно можем показать это родство, а дальше мы применяем бутстреппинг — рекурсивный принцип — не запутывая себя дополнительными стандартами, жесткими ограничениями устанавливаем родство первого уровня, дальше анализируем все эмпирические случаи: как ведут себя слова в родственных языках на первом уровне, и потом эти правила применяем к более сложным случаям родства.

Борис Долгин: Расскажите, пожалуйста, о попытках работы с генетикой и археологией

Георгий Старостин: У меня заранее подготовлены ответы на оба эти вопроса. Он общий, потому что был задан такой вопрос еще в он-лайне. Поэтому я быстро постараюсь на него ответить. Существует тонна специальной литературы, которая посвящена попыткам соотнесения результатов лингвистической компаративистики с данными археологии и генетики. По одной индоевропейской семье жизни не хватит, чтобы перечислить всю литературу, написанную на эти темы. К сожалению, она далеко не вся написана на надлежащем уровне - и в первую очередь по тому прискорбному обстоятельству, что в мире практически нет людей, которые были бы одинаково квалифицированны в области археологии и лингвистики или генетики и лингвистики. Я, например, плохо квалифицирован как археолог или как генетик - и наоборот, когда я читаю работы археологов и генетиков, то почти всегда, когда они начинают оперировать лингвистическими понятиями, хочется схватиться за голову. Можно дать подробный ответ, как мы пытаемся скоррелировать эти данные, но это курс лекций на 1-2 семестра. Краткий ответ тот, что все это находится в зачаточном состоянии, потому что пока нет жестких и общепринятых критериев отождествления лингвистических данных с археологическими и генетическими, причем ситуация еще усугубляется тем, что данные всех трех областей наук все время изменяются и дополняются. Мы можем сегодня построить какую-то разумную соотносительную модель, положить на нее уйму времени, а потом обнаружится новый археологический слой, или генетики еще добавят пару признаков, по которым они классифицируют народы, - и вся модель окажется перечеркнутой. Я, в принципе, настроен очень оптимистически, и рано или поздно все три типа сведений будут хорошо соотнесены, но не пришло еще то время, когда мы могли бы заниматься этим всерьез: еще и лингвистам, и археологам и генетикам довольно много нужно работать.

Голос из зала: А на чем тогда основан оптимизм?

Георгий Старостин: Оптимизм основан на том, что информации все время становится все больше, и в какой-то момент, по-видимому, наступит критическое насыщение.

Для индоевропейского есть классическая гипотеза об отождествлении курганной культуры, например, археологической с прародиной индоевропейской семьи. Это красивая и вполне правдоподобная гипотеза, которая, по-видимому, на сегодня имеет основную поддержку, но при этом различного рода противоречащие мнения все равно раздаются время от времени, и единого жесткого стандарта, который бы раз и навсегда положил конец всем сомнениям относительно такого отожествления, пока нет. Возможно, будет.

Кузнецов Анатолий Иванович: Я по найму разрабатываю гуманитарные системы: спасибо. Очень интересно. Вопрос следующий: вы сказали про объективность, и вот это место меня царапнуло, то есть это классическая постановка вопроса, когда мы говорим, что удаление субъективности является показателем объективной данности, но ведь существует и классическая постановка, планка которой имеет эффект наблюдателя, и послеклассическая. И здесь у меня возник вопрос. Если мы не учитываем субъективность классификации и перенесем структуры, связанные с субъектом, прямо на классификацию. То есть ли мы рассматриваем людей, язык птиц, еще языки тогда, наверное, этот вопрос бы эксперировался.

Георгий Старостин: Я могу сказать буквально пару слов. Такое гигантское количество работ написано, которые не просто принимают субъективный фактор во внимание, а целиком диктуются субъективным фактором, что было бы интересно как минимум посвятить меньшее, но, на мой взгляд, лучшее количество работ попыткам объективного взгляда на историю языка. Что касается всего остального, то даже и не знаю, что ответить, честно говоря.

Борис Долгин: Собственно, вполне в изложении присутствовал анализ субъективности в том смысле, что было указано на большую изученность индоевропейской семьи по понятным вполне историческим причинам.

Георгий Старостин: Да, конечно.

Михаил Гельфанд: У меня вопрос к первому и последнему дереву. Вы рассказывали, что ирландский язык попал между кетским и бурушаски, а потом сказали, что несовершенство типологических деревьев связано с заимствованиями. Неужели слова ирландского языка были заимствованы из кетского и бурушаски?

Георгий Старостин: Нет. Это дерево строилось не на основании лексических заимствований, а на основании типологических признаков, и там, по-видимому, все дело было в случайных совпадениях по типологическим признакам.

Гельфанд: А вот к этому дереву базовой предпосылкой была предпосылка устойчивой скорости вымывания базисной лексики?

Георгий Старостин: Да.

Гельфанд: При этом длины веток на этом дереве очень разные - это означает, что вымывание происходит в разных языках с разной скоростью, или я не понял, что нарисовано.

Георгий Старостин: Нет, просто крайними узлами в этих ветках сами по себе являются реконструированные праязыки.

Гельфанд: Это внутренние узлы.

Георгий Старостин: Да. И они сами по себе имеют различную датировку.

Гельфанд: Понял. Спасибо. И еще вопрос: в этой стойке деревья фактически на алгоритме пятидесяти символов?

Георгий Старостин: Да

Гельфанд: Насколько они устойчивы - во-первых, по набору символов, во-вторых, по набору языков? Не происходит ли куча коротких веток в середине, очень неустойчивая относительно исходных условий, скажем, взять не пятидесятисловный список, а пятидесятипятисловный - и получится беда?..

Борис Долгин: То есть, проверяли ли вы, иными словами…

Гельфанд: Но собственно в нормальном статистическом смысле?

Георгий Старостин: Вопрос понятен. Они имеют разную степень устойчивости. Некоторые из коротких веток действительно меняют свою позицию друг относительно друга при увеличении списка, и при публикации таких деревьев всегда имеет смысл указывать, какие из веток не меняются никогда, а какие менее стабильны, и нужно вводить некоторые факторы погрешности.

Гельфанд: Я прошу прощения - и для протокола один вопрос о поправках. Вы говорили, что в биологии редко бывают горизонтальные переносы, а они бывают сплошь и рядом.

Георгий Старостин: Хорошо. Спасибо.

Владимир, программист: Когда шли лекции Сергея Анатольевича, он был в Школе Злословия, очень интересное интервью. Он более определенно говорил о том, что вероятный смыл его работы в том, чтобы все-таки свести к одному праязыку, как говорит он. Вы об этих вопросах высказываетесь более осторожно. Как вы считаете, давно произошло первое ветвление, если действительно все произошло от одного языка? Или сейчас считается, что праязык рассыпался во время бедствий 2 миллиона лет назад?

Георгий Старостин: Если бы возраст человеческого языка был 2 миллиона лет, что крайне маловероятно, мы бы в любом случае не свели, не было бы никакой возможности средствами сравнительно-исторического языкознания восстановить тот язык, который существовал 2 миллиона лет тому назад. Мы скромно надеемся, что, может быть, удастся восстановить язык 30-50 тысячелетней давности, но надо сказать, что Сергей Анатольевич, несмотря на то, что он много говорил о праязыке человечества и рассуждал на эту тему, всегда очень четко определял некоторый агностицизм по этому поводу, то есть он не говорил никогда, что мы доказали существование праязыка человечества, что все люди, несомненно, говорили на одном языке и так далее. Во многом это до сих пор остается вопросом веры. Если вы спросите меня, верю ли я в существование единого праязыка, языка Адама и Евы, скажу - да, наверное, верю, но это не имеет никакого отношения к тому, о чем я сегодня рассказывал.

Владимир, научный сотрудник в области химии: К последнему вопросу. У вас звучало некое сомнение в существовании праязыка, хотя известно, что генетически дивергенция человечества началась примерно 200 тысяч лет назад. Были генетические Адам и Ева, поэтому трудно предположить, что такая вещь, как язык, была изобретена несколько раз независимо.

Борис Долгин: Точнее - в данный момент господствующей является эта гипотеза. Почему трудно предположить?

Владимир, научный сотрудник в области химии: Потому что, как показывают археологические исследования, 200 тысяч лет назад культура была такая, что без языкового обмена, без языковой коммуникации это не могло существовать.

Борис Долгин: Какое это отношение имеет к вопросу о возможности изобретения несколько раз?

Владимир, научный сотрудник в области химии: Языка, потому что есть такая вещь, которая уже существует, так же как с зарождением жизни, по всей видимости.

Борис Долгин: Физические законы, конечно, никогда не открываются в разных местах. Спасибо.

Владимир, научный сотрудник в области химии: Если язык существует один раз, он не может быть забыт. Вопрос в связи с этим такой: когда могла начаться дивергенция человеческих языков? Можно ли, хотя бы грубо, на основании археологических данных, на основании данных о расселении человечества по континентам, ответить? Понятно, что пралюди жили в районе Южной, Юго-Восточной Африки, когда могла начаться дивергенция языков. Спасибо.

Борис Долгин: Я даже дополню вопрос. Какова, на ваш взгляд, мощность сравнительно-исторического языкознания?

Георгий Старостин: Вопрос понятен, хотя это два разных вопроса.

Борис Долгин: Да, это два разных вопроса, но они связаны.

Георгий Старостин: Что касается того, когда могла начаться дивергенция языка. В тот момент, когда Homo sapiens стал расселяться по планете, в этот момент и могла начаться дивергенция языка. К какому времени мы относим этот момент? Миграции из Африки начинаются 60 тысяч лет назад, хотя язык мог начать дивергировать и раньше, и в самой Африке. Что касается мощности, глубины сравнительно-исторического метода, то мы зависим в первую очередь от тех языков, которые мы видим сегодня, – сколько потомков сегодня мы видим, такова и наша мощность. Если, например, историческая ситуация была такова, что от первоначального языка человечества откололись несколько ветвей, и ушли Бог знает куда, и там замерзли во время последнего ледникового периода, например, то это уже автоматически значит, что первоначальный язык человечества мы не реконструируем никогда. У нас, в общем и целом, хотя уже перехожу скорее к интуитивным соображениям, есть несколько языковых зон: одна - очень большая, в которую входят практически все языки Евразии, подавляющее большинство языков Африки и все языки Америки; другая зона, имеющая с этой гораздо меньшее количество сходств, – это тихоокеанская зона Папуа Новая Гвинея и Австралия; и третья зона, еще менее похожая на две предыдущие, - это Южная Африка. Бушмены и готтентоты, так называемые койсанские языки, которые типологически безумно сильно отличаются от всех остальных в первую очередь наличием в них специальных типов так называемых щелкающих звуков, но также и по своей лексике абсолютно ни на кого не похожие. Можно в качестве рабочей модели принять некое членение всех языков человечества на эти три группы: одна, условно говоря, папуасско-австралийская, другая – южноафриканская, бушмено-готтентотская и третья – все остальные. Таким образом, бушмено-готтентотские языки - это языки, которые родились в Африке и из Африки никуда не уходили никогда, там остались жить и сегодня доживают свои последние дни, будучи нещадно истребляемы другими, более продвинутыми в культурном отношении языками и народностями. Вторая – это условно первая волна миграции из Африки, которая дошла до Папуасии и Австралии, и третья – все остальное – это более новая волна миграций, условно 30 тысяч лет до нашей эры, которая заселила не только все оставшиеся незаселенные куски планеты, но и, по-видимому, вычистила как следует огромный пласт предыдущего языкового наследия. Это некоторая рабочая схема, которая основана на интуиции, опыте работы с разными языками, но не поддержана пока еще строгими научными выводами.

Григорий Чудновский: Что такое язык, я не до конца понял. Какими признаками он наделен? Я поясню…

Борис Долгин: В смысле - с каким рабочим понятием языка работал наш докладчик?

Григорий Чудновский: Я хочу уловить. То, что я скажу, является ли тем, что вы имели в виду? А потом расскажете, с чем вы работали. Я живу в мире, в России, где сосуществуют три языка: бытовой - бытийный, литературный - художественно-поэтический, церковнославянский, допустим. Три языка существуют; какой язык называется в России языком с вашей точки зрения как исследователя - это первый вопрос, проясняющий мое простое понимание, а второй – когда появился исторический язык во времени, чтобы его можно было считать языком от простых звуков при мировом переселении, при определенной миграции и до такого уровня культуры? Хотя бы примерно во времени, что вы, возможно, знаете. Спасибо.

Георгий Старостин (фото Наташи Четвериковой)
Георгий Старостин (фото Наташи Четвериковой)

Георгий Старостин: Если бы я это знал… На первый вопрос мне проще ответить, чем на второй. Конечно, все три перечисленные вами формы есть три разные формы языкового существования и церковнославянский язык – это тоже язык, поскольку это средство коммуникативного общения, хотя оно имеет ограниченную сферу потребления. От этого он не перестает быть языком, но когда речь идет об историческом аспекте языка, то лингвиста в первую очередь всегда интересует бытовой аспект употребления языка. Далеко не всегда мы имеем возможность работать именно с бытовым аспектом. Если, например, речь идет о древнем языке, от которого остались только литературные тексты, скажем, религиозного содержания, то мы вынуждены работать с некоторым стилистическим регистром этого языка. Мы не знаем, как древние египтяне разговаривали в быту, например, мы знаем о египетском языке только по текстам пирамид, разным литературным памятникам, деловой переписке (это еще один стилистический регистр) и так далее. Но в общем и в целом за долгие годы своего существования лингвистика научилась более или менее разрешать эти проблемы, делать поправки на литературность, на некоторую степень искусственности того или иного языка по сравнению с бытовым, разговорным регистром. Интересно, что когда мы говорим о тех же самых стословниках, литературность очень часто является искажающим фактором в наших подсчетах, потому что в литературных языках, скажем, в новых европейских литературных языках, создававшихся на базе определенных разговорных диалектах в период с Возрождения вплоть до настоящего времени, они иногда получаются немного гибридизированными искусственными языками. И в одном стословнике, например, может быть одно слово из одного диалекта этого языка, а другое слово - из другого диалекта этого языка. К сожалению, это искажает точность полученных результатов, но эта проблема не очень существенна. Эти искажения, как правило, не носят губительного характера, а в подавляющем большинстве случаев, там, где идет речь не о языках, история которых нам известна, а о языках мелких народностей, у которых литературных традиций вообще не существовало, этой проблемы вообще не возникает. Да, мы все эти формы называем языковыми, но делаем поправки на литературность и стараемся по возможности оперировать тем языком, который человек использует в быту. Что касается второго вопроса - про время возникновения языка как языка, отличного от животной системы коммуникации…

Борис Долгин: Отсюда, видимо есть переход к вопросу о том, что вообще считать языком.

Георгий Старостин: Да, конечно, но определенного ответа на этот вопрос у меня нет. До недавнего времени, например, считалось, что у неандертальцев точно не могло еще существовать языка, потому что речевой аппарат был неправильно устроен. Сейчас так не считают, сейчас считают, что его ротовой аппарат позволял разговаривать, поэтому это серьезный сложный философский вопрос, на который у разных людей есть разные ответы. Я не хочу здесь высказывать свое мнение по этому поводу.

Илья Николаевич: Как определяются сами праязыки, то есть произношение этих языков? Вы говорили, что можно их сравнивать каким-то образом, произношение одних и тех же каких-то пятидесяти слов. И более подробно я хотел бы узнать, как определяется произношение, допустим, в китайском языке 2000 лет назад. Китайский язык: мы знаем иероглифы, а как они произносились, неизвестно. Как определяется произношение в праязыках, у которых не было письменности?

Георгий Старостин: Спасибо. Вопросы вполне толковые. Произношение. В первую очередь мы при реконструкции оперируем до некоторой степени условными сущностями; то, что мы реконструируем, – это не звуки праязыка, а фонемы праязыка, то есть некоторые условности, которые функционировали в качестве смыслоразличительных единиц в этом языке. Все фонемы – это не специфический признак праязыка, все языки состоят из фонем. В русском языке выделяются фонемы как некоторые абстрактные психологические единицы. Один и тот же звук, например, К мы можем произносить как К, как КХ, можем как КЪ, от этого слово не изменится – это будут три разных звука, а фонема будет оставаться одной и той же в рамках русского языка, а в рамках других языков может измениться. При реконструкции праязыка мы реконструируем в первую очередь фонемы, мы не претендуем на то, что под звездочкой те формы, которые мы ставим, ровно так и произносились, как мы их записывали. Если мы записываем букву *k под звездочкой, может быть, она произносилась К, может быть, - КЬ, может быть, КХ, может быть, еще как-то, мог быть широкий диапазон конкретных произношений. С другой стороны, существует такая область науки, как типология фонетических изменений, которая занимается изменением конкретного произношения от языка к языку и устанавливает, какие звуковые переходы типичны и естественны для языков, а какие, наоборот, - редкие или вообще невозможны. Грубо говоря, если в одном языке мы видим звук К, а в другом языке ему соответствует звук Ч, то в подавляющем большинстве случаев это означает, что здесь имела место так называемая палатализация, смягчение К и постепенное развитие звука Ч на его месте, и поэтому, если у нас в одном языке К, а в другом Ч, то под звездочку мы, конечно, поставим К потому что переход К в Ч типологически известен и даже в каких-то отдельных живых языках его можно наблюдать едва ли не воочию, а, наоборот, переход Ч в К практически неизвестен, очень маловероятен. Всегда есть некоторая степень риска, но в таких случаях она будет незначительна.

Что касается более конкретного вопроса про китайский язык, это целая большая область, подобласть китайского языкознания – восстановление китайского произношения двух- и более тысячелетней давности, которая опирается на целый ряд источников. Помимо иероглифики, у нас есть большое количество исторических данных по китайскому языку, существуют фонетические описания того, как произносились китайские звуки полторы тысячи лет назад, во-первых. Есть так называемые фонетические словари и фонетические таблицы, существуют методы статистического анализа данных древнекитайской поэзии, которая дает очень много средств к такой реконструкции, да и, кстати говоря, сама иероглифика во многом устроена по фонетическому принципу, ее очень тщательный анализ дает возможность реконструировать это произношение. Есть специальная литература по этому поводу...

Борис Долгин: Наверное, остатки в каких-то контактировавших языках.

Георгий Старостин: Остатки в контактировавших языках, транскрипции иноязычных слов в собственно китайских памятниках, диалектные данные в современных китайских диалектах, которые очень сильно различаются по произношению, кстати говоря, они условно называются китайские диалекты, на самом деле это большое количество разных взаимонепонятных языков при устном общении, только иероглифическая письменность их объединяет. Это большая тема.

Борис Долгин: Вполне научно изучаемая.

Голос из зала: Скажите, были ли случаи в изучении языков, когда обнаруживался язык, который нельзя было отнести ни к какой семье? Я эти вещи читал, но подозреваю, что они должны быть утки.

Георгий Старостин: Нет, это не утки. Есть так называемые языки-изоляты, которые, если к какой-то семье относились когда-то, то очень давно от нее откололись, долгое время существовали сами по себе, варились в собственном соку, и сегодня их генетическую принадлежность установить либо очень сложно, либо почти невозможно. Таких примеров очень много в самых разных частях света. Для некоторых языков есть довольно хорошо подтверждаемая гипотеза их родства в рамках макросемей. Баскский язык в Испании, который часто считается изолятом, - существует хорошее свидетельство того, что он, по-видимому, все-таки входит в дене-кавказскую семью языков, дерево которой еще висит на экране. Бывают такие языки, генетическая принадлежность которых даже в рамках теории макросемей до сих пор совершенно неопределима. Шумерский, например: существует несколько конкурирующих гипотез о том, чему родствен шумерский, но ни одна из них не лучше другой, и, значит, все одинаково плохи. В Африке есть некоторое количество таких языков, да и в Америке довольно много. По-видимому, какие-то из них удастся разделить в ходе дальнейшей работы по отдельным ветвям общего древа, а какие-то, возможно, так навсегда и останутся изолятами.

Голос из зала: Скажите, почему некоторые народы активно заимствуют иностранные слова, а другие как-то очень плохо заимствуют иностранные слова? Я знаю, что французы очень берегут свой язык и практически не пускают в него иностранные слова.

Георгий Старостин: Это сильно преувеличено, они скорее распускают слухи о том, что не пускают в свой язык иностранные слова. На самом деле в современном французском языке очень много английских заимствований, в основном - в молодежных слоях, но они постепенно проникают во все слои употребления. С другой стороны, пропорции, в которых слова заимствуются из одного языка в другой, разные для разных народов. Совершенно естественная ситуация - что народ, говорящий на некотором языке и стоящий на одной ступени технологического развития, оказывается рядом с менее развитым народом, и понятно, кто у кого будет заимствовать слова в первую очередь, хотя не все так просто, бывают случаи, когда и продвинутые народы активно заимствуют слова у своих менее развитых соседей, но общая ситуация такова, что культурную лексику, если земледельцы и скотоводы селятся рядом с охотниками и собирателями, то охотники и собиратели будут таскать у них земледельческую и скотоводческую терминологию, особенно в том случае, если они сами потихонечку переходят на оседлый образ жизни и сами начинают заниматься земледелием и так далее. В каких-то случаях это имеет и культурные оттенки, чувство национальной идентичности, эмоциональной гордости и так далее, но это, как правило, очень поздние вещи. Народ, который сознательно блюдет языковую чистоту, не пускает никого, потому что это наш великий и родной язык, - это продукт по большому счету Нового времени. То, что такие ситуации могли возникать и раньше, у нас нет никаких оснований утверждать.

Ирина Леонтьева: у меня очень короткий вопрос: вы не могли бы сказать, все-таки в латинском языке буква С как читается - как Ц или как К? Кесарь или Цесарь? В классической латыни?

Георгий Старостин: В классической латыни всегда читается как К, а то, что с ней потом произошло, - это так называемые позиционные изменения, когда в каких-то позициях перед определенными гласными переходила в другие звуки. Как раз к вопросу о типологии фонетических изменений.

Александр Карпов, Высшая школа Экономики: У меня вопрос по проекту эволюции языка. Экономисты Голд и Миттис обрабатывают свои эволюционные модели, как на разных стадиях человечества возникали социальные институты, разные формы собственности, и они строят агентные компьютерные модели. Проводили ли вы нечто подобное?

Георгий Старостин: Агентные модели мы пока еще не задействовали в данном проекте. Это было бы очень интересно, но это не наша тема, это скорее смежная тема, потому что мы оперируем эмпирическими данными - идем от конкретных языковых данных, а это предполагает, наоборот, обратный подход построения некоторой симуляции, которая сама в конечном итоге порождает эти определенные данные. Надеюсь, что со временем это тоже добавится к нашим целям, потому что польза от таких моделей и в этом разделе лингвистики тоже довольно очевидна.

Евгений: Вопрос простой. Эсперанто является объектом вашей классификации?

Георгий Старостин: Эсперанто может являться таким же объектом классификации, как эльфийский язык или клингонский язык, как любые искусственные языки, хотя эсперанто от них отличается в несколько выгодную сторону в том плане, что лексика и грамматика эсперанто основаны на реальных фактах естественных языков. В общем, было бы некорректно включать эсперанто в общую классификацию, потому что он не представляет собой результат естественной языковой эволюции, хотя посчитать стословный список эсперанто, наверное, было бы интересно. Посмотреть, по крайней мере: мы могли бы определить, какой там из известных компонентов преобладал, кто был более задействован – романисты, или германисты, или кто-нибудь еще в его создании.

Голос из зала: Добрый день. У меня два вопроса. Первый: от чего зависит наличие в языке большого количества диалектов, как, например, в арабском или китайском, где существует масса диалектов и в то же время есть очень однородные языки, как русский, где диалектов нет?

Георгий Старостин: Это сильное утверждение, а как же русская диалектология?

Голос из зала: И второй вопрос, когда представители одной генетической группы языков сильно удалены географически, например, Тибет и Северный Кавказ – это всегда объясняется миграциями, или есть какие-то другие причины?

Георгий Старостин: Я со второго вопроса начну. Если не миграции, то что? Либо инопланетные телепортации, либо миграции. Тут возможны только два сценария: либо миграция из пункта А в пункт Б, либо языки были распространены на непрерывной территории, и, наоборот, между языками в ходе миграции вклинился кто-то третий. Бывают и те, и другие ситуации. Что касается вопроса про диалекты, все зависит от конкретных исторических обстоятельств. Понятно, что диалектные различия возникают в ходе миграций. У людей, которые много поколений подряд живут в одной и той же деревне, никаких серьезных диалектных различий не возникнет, хотя и язык изменится сам по себе, но бывают очень разные исторические обстоятельства. С русским и арабским первое, что приходит в голову: почему арабские диалекты сильнее отличаются друг от друга, чем русские друг от друга? Опять-таки, на арабский язык в ходе исламизации и арабизации большого географического пространства переходили огромные массы местного населения, и во многом эти различия как раз сформировались именно из-за того, о чем я говорил раньше в ходе лекции. Местное население переходило на чужой язык - и переносило свои произносительные, иногда лексические особенности на выученный язык. С русским языком несколько сложнее, на русском языке как говорили, так и говорят русские люди, которые расселялись по территории России, массовых переходов не русскоязычного населения на русский язык в качестве первого, родного языка в последнее время не было.

Борис Долгин: Конечно, были. Практически все этнически нерусское население России говорит на русском языке.

Георгий Старостин: Далеко не всегда в качестве родного языка, это выученный язык и у них.

Дмитрий Крылов: Я занимаюсь лингвистикой из любопытства. Здесь было множество вопросов, и часть выступления была посвящена прошлому языков, но занимаясь «Эволюцией языка», само название проекта, не задумывались ли вы совершить какой-то экскурс и в будущее языков и какую-то проекцию составить на будущее состояние, сделать возможный прогноз? Насколько это возможно, вопрос ли это веры или научный проект, научной новой методологии, и, иными словами, согласны ли вы с теорией, по которой все пришло от единого, сложного, и, возможно, снова придет к единому, ведь этому есть подтверждение современности? Если мы возьмем вопрос унификации языков, вопрос исчезновения множества языков и диалектов, английский как международный язык, эсперанто, в общем-то, тенденции очевидны.

Георгий Старостин: Спасибо. Прогнозы делать очень тяжело в этом отношении, и в первую очередь - потому что мы сегодня живем в мире, который очень сильно отличается от того мира, который существовал еще 200-300 лет тому назад, не говоря уже о гораздо большей древности. Таких тенденций глобализации, которые сегодня появляются, никогда раньше не существовало, хотя были какие-то до некоторой степени похожие модели. Сегодня, в общем и целом, прослеживается тенденция, в первую очередь, к вымиранию огромного количества языков. Из тех 6909 языков «Этнолога», которые я упоминал в начале, по разным прогнозам: кто-то говорит, что за следующие 10 лет вымрет 1000 языков, кто-то говорит, что за следующие 20 лет вымрут 3000 языков, но общая тенденция в общем и целом видна, население мелких населенных пунктов с большим удовольствием переходит на язык своего большого могучего соседа, кем бы он ни был, китайским, английским, хинди, кем угодно, но что все мы придем в результате этого в какой-то момент к полному единству, что все языки опять сольются в некоторый единый язык, будь то английский или какой-нибудь еще, в этом серьезнейшее сомнение, потому что, на самом деле, слишком велика тяга к дивергенции, и слишком огромен мир для того, чтобы все могло так плачевно закончиться. Даже если все унифицируется или половина людей земного шара будет говорить по-английски, то этот английский язык сам по себе в конечном итоге сам разделится на несколько языков, так как это происходило много раз в ходе истории человечества, когда огромная территория начинала говорить на одном языке, а потом, скажем, в ходе индоевропейской экспансии 5-6 тысяч лет тому назад половина Евразии заговорила на индоевропейском языке - и чем это закончилось? Сегодня вместо одного индоевропейского языка существует триста. Примерно то же самое постигнет любой другой язык, которому удастся унифицировать, глобализовать человечество в сколь-либо обозримом будущем.

Борис Долгин: Но сегодня несколько иначе устроена коммуникация, и, во всяком случае, по территориальному принципу разделение может не возникнуть.

Георгий Старостин: Может и не возникнуть, а может и возникнуть, но какое-то разделение будет, даже тот же самый английский язык сегодня существует в довольно разных изводах, и многие носители английского языка с трудом понимают друг друга, когда они общаются на английском языке. Если общаешься с китайцем, который выучил английский язык, то у меня, например, возникают очень серьезные проблемы с его пониманием, а представьте себе если все китайцы перейдут на английский язык когда-нибудь, но они будут понимать себя примерно так же, как они сегодня понимают друг друга по-китайски, то есть никак, потому что житель Северного Китая не может в принципе понять жителя Южного Китая, говорящего на своем родном диалекте.

Борис Долгин: Спасибо большое!

Подпишитесь
— чтобы вовремя узнавать о новых публичных лекциях и других мероприятиях!

Редакция

Электронная почта: polit@polit.ru
VK.com Twitter Telegram YouTube Яндекс.Дзен Одноклассники
Свидетельство о регистрации средства массовой информации
Эл. № 77-8425 от 1 декабря 2003 года. Выдано министерством
Российской Федерации по делам печати, телерадиовещания и
средств массовой информации. Выходит с 21 февраля 1998 года.
При любом использовании материалов веб-сайта ссылка на Полит.ру обязательна.
При перепечатке в Интернете обязательна гиперссылка polit.ru.
Все права защищены и охраняются законом.
© Полит.ру, 1998–2024.