будущее есть!
  • После
  • Конспект
  • Документ недели
  • Бутовский полигон
  • Колонки
  • Pro Science
  • Все рубрики
    После Конспект Документ недели Бутовский полигон Колонки Pro Science Публичные лекции Медленное чтение Кино Афиша
После Конспект Документ недели Бутовский полигон Колонки Pro Science Публичные лекции Медленное чтение Кино Афиша

Конспекты Полит.ру

Смотреть все
Алексей Макаркин — о выборах 1996 года
Апрель 26, 2024
Николай Эппле — о речи Пашиняна по случаю годовщины геноцида армян
Апрель 26, 2024
«Демография упала» — о демографической политике в России
Апрель 26, 2024
Артем Соколов — о технологическом будущем в военных действиях
Апрель 26, 2024
Анатолий Несмиян — о технологическом будущем в военных действиях
Апрель 26, 2024

После

Смотреть все
«После» для майских
Май 7, 2024

Публичные лекции

Смотреть все
Всеволод Емелин в «Клубе»: мои первые книжки
Апрель 29, 2024
Вернуться к публикациям
Май 18, 2025
Наука
Тарасевич Григорий

Компьютер замахнулся на Вильяма нашего Шекспира

Скоро в киевском Центре театрального искусства им. Леся Курбаса состоится премьера пьесы Шекспира «Король Лир». Особенность этой постановки в том, что перевод пьесы был выполнен компьютером.

К этому событию можно отнестись по-разному. Для кого-то это не более, чем культурно-технологический перформанс. Помнится, кто-то из наших концептуальных художников развлекался, пропуская текст «Евгения Онегина» через машинный переводчик «туда-обратно».

Но если откинуть в сторону иронию и скепсис, то компьютерный вариант Шекспира, поставленный на вполне солидной сцене, это значимая веха в истории машинного перевода, который в этом году отмечает свой 50-летний юбилей.

Мечта о «магическом кристалле», который поможет людям общаться, независимо от их языка, существовала с незапамятных времен. Но воплощаться в реальность она начала только после Второй мировой войны, на волне развития кибернетики.

Еще 1629 году Рене Декарт предложил изобрести шифр, который обозначал бы одним и тем же номером одинаковые понятия в разных языках. Идею возложить работу переводчика на специальные механизмы впервые высказал в XIX веке знаменитый английский математик Чарльз Бэббидж. Он разработал проект цифровой аналитической машины. Идея Бэббиджа состояла в том, что память объемом в тысячу 50-разрядных чисел (по 50 зубчатых колес в каждом регистре) можно использовать для хранения словарей.

В 1933 году было выдано сразу два патента на переводящие устройства. Французский армянин Георг Артсани разработал схему прибора на бумажной ленте для перевода произвольного слова на другой язык. В России патент получил Петр Смирнов-Троянский. Но для воплощения всех машинно-переводческих идей нужно было некое устройство, быстро и точно обрабатывавшее информацию. И поэтому реальное развитие машинного перевода началось только с появлением компьютера.

Принято считать, что главным вдохновителем разработок в этой области стал Уоррен Уивер – математик, работавший одним из руководителей Рокфеллеровского научного фонда. В марте 1947 года он отправил письмо отцу-основателю кибернетики Норберту Винеру. Там была впервые сформулирована концепция машинного перевода. В своем письме к Винеру Уивер предлагал разработать промежуточный «универсальный» язык, который назвал «машинезийским». Обрабатывая предложение, написанное на одном языке, компьютер должен был найти в словаре аналог каждого из слов на другом языке, а затем расставить полученные слова в соответствии с правилами грамматики. «У меня перед глазами текст, написанный по-русски, но я собираюсь сделать вид, что на самом деле он написан по-английски и закодирован при помощи довольно странных знаков. Все что мне нужно, это взломать код, чтобы извлечь информацию, заключенную в тексте», – писал Уивер .

Норберт Винер свободно изъяснялся чуть ли не на десяти языках. Может быть, поэтому он не придал особого значения идеям своего коллеги. Куда больший энтузиазм предложения Уивера вызвали в военном ведомстве США. Неизвестно, поняли ли генералы и полковники все концепции математика. Но были произнесены ключевые слова: «взломать код», «вычислительная машина» и «русский язык». Очевидно, этого было достаточно для того, чтобы в проект начали вкладываться серьезные деньги.

В 1954 году с большой помпой в Нью-Йорке была представлена первая система машинного перевода, созданная специалистами IBM и Джорджтаунского университета. Программа была довольно скромной. Она имела словарь в 250 единиц и грамматических правил. Но она действительно перевела правильным английским языком 60 несложных русских предложений, состоящих только из слов, включенных в словарь. К этому моменту было уже понятно, что перевод – это не просто замена одних знаков другими. Некоторые русские слова уже имели по два английских значения. Например, в зависимости от конкретного следующего слова машина переводила русский предлог «к» английскими «to» или «for».

Демонстрация системы вызвала эйфорию у ученых и их спонсоров. Казалось, что создание систем качественного автоматического перевода вполне достижимо в пределах нескольких лет. Профессиональные переводчики всерьез подумывали о том, что пора осваивать более перспективные специальности, вроде массажиста или водителя такси.

Но ликование кибернетиков продолжалось недолго. Еще в 1959 году американский философ Йошуа Бар-Хиллел выступил с утверждением, что высококачественный полностью автоматический перевод не может быть достигнут в принципе.

В качестве примера Бар-Хиллел привел фразу: John was looking for his toy box. Finally he found it. The box was in the pen. («Джон искал свою коробку с игрушками. Наконец он ее нашел. Коробка была в манеже».) Pen в данном случае означает не «ручка» (инструмент для письма), а «детский манеж». Правильно перевести этот текст машине не под силу, поскольку она не понимает «внеязыковой реальности».

В 1966 году специальная комиссия, созданная Академией наук США, пришла к заключению, что перекладывать перевод с человека на компьютер нерентабельно. Бурный поток финансирования исследований сначала превратился в тощий ручеек, а потом и вовсе иссяк. Ученым приходилось искать средства в самых экзотических местах. Например, разработка систем машинного перевода в университете Brigham Young University финансировалась Мормонской церковью, заинтересованной в переводе Библии.

Затишье в развитии машинного перевода продолжалось недолго. К концу 80-х годов компьютер стал превращаться из огромного прибора для избранных в компактное устройство для всех. Увеличивалась производительность процессора, разрабатывались новые лингвистические алгоритмы, позволяющие переводить текст точнее. Были созданы различные методы формализации смысла – семантические сети, фреймы и т.д. Машину учили мыслить или, по крайней мере, убедительно изображать мышление.

С начала 90-х годов на рынок систем машинного перевода выходят отечественные разработчики. Наша страна в этой области никогда не отставала от Запада.

Кстати, двое наиболее ярких ученых, заложивших основу для машинного перевода, имели большие неприятности с властями своих стран. Ноам Хомский, создавший так называемые контекстно-свободные грамматики, очень жестко выступал против политики США и даже оказался в тюрьме за организацию антивоенных манифестаций. Его советский коллега Игорь Мельчук, разработавший лингвистическую модель «Смысл-Текст», имел неприятности с КГБ из-за своих связей с диссидентами и был вынужден эмигрировать из СССР.

У нас были отличные теоретики, правда, с практической реализацией дело обстояло хуже. Но рыночная экономика сделала свое дело. Кабинетные изыскания лингвистов превратились в товар. В июле 1990 года была представлена первая в России коммерческая система машинного перевода под названием PROMT (PROgrammer's Machine Translation). Уже в 1992 году компания «ПРОМТ» выиграла конкурс NASA на поставку систем машинного перевода. Вскоре появилась еще одна «рыночная» система – «СОКРАТ».

Современные системы машинного перевода, безусловно, далеки от совершенства. Полностью устранить комичные неполадки не получается даже сегодня. Например, если переводить американские газеты, чаще всего будет встречаться словосочетание «молодой кустарник». Причем употребляться они будут в самом неожиданном контексте. Машина пока что не научилась понимать, что Bush – это вовсе не поросль, а президент США Джордж Буш-младший.

Главное преимущество машинного перевода – это скорость. Для примера я пропустил через компьютерный переводчик 300 страниц произвольного текста. На его полную обработку ушло меньше пяти минут. Человеку бы понадобилась не одна неделя.

Вряд ли в ближайшем будущем возможности машинного перевода принципиально улучшатся. Вопрос о месте машинного перевода казался закрытым. Даже сами производители программных продуктов готовы были это признать.

«Компьютер не наделен образным мышлением, у него отсутствует ассоциативное мышление и аналитические способности. Иначе говоря, творение никогда не сможет превзойти своего творца. Поэтому машинный перевод был, есть и будет удобным и эффективным средством для решения двух задач: быстро понять смысл текста (в английском языке это называется словом gisting). Это фантастически удобно, когда важно понять, о чем идет речь в тексте. Это позволяет заказать гостиницу на западном сайте, прочесть новости на незнакомом языке, разобраться с инструкцией к бытовой технике и т. д.», – признает директор по маркетингу «ПРОМТ» Александр Андреев

Он также считает, что системы машинного перевода, могут быть использованы как инструмент для повышения производительности труда. Эти системы успешно используются не только рядовыми пользователями, не знающими иностранных языков, но и профессиональными переводчиками.

Долгое время был расхожим стереотип о том, что машинный перевод прежде всего предназначен для документации и деловой переписки, в которых нет сложных грамматических конструкций и двусмысленностей. Программа слишком формально подходит к делу, говорили они, сухо фиксируя то, что «видит», не заботясь об адекватной передаче фразеологических оборотов, игры слов или рифмы.

«Мы постоянно работаем над усовершенствованием нашей технологии, постоянно вносим улучшения в алгоритмы перевода. Однако никаких революционных сдвигов ждать не следует, &ndash сообщил «Полит.ру» Александр Андреев. – Образно говоря, ситуацию с качеством машинного перевода можно сравнить с математической функцией, которая на начальном этапе резко растет (с небольшими затратами можно достигнуть революционных изменений в качестве перевода, здесь любой, даже очень плохой перевод кажется большой победой над иностранным текстом), затем постепенно переходит в стадию насыщения: даже небольшие улучшения в качестве перевода требуют больших затрат времени и средств. Сейчас мы находимся как раз в стадии насыщения. Поэтому можно сказать, что качество перевода улучшается постоянно и, суммируя изменения за определенный период, можно даже говорить о переходе на новый уровень».

Судя по всему, символом «нового уровня» станет постановка Шекспира, переведенного компьютерной системой. Эта идея появилась у режиссера киевского Центра театрального искусства им. Леся Курбаса Александра Остапенко.

Он давно собирался поставить спектакль на основе оригинальных текстов Шекспира. Но любой перевод классика является фактически самостоятельным литературным произведением. Тексты Пастернака или Маршака несут в себе собственное восприятие переводчиком той эпохи характеров и отношений. Это восприятие неизбежно наслаивается на авторскую индивидуальность.

Очень сложно было найти редактора-переводчика (человека), который согласился бы «наступить на горло» собственной переводческой амбиции. И тогда режиссер решился обратиться за помощью к российским разработчикам компьютерных программ перевода.

Результат оказался неожиданным. Вот фрагмент из варианта выполненного системой «ПРОМТ»: «Я так часто краснел, чтобы признать его, что теперь покрылся медью». Здесь любой редактор старался бы подобрать эквивалент в русском языке. Но при таком переводе теряется еще один смысл, еще одно ощущение – металл, доспехи... Краснел, был беззащитен и вдруг – защищен доспехами цвета меди.

Приведем еще один пример. Слова короля Лира на языке оригинала звучат так:

«Lear: Meantime we shall express our darker purpose.

Give me the map there. Know we have divided

In there our kingdom; and' tis our fast intent

To shake all cares and business from our age,

Conferring them on younger strengths while we

Unburthen'd crawl toward death».

Этот же фрагмент в переводе Александра Дружинина выглядит следующим образом:

«Мы же между тем

Передадим наш замысел давнишний.

Подайте карту королевства!

Знайте

Все, здесь стоящие, что на три части

Мы разделили наше государство

И твердо вознамерились, сложивши

С себя заботы трудной царской власти,

Без ноши на плечах плестись ко гробу.

Пора дать место юношам».

Пастернак перевел этот текст так:

«А мы вас посвятим

В заветные решенья наши глубже.

Подайте карту мне. Узнайте все:

Мы разделили край наш на три части.

Ярмо забот мы с наших дряхлых плеч

Хотим переложить на молодые

И доплестись до гроба налегке».

А вот что выдала машина:

«Тем временем

Мы выразим нашу цель,

Которая в тени была.

Дайте мне карту там.

Знайте, что мы разделили

На трое наше королевство;

и это наше быстрое решение

Долою все заботы и решения от нашего возраста

Пусть их на младших, в то время как мы

Необремененно к смерти поползем».

Безусловно, тексты, получившиеся у людей-переводчиков звучат гораздо изящнее и поэтичнее. Но, с точки зрения смысла, машина не слишком отстает от человека, более того – кое-где она позволяет сохранить больше оригинальной информации.

В машинном варианте Лир говорит: «Мы выразим нашу цель // Которая в тени была». В то же время у Пастернака секретность плана отображена не так очевидно: «Заветные решенья...», а у Дружинина идея короля вообще не имеет оттенка тайны: «Передадим наш замысел давнишний...».

«Удивительное свойство, – говорит Остапенко, – которое присуще машинному переводчику, его, порой, формальный поход к тексту иногда оказывается способен пробудить взрыв ассоциаций… Вдруг стало понятно, как должны быть одеты люди, которые ТАК говорят. Вдруг стало понятно, для какого театрального помещения писалась эта пьеса – конечно, для специфичного зрительного зала театра «Глобус». Вдруг оказалось, что речь короля Лира от начала пьесы к концу пьесы изменяется так, как изменяется его характер. Это догадка, до конца еще далеко, но это в логике пьесы. Есть симптомы, что это так».

В общем, слухи о стагнации машинного перевода оказались сильно преувеличенными. Исследования и разработки в этой области продолжаются. Более того, сейчас они снова приобрели актуальность. Ведь вопрос языка – это еще и политический вопрос. Переход к английскому языку в качестве межгосударственного стал явной тенденцией. Однако для многих это является символом лингвистической экспансии США, дополняющей экспансию экономическую и военную. Противостоять этой «однополярности» может только сохранение многоязычного мира. И в этом системы машинного перевода могут стать мощным подспорьем.

Тарасевич Григорий
читайте также
Наука
Леонид Костандов: 1915 – 1984
Ноябрь 27, 2015
Руссо Максим
Наука
Сила самоиронии. К 80-летию Юрия Левады. Рассказывают Теодор Шанин и Борис Юдин
Май 13, 2010
ЗАГРУЗИТЬ ЕЩЕ

Бутовский полигон

Смотреть все
Начальник жандармов
Май 6, 2024

Человек дня

Смотреть все
Человек дня: Александр Белявский
Май 6, 2024
Публичные лекции

Лев Рубинштейн в «Клубе»

Pro Science

Мальчики поют для девочек

Колонки

«Год рождения»: обыкновенное чудо

Публичные лекции

Игорь Шумов в «Клубе»: миграция и литература

Pro Science

Инфракрасные полярные сияния на Уране

Страна

«Россия – административно-территориальный монстр» — лекция географа Бориса Родомана

Страна

Сколько субъектов нужно Федерации? Статья Бориса Родомана

Pro Science

Эксперименты империи. Адат, шариат и производство знаний в Казахской степи

О проекте Авторы Биографии
Свидетельство о регистрации средства массовой информации Эл. № 77-8425 от 1 декабря 2003 года. Выдано министерством Российской Федерации по делам печати, телерадиовещания и средств массовой информации.

© Полит.ру, 1998–2024.

Политика конфиденциальности
Политика в отношении обработки персональных данных ООО «ПОЛИТ.РУ»

В соответствии с подпунктом 2 статьи 3 Федерального закона от 27 июля 2006 г. № 152-ФЗ «О персональных данных» ООО «ПОЛИТ.РУ» является оператором, т.е. юридическим лицом, самостоятельно организующим и (или) осуществляющим обработку персональных данных, а также определяющим цели обработки персональных данных, состав персональных данных, подлежащих обработке, действия (операции), совершаемые с персональными данными.

ООО «ПОЛИТ.РУ» осуществляет обработку персональных данных и использование cookie-файлов посетителей сайта https://polit.ru/

Мы обеспечиваем конфиденциальность персональных данных и применяем все необходимые организационные и технические меры по их защите.

Мы осуществляем обработку персональных данных с использованием средств автоматизации и без их использования, выполняя требования к автоматизированной и неавтоматизированной обработке персональных данных, предусмотренные Федеральным законом от 27 июля 2006 г. № 152-ФЗ «О персональных данных» и принятыми в соответствии с ним нормативными правовыми актами.

ООО «ПОЛИТ.РУ» не раскрывает третьим лицам и не распространяет персональные данные без согласия субъекта персональных данных (если иное не предусмотрено федеральным законом РФ).