26 марта 2019, вторник, 21:26
VK.comFacebookTwitterTelegramInstagramYouTubeЯндекс.Дзен

НОВОСТИ

СТАТЬИ

PRO SCIENCE

СКОЛКОВО

ЛЕКЦИИ

АВТОРЫ

06 июня 2004, 09:38

Компьютер замахнулся на Вильяма нашего Шекспира

Скоро в киевском Центре театрального искусства им. Леся Курбаса состоится премьера пьесы Шекспира «Король Лир». Особенность этой постановки в том, что перевод пьесы был выполнен компьютером.

К этому событию можно отнестись по-разному. Для кого-то это не более, чем культурно-технологический перформанс. Помнится, кто-то из наших концептуальных художников развлекался, пропуская текст «Евгения Онегина» через машинный переводчик «туда-обратно».

Но если откинуть в сторону иронию и скепсис, то компьютерный вариант Шекспира, поставленный на вполне солидной сцене, это значимая веха в истории машинного перевода, который в этом году отмечает свой 50-летний юбилей.

Мечта о «магическом кристалле», который поможет людям общаться, независимо от их языка, существовала с незапамятных времен. Но воплощаться в реальность она начала только после Второй мировой войны, на волне развития кибернетики.

Еще 1629 году Рене Декарт предложил изобрести шифр, который обозначал бы одним и тем же номером одинаковые понятия в разных языках. Идею возложить работу переводчика на специальные механизмы впервые высказал в XIX веке знаменитый английский математик Чарльз Бэббидж. Он разработал проект цифровой аналитической машины. Идея Бэббиджа состояла в том, что память объемом в тысячу 50-разрядных чисел (по 50 зубчатых колес в каждом регистре) можно использовать для хранения словарей.

В 1933 году было выдано сразу два патента на переводящие устройства. Французский армянин Георг Артсани разработал схему прибора на бумажной ленте для перевода произвольного слова на другой язык. В России патент получил Петр Смирнов-Троянский. Но для воплощения всех машинно-переводческих идей нужно было некое устройство, быстро и точно обрабатывавшее информацию. И поэтому реальное развитие машинного перевода началось только с появлением компьютера.

Принято считать, что главным вдохновителем разработок в этой области стал Уоррен Уивер – математик, работавший одним из руководителей Рокфеллеровского научного фонда. В марте 1947 года он отправил письмо отцу-основателю кибернетики Норберту Винеру. Там была впервые сформулирована концепция машинного перевода. В своем письме к Винеру Уивер предлагал разработать промежуточный «универсальный» язык, который назвал «машинезийским». Обрабатывая предложение, написанное на одном языке, компьютер должен был найти в словаре аналог каждого из слов на другом языке, а затем расставить полученные слова в соответствии с правилами грамматики. «У меня перед глазами текст, написанный по-русски, но я собираюсь сделать вид, что на самом деле он написан по-английски и закодирован при помощи довольно странных знаков. Все что мне нужно, это взломать код, чтобы извлечь информацию, заключенную в тексте», – писал Уивер .

Норберт Винер свободно изъяснялся чуть ли не на десяти языках. Может быть, поэтому он не придал особого значения идеям своего коллеги. Куда больший энтузиазм предложения Уивера вызвали в военном ведомстве США. Неизвестно, поняли ли генералы и полковники все концепции математика. Но были произнесены ключевые слова: «взломать код», «вычислительная машина» и «русский язык». Очевидно, этого было достаточно для того, чтобы в проект начали вкладываться серьезные деньги.

В 1954 году с большой помпой в Нью-Йорке была представлена первая система машинного перевода, созданная специалистами IBM и Джорджтаунского университета. Программа была довольно скромной. Она имела словарь в 250 единиц и грамматических правил. Но она действительно перевела правильным английским языком 60 несложных русских предложений, состоящих только из слов, включенных в словарь. К этому моменту было уже понятно, что перевод – это не просто замена одних знаков другими. Некоторые русские слова уже имели по два английских значения. Например, в зависимости от конкретного следующего слова машина переводила русский предлог «к» английскими «to» или «for».

Демонстрация системы вызвала эйфорию у ученых и их спонсоров. Казалось, что создание систем качественного автоматического перевода вполне достижимо в пределах нескольких лет. Профессиональные переводчики всерьез подумывали о том, что пора осваивать более перспективные специальности, вроде массажиста или водителя такси.

Но ликование кибернетиков продолжалось недолго. Еще в 1959 году американский философ Йошуа Бар-Хиллел выступил с утверждением, что высококачественный полностью автоматический перевод не может быть достигнут в принципе.

В качестве примера Бар-Хиллел привел фразу: John was looking for his toy box. Finally he found it. The box was in the pen. («Джон искал свою коробку с игрушками. Наконец он ее нашел. Коробка была в манеже».) Pen в данном случае означает не «ручка» (инструмент для письма), а «детский манеж». Правильно перевести этот текст машине не под силу, поскольку она не понимает «внеязыковой реальности».

В 1966 году специальная комиссия, созданная Академией наук США, пришла к заключению, что перекладывать перевод с человека на компьютер нерентабельно. Бурный поток финансирования исследований сначала превратился в тощий ручеек, а потом и вовсе иссяк. Ученым приходилось искать средства в самых экзотических местах. Например, разработка систем машинного перевода в университете Brigham Young University финансировалась Мормонской церковью, заинтересованной в переводе Библии.

Затишье в развитии машинного перевода продолжалось недолго. К концу 80-х годов компьютер стал превращаться из огромного прибора для избранных в компактное устройство для всех. Увеличивалась производительность процессора, разрабатывались новые лингвистические алгоритмы, позволяющие переводить текст точнее. Были созданы различные методы формализации смысла – семантические сети, фреймы и т.д. Машину учили мыслить или, по крайней мере, убедительно изображать мышление.

С начала 90-х годов на рынок систем машинного перевода выходят отечественные разработчики. Наша страна в этой области никогда не отставала от Запада.

Кстати, двое наиболее ярких ученых, заложивших основу для машинного перевода, имели большие неприятности с властями своих стран. Ноам Хомский, создавший так называемые контекстно-свободные грамматики, очень жестко выступал против политики США и даже оказался в тюрьме за организацию антивоенных манифестаций. Его советский коллега Игорь Мельчук, разработавший лингвистическую модель «Смысл-Текст», имел неприятности с КГБ из-за своих связей с диссидентами и был вынужден эмигрировать из СССР.

У нас были отличные теоретики, правда, с практической реализацией дело обстояло хуже. Но рыночная экономика сделала свое дело. Кабинетные изыскания лингвистов превратились в товар. В июле 1990 года была представлена первая в России коммерческая система машинного перевода под названием PROMT (PROgrammer's Machine Translation). Уже в 1992 году компания «ПРОМТ» выиграла конкурс NASA на поставку систем машинного перевода. Вскоре появилась еще одна «рыночная» система – «СОКРАТ».

Современные системы машинного перевода, безусловно, далеки от совершенства. Полностью устранить комичные неполадки не получается даже сегодня. Например, если переводить американские газеты, чаще всего будет встречаться словосочетание «молодой кустарник». Причем употребляться они будут в самом неожиданном контексте. Машина пока что не научилась понимать, что Bush – это вовсе не поросль, а президент США Джордж Буш-младший.

Главное преимущество машинного перевода – это скорость. Для примера я пропустил через компьютерный переводчик 300 страниц произвольного текста. На его полную обработку ушло меньше пяти минут. Человеку бы понадобилась не одна неделя.

Вряд ли в ближайшем будущем возможности машинного перевода принципиально улучшатся. Вопрос о месте машинного перевода казался закрытым. Даже сами производители программных продуктов готовы были это признать.

«Компьютер не наделен образным мышлением, у него отсутствует ассоциативное мышление и аналитические способности. Иначе говоря, творение никогда не сможет превзойти своего творца. Поэтому машинный перевод был, есть и будет удобным и эффективным средством для решения двух задач: быстро понять смысл текста (в английском языке это называется словом gisting). Это фантастически удобно, когда важно понять, о чем идет речь в тексте. Это позволяет заказать гостиницу на западном сайте, прочесть новости на незнакомом языке, разобраться с инструкцией к бытовой технике и т. д.», – признает директор по маркетингу «ПРОМТ» Александр Андреев

Он также считает, что системы машинного перевода, могут быть использованы как инструмент для повышения производительности труда. Эти системы успешно используются не только рядовыми пользователями, не знающими иностранных языков, но и профессиональными переводчиками.

Долгое время был расхожим стереотип о том, что машинный перевод прежде всего предназначен для документации и деловой переписки, в которых нет сложных грамматических конструкций и двусмысленностей. Программа слишком формально подходит к делу, говорили они, сухо фиксируя то, что «видит», не заботясь об адекватной передаче фразеологических оборотов, игры слов или рифмы.

«Мы постоянно работаем над усовершенствованием нашей технологии, постоянно вносим улучшения в алгоритмы перевода. Однако никаких революционных сдвигов ждать не следует, &ndash сообщил «Полит.ру» Александр Андреев. – Образно говоря, ситуацию с качеством машинного перевода можно сравнить с математической функцией, которая на начальном этапе резко растет (с небольшими затратами можно достигнуть революционных изменений в качестве перевода, здесь любой, даже очень плохой перевод кажется большой победой над иностранным текстом), затем постепенно переходит в стадию насыщения: даже небольшие улучшения в качестве перевода требуют больших затрат времени и средств. Сейчас мы находимся как раз в стадии насыщения. Поэтому можно сказать, что качество перевода улучшается постоянно и, суммируя изменения за определенный период, можно даже говорить о переходе на новый уровень».

Судя по всему, символом «нового уровня» станет постановка Шекспира, переведенного компьютерной системой. Эта идея появилась у режиссера киевского Центра театрального искусства им. Леся Курбаса Александра Остапенко.

Он давно собирался поставить спектакль на основе оригинальных текстов Шекспира. Но любой перевод классика является фактически самостоятельным литературным произведением. Тексты Пастернака или Маршака несут в себе собственное восприятие переводчиком той эпохи характеров и отношений. Это восприятие неизбежно наслаивается на авторскую индивидуальность.

Очень сложно было найти редактора-переводчика (человека), который согласился бы «наступить на горло» собственной переводческой амбиции. И тогда режиссер решился обратиться за помощью к российским разработчикам компьютерных программ перевода.

Результат оказался неожиданным. Вот фрагмент из варианта выполненного системой «ПРОМТ»: «Я так часто краснел, чтобы признать его, что теперь покрылся медью». Здесь любой редактор старался бы подобрать эквивалент в русском языке. Но при таком переводе теряется еще один смысл, еще одно ощущение – металл, доспехи... Краснел, был беззащитен и вдруг – защищен доспехами цвета меди.

Приведем еще один пример. Слова короля Лира на языке оригинала звучат так:

«Lear: Meantime we shall express our darker purpose.

Give me the map there. Know we have divided

In there our kingdom; and' tis our fast intent

To shake all cares and business from our age,

Conferring them on younger strengths while we

Unburthen'd crawl toward death».

Этот же фрагмент в переводе Александра Дружинина выглядит следующим образом:

«Мы же между тем

Передадим наш замысел давнишний.

Подайте карту королевства!

Знайте

Все, здесь стоящие, что на три части

Мы разделили наше государство

И твердо вознамерились, сложивши

С себя заботы трудной царской власти,

Без ноши на плечах плестись ко гробу.

Пора дать место юношам».

Пастернак перевел этот текст так:

«А мы вас посвятим

В заветные решенья наши глубже.

Подайте карту мне. Узнайте все:

Мы разделили край наш на три части.

Ярмо забот мы с наших дряхлых плеч

Хотим переложить на молодые

И доплестись до гроба налегке».

А вот что выдала машина:

«Тем временем

Мы выразим нашу цель,

Которая в тени была.

Дайте мне карту там.

Знайте, что мы разделили

На трое наше королевство;

и это наше быстрое решение

Долою все заботы и решения от нашего возраста

Пусть их на младших, в то время как мы

Необремененно к смерти поползем».

Безусловно, тексты, получившиеся у людей-переводчиков звучат гораздо изящнее и поэтичнее. Но, с точки зрения смысла, машина не слишком отстает от человека, более того – кое-где она позволяет сохранить больше оригинальной информации.

В машинном варианте Лир говорит: «Мы выразим нашу цель // Которая в тени была». В то же время у Пастернака секретность плана отображена не так очевидно: «Заветные решенья...», а у Дружинина идея короля вообще не имеет оттенка тайны: «Передадим наш замысел давнишний...».

«Удивительное свойство, – говорит Остапенко, – которое присуще машинному переводчику, его, порой, формальный поход к тексту иногда оказывается способен пробудить взрыв ассоциаций… Вдруг стало понятно, как должны быть одеты люди, которые ТАК говорят. Вдруг стало понятно, для какого театрального помещения писалась эта пьеса – конечно, для специфичного зрительного зала театра «Глобус». Вдруг оказалось, что речь короля Лира от начала пьесы к концу пьесы изменяется так, как изменяется его характер. Это догадка, до конца еще далеко, но это в логике пьесы. Есть симптомы, что это так».

В общем, слухи о стагнации машинного перевода оказались сильно преувеличенными. Исследования и разработки в этой области продолжаются. Более того, сейчас они снова приобрели актуальность. Ведь вопрос языка – это еще и политический вопрос. Переход к английскому языку в качестве межгосударственного стал явной тенденцией. Однако для многих это является символом лингвистической экспансии США, дополняющей экспансию экономическую и военную. Противостоять этой «однополярности» может только сохранение многоязычного мира. И в этом системы машинного перевода могут стать мощным подспорьем.

Обсудите в соцсетях

Система Orphus

Главные новости

21:20 Российские следователи завели дело о пытках в тайных тюрьмах СБУ
21:02 СМИ узнали о докладе Путину перед задержанием Абызова
20:44 СКР начал проверку после падения глыбы льда на жительницу Мурманска
20:12 Шойгу объявил о создании киностудии министерства обороны
20:07 СМИ узнали о «выманивании» Абызова из-за границы для задержания
20:00 ФК «Зенит» рассказал о своей попытке отправить врача к Кокорину
19:47 Захарова объяснила пребывание военных из РФ в Венесуэле
19:40 Путин опроверг слухи о превращении музыкальных школ в кружки
19:16 Экс-министр Абызов задержан за мошенничество в составе ОПС
18:53 Для экс-главы Коми Гайзера запросили 21 год колонии
18:36 У тещи Чемезова нашли пентхаус в Москве за 2 млрд рублей
18:04 Арашуков заявил о миллиардной стоимости показаний против себя
17:40 ЦБ зарегистрировал первый банк с 2015 года
17:07 Нефтяники продлят заморозку цен на бензин до июля
16:38 «Открытая Россия» попросила Минюст зарегистрировать ее как общественную организацию
15:53 Рауфу Арашукову назначат психиатрическую экспертизу
15:35 Погребняк оштрафован за высказывание о темнокожих игроках
14:44 Рядом с Кремлем украли кабель правительственной связи
14:29 США провели испытания противоракет над Тихим океаном
14:08 В Москве нашли мертвым генерал-майора ФСБ
13:45 Обвиняемым в убийстве отца сестрам Хачатурян продлили меру пресечения
13:19 Facebook удалил почти 2 тысячи связанных с Россией страниц
12:58 Президент Мексики потребовал от короля Испании и папы римского извинений за колониальные завоевания
12:26 В Ингушетии началась акция против изменений правил проведения референдума
12:02 NASA отменило первый женский полет в космос из-за скафандров
11:31 Аспиранта МГУ Мифтахова признали политзаключенным
11:09 Россияне заплатят 385 млрд рублей за умные счетчики
10:47 На ЦКАД вокруг Москвы выделят еще 45 млрд рублей
10:22 Huawei решил запустить в России свой музыкальный сервис
10:13 Устройство виртуальной реальности позволяет взглянуть на мир глазами долгопята
10:00 Названы регионы с самой низкой занятостью
09:42 Макгрегор объявил о завершении карьеры
09:26 Лондонский суд отказал Аветисяну в попытках взять контроль над банком «Восточный»
09:06 Проект закона об автономном рунете подорожал до 30 млрд рублей
02:00 США обновили списки подозреваемых в торговле нефтью с Ираном и Сирией
01:20 Кабмин изменил правила оценки заявок на госстроительство
00:57 Адвоката судившейся с Трампом порномодели обвинили в вымогательстве
00:42 Тимошенко изменила свое обещание вернуть Крым после выборов
00:36 Минфин предложил поднять минимальную цену на игристое вино и шампанское
00:15 Airbus поставит в Китай аэробусы на 35 млрд долларов
25.03 23:59 Хоккеист Овечкин встретился с президентом США в Белом доме
25.03 23:46 В Венесуэле третий раз с начала марта пропало электричество
25.03 23:20 В России впервые вынесен приговор о вовлечении подростков в несогласованный пикет
25.03 23:02 Союз биатлонистов России хочет нанять Бьорндалена тренером сборной
25.03 22:55 Россия попросила Польшу выдать фигуранта дела «Зимней вишни»
25.03 22:42 Клиентам Apple TV+ покажут шоу от Спилберга и Уинфри
25.03 22:31 Минобороны РФ признало гибель трех военных в Сирии
25.03 22:15 Госдуме предложили расширить список мест альтернативной гражданской службы
25.03 22:01 В приложении Apple News+ появилась подписка на журналы
25.03 21:41 ВС РФ отклонил иск коммунистов о передаче мандата Грудинину
«ВКонтакте» «Газпром» «Зенит» «Мистраль» «Оборонсервис» «Роснефть» «Спартак» «Яблоко» Абхазия Австралия Австрия Азербайджан Антимайдан Аргентина Арктика Армения Афганистан Аэрофлот Башкирия Белоруссия Бельгия Бразилия ВВП ВКС ВМФ ВПК ВТБ ВЦИОМ Ватикан Великобритания Венесуэла Владивосток Внуково Волгоград ГИБДД ГЛОНАСС Генпрокуратура Германия Голливуд Госдеп Госдума Греция Гринпис Грузия ДТП Дагестан Домодедово Донецк ЕГЭ ЕСПЧ Евровидение Еврокомиссия Евромайдан Евросоюз Египет Екатеринбург ЖКХ Израиль Ингушетия Индия Индонезия Интерпол Ирак Иран Испания Италия Йемен КНДР КПРФ Казань Казахстан Калининград Камчатка Канада Каталония Кемерово Киев Киргизия Китай Конституция Кремль Крым Куба Курилы ЛГБТ ЛДПР Латвия Ливия Литва Лондон Луганск МВД МВФ МКС МОК МЧС Малайзия Мексика Мемория Минздрав Минкомсвязи Минкульт Минобороны Минобрнауки Минпромторг Минсельхоз Минтранспорта Минтруд Минфин Минэкономразвития Минэнерго Минюст Молдавия Мосгорсуд Москва НАСА Нигерия Нидерланды Новосибирск Норвегия ОБСЕ ООН ОПЕК Одесса ПДД Пакистан Паралимпиада Париж Пентагон Польша Право Приморье Продовольствие РАН РЖД РПЦ РФС Росавиация Роскомнадзор Роскосмос Роспотребнадзор Россельхознадзор Россия Росстат СМИ СССР США Сахалин Сбербанк Севастополь Сербия Сирия Сколково Славянск Сочи Таджикистан Таиланд Татарстан Трансаэро Турция УЕФА Узбекистан Украина ФАС ФБР ФИФА ФСБ ФСИН ФСКН Филиппины Финляндия Франция Харьков ЦИК ЦРУ ЦСКА Центробанк Чехия Чечня Швейцария Швеция Шереметьево Эбола Эстония ЮКОС Якутия Яндекс Япония авиакатастрофа автопром алкоголь амнистия армия археология астрономия аукционы банкротство беженцы бензин беспилотник беспорядки биатлон бизнес бокс болельщики вандализм взрыв взятка вирусы вузы выборы гаджеты генетика гомосексуализм госбюджет госзакупки госизмена деньги дети доллар допинг драка евро журналисты законотворчество землетрясение импорт инвестиции инновации интернет инфляция ипотека искусство ислам история казнь кино кораблекрушение коррупция космос кража кредиты культура лингвистика литература медиа медицина метро мигранты монархия мошенничество музыка наводнение налоги нанотехнологии наркотики наука недвижимость некролог нефть образование обрушение общество ограбление оппозиция опросы оружие офшор палеонтология педофилия пенсия пиратство планетология погранвойска пожар полиция похищение правительство православие преступность происшествия ракета рейтинги реклама религия ритейл рубль санкции связь сепаратизм следствие смартфоны социология спецслужбы спутники страхование стрельба строительство суды суицид тарифы театр телевидение теракт терроризм технологии транспорт туризм убийство фармакология физика фоторепортаж футбол хакеры химия хоккей хулиганство цензура школа шпионаж экология экономика экстремизм этология «Единая Россия» «Исламское государство» «Нафтогаз Украины» «Правый сектор» «Справедливая Россия» «болотное дело» Александр Лукашенко Александр Турчинов Алексей Кудрин Алексей Навальный Алексей Улюкаев Амурская область Анатолий Сердюков Ангела Меркель Антон Силуанов Аркадий Дворкович Арсений Яценюк Барак Обама Басманный суд Башар Асад Белый дом Борис Немцов Валентина Матвиенко Верховная Рада Верховный суд Виктор Янукович Виталий Мутко Владимир Жириновский Владимир Маркин Владимир Мединский Владимир Путин Вячеслав Володин Дальний Восток День Победы Дмитрий Медведев Дмитрий Песков Дмитрий Рогозин Дональд Трамп Евгения Васильева Забайкальский край Интервью ученых Ирина Яровая Иркутская область История человечества Конституционный суд Космодром Байконур Краснодарский край Красноярский край Ксения Собчак Ленинградская область МИД России Мария Захарова Михаил Прохоров Михаил Саакашвили Михаил Ходорковский Московская область Мурманская область Надежда Савченко Николас Мадуро Нобелевская премия Новый год Олимпийские игры Ольга Голодец Павел Дуров Палестинская автономия Папа Римский Первый канал Петр Порошенко Почта России Приморский край Рамзан Кадыров Реджеп Эрдоган Республика Карелия Ростовская область Саратовская область Саудовская Аравия Свердловская область Сергей Лавров Сергей Нарышкин Сергей Полонский Сергей Собянин Сергей Шойгу Следственный комитет Совбез ООН Совет Федерации Ставропольский край Счетная палата Тереза Мэй Франсуа Олланд Хабаровский край Хиллари Клинтон Челябинская область Черное море Эдвард Сноуден Элла Памфилова Южная Корея Юлия Тимошенко авторское право администрация президента акции протеста атомная энергия баллистические ракеты банковский сектор биология большой теннис визовый режим военная авиация выборы губернаторов газовая промышленность гражданская авиация гуманитарная помощь декларации чиновников дороги России информационные технологии климат Земли компьютерная безопасность космодром Восточный крушение вертолета легкая атлетика лесные пожары междисциплинарные исследования мобильные приложения морской транспорт некоммерческие организации общественный транспорт патриарх Кирилл пенсионная реформа пищевая промышленность права человека правозащитное движение преступления полицейских публичные лекции русские националисты сельское хозяйство сотовая связь социальные сети стихийные бедствия телефонный терроризм уголовный кодекс фондовая биржа химическое оружие эволюция экономический кризис ядерное оружие Великая Отечественная война Вторая мировая война Ирак после войны Ким Чен Ын Революция в Киргизии Российская академия наук Стихотворения на случай Федеральная миграционная служба борьба с курением выборы мэра Москвы здравоохранение в России связь и телекоммуникации тюрьмы и колонии Совет по правам человека аварии на железной дороге естественные и точные науки закон об «иностранных агентах» видеозаписи публичных лекций «Полит.ру» Новые технологии, инновации Сочи 2014 Кабардино-Балкария Левада-Центр Нью-Йорк Санкт-Петербург отставки-назначения шоу-бизнес Ростов-на-Дону ЧМ-2018 Компьютеры, программное обеспечение Книга. Знание ВИЧ/СПИД Apple Bitcoin Boeing Facebook Google iPhone IT NATO PRO SCIENCE видео ProScience Театр Pussy Riot Telegram Twitter

Редакция

Электронная почта: [email protected]
Адрес: 129090, г. Москва, Проспект Мира, дом 19, стр.1, пом.1, ком.5
Телефон: +7 929 588 33 89
Яндекс.Метрика
Свидетельство о регистрации средства массовой информации
Эл. № 77-8425 от 1 декабря 2003 года. Выдано министерством
Российской Федерации по делам печати, телерадиовещания и
средств массовой информации. Выходит с 21 февраля 1998 года.
При любом использовании материалов веб-сайта ссылка на Полит.ру обязательна.
При перепечатке в Интернете обязательна гиперссылка polit.ru.
Все права защищены и охраняются законом.
© Полит.ру, 1998–2019.