Полiт.ua Государственная сеть Государственные люди Войти
16 декабря 2017, суббота, 18:07
Facebook Twitter LiveJournal VK.com RSS

НОВОСТИ

СТАТЬИ

АВТОРЫ

ЛЕКЦИИ

PRO SCIENCE

СКОЛКОВО

РЕГИОНЫ

06 июня 2004, 09:38

Компьютер замахнулся на Вильяма нашего Шекспира

Скоро в киевском Центре театрального искусства им. Леся Курбаса состоится премьера пьесы Шекспира «Король Лир». Особенность этой постановки в том, что перевод пьесы был выполнен компьютером.

К этому событию можно отнестись по-разному. Для кого-то это не более, чем культурно-технологический перформанс. Помнится, кто-то из наших концептуальных художников развлекался, пропуская текст «Евгения Онегина» через машинный переводчик «туда-обратно».

Но если откинуть в сторону иронию и скепсис, то компьютерный вариант Шекспира, поставленный на вполне солидной сцене, это значимая веха в истории машинного перевода, который в этом году отмечает свой 50-летний юбилей.

Мечта о «магическом кристалле», который поможет людям общаться, независимо от их языка, существовала с незапамятных времен. Но воплощаться в реальность она начала только после Второй мировой войны, на волне развития кибернетики.

Еще 1629 году Рене Декарт предложил изобрести шифр, который обозначал бы одним и тем же номером одинаковые понятия в разных языках. Идею возложить работу переводчика на специальные механизмы впервые высказал в XIX веке знаменитый английский математик Чарльз Бэббидж. Он разработал проект цифровой аналитической машины. Идея Бэббиджа состояла в том, что память объемом в тысячу 50-разрядных чисел (по 50 зубчатых колес в каждом регистре) можно использовать для хранения словарей.

В 1933 году было выдано сразу два патента на переводящие устройства. Французский армянин Георг Артсани разработал схему прибора на бумажной ленте для перевода произвольного слова на другой язык. В России патент получил Петр Смирнов-Троянский. Но для воплощения всех машинно-переводческих идей нужно было некое устройство, быстро и точно обрабатывавшее информацию. И поэтому реальное развитие машинного перевода началось только с появлением компьютера.

Принято считать, что главным вдохновителем разработок в этой области стал Уоррен Уивер – математик, работавший одним из руководителей Рокфеллеровского научного фонда. В марте 1947 года он отправил письмо отцу-основателю кибернетики Норберту Винеру. Там была впервые сформулирована концепция машинного перевода. В своем письме к Винеру Уивер предлагал разработать промежуточный «универсальный» язык, который назвал «машинезийским». Обрабатывая предложение, написанное на одном языке, компьютер должен был найти в словаре аналог каждого из слов на другом языке, а затем расставить полученные слова в соответствии с правилами грамматики. «У меня перед глазами текст, написанный по-русски, но я собираюсь сделать вид, что на самом деле он написан по-английски и закодирован при помощи довольно странных знаков. Все что мне нужно, это взломать код, чтобы извлечь информацию, заключенную в тексте», – писал Уивер .

Норберт Винер свободно изъяснялся чуть ли не на десяти языках. Может быть, поэтому он не придал особого значения идеям своего коллеги. Куда больший энтузиазм предложения Уивера вызвали в военном ведомстве США. Неизвестно, поняли ли генералы и полковники все концепции математика. Но были произнесены ключевые слова: «взломать код», «вычислительная машина» и «русский язык». Очевидно, этого было достаточно для того, чтобы в проект начали вкладываться серьезные деньги.

В 1954 году с большой помпой в Нью-Йорке была представлена первая система машинного перевода, созданная специалистами IBM и Джорджтаунского университета. Программа была довольно скромной. Она имела словарь в 250 единиц и грамматических правил. Но она действительно перевела правильным английским языком 60 несложных русских предложений, состоящих только из слов, включенных в словарь. К этому моменту было уже понятно, что перевод – это не просто замена одних знаков другими. Некоторые русские слова уже имели по два английских значения. Например, в зависимости от конкретного следующего слова машина переводила русский предлог «к» английскими «to» или «for».

Демонстрация системы вызвала эйфорию у ученых и их спонсоров. Казалось, что создание систем качественного автоматического перевода вполне достижимо в пределах нескольких лет. Профессиональные переводчики всерьез подумывали о том, что пора осваивать более перспективные специальности, вроде массажиста или водителя такси.

Но ликование кибернетиков продолжалось недолго. Еще в 1959 году американский философ Йошуа Бар-Хиллел выступил с утверждением, что высококачественный полностью автоматический перевод не может быть достигнут в принципе.

В качестве примера Бар-Хиллел привел фразу: John was looking for his toy box. Finally he found it. The box was in the pen. («Джон искал свою коробку с игрушками. Наконец он ее нашел. Коробка была в манеже».) Pen в данном случае означает не «ручка» (инструмент для письма), а «детский манеж». Правильно перевести этот текст машине не под силу, поскольку она не понимает «внеязыковой реальности».

В 1966 году специальная комиссия, созданная Академией наук США, пришла к заключению, что перекладывать перевод с человека на компьютер нерентабельно. Бурный поток финансирования исследований сначала превратился в тощий ручеек, а потом и вовсе иссяк. Ученым приходилось искать средства в самых экзотических местах. Например, разработка систем машинного перевода в университете Brigham Young University финансировалась Мормонской церковью, заинтересованной в переводе Библии.

Затишье в развитии машинного перевода продолжалось недолго. К концу 80-х годов компьютер стал превращаться из огромного прибора для избранных в компактное устройство для всех. Увеличивалась производительность процессора, разрабатывались новые лингвистические алгоритмы, позволяющие переводить текст точнее. Были созданы различные методы формализации смысла – семантические сети, фреймы и т.д. Машину учили мыслить или, по крайней мере, убедительно изображать мышление.

С начала 90-х годов на рынок систем машинного перевода выходят отечественные разработчики. Наша страна в этой области никогда не отставала от Запада.

Кстати, двое наиболее ярких ученых, заложивших основу для машинного перевода, имели большие неприятности с властями своих стран. Ноам Хомский, создавший так называемые контекстно-свободные грамматики, очень жестко выступал против политики США и даже оказался в тюрьме за организацию антивоенных манифестаций. Его советский коллега Игорь Мельчук, разработавший лингвистическую модель «Смысл-Текст», имел неприятности с КГБ из-за своих связей с диссидентами и был вынужден эмигрировать из СССР.

У нас были отличные теоретики, правда, с практической реализацией дело обстояло хуже. Но рыночная экономика сделала свое дело. Кабинетные изыскания лингвистов превратились в товар. В июле 1990 года была представлена первая в России коммерческая система машинного перевода под названием PROMT (PROgrammer's Machine Translation). Уже в 1992 году компания «ПРОМТ» выиграла конкурс NASA на поставку систем машинного перевода. Вскоре появилась еще одна «рыночная» система – «СОКРАТ».

Современные системы машинного перевода, безусловно, далеки от совершенства. Полностью устранить комичные неполадки не получается даже сегодня. Например, если переводить американские газеты, чаще всего будет встречаться словосочетание «молодой кустарник». Причем употребляться они будут в самом неожиданном контексте. Машина пока что не научилась понимать, что Bush – это вовсе не поросль, а президент США Джордж Буш-младший.

Главное преимущество машинного перевода – это скорость. Для примера я пропустил через компьютерный переводчик 300 страниц произвольного текста. На его полную обработку ушло меньше пяти минут. Человеку бы понадобилась не одна неделя.

Вряд ли в ближайшем будущем возможности машинного перевода принципиально улучшатся. Вопрос о месте машинного перевода казался закрытым. Даже сами производители программных продуктов готовы были это признать.

«Компьютер не наделен образным мышлением, у него отсутствует ассоциативное мышление и аналитические способности. Иначе говоря, творение никогда не сможет превзойти своего творца. Поэтому машинный перевод был, есть и будет удобным и эффективным средством для решения двух задач: быстро понять смысл текста (в английском языке это называется словом gisting). Это фантастически удобно, когда важно понять, о чем идет речь в тексте. Это позволяет заказать гостиницу на западном сайте, прочесть новости на незнакомом языке, разобраться с инструкцией к бытовой технике и т. д.», – признает директор по маркетингу «ПРОМТ» Александр Андреев

Он также считает, что системы машинного перевода, могут быть использованы как инструмент для повышения производительности труда. Эти системы успешно используются не только рядовыми пользователями, не знающими иностранных языков, но и профессиональными переводчиками.

Долгое время был расхожим стереотип о том, что машинный перевод прежде всего предназначен для документации и деловой переписки, в которых нет сложных грамматических конструкций и двусмысленностей. Программа слишком формально подходит к делу, говорили они, сухо фиксируя то, что «видит», не заботясь об адекватной передаче фразеологических оборотов, игры слов или рифмы.

«Мы постоянно работаем над усовершенствованием нашей технологии, постоянно вносим улучшения в алгоритмы перевода. Однако никаких революционных сдвигов ждать не следует, &ndash сообщил «Полит.ру» Александр Андреев. – Образно говоря, ситуацию с качеством машинного перевода можно сравнить с математической функцией, которая на начальном этапе резко растет (с небольшими затратами можно достигнуть революционных изменений в качестве перевода, здесь любой, даже очень плохой перевод кажется большой победой над иностранным текстом), затем постепенно переходит в стадию насыщения: даже небольшие улучшения в качестве перевода требуют больших затрат времени и средств. Сейчас мы находимся как раз в стадии насыщения. Поэтому можно сказать, что качество перевода улучшается постоянно и, суммируя изменения за определенный период, можно даже говорить о переходе на новый уровень».

Судя по всему, символом «нового уровня» станет постановка Шекспира, переведенного компьютерной системой. Эта идея появилась у режиссера киевского Центра театрального искусства им. Леся Курбаса Александра Остапенко.

Он давно собирался поставить спектакль на основе оригинальных текстов Шекспира. Но любой перевод классика является фактически самостоятельным литературным произведением. Тексты Пастернака или Маршака несут в себе собственное восприятие переводчиком той эпохи характеров и отношений. Это восприятие неизбежно наслаивается на авторскую индивидуальность.

Очень сложно было найти редактора-переводчика (человека), который согласился бы «наступить на горло» собственной переводческой амбиции. И тогда режиссер решился обратиться за помощью к российским разработчикам компьютерных программ перевода.

Результат оказался неожиданным. Вот фрагмент из варианта выполненного системой «ПРОМТ»: «Я так часто краснел, чтобы признать его, что теперь покрылся медью». Здесь любой редактор старался бы подобрать эквивалент в русском языке. Но при таком переводе теряется еще один смысл, еще одно ощущение – металл, доспехи... Краснел, был беззащитен и вдруг – защищен доспехами цвета меди.

Приведем еще один пример. Слова короля Лира на языке оригинала звучат так:

«Lear: Meantime we shall express our darker purpose.

Give me the map there. Know we have divided

In there our kingdom; and' tis our fast intent

To shake all cares and business from our age,

Conferring them on younger strengths while we

Unburthen'd crawl toward death».

Этот же фрагмент в переводе Александра Дружинина выглядит следующим образом:

«Мы же между тем

Передадим наш замысел давнишний.

Подайте карту королевства!

Знайте

Все, здесь стоящие, что на три части

Мы разделили наше государство

И твердо вознамерились, сложивши

С себя заботы трудной царской власти,

Без ноши на плечах плестись ко гробу.

Пора дать место юношам».

Пастернак перевел этот текст так:

«А мы вас посвятим

В заветные решенья наши глубже.

Подайте карту мне. Узнайте все:

Мы разделили край наш на три части.

Ярмо забот мы с наших дряхлых плеч

Хотим переложить на молодые

И доплестись до гроба налегке».

А вот что выдала машина:

«Тем временем

Мы выразим нашу цель,

Которая в тени была.

Дайте мне карту там.

Знайте, что мы разделили

На трое наше королевство;

и это наше быстрое решение

Долою все заботы и решения от нашего возраста

Пусть их на младших, в то время как мы

Необремененно к смерти поползем».

Безусловно, тексты, получившиеся у людей-переводчиков звучат гораздо изящнее и поэтичнее. Но, с точки зрения смысла, машина не слишком отстает от человека, более того – кое-где она позволяет сохранить больше оригинальной информации.

В машинном варианте Лир говорит: «Мы выразим нашу цель // Которая в тени была». В то же время у Пастернака секретность плана отображена не так очевидно: «Заветные решенья...», а у Дружинина идея короля вообще не имеет оттенка тайны: «Передадим наш замысел давнишний...».

«Удивительное свойство, – говорит Остапенко, – которое присуще машинному переводчику, его, порой, формальный поход к тексту иногда оказывается способен пробудить взрыв ассоциаций… Вдруг стало понятно, как должны быть одеты люди, которые ТАК говорят. Вдруг стало понятно, для какого театрального помещения писалась эта пьеса – конечно, для специфичного зрительного зала театра «Глобус». Вдруг оказалось, что речь короля Лира от начала пьесы к концу пьесы изменяется так, как изменяется его характер. Это догадка, до конца еще далеко, но это в логике пьесы. Есть симптомы, что это так».

В общем, слухи о стагнации машинного перевода оказались сильно преувеличенными. Исследования и разработки в этой области продолжаются. Более того, сейчас они снова приобрели актуальность. Ведь вопрос языка – это еще и политический вопрос. Переход к английскому языку в качестве межгосударственного стал явной тенденцией. Однако для многих это является символом лингвистической экспансии США, дополняющей экспансию экономическую и военную. Противостоять этой «однополярности» может только сохранение многоязычного мира. И в этом системы машинного перевода могут стать мощным подспорьем.

Обсудите в соцсетях

Система Orphus

Главные новости

17:07 Володин призвал власти РФ и Белоруссии уравнять граждан в правах
16:18 Фигуранта дела о контрабанде алкоголя нашли убитым в Ленобласти
15:13 Экс-сотрудник ФСБ отверг обвинения в хакерских атаках против США
15:11 Украина составила план покорения Крыма телевидением
14:07 Ученые из США выложили в сеть видео с ядерным испытанием
13:55 Овечкина признали одним из величайших игроков в истории НХЛ
13:12 Борис Джонсон снялся в «рекламе» сока с Фукусимы
12:53 Глава Минтруда анонсировал выделение 49 млрд рублей на ясли
11:40 В Москве мошенники забрали 20 млн рублей у покупателя биткоинов
11:29 Норвегия первой в мире «похоронила» FM-радио
10:51 Российские военные обвинили США в подготовке «Новой сирийской армии» боевиков
10:00 Россия вложила в госдолг США 1,1 млрд долларов за месяц
09:51 Собянин позвал москвичей оценить новогоднюю подсветку
09:21 Трамп включит «агрессию» КНР в стратегию нацбезопасности
15.12 21:08 Отца предполагаемых организаторов теракта в метро Петербурга выслали в Киргизию
15.12 20:57 Майкл Джордан назван самым высокооплачиваемым спортсменом всех времен
15.12 20:36 Вероника Скворцова обсудила с Элтоном Джоном борьбу с ВИЧ
15.12 20:23 Полиция открыла огонь по мужчине с ножом в аэропорту Амстердама
15.12 20:07 Falcon 9 отправила груз на МКС и вернулась на космодром в США
15.12 19:47 В Пентагоне рассказали о новом сближении с российской авиацией в Сирии
15.12 19:44 ЦБ оценил объем докапитализации Промсвязьбанка в 100-200 млрд рублей
15.12 19:27 Пожизненно отстраненная от Игр скелетонистка Елена Никитина выиграла ЧЕ
15.12 19:18 Косово объявило о создании собственной армии к марту 2018 года
15.12 19:03 В Назарете отменили Рождество
15.12 18:51 В Испании не поверили в угрозу отстранения от ЧМ-2018
15.12 18:35 Программу безопасности на дорогах увеличили на 2 млрд рублей
15.12 18:25 ФАС проверит частичную отмену роуминга сотовыми операторами
15.12 18:25 РФ и Египет подписали соглашение о возобновлении авиасообщения
15.12 18:19 Трамп попросил у России помощи с КНДР
15.12 18:03 Курс биткоина приблизился к 18 тысячам долларов
15.12 17:54 Промсвязьбанк сообщил о проблемах в работе интернет-банка
15.12 17:48 ФИФА пригрозила отстранить сборную Испании от ЧМ-2018 из-за действий властей
15.12 17:28 Задержанный в Петербурге планировал взорвать Казанский собор
15.12 17:25 Промпроизводство в РФ в ноябре упало максимальными темпами за 8 лет
15.12 17:01 Турция потребует в ООН отменить решение США по Иерусалиму
15.12 16:43 В посольстве США назвали ложью обвинение во вмешательстве в российскую политику
15.12 16:33 Букингемский дворец назвал дату свадьбы принца Гарри
15.12 16:29 Журналист сообщил о готовности Захарченко внедрить на Украину 3 тысячи партизан
15.12 16:14 МИД Украины опроверг ведение переговоров об экстрадиции Саакашвили
15.12 16:08 Страны ЕС согласились начать вторую фазу переговоров по выходу Великобритании
15.12 15:49 Дипломатов из США не пустят наблюдать за российскими выборами
15.12 15:47 Глава ЦИК назвала стоимость информирования избирателей о выборах
15.12 15:36 Гафт перенес операцию из-за проблем с рукой
15.12 15:21 В Кремле посчитали недоказанными обвинения в адрес Керимова во Франции
15.12 14:55 ФСБ задержала в Петербурге планировавших теракты исламистов
15.12 14:33 Сенаторы одобрили закон о штрафах за анонимность в мессенджерах
15.12 14:15 В Кремле признали нежелание Путина упоминать фамилию Навального
15.12 14:02 Дума отказалась ограничить доступ к сведениям о закупках госкомпаний
15.12 13:59 Минфин пообещал не допустить «эффект домино» из-за Промсвязьбанка
15.12 13:52 Алексей Улюкаев приговорен к восьми годам строгого режима
Apple Boeing Facebook Google iPhone IT NATO PRO SCIENCE видео ProScience Театр Pussy Riot Twitter Абхазия аварии на железной дороге авиакатастрофа Австралия Австрия автопром администрация президента Азербайджан акции протеста Александр Лукашенко Алексей Кудрин Алексей Навальный Алексей Улюкаев алкоголь амнистия Анатолий Сердюков Ангела Меркель Антимайдан Аргентина Аркадий Дворкович Арктика Армения армия Арсений Яценюк археология астрономия атомная энергия аукционы Афганистан Аэрофлот баллистические ракеты банковский сектор банкротство Барак Обама Башар Асад Башкирия беженцы Белоруссия Белый дом Бельгия беспорядки биатлон бизнес биология ближневосточный конфликт бокс болельщики «болотное дело» большой теннис Борис Немцов борьба с курением Бразилия Валентина Матвиенко вандализм Ватикан ВВП Великая Отечественная война Великобритания Венесуэла Верховная Рада Верховный суд взрыв взятка видеозаписи публичных лекций «Полит.ру» видео «Полит.ру» визовый режим Виктор Янукович вирусы Виталий Мутко «ВКонтакте» ВКС Владивосток Владимир Жириновский Владимир Маркин Владимир Мединский Владимир Путин ВМФ военная авиация Волгоград ВТБ Вторая мировая война вузы ВЦИОМ выборы выборы губернаторов выборы мэра Москвы Вячеслав Володин гаджеты газовая промышленность «Газпром» генетика Генпрокуратура Германия ГИБДД ГЛОНАСС Голливуд гомосексуализм госбюджет Госдеп Госдума госзакупки гражданская авиация Греция Гринпис Грузия гуманитарная помощь гуманитарные и социальные науки Дагестан Дальний Восток декларации чиновников деньги День Победы дети Дмитрий Медведев Дмитрий Песков Дмитрий Рогозин доллар Домодедово Дональд Трамп Донецк допинг дороги России драка ДТП Евгения Васильева евро Евровидение Еврокомиссия Евромайдан Евросоюз Египет ЕГЭ «Единая Россия» Екатеринбург ЕСПЧ естественные и точные науки ЖКХ журналисты Забайкальский край закон об «иностранных агентах» законотворчество здравоохранение в России землетрясение «Зенит» Израиль Ингушетия Индия Индонезия инновации Интервью ученых интернет инфляция Ирак Ирак после войны Иран Иркутская область искусство ислам «Исламское государство» Испания история История человечества Италия Йемен Казань Казахстан казнь Калининград Камчатка Канада Киев кино Киргизия Китай климат Земли КНДР Книга. Знание Компьютеры, программное обеспечение Конституционный суд Конституция кораблекрушение коррупция космодром Восточный космос КПРФ кража Краснодарский край Красноярский край кредиты Кремль крушение вертолета Крым крымский кризис Куба культура Латвия ЛГБТ ЛДПР Левада-Центр легкая атлетика Ленинградская область лесные пожары Ливия лингвистика Литва литература Лондон Луганск Малайзия Мария Захарова МВД МВФ медиа медицина междисциплинарные исследования Мексика Мемория метро мигранты МИД России Минздрав Минкомсвязи Минкульт Минобороны Минобрнауки Минсельхоз Минтранспорта Минтруд Минфин Минэкономразвития Минэнерго Минюст «Мистраль» Михаил Саакашвили Михаил Ходорковский МКС мобильные приложения МОК Молдавия Мосгорсуд Москва Московская область мошенничество музыка Мурманская область МЧС наводнение Надежда Савченко налоги нанотехнологии наркотики НАСА наука Наука в современной России «Нафтогаз Украины» недвижимость некоммерческие организации некролог Нерусский бунт нефть Нигерия Нидерланды Нобелевская премия Новосибирск Новые технологии, инновации Новый год Норвегия Нью-Йорк «Оборонсервис» образование обрушение ОБСЕ общественный транспорт общество ограбление Одесса Олимпийские игры ООН ОПЕК оппозиция опросы оружие отставки-назначения офшор Пакистан палеонтология Палестинская автономия Папа Римский Париж ПДД педофилия пенсионная реформа Пентагон Петр Порошенко пищевая промышленность погранвойска пожар полиция Польша похищение Почта России права человека правительство Право правозащитное движение православие «Правый сектор» преступления полицейских преступность Приморский край Продовольствие происшествия публичные лекции Рамзан Кадыров РАН Революция в Киргизии Реджеп Эрдоган рейтинги религия Республика Карелия Реформа армии РЖД ритейл Роскомнадзор Роскосмос «Роснефть» Роспотребнадзор Россельхознадзор Российская академия наук Россия Ростов-на-Дону Ростовская область РПЦ рубль русские националисты РФС Санкт-Петербург санкции Саудовская Аравия Сахалин Сбербанк Свердловская область связь связь и телекоммуникации Севастополь сельское хозяйство сепаратизм Сербия Сергей Лавров Сергей Полонский Сергей Собянин Сергей Шойгу Сирия Сколково Славянск Следственный комитет следствие смартфоны СМИ Совбез ООН Совет по правам человека Совет Федерации сотовая связь социальные сети социология Социология в России Сочи Сочи 2014 «Спартак» спецслужбы «Справедливая Россия» спутники СССР Ставропольский край стихийные бедствия Стихотворения на случай страхование стрельба строительство суды суицид Счетная палата США Таджикистан Таиланд Татарстан театр телевидение телефонный терроризм теракт терроризм технологии Трансаэро транспорт туризм Турция тюрьмы и колонии убийство уголовный кодекс УЕФА Узбекистан Украина Условия труда фармакология ФАС ФБР Федеральная миграционная служба физика Филиппины Финляндия ФИФА фондовая биржа фоторепортаж Франсуа Олланд Франция ФСБ ФСИН ФСКН футбол Хабаровский край хакеры Харьков Хиллари Клинтон химическое оружие химия хоккей хулиганство цензура Центробанк ЦИК Цикл бесед "Взрослые люди" ЦРУ ЦСКА Челябинская область Чехия Чечня ЧМ-2018 шахты Швейцария Швеция школа шоу-бизнес шпионаж Эбола эволюция Эдвард Сноуден экология экономика экономический кризис экстремизм Эстония Южная Корея ЮКОС Юлия Тимошенко ядерное оружие Якутия Яндекс Япония

Редакция

Электронная почта: politru.edit1@gmail.com
Адрес: 129090, г. Москва, Проспект Мира, дом 19, стр.1, пом.1, ком.5
Телефон: +7 495 980 1894.
Яндекс.Метрика
Свидетельство о регистрации средства массовой информации
Эл. № 77-8425 от 1 декабря 2003г. Выдано министерством
Российской Федерации по делам печати, телерадиовещания и
средств массовой информации. Выходит с 21 февраля 1998 года.
При любом использовании материалов веб-сайта ссылка на Полит.ру обязательна.
При перепечатке в Интернете обязательна гиперссылка polit.ru.
Все права защищены и охраняются законом.
© Полит.ру, 1998–2014.