Полiт.ua Государственная сеть Государственные люди Войти
15 декабря 2017, пятница, 11:36
Facebook Twitter LiveJournal VK.com RSS

НОВОСТИ

СТАТЬИ

АВТОРЫ

ЛЕКЦИИ

PRO SCIENCE

СКОЛКОВО

РЕГИОНЫ

Машинный перевод против второклассников

Каждый год в середине ноября статистику поисковых систем заполняет словосочетание «Русский медвежонок». Так называется конкурс для школьников по русскому языку и лингвистике, который в 2000 году по образцу международного конкурса по математике «Кенгуру» придумали математик из Кирова Игорь Рубанов и лингвист из Москвы Елена Муравенко. Конкурс с тех пор стал очень популярным — в нём ежегодно участвуют больше двух миллионов школьников в России и других странах. Победа в «Медвежонке», в отличие от школьных олимпиад, не даёт никаких льгот или привилегий. Единственная цель конкурса — показать детям, что за скучным предметом «русский язык» может скрываться интересная деятельность: от решения головоломок или внезапного обнаружения древнего родства внешне непохожих слов до открытия языковых законов, которые изучает наука лингвистика.

Например, в этом году восьмиклассники получили возможность за две минуты немного разобраться в грамматике итальянского языка и обнаружить неточность в переводе названия оперы Моцарта:

Даны несколько слов и словосочетаний на итальянском языке и их перевод на русский: tutto ‘весь’, belli ragazzi ‘красивые юноши’, belle ragazze ‘красивые девушки’, famosi poeti ‘знаменитые поэты’, famose italiane ‘знаменитые итальянки’. Название оперы Вольфганга Амадея Моцарта “Сosì fan tutte” буквально переводится на русский язык «Так поступают все», однако для более точной передачи смысла обычно добавляют ещё одно слово. Какое?

(А) люди; (Б) мужчины; (В) музыканты; (Г) итальянцы; (Д) женщины.

 (автор задачи — Пётр Аркадьев)

 А четвероклассники смогли открыть для себя риторические вопросы и задуматься о функциях знаков препинания:

 В XVI веке один английский издатель предложил для некоторых предложений использовать особый знак. Из пяти данных ниже вопросов учителей он подошёл бы к четырём. Определив его предназначение, выберите, для какого вопроса этот знак не подходит.

(А) А голову ты дома не забыл

(Б) Оценку вам тоже одну на двоих ставить

(В) Уроки за тебя делать Пушкин будет

(Г) Ты сделал домашнее задание

(Д) Третья парта, я вам не мешаю разговаривать

(автор задачи — Борис Иомдин)

Участник конкурса получает три десятка задач с выбором ответа (разных для разных классов), которые надо решить за два школьных урока. Конечно, предполагается, что школьники решают задачи самостоятельно. Но некоторым кажется, что вернее будет подсмотреть ответ в интернете. Вот и получается, что в день проведения конкурса запросы вроде «ответы к русскому медвежонку» выходят в топ поисковых систем.

Самым младшим участникам «Русского медвежонка» — ученикам 2-го и 3-го классов — в этом году была дана такая задача:

Вот несколько болгарских слов и их переводы на русский язык: вълк — волк, конче — жеребёнок, патка — утка, петел — петух, прасе — поросёнок, пиле — цыплёнок. Как по-болгарски будет «Русский медвежонок»?

(А) Руски медвежонок; (Б) Руско мече; (В) Руски мечок; (Г) Руски мишка; (Д) Руска мишка.

(автор задачи — Борис Иомдин)

В «Медвежонке» каждый год бывает несколько задач, посвященных не русскому, а другим языкам: в этом году, кроме итальянского и болгарского, это польский и готский. И каждый год возмущенные родители школьников пишут письма организаторам и изливают гнев на форумах:

«Почему мой сын второклассник должен знать польский или болгарский язык?»

«Почему на конкурсе ПО РУССКОМУ языку надо ПЕРЕВОДИТЬ иностранные слова? Где логика?»

«Вот проблема-то и в том как раз — олимпиада-то по РУССКОМУ языку, а не по логике. В наше время на олимпиадах по РУССКОМУ языку были совсем другие задания, не подвластные логике, а лишь только знанию правил и исключений русского языка»

 «Ну пипец, помимо русского еще польский и болгарский надо знать чтобы правильно ответить»

 «Вопрос-при чем тут польский и болгарский язык и зачем забивать этим и так прилично не по годам забитые детские головы? Когда будут "млеко, яйки, шнеле"?»

 «Хотелось бы спросить Вас всех ,кто занимается составлением задач, для чего ученикам второго класса нужны столь сомнительные задачи, на которые можно ответить только "методом тыка"»

 «Я просто понять не могу каким это все боком к русскому языку относится? Ну назвали бы тогда олимпиаду по логике или смекалке или еще как»

Многие уверены: русский язык — это не про логику, а про словарные слова, безударные гласные и запятые. А если задание школьного конкурса почему-то выходит за пределы орфографии и пунктуации, то это всё козни злонамеренных организаторов.

«Русский медвежонок» — не экзамен на знание русского или иностранных языков, а конкурс-игра с подзаголовком «Языкознание для всех». Его цель — заинтересовать школьников русским языком и лингвистикой, показать, чем похожи и чем различаются языки мира, продемонстрировать, что и второклассник может обнаружить языковую закономерность и даже перевести слова на язык, которого он не знает. Для решения задачи на болгарский язык совсем не требуется его знать — нужно лишь понимать, что русские слова жеребёнок, поросёнок, цыплёнок и медвежонок называют детёнышей животных, и увидеть, что по-болгарски все они заканчиваются одинаково (как и по-русски). Многие второклассники с этим справились.

Те, кто решил на собственную логику не рассчитывать, а поискать ответ в интернете, столкнулись с неожиданными проблемами. Современный пользователь интернета твёрдо знает: если попался текст на иностранном языке, можно легко перевести его в интернет-переводчике. Машинный перевод сейчас действительно очень активно развивается (в частности благодаря усилиям лингвистов — а многие из них в детстве успешно участвовали в лингвистических олимпиадах и конкурсах). Но всё же до сих пор онлайн-переводчики часто дают неверные или неточные результаты. Это происходит, в частности, потому, что современный машинный перевод обычно основан на статистических данных интернета, а не на анализе лексики и грамматики. А некоторые родители школьников уверены: авторы задач «Русского медвежонка» сами в языках ни бельмеса, а туда же, экзаменовать школьников.

 «Если не знаешь болгарского языка, то надежда только на переводчик, хотя как раз тут возникли небольшие трудности. Детям на конкурсе точно придётся не легко».

 «Ни один переводчик русско-болгарский не выдаёт перевод, который был бы у вас представлен в ваших вариантах ответов. Похоже, но не так. Сами, видимо, не знали и написали, как думали, примерно! Уж если вы решили использовать задание, которое может знать только тот, кто знает болгарский, и додуматься тут тоже невозможно, то хоть проявляйте больше ответственности и точности!»

 «Ни один переводчик в интернете (их там множество) не выдает точно такого перевода, как представлено у вас в ответах. То есть даже с переводчиком точно определить между вариантом Б и В не представляется возможным. Это неправильно. Обратите на это внимание составителей теста».

Словосочетание «русский медвежонок» по-русски встречается в интернете очень часто (в основном благодаря названию конкурса), а по-болгарски — редко. Вот статистических данных и не хватает, чтобы перевести это словосочетание автоматически, не обращаясь к данным русско-болгарского словаря (где даны переводы слов) и болгарской грамматики (где, в частности, указано, как по-болгарски согласуется прилагательное с существительным). Поэтому некоторые интернет-переводчики в качестве перевода русского словосочетания русский медвежонок на болгарский язык выдают словосочетания руски мечета и руската мечка. Но первое из них означает ‘русские медвежата’ (во множественном, а не в единственном числе), а второе — ‘русский медведь’ (взрослый медведь, а не детёныш), с определённым артиклем. Существует по-болгарски и словосочетание руски мечок, данное в ответе (В) — те, кто не решал задачу сам, а искал ответ в интернете, его и выбрали. Однако оно означает не ‘русский медвежонок’, а ‘русский самец медведя’. Дело в том, что по-болгарски нейтральным названием медведя является слово женского рода мечка, а не слово мужского рода мечок (примерно так же, как нейтральным названием лисы по-русски является слово женского рода лиса, а не слово мужского рода лис). Слово же мече означает ‘медвежонок’ (детёныш медведя) или ‘мишка’ (маленький или игрушечный медведь). Слово мишка, кстати, по-болгарски тоже существует, но означает ‘мышь’.

Всё это легко увидеть в словарях. Но русско-болгарский словарь в интернете найти гораздо сложнее, чем онлайн-переводчик. На это и рассчитывали составители конкурса: хочется, чтобы в нём выигрывали честные школьники, которые решают задачи сами, а не слушают подсказки или подсматривают ответы в интернете.

Многие почему-то уверены: в школьном конкурсе не могут проверять сообразительность — только знания, а логика и лингвистика никак не связаны.

 «Медвежонок — мече, а логики никакой. Вы хотели ее увидеть в "медвежонке"? Но ее и не было никогда».

 Хорошо, что второклассники об этом не знают — они могли ещё ничего не слышать ни о лингвистике, ни о логике, а задачи каждый год решают с успехом. Один школьник в своё время победил в «Русском медвежонке» и так заинтересовался лингвистикой, что недавно получил премию «Просветитель» за книгу об искусственных языках. Кстати, на эсперанто интернет-переводчики уже научились переводить, но как сказать «Русский медвежонок», тоже пока не знают. А вы узнаете, если решите задачу, составленную специально для этой заметки:

Вот несколько слов на языке эсперанто и их переводы на русский язык: alkino — лосиха, anaso — утка, kokido — цыплёнок, porkido — поросёнок, ursino — медведица, virkoko — петух. Как на эсперанто будет «Русский медвежонок»?

(А) Rusa ursa; (Б) Rusa urso; (В) Ruso urso; (Г) Ruso urkido; (Д) Rusa ursido.

Обсудите в соцсетях

Система Orphus
Loading...
Подпишитесь
чтобы вовремя узнавать о новых спектаклях и других мероприятиях ProScience театра!
3D Apple Big data Dragon Facebook Google GPS IBM iPhone MERS PRO SCIENCE видео ProScience Театр SpaceX Tesla Motors Wi-Fi Адыгея Александр Лавров альтернативная энергетика Анастасия Волочкова «Ангара» антибиотики античность археология архитектура астероиды астрофизика аутизм Байконур бактерии бедность библиотека онлайн библиотеки биология биомедицина биомеханика бионика биоразнообразие биотехнологии блогосфера бозон Хиггса британское кино Византия визуальная антропология викинги вирусы Вольное историческое общество Вселенная вулканология Выбор редакции гаджеты генетика география геология геофизика глобальное потепление грибы грипп дельфины демография дети динозавры Дмитрий Страшнов ДНК Древний Египет естественные и точные науки животные жизнь вне Земли Западная Африка защита диссертаций землетрясение змеи зоопарк зрение Иерусалим изобретения иммунология инновации интернет инфекции информационные технологии искусственный интеллект ислам историческая политика история история искусства история России история цивилизаций История человека. История институтов исчезающие языки карикатура католицизм квантовая физика квантовые технологии КГИ киты климатология комета кометы компаративистика компьютерная безопасность компьютерные технологии космический мусор космос криминалистика культура культурная антропология лазер Латинская Америка лексика лженаука лингвистика Луна мамонты Марс математика материаловедение МГУ медицина междисциплинарные исследования местное самоуправление метеориты микробиология Минобрнауки мифология млекопитающие мобильные приложения мозг моллюски Монголия музеи НАСА насекомые неандертальцы нейробиология неолит Нобелевская премия НПО им.Лавочкина обезьяны обучение общество О.Г.И. онкология открытия палеолит палеонтология память папирусы паразиты педагогика планетология погода подготовка космонавтов популяризация науки право преподавание истории продолжительность жизни происхождение человека Протон-М психоанализ психология психофизиология птицы РадиоАстрон ракета растения РБК РВК РГГУ регионоведение религиоведение рептилии РКК «Энергия» робототехника Роскосмос Роспатент русский язык рыбы сердце сериалы Сингапур сланцевая революция смертность СМИ Солнце сон социология спутники старение старообрядцы стартапы статистика такси технологии тигры торнадо транспорт ураган урбанистика фармакология Фестиваль публичных лекций физика физиология физическая антропология финансовый рынок фольклор химия христианство Центр им.Хруничева школа школьные олимпиады эволюция эволюция человека экология эмбриональное развитие эпидемии этика этнические конфликты этология Юпитер ядерная физика язык

Редакция

Электронная почта: politru.edit1@gmail.com
Адрес: 129090, г. Москва, Проспект Мира, дом 19, стр.1, пом.1, ком.5
Телефон: +7 495 980 1894.
Яндекс.Метрика
Свидетельство о регистрации средства массовой информации
Эл. № 77-8425 от 1 декабря 2003г. Выдано министерством
Российской Федерации по делам печати, телерадиовещания и
средств массовой информации. Выходит с 21 февраля 1998 года.
При любом использовании материалов веб-сайта ссылка на Полит.ру обязательна.
При перепечатке в Интернете обязательна гиперссылка polit.ru.
Все права защищены и охраняются законом.
© Полит.ру, 1998–2014.