будущее есть!
  • После
  • Конспект
  • Документ недели
  • Бутовский полигон
  • Колонки
  • Pro Science
  • Все рубрики
    После Конспект Документ недели Бутовский полигон Колонки Pro Science Публичные лекции Медленное чтение Кино Афиша
После Конспект Документ недели Бутовский полигон Колонки Pro Science Публичные лекции Медленное чтение Кино Афиша

Конспекты Полит.ру

Смотреть все
Алексей Макаркин — о выборах 1996 года
Апрель 26, 2024
Николай Эппле — о речи Пашиняна по случаю годовщины геноцида армян
Апрель 26, 2024
«Демография упала» — о демографической политике в России
Апрель 26, 2024
Артем Соколов — о технологическом будущем в военных действиях
Апрель 26, 2024
Анатолий Несмиян — о технологическом будущем в военных действиях
Апрель 26, 2024

После

Смотреть все
«После» для майских
Май 7, 2024

Публичные лекции

Смотреть все
Всеволод Емелин в «Клубе»: мои первые книжки
Апрель 29, 2024
Вернуться к публикациям
лингвистика
Июль 1, 2025
Pro Science
Иомдин Борис

Машинный перевод против второклассников

Машинный перевод против второклассников
ps_1424724577_Rus-Med-23-02-15
. Источник: rm.kirov.ru

Каждый год в середине ноября статистику поисковых систем заполняет словосочетание «Русский медвежонок». Так называется конкурс для школьников по русскому языку и лингвистике, который в 2000 году по образцу международного конкурса по математике «Кенгуру» придумали математик из Кирова Игорь Рубанов и лингвист из Москвы Елена Муравенко. Конкурс с тех пор стал очень популярным — в нём ежегодно участвуют больше двух миллионов школьников в России и других странах. Победа в «Медвежонке», в отличие от школьных олимпиад, не даёт никаких льгот или привилегий. Единственная цель конкурса — показать детям, что за скучным предметом «русский язык» может скрываться интересная деятельность: от решения головоломок или внезапного обнаружения древнего родства внешне непохожих слов до открытия языковых законов, которые изучает наука лингвистика.

Например, в этом году восьмиклассники получили возможность за две минуты немного разобраться в грамматике итальянского языка и обнаружить неточность в переводе названия оперы Моцарта:

Даны несколько слов и словосочетаний на итальянском языке и их перевод на русский: tutto ‘весь’, belli ragazzi ‘красивые юноши’, belle ragazze ‘красивые девушки’, famosi poeti ‘знаменитые поэты’, famose italiane ‘знаменитые итальянки’. Название оперы Вольфганга Амадея Моцарта “Сosì fan tutte” буквально переводится на русский язык «Так поступают все», однако для более точной передачи смысла обычно добавляют ещё одно слово. Какое?

(А) люди; (Б) мужчины; (В) музыканты; (Г) итальянцы; (Д) женщины.

 (автор задачи — Пётр Аркадьев)

 А четвероклассники смогли открыть для себя риторические вопросы и задуматься о функциях знаков препинания:

 В XVI веке один английский издатель предложил для некоторых предложений использовать особый знак. Из пяти данных ниже вопросов учителей он подошёл бы к четырём. Определив его предназначение, выберите, для какого вопроса этот знак не подходит.

(А) А голову ты дома не забыл⸮

(Б) Оценку вам тоже одну на двоих ставить⸮

(В) Уроки за тебя делать Пушкин будет⸮

(Г) Ты сделал домашнее задание⸮

(Д) Третья парта, я вам не мешаю разговаривать⸮

(автор задачи — Борис Иомдин)

Участник конкурса получает три десятка задач с выбором ответа (разных для разных классов), которые надо решить за два школьных урока. Конечно, предполагается, что школьники решают задачи самостоятельно. Но некоторым кажется, что вернее будет подсмотреть ответ в интернете. Вот и получается, что в день проведения конкурса запросы вроде «ответы к русскому медвежонку» выходят в топ поисковых систем.

Самым младшим участникам «Русского медвежонка» — ученикам 2-го и 3-го классов — в этом году была дана такая задача:

Вот несколько болгарских слов и их переводы на русский язык: вълк — волк, конче — жеребёнок, патка — утка, петел — петух, прасе — поросёнок, пиле — цыплёнок. Как по-болгарски будет «Русский медвежонок»?

(А) Руски медвежонок; (Б) Руско мече; (В) Руски мечок; (Г) Руски мишка; (Д) Руска мишка.

(автор задачи — Борис Иомдин)

В «Медвежонке» каждый год бывает несколько задач, посвященных не русскому, а другим языкам: в этом году, кроме итальянского и болгарского, это польский и готский. И каждый год возмущенные родители школьников пишут письма организаторам и изливают гнев на форумах:

«Почему мой сын второклассник должен знать польский или болгарский язык?»

«Почему на конкурсе ПО РУССКОМУ языку надо ПЕРЕВОДИТЬ иностранные слова? Где логика?»

«Вот проблема-то и в том как раз — олимпиада-то по РУССКОМУ языку, а не по логике. В наше время на олимпиадах по РУССКОМУ языку были совсем другие задания, не подвластные логике, а лишь только знанию правил и исключений русского языка»

 «Ну пипец, помимо русского еще польский и болгарский надо знать чтобы правильно ответить»

 «Вопрос-при чем тут польский и болгарский язык и зачем забивать этим и так прилично не по годам забитые детские головы? Когда будут "млеко, яйки, шнеле"?»

 «Хотелось бы спросить Вас всех ,кто занимается составлением задач, для чего ученикам второго класса нужны столь сомнительные задачи, на которые можно ответить только "методом тыка"»

 «Я просто понять не могу каким это все боком к русскому языку относится? Ну назвали бы тогда олимпиаду по логике или смекалке или еще как»

Многие уверены: русский язык — это не про логику, а про словарные слова, безударные гласные и запятые. А если задание школьного конкурса почему-то выходит за пределы орфографии и пунктуации, то это всё козни злонамеренных организаторов.

«Русский медвежонок» — не экзамен на знание русского или иностранных языков, а конкурс-игра с подзаголовком «Языкознание для всех». Его цель — заинтересовать школьников русским языком и лингвистикой, показать, чем похожи и чем различаются языки мира, продемонстрировать, что и второклассник может обнаружить языковую закономерность и даже перевести слова на язык, которого он не знает. Для решения задачи на болгарский язык совсем не требуется его знать — нужно лишь понимать, что русские слова жеребёнок, поросёнок, цыплёнок и медвежонок называют детёнышей животных, и увидеть, что по-болгарски все они заканчиваются одинаково (как и по-русски). Многие второклассники с этим справились.

Те, кто решил на собственную логику не рассчитывать, а поискать ответ в интернете, столкнулись с неожиданными проблемами. Современный пользователь интернета твёрдо знает: если попался текст на иностранном языке, можно легко перевести его в интернет-переводчике. Машинный перевод сейчас действительно очень активно развивается (в частности благодаря усилиям лингвистов — а многие из них в детстве успешно участвовали в лингвистических олимпиадах и конкурсах). Но всё же до сих пор онлайн-переводчики часто дают неверные или неточные результаты. Это происходит, в частности, потому, что современный машинный перевод обычно основан на статистических данных интернета, а не на анализе лексики и грамматики. А некоторые родители школьников уверены: авторы задач «Русского медвежонка» сами в языках ни бельмеса, а туда же, экзаменовать школьников.

 «Если не знаешь болгарского языка, то надежда только на переводчик, хотя как раз тут возникли небольшие трудности. Детям на конкурсе точно придётся не легко».

 «Ни один переводчик русско-болгарский не выдаёт перевод, который был бы у вас представлен в ваших вариантах ответов. Похоже, но не так. Сами, видимо, не знали и написали, как думали, примерно! Уж если вы решили использовать задание, которое может знать только тот, кто знает болгарский, и додуматься тут тоже невозможно, то хоть проявляйте больше ответственности и точности!»

 «Ни один переводчик в интернете (их там множество) не выдает точно такого перевода, как представлено у вас в ответах. То есть даже с переводчиком точно определить между вариантом Б и В не представляется возможным. Это неправильно. Обратите на это внимание составителей теста».

Словосочетание «русский медвежонок» по-русски встречается в интернете очень часто (в основном благодаря названию конкурса), а по-болгарски — редко. Вот статистических данных и не хватает, чтобы перевести это словосочетание автоматически, не обращаясь к данным русско-болгарского словаря (где даны переводы слов) и болгарской грамматики (где, в частности, указано, как по-болгарски согласуется прилагательное с существительным). Поэтому некоторые интернет-переводчики в качестве перевода русского словосочетания русский медвежонок на болгарский язык выдают словосочетания руски мечета и руската мечка. Но первое из них означает ‘русские медвежата’ (во множественном, а не в единственном числе), а второе — ‘русский медведь’ (взрослый медведь, а не детёныш), с определённым артиклем. Существует по-болгарски и словосочетание руски мечок, данное в ответе (В) — те, кто не решал задачу сам, а искал ответ в интернете, его и выбрали. Однако оно означает не ‘русский медвежонок’, а ‘русский самец медведя’. Дело в том, что по-болгарски нейтральным названием медведя является слово женского рода мечка, а не слово мужского рода мечок (примерно так же, как нейтральным названием лисы по-русски является слово женского рода лиса, а не слово мужского рода лис). Слово же мече означает ‘медвежонок’ (детёныш медведя) или ‘мишка’ (маленький или игрушечный медведь). Слово мишка, кстати, по-болгарски тоже существует, но означает ‘мышь’.

Всё это легко увидеть в словарях. Но русско-болгарский словарь в интернете найти гораздо сложнее, чем онлайн-переводчик. На это и рассчитывали составители конкурса: хочется, чтобы в нём выигрывали честные школьники, которые решают задачи сами, а не слушают подсказки или подсматривают ответы в интернете.

Многие почему-то уверены: в школьном конкурсе не могут проверять сообразительность — только знания, а логика и лингвистика никак не связаны.

 «Медвежонок — мече, а логики никакой. Вы хотели ее увидеть в "медвежонке"? Но ее и не было никогда».

 Хорошо, что второклассники об этом не знают — они могли ещё ничего не слышать ни о лингвистике, ни о логике, а задачи каждый год решают с успехом. Один школьник в своё время победил в «Русском медвежонке» и так заинтересовался лингвистикой, что недавно получил премию «Просветитель» за книгу об искусственных языках. Кстати, на эсперанто интернет-переводчики уже научились переводить, но как сказать «Русский медвежонок», тоже пока не знают. А вы узнаете, если решите задачу, составленную специально для этой заметки:

Вот несколько слов на языке эсперанто и их переводы на русский язык: alkino — лосиха, anaso — утка, kokido — цыплёнок, porkido — поросёнок, ursino — медведица, virkoko — петух. Как на эсперанто будет «Русский медвежонок»?

(А) Rusa ursa; (Б) Rusa urso; (В) Ruso urso; (Г) Ruso urkido; (Д) Rusa ursido.

Иомдин Борис
читайте также
Pro Science
Эксперименты империи. Адат, шариат и производство знаний в Казахской степи
Май 15, 2024
Pro Science
Раскопки в Телль Ваджеф
Май 15, 2024
ЗАГРУЗИТЬ ЕЩЕ

Бутовский полигон

Смотреть все
Начальник жандармов
Май 6, 2024

Человек дня

Смотреть все
Человек дня: Александр Белявский
Май 6, 2024
Публичные лекции

Лев Рубинштейн в «Клубе»

Pro Science

Мальчики поют для девочек

Колонки

«Год рождения»: обыкновенное чудо

Публичные лекции

Игорь Шумов в «Клубе»: миграция и литература

Pro Science

Инфракрасные полярные сияния на Уране

Страна

«Россия – административно-территориальный монстр» — лекция географа Бориса Родомана

Страна

Сколько субъектов нужно Федерации? Статья Бориса Родомана

Pro Science

Эксперименты империи. Адат, шариат и производство знаний в Казахской степи

О проекте Авторы Биографии
Свидетельство о регистрации средства массовой информации Эл. № 77-8425 от 1 декабря 2003 года. Выдано министерством Российской Федерации по делам печати, телерадиовещания и средств массовой информации.

© Полит.ру, 1998–2024.

Политика конфиденциальности
Политика в отношении обработки персональных данных ООО «ПОЛИТ.РУ»

В соответствии с подпунктом 2 статьи 3 Федерального закона от 27 июля 2006 г. № 152-ФЗ «О персональных данных» ООО «ПОЛИТ.РУ» является оператором, т.е. юридическим лицом, самостоятельно организующим и (или) осуществляющим обработку персональных данных, а также определяющим цели обработки персональных данных, состав персональных данных, подлежащих обработке, действия (операции), совершаемые с персональными данными.

ООО «ПОЛИТ.РУ» осуществляет обработку персональных данных и использование cookie-файлов посетителей сайта https://polit.ru/

Мы обеспечиваем конфиденциальность персональных данных и применяем все необходимые организационные и технические меры по их защите.

Мы осуществляем обработку персональных данных с использованием средств автоматизации и без их использования, выполняя требования к автоматизированной и неавтоматизированной обработке персональных данных, предусмотренные Федеральным законом от 27 июля 2006 г. № 152-ФЗ «О персональных данных» и принятыми в соответствии с ним нормативными правовыми актами.

ООО «ПОЛИТ.РУ» не раскрывает третьим лицам и не распространяет персональные данные без согласия субъекта персональных данных (если иное не предусмотрено федеральным законом РФ).