20 октября 2019, воскресенье, 00:58
VK.comFacebookTwitterTelegramInstagramYouTubeЯндекс.Дзен

НОВОСТИ

СТАТЬИ

PRO SCIENCE

МЕДЛЕННОЕ ЧТЕНИЕ

ЛЕКЦИИ

АВТОРЫ

Конференция «Диалог–2015»

Логотип конференции "Диалог-2015"
Логотип конференции "Диалог-2015"

В конце мая в Москве прошла уже 21-я по счету конференция по компьютерной лингвистике и интеллектуальным технологиям «Диалог». Конференция «Диалог 2015» прошла под патронажем Российского фонда фундаментальных исследований при организационной поддержке компании ABBYY. Ее учредителями были Институт лингвистики РГГУ, Институт проблем информатики РАН, Институт проблем передачи информации РАН, ABBYY, Yandeх и Филологический факультет МГУ. Мы кратко расскажем лишь о некоторых прозвучавших на конференции докладах.

Применению корпусной лингвистики для изучения сочетаемости слов, в том числе и изменений этой сочетаемости с течением времени, был посвящен доклад В. П. Захарова (СПбГУ). Изучение частотных сочетаний слов – давняя сфера лексической семантики. В 1960 году И. А. Мельчук сформулировал определение устойчивости сочетаний, которое определяется «вероятностью, с которой данный элемент предсказывает совместное появление остальных элементов сочетания». Фразеологические словари и словари сочетаемости слов, как правило, не содержат информации о сравнительной частотности тех или иных сочетаний, но современные технологии позволили лингвистам заполнить этот пробел.

Например, согласно «Словарю сочетаемости слов русского языка» аплодисменты могут быть: громкие, продолжительные, долго не смолкающие, несмолкаемые, бурные, дружные, одобрительные, горячие, восторженные, сдержанные, скупые, редкие и жидкие. Анализ языковых корпусов позволяет установить частоту каждого из вариантов. При этом есть возможность проследить изменения частоты в ходе истории. Выясняется, например, что во второй половине 1930-х годов аплодисменты чаще были бурными, а с конца 1970-х начинают лидировать продолжительные аплодисменты. Другой пример – сочетания типа буря (гром, шквал, взрыв) аплодисментов. Среди них с отрывом лидирует гром аплодисментов, на втором месте была буря, однако в 1980-х шквал аплодисментов обогнал бурю по частоте. Тут следует обратить внимание, что разные языковые корпуса дают разные результаты. В подкорпусах, где собраны тексты из социальных сетей «Живой журнал» и «В контакте» шквал аплодисментов уже вышел на первое место, обогнав даже гром. Также отличаются сравнительные частоты выражений перебиваться с хлеба на воду и перебиваться с хлеба на квас. В корпусе Google books чаще находится выражение перебиваться с хлеба на квас, тогда как в Генеральном интернет-корпусе русского языка (о нем рассказывалась в интервью одного из его создателей В. П. Селегея) напротив, почти в три раза чаще используется выражение перебиваться с хлеба на воду. Исследователь приходит к выводу, что это отражает разницу между книжным и спонтанным языком.

И. В. Яковлева (Ульяновский государственный университет) рассказала, как в различных языках в качестве глаголов речи выступают глаголы, обозначающие изначально действие, которое приводит к перемещению объекта по воздуху. В русском языке примерами могут послужить выражения бросить реплику или уронить язвительное замечание. Подобные глаголы можно разделить на несколько групп. Они могут обозначать воздействие на объект рукой, как контролируемое (бросить, кинуть), так и неконтролируемое (уронить, обронить). Другие глаголы подразумевают выделение объекта через отверстие (выплевывать, извергать), наконец третьи обозначают выделение вещества всей поверхностью (излучать, выделять). Возможность использовать глаголы из той или иной группы в значении глаголов речи различна в разных языках. В русском языке последняя из перечисленных групп для обозначения речи не употребляется, тогда как в иврите слово lifrot ‘выбрасывать, извергать, испускать, излучать’ может использоваться для этого. Также могут возникать дополнительные семантические ограничения, например, в русском языке глаголы изрыгать и извергать в этом качестве могут в качестве дополнений иметь только слова с негативным значением (проклятия, оскорбления).

Два доклада были посвящены исследованию характерного компонента частью языковой картины мира, так называемых «лингвоспецифичные слова». Их подготовили Анна Зализяк (Институт языкознания РАН) и Дмитрий Шмелев (МПГУ, Институт русского языка РАН). Как отмечено в докладе Анны Зализняк, множество лингвоспецифических слов неоднородно. К ним относятся, во-первых, случаи, когда одни и те же значения по-разному распределены между словами в разных языках. Например, два значения «животное масло» и «растительное масло» в русском языке вложены в одно слово масло, а во многих других распределены по разным словам (нгл. oil и butter, исп. aceite и mantequilla, франц. huile и beurre). Изучение таких случаев – одна из задач лексической типологии (подробнее с ней можно познакомиться в очерках «Лексическая типология: начало» и «Лексическая типология: руки и ноги»). Другой пример лингвоспецифических слов – это слова, у которых эквивалент в другом языке вовсе отсутствует, и в случаен необходимости приходится прибегать к заимствованию слова или использовать описательное определение. К таким словам относятся русский самовар, индийское сари, испанская паэлья и многие другие.

Наконец, основным объектом исследования стал третий тип лингвоспецифичных слов, у которых существует один или даже много вариантов перевода на другой язык, но все они недостаточно точны, так как не отражают определенные смысловые компоненты переводимого слова (в русском языке это слова тоска, удаль, душа, разлука и многие другие). Так как для этих слов не удается подобрать точный аналог в языке, на который осуществляется перевод, то для передачи части их смысла приходится использовать уточняющие слова или же этот смысл просто теряется при переводе. По мнению исследователей языковой картины мира, эти труднопереводимые смысловые компоненты обычно относятся к одной из «ключевых идей», или «сквозных мотивов»

Для изучения таких слов исследователи создали параллельный русско-французский корпус текстов, то есть корпус, содержащих пары текстов, один из которых является переводом второго. Также ими использовался параллельный англо-русский подкорпус, которых входит в состав «Национального корпуса русского языка». В результате получился своеобразный метод выявления лингвоспецифических слов. Выход из ситуации, который нашел переводчик в каждом конкретном случае, может быть источником сведений о значении слова. Наличие множества слов, реально используемых переводчиками для передачи одного слова и имеющих приблизительно равную частотность, можно считать сигналом лингвоспецифичности. Другими такими сигналами служат, например, неоднословные переводы или замена части речи при переводе. Доклад был проиллюстрирован анализом вариантов перевода русских текстов, содержащий слова собираться и разлука.

Изучение специфической интонации, которая присуща одесскому региональному варианту русского языка, был посвящен доклад Т. Е. Янко (Институт языкознания РАН). Для этой цели был собран «аудиокорпус»: записи рассказов одесситов о городе, анекдотов, кулинарных телепередач, интервью с одесситами. Обычно исследователи говорят об особой восходяще-нисходящей интонации, которая возникла в русском языке Одессы под влиянием языка идиш. Уточнить эти данные Т. Е. Янко и ее коллеги смогли при помощи эксперимента, в которой обеспечил сопоставление интонационных контуров одесского варианта и нормативного русского языка. Они записали, как носитель нормативного русского языка произносит те же тексты, которые в собранном ими материале произносили одесситы. Это позволило определить ряд более тонких отличий одесской интонации.

Обсудите в соцсетях

Система Orphus
«Ангара» Африка Византия Вселенная Гренландия ДНК Иерусалим КГИ Луна МГУ Марс Монголия НАСА РБК РВК РГГУ РадиоАстрон Роскосмос Роспатент Росприроднадзор Русал СМИ Сингапур Солнце Титан Юпитер акустика антибиотики античность археология архитектура астероиды астрофизика бактерии бедность библиотеки биомедицина биомеханика бионика биоразнообразие биотехнологии блогосфера викинги вирусы воспитание вулканология гаджеты генетика география геология геофизика геохимия гравитация грибы дельфины демография демократия дети динозавры животные здоровье землетрясение змеи зоопарк зрение изобретения иммунология импорт инновации интернет инфекции ислам исламизм исследования история карикатура картография католицизм кельты кибернетика киты климатология клонирование комета кометы компаративистика космос культура лазер лексика лженаука лингвистика льготы мамонты математика материаловедение медицина металлургия метеориты микробиология микроорганизмы мифология млекопитающие мозг моллюски музеи насекомые наука нацпроекты неандертальцы нейробиология неолит обезьяны общество онкология открытия палеолит палеонтология память папирусы паразиты перевод питание планетология погода политика право приматы психиатрия психоанализ психология психофизиология птицы ракета растения религиоведение рептилии робототехника рыбы сердце смертность собаки сон социология спутники старение старообрядцы стартапы статистика такси технологии тигры топливо торнадо транспорт ураган урбанистика фармакология физика физиология фольклор химия христианство цифровизация школа экология электрохимия эпидемии эпидемиология этология язык Александр Беглов Древний Египет Западная Африка Латинская Америка НПО «Энергомаш» Нобелевская премия РКК «Энергия» Российская империя Сергиев Посад альтернативная энергетика аутизм биология бозон Хиггса глобальное потепление грипп информационные технологии искусственный интеллект история искусства история цивилизаций исчезающие языки квантовая физика квантовые технологии климатические изменения компьютерная безопасность компьютерные технологии космический мусор криминалистика культурная антропология междисциплинарные исследования местное самоуправление мобильные приложения научный юмор облачные технологии обучение одаренные дети педагогика персональные данные подготовка космонавтов преподавание истории продолжительность жизни происхождение человека русский язык сланцевая революция физическая антропология финансовый рынок черные дыры эволюция эмбриональное развитие этнические конфликты ядерная физика Вольное историческое общество жизнь вне Земли естественные и точные науки НПО им.Лавочкина Центр им.Хруничева История человека. История институтов дело Baring Vostok Протон-М 3D Apple Big data Dragon Facebook Google GPS IBM MERS PRO SCIENCE видео ProScience Театр SpaceX Tesla Motors Wi-Fi

Редакция

Электронная почта: [email protected]
Телефон: +7 929 588 33 89
Яндекс.Метрика
Свидетельство о регистрации средства массовой информации
Эл. № 77-8425 от 1 декабря 2003 года. Выдано министерством
Российской Федерации по делам печати, телерадиовещания и
средств массовой информации. Выходит с 21 февраля 1998 года.
При любом использовании материалов веб-сайта ссылка на Полит.ру обязательна.
При перепечатке в Интернете обязательна гиперссылка polit.ru.
Все права защищены и охраняются законом.
© Полит.ру, 1998–2019.