Полiт.ua Государственная сеть Государственные люди Войти
26 июля 2016, вторник, 00:59
Facebook Twitter LiveJournal VK.com RSS

НОВОСТИ

СТАТЬИ

АВТОРЫ

ЛЕКЦИИ

PRO SCIENCE

ТЕАТР

РЕГИОНЫ

Конференция «Диалог–2015»

Логотип конференции "Диалог-2015"
Логотип конференции "Диалог-2015"

В конце мая в Москве прошла уже 21-я по счету конференция по компьютерной лингвистике и интеллектуальным технологиям «Диалог». Конференция «Диалог 2015» прошла под патронажем Российского фонда фундаментальных исследований при организационной поддержке компании ABBYY. Ее учредителями были Институт лингвистики РГГУ, Институт проблем информатики РАН, Институт проблем передачи информации РАН, ABBYY, Yandeх и Филологический факультет МГУ. Мы кратко расскажем лишь о некоторых прозвучавших на конференции докладах.

Применению корпусной лингвистики для изучения сочетаемости слов, в том числе и изменений этой сочетаемости с течением времени, был посвящен доклад В. П. Захарова (СПбГУ). Изучение частотных сочетаний слов – давняя сфера лексической семантики. В 1960 году И. А. Мельчук сформулировал определение устойчивости сочетаний, которое определяется «вероятностью, с которой данный элемент предсказывает совместное появление остальных элементов сочетания». Фразеологические словари и словари сочетаемости слов, как правило, не содержат информации о сравнительной частотности тех или иных сочетаний, но современные технологии позволили лингвистам заполнить этот пробел.

Например, согласно «Словарю сочетаемости слов русского языка» аплодисменты могут быть: громкие, продолжительные, долго не смолкающие, несмолкаемые, бурные, дружные, одобрительные, горячие, восторженные, сдержанные, скупые, редкие и жидкие. Анализ языковых корпусов позволяет установить частоту каждого из вариантов. При этом есть возможность проследить изменения частоты в ходе истории. Выясняется, например, что во второй половине 1930-х годов аплодисменты чаще были бурными, а с конца 1970-х начинают лидировать продолжительные аплодисменты. Другой пример – сочетания типа буря (гром, шквал, взрыв) аплодисментов. Среди них с отрывом лидирует гром аплодисментов, на втором месте была буря, однако в 1980-х шквал аплодисментов обогнал бурю по частоте. Тут следует обратить внимание, что разные языковые корпуса дают разные результаты. В подкорпусах, где собраны тексты из социальных сетей «Живой журнал» и «В контакте» шквал аплодисментов уже вышел на первое место, обогнав даже гром. Также отличаются сравнительные частоты выражений перебиваться с хлеба на воду и перебиваться с хлеба на квас. В корпусе Google books чаще находится выражение перебиваться с хлеба на квас, тогда как в Генеральном интернет-корпусе русского языка (о нем рассказывалась в интервью одного из его создателей В. П. Селегея) напротив, почти в три раза чаще используется выражение перебиваться с хлеба на воду. Исследователь приходит к выводу, что это отражает разницу между книжным и спонтанным языком.

И. В. Яковлева (Ульяновский государственный университет) рассказала, как в различных языках в качестве глаголов речи выступают глаголы, обозначающие изначально действие, которое приводит к перемещению объекта по воздуху. В русском языке примерами могут послужить выражения бросить реплику или уронить язвительное замечание. Подобные глаголы можно разделить на несколько групп. Они могут обозначать воздействие на объект рукой, как контролируемое (бросить, кинуть), так и неконтролируемое (уронить, обронить). Другие глаголы подразумевают выделение объекта через отверстие (выплевывать, извергать), наконец третьи обозначают выделение вещества всей поверхностью (излучать, выделять). Возможность использовать глаголы из той или иной группы в значении глаголов речи различна в разных языках. В русском языке последняя из перечисленных групп для обозначения речи не употребляется, тогда как в иврите слово lifrot ‘выбрасывать, извергать, испускать, излучать’ может использоваться для этого. Также могут возникать дополнительные семантические ограничения, например, в русском языке глаголы изрыгать и извергать в этом качестве могут в качестве дополнений иметь только слова с негативным значением (проклятия, оскорбления).

Два доклада были посвящены исследованию характерного компонента частью языковой картины мира, так называемых «лингвоспецифичные слова». Их подготовили Анна Зализяк (Институт языкознания РАН) и Дмитрий Шмелев (МПГУ, Институт русского языка РАН). Как отмечено в докладе Анны Зализняк, множество лингвоспецифических слов неоднородно. К ним относятся, во-первых, случаи, когда одни и те же значения по-разному распределены между словами в разных языках. Например, два значения «животное масло» и «растительное масло» в русском языке вложены в одно слово масло, а во многих других распределены по разным словам (нгл. oil и butter, исп. aceite и mantequilla, франц. huile и beurre). Изучение таких случаев – одна из задач лексической типологии (подробнее с ней можно познакомиться в очерках «Лексическая типология: начало» и «Лексическая типология: руки и ноги»). Другой пример лингвоспецифических слов – это слова, у которых эквивалент в другом языке вовсе отсутствует, и в случаен необходимости приходится прибегать к заимствованию слова или использовать описательное определение. К таким словам относятся русский самовар, индийское сари, испанская паэлья и многие другие.

Наконец, основным объектом исследования стал третий тип лингвоспецифичных слов, у которых существует один или даже много вариантов перевода на другой язык, но все они недостаточно точны, так как не отражают определенные смысловые компоненты переводимого слова (в русском языке это слова тоска, удаль, душа, разлука и многие другие). Так как для этих слов не удается подобрать точный аналог в языке, на который осуществляется перевод, то для передачи части их смысла приходится использовать уточняющие слова или же этот смысл просто теряется при переводе. По мнению исследователей языковой картины мира, эти труднопереводимые смысловые компоненты обычно относятся к одной из «ключевых идей», или «сквозных мотивов»

Для изучения таких слов исследователи создали параллельный русско-французский корпус текстов, то есть корпус, содержащих пары текстов, один из которых является переводом второго. Также ими использовался параллельный англо-русский подкорпус, которых входит в состав «Национального корпуса русского языка». В результате получился своеобразный метод выявления лингвоспецифических слов. Выход из ситуации, который нашел переводчик в каждом конкретном случае, может быть источником сведений о значении слова. Наличие множества слов, реально используемых переводчиками для передачи одного слова и имеющих приблизительно равную частотность, можно считать сигналом лингвоспецифичности. Другими такими сигналами служат, например, неоднословные переводы или замена части речи при переводе. Доклад был проиллюстрирован анализом вариантов перевода русских текстов, содержащий слова собираться и разлука.

Изучение специфической интонации, которая присуща одесскому региональному варианту русского языка, был посвящен доклад Т. Е. Янко (Институт языкознания РАН). Для этой цели был собран «аудиокорпус»: записи рассказов одесситов о городе, анекдотов, кулинарных телепередач, интервью с одесситами. Обычно исследователи говорят об особой восходяще-нисходящей интонации, которая возникла в русском языке Одессы под влиянием языка идиш. Уточнить эти данные Т. Е. Янко и ее коллеги смогли при помощи эксперимента, в которой обеспечил сопоставление интонационных контуров одесского варианта и нормативного русского языка. Они записали, как носитель нормативного русского языка произносит те же тексты, которые в собранном ими материале произносили одесситы. Это позволило определить ряд более тонких отличий одесской интонации.

Обсудите в соцсетях

Система Orphus
Подпишитесь
чтобы вовремя узнавать о новых спектаклях и других мероприятиях ProScience театра!
3D Apple Facebook Google GPS IBM iPhone PRO SCIENCE видео ProScience Театр Wi-Fi альтернативная энергетика «Ангара» античность археология архитектура астероиды астрофизика Байконур бактерии библиотека онлайн библиотеки биология биомедицина биомеханика бионика биоразнообразие биотехнологии блогосфера бозон Хиггса визуальная антропология вирусы Вольное историческое общество Вселенная вулканология Выбор редакции гаджеты генетика география геология глобальное потепление грибы грипп демография дети динозавры ДНК Древний Египет естественные и точные науки животные жизнь вне Земли Западная Африка защита диссертаций землетрясение зоопарк Иерусалим изобретения иммунология инновации интернет инфекции информационные технологии искусственный интеллект ислам историческая политика история история искусства история России история цивилизаций История человека. История институтов исчезающие языки карикатура католицизм квантовая физика квантовые технологии КГИ киты климатология комета кометы компаративистика компьютерная безопасность компьютерные технологии коронавирус космос криминалистика культура культурная антропология лазер Латинская Америка лженаука лингвистика Луна мамонты Марс математика материаловедение МГУ медицина междисциплинарные исследования местное самоуправление метеориты микробиология Минобрнауки мифология млекопитающие мобильные приложения мозг Монголия музеи НАСА насекомые неандертальцы нейробиология неолит Нобелевская премия НПО им.Лавочкина обезьяны обучение общество О.Г.И. открытия палеолит палеонтология память педагогика планетология погода подготовка космонавтов популяризация науки право преподавание истории происхождение человека Протон-М психология психофизиология птицы ракета растения РБК РВК регионоведение религиоведение рептилии РКК «Энергия» робототехника Роскосмос Роспатент русский язык рыбы Сингапур смертность Солнце сон социология спутники старообрядцы стартапы статистика технологии тигры торнадо транспорт ураган урбанистика фармакология Фестиваль публичных лекций физика физиология физическая антропология фольклор химия христианство Центр им.Хруничева школа эволюция эволюция человека экология эпидемии этнические конфликты этология ядерная физика язык

Редакция

Электронная почта: politru.edit1@gmail.com
Адрес: 129343, Москва, проезд Серебрякова, д.2, корп.1, 9 этаж.
Телефоны: +7 495 980 1893, +7 495 980 1894.
Стоимость услуг Полит.ру
Свидетельство о регистрации средства массовой информации
Эл. № 77-8425 от 1 декабря 2003г. Выдано министерством
Российской Федерации по делам печати, телерадиовещания и
средств массовой информации. Выходит с 21 февраля 1998 года.
При любом использовании материалов веб-сайта ссылка на Полит.ру обязательна.
При перепечатке в Интернете обязательна гиперссылка polit.ru.
Все права защищены и охраняются законом.
© Полит.ру, 1998–2014.