будущее есть!
  • После
  • Конспект
  • Документ недели
  • Бутовский полигон
  • Колонки
  • Pro Science
  • Все рубрики
    После Конспект Документ недели Бутовский полигон Колонки Pro Science Публичные лекции Медленное чтение Кино Афиша
После Конспект Документ недели Бутовский полигон Колонки Pro Science Публичные лекции Медленное чтение Кино Афиша

Конспекты Полит.ру

Смотреть все
Алексей Макаркин — о выборах 1996 года
Апрель 26, 2024
Николай Эппле — о речи Пашиняна по случаю годовщины геноцида армян
Апрель 26, 2024
«Демография упала» — о демографической политике в России
Апрель 26, 2024
Артем Соколов — о технологическом будущем в военных действиях
Апрель 26, 2024
Анатолий Несмиян — о технологическом будущем в военных действиях
Апрель 26, 2024

После

Смотреть все
«После» для майских
Май 7, 2024

Публичные лекции

Смотреть все
Всеволод Емелин в «Клубе»: мои первые книжки
Апрель 29, 2024
Вернуться к публикациям
лингвистика компьютерная лингвистика
Июнь 19, 2016
Pro Science
Руссо Максим

Конференция «Диалог 2016»

Конференция «Диалог 2016»
7435e_Dialogue_LogoTextEn_RGB
Логотип конференции «Диалог 2016»

1 – 4 июня в Москве прошла 22-я международная конференция «Диалог 2016», посвященная компьютерной лингвистике и интеллектуальным технологиям. Доклады ее участников освещали различные проблемы описания естественного языка, компьютерного моделирования языковых процессов, создания практически применимых компьютерных лингвистических технологий. Конференция организуется компаниями ABBYY и Yandeх, Институтом лингвистики РГГУ, Институтом проблем информатики РАН, Институтом проблем передачи информации РАН и Филологическим факультетом МГУ

Традиционно на конференции также подводятся итоги соревнований различных автоматических алгоритмов анализа русских текстов (Dialogue Evaluation). «Соревнования» компьютерных программ продолжаются в течение года, а на «Диалоге» специалисты оценивают их результаты. На этот раз в рамках Dialogue Evaluation прошло тестирование программ, анализирующих тональность текста, систем автоматического исправления опечаток и методов автоматического извлечения фактов.

На общих заседаниях конференции выступили трое специально приглашенных докладчиков. Доклад Алессандро Москитти (Alessandro Moschitti, Катарский вычислительный исследовательский институт, Университет Хамад бин Халифа) был посвящен применению искусственных нейронных сетей с глубинным обучением для решения задач автоматической обработки естественного языка. В последние годы в связи с большим прогрессом, достигнутым в области машинного обучения нейронные сети всё больше используются и в лингвистических приложениях, например, для распознавания речи, категоризации документов, машинного перевода. Но, как отметил Москитти, сложные задачи семантического анализа требуют новых решений в области нейронных сетей. По его оценке, успехи сетей в таких задачах, как извлечение из текста имплицитной информации, идентификация перефразированных предложений, создание вопросно-ответных автоматических систем, пока сравнительно невелики. В качестве примера современной системы автоматического анализа текстов Москитти привел алгоритм работы суперкомпьютера Watson компании IBM, оснащенного системой искусственного интеллекта, которая обучена понимать вопросы на английском языке и искать на них ответы. Часть доклада была посвящена применению ядерных методов распознавания (kernel methods) в лингвистических задачах.

Бонни Веббер (Bonnie Webber, Эдинбургский университет) рассказала о работе над Penn Discourse Treebank 2.0 (PDTB2), созданным в 2008 году крупнейшим в мире аннотированным текстовым корпусом. Сейчас его разработчики создают новую версию корпуса (PDTB3), которая будет снабжена системой меток, указывающих на семантические отношения между предложениями (последовательность, условие, отрицание), в том числе такие отношения, которые связывают предложения из разных абзацев текста. В докладе Марка Стидмана (Mark Steedman, Эдинбургский университет) речь шла о моделировании семантики текстов системами автоматического анализа. Он отметил, что по сравнению с уже довольно хорошо разработанными формальными моделями служебных слов и логических операторов понимание компьютерными системами значений слов и предложений всё еще затруднено, хотя именно их значения составляют основное содержание текста.

Отдельная секция конференции «Диалог 2016» была посвящена проблемам лексической семантики русского языка. В докладе Валентины Апресян (Институт русского языка РАН, НИУ ВШЭ) рассматривались тонкие различия в семантике и сочетаемости синонимичных глаголов пропасть и исчезнуть. Анализировались также другие глаголы или выражения с общим значением ‘прекращение существования’ и выявлялись факторы, влияющие на их употребление, а также другие значения, которые могут регулярно возникать у подобных глаголов. Например, у многих таких глаголов имеются значения не только ‘перестать существовать’, но и ‘переместиться’, и ‘перестать быть видимым’. У некоторых глаголов значение ‘переместиться’ является исходным, а значение ‘прекращение существования’ – производным (например, у глаголов пройти и уйти). На выбор одного из близких по значению глаголов влияет ряд параметров. Один из них – тип исчезающего объекта: живой организм, ресурс, состояние и другие. При этом, например, в применении к живым организмам исчезнуть может обозначать только прекращение существования вида, а не отдельного организма и, соответственно, употребляется только с родовыми субъектами: Динозавры исчезли в конце мелового периода, возможно, под воздействием похолодания, но не *Наши лошади исчезли из-за болезни. Выражение Наши лошади исчезли, будет означать только кражу или побег лошадей, но не их гибель. По признаку причины прекращения существования глаголы делятся на следующие группы: те, для которых причина обязательна (кончиться, иссякнуть); те, у которых причины чаще нет (пропасть, улетучиться, испариться) и остальные, для которых причина в разной степени возможна, но не обязательна. Глагол исчезнуть часто указывает на внешнее воздействие или целенаправленное усилие как фактор, приводящий к прекращению существования объекта, хотя можно и таинственно/загадочно исчезнуть. Глагол пропасть часто указывает на беспричинное, с точки зрения говорящего, прекращение существования и на нарушение его ожиданий. Контролируемое целенаправленное усилие в качестве причины пропасть невозможно: *От многочисленных фонетических упражнений его акцент наконец пропал. Другими важными параметрами оказываются скорость и степень прекращения существование и наличие наблюдателя.

Вопросам мультимодальной лингвистики, которая учитывает взаимодействие всех способов передачи информации (речь, интонация, жесты, мимика, направление взгляда), был посвящен доклад Ольги Федоровой, Андрея Кибрика, Николая Коротаева, Аллы Литвиненко и Юлии Николаевой. Они изучили координацию между элементарными единицами речи и сопровождающими их спонтанными жестами рук. Ранее ряд авторов утверждал, что время начала жеста обычно опережает время начала речи. После исследования авторы установили, что в исследованном материале жесты опережают речь менее чем в половине случаев. По предположению ученых, временные характеристики жестов зависят от их классификации, в зависимости от речевого жанра и индивидуальных особенностей говорящих.

Руссо Максим
читайте также
Pro Science
Эксперименты империи. Адат, шариат и производство знаний в Казахской степи
Май 15, 2024
Pro Science
Раскопки в Телль Ваджеф
Май 15, 2024
ЗАГРУЗИТЬ ЕЩЕ

Бутовский полигон

Смотреть все
Начальник жандармов
Май 6, 2024

Человек дня

Смотреть все
Человек дня: Александр Белявский
Май 6, 2024
Публичные лекции

Лев Рубинштейн в «Клубе»

Pro Science

Мальчики поют для девочек

Колонки

«Год рождения»: обыкновенное чудо

Публичные лекции

Игорь Шумов в «Клубе»: миграция и литература

Pro Science

Инфракрасные полярные сияния на Уране

Страна

«Россия – административно-территориальный монстр» — лекция географа Бориса Родомана

Страна

Сколько субъектов нужно Федерации? Статья Бориса Родомана

Pro Science

Эксперименты империи. Адат, шариат и производство знаний в Казахской степи

О проекте Авторы Биографии
Свидетельство о регистрации средства массовой информации Эл. № 77-8425 от 1 декабря 2003 года. Выдано министерством Российской Федерации по делам печати, телерадиовещания и средств массовой информации.

© Полит.ру, 1998–2024.

Политика конфиденциальности
Политика в отношении обработки персональных данных ООО «ПОЛИТ.РУ»

В соответствии с подпунктом 2 статьи 3 Федерального закона от 27 июля 2006 г. № 152-ФЗ «О персональных данных» ООО «ПОЛИТ.РУ» является оператором, т.е. юридическим лицом, самостоятельно организующим и (или) осуществляющим обработку персональных данных, а также определяющим цели обработки персональных данных, состав персональных данных, подлежащих обработке, действия (операции), совершаемые с персональными данными.

ООО «ПОЛИТ.РУ» осуществляет обработку персональных данных и использование cookie-файлов посетителей сайта https://polit.ru/

Мы обеспечиваем конфиденциальность персональных данных и применяем все необходимые организационные и технические меры по их защите.

Мы осуществляем обработку персональных данных с использованием средств автоматизации и без их использования, выполняя требования к автоматизированной и неавтоматизированной обработке персональных данных, предусмотренные Федеральным законом от 27 июля 2006 г. № 152-ФЗ «О персональных данных» и принятыми в соответствии с ним нормативными правовыми актами.

ООО «ПОЛИТ.РУ» не раскрывает третьим лицам и не распространяет персональные данные без согласия субъекта персональных данных (если иное не предусмотрено федеральным законом РФ).