29 марта 2024, пятница, 11:28
TelegramVK.comTwitterYouTubeЯндекс.ДзенОдноклассники

НОВОСТИ

СТАТЬИ

PRO SCIENCE

МЕДЛЕННОЕ ЧТЕНИЕ

ЛЕКЦИИ

АВТОРЫ

28 февраля 2017, 15:00

Диалог с роботами

Публичная лекция Ильи Утехина
Публичная лекция Ильи Утехина
Наташа Четверикова/Полит.ру

27 февраля в проекте «Публичные лекции "Полит.ру"» в рамках цикла, совместного с Европейским университетом в Санкт-Петербурге, выступил профессор и декан Факультета антропологии Европейского университета в Санкт-Петербурге, доцент факультета Свободных искусств и наук СПбГУ, кандидат исторических наук Илья Утехин. Тема его лекции «Как устроен диалог?».

Диалог, то есть спонтанное речевое взаимодействие двух или более участников, находящихся рядом друг с другом, представляет собой наиболее базовую форму человеческого общения и использования языка. Долгое время исследователей удовлетворяла простая модель диалога, в которой выделялись его участники («говорящий» и «слушающий») и говорящий кодировал смысл сообщения при помощи языкового кода и передавал его слушающему, а затем они менялись ролями. Новым шагом в изучение общения стало возникновение теории речевых актов и лингвистической прагматики, где коммуникация рассматривалась не просто как декодирование языкового сообщения, а как выявление намерений говорящего, иногда вовсе не вытекающих прямо из значений слов. В работах этих направлений были описаны многочисленные примеры того, как одно и то же высказывание может передавать различные намерения говорящего. Например, фраза «Сядьте здесь» может быть как советом, так и требованием.

В последние десятилетия в нашу жизнь пришли различные технические новинки, с появлением которых представления о том, каким может быть диалог расширились. Появляется все больше устройств, понимающих человеческую речь, причем не просто предназначенных для голосового управления, а способных отвечать человеку, вступая с ним в диалог. Это роботы, а также компьютерные программы с возможностью синтезировать речь в устной или письменной форме (среди самых известных – приложение Siri, Voice Mate и другие). В социолингвистике есть плодотворный подход изучения особенностей языка в различных жанрах: при коммуникации человека с родственниками, знакомыми, незнакомыми, старшими, младшими, начальниками, подчиненными и так далее. Теперь социолингвисты получили в распоряжение новый микрожанр – коммуникацию человека с техническим устройством. И особенности этого жанра, а также те неудачи в коммуникации, которые мы наблюдаем у роботов, выявляют существенные характеристики диалога, на которые раньше, возможно, исследователи обращали недостаточно внимания.

Важных черт диалога несколько. Во-первых, собеседники в нем находятся в одном и том же пространстве и видят друг друга. Они обращаются друг к другу лично и говорят от себя. Реплики собеседника они слышат непосредственно, без задержки. Сказанное в диалоге исчезает и нигде не фиксируется. Собеседники свободны в определении того, кому сейчас говорить. Определение очередности говорящих в устной беседе оказывается непростой задачей, которая решается при помощи скоординированного взаимодействия. Как показали исследования в США, на переход очереди говорящих в диалоге уходит всего лишь около 200 миллисекунд. Это время слишком мало, чтобы человек успевал среагировать и понять, что теперь у него есть возможность вставить свою реплику, а значит формирование намерения говорить начинается, когда он еще слушает собеседника, параллельно с обработкой входящей информации. Не смотря на сложность задачи, люди, как правило, прекрасно справляются с обменом ролями говорящего и слушающего в диалоге, а роботы пока не способны делать это столь же искусно.

В любом диалоге от его участников требуется внимание к перспективе собеседника, то есть нужно как-то представлять, что у него в голове, что он знает, каковы его намерения, как он понимает только что услышанное. Системы искусственного интеллекта обрабатывают преимущественно смысл произнесенных высказываний, а построение такой «модели собеседника» в их задачу не входит. Это часто служит причиной коммуникативных неудач в разговорах человека с машиной.

Впрочем, бывают ситуации, когда для беседы не столь важна информация о представлениях собеседника об окружающем мире. Знаменитая ELIZA – программа, созданная Джозефом Вейценбаумом еще в 1966 году – должна была по замыслу автора вступать с человеком диалог, напоминающий разговор психотерапевта с пациентом. Обычно ELIZA, задавая очередной вопрос, просто переформулирует предшествующую реплику собеседника, выделив в ней ключевое слово. Когда программа затрудняется с ответом, она говорит «Понятно» или «Продолжайте, пожалуйста». В результате возникает довольно точная пародия реальных диалогов с психотерапевтом.

Но такой успех возможен лишь в узких рамках жанра. При попытках поговорить с какой-нибудь компьютерной программой на другую тему, мы можем наткнуться на непонимание, вызванное тем, что программа использует при построении своей реплики только непосредственно предшествующую фразу партнера, не учитывая ни всего произнесенного ранее, ни каких-либо общих для участников разговора представлений о внешнем мире. Реальный же разговор не сводится к реакции на предшествующую реплику. Диалоги между людьми часто содержат вложенные конструкции (например, «Куда пошел Вася? – Это такой рыжий? – Да. – Он пошел в магазин»). Если система искусственного интеллекта работает только с последней фразой, она оказывается неспособной воспроизвести подобный диалог.

При создании «говорящих программ» важно учитывать и данные этнографии речи, порою без этого программа не может понять слова человека. Например, уже упоминавшаяся Siri оказывается не в состоянии правильно отреагировать на «Угу», произнесенное вместо «Да». Если бы при подготовке русской версии программы было учтено, что «Угу» в русской речи служит очень частым сигналом согласия, этой ошибки можно было бы избежать.

Редакция

Электронная почта: polit@polit.ru
VK.com Twitter Telegram YouTube Яндекс.Дзен Одноклассники
Свидетельство о регистрации средства массовой информации
Эл. № 77-8425 от 1 декабря 2003 года. Выдано министерством
Российской Федерации по делам печати, телерадиовещания и
средств массовой информации. Выходит с 21 февраля 1998 года.
При любом использовании материалов веб-сайта ссылка на Полит.ру обязательна.
При перепечатке в Интернете обязательна гиперссылка polit.ru.
Все права защищены и охраняются законом.
© Полит.ру, 1998–2024.