19 марта 2024, вторник, 04:58
TelegramVK.comTwitterYouTubeЯндекс.ДзенОдноклассники

НОВОСТИ

СТАТЬИ

PRO SCIENCE

МЕДЛЕННОЕ ЧТЕНИЕ

ЛЕКЦИИ

АВТОРЫ

22 сентября 2020, 13:00

Дата-журналистика: «Получается, что журналист не нужен»

Иван Бегтин
Иван Бегтин
Фото из Facebook Ивана Бегтина

Эпидемия коронавируса — несомненно трагическое, крайне вредное и неудобное для всех явление, однако она дает нам уникальный шанс узнать много нового о себе самих. Хочется верить, что наступает время прорывов в области социологии и социальной психологии.

Одно из интереснейших последствий пандемии — возникновение одной-единственной темы, которую в течение долгого времени освещают практически все медиа на всех языках и континентах без исключения. Мы в Полит.ру видим в этом хорошую возможность для метажурналистского расследования и пытаемся описать медиашторм, рожденный пандемией, своего рода инфодемию, которая возникла в информационном пространстве.

Главный вопрос, который нас интересует, — можно ли путем анализа большого массива текстов СМИ, объединенных одной темой (в данном случае — пандемии), выявить новые способы построения смыслов и формы редакционной политики?

Именно этому посвящен проект «Трансформация картины мира в глобальном онлайн-пространстве под влиянием эпидемии COVID-19», который мы проводим совместно с факультетом коммуникаций, медиа и дизайна НИУ ВШЭ.

Мы будем подробно рассказывать обо всех этапах нашего исследования, инструментах и технологиях, которыми воспользуемся, открытиях, выводах и новых вопросах. И, разумеется, познакомим наших читателей с авторитетными экспертами.

Начнем мы с описания предмета дата-журналистики и смежных с ней областей. Ведь именно этим нам предстоит занятся в рамках нашего проекта.

Наш первый гость — Иван Бегтин, директор АНО «Информационная культура», один из ведущих российских экспертов в области открытых данных (OpenData) и открытого государства (OpenGovernment). Автор общественных проектов ГосЗатраты, Школа открытых данных, Школа информационной культуры, Открытая полиция, Понятный русский язык, Цифровое сохранение, за его работой удобно следить при помощи отдельного блога.

ВОСКРЕСЕНСКИЙ: Иван, вы знаете о нашем исследовании медиашторма, и это повод для нашей встречи, но сегодня хочу попросить вас раскрыть более общую тему: как мы можем использовать большие и открытые данные, в чем специфическая роль данных для журналистики и что вообще такое — "журналистика, основанная на данных"? Какие нам понадобятся специфические навыки и компетенции для того, чтобы строить эту новую журналистику, основанную на данных?

БЕГТИН: Начнем с того, что вы зря смешиваете понятия медиашторм и дата-журналистика.

Медиашторм является предметом анализа продвинутых, «настоящих» политологов и социологов, которые изучают тренды, компаний, которые следят за своим брендом, политиков, которые следят за потоками негатива. Все они мониторят разного рода медиаштормы, нанимают специальные команды людей, подписываются на специальные сервисы.

СМИ не формируют медиашторм. К сожалению, они просто являются частью этого шторма. Они как-то вовлечены в процесс, но очень редко обладают достаточными навыками для рефлексии по его поводу.

Работа дата-журналиста больше всего похожа на традиционное журналистское расследование: он копается в разных базах данных — недвижимости, деклараций о доходах, владения оффшорными компаниями и т.п. Разница только в объеме данных. Дата-журналист работает не с индивидуальными, конкретными записями, а с большими базами данных, совмещая функции и журналиста, и аналитика.

Дата-анализ, как правило, использует медиа, которые создают большие продукты вроде лонгридов и спецпроектов. Классическая, наиболее распространенная в мире форма таких спецпроектов, — освещение неких мегасобытий, например, Олимпиады или электоральных циклов. Скажем, сайт FiveThirtyEight в США, в течение долгого времени работая с данными в режиме data-журналистики, освещал выборы президента, предсказал победу Клинтон и в итоге облажался с точки зрения аналитики и прогнозирования.

ВОСКРЕСЕНСКИЙ: Что ж, давайте медиашторм отложим на десерт и поговорим о дата-журналистике. Это новый тренд, не так ли?

БЕГТИН: Абсолютно согласен, да, это новый тренд. Более того, я непосредственно участвую в его формировании здесь в России, в частности являясь индустриальным партнером на магистерской программе Высшей школы экономики. Однако могу сказать, что рынка под этот тренд пока нет, по крайней мере, в России. И даже в мире; это не совсем рынок журналистики. Дата-анализ используют некоторые высокотехнологичные медиа, а остальное в большинстве случаем является предметом политического финансирования, то есть это дата-журналистика, расследовательская журналистика (например, ICCRP). Это форма деятельности журналиста, которая финансируется из ограниченного набора некоммерческих фондов.

Исключение составляют бизнес-медиа, поставляющие финансовую информацию, — «Рейтерс», «АП», «Блумберг», — там дата-журналистика культивируется многие годы, а в последнее время развивается робо-журналистика.

Возникает новая профессия технологического редактора, который управляет этими роботами: задает им темы, настраивает их, и так далее. На финансовом рынке это происходит уже лет 20, а в классические медиа приходит постепенно.

Но если Полит.ру захочет вдруг стать на острие технологического прогресса — заводите колонку для роботов. Например, можно ежедневно получать сведения о госконтрактах, госбюджете, валютах, каких-нибудь макрособытиях.

Так же можно задавать канву репортажа. Например, в Москве проходят митинги. Запускаем дрона, который летает над ними и периодически делает фотографии. Алгоритм по фотографии определяет количество людей и постит в Твиттер или телеграм-канал, а редактор время от времени добавляет какие-то детали.

Я бы не назвал это журналистикой, но определенно это — некое медиа, которое не просто потребляет данные, а находит способ их производства.

На публицистику существенно повлияют так называемые алгоритмы JPT — алгоритмы «мягкого» искусственного интеллекта, понимания естественного языка и воспроизведения на нем текстов.

Было несколько десятков экспериментов, когда авторы писали текст, и алгоритм их переписывал или дорабатывал и дописывал. Автор писал абзац — следующий абзац писал робот, и т.д. Сегодня работает уже третье поколение JPT, и алгоритм продолжает совершенствоваться.

Страшная штука. Получается, что журналист не нужен. Разве что отправить его под прикрытием работать в какую-нибудь преступную группировку — с этим робот не справится. Пока еще нет. Но если журналист сидит в кабинете и пишет обо всем исключительно со слов или по материалам, из собственных измышлений с отсылками к литературе, к другим статьям, то его можно заменить. Не сейчас, но в относительно короткой перспективе. Еще при нашей жизни. И мы еще будем в достаточно здравом уме, чтобы это понять и испугаться.

ВОСКРЕСЕНСКИЙ: Если мы прогнозируем такое развитие событий, то какие специфические навыки, знания, подходы позволят нам остаться в этой профессии и быть ценными рядом с искусственным интеллектом? Что мы можем противопоставить и чем дополнить эти технологии? Чему нам нужно учиться?

БЕГТИН: Надо возвращать профессии журналиста элитарность, возможно, она стала слишком распространенной, ее девальвация произошла не от снижения количества профессионалов, а от роста количества людей, которые непрофессионально пишут. Надеюсь, публицистика снова станет элитарной. Будет пятьсот авторов на страну, но они будут глубоко и лично вовлечены в процесс создания текста. Большее погружение, большая персонификация, больший субъективизм в изложении мнения — вот наиболее вероятный сценарий развития классической журналистики.

В то же время, несомненно, будет развиваться роботизация. Либо полная роботизация, либо автоматизация процесса подготовки текстов, робо-журналистика. Особенно в медиа, которые по сути не являются журналистскими, а просто генерируют бесконечное количество рерайта.

ВОСКРЕСЕНСКИЙ: Представим себе, что сейчас создается лаборатория по робо-журналистике. С чего вы бы начали?

БЕГТИН: Я в первую очередь нашел бы заинтересованных партнеров, так как это вполне монетизируемая история. На роботизацию однозначно есть спрос. Можно предлагать многим медиа разработку шаблонов, автоматическую генерацию текста.

К тому же, «освобождение рабов» — хорошая работа, так что социальные причины этим заниматься тоже есть.

Потребуются люди с двумя навыками: те, кто хорошо понимает аудиторию и медиаповестку, и те, кто может структурировано описывать задачи, — как должна быть построена типичная статья, публикация, медиазаголовок.

Задачи следует структурировать и типизировать так, чтобы автоматизированные алгоритмы, которые будут писать, «думали, как человек».

Необходимо также собрать большой корпус текстов с множеством источников данных.

Далее я бы запустил бесконечное количество конкурсов с призами и с возможностями карьерного и профессионального развития для студентов, для программистов, для айтишников. Конкурсная задача — разработка разного рода алгоритмов и создание сервисов, на которых медиа смогут экспериментировать со своими материалами. На такой основе относительно легко можно будет создавать коммерческие продукты.

ВОСКРЕСЕНСКИЙ: То есть в техническое задание для этих конкурсов мы можем положить редакционное руководство по написанию фичеров, репортажей и так далее, и предложить разработать алгоритмы?

БЕГТИН: Давайте рассмотрим пример: у нас есть какая-нибудь официальная государственная статистика. Даем базу этих показателей айтишникам, даем примеры текстов, которые на их основе могут быть написаны, и просим сделать алгоритм, который наиболее человеческим образом излагает изменения по тем или иным показателям в течение времени. Например, то, что произошло в течение месяца. Предположим, произошло событие, Росстат выпустил очередную цифру по изменению смертности в РФ. Алгоритм должен оперативно написать текст, который отразит изменения и даст какие-нибудь дополнительные инсайты — как это произошло, кого затронут изменения в разных регионах, — расставит акценты и напишет текст, максимально пригодный к осмыслению человеком.

Жюри должно состоять в первую очередь из редакторов, то есть людей, которые способны распознать подходящий для публикации текст. После этого каждый текст оцениваем по трем критериям: скорость работы алгоритма, «человечность», пригодность к публикации.

ВОСКРЕСЕНСКИЙ: Интересный эксперимент, надеюсь, он состоится. Если я правильно понимаю, чем-то подобным вы занимаетесь со студентами в «Вышке»? Чему вы учите этих молодых людей?

БЕГТИН: Я не преподаю сам — в рамках этой магистерской программы я выступаю индустриальным партнером и трудоустраиваю выпускников.

ВОСКРЕСЕНСКИЙ: То есть вы, в некотором роде, — заказчик обучения и точно знаете, что нужно молодому дата-журналисту, чтобы быть востребованным на рынке?

БЕГТИН: Как я уже говорил, дата-журналист должен совмещать две важные функции — журналиста и аналитика — и обладать двумя наборами компетенций. 

Во-первых, владение русским языком на уровне лучше, чем у студентов-технарей, и понимание принципов журналистики: как устроены медиа, их экономика, логика, формы существования, что такое спецпроекты, время жизни статьи, и многое другое. Это те вещи, которые большинство айтишников совсем не понимает.

Во-вторых, необходимы знания о том, как устроены основные инструменты дата-аналитика (какой-нибудь Jupyter Notebook, Python, другой инструментарий). Навыки работы с источниками данных, проектирования разного рода исследований, понимание, как собирать и обрабатывать данные, какие механизмы и подходы можно применить к очистке данных и оценке их достоверности. Все это, на самом деле, не очень сложно для людей с техническим бэкграундом, но они, как правило, очень плохо пишут. Этому их надо целенаправленно учить. И наоборот — гуманитариям тяжело дается математика и компьютерные (не человеческие) языки.

Это такая двойная профессия, в которой могут преуспеть гуманитарии с техническими навыками или технари с некоторым набором гуманитарных навыков.

ВОСКРЕСЕНСКИЙ: Наличие магистерской программы в одном из самых уважаемых университетов страны может свидетельствовать о престиже профессии. Так ли это?

БЕГТИН: Должен сказать, что дата-журналистика в России довольно хорошо развита. У нее пока нет сильной экономической основы, крупные издания не спешат создавать дата-лаборатории, но это связано с общим кризисом журналистики и медиа в России. Но есть большая тусовка людей, которые живут этим. Эта тусовка постоянно растет. Есть среда, в которой довольно легко научиться основам профессии. При некоторой усидчивости, настойчивости и стремлении к работе с данными классический журналист может скорректировать свою специальность и получить массу карьерных возможностей. Например, владея анализом данных, гораздо проще уходить из медиа общего типа в какое-нибудь специализированное издание, которое пишет только о транспорте или о медицине. Или в аналитическое агентство. При наличии некоторой склонности к критическому мышлению подобные специалисты-исследователи очень востребованы.

ВОСКРЕСЕНСКИЙ: И последний вопрос. Кризис, связанный с пандемией, как-то повлиял на ваши представления о дата-журналистике? Появились ли новые идеи, гипотезы? Может быть, удалось разглядеть новые тренды?

БЕГТИН: Честно говоря, ничего существенного. Главные изменения, которые я вижу, не связаны с пандемией, они глобальные и долгосрочные. Это, прежде всего, постепенное проникновение робо-журналистики.

Русский язык сложнее английского, сложнее немецкого, и поэтому у нас это отложенный тренд. Но, как я уже сказал, у нас довольно сильные команды компьютерных лингвистов, поэтому я уверен, что роботизация неизбежна.

ВОСКРЕСЕНСКИЙ: Спасибо за познавательный рассказ о дата-журналистике.

О медиашторме  в следующей серии.

В материале использована информация, полученная в в ходе реализации проекта "Трансформация картины мира в глобальном онлайн-пространстве под влиянием эпидемии COVID-19".

Редакция

Электронная почта: polit@polit.ru
VK.com Twitter Telegram YouTube Яндекс.Дзен Одноклассники
Свидетельство о регистрации средства массовой информации
Эл. № 77-8425 от 1 декабря 2003 года. Выдано министерством
Российской Федерации по делам печати, телерадиовещания и
средств массовой информации. Выходит с 21 февраля 1998 года.
При любом использовании материалов веб-сайта ссылка на Полит.ру обязательна.
При перепечатке в Интернете обязательна гиперссылка polit.ru.
Все права защищены и охраняются законом.
© Полит.ру, 1998–2024.