будущее есть!
  • После
  • Конспект
  • Документ недели
  • Бутовский полигон
  • Колонки
  • Pro Science
  • Все рубрики
    После Конспект Документ недели Бутовский полигон Колонки Pro Science Публичные лекции Медленное чтение Кино Афиша
После Конспект Документ недели Бутовский полигон Колонки Pro Science Публичные лекции Медленное чтение Кино Афиша

Конспекты Полит.ру

Смотреть все
Алексей Макаркин — о выборах 1996 года
Апрель 26, 2024
Николай Эппле — о речи Пашиняна по случаю годовщины геноцида армян
Апрель 26, 2024
«Демография упала» — о демографической политике в России
Апрель 26, 2024
Артем Соколов — о технологическом будущем в военных действиях
Апрель 26, 2024
Анатолий Несмиян — о технологическом будущем в военных действиях
Апрель 26, 2024

После

Смотреть все
«После» для майских
Май 7, 2024

Публичные лекции

Смотреть все
Всеволод Емелин в «Клубе»: мои первые книжки
Апрель 29, 2024
Вернуться к публикациям
Википедия интернет экономика компьютерные технологии Big data
Июль 2, 2025
Pro Science

Кассовые сборы фильмов предсказывают по Википедии

Кассовые сборы фильмов предсказывают по Википедии
ps_film_revenue_prediction
Сравнение реальных кассовых сборов со спрогнозированными на основе деятельности пользователей Википедии. Источник: Márton Mestyán. Taha Yasseri. János Kertész

Ученые создали алгоритм прогнозирования финансового успеха фильма на основе данных о деятельности интернет-пользователей. В статье, опубликованной в PLOS ONE, трое венгерских авторов продемонстрировали, что популярность фильма можно предсказать задолго до его выхода на экран с помощью измерения активности редакторов и читателей статьи об этом фильме в Википедии.

Исследователи неоднократно с успехом применяют анализ сетевой активности пользователей для получения различной информации. Такеси Сакаи и коллеги из Токийского университета в 2010 году предложили использовать «Твиттер» для выявления сообщений о землетрясениях. В дальнейшем один из соавторов Сакаи – Макото Окадзаки – применил семантический анализ сообщений «Твиттера» для обнаружения радуг и городских пробок. В США компьютерная система на основе «Твиттера» используется для выявления ресторанов с некачественной пищей. Лингвисты изучают блогосферу с целью выявления изменений в языке или географического распределения языков. Анализ «Твиттера» позволяет предсказывать изменения промышленного индекса Доу-Джонса  с точностью до 87,6% или же результаты выборов. В других исследованиях анализируются статистика поисковых запросов в Google, количество загрузок на сайте arXiv.org, пользовательские комментарии к статьям в интернет-изданиях и другие виды сетевой активности.

Мартон Местьян (Márton Mestyán), Таха Яссери (Taha Yasseri) и Янош Кертес (János Kertész) предлагают оценивать активность редакторов и количество просмотров страницы о готовящемся фильме в Википедии для оценки его будущей популярности и кассовых сборов. Для отработки методики они использовали данные о 312 фильмах, которые вышли на экраны в США в 2010 году. Разработанный ими метод анализа дает хорошие прогнозы уже за один месяц до появления картины в кинотеатрах. При анализе учитывались: количество просмотров статьи, количество пользователей, которые вносили изменения, количество самих изменений и его один показатель – коэффициент строгости, основанный на том, какое количество правок подвергаются в дальнейшем пересмотру.

Исследователи подчеркивают, что их статистический метод, независящий от языка, легко может быть применен к кинорынкам других стран и даже для прогнозирования популярности других видов продукции.

читайте также
Pro Science
Эксперименты империи. Адат, шариат и производство знаний в Казахской степи
Май 15, 2024
Pro Science
Раскопки в Телль Ваджеф
Май 15, 2024
ЗАГРУЗИТЬ ЕЩЕ

Бутовский полигон

Смотреть все
Начальник жандармов
Май 6, 2024

Человек дня

Смотреть все
Человек дня: Александр Белявский
Май 6, 2024
Публичные лекции

Лев Рубинштейн в «Клубе»

Pro Science

Мальчики поют для девочек

Колонки

«Год рождения»: обыкновенное чудо

Публичные лекции

Игорь Шумов в «Клубе»: миграция и литература

Pro Science

Инфракрасные полярные сияния на Уране

Страна

«Россия – административно-территориальный монстр» — лекция географа Бориса Родомана

Страна

Сколько субъектов нужно Федерации? Статья Бориса Родомана

Pro Science

Эксперименты империи. Адат, шариат и производство знаний в Казахской степи

О проекте Авторы Биографии
Свидетельство о регистрации средства массовой информации Эл. № 77-8425 от 1 декабря 2003 года. Выдано министерством Российской Федерации по делам печати, телерадиовещания и средств массовой информации.

© Полит.ру, 1998–2024.

Политика конфиденциальности
Политика в отношении обработки персональных данных ООО «ПОЛИТ.РУ»

В соответствии с подпунктом 2 статьи 3 Федерального закона от 27 июля 2006 г. № 152-ФЗ «О персональных данных» ООО «ПОЛИТ.РУ» является оператором, т.е. юридическим лицом, самостоятельно организующим и (или) осуществляющим обработку персональных данных, а также определяющим цели обработки персональных данных, состав персональных данных, подлежащих обработке, действия (операции), совершаемые с персональными данными.

ООО «ПОЛИТ.РУ» осуществляет обработку персональных данных и использование cookie-файлов посетителей сайта https://polit.ru/

Мы обеспечиваем конфиденциальность персональных данных и применяем все необходимые организационные и технические меры по их защите.

Мы осуществляем обработку персональных данных с использованием средств автоматизации и без их использования, выполняя требования к автоматизированной и неавтоматизированной обработке персональных данных, предусмотренные Федеральным законом от 27 июля 2006 г. № 152-ФЗ «О персональных данных» и принятыми в соответствии с ним нормативными правовыми актами.

ООО «ПОЛИТ.РУ» не раскрывает третьим лицам и не распространяет персональные данные без согласия субъекта персональных данных (если иное не предусмотрено федеральным законом РФ).