Нейронная сеть рассчитала процент оппозиции в России

Как мы уже писали раньше, нами была построена математическая модель политических взглядов пользователей социальной сети ВКонтакте.
Программа анализирует страницу пользователя, изучает его интересы и увлечения. В итоге ему присваивается индекс между 0 и 1. Значение индекса ближе к 0 показывает приверженность к консервативным взглядам, ближе 1 — к либеральным.
Подробнее об индексе тут.
Если кто-то считает "либералы" ругательным словом, можно использовать термин "прогрессисты", а консерваторов называть "государственниками".

Мы решили применить на практике нашу нейронную сеть и посмотреть картину политических предпочтений в нескольких городах РФ.

Для этого мы рассчитали наш индекс для пользователей ВКонтакте из этих городов в соответствии с демографическим профилем населения. Подробнее о том, по какому принципу совершалась выборка анкет, читайте тут.

Демографический профиль городского населения, согласно последней переписи населения РФ.  
Мы учли смещение данного профиля на 8 лет с момента переписи.
Да, женщины живут дольше и в одиночестве.
Демографический профиль городского населения, согласно последней переписи населения РФ. Мы учли смещение данного профиля на 8 лет с момента переписи. Да, женщины живут дольше и в одиночестве.
Для тех, кто сразу начнет активно возражать "нельзя использовать Контакт", "в Контакте сидит одна школота", "в Контакте нет пенсионеров" - посмотрите, пожалуйста, еще раз на демографический профиль выборки. Она прекрасно представляет срез населения РФ, согласно переписи 2010 года (и учитывает сдвиг). Четко видны несколько демографических волн. И да, во ВКонтакте тоже есть пенсионеры :)

Итак, рассмотрим гипотетическую ситуацию, когда на выборах в РФ представлены только два кандидата. Один более консервативный, например условный В. Путин, другой более либеральный, например условный А. Навальный. Мы специально упростили ситуацию, не включив в рассмотрение третьи силы, вроде коммунистов.
Какие же будут результаты выборов, при максимальной явке? Проверим, совпадут ли наши данные с соцопросами ВЦИОМа.

Смотрим, что рассчитала наша нейронная сеть:

Москва

Выборка:

Итоги:

Видим, что на текущий исторический момент "основной кандидат" выиграл бы честные выборы в Москве, даже, если бы на них были представлены реальные кандидаты от оппозиции. В выборе между "свобода-перемены-прогресс" и "традиции-стабильность-порядок" выигрывают "скрепы".

С другой стороны, ~40% у оппозиции, это совсем не 2%, как заявляли некоторые персонажи, а 62% это не 86% от ВЦИОМа.

* * *

А как обстоят дела в Санкт-Петербурге? Действительно ли питерцы более либеральные, чем москвичи?!

Санкт-Петербург

Таки да. Наша модель показала, что питерцы немного либеральнее, но без фанатизма.

* * *

А теперь посмотрим областной центр, где "основной кандидат" традиционно набирает голоса выше среднего по стране, например Тулу.

Тула

Да, Тула ожидаемо консервативнее столиц.

* * *

А еще интересно было бы проверить какой-нибудь город, где кандидат от власти всегда набирает фантастические 90+%. Например, прекрасный город Махачкала. Правда, тут у нас возникли небольшие затруднения с выборкой. Дело в том, что люди из Махачкалы старше 35-40 лет очень слабо представлены в социальной сети ВКонтакте. Вот как выглядела наша полная выборка:

Чтобы получить выборку с "правильным" демографическим профилем, как на первом графике, с характерными двумя пиками в районе 30 и 57 лет, нам пришлось отбросить большую часть наблюдений. Из 35 тыс. проанализированных анкет у нас осталось только 3 тыс. Но, зато, с правильным профилем:

На всякий случай мы приведем итоги наших условных выборов в г. Махачкале для обоих вариантов выборки.

Махачкала

Итоги без учета демографического профиля
Итоги без учета демографического профиля
Итоги с "правильным" демографическим профилем
Итоги с "правильным" демографическим профилем

Шито!? 70% ? Как в Туле? А где обещанные 90%? :)
Шутки-шутками, но на самом деле тоже все ожидаемо. В Махачкале живут такие же люди, смотрят тот же телевизор, и их политические взгляды в среднем такие же, как и всех жителей Российской Федерации.
А про 90% на последних выборах нам уже все рассказали наблюдатели.

* * *

И наконец, проверим еще одно бытующее мнение, будто в небольших городах власть имеет больше поддержки, а оппозиция меньше. Мы посчитали навскидку разные города с разной численностью населения в нескольких регионах.

* данные о численности населения указаны согласно Всероссийской переписи населения 2010 г.
* данные о численности населения указаны согласно Всероссийской переписи населения 2010 г.

Да, модель подтверждает предположение. В целом в небольших городах поддержка власти больше. Но корреляция скорее не с численностью населения, а с депрессивностью региона/населенного пункта (больше депрессивности - больше поддержка). Относительно благополучная Шуя со своим ВУЗом, производством мануфактуры и известным в области водочным заводом занимает последнее место по лояльности из рассчитанных городов, несмотря на малую численность населения.

Ну, а победителем в номинации "малые города" становится Котлас (Архангельская обл, население 60 тыс.)

ОАО «Лимендский судостроительно-судоремонтный завод». 
Одно из основных предприятий Котласа. Источник - wikipedia.org
ОАО «Лимендский судостроительно-судоремонтный завод». Одно из основных предприятий Котласа. Источник - wikipedia.org

Котлас - 83%!

* * *

Выводы

Ничего сверхреволюционного мы в своих результатах не получили. Все довольно ожидаемо, хотя и не совсем так, как нам говорят ВЦИОМ и ЦИК.

Действительно революционным был сам метод, каким мы эти данные получили.

Не проводя никаких опросов можно получить электоральную картину по всей стране. Наша математическая модель на контрольной выборке показала точность предсказания политических взглядов 95%! Также модель избавлена от недостатков социологических опросов таких, как маленькая выборка, предвзятость интервьюеров, боязнь давать правдивые ответы и т. д.

Мы даже смогли предсказать результаты президентских выборов 2018 года. Во избежание подозрений на махинации мы разместили наш прогноз 12 марта 2018 на независимой площадке medium.com. Прогноз, сделанный по выборке из г. Москвы совпал с общероссийским результатом с точностью до 1 процента. (Москва, сценарий В)

Посмотреть и самому попробовать работу математической модели можно тут. Подвигайте ползунки в интерфейсе, выбирайте и сравнивайте разные сценарии и города, поиграйте в политологов :)

_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
Об авторе: Гашпар Юрий, Data Scientist, www.skydigital.pro

_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
Понравилась статья? Нажмите на лайк (палец вверх), тогда ее смогут прочитать больше людей.

Хотите читать больше таких статьей - подпишитесь на наш канал. У нас еще много интересных тем на стыке политики, психологии, Big Data и анализа социальных сетей.