Maxim Mironov (mmironov) wrote,
Maxim Mironov
mmironov

Categories:

Почему голь голосует за Путина? Она не голосует.

Россия родина не только слонов, но и экспертов по всем вопросам. Когда идет чемпионат по футболу – все становятся экспертами по футболу, когда начинается рост или падение цен на нефть –  аналитиками по нефтяным ценам, когда падает курс рубля – экспертами по валютному рынку, когда идут выборы – все становятся политологами.

Илья Варламов (http://echo.msk.ru/blog/varlamov_i/1846302-echo/) обнаружил интересную зависимость, что в районах с относительно дешевой недвижимостью процент голосов за ЕР выше, чем в районах с дорогой. Из этого он делает вывод, что бедные голосуют за Путина. Я не буду придираться к мелочам, что ЕР и Путин – это не совсем одно и то же, и их рейтинги сильно отличаются. Рассмотрим суть вопроса – можно ли делать подобные выводы на основании выявленной корреляции.

Начнем с различия между корреляцией и причинно-следственными связями. Корреляция между двумя переменными сама по себе вообще не позволяет сделать вывод о природе зависимости переменных. Приведу несколько примеров. Предположим, вы исследуете связь между количеством зонтиков на улице и дождем. После многолетних наблюдений вы заметили, что чем больше вы видите людей с зонтами, тем больше вероятность дождя. Отсюда можно сделать вывод, что если у вас засуха и вы хотите вызвать дождь, нужно на улицу выгнать побольше народу с зонтами. Этот феномен называется обратной зависимостью (на самом деле дождь вызывает появление зонтов на улице). Другой пример: мы видим корреляцию между зонтами на улице и лужами. Делаем вывод (уже наученные), что либо зонты вызывают лужи, либо лужи вызывают зонты. На самом деле есть третья переменная – дождь, которую мы исключили из анализа (очень часто эта третья переменная не наблюдается), и она вызывает и лужи, и зонты на улице. Наконец, существует известная корреляция, что многие великие ученые (в том числе нобелевские лауреаты) в детстве занимались музыкой. Отсюда следствие – хочешь, чтобы твой ребенок вырос великим ученым, отдай его на музыку. Однако есть третья переменная, которая ненаблюдаемая. Мы можем ожидать, что родители определенного интеллектуального уровня, которые заботятся о ребенке, скорее отдадут его на музыку. То есть переменная «ребенок занимается музыкой» коррелирует с интеллектуальным уровнем ребенка (который в свою очередь коррелирует с интеллектом родителем) и то, сколько усилий родители инвестируют в образование ребенка. Скорей всего именно это переменная (а не музыка сама по себе) вызывает наблюдаемую зависимость. Можно привести еще много подобных примеров.

Наличие корреляции между голосами за ЕР и ценами на недвижимость также не ведет само по себе к выводу, что бедные поддерживают ЕР. Александра Петрачкова в статье «Where observers are more effective? Evidence from Russia» Working paper, 2016 проанализировала результаты выборов в Госдуму 2011 по Москве. Она оценила социодемографические характеристики на уровне УИКов, использовав базу данных Пенсионного фонда и проанализировала связь между процентом голосов, отданных партиям, и различными характеристиками на уровне УИКов:


В этой таблице Log(income) – средний логарифм дохода по УИКу, St. Dev[log(income)] – стандартное отклонение логарифма дохода, Age – средний возраст избирателей, Share of private employees – доля работников, занятых в частном секторе,  Distance to center – расстояние от УИКа до Кремля (в км),  Distance to subway расстояние от УИКа до ближайшей станции метро (ограничено сверху 2-мя км). В скобках – стандартные ошибки оценки коэффициентов, * - статистическая значимость коэффициента на уровне 10%, ** - на 5%, *** - на 1%. Как видно из таблицы,  для Единой России (колонка 1), коэффициент при доходе хотя и отрицательный (то есть чем богаче УИК, тем меньше голосов за ЕР), но статистически незначимый. То есть мы не можем с какой-то разумной долей уверенности утверждать, что есть какая-то связь между голосами за ЕР и доходом. Более интересно проанализировать коэффициент при стандартном отклонении дохода. Это фактически мера неравенства по доходам на уровне УИКа. Чем больше уровень неравенства окружает избирателя, тем меньше он голосует за ЕР, причем коэффициент обладает высокой статистической значимостью. Похоже, что Россия лежит в мэйнстриме современных тенденций – людей прежде всего беспокоит неравенство (Пикетти, Зингалес) и это важный фактор недовольства властью. С другой стороны, у КПРФ и Яблоко зависимость обратная. Видимо, эти партии у избирателя ассоциируется с социальной справедливостью. Остальные коэффициенты я анализировать не буду – для целей этого поста достаточно дохода и неравенства по доходам. Подчеркну, что работа Петрачковой тоже по сути анализ корреляций – там просто больше переменных, и высокий уровень детализации (на уровне УИКов). К тому же агрегированные данные по УИКам используются для проецирования поведения индивидов. Это не совсем корректно. В политологии эта проблема известна как ecological fallacy.

Хочу отметить, что я ни в коем случае не отрицаю наличие связи между благосостоянием и голосами за ЕР в масштабах России. Более того, я считаю такую гипотезу вполне вероятной (http://echo.msk.ru/blog/mmironov/1845586-echo/ ) однако подобные гипотезы требуют более качественной проверки, чем простой анализ корреляций между доходами (как вариант ценами на недвижимость) и голосами. Как я показал на примере Москвы, если в модель добавить еще несколько переменных, то корреляция между доходами и голосами за ЕР пропадает, и ответ на вопрос «Почему голь голосует за Путина?» становится «она не голосует».

Я надеюсь, что российская оппозиция осознает, что без качественных цифр и аналитики невозможно вести политическую борьбу. И так приходится воевать с превосходящими силами противника – стрелять из старенькой пушки по прочным современным укреплениям. Да еще у оппозиции нет даже примерного понимания – куда стрелять. Поэтому стреляют во все стороны, намного чаще убивая своих, чем чужих. Если так будет продолжаться дальше, то и через 5 лет мы будем задавать себе вопрос «почему оппозиция проиграла?» Необходимо начать применять современные методики, чтобы получать качественные ответы на ключевые вопросы: как измерить поддержку оппозиции, как идентифицировать своего избирателя, на агитацию среди каких социальных групп следует тратить средства избирательного фонда, и т.д. Пора, наконец, понять, что современная политология, как и экономика, по своей сути ближе к математике и статистике, чем к классическим гуманитарным дисциплинам. Без современных эконометрических методов, на одних рассуждениях далеко не уедешь.



Subscribe

  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 28 comments