Решил продолжить исследование пяти предположительно честных (по итогам голосования по поправкам к Конституции РФ) ТИКов Воронежской области, начатое в посте.
Сейчас я хочу оценить предполагаемую честную явку в этих пяти ТИКах с помощью «двухголовой гауссианы», о которой писал. Только теперь я построил распределение УИКов по явке не в шкале явки в процентах, а в шкале логитов явки. (Логит – это математическая функция вида y=logit(x)=ln(x)-ln(1-x)).
Почему я так сделал? Дело в том, что нормальное распределение некоторой величины предполагает, что эта величина теоретически может принимать значения от минус бесконечности до плюс бесконечности. Но процент явки может принимать значения только от 0 до 100%. Поэтому идея использовать нормальное распределение для моделирования того, как УИКи распределяются по явке, по-моему, не очень хорошая. Да, нормальное распределение может здесь использоваться как некое приближение, если среднеквадратическое отклонение явки от среднего значения невелико (скажем, 1%). Но если это отклонение составляет, например, 5% и больше, то я уже не уверен в том, что обычное нормальное распределение здесь можно использовать. А вот логит-нормальное распределение для величин, которые принимают значения только в пределах от 0 до 100% (или, что то же самое, от 0 до 1) использовать можно. Правда, при этом важно помнить, что от 0 и 1 логит не рассчитывается.
Итак, я пересчитал явку из процентов в логиты по формуле logit(x/100)=ln(x/100)-ln(1-(x/100)) для тех УИК, для которых логит явки рассчитывается. Далее, я нашел минимальное и максимальное значения логита явки среди УИКов, нашел разность максимума и минимума, разделил ее на 100 и, таким образом, разбил интервал между максимумом и минимумом на 100 равных отрезков. На прикрепленном к посту графике по оси OX приведена шкала, на которой отмечено значение минимума и средние значения остальных отрезков (средние значения я рассчитал как средние арифметические крайних значений). И, дальше, для моделирования распределения УИКов по логиту явки я использовал функцию следующего вида (использую excel-совместимую терминологию):
y=a*НОРМРАСП(x;МО_1;О_1;0)+ b*НОРМРАСП(x;МО_1;О_1;0),
где МО_1 – математическое ожидание для «левой головы» «двухголовой гауссианы»;
О_1 – среднеквадратическое отклонение для «левой головы» «двухголовой гауссианы»;
МО_2 – математическое ожидание для «правой головы» «двухголовой гауссианы»;
О_2 – среднеквадратическое отклонение для «правой головы» «двухголовой гауссианы»;
a, b – параметры модели, подбираемые эмпирически.
После того, как я подобрал параметры этой модели, у меня получилось следующее:
МО_1=-0,50395;
О_1=0,251179;
МО_2=0,332322;
О_2 =0,242195;
a=7,396072;
b=9,906936.
Результаты моделирования с помощью этой функции представлены на графике, который я прикрепляю к данному посту. Среди рассчитанных параметров уравнения самый важный для нас – это МО_1. С помощью него можно найти предполагаемое значение честной явки. Для этого нужно рассчитать значение обратной для логита функции от МО_1. А обратная функция для логита – это логистическая функция:
y=ln(x)-ln(1-x); e^y=x/(1-x); e^y*(1-x)=x; e^y-x* e^y =x; e^y-x* e^y =x; e^y-x* e^y =x*(1+ e^y); x=e^y/(1+ e^y); x=1/(1+ e^(-y)) ч т.д.
Поэтому предполагаемую честную явку можно рассчитать по следующей формуле:
1/(1+ e^(-МО_1))=1/(1+ e^0,50395)=0,3766
То есть предполагаемая честная явка составляет 37,66%.
Возьмем теперь предполагаемые честные значения голосов «за» и «против» из предыдущего поста: за: 64,68%; против: 34,5%. (Напомню также официальные данные в сумме по пяти рассматриваемым ТИКам: явка 52,42%, за поправки 68,81%, против поправок 30,3%). То есть официально за поправки проголосовали 52,42*(68,81/100)=36,07% от общего числа избирателей. Предполагаемый честный процент от общего числа избирателей, проголосовавших за поправки: 37,66*(64,68/100)=24,36%. Получаем процент от общего числа избирателей, который, как предполагается, был сфальсифицирован в пользу «за поправки»: 36,07-24,36=11,71%. При этом предполагаемый процент сфальсифицированной явки от общего числа избирателей составляет 52,42-37,66=14,76%. И снова: 14,76% не совсем совпадает с 11,71%. Остается еще 14,76%-11,71%=3,05% необъясненные. Во предыдущем посте этот необъясненный процент у меня составил 15,55%-12,22%=3,33%. Сегодня получилось поменьше, но не намного.
Итак, я использовал два простых метода, с помощью которых можно оценить примерную величину предполагаемой честной явки:
1. Рассчитал явку на участках с низкой явкой (во вчерашнем посте);
2. Внимательно пригляделся к «левой голове» «двухголовой гауссианы» (в этом посте).
Есть еще третий, довольно-таки простой метод. Но о нем чуть позже.