Ilość nieważnych pakietów, kart i głosów dodatnio koreluje z wynikami Dudy oraz negatywnie koreluje z wynikami Biedronia, Kamysza i Trzaskowskiego w pierwszej turze wyborów prezydenckich 2020 roku. Prawdopodobieństwo przypadku od strony statystycznej jest bliskie zeru. Analiza przeprowadzona dla danych z zagranicy.
Dla danych z USA zauważyliśmy niepokojące zależności. Byłem ciekaw czy powielają się one dla danych z całej Polonii.
Co badałem?
Dla każdego z 165 obwodów polonijnych zsumowałem liczbę kart wydanych wyborcom w lokalu oraz liczbę przyjętych pakietów. Interesowało mnie to, jaki procent z nich został uznany za głos nieważny. Taki procent nieskutecznych wyborców wyliczyłem dla każdego obwodu. Następnie postanowiłem sprawdzić, czy istnieje związek pomiędzy ilością nieskutecznych wyborców a wynikami poszczególnych kandydatów. Miałem podejrzenie, że tam, gdzie takich nieskutecznych wyborców jest więcej kandydat partii rządzącej, która zorganizowała bardzo duże zamieszanie podczas wyborów za granicą, mógł uzyskiwać lepsze rezultaty niż w innych obwodach, gdzie nieskutecznych wyborców było mniej. Moje przypuszczenia niestety się potwierdziły. Zależność jest bardzo wyraźna.
Byłem jednak bardzo zaskoczony, gdy zobaczyłem, że dla głównych przeciwników ideologicznych rządzącej partii zależność ta jest odwrotna. Im więcej nieskutecznych wyborców, tym gorzej oni wypadali. Na poniższym wykresie widać wyraźny trend wzrostowy dla Andrzeja Dudy i odwrotne dla wyników Rafała Trzaskowskiego, Roberta Biedronia i Władysława Kosiniaka-Kamysza.
Czy to przypadek?
Od dobrze zorganizowanych wyborów oczekiwalibyśmy, aby takich prawidłowości w danych z komisji nie było. Zawsze można powiedzieć, że taki zbieg okoliczności jest akurat przypadkowy i nie było w tym żadnego czynnika koordynującego ilość skutecznych głosów oraz wyników kandydatów.
Na szczęście statystyka dysponuje metodami, aby sprawdzić, jak prawdopodobne jest zaistnienie takiego zbiegu okoliczności. Policzyłem współczynniki korelacji i na podstawie dystrybuant odpowiednich rozkładów prawdopodobieństwa wyliczyłem prawdopodobieństwo. W dużym uproszczeniu jeśli rzucamy monetą 100 razy i 90 razy wypada resztka, to czujemy, że coś z monetą jest nie tak. Poniższa tabela przedstawia wyliczone prawdopodobieństwa, że omawiana zależność jest przypadkowa.
Robert BIEDROŃ | Krzysztof BOSAK | Andrzej DUDA | Szymon HOŁOWNIA | Władysław KOSINIAK-KAMYSZ | Rafał TRZASKOWSKI | |
Prawdopodobieństwo, że zależność jest przypadkowa | 0,001% | 12,953% | 0,036% | 17,993% | 0,013% | 0,177% |
Korelacja | -0,4787121167 | -0,1557611866 | 0,3271694984 | -0,1309122416 | -0,4505958443 | -0,2785371774 |
Prawdopodobieństwo przypadku jest bliskie zeru dla czterech kandydatów. Liczenie, że przytrafiło się coś, co mogło się zdarzyć raz na 100 tysięcy razy, jest jak liczenie, że rzucana moneta stanie na kancie.
W przypadku Krzysztofa Bosaka i Szymona Hołowni prawdopodobieństwa przypadku są zdecydowanie większe i na podstawie tych danych trudno cokolwiek wykazać.
Co dalej?
Nie potrafię powiedzieć, jakie jest źródło tej zgodności. Jest ona jednak tak duża i niepokojąca, że koniecznie powinna być zbadana. Państwowa Komisja Wyborcza i Ministerstwo Spraw Zagranicznych koniecznie powinny wyjaśnić przyczynę takich anomalii. Musimy ich o to zdecydowanie pytać! To oni powinni być zainteresowani sprawdzeniem czy nie doszło do manipulacji. Inaczej pozostaną domysły i będą wątpliwości co do rezultatu wyborów.
Niezależnie od tego należy:
- zweryfikować moje obliczenia oraz tok rozumowania,
- przeprowadzić podobną analizę dla wszystkich obwodów wyborczych w Polsce,
- sprawdzić inne wskaźniki niż liczba skutecznych wyborców,
- porównać wyniki z poprzednimi wyborami.
To wszystko przerasta jednego biednego człowieka, który sypia ostatnio po 3 godziny na dobę. Proszę o pomoc każdego, kto ma doświadczenie z analizą danych i statystyką. Zachęcam do kontaktu.
Moje obliczenia: https://docs.google.com/spreadsheets/d/1o6ug7s_26SJrIuFx7uP4lW3faAxaoTsHbbduv24S648/edit?usp=sharing
Dane wyborcze: https://wybory.gov.pl/prezydent20200628/pl/dane_w_arkuszach
Metodologia
Metoda korelacji, którą tutaj stosuję, jest bardzo wrażliwa na zakłócenia, dlatego przed obliczeniami usunąłem niektóre dane. Mogę zapewnić, że nawet bez takiej filtracji te same trendy ciągle były widoczne.
Na początku usunąłem kandydatów, którzy zdobyli mniej niż 1% głosów. Zdobywali oni najczęściej po kilka głosów w nielicznych obwodach. Metoda korelacji Pearsona źle sobie radzi gdy zmienna jest praktycznie dyskretna. Ci kandydaci nie są również największym zmartwieniem Polski w tej chwili.
Następnie nie brałem pod uwagę obwodów, gdzie wszyscy wyborcy byli skuteczni. Było ich 39 ze 165. Były one bardzo małe albo dobrze zorganizowane. Mnie bardziej interesowały obwody, gdzie istniała szansa, aby powstał jakiś bałagan. Interesowało mnie jak ten potencjalny bałagan, przekładał się na większe lub mniejsze szanse poszczególnych kandydatów.
Na końcu dla każdego z kandydatów brałem pod uwagę jedynie obwody, w których zdobywał on więcej niż 10 głosów. Metoda korelacji nie radzi sobie dobrze z wartościami dyskretnymi. Był to też kolejny sposób, aby odfiltrować mniejsze obwody, w których trudno obserwować trendy ze względu na niewielką liczbę danych.
Hipotezy i wyjaśnienia (dodano po publikacji)
W internetowych dyskusjach najczęściej pojawia się domysł, że tam gdzie Andrzej Duda cieszy się większym poparciem, komisje miały większą tendencję w unieważnianiu głosów. Wiele osób próbuje szukać innych potencjalnych czynników wpływających na powstanie takiej zależności. Najczęstszą alternatywą jest domysł, że statystycznie gorzej wykształceni wyborcy PiS popełniają więcej błędów podczas oddawania głosu. Niestety wszystkie te domysły są jedynie niezweryfikowanymi statystycznie hipotezami i mają takie samo znaczenie.
Państwowa Komisja Wyborcza i Ministerstwo Spraw Zagranicznych koniecznie powinny wyjaśnić przyczynę takich anomalii. Musimy ich o to zdecydowanie pytać! Tak naprawdę to oni powinni sami być zainteresowani sprawdzeniem czy nie doszło do manipulacji, a nawet jest to ich obowiązek. Inaczej pozostaną domysły i będą wątpliwości co do rezultatu wyborów. Proces wyborczy powinien być przecież całkowicie transparentny i nie pozostawiać żadnych wątpliwości. Oni muszą nam pokazać badania, a nie odwrotnie.
Piszcie w tej sprawie do biuro@kbw.gov.pl i rzecznik@msz.gov.pl. Jak będzie dużo zapytań, to będą musieli nam odpowiedzieć.
Otrzymałem odpowiedź od Krajowego Biura Wyborczego
Państwowa Komisja Wyborcza nie zajmuje się badaniami statystycznymi dotyczącymi relacji nieważnych głosów do wyniku wyborów. Państwowa Komisja Wyborcza przedstawia wyniki głosowania i wyniki wyborów.
Dobra robota.
Ciekawe wyliczenia, jednak trzeba pamiętać, że mogą być inne wytłumaczenia tej sytuacji niż fałszowanie wyborów, które robione tylko i wyłącznie na zagranicy, przyniosłoby mało korzyści w stosunku do ryzyk.
Dla przykładu, Duda ma wyższe poparcie wśród osób gorzej wykształconych, co jak zgaduję, dodatnio koreluje z błędnym wypełnieniem arkusza – w przypadku wyborów korespondencyjnych było to trudniejsze niż w przypadku głosowania w lokalu, trzeba było wykonać więcej czynności. Jeżeli wspomniana korelacja jest prawdziwa, to w miejscach, gdzie Duda ma większe poparcie, będzie większy procent błędnych wypełnień pakietów. Wyjaśnień danych, które przedstawiłeś może być po prostu więcej niż fałszowanie wyborów.
Pewne jest jedynie, że taka wyraźna zależność istnieje. Nie znamy jej przyczyny. My też nie musimy jej znać. Państwowa Komisja Wyborcza i Ministerstwo Spraw Zagranicznych koniecznie powinny wyjaśnić przyczynę takich anomalii. Musimy ich o to zdecydowanie pytać!
Tak naprawdę to oni powinni sami być zainteresowani sprawdzeniem czy nie doszło do manipulacji, a nawet jest to ich obowiązek. Inaczej pozostaną domysły i będą wątpliwości co do rezultatu wyborów. Proces wyborczy powinien być przecież całkowicie transparentny i nie pozostawiać żadnych wątpliwości.
Cześć!
Na wstepie chciabym napisać, że ciesze się, że ktoś sprawdza takie rzeczy. Od siebie dodam, że:
1. została sprawdzona statystyczna istoność korelacji a nie prawdopodobieństwo zdarzenia (i.e. przykład z monetą) więc to pozwala nam jedynie stwierdzić, że taka korelacja jest statystycznie istotna od 0 z zadanym poziomem ufności;
2. na podstawie współczynnika korelacji nie można wnioskować co jest przyczyną a co skutkiem (np. dodatnio skorelowana liczba utonięć ze spożywaniem lodów). W podanym przykładzie może być np. tak, że regiony w których większe poparcie ma R. Trzaskowski są gorzej zarządzane lub np. chwilowo pogrążone w chaosie spowodowanym przez COVID. Na podstawie współczynnika korelacji wiemy jedynie, że w komisjach gdzie oddano więcej głosów na opozycje to stosunek liczby nieważnych głosów był większy w porównaniu do komisji gdzie większe poparcie obecny prezydent;
3. w podanym przykładzie mamy również skorelowanie samych współczynników korelacji, gdzie jeśli taka dodatnia korelacja występuje dla PAD wtedy możemy oczekiwać, że dla jego najwięszkego konkurenta RT, związek ten będzie odwrotny.
Podsumowując, chciałem jedynie przekazać, że wyciąganie wniosków przyczynowo-skutkowych na podstawie współczynnika korelacji może być dalece mylne i należy zweryfikowac to innymi metodami oraz testami.
Zdecydowanie tak. Starałem się unikać sugerowania związków przyczynowo-skutkowych. Nie wiem czy mi się to udało.
Zgadzam się z tym, co napisali przedmówcy odnośnie możliwego znaczenia innych czynników oraz konieczności ostrożności w wyciąganiu wniosków przyczynowo-skutkowych na podstawie danych korelacyjnych. Ze swojej strony dorzucę takie analizy, które zrobiłem. Zastanawiam się, czy to, Państwa zdaniem, ma sens od statystycznej strony.
Regresja liniowa
Dopiero podniesienie tych wskaźników korelacji do potęgi pokazuje (w ramach regresji liniowej), za jaki % zmienności zmiennej zależnej (wynik kandydata) odpowiadał dany predyktor (odsetek nieważnych głosów).
W dużym uproszczeniu i przybliżeniu wyglądałoby to chyba tak (jeśli się mylę, to niech ktoś poprawi):
odsetek głosów nieważnych pozwalał w tym modelu wyjaśnić
22% wariancji wyniku Biedronia,
10% wariancji wyniku Dudy,
20% wariancji wyniku Kosiniaka-Kamysza
7% wariancji wyniku Trzaskowskiego.
W wypadku głównych kontrkandydatów zatem 90% wyniku Dudy i 93% wyniku Trzaskowskiego w tym modelu wynika z innych czynników.
Można jeszcze policzyć wskaźnik estymacji i zweryfikować jaki przyrost/ ubytek poparcia dla każdego z kandydatów wiązał się ze wzrostek odsetka kart nieważnych o 1 pkt. %. Tak na szybko wychodzi to tak – wzrost odsetka głosów nieważnych o 1 pkt. % pozwala w ramach modelu przewidywać następujący przyrost/ spadek poparcia dla kandydatów:
Biedroń: -0.67 pkt. %,
Duda: +2.40 pkt. %,
Kosiniak-Kamysz: -0.07 pkt. %,
Trzaskowski: -1.42 pkt. %.
Główne pytanie dotyczy tego, czy te zależności utrzymałyby się, gdyby w modelu uwzględnić inne czynniki…
Przełożenie na głosy
Zrobiłem jeszcze dalszy ciąg w celu obliczenia ile głosów mogłoby to ująć/ dodać poszczególnym kandydatom. Schemat obliczeń był taki:
1) Bazując na powyżej podanych wskaźnikach, obliczyłem o ile pkt. %, opierając się na tym modelu, wzrosło/ spadłoby poparcie dla każdego z kandydatów w poszczególnych obwodach (uwzględniając to, ile w każdym z nich było % głosów nieważnych).
2) W oparciu o to, wyliczyłem ile gołych głosów mógłby zyskać/ stracić dany kandydat w każdym obwodzie a potem sumarycznie wśród głosów Polonii.
Wyniki są takie:
Biedroń: -1207 głosów
Duda: +4325 głosy
Kosiniak-Kamysz: -126 głosów
Trzaskowski: -2558 głosów.
Wszystkich głosów ważnych za granicą: 320.192.
Jeśli mój ciąg działań jest jako tako uprawomocniony i sensowny, to te różnice w gołych głosach od Polonii raczej nie są specjalnie znaczące.
Na pewno ciekawie byłoby zweryfikować to w obwodach na terenie Polski.
Dziękuję. Bardzo ciekawa analiza. Odniosę się do ostatniej kwestii tj. jak ewentualne nieprawidłowości wpłynęły na wynik. Bardzo dziękuję za te estymaty. Dzięki nim widzimy jaki istotny jest problem w sposób liczbowy.
W ramach dyskusji dodam, że ewentualna stronniczość wprawdzie nie wpłynęła na osoby, które zakwalifikowały się do drugiej tury, ale:
– sam fakt istnienia ewentualnej nieprawidłowości jest istotny;
– w drugiej turze różnica pomiędzy kandydatami może być minimalna, więc tego typu stronniczość komisji wyborczych może przeważyć o zwycięstwie;
– PiS skubie procenty na każdym kroku np. posiadanie TVP daje im kilka lib kilkadziesiąt procent przewagi; Jak to się poskłada, to bardzo istotnie wpływa na wynik.
Jeszcze raz bardzo dziękuję za ciekawą i ważną analizę.
Cieszę się, że mogłem pomóc.
Nie neguję tego, że należy weryfikować różne możliwe nieprawidłowości, niezależnie od tego na czyją (nie)korzyść by działały. Wszak chodzi o to, żeby wybory były możliwie demokratyczne.
Z tymi ostatnimi analizami, to można by uprościć, teraz pomyślałem, i od razu wziąć zależności między odsetkiem głosów nieważnych a gołymi głosami na kandydata.
Pozdrowienia!
Skoro juz robisz jakies wykresy to na tych wykresach oznacz co jest na osiach bo ni jak nie idzie tych wykresow zrozumiec.
Zrobione 🙂
Inna sprawa że fajnie by było porównać z jakiego powodu głosy są nieważne. Chyba można założyć że jeśli ktoś by chciał zmanipulować wyniki to raczej wybrałby jeden sposób. Ciekawe czy ten sposób się powtarza…
Ludzie też mogli manipulować nieświadomie. Komisje, gdy podejmowały decyzję czy głos uznać za ważny mogły się nieświadomie kierować tym na kogo był oddany, a potem sobie to jakoś racjonalnie wyjaśnić. Dlatego takie ważne jest, aby w komisjach zasiadały osoby o różnorodnych poglądach.
Wszystko to jednak jest gdybologia. Ciekawe hipotezy, ale nie ma dowodów w postaci postępowania statystycznego, aby potwierdzić lub obalić żadnego z podejrzeń. PKW i MSZ mają obowiązek nam te zależności wyjaśnić. Mam nadzieję, że sami są ich od dawna świadomi i sprawa jest zbadana przez ekspertów, którzy wykonali odpowiednie obliczenia. Teraz jedynie musimy ich o to wypytać. Proszę pisać do MSZ i PKW.
Ciekawy jestem jak to będzie po drugiej turze wyborów. Chyba można założyć że w tych samych okręgach wyborczych procentowo powinniśmy mieć taką samą (podobną) liczbę nieważnych głosów? Skoro ktoś zrobił to źle za pierwszym razem i nikt mu nie powiedział że to jest źle to z dużym prawdopodobieństwem zrobi to jeszcze raz. Ewentualna zmiana powinna być raczej na korzyść tzn. mniej nieważnych głosów i w żadnym wypadku nie wyobrażam sobie więcej nieważnych głosów.
Ciekawa analiza, tylko że patrząc na wykresy, to tak na oko korelacja jest spowodowana przez 5-6 okręgów z największym % głosów nieważnych (powyżej ok 8% nieważnych). Reszta okręgów tworzy dość nieskorelowanego bloba. Jak wyglądałby wynik takiej samej analizy, przeprowadzonej dla danych z pominięciem tych kilku okręgów? Czy efekt by się utrzymał?
Pewna zasada mówi, że najprostsze tłumaczenie jest tłumaczeniem poprawnym. A najprostsze jest intencjonalne unieważnianie głosów.
Dobry wieczór. Mam kilka problemów z Pana wyliczeniami, ale ufam, że uda się je rozwikłać. Pierwszym problemem jest kwalifikacja głosu jako nieważnego. Wydaje mi się, że wliczając do tej puli zarówno te głosy, które musiały być odrzucone ze względów proceduralnych (np. brak podpisanego oświadczenia o osobistym i tajnym oddaniu głosu), jak i te, które wynikały z pracy samej komisji, popełnia Pan błąd. To dwie zupełnie różne sytuacje i powinno się je traktować oddzielnie.
Druga kwestia, której nie potrafię zrozumieć to ta, dlaczego wykluczył Pan z korelacji te komisje, które zaraportowały 0% głosów nieważnych? 0% to też wynik, jak najbardziej należało je włączyć do analiz, to spory błąd metodyczny.
Po trzecie, jak Pan zapewne wie, testy parametryczne, a takim testem jest korelacja Pearsona, są słabo odporne zarówno na niewielką próbę, jak i na inne założenia, np. założenie o normalności rozkładu. Wrzuciłem sobie na warsztat cztery zmienne: rzeczywisty odsetek głosów nieważnych (czyli tych, które zostały odrzucone przez komisję na etapie liczenia głosów), wyliczony przez Pana odsetek głosów nieważnych (procentowy) oraz odsetki głosów uzyskanych przez głównych kontrkandydatów (pana prezydenta Dudy i pana prezydenta Trzaskowskiego).
W pierwszym etrapie zbadałem rozkłady tych zmiennych i – bez zaskoczenia – statystyka Shapiro-Wilka pokazała znaczne odstępstwa od rozkładu normalnego dla tych czterech zmiennych. W związku z tym w badaniu powiązań między zmiennymi (oboma typami głosów nieważnych oraz wynikami kontrkandydatów) zdecydowałem się na użycie korelacji rang Spearmana, która jest bardziej odporna na tego typu sytuacje.
Korelacja rangowa (ρ) w przypadku prezydenta Dudy i odsetkiem odrzuconych głosów wyniosła 0,066 i nie była istotna statystycznie (sig = 0,261)
Korelacja rangowa (ρ) w przypadku prezydenta Dudy i całkowitym odsetkiem odrzuconych głosów wyniosła 0,008 i nie była istotna statystycznie (sig = 0,677)
Korelacja rangowa (ρ) w przypadku prezydenta Trzaskowskiego i odsetkiem odrzuconych głosów wyniosła 0,023 i nie była istotna statystycznie (sig = 0,261)
Korelacja rangowa (ρ) w przypadku prezydenta Trzaskowskiego i całkowitym odsetkiem odrzuconych głosów wyniosła -0,025 i nie była istotna statystycznie (sig = 0,634)
Będę wdzięcznym, jeśli odniesie się Pan do tego komentarza.
Zdrowia,
Łukasz Widła-Domaradzki
Dziękuję za bardzo ciekawą analizę. Przeczytałem. Pomyślę i w wolnej chwili coś napiszę.
Zgadzam się z uwagami Kamila, być może ‘coś w tym jest’ ale efekt jest bardzo słaby i jest ponad 90% innych czynników, które mogą wyjaśnić wariancję obu najważniejszych kandydatów. Coś czego nie zauważyli moi przedmówcy. Współczynniki korelacji są dość wysokie jak na tego typu dane i myślę, że spowodowane to jest outlajerami 🙂 (nie mam pojęcia jak to nazywa się po Polsku) przynajmniej w przypadku dwóch najważniejszych kandydatów. Widać wyraźnie, że na ekstremach są bardzo rozproszone wartości. Myślę więc, że ‘trend’ który obserwujemy to zasługa 5-10 okręgów wyborczych. Co do statystycznej istotności to bym się aż tak nie ‘podniecała’, że wynik jest ważny. Coś może być statystycznie istotne ale sam efekt może być bardzo mały i w praktyce nic nie znaczący (tak jak tutaj model wyjaśnia tylko do 10% wariancji). Choć z drugiej strony jeśli chodzi o dane administracyjne współczynnik R2 na poziomie 0.1 (czyli 10% wariancji) to jest już wynik, którym można się ewentualnie zainteresować.
‘Podoba’ mi się teza związana z edukacją, jeśli wyborcy Dudy są gorzej wykształceni to jest większe prawdopodobieństwo oddania nieważnego głosu.
Propozycja kolejnych analiz jest trafna, myślę, że trzeba by to powtórzyć dla wszystkich okręgów w Polsce oraz porównać z poprzednimi wyborami. Jak znajdę chwilę to może sama coś tam policzę. Dobra robota, ale też nie ma co siać paniki (przynajmniej na razie).
p.s. Ja też nie mogłam wziąć udziały w wyborach 🙁 Pozdrawiam z Oxfordu.
Pozdrawiam Oxford. Miejmy nadzieję, że w drugiej turze weźmiemy udział. Dziękuję za ciekawe przemyślenia. Ciesze sie, że tak dużo osób teraz przygląda się tym danym. Wydaje mi się, że powinna to być czynność rutynowa wykonywana w PKW, NGO-sach i redakcjach obserwujących wybory. Właśnie dostałem informację od PKW, że oni niczego takiego nie robią :(. A przecież taki bałagan, jaki powstał byl idealna sytuacją dla naduzyć. Oczywiście nie wiemy czy się zdarzyły czy nie, dlatego sprawdzamy.
Teraz interesuje mnie pytania:
– Ile PiS zyskał utrudniając Polonii udział w wyborach?
– Jeśli powstaną podobne utrudnienia w II turze, jak przełożą się na wynik?
W II turze różnica może być niewielka, więc brak tych głosów może przeważyć.
Moi przedmówcy już skutecznie wypunktowali statystyczną lichość tej analizy, ale pozwolę sobie jeszcze dodać coś od siebie.
Spośród nieco ponad 12 tys głosów wrzuconych przez Ciebie do sztucznie stworzonej kategorii “głosy nieskuteczne”, ponad 90% to nie głosy nieważne, tylko głosy, które nie znalazły się wcale w urnie z jednego z 4 powodów – nie było oświadczenia (11400 kopert), oświadczenie było niepodpisane (211), nie było kopery z głosem (483) lub też koperta była niezaklejona (345).
Wyjęte z tych pakietów kopery do głosowania nie były przez komisję otwierane i nie były wrzucane do urny, zatem komija nawet tych kart na oczy nie widziała i nie decydowała o tym, czy głosy te są ważne czy nieważne, nie było tu żadnego miejsca ani na uznaniowość w określaniu głosu jako ważny/nieważny ani żadnej możliwości “unieważnienia” głosu poprzez dostawienie drugiego krzyżyka (nb takich głosów z więcej niż jednym krzyżykiem było w sumie… 96 na 311 362 wyjęte z urny)
Głosów faktycznie nieważnych, czy to z powodu nieważności karty czy też samego głosu było raptem 663, czyli 5% spośród “głosów nieskutecznych”.
Jeśli natomiast chodzi o głosy nietrafiające do urny to tutaj zauważona przez Ciebie korelacja świadczy o czymś zgoła odmiennym niż sugerujesz. Otóż, o ile wyborcy Trzaskowskiego celowo nie wysyłali niekompletnych pakietów, to w każdej komisji w tych pakietach jest podobny % głosów na Dudę jak jego wynik w danej komisji. Zatem jeśli % “głosów nieskutecznych” jest więcej w komisjach gdzie wygrał Duda, to w praktyce to właśnie Duda najwięcej na tych “nieskutecznych głosach” stracił.
Można próbować też tak:
https://pl.wikipedia.org/wiki/Rozk%C5%82ad_Benforda
Nie chciałbyś przeprowadzić takiej analizy dla całej Polski po 2 turze i sprawdzić, czy mogłoby to zmienić wynik?
Te wybory mnie wyczerpały :(, ale jak się zregeneruję, to kto wie 🙂