Archiwa tagu: sondaże

Przeliczanie sondaży, przeliczanie głosów

Jak obliczyć, na ile mandatów może liczyć partia, jeśli znamy tylko ogólnopolskie wyniki sondaży? Są tu dwa podejścia, niczym przysłowiowe dwie szkoły – falenicka i otwocka. Pierwsza próbuje zrobić to tak, jak to się odbędzie, to znaczy obliczać podział mandatów dla każdego z okręgów z osobna. To jednak wymaga przyjęcia jakiegoś wzoru, opisującego jak np. ogólny wzrost poparcia o 1 pp. przekłada się na zmianę w każdym z okręgów. Można założyć, że poparcie wzrasta wszędzie o tyle samo, czyli 1 pp. – lecz może sensowniej byłoby przyjąć, że wzrosty są jakoś zróżnicowane i zależne od stanu wyjściowego. Takie szacunki można poczynić na podstawie wcześniejszych wyników wyborów. Tylko skąd mamy pewność, że kolejne zmiany będą mieć takie same charakterystyki, jak zmiany kilka lat wcześniej? Łatwo tu o błąd. Dlatego sam skłaniam się do drugiej szkoły, która opiera się na odkryciu, jak system D’Hondta przekształca głosy na mandaty (naukowy opis znaleźć można tu). Obrazowy opis tego mechanizmu jest oparty na metaforze kociołka i chochelki – partie przygotowują razem posiłek i każda z nich wrzuca do wspólnego kociołka pół mandatu za każdy okręg. Zawartość kociołka to zatem liczba partii razy 20,5. Potem każda z nich wyjada z kociołka mandaty chochelką wielkości swojego procentowego poparcia. Czyli w przypadku rywalizacji pięciu partii, ta z nich, która ma 40% poparcia dostanie jakieś 40 mandatów – po odliczeniu wcześniej poniesionych „kosztów” będzie mieć zatem „zysk” około 20 mandatów. Taka zaś, która ma 10% poparcia, wyje z kociołka tylko jakieś 10 mandatów, czyli będzie mieć 10 mandatów mniej, bo przecież wcześniej wrzuciła tam swój „wsad do kotła” w postaci 20,5 mandatu.

Takie przeliczenie jest proste – nie wymaga obliczania wyników dla każdego z okręgów z osobna. Prosta tabelka w Excelu pozwala od razu podzielić mandaty między partie. Tylko to zakłada, że wynik nie jest w żaden sposób skrzywiony. Tymczasem są dwa źródła możliwych skrzywień.

Po pierwsze siła głosu w poszczególnych okręgach nie jest równa. Zależy od liczby przydzielonych mandatów oraz różnic we frekwencji. Jeśli więc jakaś partia ma 30% poparcia, to może się okazać, że – jeśli ma większe poparcie w okręgach o niskiej frekwencji – że ono realnie odpowiada jednak np. 31%. Jeśli jednak jej poparcie jest w takich okręgach niższe od średniego, to jej realna siła może spaść do – powiedzmy – 29%.

Po drugie, ogólny wzór zakłada, że żadna partia nie miała szczególnego szczęścia ani wyjątkowego pecha i głosy zmarnowane w każdym z okręgów – naddatki na kolejny mandat, czyli właśnie ten „wsad” wrzucany do kociołka – odpowiadają średnio połowie mandatu. Można to sobie wyobrazić tak, że dla każdego z okręgów rzucamy kostką w grze o wielkość naszej straty. Jeśli rzucimy wyniki 1-3 to tracimy mandat, jeśli 4-6 nie. Powinniśmy stracić średnio 0,5 mandatu na okręg. Taka byłaby logika całego mechanizmu, gdybyśmy mieli nieskończenie wiele okręgów wyborczych. Lecz naszych okręgów jest 41. Nie działa tu jeszcze prawo wielkich liczb, lecz też szczególne odchylenia są bardzo mało prawdopodobne. Jakieś jednak mogą się zdarzyć.

Mam świadomość, że takie odchylenia występują. Przekonują o tym dwa zestawienia. Pierwsze pokazuje, jakie różnice w liczbie zdobytych mandatów wynikały z uwzględnienia różnej siły głosu w okręgach. Policzyłem to tak, że głosy z każdego okręgu zważyłem ogólną siłą głosu, czyli liczbą głosów ważnych przypadającą na jeden mandat. Tak można ustalić efektywny procent poparcia. Taki procent przeliczyłem „chochelką” i odjąłem od wyników te ustalone na podstawie oficjalnych procentów poparcia. Wykres pokazuje takie nadwyżki i straty dla każdej partii czy kategorii partii osobno, lecz także bilans dla trójki partii tworzących dziś „Blok Senacki”. W czterech ostatnich wyborach wyglądało to tak:

Widać, że są tu pewne wzory odchyleń, lecz przyjęcie na ich podstawie poprawki dla tegorocznych sondaży proste nie jest. Zanim do tego wrócę, jeszcze oszacowanie drugiego rodzaju odchyleń – takich, których nie da się wytłumaczyć systemowymi efektami. To różnica pomiędzy modelem z uwzględnieniem skrzywień wagą głosu a realnymi wynikami. Te wyglądały tak:

Tu już żywcem nie widać żadnych niepodważalnych wzorów. Każdej z dużych partii choć raz udało się idealnie wpasować w model. Bilans Bloku Senackiego wydawał się przez trzy kadencje stale ujemny, bo w ostatniej przeskoczyć zdecydowanie na drugą stronę. Poparcie dla Palikota i Kukiza układało się szczęśliwie, dając im dodatkowe mandaty, zaś zastępująca ich w roli czarnego konia Konfederacja była największym pechowcem.

Te odchylenia można teraz dodać, pogrupować dla każdych wyborów oddzielnie i na koniec porównać z błędami sondaży – konkretnie zaś z różnicą pomiędzy realnymi wynikami a przeliczeniem „chochelką” średniej sondaży z ostatniego tygodnia (na podstawie zestawienia przygotowanego na potrzeby konkursu „Pytia”).

Gdyby ktoś miał na temat skrzywień wynikających z dystrybucji głosów każdej z partii pomiędzy okręgami genialną wiedzę i w ostatnim dniu kampanii, w oparciu o poprawkę z tego wynikającą, przeliczył średnią ostatnich sondaży, to jego prognoza niezwykle rozminęłaby się z rzeczywistością. PiS miałby w takiej prognozie 250 mandatów. Poprawka spotęgowałaby błędy sondaży.

Dodatkowo, model pozwalający przewidzieć odchylenia od standardowych spodziewanych wyników, trzeba nakarmić jakimiś danymi. Mogą to być sondaże (jak widać, o za małej precyzji) albo wyniki wcześniejszych wyborów. Testem trafności modeli stworzonych w oparciu o wcześniejsze dane, jest sprawdzenie, jaki jest błąd oszacowania dla dowolnego przypadku ze zbioru bazowego, jeśli stworzyć model w oparciu o wszystkie pozostałe przypadki. Tu mamy bazę w postaci czterech jedynie wyborów, więc można to sprawdzić dla każdej kombinacji. Czyli dla każdych wyborów z lat 2007-2019 liczymy średnie skrzywienie dla danej partii z pozostałej trójki głosowań i odejmujemy to rzeczywiste. Wychodzi to tak:

Odchylenia te nie są znacząco mniejsze niż precyzja samej „chochelki”, zastosowanej bez żadnej korekty. Tu akurat uwzględnienie historii choroby nie bardzo pomaga w przewidywaniu, co się nam przytrafi następnym razem. To właśnie dlatego wolę rozwiązanie prostsze, tylko powiązane z kluczowym zastrzeżeniem – to się może potoczyć trochę inaczej, ale nie mamy mocnych podstaw by sądzić, w którą stronę. Mamy po przeliczeniu generalne wyobrażenie, w którą stronę to idzie, lecz szczegóły, to i tak dopiero wyjdą w praniu, w noc powyborczą.

Moje podejście różni się jeszcze pod jednym względem od opinii niektórych zwolenników stosowania poprawek. Nie przychodzi mi do głowy twierdzić, że oni są niekompetentni i nieuchronnie tkwią w błędzie. Oni próbują po swojemu, ja po swojemu. Nie trzymam swojej wiedzy pod korcem – tabelkę w Excelu, pozwalającą w minutę przeliczyć wynik sondażu na mandaty, wysyłam wszystkim chętnym. Przypuszczam, że autorzy bardziej złożonych modeli nie będą chcieli wprowadzić postronnych w tajniki swojego podejścia. Choć może się mylę – w każdym razie chętnie bym się z tym podejściem zapoznał. Może mnie przekonają.

PS. Próbowałem kiedyś namówić kolegów-matematyków na stworzenie modelu rozrzucającego sondażowe poparcie po okręgach. Odpowiedzieli mi, że to się da zrobić tylko naruszając newralgiczne założenia o spodziewanych rozkładach poparcia i frekwencji. Choć zawsze można zastosować jakiś inny rozkład:

Obrazek z bardzo ciekawego opracowania Ireneusza Sadowskiego.

Lipcowe sondaże, lipne prognozy

Czy lipcowe sondaże to źródło lipnych prognoz? W uzupełnieniu do tekstu w Tygodniku Powszechnym trzy wykresy pokazujące przywołane tam dane.

Najpierw zestawienie średnich lipcowych sondaży z 16 ostatnich lat. Wyróżniono dominujący duet, dwóch mniejszych udziałowców „bandy czworga” oraz pozostałych, pokazanych jako jedna kategoria. Nazwy bez wnikania we wszystkie metamorfozy:

Twierdzenie, że w Polsce pogłębia się polaryzacja to – w świetle tych danych – raczej myślenie życzeniowe. Może to jednak tylko cisza przed burzą? Wykluczyć się tego nie da, lecz jak dotąd zmiany szły częściej w stronę depolaryzacji niż polaryzacji. Na początek porównanie według partii:

Niewielką polaryzację widzieliśmy przed 16 laty. Od tego czasu nasz osławiony „duopl” wychodził z kampanii osłabiony. Osiągnięcie przez PiS „czwórki z przodu” wymagałoby odwrócenia trendu, dość tu jednak widocznego, nawet jeśli to tylko cztery przypadki.

Można to jednak też pogrupować inaczej, uwzględniając pozycję względem władzy i rankingi. Wygląda to wtedy tak:

Generalnie spodziewać się można jeszcze całkiem znaczących zmian, choć lipcowe radości z miejsca na sondażowym podium w pięciu na sześć przypadków przynosiły potem rozczarowanie. Choć z drugiej strony trzeba mieć też na uwadze, że w ostatnich miesiącach sytuacja była całkiem stabilna:

Żadnego tsunami tu na razie nie widać, zaś ewentualne „równie pochyłe” to na razie są takie raczej „płaskawe”. Media są złaknione dramatycznych zwrotów akcji, lecz wygląda na to, że im bardziej ich pragną, tym bardziej ich brakuje. Walka jest wyrównana a słabości wszystkich pięciu stron na razie nie zapowiadają gwałtownych zmian. Pewnie jednak stopniowo rozgorączkowanie będzie mieć głębsze źródła. Do tego przyjdzie wrócić w pierwszych dniach września.

PS. Wyjaśnienia co do metodologii – wszystkie sondaże i wyniki są standaryzowane tak, że pominąłem niezdecydowanych oraz te partie, które ani w lipcowych sondażach, ani w październikowych wyborach, nie przekroczyły 2%.

Tuskograd

Wygląda na to, że „genialny strateg” poprowadził swoją partię na Tuskograd. Nie dość, że ze wspaniałego zwycięstwa – zarówno symbolicznego, jak i praktycznego – nic nie wyszło, to jeszcze skończyło się na jednoznacznej klęsce w totalnym okrążeniu. Czy najnowszy sondaż może otrzeźwić przynajmniej część kierownictwa PiS? W każdym razie prysznic to naprawdę zimny. Gdyby w najbliższą niedzielę odbyły się wybory, PiS oddaje władzę i nawet sojusz z Kukizem nie daje szansy na jej utrzymanie. Przeliczenie sondażu „Rzeczpospolitej” na mandaty wygląda tak:

Można się bronić przed rzeczywistością na dwa sposoby. Po pierwsze, podważać sondaże jako takie. Tyle tylko, że przez miniony rok koronnym argumentem polityków PiS, mającym potwierdzić sensowność prowadzonych działań, było właśnie sondażowe prowadzenie. Teraz dalej prowadzą, tylko ten wynik nie daje już złudzeń. Przy takim wyniku Kosiniak-Kamysz może powtórzyć za Pawlakiem „nie wiadomo, kto wygra wybory, ale na pewno nasz przyszły koalicjant”. Nic nie wskazuje na to, by mieli woleć PiS od PO z przyległościami.

Oczywiście można przejść do drugiej linii obrony – do wyborów dużo czasu a oderwana od rzeczywistości opozycja może jeszcze zawsze rządzącym podarować zwycięstwo. Tylko rządzący muszą chcieć przyjąć ten prezent. Tymczasem przez miniony rok prezesowi najwyraźniej udało się wmówić najbliższym współpracownikom, że jego geniusz pozwala zawiesić podstawowe prawa polityki. Ten sondaż potwierdza je jednak raz jeszcze. To opozycja odbywa pokutę polegającą na podnoszeniu się z kolejnych porażek. Od rządzących wyborcy oczekują zwycięstw realnych, nie zaś moralnych. To opozycja podgrzewa konflikty, żeby akumulować kapitał społecznego niezadowolenia. Próbą rządzących jest zdolność do ich ograniczenia, nie zaś dokładanie do kotła. Rządzącym pomóc mogą konflikty zewnętrzne (jak przed trzema laty agresja Rosji na Ukrainę uratowała symboliczne zwycięstwo PO w eurowyborach). Jednak najwyraźniej kluczowa część  Polaków nie uważa już relacji z UE za coś zupełnie zewnętrznego. Na pewno zaś nie zaczną uważać Tuska za obcokrajowca tylko dlatego, że tak to czuje jego wewnątrzkrajowy oponent. Tego typu retoryka trzymała PiS w ławach opozycji przez długie 8 lat. Najwyraźniej może go tam zaprowadzić raz jeszcze.

PS. Jedno zastrzeżenie do tytułowej analogii. Generalnie jestem zagorzałym przeciwnikiem „argumentum ad Hitlerum” czy też „Stalinum”. Wszystkie porównania do faszyzmu i komunizmu w ocenach ideowych aspektów polityki uważam za kompromitujące dla tych, którzy ich używają. Natomiast Stalingrad jest dla mnie przede wszystkim wydarzeniem militarnym, w którym skupiają się najróżniejsze problemy decyzyjne. Innego aspektu tej bitwy używałem przed ponad czterema laty do zobrazowania problemów PO. Można się o tym przekonać tu: https://www.tygodnikpowszechny.pl/syndrom-stalingradzki-17794

Rząd zależny od 5%

Już prawie codziennie słyszę pytanie o to, kto wygra wybory. Pod wpływem tych pytań ułożyłem sobie w głowie taką myśl: 95% wyborców wyznacza możliwe scenariusze. 5% rozstrzyga, który z nich się ostatecznie spełni. Zobrazowanie na podstawie ostatnich sondaży.

Z czterech najnowszych sondaży zrobiłem mieszankę, rozdzielając pomiędzy podane partie głosy niezdecydowanych. Wyszło mi takie poparcie:

  • PiS – 39%
  • PO – 25,6%
  • ZL – 9,6%
  • NRP – 7,3%
  • Kukiz’15 – 7%
  • PSL – 6,1%

Na tej podstawie policzyłem sobie podział mandatów – także dla hipotetycznych pięciu scenariuszy. Każdy z nich opiera się na przesunięciu nie więcej niż 2,5% u jednej partii. Dwa pierwsze zakładają, że nastąpią dwa takie przesunięcia – jedno na plus, drugie na minus. Trzy kolejne zakładają, że po dwie partie stracą a po dwie zyskają.

Pierwszy scenariusz wydaje się najbardziej prawdopodobny. Kukiz kontynuuje swój lot koszący, spadając pod próg, zaś PSL dostaje więcej niż w sondażach, dzięki walorom swoich lokalnych aktywistów. W drugim scenariuszu pojedynek pomiędzy Petru a nową Lwicą Lewicy rozstrzyga się na korzyść tego pierwszego, co skutkuje przesunięciem rzeczonych 2,5% po tej linii. Zjednoczonej Lewicy brakuje niecałego procentu do wysokich koalicyjnych progów.

W trzecim scenariuszu dzieje się dokładnie na odwrót – Nowoczesnej Ryszardzie Petru brakuje do progu, bo szala przeważa na lewo. Do tego jeszcze, tak jak w pierwszym scenariuszu, PSL zyskuje a Kukiz traci. W czwartym scenariuszu liberalno-lewicowy elektorat, skutecznie wystraszony perspektywą rządów PiS, mobilizuje się nadspodziewanie. PSL i Kukiz pod progiem, zaś PO i lewica dostają bonus. Wreszcie ostatni scenariusz to również porażka nowych inicjatyw, tylko że zamiast lewicy, dodatkowe 2,5% dostaje PiS. Każda z małych partii choć raz traci, zaś z dużych choć raz zyskuje. Spodziewane podziały mandatów dla punktu wyjścia oraz wszystkich scenariuszy pokazuje wykres:

scenariusze2015Gdyby obecne sondaże nie kłamały, to PiS ma przed sobą niezły zgryz – czy wiązać się koalicją ze zbieraniną z list Kukiza, czy też odpowiedzieć na dzisiejszą zawoalowaną ofertę PSL. Teoretycznie potrzebne jest tylko kilka mandatów, które można wyłuskać z różnych partii… W każdym razie realnej alternatywy dla koalicji tworzonej przez PiS nie ma.

Gdyby jednak Kukiz wypadł z gry, zaś ludowcy wrócili do znanego nam już rozmiaru, to oni stają przed dylematem. Czy stworzyć rząd ze zwycięzcą, czy też anypisową czwórkoalicję. Łatwo w takiej koalicji nie będzie, zwłaszcza przy nieprzyjaznym prezydencie. Dodatkowo 6 rozłamowców z PO może ich zostawić zupełnie na lodzie.

Takich problemów nie ma, jeśli lewica wypada z obiegu – i Kukiz, i PSL, choć mają swoje kluby, grzeją ławy opozycji. Większość PiS jest minimalna, ale jest. Mogą się do niej co najwyżej przyłączyć. To dałoby jej większy komfort, lecz warunków to chyba nie bardzo mają jak stawiać.

Zyski PSL i lewicy mogą sprawić, że wystarczą one PO do zmontowania koalicji przeciw PiS. Bez Petru może być trochę łatwiej, lecz przecież zagrożenia pozostają te same. Jeszcze łatwiej byłoby, gdyby to Petru zastąpił w takiej koalicji PSL. Choć napięcia wewnątrz PO mogą być od tego jeszcze większe. Konserwatyści stają się bardziej osamotnieni.

Gdyby jednak nowe inicjatywy osłabły, zaś wzmocnił się PiS, to może on liczyć na całkiem stabilną większość. Brakuje do niej dosłownie kilku procent – 2,5 zyskane i 5 stracone przez dwie listy tuż nad progiem.

Jak nietrudno zauważyć, przewidywanie czegokolwiek ostatecznego ma bardzo słabe podstawy. Pewna jest tylko niepewność – zapewne do ostatniej chwili.