Egy matematikus professzor tanulmánya szerint így csalhattak a magyar választásokon!
Matematikai anomáliák a választásokon
Lehet, hogy csalás volt
Elgondolkodtató, és tartalmának ismeretében rendkívül fontos tanulmányt küldött a Demokratának egy matematikus-statisztikus, aki neve elhallgatását kérte, ami a leírtak ismeretében érthető. A nem könnyen olvasható tanulmányt annak fontossága miatt szó szerint közöljük. Ennek lényege, hogy tudományos módszerekkel (matematikai statisztika) vizsgálva a végeredményt a csalás alapos gyanúja merült fel.
A cikk tartalma
- A budapesti EVK eredmények túl közel esnek egymáshoz
- Ezt bizonyítja az ún. „Khi négyzet próba”
- A 63% körüli eredmény érdekes egybeesései
- A városi kontra vidéki szórás különbségei
- A Benford törvény, amin szintén elbukik a választási eredmény
Fontos! Ez az adatbázis a valasztas.hu-n szombatig elérhető!
Az egyik, amire nyilván sokan felfigyeltek, az az első eredmények publikálása volt. Feltűnt, hogy 1,37%-os feldolgozottságnál ez volt az állás:
Fidesz 53,28%
Tisza 38,68%
Mi hazánk 6,11%
DK 0,74%
MKKP 0,57%
Csakhogy kevesen gondoltak bele, hogy az 1,37 % ekkor már 82200 szavazatot jelentett, amely 80-szorosa egy átlagos közvélemény kutatási mintának. Matematikailag bizonyítható, hogy az adatoknak egyenletes eloszlást kell mutatniuk, vagyis egy ekkora mintánál már szinte a végeredményt kell lássuk.
Mert mi is lett a végeredmény (98,93%-os feldolgozottságnál)?
Fidesz 39,56% – az eltérés 13,72%
Tisza 52,10% – az eltérés 13,42%
Mi hazánk 5,72% – az eltérés 0,39%
DK 1,13% – az eltérés 0,39%
MKKP 0,81% – az eltérés 0,24%
Vagyis három pártnál a kezdeti és a végső eredmények eltérése minimális és nagyságrendileg ugyanakkora, 0,39 és 0,24 százalék körüli, a két versengő pártnál azonban megdöbbentően magas, több mint 13 százalék. Ráadásul a tendencia is megváltozik. Ez matematikailag nem lehetséges. A rendelkezésre álló adatok statisztikai elemzése során olyan rendellenességek azonosíthatók, amelyek felvethetik a választási eredmények központi befolyásoltságának lehetőségét.
A budapesti eredmények koncentrációja
Budapest 16 választókerületéből 8 esetben a Tisza Párt eredménye a 63% körüli, rendkívül szűk (0,5 százalékpontos) sávban (62,5% – 63,5%) alakult ki. Ez egy olyan statisztikai jelenség, amelynek a valószínűsége természetes választási környezetben elenyésző lenne.
Binomiális valószínűség-számítás:
A modell alapfeltétele, hogy a körzetek eredményei a várható érték körül mozognak valamilyen szórás mellett. A szórás a választókerületek társadalmi és politikai heterogenitását mutatja meg.
A jelenség magyarázata a körzetek közötti különbségekben (a szórásban) rejlik. Ha a 16 körzet társadalmi összetétele, politikai preferenciája és demográfiája szinte hajszálpontosan megegyezik (a szórás 1%), akkor ez a csoportosulás nem meglepő. Azonban egy valós, heterogén választási környezetben, ahol a körzetek közötti szórás jellemzően 5% felett van, az ilyen „tömörülés„ matematikai valószínűsége a nullához közelít. (A szavazatok vizsgálatakor csak a szavazóhelyiségek eredményeit néztük. Ezt torzíthatják az utólagos adatok, így fontos lehet a vizsgálatkor ezekhez visszatérni.)
A következő lépések lennének indokoltak a gyanú tisztázására:
Szavazóköri variancia vizsgálata: Ha a körzetek eredménye ennyire hasonló, akkor a körzeten belüli szavazóköröknek is hasonló eloszlást kellene mutatniuk. Ha ott nagy a szórás, de a végeredmény mégis ”beáll„ 63%-ra, az statisztikai anomáliára utalhat.
Részvételi korreláció: Vizsgálni kellene, hogy a részvételi arány és a szavazati arány között van-e gyanús összefüggés (például a magasabb részvétel mindig a 63% felé közelíti-e az eredményt).
Anomália esetén vizsgálandó: pl. a számláló, összeadó program működése befolyásolt volt-e, lehetett-e. Kötelezően előírt volt-e a jegyzőkönyvvezetőknek a gépbe bevitt adatok kézi számológéppel történő utánszámolása.
Az előbb megfigyelt eseményre (16-ból 8 furcsa halmozódást mutat) a Khi-négyzet próba az egyik legfontosabb eszköz, mivel ez mutatja meg, hogy a megfigyelt gyakoriság mennyire tér el szignifikánsan az elméletileg várható gyakoriságtól. Itt azt nézzük meg, hogy a kapott eredmények (például a 63,0%, 63,1%, 62,9% stb. eloszlása) követnek-e egy természetes, haranggörbe-szerű eloszlást.
A hipotézis H0: Az eredmények eloszlása megfelel a normál statisztikai szórásnak.
A próba lényege: Ha túl sok adat sűrűsödik egyetlen szűk tartományban (a ”púp„ túl magas és vékony), a Khi-négyzet értéke megnő.
Kritikus érték: Ha a számított érték meghaladja a táblázat szerinti kritikus szintet, akkor a H0 hipotézist elvetjük – tehát az eredmény feltehetően nem a véletlen műve.
Ha a 16 körzetből 8 (azaz 50%) esik egy olyan szűk sávba, amelynek a valószínűsége egy normális 5%-os szórás mellett csak kb. 8%, akkor számításkor a számlálóban a (8 – 1,28)^2 egy hatalmas értéket ad. Ez a khi-négyzet értéket az egekbe tolja, a hozzá tartozó p-értéket (valószínűséget) pedig messze a bűvös 0,05-ös (5%-os) szignifikancia-szint alá viszi.
A természetes folyamatokban a szórás (entrópia) törvényszerű. Ha a Khi-négyzet próba eredménye ”túl tökéletes„ illeszkedést vagy extrém sűrűsödést mutat, az a statisztikában a Too Good To Be True jelenség.
A hipotézis felállítása
H0 (Nullhipotézis): Az eredmények eloszlása véletlenszerű, és megfelel a természetes társadalmi szórásnak (ami egy ilyen kiélezett választáson általában 5-7% körül mozog.
H1 (Alternatív hipotézis): Az adatok eloszlása nem magyarázható a véletlennel, külső (szisztematikus) hatás érte őket.
Megfigyelt értékek: 8 körzet bent, 8 körzet kint.
Várható értékek: Egy reális, 5%-os szórás mellett annak az esélye, hogy 1 körzet pont ebbe a szűk sávba essen, mindössze ~8%. Tehát 16 körzetből elméletileg csak ~1,28 körzetet várnánk ebbe a sávba – és nem nyolcat!
A Khi-négyzet próba kiszámítása
Osszuk az eredményeket két kategóriába: a ”kritikus sávba„ (62,5% – 63,5%) esők és az azon kívüliek.
A képlet: alapján számított khi négyzet: 38,26.
Értékelés
Egy 1-es szabadságfokú khi négyzet eloszlásnál a kritikus érték (p = 0,05-nél) 3,84. A mi számított értékünk (38,26) ennek a tízszerese.
Matematikai konklúzió: A p-érték ebben az esetben kisebb, mint 0,000001. Ez azt jelenti, hogy kevesebb mint egy az egymillióhoz az esélye annak, hogy ez a mintázat a véletlen műve legyen, feltéve, hogy a körzetek társadalmilag heterogének.
Megjegyzés az 5%-os szórás használatához:
Társadalmi heterogenitás: Budapest választókerületei nem klónok. Még ha hasonló is az átlagos pártszimpátia, a kerületek belső szerkezete (lakótelep vs. kertváros, bérlakás vs. saját ingatlan) jelentős varianciát generál. A statisztikai tapasztalat azt mutatja, hogy egy országos vagy városi szintű választáson a körzetek közötti szórás szinte soha nem megy 4-5% alá.
A 1%-os szórás abszurditása: Ahhoz, hogy a 63% körüli „tömörülés” normális legyen, a szórásnak 1% környékén kellene lennie. Ez azt jelentené, hogy a 16 budapesti körzet demográfiailag és politikailag 99%-ban azonos. Ez szociológiai képtelenség.
Érzékenységvizsgálat: Az elemzésben éppen ezért mutattunk be több szcenáriót. Még ha engedékenyebbek vagyunk is, és 3%-os szórásra állítjuk a modellt (ami még mindig rendkívül homogén környezetet feltételez), a 8 körzet sűrűsödésének esélye még mindig csak 0,04% (1 a 2500-hoz). Ez továbbra is bőven a tudományos szignifikancia-határ (5%) alatt van.
A statisztikában ezt a jelenséget gyakran a választási dinamika torzulásának nevezzük. Ha egy egyéni választókerületben a feldolgozás során az arányok nem fokozatosan és logikusan (a különböző karakterű szavazókörök beérkezésével) változnak, hanem hirtelen, rendszerszerű eltolódások látszanak, az külső beavatkozásra is utalhat.
A ”Vízszintes Beállás„ (Plateau) vizsgálata
Javasoljuk annak ellenőrzését, hogy a feldolgozás utolsó 20-30 százalékában (amikor a nagyvárosi, jellemzően tiszás szavazókörök jönnek) a görbe mutat-e egy természetellenes kiegyenesedést.
A gyanú: Ha az adatok beérkezése ellenére az arány fixen megmarad adott %-on, az azt jelezheti, hogy a rendszer nem összead, hanem egy előre meghatározott hányadot ”oszt ki„ a beérkező nyers adatokból.
Logisztikai regresszió a részvételre: Érdemes lenne megvizsgálni, hogy van-e összefüggés a részvételi arány és a pártarány között. Ha a részvétel növekedésével a szavazatarány nem organikus görbét ír le, hanem mindenhol az adott % felé konvergál, az ellentmond a politikai szociológiának (ahol a magasabb részvétel általában eltolja az arányokat egyik vagy másik irányba).
Míg Budapesten a 63% volt a mágneses pont, országos szinten a Tisza Párt adatai több megyében is 50% feletti, de gyanúsan ”kerek„ tartományokban (pl. 52% vagy 55%) mutattak klasztereződést bizonyos feldolgozottsági szakaszokban.
A ”szimmetria-effektus„: Érdemes megvizsgálni, hogy azokban a körzetekben, ahol a Tisza 63%-on állt, a kormánypárti szavazatok aránya mennyire volt fixen a maradék (pl. 30-33%) környékén. Ha két ellentétes oldal eredménye szinte tükörképszerűen, konstans különbséggel mozog több körzetben is, az központi algoritmusra utalhat.
Városi vs. Vidéki szórás különbsége
A paradoxon: Ha az országos adatsorban találunk olyan 10-15 választókerületet, ahol a szórás hirtelen lecsökken 1-2%-ra (tehát túl hasonlóak az eredmények), az a stratégiai körzetmódosítás vagy a célzott adatbeavatkozás jele lehet.
Az országos adatoknál a szórás természetes módon magasabb (8-12%), mint Budapesten.
Statisztikai integritásvizsgálat: A Benford-féle második számjegy teszt
A Benford-teszt esetén a szavazatok számának második számjegyének gyakoriságát vizsgáljuk. N=106 Mj: A Benford első számjegy vizsgálat nem alkalmazható sikerrel, mert a választási adatok amelyek egy adott tartományba, például 2000 és 4000 közé esnek, ezek természetes módon korlátozzák az első számjegy varianciáját. (pl. nincs 4-nél nagyobb első számjegy.)
A Benford-törvény alapján egy 106-os mintánál a kiválasztott számjegyek (0, 3, 9) gyakoriságának 9 és 12,7 között kellene mozogniuk plusz-mínusz a szórás. Ehhez képest a Fidesz-KDNP eredményei közt a 9-es szám 17-szer szerepel!
A modern választási kriminalisztika (pl. Nigrini módszertana) a MAD (Mean Absolute Deviation) mutatót használja az adatok „természetességének” mérésére. Ez az összes számjegy átlagos eltérését nézi.
Close conformity (Tökéletes): 0,000 – 0,008
Acceptable (Elfogadható): 0,008 – 0,012
Non-conformity (Manipulált): > 0,015
Az adatok alapján a MAD értékeket 0,025 körülire számoltuk mindkét párt esetén, ami a „Non-conformity„ kategóriát meghaladja. Bármi, ami a várt darabszámtól 3-szoros szórás felett van, már „bizonyító erejű anomália” lehet. Az esetünkben 17-9=8, 8:2,87= 2,78. Ez közelít ahhoz az értékhez, ami bizonyító erejű anomália lenne.
Miért elkerülhetetlen a további, független vizsgálat?
A fenti matematikai és statisztikai elemzések alapján megállapítható, hogy a választási eredményekben olyan rendszerszintű anomáliák mutatkoznak, amelyekre a természetes társadalmi folyamatok nem adnak elégséges magyarázatot. A további vizsgálat az alábbi három pillér miatt elengedhetetlen:
A statisztikai valószínűtlenség mértéke: A binomiális valószínűség-számítás és a Khi-négyzet próba egybehangzó eredménye szerint annak az esélye, hogy a budapesti körzetek fele közel ugyanazt az eredményt produkálja, kevesebb mint egy az egymillióhoz. A tudományos szignifikancia határait sokszorosan túllépő torzulás nem hagyható figyelmen kívül egy demokratikus folyamat ellenőrzésekor.
A Benford-féle második számjegy teszt és a MAD-mutató szignifikáns eltérései (0,025 a kritikus 0,015 helyett) arra is utalhatnak, hogy a szavazatszámok nem organikus egységekből adódtak össze. Ez a matematikai torzulás például olyankor jelentkezhet, amikor az adatokat egy központi algoritmus egy előre meghatározott célérték (például a 63%-os vagy más arány) szerint osztja el vagy korrigálja.
A transzparencia és a hitelesség védelme: Amennyiben a választási rendszer informatikai és összesítő moduljai (plateau-jelenség, részvételi korreláció) nem kerülnek független audit alá, a választás legitimációja matematikailag marad kérdéses. A statisztikai „Too Good to be True„ (túl szép, hogy igaz legyen) jelenség minden esetben a mérési folyamat integritásának sérülését valószínűsíti.
Javasolt azonnali lépések:
A szavazóköri szintű nyers adatok (jegyzőkönyvek) és a kerületi végeredmények közötti matematikai koherencia teljes körű, szúrópróbaszerű ellenőrzése. A választási szoftver összesítő algoritmusának független informatikai auditja, különös tekintettel a beviteli adatok kerekítési és visszaosztási mechanizmusaira. A részvételi adatok és a pártszimpátia közötti korreláció vizsgálata azokban a választókerületekben, amelyek szokatlan statisztikai homogenitást mutattak.
A demokrácia alapja a választási rendszerbe vetett közbizalom. Ha a matematika ilyen súlyos kétségeket ébreszt, a vizsgálat elmaradása magát a bizalmi rendszert áshatja alá hosszú távon.
Felhasznált módszertan és források:
Mebane, W. R. (2006): Election Forensics: The Reliability of Precinct-level Election Returns. University of Michigan. – A szavazóköri szintű anomáliák detektálásának alapműve.
Beber, B., & Scacco, A. (2012): What the Numbers Say: A Digit-Based Test for Election Fraud. Political Analysis. – A számjegy-alapú statisztikai tesztek módszertana.
Cantu, F. (2019): The Digital Footprints of a Dirty Election. British Journal of Political Science. – Az adatfeldolgozási folyamat során megjelenő digitális lábnyomok elemzése.
Pearson, K. (1900): On the criterion that a given system of deviations… is such that it can be reasonably supposed to have arisen from random sampling. – A Khi-négyzet próba matematikai alapvetése.
Demokrata.hu
Follow @jobboldalihirek