Care sunt șansele ca un om care votează în alt județ să prefere un anumit partid? Expertul România Curată, Andreea Măierean, doctor în științe politice al Universității din Boston, spune că se poate prevedea că acest om, dacă nu e student și nu rezidă într-un centru universitar va vota semnificativ mai mult pentru Victor Ponta. Asta se poate reformula așa: Cei mai mobili oameni din România neuniversitară au votat în ziua alegerilor pentru Victor Ponta. Sunt peste opt sute de mii.
Statistica ne arată că acest lucru nu e întâmplător. Dar care e raționalitatea lui? Ce ar câștiga organizatorii unor alegeri dacă ar deplasa suporterii dintr-un județ într-altul? Nimic la prima vedere, că acestea nu sunt alegeri uninominale, first past the post, unde primul clasat câștigă. Mai rămâne doar ipoteza că în anumite locuri e mai avantajos să votezi Ponta. De ce? Ipoteza cea mai plauzibilă e cea a votului multiplu.
Nu e însă singura ipoteză. CNP-uri false sau aparținând unor morți pot fi introduse mai ușor pe liste suplimentare în anumite circumscripții. Toate ipotezele conduc către ideea că participarea la vot a fost de fapt mai slabă, și anumite aberații statistice, ca mobilizarea foarte mare în mediul urban s-ar putea să aibă explicații de acest gen.
Numai examinarea semnăturilor ne poate spune. Dar există temei suficient acum pentru a o face. Președintele SAR, Alina Mungiu-Pippidi spune că astfel se văd costurile absenței unui sistem de evidență a voturilor informatizat – pentru că acesta ar atrage imediat atenția dacă un CNP s-ar repeta. ”Datele arată o deviere de la simpla întâmplare”, spune Alina Mungiu-Pippidi. ”Cât e de mare devierea nu știm, pentru că orice formă de fraudare s-ar fi folosit afectează totalul votanților. Dar e o deviere semnificativă care poate explica în jur de 5-6 la sută din votul total. Aștept cu interes orice explicație alternativă pentru care cine nu votează la el în localitate preferă Ponta”.
Ordinea primilor doi candidați nu ar fi, în acest scenariu, afectată, dar dacă diferența în turul doi va fi mai mică de atât și mecanismul e refolosit, se poate pune în pericol chiar rezultatul alegerilor. Scopul exercițiului ar fi fost astfel nu doar o victorie psihologică mai mare, ci și un antrenament pentru al doilea tur de scrutin.
***
Ce arată, de fapt, analiza (vezi mai jos). Că, de exemplu, în județul Giurgiu, 14,33% din votanți sunt pe liste suplimentare. Dintre aceștia, 61% au votat cu Ponta, iar 15% cu Iohannis. În Mehedinți, din cei 13,72% votanți pe liste suplimentare, 57,49% au votat Ponta, și 21,10% Iohannis. Situația e asemănătoare și în Mehedinți, Olt, Teleorman, Dolj, Călărași sau Gorj, județe cu peste 10% din voturi exprimate pe liste suplimentare. De fapt, exceptând județele cu mari centre universitare (București, Cluj, Timiș sau Iași, unde o parte importantă din voturile pe listele suplimentare sunt ale studenților, și Sibiul, care reprezintă o situație atipică), cu cât ponderea (procentul) listelor suplimentare e mai mare în numărul total al voturilor din acel județ, și diferențele în favoarea lui Ponta sunt mai mari în acel județ (cu diferențe de peste 20, 30 sau chiar peste 40% în favoarea lui Ponta). Iohannis conduce (cu diferențe oricum mai mici) în preferințele electoratului în județe în care ponderea listelor suplimentare în numărul total al voturilor este dată fie de numărul mare de studenți, în Sibiu, sau în județe în care listele suplimentare au o pondere de 6-7%.
***
Mai multe despre analiză
Baza de date
Am folosit date aparute in presa pe subiectul listelor suplimentare () si a procentelor castigate de primii doi clasati la nivel de judet (). Este o analiza a voturilor exprimate pe teritoriul Romaniei, voturile din diaspora nu au fost luate in calcul (in strainatate toti cetatenii romani votand pe liste suplimentare). Am exclus deasemenea cele trei mare centre universitare (Bucuresti, Iasi, Cluj), pornind de la premisa ca acolo numarul mare de votanti pe liste suplimentare ar putea fi explicat de prezenta ridicata a studentilor.
Metoda
În tabelul Excel intitulata “analiza” (click aici), am ordonat judetele in ordinea descrescatoare a ponderii voturilor pe liste suplimentare. Coloanele C-I (din tabelul Excel menționat) contin date despre: numarul de voturi pe liste suplimentare, ponderea voturilor pe liste suplimentare, numarul total de voturi, ponderea voturilor pentru Victor Ponta, numarul de voturi pentru Victor Ponta, ponderea voturilor pentru Klaus Iohannis si numarul de voturi pentru Klaus Iohannis. Ponderea totala a voturilor pe liste suplimentare a fost calculata prin raportarea numarului total de voturi pe liste suplimentare la numarul total de voturi inregistrate la nivel national. Ponderea la nivel national a voturilor pe liste suplimentare a fost de 9.32%. Asemanator, am calculat media nationala a diferentei dintre cei doi candidati: 12.49%.
In coloana J am calculat “delta voturi suplimentare” reprezentand diferenta dintre ponderea voturilor pe liste suplimentare la nivel judetean si media nationala de 9.32%.
In coloana K am scazut din procentul de voturi Ponta mai intai procentul de voturi Iohannis si apoi diferenta dintre ei la nivel national. Variabila e numita “delta voturi Ponta”.
Grafice
Graficele au fost obtinute cu functia Excel Scatter, axa X este “delta voturi suplimentare”, axa Y “delta voturi Ponta”. Primul grafic a luat in considerare toate valorile pentru “delta voturi suplimentare”, al doilea doar valorile pozitive ale variabilei. Valoarea R-squared a crescut in al doilea grafic, ceea ce indica o mai puternica corelatie. Concluzia: judetele care au fost peste media nationala a votului pe liste suplimentare au fost castigate de Victor Ponta (cu procente mai mari decat media lui nationala).
***
foto main: desen de Dan Perjovschi
Si ce aveti de gind daca detineti asemenea dovezi. Cine se poate sesiza?
Dumneavoastră nu ați dus până la capăt raționamentul, și propuneți explicația fraudei cu cnp multiplu. De ce excludeți ipoteza greșitei numărători?? Sau din contră, în centrele de votare presupuse a priori cu rezultate semnificative Ponta au venit masiv alegători opozanți pentru a mai dilua ponderea .. Ceea ce trebuie realizat este 1. examinarea listelor 2. renumărarea voturilor, de preferat a tuturor, dacă nu, a unui eșantion reprezentativ. Nu văd de ce nu s-ar realiza, studiul este un început de dovadă.
Blaga a zis ca examineaza toate listele. Dar daca nu e vot multiplu nu vad cum se vor prinde ca sunt CNPuri inventate. Cum zince dna Pippidi, daca nu ai toate CNPurile in calculator nu poti face mai nimic.
Hmmm…. interesant studiu, precum si explicatiile aferente! Ok, qui prodest? pentru ca trebuie facut ceva! Solutii bune si viabile ? Pe bune, m-am saturat de atata suspiciune, ranchiuna, ură!
…cui prodest, nu qui. dativul, va rog.
Aceasta analiza e buna, insa neconvingatoare, arata doar o corelatie intre proportia votantilor mobili si proportia voturilor pentru Ponta.
Daca doriti o dovada cu adevarat stiintifica, este nevoie de:
– proportia votantilor lui Ponta dintr-un anumit judet fara listele suplimentare
– proportia votantilor lui Ponta (numai) de pe listele suplimentare
In statistica, ar fi cu adevarat imposibil ca aceste doua proportii sa fie semnificativ diferite. Iar daca sunt semnificativ diferite, aceasta este dovada. Problema se reduce un simplu test de semnificatie, insa pe baza datelor prezentate nu pot sa scot nicio concluzie intrucat nu am proportia (doar) de pe listele suplimentare.
Am facut si regresia intre timp, correct, controland pentru centre universitare. Dovedeste decat ca vourile pe listele suplimentare se abat semnificativ de la o distributie normala – in facoarea lui VP. Cum au facut a aparut intre timp, de exemplu un doctor a autentificat votanti imobili la care s-a mers cu urna mobile. Doctorul nu era insa nici macar doctoral localitatii. Deci multe CMPuri de pe listele suplimentare sunt in plus. Probabil nici macar nu s-a folosit acelasi procedeu de la o localitate la alta.
in Dragalina urna mobila de vot a mers doar la familiile care votau cu Ponta, ceilalti care erau stiuti ca familii cu ura fata de PSD au fost ocoliti sau trimisi sa stea linistiti acasa ca o sa ajunga mai tirziu urna de vot pe la 11-12 noaptea. O buna parte dintre acestia fiind batrini cu probleme fizice fara posibilitate de transport iar copii plecati la oras sau in strainatate nu mai pot face absolut nimic sa se revolte sau sa initieze o actiune in justitie!!!
Din pacate acestea sunt discutii intre noi. Vad ca nimeni (ACL, UDREA, MACOVEI etc) nu reclama la BEC. Nu vi se pare curios??
Macovei a solicitat la BEC renumararea buletinelor declarate nule:
https://www.facebook.com/MonicaMacoveiUE/photos/a.330775430350974.73077.130380413723811/708063135955533/?type=1&theater
iar la Parchetul General a depus plangere penala prin care solicita anchetarea celor care au impiedicat dreptul la vot in diaspora.
Conferinta de presa sustinuta de Macovei unde spune chiar la inceput despre plangerea penala
https://www.privesc.eu/arhiva/54254/Briefing-sustinut-de-Monica-Macovei
@andreea: foarte interesanta analiza! Dar:
R-patrat de 0,1 inseamna ca varianta e explicata de modelul de regresie (liniar in cazul asta) in proportie de 10%. Adica foarte putin. E “mult” mai mult decat pt Iohannis (3%), dar potrivirea cu modelul de regresie e foarte proasta oricum.
Sigur, intrebarea e daca modelul liniar e adecvat, sau daca dimensiunile modelului sunt adecvate. Graficul de acum vazut cu ochiul liber nu arata deloc o corelatie. Parca la Ponta sunt mai aproape de linia imaginara (ceea ce explica un R patrat ceva mai bun) dar tot imprastiate sunt.
Alta intrebare e daca judetul e “unitatea de analiza” corecta. Judetele sunt foarte variate ca populatie, etc.
@Adrian
> Daca doriti o dovada cu adevarat stiintifica, este nevoie de:
> – proportia votantilor lui Ponta dintr-un anumit judet fara listele suplimentare
> – proportia votantilor lui Ponta (numai) de pe listele suplimentare
> In statistica, ar fi cu adevarat imposibil ca aceste doua proportii sa fie semnificativ diferite.
De ce? Sa consideram un judet cu un centru universitar. Judetul voteaza marjoritar A, centrul universitar voteaza majoritar B pe liste suplimentare. E clar ca cele doua vor fi semnificativ diferite, dar nu e nimic in neregula? Din nou ne intoarcem la judet ca “unit of analysis”
@andreea: “Dovedeste decat ca vourile…” Dragnea ar fi mandru de exprimarea asta :) :)
dear all
daca undeva au fost afisate datele la nivel de circumscriptie cu preferintele exprimate si cu numarul de persoane pe liste suplimentare oricine poate face regresia asta. nu la nivel de judet, ci la nivel de circumscriptie. Eu am verificat ce a facut andreea nu scotand judete din analiza ci adaugand un control pnetru centre universitare, am pus in el si bacaul, si targovistea, deci larg, si e semnificativ. Daca nu o puteti face singuri, trimiteti linkul la datele pe circumscriptie sau baza de date pe adresa noastra. Ca Andreea la Boston sau eu la Berlin nu avem accesul la date pe care il aveti voi daca lucrati prin staffuri de partid sau in Bucuresti. Hai, actiune, nu doar sfaturi la altii. Andreea e lucrat in Excel si descriptiv, acolo nu sintc orelatii, doar teste de semnificatie. Am facut asa ca sa poate oricine verifica, nu doar cine are softurile noastre universitare, STATA or whatever. E deviere semnificativa, sa caute procuratura de ce! Dupa statistica, investigatia.
NU procuratura. Curtea Constitutionala. E singura in masura sa refuze validarea “rezultatelor” votului.
Datele complete sunt deja publicate pe site-ul BEC.
Ponderea mare a voturilor pe liste suplimentare are o alta explicatie decat turismul electoral: multi oameni nu locuiesc acolo unde au adresa oficiala. Explicatia este legata de legislatia in vigoare – pentru a schimba domiciliul ai nevoie de o serie intreaga de acte care sa dovedeasca identitatea si domiciliul (pentru unii este efectiv imposibil – cei care locuiesc in chirie fara forme legale), de timp si de bani. Situatia aceasta se intalneste cel mai des orasele mari – care sunt centre universitare (si care au fost excluse din analiza presupunandu-se ca acolo voteaza pe liste suplimentare doar studentii).
Restul “analizei” este din ciclul “Daca torturam datele suficient vor marturisi absolut orice”. Semnificatia statistica nu este OK (probabil de aceea nici nu a fost furnizata), deci nu exista nici o legatura intre variabile.
Ciudat , Dragnea a insinuat ca in Teleorman s-au fraudat alegerile , dar in favoarea lui Iohanis . Conform lui , 99% din cei care au votat pe liste suplimnetare in Teleorman au votat Iohanis . Trist e ca multi il vor crede pe Dragnea .
Il pot crede pe Dragnea cand guvernul lui Dragnea e cel care nu publica datele?????
Foarte fain algoritmul statistic, mi-a placut mult. Simplu, dar bine gandit.
Cu toate astea, sunt cateva probleme care fac praf acest text si ii cam discrediteaza aura de stiintificitate. Cel mai important factor de discreditare este acel “dovada fraudei”, dar exista si altele, mai subtile.
1. Titlul. Demostratia spune, de fapt, ca judetele in care procentul de voturi pe listele suplimentare a fost mai mare decat media nationala au inregistrat un scor mai mare pentru Victor Ponta. Nu avem de unde sa stim daca diferenta provine din listele suplimentare sau nu. Titlul sugereaza ca votantii mobili au votat mai degraba cu Ponta. Chiar nu avem de unde sa stim asta.
2. Judetele sunt tratate si ca fiind egale, ceea ce mi se pare putin gresit. Judetele turistice, gen Brasov, Timis, Sibiu, etc, atrag foarte multi turisti din toata tara – si probabil turisti cu mijloace financiare foarte bune, pe cand judetele sarace, precum Giurgiu sau Olt, atrag nu turism propriu zis, ci tranzit oras-comuna al fortei de lucru, oameni care sunt mai degraba fara mijloace financiare foarte bune. Judetele cu delta voturi suplimentare pozitiv sunt aproape toate judete de acest tip, in care la sfarsit de saptamana migrezi pentru serviciu sau pentru a reveni la mama, acasa.
3. Corelatia cu lista suplimentara vine si din faptul ca judetele cele mai sarace au avut si cea mai mare scadere de populatie in ultimii ani, insa numele acestora nu au fost, in general, iradiate din listele electorale. Ce a rezultat a fost ca cineva avea domiciliul legal in Giurgiu, locuia la parinti intr-o comuna si vota in comuna respectiva. Sunt multe studii care arata ca oamenii cei mai saraci sunt cei cu cele mai mici sanse de a-si schimba actele de identitate odata cu mutarea dintr-un loc in altul.
Sigur, judetele sarace, in care exista nevoie de migratie interna pentru munca sunt si judetele percepute ca subordonate baronilor, asa ca ar fi usor sa confundam cele doua categorii. Nu spun ca nu exista frauda, chiar deloc. Ce spun este ca artificiul de fata, desi foarte simpatic, nu este deloc suficient pentru a da un asemenea titlu sau explicatie.
Pentru asta, v-as ruga respectuos sa modificati textul pentru a spune, de fapt, doar ceea ce poate fi spus. Ar ajuta mult la credibilitatea meseriei in care lucrez si eu.
@ Adrian Dusa
Exista listele cu datele detaliate, inclusiv pe liste permanente, suplimentare, voturi nule, etc. pe sectii de votare, pe judete, etc. undeva pe siteul BEC. Nu am timp acum sa caut dar stiu ca sint.
Sint date semnificativ diferite chiar si in acelasi judet, intre localitati si chiar si intre sectii de votare din aceeasi localitate. Ar merita studiate datele.
Ne-au trebuit 25 de ani sa realizam ca suntem furati , ca n-I se incalca dreptul fundamental de cetatean .Furturile de voturi , traseismul electoral , mortii care voteaza ; nimic nu e ceva nou , am auzit cu totii de ele . Problema e ca nu am auzit pe nimeni sa fie tras la raspundere vreodata fie el organizator sau traseist , sau vreo-unul bagat la puscarie pentru cativa ani asa cum prevede legea . Nu eu nu am auzit sa se intample , de ce ? , simplu pentru ca nici cei care au castigat nici cei care au pierdut , nu au avut nici un interes “sa dezgroape mortii ” ca doar tocmai au votat saracii , iar ei si-au vazut in continuare de impartit ciolanul . Stim cu totii ca sistemul este corupt iar cancerul psd are radacini adanc infipte asa ca acum e momentul nostru Al cetatenilor de rand sa iesim in fata pt ca adevarata putere a unui stat sunt cetatenii si nu guvernul care-I reprezinta . De aceea este datoria noastra civica si morala ca pe 16 noiembrie atunci cand mergem la vot daca sesizam ceva , orice in neregula ( aviz celor care gandesc alfel din zonele greu marcate cu rosu in turul 1 ) sa se faca auziti in special in mediul online , orice dovada concreta este bine venita . Spun asta pt ca nu , nu se vor da batuti iar in turul 2 vor incerca sa fure si mai mult ca doar asta stiu sa faca cel mai bine . Va multumesc .
“In statistica, ar fi cu adevarat imposibil ca aceste doua proportii sa fie semnificativ diferite…” (A. Dusa) Cum adica? Imi pot imagina nenumarate scenarii in care ar fi substantial diferite. De pilda, un centru universitar mare cu multi studenti din afara localitatii care prefera un anumit candidat; sau un judet in care locuitorii instariti ai capitalei de judet traiesc – dar nu cu rezidenta formala – in satele satelite si prefera sa voteze acolo, avand si preferinte electorale speciale; s.a.m.d. Pana nu se controleaza pentru o serie de variabile plauzibile asumptia ramane, cred, nefondata.
In rest, ce vad eu din grafice este ca, pe tara, nu exista, practic, o corelatie intre DVS si DVP; iar, in judetele cu vot pe suplimentare peste media pe tara, corelatia este foarte mica. De ce nu ar fi intamplatoare?
In fine, nu vad, cum s-a mai spus, daca voturile au venit, intr-adevar, de pe listele suplimentare sau nu, ci doar ca pare sa existe o slaba corelatie intre DVS si DVP…
Modul in care ati construit variabila dependenta este insuficient explicat, asa cum este ea acum pare bazata pe asumptia omogenitatii teritoriale a diferentei dintre voturile pentru Ponta si Johannis (de asta scadeti media nationala a diferentelor dintre cei doi candidati), ceea ce este extrem de dubios daca ne uitam la orice harta cu rezultatele sau stim ceva despre puterea variabila teritorial a organizatiilor de partid in Romania.
Dincolo de aceasta problema, o regresie care sa poata fi luata in serios ar trebui sa includa nu doar variabile de control despre centre universitare ci si variabile de control despre demografia si economia localitatilor si altele care sa masoare ‘strongholds’: prin nivelul de voturi castigate de PSD la alegeri precedente in fiecare dintre unitatile de analiza, prin culoarea politica a primarului (unde sunt modificari substantiale recente dupa permiterea migrarii). Asadar ar fi nevoie de date dezagregate – nivel de sectie de votare/ localitate, nu la nivel de judet, unde sunt prea putine observatii pentru o analiza multivariata care sa ia in calcul explicatiile alternative.
Este foarte probabil, date fiind profilurile de votanti din exit-polluri, ca o categorie foarte numeroasa dintre cei care au votat pe listele suplimentare: navetistii sau oamenii care nu si-au schimbat actele datorita conditiei precare, din motivele explicate de Dani Sandu sa il prefere semnificativ pe Ponta. Stiind sau banuind deja asta, dumneavoastra faceti o greseala importanta de metodologia cercetarii pentru al doilea grafic: selectati cazurile in functie de o variabila (ponderea voturilor listelor suplimentare) care este corelata cu variabila dependenta si practic ne aratati relatia doar acolo unde este mai puternica si chiar si asa variatia explicata este extrem de redusa.
Testul T sugerat de domnul Dusa ar lamuri intr-adevar 100% lucrurile dar el nu poate fi realizat pentru ca la numarare voturile venite de la cetatenii de pe listele suplimentare nu au nimic distinctiv fata de cele de la cetatenii de pe listele permanente ca sa poata sa fie contabilizate separat. Si este corect normativ sa fie asa, dat fiind principiul secretului votului.
Pentru doritori, am pus pe web in format CSV datele din turul I pe localitati
E greu de lucrat cu datele in excel pentru ca sunt peste 3200 de randuri… Datele pot fi accesate de exemplu in softul R care e gratuit si dispune de toate functiile profesionale.
Am vrut sa fac aplic algoritmul Andreei pe localitati (in loc de judete) dar cele mai recente critici m-au descurajat. Poate mai tarziu…
Nu sunt deloc expert dar cred ca metodele non-parametrice sunt mai potrivite.
Spre exemplu, pentru a testa ipoteza ca in localitatile mici s-a votat mobil pentru Ponta, am facut rapid o sesiune in R in care am calculat corelatia Spearman intre numarul de votanti mobili si procentul obtinut de Ponta in localitatea respetiva. Rho e 0,14 pentru localitati sub 10000 de locuitori cu drept de vot si 0,21 pentru localitati sub 5000 de locuitori cu drept de vot. Pentru Iohannis ambele teste indica corelatii negative.
Daca aveti alte idei teste, le puteti face singuri sau le puteti sugera aici.