Statistik, sanning eller förbannad lögn?

På ett blogginlägg så hittade jag en karta där sympatier för Sverigedemokraterna fanns angivna per kommun.

Bilden hämtad från Charlotta Mellanders blogg: http://www.vertikals.se/charlotta/2013/10/22/sverigedemokraternas-geografi/

Nu skulle det kunna vara vilken typ av karta som helst med statistik och jag har inte heller läst artikeln som jag hämtat kartan ifrån, det är inte det som är det intressanta för mig.

Nej det intressanta är hur vi väljer att åskådliggöra statistik. Börja med att titta på intervallet för de olika färgerna, varför har man valt dessa intervall. Spelar färgskalan någon roll för hur man uppfattar resultatet, tänk dig samma karta fast från rött till grönt…

För att testa lite så gick jag till valmyndighetens hemsida och laddade hem data för valkretsar och xml-filer för valresultatet 2010.

För skojs skull så använder jag röd till grön skalan så får ni själva avgöra om det blir någon skillnad.

vaĺ_sd_kvantil

Först ut är samma fördelning som i artikeln, nämligen en ”Kvantil” fördelning som innebär att det är lika många värden i varje intervall, hur nu det kan vara logiskt när man redovisar procentuella resultat och inte skördevolymer? Denna skala ”döljer” effektivt resultat som sticker ut från mängden, men det blir lika många fält av varje färg.

val_sd_standardavvikelse

Tar man i stället en standardavvikelse som indelning (bild ovan) så skulle det bli mer statistiskt korrekt, men bara om man räknar faktiska röster och inte som här procent. Lite mindre smickrande för Skåne dock.

val_sd_natural_breaks

Ungefär samma resonemang blir det om man väljer ”Natural Breaks”, men då får i alla fall Skåne lite mer sällskap avseende de gröna färgtonerna.

val_sd_pretty_breakes

Hoppsan, vad hände här? Kartan blev inte lika mönstrad som tidigare och helt plötsligt så är det bara några få kommuner som sticker ut extra. I kartan ovan har jag använt mig av ”Pretty Breaks” där resultatet redovisas i 5% intervall. För redovisning av ett procentuellt resultat så tycker jag nog att denna indelning är mer rättvisande. Man kan dock fundera på vilket intervall som skall användas.

Går man sedan in på valdistrikt och zoomar in lite på Skåne så framträder ännu en bild.

val_sd_pretty_valdistrikt

I denna bild fick jag modifiera färgerna något så att de stämmer någorlunda med färgerna för de tidigare procentangivelserna. Resultat högre än 20 % fick således en ännu mörkare färg. Om jag behållit samma färgskala så hade bilden sett ut som den här nedan, vilket ju blir helt annorlunda.

val_sd_pretty_distrikt

Jämför de två sista bilderna och lägg märke till att det är exakt samma intervaller i skalan, men olika färger. Detta ger två helt olika intryck bara för att man väljer att ta hänsyn till tidigare resultat, eller inte.

Med detta så hoppas jag att ni tittar lite närmare på redovisning av statistik nästa gång det kommer på tal. Men framför allt så skall ni gå till Valmyndighetens hemsida och hämta hem egna data och testa själva att koppla ihop shapefiler med tabelldata. Källa: http://www.val.se/val/val2010/statistik/index.html

Annonser

Taggar:,

Trackbacks / Pingbacks

  1. Valresultat 2014 | Geosupportsystem - 15 september, 2014

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com Logo

Du kommenterar med ditt WordPress.com-konto. Logga ut / Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut / Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut / Ändra )

Google+ photo

Du kommenterar med ditt Google+-konto. Logga ut / Ändra )

Ansluter till %s

%d bloggare gillar detta: