Tag Archive | Statistik

Statistik i karta

Statistik är spännande, och lite farligt. Det är lätt hänt att man vrider på siffrorna och väljer ut sådant som ”bevisar” det man själv tror är sant. Det finns många sätt att minska risken för en ”partisk” presentation, men det får man läsa mer om på andra sidor.

I detta inlägg så använder jag statistik från BRÅ (brottsförebyggande rådet) om Anmälda brott under 2015 fördelat på kommuner och per 100’000 invånare.  Läs mer…

NATO utgiftskarta

Då har så åter statistik över NATO ländernas försvarsutgifter publicerats. Jag värderar inte innehållet på något sätt, men tar tillfället i akt att omvandla siffror i tabellform till en karta i QGIS, och ger ett tips till de som emellanåt publicerar data i tabellform. Läs mer…

Brexit

Att resultatet är klart och att det presenterats på massor av sätt i media redan är inget hinder för mig att använda dessa data med QGIS för att se vad som går att få fram. Läs mer…

QGIS 2.10 Statistik

Igår berörde jag den mest påtagliga visuella förändringen i QGIS, nämligen lagereffekter.

I övrigt så känns gränssnittet igen väldigt mycket. Det enda jag kan hitta så här långt är faktiskt en ny panel och en funktion som berör statistik.

Skärmbild från 2015-06-01 18:52:37I bilden ovan har jag valt ut alla byggnader i Eksjö från Open Street Map och skrivit in ett uttryck för den statistiska beräkningen, nämligen area.

Det går att ta bort statistikrubriker från listan om man vill, men här har jag med alla.

Första gången jag gjorde detta så blev det konstiga värden, vilket berodde på att lagret var lagrat i WGS84 och inte projicerat i exempelvis SWEREF99TM. Rätt projicerat så går det att se att det finns 1174 byggnader i urvalet och att den totala byggnadsytan är drygt en halv miljon kvadratmeter. I snitt är en byggnad 440 kvadratmeter medan den enskilt minsta är ca 8 och den största över 26’000.

Statistik kan beräknas på valfritt attribut (som det går att få statistik ur), eller som här genom ett uttryck.

Nu skall jag leta vidare efter nyheter och förbättringar…

Använda Textfält i Intervall

I QGIS kan man välja stilen ”Intervall” för att exempelvis med en färgramp skapa symboler som går gradvis från en nyans till en annan beroende på värdet i fältet.

En förutsättning är att det är ett numeriskt värde… eller?

När jag hämtade hem statistik från IMF så formaterades dessa som text vilket inte blir användbart om jag skall visualisera data gradvis för jämförelser mellan nationer.

När jag råkat ut för detta tidigare så har jag suckat lite och sedan skapat egna attribut med rätt datatyp, baserade på värdet i textfälten.

Helt onödigt i QGIS!

Screenshot from 2014-12-06 17:55:19Det går fortfarande bara att välja fält som innehåller numeriska värden, men det går att skriva in ett uttryck också. Genom att helt enkelt skriva in ”toreal()” så talar jag i princip om för QGIS att programmet helt enkelt skall tolka värdet i det aktuella fältet som ett numeriskt decimalvärde.

Vill man ”tolka” ett värde som heltal så skriver man i stället ”toint()” runt fältnamnet.

Varför har jag inte tänkt på detta tidigare?

Nåja, det kanske finns fler där ute som är lika korkade som jag och inte tänkt på detta tidigare därav detta korta tips.

Vi tror på färg

Detta inlägg är inspirerat av en artikel med rubriken ”We Put 700 Red Dots On A Map” där man diskuterar vår fascination för kartor och vad symboler på dessa kan representera, och sedan lite mindre specifikt att ”vår nation har problem” och ”hur går vi vidare” etc, så artikeln tillför inte så mycket i övrigt.

Jag tänkte ta ett svenskt perspektiv på detta och försöka visa på att fascinationen och känslorna runt statistik är starka även här, trots att vi kanske inte är så medvetna om det.

Hur lite färg och ett skickligt hantverk kan uppröra, sprida glädje eller okunskap, men även informera och utbilda vid en ärlig och objektiv användning.

statistik1I bilden ovan så dras man direkt till rubriken, som är lätt att tolka. Nästa steg blir att granska bilden översiktligt och då det saknas en ”nyckel” eller teckenförklaring så bildar man sig själv snabbt en personlig uppfattning om hur bilden skall tolkas. Sedan använder man denna tolkning för att hitta platser eller liknande som man är intresserad av, och så blir man upprörd, glad eller i bästa fall ifrågasättande till det som presenteras.

statistik2Det lustiga är att om den initiala tolkningen av vad det är man ser förstärker det man redan trodde sig veta eller misstänkte, så ifrågasätter man inte statistiken i samma utsträckning som om det talar emot den uppfattning man tidigare haft.

Valet av färger och fördelning av data är verktyg jag som tillverkare av dessa kartor kan använda för att dessutom vinkla statistiken till ett syfte som passar mig. Med en väl vald rubrik, en anpassad färgskala och en noga vald indelning av statistiken kan jag styra hur du skall uppfatta det du ser i kartan. Vill jag att något skall framhävas som dåligt i förhållande till något bra så använder jag exempelvis trafikljusfärger, rött, gult och grönt. Använder jag en ljus till mörk skala så kan jag vända på den om det förstärker mitt syfte.

statistik5Om man dessutom avsiktligt är vag i sina beskrivningar så kan man likt rubriksättare i tabloidpressen styra läsaren till innehåll som egentligen inte är så intressanta eller värdefulla, bara genom att använda starka ord eller antyda att det finns en koppling till ett aktuellt ämne.

I bilderna ovan så har jag använt exakt samma data och samma värden, men ändrat färgskalor och fördelningen på olika sätt. Rubrikerna har jag valt helt godtyckligt, utan att försöka provocera för mycket, men ni förstår säkert principen.

Vad det egentligen är för statistik?

statistik4Det är helt enkelt det antal tecken som kommunens namn (enligt SCB data) innehåller. Med andra ord i det närmaste nonsens, men hur reagerade du när du tittade på kartorna ovan?

Som konsument kan man aldrig vara säker på vilket syfte tillverkaren av en statistisk karta har haft. Saknas det källhänvisningar, tabeller eller teckenförklaringar så bör man med all rätt vara kritisk i sin granskning. Även om det finns tydliga hänvisningar till en källa, så är det heller inte säkert att dessa data framställts på ett särskilt vetenskapligt sätt, vilket kan vara betydligt svårare att kontrollera. I bland får man helt enkelt bedöma om källan brukar vara trovärdig, om det är data man ifrågasätter.

Om man som karttillverkare försöker vara objektiv och tydlig så är dock statistik på kartor väldigt hjälpsamma när det gäller att belysa statistiska förhållanden där alternativet är ändlösa tabeller med siffror i oklara skalor. Men även om det är du själv som gör kartan så kan man bli lurad av resultatet. Budskapet blir därför:

  1. Använd kartan som hjälpmedel för att visualisera statistik, men var ärlig och tydlig.
  2. Gör det enkelt för konsumenten att själv kontrollera uppgifterna.
  3. Som konsument så skall man även vara uppmärksam på varningssignaler som:
    • alarmerande rubriker,
    • extrema färger samt framför allt
    • avsaknad av teckenförklaringar och källhänvisningar.

Underbara statistik!

Få saker kan få ”snålvattnet” att rinna som stora mängder statistik, om man är GIS intresserad (undrar hur Google translate översatte den meningen?).

Nu har jag hittat en sida som får detta snålvatten att likna Amazonas.

Screenshot from 2014-10-26 10:45:28Klicka på bilden för att gå till sidan.

Här finns massor med olika data och statistik som i många fall passar utmärkt att visualisera med QGIS. Jag tänkte här visa några exempel som jag slängt ihop som hastigast.

googlestatsI kartan ovan har jag lite slarvigt slängt ut statistik från Google om hur många begäran om utlämnande av uppgift som inkommit från olika länder under de första sex månaderna 2014. För att ge en rättvis bild så hade jag behövt slå ihop den delning som görs av begäran från USA. Dessa är indelade i ”Akuta uppgiftsutlämnanden” (171), ”Order om nummerregistrering” (165), ”Husransakningsorder” (3187), ”Order om avlyssning” (7), ”Övriga domstolsbeslut” (798) och ”Stämning” (8211), vilket om man rakt av summerar dessa blir 12539 st… Det finns mer statistik i denna tabell så jag vill inte dra några slutsatser av just detta, det får du själv göra.

Tabellen finns dessutom att hämta från Google på adressen http://www.google.com/transparencyreport/userdatarequests/data/.

Internetanvändare2012Från Världsbanken kan man hämta massor med statistik. I kartan ovan har jag valt andel Internetanvändare per 100 invånare. Vissa länder har låga siffror, men detta skall inte enbart kopplas till fattigdom. Annan statistik gör exempelvis gällande att andelen unga barn, som kanske normalt sett inte använder Internet, är ofta mycket hög i dessa länder. Man kanske därför bör koppla denna typ av statistik även till övrig demografi?

webbindexJag avslutar med en karta med ranking av 81 länder och hur dessa använder Internet. Jag har inte analyserat detaljerna utan konstaterar bara att Sverige är nummer 1.