Brottsligt med QGIS

https://bra.se/ (Brottsförebyggande Rådet) kan man skapa sina egna tabeller med statistik, med alldeles för många inställningsmöjligheter.

Problemet är inte att komma åt statistiken, utan att formatera om den för användning i QGIS. I detta inlägg tar jag ett exempel. När jag testat några gånger så hittade jag metoder som var lite enklare, men inte perfekta.

Skärmklipp från 2018-04-08 08:31:12

När man klickar sig vidare på sidan så hittar man ”Gör din egen tabell”. Genom att klicka på denna länk så får man ett antal olika val som skapar en tabell med de urval man valt.

Skärmklipp från 2018-04-08 08:33:25

Exporten är begränsad till 10’000 urval, så man får eventuellt dela upp urvalet i flera utsökningar och kombinera ihop dessa efteråt.

Skärmklipp från 2018-04-08 08:34:44

Ju mer omfattande utsökningen är desto mer komplex blir tabellen. Ett bekymmer är att data inte redovisas på enskilda rader, utan som extra rader under respektive områdesrubrik. Dessutom i flera kolumner om man väljer flera olika perioder. Här har jag valt att spara som ”textfil”, men det blir nog enklare att välja att ”spara som databastabell”.

Jag har skapat skräddarsydda Pythonskript för att plocka ut de data som är intressanta och skriva dessa till mer lämpligt formaterade tabeller, men i detta inlägg så tänkte jag göra det någorlunda manuellt i ett kalkylark.

Skärmklipp från 2018-04-08 08:38:35

Jag skapar helt enkelt nya kolumner med anpassade rubriker till höger om originalkolumnerna. Värdet hämtar jag med formler från fälten till vänster. Varje område (markerat i bilden ovan) upprepas genom hela tabellen (efter att vissa rader tagits bort) och det går därför att kopiera formlerna genom att ”ta tag i” och ”dra” punkten nere till höger vid sidan av hela tabellen.

Det nya området markeras sedan i sin helhet och kopieras med ctrl-c. Resultatet klistras sedan in på en ny flik

Skärmklipp från 2018-04-08 08:46:30

Vid kopieringen så gäller det att inte kopiera formlerna utan innehållet, vilket görs på lite olika sätt om man använder Excel, Calc eller Numbers.

Jag passar även på att radera texten ”kommun” från tabellen, då detta inte finns med i det vektorlager som jag skall koppla samman tabellen med i QGIS.

Den resulterande tabellen kan sedan sorteras vilket därmed plockar bort alla tomma rader. Tabellen sparas sedan på nytt som en csv-fil. Jag har valt att använda semikolon i stället för kommatecken då det redan förekommer kommatecken i min tabell.

Skärmklipp från 2018-04-08 09:17:53.png

Geometrin hämtar jag från SCB, som har lager med olika indelningar färdiga att använda med olika former av statsistik i olika GIS.

För att kunna göra sammankopplingen så behöver tabellen först läsas in i QGIS. Det görs via dialogen ”Datakällor” och ”Separerad text”.

Skärmklipp från 2018-04-08 09:19:40.png

Det är bara att peka ut filen, välja rätt tecken för separerare och sedan se till att välja ”Ingen geometri”.

Och därmed är jag egentligen klar. Man kan behöva justera någon stavning här och där för att alla områden i kartan skall få ett värde från tabellen, exempelvis så står det ”Malung” i en av tabellerna och ”Malung-Sälen” i en.

För att kunna göra jämförelser mellan kommuner med tanka på befolkningsmängd så hämtar jag även lite befolkningsstatistik från SCB. Det är inga problem att koppla samman data från flera tabeller samtidigt till ett och samma vektorlager i QGIS.

Skärmklipp från 2018-04-08 09:53:16.png

Jag skapar kopplingen mot samma målfält, men det är inte nödvändigt. Det går till och med att skapa kopplingen till den andra tabellen mot ett fält i den första…

Nu kan jag enkelt skapa nya virtuella fält i tabellen för statistiken fördelat på befolkningen i varje kommun.

brottsstatistik_2017.jpg

Genom att använda olika stilar för samma lager och den nya funktionen med kartteman, så kan samma karta användas i en layout med olika utseende, genom att varje karta kopplas till ett bestämt tema.

Nu har jag inte lagt otroligt mycket tid på att skapa en ”korrekt” bild av de valda brottstyperna i bilden ovan, men ljusa färger är ”liten” förekomst av rubricerad brottstyp per invånare och mörka färger är ”större” förekomst. Ju större skillnad det är mellan mörkt och ljust desto tydligare är det att vissa områden har en större andel av typen än andra.

Exempelvis är Skadegörelse vanligare förekommande i Stockholmsområdet och Södertälje. I övriga landet är det mindre variationer.

För stöld och rån finns det mer ”intressanta” skillnader, som i alla fall för mig var lite oväntade. Exempelvis Åre, Eda, Malung och Strömstad har större andel av denna brottstyp än omgivande kommuner. Om detta hänger samman med att dessa sannolikt har ganska mycket gränsverksamhet mot Norge… kan jag bara spekulera i, men i övrigt är även denna brottstyp mer vanlig i större tätortskommuner.

Våldsbrotten är betydligt jämnare fördelade mellan kommuner med fler eller färre invånare.

Mina statistikkartor är som vanligt inte speciellt vetenskapligt underbyggda utan fokuserar mer på metoden att hantera data i GIS. De som sedan är bättre på statistik och hur denna kan tolkas kan förhoppningsvis använda mina beskrivningar för att skapa mer korrekt underbyggda statistiska kartor.

Erfarenheter

  • Kontrollera skapade tabeller så att alla fält innehåller samma data som i kolumnen som skall kopplas samman. Annars kan vissa områden bli utan värden.
  • Använd ”databasformat” i stället för ”text” vid export från BRÅ.
  • Kontrollera tabellrubriker så att dessa inte har ”otillåtna” tecken.
Annonser

Taggar:,

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com Logo

Du kommenterar med ditt WordPress.com-konto. Logga ut /  Ändra )

Google+-foto

Du kommenterar med ditt Google+-konto. Logga ut /  Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut /  Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut /  Ändra )

w

Ansluter till %s

%d bloggare gillar detta: