Nyfiken på mera statistik

Nu har jag kört lite statistik, och det har jag gjort tidigare också. Anmälda brott från BRÅ sedan tidigare, och Ohälsotal från Försäkringskassan nyligen. Men finns det något samband mellan dessa?

Först en jättelik brasklapp! Detta är enbart ett exempel på hur man kan använda olika verktyg för att visualisera statistik! Eventuella (för snabbt dragna) slutsatser som du som läsare eventuellt drar av det jag presenterar här är upp till dig.

Det går att göra en ”kvot” mellan ohälsotal och antal anmälda brott i en kommun, men det visar inte på om det finns något samband. För det så krävs det andra verktyg än ett GIS.

Jag kommer att använda Python och två tillägg för detta nämligen Bokeh och Pandas.

sudo pip install bokeh
sudo pip install pandas

Jag använder Pandas för att läsa in min tabell med data från csv, och Bokeh för att generera en ”scatter plot” i ett diagram.

>>> import pandas
>>> from bokeh.plotting import figure, output_file, show
>>> df = pandas.read_csv('statistik.csv')
>>> p = figure(title='Ohälsotal/Anmälda Brott', plot_width=800, plot_height=1200)
>>> p.scatter(x=df.bpk_per100k, y=df.Ohalsotal_2016_1, size=10, color="navy", alpha=0.5)
>>> p.xaxis[0].axis_label = 'Brott per 100 000 invånare'
>>> p.yaxis[0].axis_label = 'Ohälsotal'
>>> show(p)

Ovanstående är allt jag behöver för att producera ett diagram som i stort svarar om det finns något samband mellan anmälda brott och ohälsotal.

Skärmbild från 2017-09-05 19-06-17.png

Med min begränsade kunskap om statistik så ser det inte ut att finnas något tydligt samband mellan brott och ohälsa. I så fall skulle diagrammet blivit mycket tydligare ”diagonalt”.

Jag laborerar vidare lite och ändrar skalorna lite, lägger till att kommunens invånarantal styr punktstorleken och det totala antalet anmälda brott styr färgen (det vill säga inte fördelat per 100’000 invånare). Dessutom har jag en HoverTool som visar kommunnamnet när muspekaren hålls över en punkt. Även utan detta blir Stockholm, Göteborg och Malmö lätta att identifiera.

bokeh_plot(1).png

Men jag har bara börjat nosa lite på allt som går att göra.

Bokeh diagram är fullständigt interaktiva och det går att zooma och panorera i diagrammet som man vill, samt väldigt enkelt spara ut en bildfil över det som visas i diagrammet.

Det finns massor med inställningar och genom att använda exempelvis Jupyter Notebook så kan man utforska ganska mycket statistik interaktivt och generera väldigt mycket trevliga diagram.

Bokeh kan dessutom köras mot en ”server” och därmed skapa kopplingar till data i realtid. Det går exempelvis att göra en sådan koppling mot geodata! Det finns även Bokeh funktioner för att visa geografiska data också, men det är inte det som lockar mig. Det vore dock väldigt häftigt med ett QGIS plugin, som helt interaktivt med inlästa vektordata kan generera diagram av varierande typ och beroende på vad man väljer i kartan (eller i diagrammet) så förändras utritningen i diagrammet (eller i kartan).

Jag skall nog försöka hitta lite tid att lära mig mer om Bokeh i höst.

Just det, du hittar Bokeh på https://bokeh.pydata.org/

Annonser

Taggar:, , ,

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com Logo

Du kommenterar med ditt WordPress.com-konto. Logga ut / Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut / Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut / Ändra )

Google+ photo

Du kommenterar med ditt Google+-konto. Logga ut / Ändra )

Ansluter till %s

%d bloggare gillar detta: