Välja rätt dataformat

Detta inlägg handlar om vilket format du skall välja för att din information skall bli tillgänglig för så många som möjligt. Detta gäller inte bara för geodata utan minst lika mycket för annan typ av information.

Jag har varit medveten om problemställningen länge, men det blev extra tydligt i och med en webbsida som dök upp i veckan.

http://simpleopendata.com/

Det är en sida på 112 rader HTML, med 45 rader stilmallar, och inget mer!

Skärmbild från 2014-02-16 10:24:22

Det är så här man gör när budskapet är det som är viktigt och inte paketeringen! Det är naturligtvis en balansgång för att inte göra informationen ”tråkig” men risken för det omvända är mycket större, så tips nummer ett är: Gör det enkelt!

Artikeln handlar dock inte om att presentera webbsidor utan om att publicera data. Detta är speciellt viktigt om man har en IT-miljö med massor av operativsystem och plattformar, med vitt skilda program för att läsa och bearbeta data.

I slutna miljöer och i stora organisationer som inte utbyter särskilt mycket information med omvärlden så har det varit vanligt att man delar information i olika Microsoft Office format, vilket fungerar, men när inte ens Word 2003 kan läsa filer från Word 2010 utan tilläggsprogram så inser man snabbt att detta kan vara ett problem.

Är det text man vill sprida, spara det som text! Excel är inget jättebra tabellformat, använd kommaseparerade textfiler i stället. Små mängder geodata kan också lagras i textformat som GeoJSON eller KML, medan större mängder geodata fungerar bäst som shapefiler. Rasterdata? använd GeoTIFF.

Ovanstående format handlar inte om presentation utan om innehåll, så om presentationen är viktigare så får man naturligtvis välja andra format i stället, men även då är öppenhet och interoperabilitet viktigt. Det är snabbt och snyggt att skapa presentationer i Keynote eller Prezi, men hur skall andra kunna läsa dessa om de inte har rätt program. Det samma gäller för Worddokument som går att göra riktigt snygga, men det spelar inte så stor roll om mottagaren saknar det där snygga typsnittet som använts till rubrikerna.

Ett sätt är att använda PDF, som man mest skall se som ett digitalt alternativ till pappersutskrifter. Vill man presentera något på en skärm så kan ett flexibelt alternativ vara HTML, inte minst i och med introduktionen av HTML5.

En viktig avslutning på artikeln är licens för användande. I dag så är det mycket riskabelt att använda data från Internet i kommersiella sammanhang utan att vara säker på villkoren för användande. Var därför mycket tydlig med att vilken licensform som data har. Är det öppna data som är fria att använda så är Open Data Commons – ODC en användbar standard.

Avslutningsvis vill jag trycka på att ”avskalat” inte nödvändigtvis alltid är bäst. Allt beror på situationen och målgruppen. Glöm aldrig att det är mottagaren som avgör vad som är bra eller dåligt när det gäller att ta till sig information.

Annonser

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com Logo

Du kommenterar med ditt WordPress.com-konto. Logga ut / Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut / Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut / Ändra )

Google+ photo

Du kommenterar med ditt Google+-konto. Logga ut / Ändra )

Ansluter till %s

%d bloggare gillar detta: