Vägledning för val av datamängd
Att välja vilken datamängd som ska publiceras först är ofta det största hindret för att komma igång. Genom att börja med datamängder som är relevanta och aktuella för er verksamhet så kan ni skapa nytta snabbt, bygga erfarenhet och lägga en grund för fortsatt arbete.
Redan i detta steg ska ni göra en översiktlig juridisk förhandsbedömning (t.ex. om datamängden omfattas av GDPR, sekretess/OSL, upphovsrätt/licens). Det minskar risken att ni prioriterar en datamängd som senare visar sig svår eller omöjlig att öppna eller dela.
Vissa datamängder kan vara enkla att börja med och fungerar bra för att bygga upp förmåga, kompetens och lärande i organisationen. Andra datamängder kan vara mer komplexa att publicera, men är samtidigt särskilt viktiga för att skapa större nytta för invånare, företag eller andra myndigheter. Inspireras av de specifikationer som finns på dataportal.se, där kan ni ta del av andras arbete och hitta färdiga specifikationer för att kunna publicera era valda datamängder. Finns en liknande datamängd redan publicerad är det en bekräftelse på genomförbarhet, relevans och efterfrågan.
Bra roller att ha med i arbetet
- Verksamhetsrepresentant – identifierar datamängder, beskriver behov och nytta.
- Jurist/dataskydd – gör juridisk förhandsbedömning (GDPR, sekretess, licens).
- Öppna data-/informationsstrateg – samordnar processen, prioriterar tillsammans med verksamheten.
- IT-förvaltning – ger input om datakällor i system och tillgänglighet.
Så här väljer du datamängd
- Kartlägg
Lista ett antal datamängder som finns i er verksamhet och som ni ser är relevanta för era behov.
- Notera var de finns, vem som ansvarar för dem och i vilket format de lagras.
- Titta särskilt på datamängder som redan är välstrukturerade och används internt – de kan vara enklare att arbeta med ur ett tekniskt perspektiv (men är inte automatiskt publicerbara).
- Sök på Dataportal.se efter motsvarande datamängder. Om de finns där är det en indikation på relevans och praxis.
- Ni kan med fördel beskriva dem i en så kallad metadata-katalog. Har ni ingen sådan finns det en enkel lösning, Delad katalog, tillgänglig hos DIGG. Ni kan också använda en vanlig tabell i word eller excel.
- Bedöm nyttan
Vilka datamängder av de ni har listat efterfrågas mest av invånare, företag, forskare eller andra myndigheter?
- Finns det nationella initiativ som pekar ut datamängder som särskilt viktiga? Exempelvis adressregister, skolenheter, bibliotek eller busshållplatser.
- Finns det lokala mål eller politiska prioriteringar som styr?
- Finns det en vinning att göra på att minska administration eller öka transparens?
Gör en initial nyttokalkyl för att kunna bedöma om det finns potential i den omfattning ni tänker och hur uppföljning av nyttoeffekter ska göras. Du kan läsa mer om hur ni kan gå tillväga i Nationella dataverkstadens verktygslåda på hemsidan, där finns också enklare mallar. Nyttokalkylen kommer ni sedan använda löpande för att säkerställa att datamängden har relevans och används som tänkt. Se mer i Steg 4.
- Gör en juridisk förhandsbedömning
Även om en datamängd finns representerad på Dataportal.se eller ni vet att en annan organiation har tillgängliggjort datan, gör en egen juridisk förhandsbedömning.
- Rättslig grund & personuppgifter
– Finns personuppgifter?
– Krävs anonymisering, maskning eller aggregering? - Sekretess/OSL & säkerhet
– Förekommer uppgifter som omfattas av sekretess eller kan innebära risker? - Upphovsrätt & licensHar ni rätt att publicera?
– Vilken öppen licens kan ni sätta (t.ex. CC0 eller CC BY)?
- Bedöm insats
Vissa datamängder kan te sig komplexa men vara förhållandevis enkla att tillgänliggöra och vice versa. Det är därför viktigt att bedöma hur mycket arbete kommer att krävas för att kunna tillgängliggöra datamängden
- Är datamängden redan digitaliserad och strukturerad?
- Hur mycket datarensning/kvalitetssäkring krävs?
- Har ni resurser för uppdaterings- och publiceringsrutiner?
- Prioritera
Utgå från de prioriteringar som styr er verksamhet i stort och bryt ner dessa som riktmärken för vad ni börjar med. Det finns också ett antal datamängder som brukar vara de mest relevanta för kommuner och regioner.
- Börja med datamängder som är efterfrågade, relativt enkla att publicera och har tydlig nytta.
– Exempel på bra startpunkter: evenemangskalender, återvinningsstationer, offentliga toaletter.
– Exempel på mer komplexa men nyttoskapande datamängder: detaljplaner, bygglov, skolplatser.
Checklista för val av första datamängd
✔ Inventering gjord (ägaransvar, format, plats)?
✔ Sökning på Dataportal.se genomförd – finns motsvarande datamängd publicerad?
✔ Juridisk förhandsbedömning klar (GDPR, sekretess/OSL, upphovsrätt/licens)?
✔ Minst en datamängd med hög nytta/låg insats identifierad?
✔ Dokumenterat varför denna datamängd prioriteras (och varför andra väljs bort)?
✔ Plan för nästa datamängd finns?
✔ Redo för Steg 2 – Dataspecifikationer?
Med tidig juridisk kontroll, nyttobedömning och stöd från Dataportal.se kan ni tryggt välja rätt datamängd att börja med.
Ladda ner steg 1 av guiden för datadelning.