En intro til registerdata
Registerdata er nøyaktige og detaljerte data. De inneholder informasjon om hele befolkningen, og har blitt samlet inn over en lang periode. Dette gjør at vi kan undersøke hvordan ting har endret seg over tid, og se trender som vi ikke finner gjennom andre metoder.
20. november 2024
I dag er tilgjengeligheten til registerdata bedre enn noensinne. Microdata.no har bidratt til å demokratisere tilgangen og senke terskelen for å bruke slike data.
Men hva er egentlig registerdata, og hvordan kommer du i gang med å bruke disse dataene til forskning og analyse? Vi har laget en ørliten guide!
Hva er egentlig registerdata?
Forvaltningsorganer i Norge samler hele tiden inn omfattende informasjon om enkeltpersoner og organisasjoner i administrative registre. Dette gjør de for å administrere formelle rettigheter og plikter som for eksempel å yte velferds- og helsetjenester, tilby utdanning, beregne skatt, drive planlegging, med mer.
Slike administrative registre har data om utdanning, inntekt, velferdsytelser, arbeidsforhold, flytting, boforhold og en rekke andre sosio-økonomiske og demografiske størrelser. I tillegg finnes det helseopplysninger i spesialist- og primærhelsetjenestene, blant annet.
Det er data som stammer fra slike administrative registre som gjerne kalles registerdata.
Organer som Statistisk sentralbyrå (SSB) og Folkehelseinstituttet (FHI) har ansvar for å samle inn data fra disse registrene, og bearbeide dem for å lage offisiell statistikk og bidra til samfunnsdebatten. FHI samler også inn data for å forbedre helsetjenestene og styre helsesektoren.
Hva gjør registerdata til en god kilde til kunnskap?
Lovverket regulerer hvordan disse organene kan dele dataene. Norske myndigheter og forskningsaktører har i mange tiår vært opptatt av hvor viktig det er at registerdata gjøres tilgjengelig for forskning og analyse.
Ettersom registerdata allerede er innsamlet gjennom eksisterende systemer, er de en kostnadseffektiv kilde til informasjon og kunnskap. I tillegg er de detaljerte, nøyaktige og dekker befolkningen over lang tid.
Registerdata kan belyse svært mange problemstillinger, inklusive sosial ulikhet, utenforskap, bosettingsmønstre, og mange andre både aktuelle og mer tidløse tema.
Her er fire gode grunner til å bruke registerdata i forskning og analyse:
- Data omfatter hele befolkningen. Registerdata er unike i den forstand at de ofte dekker hele befolkningen, eller populasjonen, i motsetning til å være begrenset til et utvalg.
- Data har høy kvalitet og nøyaktighet. Registerdata som tilbys til forskning har som regel høy kvalitet og nøyaktighet fordi de er innhentet fra administrative registre og ofte har gjennomgått kvalitetssikring og korrigering i flere ledd.
- Data er samlet inn over tid. Registerdata har informasjon om tidspunkt, tidsrom/varighet og andre tidsaspekter ved data på et detaljnivå som gir mulighet til å følge grupper over både korte og lengre tidsrom. Analyser som følger grupper over tid er helt nødvendig for å forstå langtidseffekter av politikkutforming, samfunnsutvikling og endringer i velferdsordninger og andre ordninger.
- Dataene er allerede samlet inn. Det er kostbart og komplisert å samle inn store mengder data. Å gjenbruke registerdata som allerede er samlet inn til forskning og analyse er ressursbesparende.
Tilgang til registerdata
Registerdata er beskyttet av lover som GDPR og Statistikkloven, noe som gir en del begrensninger for bruk.
SSB og sentrale helseregistre bruker dataene til å lage statistikk som er tilgjengelig for alle. Deling av denne statistikken er vanligvis ikke et problem for personvernet, fordi gruppene som tallene er fordelt på gjerne er store og grovinndelte.
Derimot er det flere begrensninger når det gjelder å dele de underliggende dataene. Vi tar her for oss fire måter å få tilgang til registerdata for forskning og analyse i Norge.
1: Tilgang via offisiell og bredt tilgjengelig statistikk
Norske statistikkprodusenter har lang erfaring med å bruke registerdata for å lage nøyaktig og sammenlignbar statistikk, og deler disse statistikkene bredt.
Se for eksempel SSBs statistikkbank og FHIs oversikt over noen av sine statistikkbanker.
Når offisiell statistikk dekker informasjonsbehovene er den en lett tilgjengelig og pålitelig kilde til informasjon. Samtidig ligger det i statistikkens natur at den ikke nødvendigvis gir svar på nye spørsmål eller spørsmål som blir stilt på en litt annen måte.
Når forskere ønsker å bruke registerdata mer direkte, er det ofte fordi de har spørsmål som bare datagrunnlaget bak statistikken kan svare på.
2: Bestille statistikken
Forskere kan søke om å få utlevert anonym statistikk skreddersydd til deres behov fra SSB og FHI/Helsedataservice. Du sender da inn en bestilling, og tabellene produseres og anonymiseres i samsvar med bestillingen.
Dette gir mulighet til å få mer spesifikke statistikktabeller, men kan samtidig være tidkrevende og ressurskrevende. Leveransen består også bare av selve statistikktabellene, noe som begrenser nytteverdien for videre bruk.
3: Søke om tilgang for selvbetjent statistikk og analyse
Av og til har brukere behov for å behandle detaljerte registerdata direkte selv, og trenger å få utlevert registerdata etter søknad.
For å få direkte tilgang til registerdata, må du søke SSB for tilgang til SSB-data og FHI/Helsedataservice for tilgang til helseregisterdata. Trenger du tilgang til begge deler må du søke begge steder.
Denne søknadsprosessen er komplisert og tidkrevende. Det meste skyldes iboende kompleksitet knyttet til blant annet GDPR og ivaretagelse av de registrertes rettigheter. I tillegg er det krevende å danne seg et bilde av hvilke data man faktisk trenger i sitt prosjekt ut fra tekstlige beskrivelser av enkeltvariabler.
Det jobbes på ulike nivå, både juridiske, tekniske og organisasjonsmessige, med å forenkle den søknadsbaserte tilgangen. Samtidig vil personvernhensyn alltid kreve saksbehandling og skjønnsmessig vurdering av hver enkelt søknad om direktetilgang til registerdata.
4: Bruke microdata.no for søknadsfri og selvbetjent statistikk og analyse
Via microdata.no får du tilgang til å jobbe direkte med registerdata. Da får du mer ut av dataene enn gjennom ferdiglagde statistikktabeller. Du behandler ikke personopplysninger selv, men genererer anonym statistikk ved hjelp av et innebygd analyseverktøy.
Tjenesten, som er utviklet av Sikt og SSB, forenkler tilgangen til registerdata for brukergrupper som ikke har tid eller ressurser til å søke. Dette øker bruken av registerdata, samtidig som personvern ivaretas.
Målt i utnyttelsesgrad av informasjonsverdien i registerdata, ligger denne tilnærmingen mye nærmere søknadsbasert direktetilgang enn den ligger statistikkbasert tilgang.
Juridisk sett ligger den imidlertid nærmest statistikkbasert tilgang, siden du som sluttbruker ikke selv behandler personopplysninger, men isteden genererer anonym statistikk og analyseresultater i analyseverktøyet.
Microdata.no følger FAIR-prinsippene for deling og gjenbruk av data. Alle variabler er søkbare, og du har umiddelbar tilgang til å jobbe med funnene dine. Tjenesten tillater kobling av variabler, og det er enkelt å dele microdata-skript for gjenbruk.
Sjekk om du kan bruke Microdata.no
For å bruke microdata.no, må du være student eller ansatt hos en institusjon som har avtale om bruk. Du trenger ikke å være i gang med, eller planlegge, et konkret prosjekt for å få akkreditering.
Vi håper at denne artikkelen ga deg en bedre forståelse av hva registerdata er, og hvordan du kan bruke dem i forskning og analyse. Artikkelen er, tro det eller ei, en forkortet utgave av et mer utfyllende innlegg om bruk av registerdata.
Les mer utfyllende om bruk av registerdata på microdata.no