Kurateringsnivåer for forskningsdata
Datakuratering går ut på å kvalitetssikre, dokumentere, standardisere og formatere data. Forskningsdataarkivet i Sikt opererer med fem kurateringsnivåer når vi arkiverer forskningsdata. Nivå 1–4 tilfredsstiller FAIR-prinsippene.
Datakuratering innebærer gjerne å legge på metadata, lage og ha kontroll over ulike versjoner av data, aggregering eller omkoding av data, og danne nye datasamlinger med utgangspunkt i ulike datakilder.
Kuratering handler også om å sikre datakvalitet og sørge for at databehandling og -prosessering skjer i overensstemmelse med lover, regler og retningslinjer.
I Sikt har vi fem kurateringsnivå, hvor nivå 1–4 tilfredsstiller FAIR-prinsippene for forskningsdata.
Kurateringsnivå 1
- Data utvalgt for verdiøkende kuratering i et langtidsperspektiv med fokus på å skape relasjoner innad og på tvers av tidsserier/datasamlinger på variabelnivå.
- Data er tilrettelegges for sekundærbruk i forskning.
- Data konverteres til langtidsformater og garanteres tilgjengelig i minimum 50 år
- Data bør være åpent tilgjengelig.
- Kvantitative matrisedata, med relevant geografisk dekning, som inngår i lange konsistente tidsserier.
- Data i denne kategorien inngår i Forskningsdataarkivet i Sikt sin hoveddatasamling og gjennomgår omfattende kuratering på variabelnivå.
Kurateringsnivå 2
- Data utvalgt for deskriptiv kuratering i et langtidsperspektiv med fokus på å skape relasjoner innad og på tvers av tidsserier/datasamlinger og mellom datasett med samme tematikk på studienivå.
- Data tilrettelegges for sekundærbruk i forskning.
- Data konverteres til langtidsformater og garanteres tilgjengelig i minimum 50 år
- Data bør være åpent tilgjengelig.
- Kvantitative matrisedata med relevant geografisk dekning, som regel tverrsnittsundersøkelser eller korte tidsserier
- Data i denne kategorien gjennomgår grunnleggende kuratering på variabelnivå.
Kurateringsnivå 3
- Data utvalgt for deskriptiv kuratering for replikasjon og etterprøvbarhet. Metadata ivaretas i et langtidsperspektiv.
- Data gjennomgår nødvendige sjekker, men videreformidles som ved overføring.
- Data vil ikke (i utgangspunktet) bli kuratert og arkivert med tanke på langsiktig bevaring. Forskningsdataarkivet i Sikt garanterer at disse dataene er tilgjengelige i minimum 10 år. De sikkerhetskopieres (kun på bitnivå ) og gjøres tilgjengelige og synlige i Forskningsdataarkivet i Sikt sin datakatalog.
- Data bør være åpent tilgjengelig
- Data i denne kategorien er primært kvalitative data i form av video, bilder, lyd og tekst, eller matrisedata med mangelfull dokumentasjon.
- Data i denne kategorien kurateres på overordnet nivå
Kurateringsnivå 4
- Data utvalgt utelukkende for distribusjon («delivery only»)
- For eksempel der data fra tredjeparter hentes via APIer/web-tjenester og leveres til sluttbrukere via et Sikt-grensesnitt.
Kurateringsnivå 5
- Data som gjøres søkbare i Forskningsdataarkivet i Sikt sin datakatalog («discovery only»).
- Data er ikke formelt arkivert hos Sikt, de vil utelukkende arkiveres andre steder som institusjonelle arkiv
- Forskningsdataarkivet i Sikt kan opprette, eller høste, metadataposter for å gjøre disse dataene mer gjenfinnbare.
- Data i denne kategorien har ofte spesielle tilgangsbetingelser tilknyttet juridiske og etiske rammer.