Kurateringsnivåer for forskningsdata

Datakuratering går ut på å kvalitetssikre, dokumentere, standardisere og formatere data. Forskningsdataarkivet i Sikt opererer med fem kurateringsnivåer når vi arkiverer forskningsdata. Nivå 1–4 tilfredsstiller FAIR-prinsippene. 

Datakuratering innebærer gjerne å legge på metadata, lage og ha kontroll over ulike versjoner av data, aggregering eller omkoding av data, og danne nye datasamlinger med utgangspunkt i ulike datakilder.

Kuratering handler også om å sikre datakvalitet og sørge for at databehandling og -prosessering skjer i overensstemmelse med lover, regler og retningslinjer.

I Sikt har vi fem kurateringsnivå, hvor nivå 1–4 tilfredsstiller FAIR-prinsippene for forskningsdata.

Kurateringsnivå 1 

  • Data utvalgt for verdiøkende kuratering i et langtidsperspektiv med fokus på å skape relasjoner innad og på tvers av tidsserier/datasamlinger på variabelnivå.  
  • Data er tilrettelegges for sekundærbruk i forskning.  
  • Data konverteres til langtidsformater og garanteres tilgjengelig i minimum 50 år 
  • Data bør være åpent tilgjengelig. 
  • Kvantitative matrisedata, med relevant geografisk dekning, som inngår i lange konsistente tidsserier.  
  • Data i denne kategorien inngår i Forskningsdataarkivet i Sikt sin hoveddatasamling og gjennomgår omfattende kuratering på variabelnivå. 

Kurateringsnivå 2 

  • Data utvalgt for deskriptiv kuratering i et langtidsperspektiv med fokus på å skape relasjoner innad og på tvers av tidsserier/datasamlinger og mellom datasett med samme tematikk på studienivå. 
  • Data tilrettelegges for sekundærbruk i forskning.  
  • Data konverteres til langtidsformater og garanteres tilgjengelig i minimum 50 år 
  • Data bør være åpent tilgjengelig. 
  • Kvantitative matrisedata med relevant geografisk dekning, som regel tverrsnittsundersøkelser eller korte tidsserier 
  • Data i denne kategorien gjennomgår grunnleggende kuratering på variabelnivå. 

Kurateringsnivå 3 

  • Data utvalgt for deskriptiv kuratering for replikasjon og etterprøvbarhet. Metadata ivaretas i et langtidsperspektiv. 
  • Data gjennomgår nødvendige sjekker, men videreformidles som ved overføring. 
  • Data vil ikke (i utgangspunktet) bli kuratert og arkivert med tanke på langsiktig bevaring. Forskningsdataarkivet i Sikt garanterer at disse dataene er tilgjengelige i minimum 10 år. De sikkerhetskopieres (kun på bitnivå ) og gjøres tilgjengelige og synlige i Forskningsdataarkivet i Sikt sin datakatalog. 
  • Data bør være åpent tilgjengelig 
  • Data i denne kategorien er primært kvalitative data i form av video, bilder, lyd og tekst, eller matrisedata med mangelfull dokumentasjon. 
  • Data i denne kategorien kurateres på overordnet nivå 

Kurateringsnivå 4 

  • Data utvalgt utelukkende for distribusjon («delivery only») 
  • For eksempel der data fra tredjeparter hentes via APIer/web-tjenester og leveres til sluttbrukere via et Sikt-grensesnitt. 

Kurateringsnivå 5 

  • Data som gjøres søkbare i Forskningsdataarkivet i Sikt sin datakatalog («discovery only»).  
  • Data er ikke formelt arkivert hos Sikt, de vil utelukkende arkiveres andre steder som institusjonelle arkiv 
  • Forskningsdataarkivet i Sikt kan opprette, eller høste, metadataposter for å gjøre disse dataene mer gjenfinnbare. 
  • Data i denne kategorien har ofte spesielle tilgangsbetingelser tilknyttet juridiske og etiske rammer.  

Veiledning for arkivering