Skal gjøre befolkningsdata tilgjengelig

Av Aksel Kjær Vidnes

Publisert 26. oktober 2012

Den unike samlingen av norske registerdata skal bli lettere tilgjengelig for forskning. Men flere forskere er skeptiske.

skal-gj-re-befolkningsdata-tilgjengelig


– Jeg tror det kommer til å være mange som er nødt til å bestille data på samme måte som vi gjør nå, sier Torkild Lyngstad. Foto: UiO

Fakta

 

  • Midlertidig åremålsstilling på to til fire år
  • Skal kvalifisere til toppstilling
  • Er unntatt regelen i lovverket om fast ansettelse
  • Man kan bare jobbe en periode ved samme institusjon

 

– Dette er en stor dag for samfunnsvitenskapen. Infrastruktur har lenge vært forbundet med store fysiske anlegg knyttet til naturvitenskapelig og teknologisk forskning. Den tid er forbi.

Ordene falt da Forskningsrådets divisjonsdirektør Jesper Simonsen innledet presentasjonen av infrastrukturprosjektet Remote Access Infrastructure for Register Data (RAIRD) onsdag 24. oktober. Prosjektet med en ramme på 35 millioner kroner fra Forskningsrådet skal frem mot 2016 bygge både et teknologisk og administrativt system for forvaltning og formidling av registerdata til bruk i forskning. Registerdata er informasjon om befolkningen fra ulike offentlige registre og gir forskere rike muligheter til å se på sammenhenger mellom ulike sosiale forhold.

Forskerne selv er imidlertid ikke helt overbevist. Flere ytrer skepsis til om den nye infrastrukturen vil gi god nok tilgang til de detaljerte dataene som de er avhengig av.

– Løser ikke problemet

– Vi er avhengig av avidentifiserte opplysninger hvor vi kan koble data selv, sa Pål Schøne fra Samfunnsvitenskapelig institutt under presentasjonen av RAIRD. Han får støtte fra demograf og førsteamanuensis i sosiologi ved Universitetet i Oslo, Torkild Lyngstad.

– Dette løser ikke mitt problem. En av fordelene med registerdata er at de har stor detaljrikdom og kan brukes til mange avanserte forskningsdesign. Jeg er redd de detaljene skal forsvinne og at vi da må gå utenom dette systemet, sier Lyngstad, som blant annet har forsket på dødelighet ved kreftsykdom i forhold til sosial bakgrunn.

Problemet de frykter er at dataene de bruker, såkalte avidentifiserte data, ikke skal gjøres tilgjengelig i det nye systemet. Med avidentifiserte data kan man i teorien identifiserte enkeltindivider gjennom en koblingsnøkkel. Dette må derfor behandles som personopplysninger og krever særdeles streng kontroll for bruk i forskning. Slike data tar i dag lang tid å få tilgang til.

– Blir som før

For å kunne gjøre registerdataene tilgjengelig for forskerne, har RAIRD som målsetting å konstruere nye tekniske løsninger, hvor dataene kan sammenstilles og benyttes fra en server som forskerne kan få tilgang til via internett.  Målet er at forskere ikke lenger behøver å søke Datatilsynet, de forskningsetiske komiteene og de ulike dataeierne, som NAV, om å bruke dataene.

Men på grunn av det strenge regelverket rundt avidentifiserte data vurderer man om RAIRD i utgangspunktet må ta sikte på et brukergrensesnitt som anonymiserer dataene, for at de ikke lenger skal anses som personopplysninger. Det innebærer også begrensninger for forskerne.

– I de prosjektene hvor man bruker registerdata, kreves det stor detaljrikdom og fleksibilitet for forskerne. Jeg tror det kommer til å være mange som er nødt til å bestille data på samme måte som vi gjør nå, sier Lyngstad.

Det er Norsk samfunnsvitenskapelig datatjeneste (NSD) og Statistisk sentralbyrå (SSB), som skal drifte infrastrukturen RAIRD. Ifølge Anders Grøndahl ved SSB og Atle Alvheim ved NSD er det omfattende regelverket for utlevering av registerdata til forskning en av prosjektets hovedutfordringer.

Samtidig er Norge sammen med de andre nordiske landene på verdenstoppen når det gjelder innhenting av registerdata. Norske forskere har imidlertid ikke kunnet nyte like godt av dataene som i Danmark og Sverige. Spesielt Sverige er internasjonalt kjent for forskning på registerdata. Ifølge et regjeringsutnevnt utvalg har bruken av slike befolkningsdata bidratt til økt produksjon i svensk forskning, særlig innen helseforskningen.

Ikke for helseforskning

Informasjonen som skal gjøres tilgjengelige gjennom RAIRD er data om befolkning, utdanning, inntekt, arbeidsmarked, og trygd og sosiale forhold. Dataseriene er i utgangspunktet ment å gå tilbake til 1992. Helsedata vil i utgangspunktet ikke kunne gjøres tilgjengelig i systemet.

Det skuffer lege og forsker ved Bærum sykehus Ingrid Christophersen. Hun tok doktorgraden i København hvor hun brukte danske helseregisterdata, men er redd den muligheten blir begrenset her.

– Det er veldig positivt at man vil bedre tilgangen, for Norge har kanskje enda bedre registerdata enn Danmark. Men det høres ikke ut som om dette er noe vi kan bruke, siden helseregistre ikke er inkludert i prosjektet, sier Christophersen. Hun skryter av det danske systemet hvor det enklere gis tilgang til å koble ulike registre enn i Norge.

– Internasjonalt har Skandinavia unike data, hvor man kan se på tendenser i befolkningen. Det er viktig fordi man kan se på et større datamateriale enn det som er mulig å få til i kliniske studier hvor det kan ta årevis å samle inn data.

Jussen i veien

Anders Grøndahl understreker at prosjektet tar sikte på å utarbeide en infrastruktur som kan inkludere mer avansert bruk av data og at det skal kunne åpne for å koble andre typer data enn det som det legges opp til innledningsvis. Han sier til Forskerforum at det ikke er dette prosjektets oppgave å løse alle juridiske hindringer for å gjøre befolkningsregistre tilgjengelige for forskningen, men å skape en infrastruktur som gjør at det i fremtiden er mulig å åpne opp for utvidet bruk.

– Når det gjelder helsedata er det først og fremst det juridiske som står i veien. SSB har ikke tillatelse til å sitte med de dataene, sier Grøndahl som ønsker å se på muligheter for å la dataene være lagret et annet sted, men at de skal kunne kobles til andre registre via SSB.

– Vi ønsker å lage et generisk system, som teknisk gir rom for å lege inn andre typer data, som helsedata. Vi ser at det er behov for avidentifisert materiale, og personlig ønsker jeg at vi skal legge til rette for det.

En pilot av prosjektet er beregnet å prøves ut i 2015 og systemet skal være operativt innen 2016.