Forskningsmiljø jobber sammen
Målet er at alle døde personer fra 1801 og opp til vår tid skal få hver sin individuelle personside basert på informasjon i folketellinger, kirkebøker og alle de andre kildene i Digitalarkivet. I tillegg skal andre åpne kilder om vedkommende, som dødsannonser, kunne kobles til siden slik at man raskt kan få et overblikk over hvilken informasjon som finnes om ulike personer. Det kan også enkelt knytte personer i samme familie til hverandre.
– Registeret ble til etter at flere forskningsmiljøer over tid så behovet for dette, blant annet historikere, samfunnsforskere, navneforskere, lokalhistorikere og medisinere, sier Lars Holden.
Han er involvert i prosjektet gjennom sin jobb som administrerende direktør i Norsk Regnesentral. Andre samarbeidsaktører er UiT - Norges arktiske universitet, Arkivverket, Statistisk sentralbyrå, Folkehelseinstituttet, Norsk lokalhistorisk institutt, Universitetet i Stavanger og i Bergen og Høgskolen i Volda/Snøhetta forlag.
Både enkeltpersoner og prosjektet lenker
Registeret vil være todelt: en åpen del og en lukket del.
– Den åpne delen på histreg.no lenker sammen alle tilgjengelige kilder som finnes transkribert i Digitalarkivet og andre steder. Vi har blant annet registrert 600 000 hendelser fra Aftenposten, hovedsakelig dødsannonser, og lenket til 13 000 biografier fra Lokalhistoriewiki. Vi har også et ønske om at andre opplysninger, som en artikkel om en person eller utstilling på et museum også skal kunne lenkes til registeret. Den lukkede delen har i tillegg informasjon fra folkeregisteret og skal også bruke folketellingen fra 1950, sier Holden, og legger til:
– Lenkingen vil bli gjort både av prosjektet og av privatpersoner. Vi håper flest mulig vil bidra. For å bidra må man registrere seg med fullt navn og epost på histreg.no og det blir registrert hvem som gjør hver enkelt endring. Registrerte brukere kan lenke sammen informasjon om samme person, koble informasjon mellom familiemedlemmer og registrere ny informasjon som for eksempel en dødsannonse eller referanse til en kilde. Søk i Digitalarkivet vil vise til lenkede sider i histreg og bidra til at det er lettere å finne all informasjon om en person ved søk i Digitalarkivet. Lenkingen skjer ved å legge flere kildeforekomster (for eksempel mor i dåp) i en kurv og så trykke på en knapp for å lenke sammen. Da slås personsidene for hver av disse kildeforekomstene sammen til en personside med oversikt over alle de lenkede kildeforekomstene til denne personen.
Kunstig intelligens og maskinlæring
Registeret har en finansiering på totalt 25 millioner kroner fra Forskningsrådet frem til neste år. Denne summen går til kjøp av utstyr, transkribering av de lukkede kildene og lønn til prosjektmedarbeiderne. For tiden brukes mest tid på å transkribere kilder som skal inn i registeret og bygge datasystemene, og mindre til selve lenkejobben. Kildene som blir prioritert er kirkebøker og folketellingen fra 1950.
– Både i transkriberingen og lenkingen bruker vi kunstig intelligens og maskinlæring. Verktøyet vi bruker er godt på tall og steder, men ikke god nok på navn ennå. Men det går fremover fra dag til dag. Algoritmene vil kunne transkribere deler av en kirkebok på sekunder. Men det vil alltid være ting som må gjøres manuelt, og da er spørsmålet hvor lang tid en vil bruke på det. Det er stor forskjell på de ulike kildene og de ulike feltene i kildene, sier Holden og legger til at et slikt verktøy aldri vil fungerer optimalt med begrenset tid og ressurser.
Knytter bare sammen kilder
Noen vil kanskje mene at registeret ligner litt på tjenester som allerede finnes. Der du kan koble data mot andres slektstrær. Men Holden sier det er flere vesentlige forskjeller mellom Historisk Befolkningsregister og disse.
– For det første skal denne tjenesten være gratis og åpen for alle. I nettbaserte slektsprogrammer vil det også være slik at alle brukere laster opp en unik gedcomfil slik at det blir et problem med dubletter fra ulike gedcomfiler. I tillegg inneholder ikke disse programmene alle personer, men det gjør vårt register. Så fremt vedkommende bodde i Norge i perioden vi har kildemateriale fra, siden vi bygger på folketellingene, kirkebøkene og alle de andre dataene i Digitalarkivet. I histreg knyttes bare forekomster i kilder sammen slik at det er lettere for brukere å vurdere kvaliteten.
Hva med alle Anne Olsen?
Men så er spørsmålet, med alle Anne Olsen som finnes i norsk kildemateriale – hvordan skal man være sikker på at Anne Olsen fra folketellingen 1910 er den samme Anne Olsen fra den transkriberte kirkeboken?
– Vi skal bare lenke de personene vi er rimelig sikre på at er samme person. Om vi for eksempel finner en Eva Olsen som dro alene til USA i en emigrantprotokoll, men ikke har noen annen informasjon om henne. Da kan vi ikke lenke henne sammen med noen andre kilder eller personer. Når vi bruker folketellingene og kirkebøkene i hele landet vil vi kunne lenke mange personer med vanlige navn og personer som flyttet til andre deler av landet. Personer fra kildene som ikke lenkes vil alltid stå klar til å lenkes når man finner den riktige. Er man i tvil kan det registreres som en lenkingskandidat. Når det gjelder lenkingen privatpersoner gjør må det være opp til hver enkelt å være sikker på at informasjonen de lenker opp er korrekt. Så vil det også være mulig for andre brukere å rapportere feil eller gjøre endringer. Registeret vil aldri bli komplett. I dag har vi over 2 mill. lenker. I noen kommuner som Rendalen har vi over 90 prosent lenkingsgrad fordi vi har lest inn lenker som andre allerede har laget, sier Holden.
Vil ikke erstatte slektsforskning
Målet er også å kunne rekruttere inn personer som kan jobbe med å sjekke endringer som blir gjort i basen. For eksempel at en person har ansvaret for en kommune i Møre og Romsdal, og får et varsel hver gang noe skjer i registeret i dette området. Da kan vedkommende gå inn og kontrollere om opplysningene som har blitt lagt inn er korrekte. Systemet egner seg også for slektshistorielag som sammen ønsker å lenke et område. Det kan gjøres i kombinasjon med at man transkriberer kilder at man også lenker kilden opp til andre opplysninger fra lokalområdet. Han legger til at registeret ikke vil erstatte tradisjonell slektsforskning, eller andre eksisterende historieportaler på nett. Vi ønsker å lage lenker til disse for også å bruke denne informasjonen og dermed bidra til økt bruk av andre slekts- og historieportaler på nettet.
– I egen slektsforskning kan man bestemme helt selv og ofte gå lengre tilbake og frem i tid enn det vi klarer i et system som «kun» baserer seg på åpne, transkriberte kilder. Men vi regner med at histreg.no vil øke interessen for slektsforskning og lokalhistorie, og bidra til å bedre kvaliteten på slektsforskningen som enkeltpersoner selv gjør.