Digitalisering av arkiv, så tillgängliggörs Sveriges historia 2026

Faktagranskad mot:

Riksarkivets sidor om Digitala forskarsalen och digitisering på sok.riksarkivet.se och riksarkivet.se (juni 2026), Riksarkivets projekt Maskintolkning av handskrivet källmaterial samt Transkriberingsnod Sverige (Riksarkivet och Göteborgs universitet, finansierat av Riksantikvarieämbetet), Riksarkivets lanseringar av AI-modellen The Swedish Lion I och mjukvaran HTRflow (riksarkivet.se 2024-2025) samt budgetpropositionen för 2026 om Riksarkivets digitaliseringsanslag (regeringen.se, refererad av Sveriges Släktforskarförbund september 2025).

Sveriges arkiv håller på att flytta in i datorn, men långsammare än många tror. Av Riksarkivets enorma bestånd är bara en bråkdel digitaliserat, samtidigt som ny AI-teknik för handskriftstolkning nu öppnar dörren till material som tidigare bara kunde läsas på plats.

Snabbfakta om digitalisering av arkiv

Riksarkivets bestånd Över 75 hyllmil, omkring 750 kilometer hyllor
Andel digitaliserat Ungefär 7 procent
Inskannade handlingar online Cirka 73,5 miljoner
Plattformar Digitala forskarsalen och Nationell Arkivdatabas (NAD)
Nationellt centrum sedan 2018
AI-modell för handskrift The Swedish Lion I, cirka 95 procents noggrannhet
Mest digitaliserade material Svenska kyrkböcker

Vad betyder digitalisering av arkiv?

Digitalisering av arkiv handlar om att omvandla pappershandlingar, böcker, kartor och fotografier till digitala filer som kan läsas, sökas och bevaras på distans. För släktforskare och historiker är det avgörande, eftersom det avgör hur mycket material som går att nå hemifrån i stället för i en forskarsal. Men begreppet rymmer flera saker som ofta blandas ihop, och det är värt att hålla isär dem.

Tre begrepp som inte är samma sak

Riksarkivet skiljer på digitisering, alltså den konkreta handlingen att skanna eller fotografera analogt material så att det blir digitala bilder, och digitalisering, den bredare omställningen där verksamheten och tillgängligheten förändras. Ett tredje begrepp är e-arkiv, som handlar om att långsiktigt bevara handlingar som är digitalt födda från början, exempelvis e-post och databaser hos myndigheter. Den här guiden handlar om det första och andra, alltså om hur Sveriges historiska pappersarkiv görs digitalt tillgängliga.

Skillnaden är inte akademisk. Ett dokument som digitiseras blir en bild, men bilden går inte automatiskt att söka i. För att en handling ska bli sökbar krävs ett ytterligare steg där texten i bilden tolkas till tecken, antingen automatiskt eller manuellt. Det är där OCR och HTR kommer in, vilket vi återkommer till.

Hur mycket är digitaliserat?

Det här är frågan som sällan får ett ärligt svar i guiderna, där det ofta heter att allt mer blir tillgängligt utan att proportionerna nämns. Sanningen är att Riksarkivet förvarar över 75 hyllmil arkivhandlingar, vilket motsvarar omkring 750 kilometer fyllda hyllor, och att ungefär sju procent av detta är digitaliserat. Det innebär att Digitala forskarsalen idag rymmer cirka 73,5 miljoner inskannade arkivhandlingar, en imponerande siffra som ändå bara skrapar på ytan av det totala beståndet.

Sett över hela sin verksamhet, inklusive uppdrag åt andra myndigheter, har Riksarkivet producerat mer än 375 miljoner digitala bilder under drygt 20 års arbete. Prioriteringen av vad som digitaliseras först styrs av efterfrågan, bevarandebehov och tillgängliga medel. Det mest omfattande av Riksarkivets eget material som digitaliserats är de svenska kyrkböckerna, vilket avspeglar hur centrala de är för släktforskningen.

Bland det material som tillgängliggjorts finns:

  • Kyrkböcker, det enskilt mest omfattande digitaliserade beståndet
  • Skattelängder och mantalslängder
  • Militära rullor och soldatregister
  • Bouppteckningar och lagfartsregister
  • Kartor, bland annat Lantmäteriets kart- och aktarkiv som digitiserats på uppdrag
  • Fotografier från olika arkivbildare
  • Svenska dagstidningar, ett långsiktigt arbete tillsammans med Kungliga biblioteket

Var du hittar det digitaliserade materialet

Riksarkivets publika digitala arkiv finns huvudsakligen på två plattformar. I Digitala forskarsalen samlas ingångar till själva de inskannade handlingarna och flera sökbara databaser. Nationell Arkivdatabas, förkortad NAD, är den kompletterande katalogen som beskriver vilka arkiv som finns och var, oavsett om de är digitaliserade eller inte.

En enkel arbetsgång för att hitta digitaliserat material:

  1. Gå till sok.riksarkivet.se och välj Digitala forskarsalen.
  2. Sök på person, ort, arkivtyp eller årtal, eller bläddra via ämnesområden som kyrkböcker eller bouppteckningar.
  3. Kryssa i alternativet för enbart digitaliserat material för att filtrera bort handlingar som bara finns på plats.
  4. Öppna förteckningen för det arkiv du hittat och följ länkarna till de skannade volymerna.
  5. Använd fritextsökning där materialet är transkriberat, vilket gäller en växande men ännu begränsad del.

Det är gratis att söka och läsa det digitaliserade materialet i Digitala forskarsalen. Avgifter kan tillkomma först om du beställer framtagning eller kopior av material som inte är digitaliserat.

Vid sidan av Riksarkivets egen, avgiftsfria Digitala forskarsal finns den kommersiella tjänsten ArkivDigital, som mot abonnemang erbjuder nyfotograferade arkivhandlingar i färg och har särskilt god täckning för tiden före 1900. Många släktforskare använder de två parallellt, eftersom de delvis täcker olika material och har olika bildkvalitet. Riksarkivets material är fritt, medan ArkivDigital kräver betalning men ofta ger skarpare bilder av äldre handskrift.

OCR och HTR, så blir text sökbar

För att en inskannad handling ska gå att söka i räcker det inte med en bild. Texten måste tolkas till tecken, och här skiljer sig tryckt och handskrivet material åt på ett avgörande sätt som konkurrerande guider ofta missar.

  • OCR, Optical Character Recognition, tolkar tryckt text. Tekniken är mogen och används rutinmässigt på exempelvis dagstidningar och maskinskrivna handlingar, så att de blir fritextsökbara direkt efter skanning.
  • HTR, Handwritten Text Recognition, tolkar handskriven text med hjälp av AI. Det är betydligt svårare, eftersom handstil varierar mellan personer och epoker, men det är just handskriften som utgör merparten av det historiska arkivmaterialet.

Skillnaden förklarar varför så mycket arkivmaterial länge varit digitiserat men ändå inte sökbart. Miljontals bilder av handskrivna kyrkböcker och domböcker har funnits tillgängliga som bilder utan att man kunnat söka på ett enda ord i dem. Det är detta som AI nu håller på att förändra.

Riksarkivets AI för handskriftstolkning

Riksarkivet har under flera år arbetat med automatiserad handskriftstolkning, det vill säga HTR. Tekniken bygger på maskininlärning där en AI-modell tränas att känna igen bokstäver och tecken från en viss tidsepok. Modellerna har byggts i transkriberingsplattformen Transkribus, ursprungligen utvecklad inom EU-projektet Readcoop vid universitetet i Innsbruck, och svenska pionjärinsatser gjordes bland annat av Jämtlands läns fornskriftsällskap tillsammans med arkivarier i Östersund.

Ett tidigt genombrott kom genom projektet som tolkade Göteborgs poliskammares rapportböcker från den detektiva avdelningen, en svit på 36 volymer och omkring 22 500 sidor skrivna mellan 1868 och 1902. Frivilliga medborgarforskare transkriberade manuellt de sidor som behövdes för att träna modellen, ett mödosamt arbete som visade sig vara själva förutsättningen för att AI:n skulle fungera.

Resultatet av detta och efterföljande projekt blev AI-modellen The Swedish Lion I, som publicerades i Transkribus och är tränad att tolka svensk handskrift från cirka 1600 till 1900. Modellen uppges ha en noggrannhetsgrad på omkring 95 procent och tränades på 3,3 miljoner textrader och totalt 15,6 miljoner ord. Den togs fram i samarbete mellan Riksarkivet i Sverige och Finland, Stockholms stadsarkiv, Jämtlands läns fornskriftsällskap, medborgarforskare och forskare vid Stockholms och Uppsala universitet.

HTRflow och öppen källkod

Riksarkivets AI-labb har även släppt mjukvaran HTRflow och en öppen modell, så att andra organisationer kan transkribera handskrivet material i sin egen IT-miljö, även dokument med känsliga personuppgifter. Allt ligger fritt tillgängligt under öppen källkod. I linje med principen om öppna data publiceras dessutom de transkriberade texterna, som kan hämtas via API eller laddas ner som XML-filer. Det skapar förutsättningar för datadriven forskning där historiska källor kan analyseras med moderna verktyg.

Arbetet har lett fram till en milstolpe där Riksarkivet gjort omkring en miljon handskrivna dokument sökbara i fritext, med en bildvisare som ställer originalet och den AI-tolkade texten sida vid sida. Riksarkivarie Karin Åström Iko har beskrivit det som en historisk milstolpe för tillgängligheten till arkivinformation och ett konkret exempel på hur AI kan demokratisera de gemensamma arkiven.

Vad digitaliseringen betyder för forskare och släktforskare

Den praktiska följden av digitaliseringen är att allt mer forskning kan göras på distans. Den som tidigare behövde resa till en forskarsal i Lund eller Härnösand kan idag läsa många kyrkböcker, bouppteckningar och militära rullor direkt i Digitala forskarsalen. När materialet dessutom blir fritextsökbart genom HTR förändras själva forskningssättet, eftersom man kan söka efter ett namn eller en ort genom en hel volym i stället för att bläddra sida för sida.

Samtidigt är det viktigt att hålla två realistiska förbehåll i minnet, som sällan framgår av entusiastiska beskrivningar.

Två saker att vara medveten om

För det första är bara cirka sju procent digitaliserat, så det material du söker kan mycket väl finnas enbart på plats och kräva ett fysiskt besök eller en beställning. För det andra har den AI-transkriberade texten luckor och fel. Bara skannat material kan tolkas, och inom det kan enskilda sidor eller hela volymer sakna transkribering. Använd därför alltid originalbilden som facit, och lita inte blint på den maskinellt tolkade texten vid viktiga avläsningar.

Från mikrofilm till AI, en kort digitaliseringshistoria

Tillgängliggörandet av svenska arkiv på distans är äldre än internet. Redan på 1980-talet byggdes en infrastruktur för att kopiera och sprida arkivmaterial, först på mikrofilm och mikrokort, långt innan skärmen blev den självklara läsplatsen.

Navet var SVAR, Svensk arkivinformation, i Ramsele i Sollefteå kommun. Verksamheten startade som ett projekt 1981 och permanentades genom ett regeringsbeslut 1984, då den blev en del av Riksarkivet och övertog uppgifter från Umeå universitet och Landsarkivet i Härnösand. SVAR fick i uppgift att med moderna medier tillgängliggöra arkivmaterial, säkra förstörelsehotade handlingar och avlasta arkiven slitaget på frekvent använt material.

Mikrofilmen var länge bäraren. 1994 invigdes SVAR Forskarcentrum i Ramsele med mikrofilmade kyrkböcker och arkivalier från hela landet, sammanlagt omkring 80 miljoner mikrofilmade boksidor. Mikrokort lånades ut och såldes till bibliotek, skolor, universitet och enskilda släktforskare, och ungefär 400 000 arkivvolymer lämnade Ramsele per år. En tvist om avgifter prövades av Justitieombudsmannen, som slog fast att tillhandahållande av allmänna handlingar hos en myndighet inte ska vara avgiftsbelagt, varpå Riksarkivet införde avgiftsfrihet från 1997.

Steget från mikrofilm till digital bild togs successivt, och SVAR finns idag inte kvar som egen verksamhet utan har uppgått i Riksarkivet. På nationell nivå samordnades arbetet en period av Digisam, ett sekretariat för digitalisering, digitalt bevarande och digitalt tillgängliggörande av kulturarvet, som var en del av Riksarkivet mellan 2011 och 2016 med en styrgrupp som rymde Riksarkivet, Riksantikvarieämbetet, Kungliga biblioteket och centralmuseerna. När Digisam avvecklats övergick samordningsansvaret, och 2018 fick Riksarkivet det formella uppdraget att vara nationellt centrum för digitalisering av kulturarvsinformation.

Linjen är tydlig. Från mikrofilmade boksidor i Ramsele, via skanning till digitala bilder, till dagens AI-tolkning av handskrift. Varje steg har handlat om samma sak, att flytta arkivet närmare den som vill läsa det.

Riksarkivet som nationellt centrum och vägen framåt

Sedan 2018 har Riksarkivet i uppdrag att vara ett nationellt centrum för digitalisering av kulturarvsinformation, en samordnande roll som sträcker sig bortom de egna samlingarna till hela kulturarvssektorn. Det innebär att Riksarkivet både digitiserar för eget behov och stöttar andra myndigheter och institutioner i deras arbete.

Takten väntas öka. I budgetpropositionen för 2026 aviserade regeringen en satsning på AI och digitalisering där Riksarkivet föreslås få förstärkta anslag, bland annat för fortsatt digitalisering av arkivmaterial.

Föreslagen satsning på Riksarkivets digitalisering

2026 20 miljoner kronor
2027 40 miljoner kronor
Från 2028 50 miljoner kronor
Syfte Fortsatt digitalisering och AI-utveckling
Sammanhang Del av en bredare statlig AI-strategi

För släktforskare och forskare är riktningen tydlig. Ju mer material som digitaliseras och tolkas, desto mer forskning kan göras hemifrån, och desto fler frågor kan ställas till källorna med hjälp av sökning och dataanalys. Men under överskådlig tid kommer arkiven att bestå av både en växande digital del och en mycket större analog del som fortfarande kräver att man kliver in i en forskarsal.

Vanliga frågor om digitalisering av arkiv

Hur mycket av Riksarkivets material är digitaliserat?

Ungefär sju procent. Riksarkivet förvarar över 75 hyllmil arkivhandlingar, motsvarande omkring 750 kilometer hyllor, och Digitala forskarsalen rymmer i dagsläget cirka 73,5 miljoner inskannade arkivhandlingar. Resten finns enbart i fysisk form och kräver besök eller beställning.

Var hittar jag digitaliserat arkivmaterial?

I Riksarkivets Digitala forskarsal på sok.riksarkivet.se, där du kan läsa kyrkböcker, bouppteckningar, militära rullor, kartor och mycket annat. Den kompletterande katalogen Nationell Arkivdatabas (NAD) beskriver vilka arkiv som finns och var, oavsett om de är digitaliserade.

Vad är skillnaden mellan digitisering och digitalisering?

Digitisering är den konkreta handlingen att skanna eller fotografera analogt material till digitala bilder. Digitalisering är den bredare omställningen där verksamhet, tillgänglighet och arbetssätt förändras. Riksarkivet använder digitisering om själva skanningsarbetet.

Vad betyder OCR och HTR?

OCR, Optical Character Recognition, tolkar tryckt text automatiskt och är en mogen teknik som används på dagstidningar och maskinskrivet material. HTR, Handwritten Text Recognition, tolkar handskriven text med hjälp av AI och är svårare eftersom handstil varierar mellan personer och epoker.

Vad är The Swedish Lion och HTRflow?

The Swedish Lion I är Riksarkivets AI-modell för att tolka svensk handskrift från cirka 1600 till 1900, med en uppgiven noggrannhet på omkring 95 procent. HTRflow är Riksarkivets öppna mjukvara för att köra handskriftstolkning, fritt tillgänglig under öppen källkod så att andra kan transkribera material i sin egen miljö.

Kostar det att använda digitaliserat material hos Riksarkivet?

Nej, det är gratis att söka och läsa det digitaliserade materialet i Digitala forskarsalen. Avgifter kan tillkomma först om du beställer framtagning eller kopior av material som inte är digitaliserat, enligt Riksarkivets taxa.

Varför är inte allt arkivmaterial digitaliserat?

Beståndet är enormt, över 75 hyllmil, och digitalisering kräver tid, personal och pengar. Prioriteringen styrs av efterfrågan och bevarandebehov, vilket är skälet till att exempelvis kyrkböcker digitaliserats först. Att skanna och tolka hela beståndet är ett arbete som sträcker sig över många år framåt.

Kan AI tolka all handskrift korrekt?

Nej. AI-transkribering har luckor och fel, och bara material som är skannat kan tolkas alls. Inom det skannade materialet kan enskilda sidor eller hela volymer sakna transkribering. Originalbilden bör alltid användas som facit vid viktiga avläsningar.

Vilket material digitaliserades först?

De svenska kyrkböckerna är det mest omfattande av Riksarkivets eget material som digitaliserats, vilket speglar deras centrala roll i släktforskningen. Bland uppdrag åt andra myndigheter märks Lantmäteriets kart- och aktarkiv samt digitiseringen av svenska dagstidningar tillsammans med Kungliga biblioteket.

Vad är skillnaden mellan digitalisering och e-arkiv?

Digitalisering handlar om att göra befintligt analogt material digitalt. E-arkiv handlar om att långsiktigt bevara handlingar som är digitalt födda från början, exempelvis e-post, databaser och digitala dokument hos myndigheter. Det är två olika utmaningar med olika tekniker och regelverk.

Får jag ladda ner de AI-transkriberade texterna?

Ja. I linje med principen om öppna data gör Riksarkivet de transkriberade texterna fritt tillgängliga. De kan hämtas via API eller laddas ner som XML-filer, vilket skapar förutsättningar för datadriven forskning på historiskt källmaterial.

Hur snabbt går digitaliseringen framåt?

Takten väntas öka. I budgetpropositionen för 2026 föreslogs förstärkta anslag till Riksarkivet, med 20 miljoner kronor 2026, 40 miljoner kronor 2027 och 50 miljoner kronor från och med 2028, som en del av en bredare statlig AI-satsning för fortsatt digitalisering.

Vad var SVAR och finns det kvar?

SVAR, Svensk arkivinformation, var en avdelning inom Riksarkivet i Ramsele som tillkom 1984 och gjorde arkivmaterial tillgängligt, först på mikrofilm och mikrokort och senare digitalt. SVAR finns inte längre kvar som egen verksamhet utan har uppgått i Riksarkivet, och materialet nås idag via Digitala forskarsalen.

Källor
  • Riksarkivet, Digitala forskarsalen, sok.riksarkivet.se (juni 2026)
  • Riksarkivet, Skanning och digitiseringstjänster samt uppdraget som nationellt centrum sedan 2018, riksarkivet.se
  • Riksarkivet, projektet Maskintolkning av handskrivet källmaterial samt Transkriberingsnod Sverige, riksarkivet.se
  • Riksarkivet, lansering av AI-modellen The Swedish Lion I och mjukvaran HTRflow, riksarkivet.se (2024-2025)
  • Riksarkivet, AI-transkriberade arkiv, sok.riksarkivet.se/om-soktjansten/ai-transkriberade-arkiv
  • Budgetpropositionen för 2026 om Riksarkivets digitaliseringsanslag, refererad av Sveriges Släktforskarförbund (Rötter), september 2025
  • Tidningen Curie, om Transkribus och EU-projektet Readcoop, 2024
  • Sveriges riksdag (motioner om SVAR i Ramsele) samt Wikipedia om SVAR och Digisam, om mikrofilm- och samordningshistoriken

Lämna en kommentar