Digital arkivering handlar om att bevara information så att den går att hitta, läsa, förstå och lita på även långt senare. Det räcker alltså inte att lägga filer i en mapp, på en server eller i en molntjänst. För att något verkligen ska vara arkiverat behövs ordning, metadata, dokumentation och en plan för hur materialet ska kunna användas också när dagens system har bytts ut. Den här guiden förklarar vad som krävs, och varför lagring inte är samma sak som bevarande.
Snabbfakta om digital arkivering
| Vad det är | Långsiktigt bevarande av digital information, inte bara lagring |
| Målet | Att informationen går att hitta, läsa, förstå och lita på över tid |
| Skiljer sig från | Lagring och backup, som inte säkrar långsiktig användbarhet |
| Bärs upp av | Struktur, metadata, lämpliga format och dokumentation |
| Internationell modell | OAIS, referensmodellen i ISO 14721 |
| System för ändamålet | E-arkiv eller annan bevarandeplattform |
| Börjar | Redan när informationen skapas |
Vad digital arkivering egentligen är
Allt mer av det vi gör lämnar digitala spår. Myndigheter, kommuner, företag, föreningar och privatpersoner skapar i dag stora mängder digitalt material: avtal, bilder, ritningar, mejl, databaser, rapporter, protokoll och webbinnehåll. När information bara sparas som den råkar bli ökar risken att filer försvinner, blir oläsliga eller tappar sitt sammanhang. Digital arkivering är svaret på det, en medveten metod för att se till att informationen överlever och förblir användbar.
En viktig insikt är att ett dokument är mer än själva filen. För att en handling ska gå att förstå och lita på i framtiden kan den också behöva uppgifter om vem som skapade den, när den skapades, vilken version det är, vilket system den kommer från och hur den har använts. Informationen får helt enkelt inte skiljas från sitt sammanhang. De som arbetar med digitalt bevarande, från Riksarkivet till Kungliga biblioteket, brukar framhålla just detta: att digital information måste struktureras, beskrivas och hanteras rätt redan från början för att kunna bevaras på ett hållbart sätt.
Lagring, backup och arkivering är olika saker
Många blandar ihop digital arkivering med vanlig lagring eller med backup, men de tre tjänar olika syften. Att hålla isär dem är grunden för att förstå varför arkivering kräver mer.
Lagring, backup och arkivering
| Lagring | Att förvara filer någonstans, utan garanti för ordning eller framtida läsbarhet |
| Backup | En säkerhetskopia för att återställa material om något går fel, ofta kortlivad |
| Arkivering | Långsiktigt bevarande med struktur, metadata och plan, så att informationen förblir användbar |
Backup är till för att återställa filer vid en krasch eller en oavsiktlig radering, och en backup skrivs ofta över efter en tid. Arkivering handlar i stället om att informationen ska finnas kvar i ett format och en struktur som gör den användbar även efter många år. Därför kräver digital arkivering oftast mer än bara teknik. Det behövs regler för vad som ska sparas, hur länge, vad som kan gallras bort och hur förändringar dokumenteras. Ett e-arkiv är med andra ord inte bara en lagringsplats, utan en del av en större struktur för att bevara och hantera information på ett kontrollerat sätt.
Det här behöver fungera
För att digital arkivering ska hålla över tid brukar några delar vara avgörande. De hänger ihop, och svagheter i en del påverkar helheten.
- Tydlig struktur: filer och information måste organiseras så att de går att hitta även långt senare.
- Metadata: uppgifter om titel, datum, skapare, version och sammanhang behöver följa med materialet.
- Lämpliga filformat: vissa format lämpar sig betydligt bättre för långtidsbevarande än andra.
- Dokumentation: det ska gå att förstå hur informationen skapades, ändrades och användes.
- Gallring och bevarande: allt ska inte sparas för alltid, men det som ska sparas måste hanteras rätt.
- Fixitet: det ska gå att kontrollera att en fil inte har ändrats eller skadats över tid.
- Kontroll över tid: material behöver ibland flyttas till nya format eller nya system för att inte bli obrukbart.
OAIS, den internationella modellen för digitalt bevarande
Den som arbetar seriöst med digitalt bevarande stöter förr eller senare på OAIS, en referensmodell som har blivit den gemensamma kartan för hela fältet. OAIS står för Open Archival Information System och fastställdes som internationell standard, ISO 14721, redan 2002 och har därefter reviderats. Modellen beskriver inte en viss produkt, utan ger ett gemensamt språk och en struktur för hur ett arkiv kan ta emot, bevara och tillgängliggöra digital information för en framtida användargrupp.
OAIS pekar ut sex funktioner som ett bevarandesystem behöver hantera: inleverans, arkivlagring, datahantering, tillgång, bevarandeplanering och administration. Modellen är också känd för att den skiljer på tre olika informationspaket, beroende på var i flödet informationen befinner sig.
- SIP, inleveranspaket: det paket som lämnas in till arkivet, med data och tillhörande metadata.
- AIP, arkivpaket: den fullständiga versionen som faktiskt bevaras i arkivet, med all metadata som behövs för bevarande och åtkomst.
- DIP, utleveranspaket: det paket som skapas och lämnas ut till en användare som begär materialet, ibland i ett annat format än det bevarade.
Tanken är att informationen tas emot som ett inleveranspaket, omvandlas till ett arkivpaket som bevaras långsiktigt, och senare kan lämnas ut som ett utleveranspaket. Modellen talar också om en producent som lämnar in materialet, en användare som tar del av det, och en utpekad målgrupp som ska kunna förstå informationen i den form den bevaras. Du behöver inte kunna OAIS i detalj för att arkivera bra, men begreppen återkommer i nästan alla seriösa system och vägledningar, och de svenska myndigheternas bevarandearbete hänvisar ofta till just denna modell.
Metadata, det som ger informationen sammanhang
Om en enda sak skiljer arkivering från lagring är det metadata. Metadata är data om data, alltså den information som beskriver en handling och knyter den till sitt sammanhang. Utan metadata blir en fil snabbt en gåta: vem skrev den, när, varför, och vilken av tre snarlika versioner är den rätta? Metadata brukar delas in i några typer som kompletterar varandra.
- Beskrivande metadata hjälper dig att hitta och identifiera materialet, exempelvis titel, skapare och datum. Enkla standarder som Dublin Core och, för arkiv, EAD används för detta.
- Teknisk metadata beskriver filen i sig, som format, storlek och vilken programvara som krävs för att öppna den.
- Administrativ metadata rör bland annat rättigheter och villkor för hur materialet får användas.
- Strukturell metadata beskriver hur olika delar hänger ihop, exempelvis sidorna i ett inskannat dokument.
För själva bevarandet finns en särskild standard, PREMIS, en förkortning av Preservation Metadata: Implementation Strategies, som har blivit den de facto-standard som används för bevarandemetadata. PREMIS dokumenterar sådant som ett arkiv behöver för att kunna bevara informationen: var materialet kommer ifrån, vilka åtgärder som vidtagits, som migreringar och fixitetskontroller, och vem eller vad som utfört dem. För att paketera all denna metadata tillsammans med filerna används ofta METS, Metadata Encoding and Transmission Standard, ett slags behållare i XML. Både PREMIS och METS förvaltas av Library of Congress, och du kan läsa mer i Library of Congress information om PREMIS.
Filformat för långtidsbevarande
Vilka format som passar bäst beror på vilken typ av material det gäller, men öppna, väletablerade och väldokumenterade format föredras eftersom de är enklare att läsa även i framtiden. Ett format som är låst till en viss leverantör eller en viss programversion riskerar att bli oläsligt den dag programmet försvinner.
Vanliga format för bevarande
| Textdokument | PDF/A, XML, HTML |
| Bilder | TIFF, PNG, JPEG2000 |
| Datafiler | CSV, XML, SQLite |
| Beskrivande information | XML, EAD, PREMIS, METS |
I Sverige är formatfrågan inte bara en rekommendation för statliga myndigheter, utan reglerad. Riksarkivets föreskrifter RA-FS 2009:2 anger tekniska krav för elektroniska handlingar, och i praktiken konverteras kontorsdokument ofta till PDF/A-1, enligt ISO 19005-1, eller till TIFF, enligt ISO 12639, medan strukturerad information lämpar sig för XML. Principen är att handlingar ska bevaras i ursprungligt skick, alltså med det innehåll och i det skick de inkom eller upprättades, och att man i möjligaste mån väljer öppna och leverantörsoberoende format, fria från kryptering och kopieringsskydd. Du hittar reglerna i RA-FS 2009:2.
Fixitet och äkthet, att lita på att inget ändrats
Ett arkiv är värdelöst om man inte kan lita på att innehållet är detsamma som när det lades in. Därför är fixitet, alltså att en fil förblir oförändrad, en central del av digital arkivering. Problemet är att digitala filer kan förändras eller skadas omärkligt, exempelvis vid kopiering eller på grund av fel i lagringsmedier.
För att kontrollera fixitet beräknas en checksumma, ibland kallad hash, för varje fil. Det är en unik teckensträng som fungerar som ett digitalt fingeravtryck. Ändras filens innehåll det allra minsta får den en helt annan checksumma. Genom att med jämna mellanrum räkna om checksumman och jämföra med det sparade värdet kan ett arkiv upptäcka om en fil har förändrats eller blivit korrupt, och vid behov hämta en oskadad kopia. Just denna typ av kontroll är en av anledningarna till att man håller flera kopior på olika platser.
Det är vanligt att skilja på två nivåer av bevarande. Den ena är att bevara själva bitströmmen oförändrad, så att filen är exakt densamma bit för bit. Den andra är att se till att filen även i framtiden går att öppna, visa och tolka, vilket kan kräva åtgärder när format och programvara åldras. Båda behövs, för en perfekt bevarad fil är till liten nytta om ingen längre har ett program som kan öppna den.
Migrering och emulering, att hålla informationen läsbar
Tekniken står inte still, och format som var självklara för tjugo år sedan kan i dag vara svåra att öppna. Detta kallas formatföråldring, och digital arkivering måste hantera det aktivt. Två strategier brukar ställas mot varandra.
- Migrering innebär att informationen med jämna mellanrum förs över till nyare, mer hållbara format och medier, samtidigt som man kontrollerar att inget väsentligt går förlorat.
- Emulering innebär i stället att man återskapar den ursprungliga miljön, exempelvis ett gammalt operativsystem eller program, så att originalfilen kan visas som den var tänkt.
För de flesta typer av handlingar är migrering den vanligaste vägen, medan emulering kan vara aktuellt för mer komplext material som program eller interaktivt innehåll. Oavsett metod bygger ett robust bevarande på återkommande kontroller, dokumentation av varje åtgärd och redundans, alltså flera kopior som gärna förvaras på geografiskt skilda platser för att klara hårdvarufel och olyckor.
Varför räcker det inte att bara spara i molnet?
Det är lätt att tro att filer är säkra bara för att de finns i molnet, men lagring är inte samma sak som arkivering. Ett dokument kan finnas kvar rent tekniskt och ändå vara svårt att använda om filnamnet är otydligt, om metadata saknas eller om ingen vet vilken version som är den rätta. Om ett verksamhetssystem stängs ned eller byts ut kan informationen dessutom bli svår att komma åt om den inte först har förts över på rätt sätt.
En molntjänst löser med andra ord lagringen, men inte bevarandet. Den säger sällan något om format, metadata, fixitetskontroll eller vad som händer den dag tjänsten upphör eller avtalet sägs upp. Det är därför många organisationer arbetar med e-arkiv eller särskilda bevarandeplattformar, där informationen inte bara ska överleva utan också fortsätta vara sökbar, begriplig och tillförlitlig. Det gäller särskilt i offentlig verksamhet, där handlingar ofta måste kunna tas fram långt efter att de skapades.
Arkivering börjar redan när informationen skapas
En vanlig miss är att tänka på arkivering som något man tar hand om sist. I själva verket blir resultatet nästan alltid bäst när man planerar för bevarande redan från början. Om nya system byggs eller köps in utan krav på export, metadata och bevarande kan det bli både dyrt och svårt att lösa i efterhand.
Detta speglas i regelverket. Enligt Riksarkivets föreskrifter ska elektroniska handlingar uppfylla de tekniska kraven senast vid överföring till bevarande, och överföringen ska ske så snart det är möjligt. Tanken är att en handling ska kunna hanteras rätt genom hela sin livscykel, från det att den skapas till att den antingen gallras eller bevaras varaktigt. När rutinerna finns på plats från start blir det lättare att veta vad som ska sparas, hur det ska beskrivas och vem som ansvarar för att informationen verkligen går att använda i framtiden.
Vad reglerna säger i Sverige
För offentlig verksamhet är digital arkivering inte frivilligt, utan en del av ett regelverk. Ramen ges av tryckfrihetsförordningen och offentlighets- och sekretesslagen, som rör rätten att ta del av allmänna handlingar, samt av arkivlagen. De närmare kraven på digitalt material finns i Riksarkivets föreskrifter.
- RA-FS 2009:1 innebär att varje myndighet ska ha en strategi för bevarande av elektroniska handlingar, dokumenterad i en bevarandeplan som täcker framställning, överföring, hantering, förvaring och vård.
- RA-FS 2009:2 anger de tekniska kraven, bland annat vilka format som godtas vid bevarande.
Du kan läsa mer i Riksarkivets riktlinjer för elektroniska handlingar. Reglerna är bindande för statliga myndigheter och vissa andra organ, medan kommuner och regioner har egna arkivmyndigheter men ofta tillämpar samma principer. Privatpersoner och föreningar är inte bundna av föreskrifterna, men kan med fördel använda samma tankesätt, eftersom utmaningarna är desamma. Själva systemet för det långsiktiga bevarandet, dit handlingar förs över, kallas e-arkiv.
Du behöver inget avancerat system för att arkivera klokt. Ge filerna tydliga och konsekventa namn, och spara gärna ett kort dokument som förklarar vad mapparna innehåller och hur de hänger ihop. Välj öppna format som PDF/A för dokument och TIFF eller PNG för viktiga bilder. Håll minst två kopior på olika platser, exempelvis en lokalt och en i molnet, och se över dem med jämna mellanrum. Gör en kopia av riktigt viktiga filer i ett nytt format innan det gamla blir för ovanligt. Då har du kommit långt med små medel.
Mer än filer i en mapp
Digital arkivering är alltså mycket mer än att spara dokument på rätt plats. Det handlar om att ge digital information ett långt liv. När det görs rätt går det att hitta materialet, förstå vad det betyder och lita på att det är äkta och komplett. Struktur, metadata, hållbara format, fixitetskontroll och en plan från början är det som skiljer ett verkligt arkiv från en hög med filer.
Det är just därför ämnet blivit så viktigt. I en tid när nästan allt skapas digitalt räcker det inte att bara spara. Man måste också bevara på ett sätt som fungerar över tid, så att morgondagens läsare, forskare och medborgare kan ta del av det vi skapar i dag.
Vanliga frågor om digital arkivering
Vad är digital arkivering?
Digital arkivering är långsiktigt bevarande av digital information, så att den går att hitta, läsa, förstå och lita på även långt senare. Det omfattar struktur, metadata, lämpliga filformat och dokumentation, och är något helt annat än att bara lägga filer i en mapp eller en molntjänst.
Vad är skillnaden mellan lagring, backup och arkivering?
Lagring är att förvara filer, utan garanti för ordning eller framtida läsbarhet. Backup är en säkerhetskopia för att återställa material om något går fel, och skrivs ofta över efter en tid. Arkivering är långsiktigt bevarande med struktur, metadata och plan, så att informationen förblir användbar över många år.
Räcker det att spara filer i molnet?
Nej. Molnet löser lagringen, men inte bevarandet. En fil kan finnas kvar tekniskt och ändå vara oanvändbar om metadata saknas, filnamnet är otydligt eller ingen vet vilken version som gäller. Molntjänsten säger sällan något om format, fixitet eller vad som händer den dag tjänsten upphör.
Vad är OAIS-modellen?
OAIS, Open Archival Information System, är en internationell referensmodell för digitalt bevarande, fastställd som standarden ISO 14721. Den beskriver inte en produkt, utan ger ett gemensamt språk och en struktur för hur ett arkiv tar emot, bevarar och tillgängliggör digital information, med sex funktioner och tre slags informationspaket.
Vad är skillnaden mellan SIP, AIP och DIP?
De tre är informationspaket i OAIS-modellen. SIP är inleveranspaketet som lämnas in till arkivet. AIP är arkivpaketet som faktiskt bevaras, med all metadata som behövs. DIP är utleveranspaketet som lämnas ut till en användare, ibland i ett annat format än det bevarade.
Vilka filformat passar för långtidsbevarande?
Öppna, väldokumenterade och leverantörsoberoende format föredras. För text används ofta PDF/A, XML och HTML, för bilder TIFF, PNG och JPEG2000, och för data CSV, XML och SQLite. Tanken är att formaten ska gå att läsa även när dagens program har bytts ut.
Vad är PDF/A?
PDF/A är en variant av PDF som är särskilt utformad för långtidsbevarande, standardiserad som ISO 19005. Till skillnad från vanlig PDF bäddar PDF/A in allt som behövs för att visa dokumentet korrekt i framtiden, exempelvis teckensnitt, och undviker funktioner som kan göra filen svår att återskapa senare.
Varför är metadata så viktigt vid arkivering?
Metadata är data om data och knyter en fil till sitt sammanhang, som titel, datum, skapare, version och ursprung. Utan metadata blir materialet snabbt svårt att hitta, förstå och lita på. Det är ofta just metadata, snarare än själva filen, som avgör om informationen förblir användbar över tid.
Vad är PREMIS och METS?
PREMIS är en de facto-standard för bevarandemetadata, som dokumenterar var materialet kommer ifrån, vilka åtgärder som vidtagits och vem som utfört dem. METS är en behållare i XML som paketerar olika slags metadata tillsammans med filerna. Båda förvaltas av Library of Congress och används i många bevarandesystem.
Vad är fixitet och en checksumma?
Fixitet betyder att en fil förblir oförändrad över tid. För att kontrollera det beräknas en checksumma, en unik teckensträng som fungerar som ett digitalt fingeravtryck. Ändras filen får den en annan checksumma, så genom att jämföra med ett sparat värde kan ett arkiv upptäcka om en fil förändrats eller skadats.
Vad är skillnaden mellan migrering och emulering?
Båda hanterar att format och programvara åldras. Migrering innebär att informationen förs över till nyare, mer hållbara format med jämna mellanrum. Emulering innebär i stället att man återskapar den ursprungliga miljön, som ett gammalt program, så att originalfilen kan visas som den var tänkt. Migrering är vanligast.
Vad är ett e-arkiv?
Ett e-arkiv är ett system för långsiktigt digitalt bevarande, dit information förs över från de system där den skapas. Det är inte bara en lagringsplats, utan en plattform som ska hålla materialet sökbart, begripligt och tillförlitligt över tid. E-arkiv används särskilt i offentlig verksamhet.
Vilka regler gäller för myndigheter i Sverige?
Ramen ges av tryckfrihetsförordningen, offentlighets- och sekretesslagen och arkivlagen. De närmare kraven på digitalt material finns i Riksarkivets föreskrifter, framför allt RA-FS 2009:1 om en strategi och bevarandeplan och RA-FS 2009:2 om tekniska krav och format. Reglerna är bindande för statliga myndigheter och vissa andra organ.
När bör man börja tänka på arkivering?
Redan när informationen skapas. Planeras bevarande, format och metadata in från start blir resultatet bättre och billigare än om allt ska lösas i efterhand. Enligt Riksarkivets föreskrifter ska handlingar dessutom uppfylla de tekniska kraven senast vid överföring till bevarande, och överföringen ske så snart det är möjligt.
- OAIS-referensmodellen, ISO 14721 (sex funktioner samt paketen SIP, AIP och DIP), iso.org och oais.info
- PREMIS och METS, standarder för bevarande- och förpackningsmetadata, Library of Congress (loc.gov/standards/premis)
- Riksarkivet, riktlinjer för elektroniska handlingar samt RA-FS 2009:1 och RA-FS 2009:2 (tekniska krav, PDF/A-1, TIFF, XML), riksarkivet.se och lagen.nu (juni 2026)
- Fixitet och checksummor för integritetskontroll samt migrering och emulering, Digital Preservation Coalition och Library of Congress
- Tryckfrihetsförordningen, offentlighets- och sekretesslagen samt arkivlagen som rättslig ram
Läs vidare
