bevaringsstrategier for digitale arkivalier

15
Evaluering i Informationsforvaltning efterår 2006 Bevaringsstrategier for digitale arkivalier Spørgsmål: Der ønskes en redegørelse for henholdsvis migration og emulation som bevaringsstrategi. Endvidere ønskes en diskussion af, hvilke indvirkninger valget af bevaringsstrategi har for bevaringen af kulturhistoriske digitale kilder. 1.0 Indledning Historikere har i deres arbejde altid været afhængige af de levn, som fortiden har efterladt sig, men ikke alle historiske perioder har efterladt sig lige mange kilder. Mængden af kildemateriale fra forskellige historiske perioder afhænger dels af materialets holdbarhed, dels af det miljø de opbevares i, og dels af de foranstaltninger man i fortiden har truffet for at sikre bevarelsen af kilderne. I dag står vi i den paradoksale situation, at det samfund som mange betegner som et informationssamfund risikerer at efterlade meget få anvendelige kilder til fremtidens historikere. Det er ikke bevidstheden om vigtigheden af at bevare kilderne eller institutioner til at varetage bevarelsen, der mangler, men mange af det vigtige digitale kildemateriale, som vi producere i dag, er simpelthen af en sådan beskaffenhed, at det er meget vanskeligt at bevare i en tilgængelig form. Hvor f.eks. papirkilder er umiddelbart tilgængelige, er digitale kilders tilgængelighed afhængig af bestemte teknologier. Jeg vil i denne opgave, efter en kort introduktion til emnet bevaringsstrategier for digitale kilder, redegøre for to forskellige strategier dertil, migrationsstrategien og emulationsstrategien. Efterfølgende vil jeg diskuterer de konkrete problemer, der gælder bevaringen af digitale kulturhistoriske kilder i relation til disse strategier. 2.0 Bevaringsstrategier I denne opgave vil jeg kun berøre bevaringsstrategierne emulation og migration, mens jeg vil se bort fra den museale strategi og udskriftsstrategien. Før man forholder sig til bevaringsstrategier er det vigtigt at gøre sig klart, hvem man bevarer for. Det er oplagt, at de personer, som i fremtiden skal anvende de kilder, som vi bevarer, kan have meget forskellige behov, som stiller forskellige krav til den måde, hvorpå vi bevarer kilderne, og

Upload: daniell-marcussen

Post on 11-Apr-2015

85 views

Category:

Documents


0 download

DESCRIPTION

Universitetsopgave om bevaringsstrategier for digitale arkivalier

TRANSCRIPT

Page 1: Bevaringsstrategier for digitale arkivalier

Evaluering i Informationsforvaltning efterår 2006

Bevaringsstrategier for digitale arkivalier

Spørgsmål:

Der ønskes en redegørelse for henholdsvis migration og emulation som bevaringsstrategi.

Endvidere ønskes en diskussion af, hvilke indvirkninger valget af bevaringsstrategi har for

bevaringen af kulturhistoriske digitale kilder.

1.0 Indledning

Historikere har i deres arbejde altid været afhængige af de levn, som fortiden har efterladt sig, men

ikke alle historiske perioder har efterladt sig lige mange kilder. Mængden af kildemateriale fra

forskellige historiske perioder afhænger dels af materialets holdbarhed, dels af det miljø de

opbevares i, og dels af de foranstaltninger man i fortiden har truffet for at sikre bevarelsen af

kilderne. I dag står vi i den paradoksale situation, at det samfund som mange betegner som et

informationssamfund risikerer at efterlade meget få anvendelige kilder til fremtidens historikere.

Det er ikke bevidstheden om vigtigheden af at bevare kilderne eller institutioner til at varetage

bevarelsen, der mangler, men mange af det vigtige digitale kildemateriale, som vi producere i dag,

er simpelthen af en sådan beskaffenhed, at det er meget vanskeligt at bevare i en tilgængelig form.

Hvor f.eks. papirkilder er umiddelbart tilgængelige, er digitale kilders tilgængelighed afhængig af

bestemte teknologier.

Jeg vil i denne opgave, efter en kort introduktion til emnet bevaringsstrategier for digitale kilder,

redegøre for to forskellige strategier dertil, migrationsstrategien og emulationsstrategien.

Efterfølgende vil jeg diskuterer de konkrete problemer, der gælder bevaringen af digitale

kulturhistoriske kilder i relation til disse strategier.

2.0 Bevaringsstrategier

I denne opgave vil jeg kun berøre bevaringsstrategierne emulation og migration, mens jeg vil se

bort fra den museale strategi og udskriftsstrategien.

Før man forholder sig til bevaringsstrategier er det vigtigt at gøre sig klart, hvem man bevarer for.

Det er oplagt, at de personer, som i fremtiden skal anvende de kilder, som vi bevarer, kan have

meget forskellige behov, som stiller forskellige krav til den måde, hvorpå vi bevarer kilderne, og

Page 2: Bevaringsstrategier for digitale arkivalier

dermed hvad vi bevarer. Nogle vil måske kun være afhængige af den rå data, som ligger i den

digitale kilde, mens andre, eksempelvis historikere der beskæftiger som med softwarehistorie vil

være afhængige af hele kilden i dens oprindelige digitale form.

De overordnede problemer, som de forskellige bevaringsstrategier forsøger at løse, er dels

forbundet med forældelsen af hard- og software og dels med forgængeligheden af de fysiske

medier, som kilderne opbevares på. Problemet med de forgængelige medier er der kun en løsning

på, nemlig at flytte den arkiverede data fra det oprindelige medie til et nyt. Efterhånden som

medierne i sig selv bliver forældet, er det også nødvendigt at overføre den arkiverede data til nyere

typer af medier, dette kunne f.eks. være fra 5.25” floppydisk over 3.5” HD og CD-ROM til DVD.

Uanset hvilken bevaringsstrategi, man vælger, er det nødvendigt med en kontinuerlig overflytning

til nye medier pga. de fysiske mediers begrænsede levetid.1

2.1 Migration som bevaringsstrategi

Den bevaringsstrategi, som går under betegnelsen migration, er den mest udbredte, og også den

strategi som anvendes i Danmark.

Med migrationsstrategien vælger man at bevare de digitale arkivalier i en tilgængelig form ved at

konverterer dem til nye standardiserede formater efterhånden som de gamle forældes (det originale

version bør naturligvis altid bevares som et supplement til enhver migrationsmetode). Der findes

imidlertid flere forskellige former for migration, som bl.a. Paul Wheatley har forsøgt at udvikle en

række begreber for2 (her i fordansket udgave):

1) Minimum migration

Denne form for migration er relativ simpel teknisk løsning som ikke kræver meget arbejde.

Metoden indebærer at man enten manuelt eller automatisk henter den rene tekst ud af et givent

digitalt dokument (dokument skal her og efterfølgende forstås i en meget bred betydning og også

kan indbefatte hele computersystemer) og gemmer den i et nyt format. Hvis man tager en Word fil

som eksempel vil det betyde at kun den rå tekst gemmes mens alt der f.eks. har med tekstformater,

struktur, layout og funktionalitet at gøre går tabt.

2) Bevaringsmigration

Sigtet med denne bevaringsstrategi er at bevare tekstindhold og evt. hyperstruktur og noget af

dokumentets oprindelige ”look and feel” (alt der har at gøre med design, layout og andre elementer

ved hard- og softwares udformning det påvirker brugerens oplevelse og måske også selve

1 Rothenberg, Jeff: "Ensuring the Longevity of Digital Information" (1999). 2 Wheatley, Paul: "Migration - a CAMiLEON discussion paper" (2001).

Page 3: Bevaringsstrategier for digitale arkivalier

anvendelsen) uden at bevare den hard- og software, som dokumentet kørte på. Dette kan ske på tre

forskellige måder: A) Grundlæggende bevaringsmigration, som indebærer at det migrerede

dokument gemmes sammen med en række screenshots, der viser dokumentet i brug på den

oprindelige computerplatform og evt. billeder af det forældede hardware. B) Anoteret

bevaringsmigration, som udover det ovenstående også indeholder en tekst som beskriver brugen af

dokumentet på den oprindelige computerplatform. C) Kompleks bevaringsmigration, som udover

screenshots, billeder og en anotering også indeholder filmsekvenser, der viser dokumentet anvendt

på den oprindelige computerplatform.

Bevaringsmigration er en relativt billig og simpel måde at bevare noget af det originale dokuments

”look and feel” med udgør samtidig i sig selv et bevaringsproblem, idet de filer, som gemmes

sammen med det migrerede dokument for at beskrive det, også skal sikres i en tilgængelig form.

Det er derfor vigtigt nøje at overveje ”holdbarheden” af de valgte formater, således at de uden større

problemer kan migreres sammen med det arkiverede dokument.

3) Rekonstruktion

Det kan diskuteres om rekonstruktion overhovedet kan betegnes som en migrationsmetode men den

er alligevel medtaget her, bl.a. fordi de i visse tilfælde udgør et alternativ til emulationsstrategien.

Rekonstruktion indbefatter at det digitale dokument kodes fra bunden i et nyt programmeringssprog

på en ny computerplatform. Målet med denne metode er at komme så tæt på det originale

dokuments ”look and feel” uden dog at anvende et eneste element fra originalen. Denne metode har

været anvendt i forbindelse med simple computerspil som et brugbart men også meget

omkostningsfuldt alternativ til emulering.

For både minimum migration og bevaringsmigration gælder det, at man enten kan lave en reversibel

eller en ikke-reversibel migration. Den reversible migration laves således at man har mulighed for

migrerer baglæns og dermed sikre sig at migrationen er foregået korrekt ved at sammenligne med

den foregående original. For historikeren må det siges at være afgørende at de originale dokumenter

bevares i deres oprindelige form og at migrationerne er reversible.3

Fordele og ulemper ved migrationsstrategien

En af de mest iøjnefaldende fordele ved migrationsstrategien er, at den gør dele af de digitale

arkivalier umiddelbart tilgængelige uden, at det kræver særligt emulationssoftware eller at brugeren

3 Ibid.

Page 4: Bevaringsstrategier for digitale arkivalier

sætter sig ind i anvendelsen af hverken emulatoren eller det system, som emulatoren emulerer. En

anden fordel ved migrationsstrategien er, at man frit kan vælge filformater og dermed undgå

problemer vedrørende ophavsret ved at vælge formater, som ikke er underlagt copyright

restriktioner. Ligeledes kan man vælge formater som er bredt understøttede og som er platform-,

system og programuafhængige. Når det drejer sig om simple digitale dokumenter, som f.eks. tekst,

billeder, lyd- og filmklip, er det ligeledes relativt simpelt og billigt at udvikle automatiske

konverteringsprogrammer, der kan migrerer dokumentet fra et format til et andet.

Det er derimod tvivlsomt om migrationsstrategien er anvendelig og ikke mindst rentabel når det

gælder større og mere komplekse digitale dokumenter. Det først problem som melder sig vedrører

filformater. Migrationsstrategien betyder bl.a. af man forsøger at migrerer digitale dokumenter til

langtidsholdbare standardiserede filformater. Efterhånden som de digitale dokumenter bliver større

og mere komplekse vil de også bestå af stadig flere forskellige filformater (medmindre man vælger

at migrerer alt til rå tekst). Disse filformater forældes alle, og det gør de i forskellige hastigheder og

derfor på forskellige tidspunkter. Dette kan betyde at stadig flere digitale arkivalier vil befinde sig i

en permanent migrationsproces, som i realiteten vil gøre dem utilgængelige. De større og mere

komplekse digitale dokumenter betyder også at det bliver stadig vanskeligere og dyrere at udvikle

software, der kan gennemføre automatiske migrationer, og risikoen for fejl og datatab stiger

markant. Det er ikke utænkeligt, at hvert enkelt dokument vil kræve individuelle løsninger for at

sikre en acceptabel migrationsproces – altså individuelle løsninger for en stadig voksende mængde

arkivalier. Det økonomiske aspekt ved henholdsvis migrationsstrategien og emulationsstrategien er

bl.a. blevet undersøgt af Erik Oltmans fra Koninklijke Bibliotheek (Nationalbiblioteket i Holland)

og Nanda Kol fra Technische Universiteit Delft. Deres undersøgelse viser en lille økonomisk fordel

ved migrationsstrategien på kortsigt, mens emulationsstrategien ser ud til at være endog meget mere

rentabel på længere sigt og særligt når det gælder større mængder arkivalier. Ved bevaring af

1.000.000 digitale objekter over en halvtresårig periode viser undersøgelsen at omkostningerne

forbundet med migrationsstrategien vil være ikke mindre end 79 % højere end omkostningerne

forbundet med emulationsstrategien. Ved bevaring af 5.000.000 digitale objekter viser

undersøgelsen at forskellen vil være endnu større således at omkostningerne forbundet med

migrationsstrategien vil være mere en dobbelt så høje som omkostningerne forbundet med

emulationsstrategien.4

4 Oltmans, Erik & Nanda Kol: "A Comparison Between Migration and Emulation in Terms of Costs" (2005).

Page 5: Bevaringsstrategier for digitale arkivalier

Set fra en historikers perspektiv udgør migrationsstrategien også en alvorlig udfordring af

kildebegrebet. Spørgsmålet er om man med migrationsstrategien vi overhovedet efterlader os levn

til fremtidens historikere eller om de er tvunget til at nøjes med beretninger. Teknisk set er der ikke

tale om levn, fordi kilden har gennemgået en forandring igennem migrationens tilpasning til aktuel

teknologi, der er derimod tale om beretninger i forbindelse med alle former for migration inklusivt

rekonstruktionsmetoden. Dette må naturligvis få store konsekvenser for historikerens

arbejdsbetingelser i fremtiden og på hvilke slutninger, det vil være muligt at drage på baggrund af

de bevarede arkivalier. En fremtidig historisk hjælpevidenskab vil måske være digital arkæologi?

Det er naturligvis ikke uvæsentligt hvilken migrationsmodel, man taler om, og historikere vil

naturligvis være bedre stillet med et godt anoteret migreret dokument end et dokument, som har

været udsat for en minimum migration eller, som det i dag ofte er tilfældet, ingenting.

2.2 Emulation som bevaringsstrategi

Emulationsstrategien er en relativt uprøvet bevaringsstrategi, som dog anvendes visse steder i USA

og i forbindelse med fænomenet retrogaming.

Emulationsstrategien handler om at emulere/efterligne forældede computerplatforme ved hjælp af et

stykke software (emulator), der kan køre på en moderne computer. Formålet med emuleringen er at

gøre det muligt at få adgang til de originale digitale dokumenter og derved bevare mest muligt af

dokumentets ”look and feel” uden at skulle bevare den originale hardware. Emulationsstrategien

forudsætter at man bevarer de originale byte streams og udvikler og vedligeholder

emulatorprogrammer der kan efterligne de computerplatforme som de originale byte streams er

skabt til.

Der findes tre grundlæggende typer af emulatorer:

1) Hardware emulation

En hardware emulation efterligner en given computerplatform på hardware niveau. Med denne form

for emulation er det i princippet muligt at køre alle såvel operativsystemer som applikations

programmer, som er udviklet til denne platform. Med denne form for emulering vil det kun være

nødvendigt at udvikle én emulator for hver hardware platform, man ønsker at emulere, for at få

adgang til alle digitale arkivalier som er afhængige af denne platform. Såkaldte retrogamere har

længe udviklet denne type af emulatorer, som i mange tilfælde kan downloades gratis fra

internettet.5

5 Liste over emulatorer: http://www.theoldcomputer.com/Libarary's/Emulation/emulators_summary.htm

Page 6: Bevaringsstrategier for digitale arkivalier

Blandt de mest kendte eksisterende hardware emulatorer kan nævnes Commodore 64 emulatoren

CCS64,6 Commodore emulatoren VICE

7 (denne emulator indeholder alle Commodore computere

fra PET til C128), Commodore Amiga emulatoren WinUAE,8 arkademaskine emulatoren MAME

9

og PC emulatoren Bochs IA-3210

2) Operativsystem emulator

Denne form for emulation har samme formål som den ovenstående men foregår på operativsystem

niveau. Dette betyder at det kun er de applikations programmer og dokumenter som er kompatible

med dette operativsystem, som kan som kan køre under emuleringen. Der er ikke umiddelbart

nogen fordele ved at vælge en operativsystem emulation, men det er et muligt alternativ hvis en

hardware emulation af eller anden grund ikke er mulig eller for krævende.

3) Software emulator

Med denne form for emulation emuleres der på software niveau. Dette betyder at det kun er digitale

dokumenter, som er kompatible med det applikations program, der emuleres, som man kan opnå

adgang til. Igen er der ikke umiddelbare fordele ved denne form for emulation men det kan være et

alternativ, hvis de ovenstående former for emulation af den ene eller den anden grund er

udelukket.11

Uanset hvilken form for emulation man vælger, er man afhængig af at de originale digitale

dokumenter bevares, og at den viden og software, som muliggør adgangen til disse dokumenter, er

umiddelbart tilgængelig. Med emulationsstrategien skal man derfor ikke blot opbevare selve den

originale byte stream men også emulatoren og de beskrivelser og specifikationer, som er

nødvendige for at få emulatoren til at fungere. De forskellige elementer, som man evt. kunne

indkapsle sammen med den originale byte stream kunne være: 1) Selve emulatorsoftwaren (eller

evt. et link et centralt arkiv over alle emulatorer), 2) En vejledning i brugen af emulatorsoftwaren og

den emulerede computerplatform, 3) Emulatorspecifikationer der muliggør en genkodning af

emulatorsoftwaren på fremtidige computere (hvis emulatoren af en eller anden grund ikke er blevet

løbende vedligeholdt og opdateret). Derudover er det vigtigt af der sammen med det fysiske medie,

6 CCS64 emulator: http://www.computerbrains.com/ccs64/ 7 VICE emulator: http://www.viceteam.org/ 8 WinUAE emulator: http://www.winuae.net/ 9 MAME emulator: http://www.mame.net/ og den mere brugervenlige MAME32 emulator:

http://mame32qa.classicgaming.gamespy.com/ 10 Bochs IA-32: http://bochs.sourceforge.net/ 11 Rothenberg, Jeff: "Avoiding Technological Quicksand: Finding a Viable Technical Foundation for Digital

Preservation" (1999).

Page 7: Bevaringsstrategier for digitale arkivalier

hvorpå de indkapslede filer findes, opbevares en beskrivelse og vejledning i, hvordan man får

adgang til de vejledninger og emulatorspecifikationer, som ligger sammen med den originale byte

stream. Det vil være nødvendigt at opbevare denne beskrivelse og vejledning i en umiddelbar

tilgængelig form, evt. i papir form eller på mikrofilm. Emulationsstrategien forudsætter en vis grad

af migration, idet de vejledninger og specifikationer, som indkapsles sammen med den originale

byte stream, skal bevares i en tilgængelig form og derfor med jævne mellemrum migreres til nye

formater. Ligeledes kræves det, at selve emulatorsoftwaren rekonstrueres efterhånden som de

operativsystemer og den hardware, den skal køre på, forældes. En af de mest fremtrædende fortalere

for emulationsstrategien, Jeff Rothenberg, mener at det udelukkende er nødvendigt at opbevare en

detaljeret emulatorspecifikation for at fremtidige brugere let kan kode en fungerende emulator på

enhver fremtidig computerplatform. Rothenberg forestiller sig endog at det vil være muligt at skabe

en universel emulator af en given computerplatform, som består af en bagvedliggende emulator

kode, som kun kræver en eksekutivfil, som er tilpasset den computerplatform, som emulatoren skal

køre på. På denne måde vil det kun være nødvendigt at skabe en eksekutivfil, som så at sige peger

på den bagvedliggende kode, for at få en fungerende emulator på en hvilket som helst fremtidig

computerplatform.12

Fordele og ulemper ved emulationsstrategien

Den mest oplagte fordel ved emulationsstrategien er at den originale byte stream bevares i en

tilgængelig form, og således bevares også hele det digitale dokuments udseende, funktionalitet og

ikke mindst dets ”look and feel”. Set fra historikerens synspunkt er det ikke uvæsentligt at det med

emulationsstrategien er muligt at bevare det originale dokument i en tilgængelig form. Med

emulationsstrategien er historikeren ikke begrænset til at lave beretningsslutninger, som det er

tilfældet, når man anvender migrationsstrategien. Emulationsstrategien har også den fordel, at den

ikke kræver individuelle løsninger for det enkelte digitale dokument. Når man først har udviklet en

fungerende hardware emulator, vil man have adgang til alle de originale byte streams, som er

afhængig af den emulerede computerplatform. Det er også en fordel ved emulatorstrategien, at man

undgår den risiko for datatab der er forbundet med gentagende migrationer. Der er dog stadig en

mindre risiko for datatab forbundet med flytningerne af de digitale dokumenter fra et medie til et

andet.

12 Ibid.

Page 8: Bevaringsstrategier for digitale arkivalier

En ulempe ved emulationsstrategien er at det er vanskeligere at sikre tilgængeligheden. Selvom

emulatoren fungerer, vil det alligevel kræve meget af brugeren at opnå adgang til det arkiverede

dokument. For at få adgang til det digitale dokument forudsættes det at brugeren sætter sig ind i

hvordan emulatorsoftwaren og det emulerede system virker. Det vil derfor være en mere

tidskrævende og vanskelig proces at få adgang til arkivalierne via en emulator end tilfældet er i

forbindelse med migrerede udgaver af arkivalierne. For en god ordens skyld skal det dog nævnes, at

de fleste eksisterende emulatorer er forsynet med en brugergrænseflade, som gør det relativt simpelt

at betjene emulatoren. Hvis man forlader sig på en bevaringsmetode, hvor emulatoren ikke

indkapsles sammen med den arkiverede byte stream og/eller ikke vedligeholdes, men i stedet regner

med at emulatoren kan genkodes ud fra de arkiverede emulatorspecifikationer, kan man også

forestille sig problemer med tilgængeligheden. For det første kan man risikere at

emulatorspecifikationen og/eller vejledningerne er helt eller delvist ødelagt i migrationsprocessen.

For det andet kan man forestille sig at emulatorspecifikationerne (særligt for mere komplekse

platforme) vil være mere eller mindre uforståelige for fremtidens brugere, fordi det anvendte

tekniske sprog er forsvundet med den hardware, den beskriver. Endnu en ulempe er at

emulationsstrategien modsat migrationsstrategien er afhængig af adgangen til software, som kan

være underlagt copyright. Problemet med ophavsrettigheder til den forældede software, som kræves

for at få visse emulatorer til at virke skal løses juridisk før en emulationsstrategi for alvor kan

komme på tale. En indvending, som man støder på, når man beskæftiger sig med

emulationsstrategien, og som bl.a. er blevet fremført af Stewart Granger, er, at hver hardware

opsætning på en moderne computer kræver sin egen emulator. Emulatorene vil således blive meget

komplicerede at udvikle, og man vil skulle udvikle nærmest uendeligt antal unikke emulatorer for at

kunne emulere enhver tænkelig hardware opsætning.13

Eksisterende emulatorer viser imidlertid at

denne antagelse ikke nødvendigvis er rigtig. Ser man f.eks. på Amiga emulatoren WinUAE vil man

se at den kan køre flere forskellige Amiga Kickstart ROM-filer (svarer lidt til BIOS i en moderne

PC) og derfor emulere forskellige udgaver af Amigaen og forskellige operativsystemer. Med

WinUAE emulatoren kan man også indstille CPU typen, chipset, mængde af RAM og drev

hastighed og type individuelt. Det vil sige at man kan emulere en lang række forskellige hardware

opsætninger i den samme emulator. De fleste eksisterende emulatorer muliggør en sådan individuel

indstilling af de enkelte hardware elementer, eksempelvis kan MAME emulere mere end 120

forskellige CPU’ere. Det er derfor ikke utænkeligt at man i fremtiden eksempelvis vil kunne

13 Granger, Stewart Granger: "Emulation as a Digital Preservation Strategy" (2000).

Page 9: Bevaringsstrategier for digitale arkivalier

udvikle en PC emulator hvor, BIOS, RAM, CPU, GPU, drev hastighed osv., kan indstilles

individuelt således at man kan emulere et tilstrækkelig bredt spektrum at hardware opsætninger til,

at man kun behøver en PC emulator for at opnå adgang til samtlige arkiverede PC dokumenter.

Hvad angår de økonomiske omkostninger der er forbundet med emulationsstrategien, så er det

oplagt, at udviklingen af præcise emulatorer er bekosteligt, men det er den ikke nødvendigvis

sammenlignet med migrationsstrategien. I den danske debat om de økonomiske aspekter ved

migrations- og emulationsstrategierne ser det ud til at være den almindelige antagelse, at

migrationsstrategien er mest rentable strategi.14

Jeg har imidlertid ikke været i stand til at finde frem

til hvilke undersøgelser, denne antagelse bygger på, og jeg kan således dårligt bedømme den. Ser

man på den internationale debat om bevaringsstrategier, danner der sig slet ikke et lige så entydigt

billede af de økonomiske fordele ved migrationsstrategien. I den hollandske undersøgelse, som jeg

tidligere har refereret til, viser der sig ligefrem en signifikant økonomisk fordel ved

emulationsstrategien, og denne fordel vokser over tid og med antallet af bevarede digitale

dokumenter. Hvis man samtidig sammenholder dette med den antagelse, at mere komplekse digitale

arkivalier kræver mere individuelle løsninger i forbindelse med migration, mens man vil være i

stand til at udvikle standardiserede emulatorer på internationalt niveau, vil jeg være tilbøjelig til at

tilslutte mig den udlægning, at emulation er den mest økonomisk rentable bevaringsstrategi. Det gør

jeg dog med det forbehold, at jeg ikke har haft adgang til de undersøgelser, der må formodes at

ligge til grund for den modsatte udlægning, som ligger til grund for den danske bevaringsstrategi.

3.0 Bevaringsstrategiens indvirkning set i forhold til digitale kulturhistoriske kilder

Kulturhistoriske kilder er en meget bred kategori, som omfatter alt, der vedrører

civilisationsprocesser. Jeg vil imidlertid begrænse mig til at se på de elementer af kulturhistorien,

der har at gøre med kunst, underholdning og kommunikation at gøre.

Hvis det skal være muligt at beskæftige sig med identitets-, køns-, mentalitets-, kunst-, diskurs-,

mikrohistorie og andre kulturhistoriske forskningsfelter, er det afgørende, at vi bevarer

kildemateriale, der kan belyse disse felter. Dette er hidtidigt sket for de ikke-digitale arkivaliers

vedkommende, men med opkomsten af en række nye typer af digitale kilder, står vi overfor den

udfordring at udforme konkrete bevaringsstrategier for disse typer kilder. Det første problem er,

hvad der skal opbevares, og hvem der skal gøre det. Jeg mener, at man kan spore en vis portion

institutionel træghed, når det gælder de typer af digitale kilder, man opbevarer. Ser man f.eks. på

14 http://www.sa.dk/sa/itogarkiv/teknologi/strat/digbevstrat.htm

Page 10: Bevaringsstrategier for digitale arkivalier

computerspil, så er det et kulturmedie, som i dag er over 30 år gammelt, og som hvad angår

omsætning overstiger både film- og bogindustrien. Det er ikke usandsynligt, at der i dag er flere

mennesker, der spiller computerspil end mennesker, der læser bøger, og man må efterhånden

erkende, at computerspillet er en endog særdeles vigtig kulturel faktor. Ikke desto mindre findes der

i Danmark på nuværende tidspunkt ikke nogen langsigtet bevaringsstrategi for dette medie, og der

er ikke skabt institutioner specialiseret til bevaringen af denne kildetype – vi har ikke noget der

svarer til f.eks. Det Danske Filminstitut for computerspil.

Jeg vil nu se på en række forskellige eksempler på disse nye kildetyper og diskutere hvilke

konsekvenser, der er ved henholdsvis migration og emulation som bevaringsstrategi.

De første typer af digitale kilder, som jeg vil se på, har med kommunikation at gøre. I løbet af

ganske få år har den teknologiske udvikling frembragt en række ny digitale kommunikationsformer,

som vi ikke tidligere har haft adgang til, som f.eks. SMS/MMS, e-mail, Instant Messaging og

internettets debatfora. I forbindelse med arkivering af disse digitale kommunikationsformer vil

formålet typisk være at bevare selve formen, det vil sige dels hvordan kommunikationen foregår

rent teknisk, og dels hvordan man bruger kommunikationsmidlet. De digitale

kommunikationsmidler er meget forskellige fra ikke-digitale kommunikationsmidler, idet særlig

internettet har muliggjort kommunikation, der er løsrevet fra tid og sted, og således kan ligesindede

eller mennesker med sammenfaldende interesser i hele verden mødes virtuelt meget lettere, end de

ville kunne have gjort uden om de digitale medier. Mediernes form har således betydning for

udviklingen af sociale relationer, sprogets udvikling og også for den effekt det kommunikerede har i

omverdenen. Med bevaringen af de digitale kilder for eftertiden muliggør man således

kulturhistoriske studier af blandt andet disse elementer.

Som det første eksempel vil jeg bruge SMS/MMS. SMS/MMS er en relativt simpel

kommunikationsform, som kan bestå af rene tekststykker, billeder og små filmklip. Hvis vi

forestiller os, at der udvikles en emulator, der kan efterligne en mobiltelefons soft- eller hardware,

ville vi kunne se de originale SMS/MMS meddelelser og sandsynligvis kunne læse dem i en

displayrude, som efterligner den, man finder på en mobiltelefon. Men spørgsmålet er, om en sådan

emulering er nødvendig. SMS/MMSens indhold er relativt simpel, og man må gå ud fra, at det vil

være en enkel proces at migrere den til et nyt format, derfor kan man sige at en emulering af

mobiltelefoner med henblik på at studerer SMS/MMS beskeder er en unødvendig grundig

bevaringsstrategi. Noget af det man derimod kunne interessere sig for i forbindelse med

SMS/MMS, er den måde, hvorpå der over en meget kort periode har udviklet sig en helt ny variant

Page 11: Bevaringsstrategier for digitale arkivalier

af det danske skriftsprog. Dette nye skriftsprog vil man sagtens kunne undersøge på baggrund af en

migreret bevaring af eksempler på SMS/MMS meddelelser. Men det vil kræve en meget udførlig

anotering for at man ville kunne forstå, hvorfor dette skriftsprog udvikler sig, som det gør, da

aspekter som fysisk layout af display og tastatur sandsynligvis har afgørende indvirkning på dette.

En kompleks migration ville derfor muligvis være den bedste bevaringsform, hvis historikere i

fremtiden f.eks. skulle undersøge dette SMS/MMS sprogs udvikling.

E-mailen er en digital kommunikationsform, der på visse områder ligner SMS/MMSen, men som

alligevel er en del mere kompliceret. En e-mail kan udover tekstmeddelelsen også indeholde

vedhæftede filer af enhver art og internetlinks. Dette betyder, at e-mailen har en simpel

hyperstruktur, som stiller større krav til en eventuel migration. Hvis denne hyperstruktur skulle

bevares gennem migration, ville det forudsætte, at migrationen også kunne indhente og migrerer de

internetlinks og vedhæftede filer, som e-mailen kan indeholde. Det vil sandsynligvis være en meget

krævende teknisk løsning, hvis den da overhovedet er mulig. En løsning, som virker mere

anvendelig, er PC emulation. Med en PC emulator ville det være muligt at køre det krævede

operativsystem og applikationssoftware for både at få adgang til de originale e-mail filer, de

vedhæftede filer og måske endda til arkiverede internetsider, som f.eks. dem Netarkivet15

indsamler

ved hjælp af web-crawlere. Det sidste forudsætter naturligvis, at internetsiderne er arkiverede i

deres originale format. I modsætning til SMS/MMS meddelelser vil selve indholdet af e-mail

meddelelserne også have en interesse. Ligesom man opbevarer private arkivalier, som f.eks.

brevsamlinger, for deres kulturhistoriske interesse ville det også være oplagt at arbejde for at

sådanne e-mail arkiver vil blive bevaret for eftertiden.

Instant Messaging (IM), som man bl.a. kender fra MSN Messenger, AIM og ICQ, er også en vigtig

digital kommunikationsform som kunne være interessant at bevare i en eller anden form. I dette

tilfælde er det næppe muligt at opbevare IM kommunikation og siden hen emulere den, da

kommunikationen foregår som en direkte chat mellem forskellige mennesker og ikke gemmes i

filer, der opbevares, sådan som det er tilfældet med SMS/MMS og e-mail. En IM kommunikation

kan omfatte mange mennesker på en gang, og den muliggør såvel stemme- og videokommunikation

som deling af filer. Det vil selvfølgelig være en god ide at bevare IM klienterne, således at de kan

køres under en PC emulator og afprøves gennem etableringen af netværk mellem flere PC

emulationer. Men det vigtigste vil efter min mening være en grundig anotering som indeholder en

omfattende videodokumentation, billeder og beskrivelser, der dokumenterer de mange forskellige

15 http://netarkivet.dk/

Page 12: Bevaringsstrategier for digitale arkivalier

funktioner og anvendelsesmuligheder IM har. Enhver, der har skrevet gruppeprojekt på

universitetet, kender sikkert til at bruge IM, og et af de meget interessante aspekter ved denne

kommunikationsteknologi, er den effekt den har haft på vores arbejdsmønster (mennesker f.eks. kan

arbejde sammen i grupper på trods af store geografiske afstande).

En række andre eksempler på digital kommunikation indsamles i et vist omfang i dag ved hjælp af

web-crawlere, der med jævne mellemrum ”høster” dele af internettet. I Danmark varetages denne

opgave som tidligere nævnt af Netarkivet, der gennemfører 3 forskellige former for høstninger: 1)

Tværsnitshøstning, hvor man indsamler alle danske internetsider 4 gange årligt, 2) Selektiv

høstning, hvor udvalgte internetsider (ca. 80 forskellige) som f.eks. nyhedsmedier høstes med en

højere frekvens (i visse tilfælde 1 gang i timen), 3) Begivenhedshøstning, hvor et større antal

internetsider indsamles hyppigere (typisk dagligt) i forbindelse med særlige begivenheder som

f.eks. valg.16

Jeg mener imidlertid, at der er brug for endnu en høstningstype, nemlig en høstning

der i perioder laver hyppige høstninger at udvalgte fænomener. Disse fænomener kunne f.eks. være

et udvalg af internettets debatfora, YouTube, Google Video, MySpace eller Google Earth (og

særligt al den aktivitet, som foregår omkring dets community), som alle er kendetegnet ved at være

meget dynamiske og ved at skabe helt nye fællesskaber, som er uafhængige af geografisk placering.

Noget af det interessante ved fænomener som disse er, at det på mange måder har nedbrudt

forskellige hierarkier, og at de ved hjælp af ny teknologi har åbnet mulighed for at alle med relativt

enkle midler kan nå ud til utroligt mange mennesker og potentielt ændre politiske og kulturelle

dagsordner på overordnet niveau. For kunne se hvordan en sag kan udvikle sig hurtigt fra bunden

via digitale medier som f.eks. YouTube vil det være nødvendigt, at man i perioder laver hyppige

høstninger. Man kunne f.eks. kalde denne form for høstning for fænomenhøstning. Den eneste måde

at opnå afgang til disse høstninger er gennem emulation. Migration ville være alt for omfattende og

resultatet ville ikke give noget reelt billede af, hvad internettet anno 2007 er for en størrelse. En PC

emulator ville derimod umiddelbart kunne åbne de arkiverede internetsider ved hjælp af den rigtige

browser software og opnå noget, der ligner den oprindelige funktionalitet samt ”look and feel”.

Jeg vil nu gå over til at se på bevaringsstrategier i relation til Computerspil, som udgør en meget

stor andel af det kulturhistoriske digitale kildemateriale, der har med kunst og underholdning at

gøre. Computerspil er og har altid været kendetegnet ved at udgøre noget af samtidens mest

avancerede software og ved at stille store krav til hardwaren. Det er derfor også meget vanskeligt at

forestille sig andre bevaringsstrategier end emulation for denne kategori af kilder. Den eneste

16 Andersen, Bjarne: ”DK-domænet i ord og tal” (2006).

Page 13: Bevaringsstrategier for digitale arkivalier

alternative løsning er reproduktion, altså en genkodning af spillet fra bunden på en ny

computerplatform. Dette er muligt med simple spil, som f.eks. computerspil fra først i 1980’erne

men det er det næppe med nutidens meget store og komplekse computerspil. Reproduktion er en

meget ressourcekrævende strategi som kun kan komme på tale i situationer hvor en emulation er

umulig f.eks. hvis det originale spil er gået tabt. I en sådan situation vil det være en mulig del af en

bevaringsstrategi at kode spillet på ny ud fra billeder og filmklip. Der er blevet eksperimenteret med

rekonstruktion af computerspil i forbindelse med undersøgelser af brugernes oplevelse af

henholdsvis den emulerede versions og den rekonstruerede versions ”look and feel” set i forhold til

det originale spil afviklet på den originale platform. I et eksperiment undersøgte man brugernes

oplevelse af ”look and feel” ved spillet Chuckie Egg i henholdsvis en emuleret og en rekonstrueret

udgave efter at de først havde prøvet det originale spil på dets originale platform, som var en BBC

Microcomputer. Resultatet af denne undersøgelse var lidt overraskende, at der ikke var nogen

nævneværdig forskel mellem brugernes vurdering af de to versioners evne til at indfange det

originale spils ”look and feel”.17

Dette ændrer dog ikke ved, at adgangen til den oprindelige byte

stream via en emulator er at foretrække frem for rekonstruktionen både set ud fra et økonomisk

synspunkt og ud fra den betragtning, at vi naturligvis skal bevare de originale dokumenter, når det

er teknisk muligt.

Hvis jeg skal konkludere på denne diskussion, vil jeg sige, at hensynet til at bevare de originale levn

må veje tungt, og at emulatorstrategien i den forbindelse er et godt redskab til at sikre, at de digitale

kilder forbliver tilgængelige. Dette siges dog med forbehold for, at der fortsat er tekniske og

juridiske problemstillinger at løse, hvis emulation skal blive den udbredte digitale bevaringsstrategi.

Samtidig er det vigtigt at få med, at emulation ikke til alle digitale kilder er det mest egnede; i

forbindelse med nogle typer af digitale kilder vil en migreret udgave i realiteten give et bedre

billede af det arkiverede dokument, end den emulerede udgave, ligesom det i visse tilfælde vil være

praktisk umuligt at vælge emulationsstrategien. Hvad angår det økonomiske aspekt ved

bevaringsstrategierne, vil jeg som tidligere nævnt stille mig tvivlende overfor den almindelige

holdning, som præger den danske diskussion, idet jeg mener at have set og fremlagt gode

argumenter for at emulationsstrategien i de fleste tilfælde er den både teknisk og økonomisk mest

overkommelige løsning.

17 Hedstrom, Margaret & Clifford Lampe: "Emulation vs. Migration: Do Users Care?" (2001).

Page 14: Bevaringsstrategier for digitale arkivalier

Litteraturliste

Andersen, Bjarne: ”DK-domænet i ord og tal” (2006).

http://netarkivet.dk/publikationer/DFrevy.pdf

Bearman, David: "Reality and Chimeras in the Preservation of Electronic Records" (1999).

http://www.dlib.org/dlib/april99/bearman/04bearman.html

Gilheany Steve: "Preserving Information Forever and a Call for Emulators" (1998).

http://www.archivebuilders.com/pdf/22010v052.pdf

Granger, Stewart Granger: "Emulation as a Digital Preservation Strategy" (2000).

http://www.dlib.org/dlib/october00/granger/10granger.html

Hedstrom, Margaret & Clifford Lampe: "Emulation vs. Migration: Do Users Care?" (2001).

http://www.rlg.org/preserv/diginews/diginews5-6.html#feature1

Mellor, Phil m.fl.: "Migration on Request, a Practical Technique for Preservation".

http://www.si.umich.edu/CAMILEON/reports/migreq.pdf

Oltmans, Erik & Nanda Kol: "A Comparison Between Migration and Emulation in Terms of Costs"

(2005).

http://www.rlg.org/en/page.php?Page_ID=20571&Printable=1&Article_ID=1714

Pace, Andrew K.: "Digital Preservation: Everything New Is Old Again" (2000).

http://www.infotoday.com/cilmag/feb00/pace.htm

Ross, Seamus & Ann Gow: "Digital Archaeology: Rescuing Neglected and Damaged Data

Resources" (1999).

http://www.ukoln.ac.uk/services/elib/papers/supporting/pdf/p2.pdf

Page 15: Bevaringsstrategier for digitale arkivalier

Rothenberg, Jeff: "Avoiding Technological Quicksand: Finding a Viable Technical Foundation for

Digital Preservation" (1999).

http://www.clir.org/PUBS/reports/rothenberg/pub77.pdf

Rothenberg, Jeff: "Ensuring the Longevity of Digital Information" (1999).

http://www.clir.org/PUBS/archives/ensuring.pdf

Wheatley, Paul: "Migration - a CAMiLEON discussion paper" (2001).

http://www.ariadne.ac.uk/issue29/camileon/

"Preserving Digital Information - Report of the Task Force on Archiving of Digital Information"

(1996).

ftp://ftp.rlg.org/pub/archtf/final-report.pdf

Udarbejdet af:

Daniell Marcussen

Studienr. 20001525

Januar 2007