bevaringsstrategier for digitale arkivalier
DESCRIPTION
Universitetsopgave om bevaringsstrategier for digitale arkivalierTRANSCRIPT
Evaluering i Informationsforvaltning efterår 2006
Bevaringsstrategier for digitale arkivalier
Spørgsmål:
Der ønskes en redegørelse for henholdsvis migration og emulation som bevaringsstrategi.
Endvidere ønskes en diskussion af, hvilke indvirkninger valget af bevaringsstrategi har for
bevaringen af kulturhistoriske digitale kilder.
1.0 Indledning
Historikere har i deres arbejde altid været afhængige af de levn, som fortiden har efterladt sig, men
ikke alle historiske perioder har efterladt sig lige mange kilder. Mængden af kildemateriale fra
forskellige historiske perioder afhænger dels af materialets holdbarhed, dels af det miljø de
opbevares i, og dels af de foranstaltninger man i fortiden har truffet for at sikre bevarelsen af
kilderne. I dag står vi i den paradoksale situation, at det samfund som mange betegner som et
informationssamfund risikerer at efterlade meget få anvendelige kilder til fremtidens historikere.
Det er ikke bevidstheden om vigtigheden af at bevare kilderne eller institutioner til at varetage
bevarelsen, der mangler, men mange af det vigtige digitale kildemateriale, som vi producere i dag,
er simpelthen af en sådan beskaffenhed, at det er meget vanskeligt at bevare i en tilgængelig form.
Hvor f.eks. papirkilder er umiddelbart tilgængelige, er digitale kilders tilgængelighed afhængig af
bestemte teknologier.
Jeg vil i denne opgave, efter en kort introduktion til emnet bevaringsstrategier for digitale kilder,
redegøre for to forskellige strategier dertil, migrationsstrategien og emulationsstrategien.
Efterfølgende vil jeg diskuterer de konkrete problemer, der gælder bevaringen af digitale
kulturhistoriske kilder i relation til disse strategier.
2.0 Bevaringsstrategier
I denne opgave vil jeg kun berøre bevaringsstrategierne emulation og migration, mens jeg vil se
bort fra den museale strategi og udskriftsstrategien.
Før man forholder sig til bevaringsstrategier er det vigtigt at gøre sig klart, hvem man bevarer for.
Det er oplagt, at de personer, som i fremtiden skal anvende de kilder, som vi bevarer, kan have
meget forskellige behov, som stiller forskellige krav til den måde, hvorpå vi bevarer kilderne, og
dermed hvad vi bevarer. Nogle vil måske kun være afhængige af den rå data, som ligger i den
digitale kilde, mens andre, eksempelvis historikere der beskæftiger som med softwarehistorie vil
være afhængige af hele kilden i dens oprindelige digitale form.
De overordnede problemer, som de forskellige bevaringsstrategier forsøger at løse, er dels
forbundet med forældelsen af hard- og software og dels med forgængeligheden af de fysiske
medier, som kilderne opbevares på. Problemet med de forgængelige medier er der kun en løsning
på, nemlig at flytte den arkiverede data fra det oprindelige medie til et nyt. Efterhånden som
medierne i sig selv bliver forældet, er det også nødvendigt at overføre den arkiverede data til nyere
typer af medier, dette kunne f.eks. være fra 5.25” floppydisk over 3.5” HD og CD-ROM til DVD.
Uanset hvilken bevaringsstrategi, man vælger, er det nødvendigt med en kontinuerlig overflytning
til nye medier pga. de fysiske mediers begrænsede levetid.1
2.1 Migration som bevaringsstrategi
Den bevaringsstrategi, som går under betegnelsen migration, er den mest udbredte, og også den
strategi som anvendes i Danmark.
Med migrationsstrategien vælger man at bevare de digitale arkivalier i en tilgængelig form ved at
konverterer dem til nye standardiserede formater efterhånden som de gamle forældes (det originale
version bør naturligvis altid bevares som et supplement til enhver migrationsmetode). Der findes
imidlertid flere forskellige former for migration, som bl.a. Paul Wheatley har forsøgt at udvikle en
række begreber for2 (her i fordansket udgave):
1) Minimum migration
Denne form for migration er relativ simpel teknisk løsning som ikke kræver meget arbejde.
Metoden indebærer at man enten manuelt eller automatisk henter den rene tekst ud af et givent
digitalt dokument (dokument skal her og efterfølgende forstås i en meget bred betydning og også
kan indbefatte hele computersystemer) og gemmer den i et nyt format. Hvis man tager en Word fil
som eksempel vil det betyde at kun den rå tekst gemmes mens alt der f.eks. har med tekstformater,
struktur, layout og funktionalitet at gøre går tabt.
2) Bevaringsmigration
Sigtet med denne bevaringsstrategi er at bevare tekstindhold og evt. hyperstruktur og noget af
dokumentets oprindelige ”look and feel” (alt der har at gøre med design, layout og andre elementer
ved hard- og softwares udformning det påvirker brugerens oplevelse og måske også selve
1 Rothenberg, Jeff: "Ensuring the Longevity of Digital Information" (1999). 2 Wheatley, Paul: "Migration - a CAMiLEON discussion paper" (2001).
anvendelsen) uden at bevare den hard- og software, som dokumentet kørte på. Dette kan ske på tre
forskellige måder: A) Grundlæggende bevaringsmigration, som indebærer at det migrerede
dokument gemmes sammen med en række screenshots, der viser dokumentet i brug på den
oprindelige computerplatform og evt. billeder af det forældede hardware. B) Anoteret
bevaringsmigration, som udover det ovenstående også indeholder en tekst som beskriver brugen af
dokumentet på den oprindelige computerplatform. C) Kompleks bevaringsmigration, som udover
screenshots, billeder og en anotering også indeholder filmsekvenser, der viser dokumentet anvendt
på den oprindelige computerplatform.
Bevaringsmigration er en relativt billig og simpel måde at bevare noget af det originale dokuments
”look and feel” med udgør samtidig i sig selv et bevaringsproblem, idet de filer, som gemmes
sammen med det migrerede dokument for at beskrive det, også skal sikres i en tilgængelig form.
Det er derfor vigtigt nøje at overveje ”holdbarheden” af de valgte formater, således at de uden større
problemer kan migreres sammen med det arkiverede dokument.
3) Rekonstruktion
Det kan diskuteres om rekonstruktion overhovedet kan betegnes som en migrationsmetode men den
er alligevel medtaget her, bl.a. fordi de i visse tilfælde udgør et alternativ til emulationsstrategien.
Rekonstruktion indbefatter at det digitale dokument kodes fra bunden i et nyt programmeringssprog
på en ny computerplatform. Målet med denne metode er at komme så tæt på det originale
dokuments ”look and feel” uden dog at anvende et eneste element fra originalen. Denne metode har
været anvendt i forbindelse med simple computerspil som et brugbart men også meget
omkostningsfuldt alternativ til emulering.
For både minimum migration og bevaringsmigration gælder det, at man enten kan lave en reversibel
eller en ikke-reversibel migration. Den reversible migration laves således at man har mulighed for
migrerer baglæns og dermed sikre sig at migrationen er foregået korrekt ved at sammenligne med
den foregående original. For historikeren må det siges at være afgørende at de originale dokumenter
bevares i deres oprindelige form og at migrationerne er reversible.3
Fordele og ulemper ved migrationsstrategien
En af de mest iøjnefaldende fordele ved migrationsstrategien er, at den gør dele af de digitale
arkivalier umiddelbart tilgængelige uden, at det kræver særligt emulationssoftware eller at brugeren
3 Ibid.
sætter sig ind i anvendelsen af hverken emulatoren eller det system, som emulatoren emulerer. En
anden fordel ved migrationsstrategien er, at man frit kan vælge filformater og dermed undgå
problemer vedrørende ophavsret ved at vælge formater, som ikke er underlagt copyright
restriktioner. Ligeledes kan man vælge formater som er bredt understøttede og som er platform-,
system og programuafhængige. Når det drejer sig om simple digitale dokumenter, som f.eks. tekst,
billeder, lyd- og filmklip, er det ligeledes relativt simpelt og billigt at udvikle automatiske
konverteringsprogrammer, der kan migrerer dokumentet fra et format til et andet.
Det er derimod tvivlsomt om migrationsstrategien er anvendelig og ikke mindst rentabel når det
gælder større og mere komplekse digitale dokumenter. Det først problem som melder sig vedrører
filformater. Migrationsstrategien betyder bl.a. af man forsøger at migrerer digitale dokumenter til
langtidsholdbare standardiserede filformater. Efterhånden som de digitale dokumenter bliver større
og mere komplekse vil de også bestå af stadig flere forskellige filformater (medmindre man vælger
at migrerer alt til rå tekst). Disse filformater forældes alle, og det gør de i forskellige hastigheder og
derfor på forskellige tidspunkter. Dette kan betyde at stadig flere digitale arkivalier vil befinde sig i
en permanent migrationsproces, som i realiteten vil gøre dem utilgængelige. De større og mere
komplekse digitale dokumenter betyder også at det bliver stadig vanskeligere og dyrere at udvikle
software, der kan gennemføre automatiske migrationer, og risikoen for fejl og datatab stiger
markant. Det er ikke utænkeligt, at hvert enkelt dokument vil kræve individuelle løsninger for at
sikre en acceptabel migrationsproces – altså individuelle løsninger for en stadig voksende mængde
arkivalier. Det økonomiske aspekt ved henholdsvis migrationsstrategien og emulationsstrategien er
bl.a. blevet undersøgt af Erik Oltmans fra Koninklijke Bibliotheek (Nationalbiblioteket i Holland)
og Nanda Kol fra Technische Universiteit Delft. Deres undersøgelse viser en lille økonomisk fordel
ved migrationsstrategien på kortsigt, mens emulationsstrategien ser ud til at være endog meget mere
rentabel på længere sigt og særligt når det gælder større mængder arkivalier. Ved bevaring af
1.000.000 digitale objekter over en halvtresårig periode viser undersøgelsen at omkostningerne
forbundet med migrationsstrategien vil være ikke mindre end 79 % højere end omkostningerne
forbundet med emulationsstrategien. Ved bevaring af 5.000.000 digitale objekter viser
undersøgelsen at forskellen vil være endnu større således at omkostningerne forbundet med
migrationsstrategien vil være mere en dobbelt så høje som omkostningerne forbundet med
emulationsstrategien.4
4 Oltmans, Erik & Nanda Kol: "A Comparison Between Migration and Emulation in Terms of Costs" (2005).
Set fra en historikers perspektiv udgør migrationsstrategien også en alvorlig udfordring af
kildebegrebet. Spørgsmålet er om man med migrationsstrategien vi overhovedet efterlader os levn
til fremtidens historikere eller om de er tvunget til at nøjes med beretninger. Teknisk set er der ikke
tale om levn, fordi kilden har gennemgået en forandring igennem migrationens tilpasning til aktuel
teknologi, der er derimod tale om beretninger i forbindelse med alle former for migration inklusivt
rekonstruktionsmetoden. Dette må naturligvis få store konsekvenser for historikerens
arbejdsbetingelser i fremtiden og på hvilke slutninger, det vil være muligt at drage på baggrund af
de bevarede arkivalier. En fremtidig historisk hjælpevidenskab vil måske være digital arkæologi?
Det er naturligvis ikke uvæsentligt hvilken migrationsmodel, man taler om, og historikere vil
naturligvis være bedre stillet med et godt anoteret migreret dokument end et dokument, som har
været udsat for en minimum migration eller, som det i dag ofte er tilfældet, ingenting.
2.2 Emulation som bevaringsstrategi
Emulationsstrategien er en relativt uprøvet bevaringsstrategi, som dog anvendes visse steder i USA
og i forbindelse med fænomenet retrogaming.
Emulationsstrategien handler om at emulere/efterligne forældede computerplatforme ved hjælp af et
stykke software (emulator), der kan køre på en moderne computer. Formålet med emuleringen er at
gøre det muligt at få adgang til de originale digitale dokumenter og derved bevare mest muligt af
dokumentets ”look and feel” uden at skulle bevare den originale hardware. Emulationsstrategien
forudsætter at man bevarer de originale byte streams og udvikler og vedligeholder
emulatorprogrammer der kan efterligne de computerplatforme som de originale byte streams er
skabt til.
Der findes tre grundlæggende typer af emulatorer:
1) Hardware emulation
En hardware emulation efterligner en given computerplatform på hardware niveau. Med denne form
for emulation er det i princippet muligt at køre alle såvel operativsystemer som applikations
programmer, som er udviklet til denne platform. Med denne form for emulering vil det kun være
nødvendigt at udvikle én emulator for hver hardware platform, man ønsker at emulere, for at få
adgang til alle digitale arkivalier som er afhængige af denne platform. Såkaldte retrogamere har
længe udviklet denne type af emulatorer, som i mange tilfælde kan downloades gratis fra
internettet.5
5 Liste over emulatorer: http://www.theoldcomputer.com/Libarary's/Emulation/emulators_summary.htm
Blandt de mest kendte eksisterende hardware emulatorer kan nævnes Commodore 64 emulatoren
CCS64,6 Commodore emulatoren VICE
7 (denne emulator indeholder alle Commodore computere
fra PET til C128), Commodore Amiga emulatoren WinUAE,8 arkademaskine emulatoren MAME
9
og PC emulatoren Bochs IA-3210
2) Operativsystem emulator
Denne form for emulation har samme formål som den ovenstående men foregår på operativsystem
niveau. Dette betyder at det kun er de applikations programmer og dokumenter som er kompatible
med dette operativsystem, som kan som kan køre under emuleringen. Der er ikke umiddelbart
nogen fordele ved at vælge en operativsystem emulation, men det er et muligt alternativ hvis en
hardware emulation af eller anden grund ikke er mulig eller for krævende.
3) Software emulator
Med denne form for emulation emuleres der på software niveau. Dette betyder at det kun er digitale
dokumenter, som er kompatible med det applikations program, der emuleres, som man kan opnå
adgang til. Igen er der ikke umiddelbare fordele ved denne form for emulation men det kan være et
alternativ, hvis de ovenstående former for emulation af den ene eller den anden grund er
udelukket.11
Uanset hvilken form for emulation man vælger, er man afhængig af at de originale digitale
dokumenter bevares, og at den viden og software, som muliggør adgangen til disse dokumenter, er
umiddelbart tilgængelig. Med emulationsstrategien skal man derfor ikke blot opbevare selve den
originale byte stream men også emulatoren og de beskrivelser og specifikationer, som er
nødvendige for at få emulatoren til at fungere. De forskellige elementer, som man evt. kunne
indkapsle sammen med den originale byte stream kunne være: 1) Selve emulatorsoftwaren (eller
evt. et link et centralt arkiv over alle emulatorer), 2) En vejledning i brugen af emulatorsoftwaren og
den emulerede computerplatform, 3) Emulatorspecifikationer der muliggør en genkodning af
emulatorsoftwaren på fremtidige computere (hvis emulatoren af en eller anden grund ikke er blevet
løbende vedligeholdt og opdateret). Derudover er det vigtigt af der sammen med det fysiske medie,
6 CCS64 emulator: http://www.computerbrains.com/ccs64/ 7 VICE emulator: http://www.viceteam.org/ 8 WinUAE emulator: http://www.winuae.net/ 9 MAME emulator: http://www.mame.net/ og den mere brugervenlige MAME32 emulator:
http://mame32qa.classicgaming.gamespy.com/ 10 Bochs IA-32: http://bochs.sourceforge.net/ 11 Rothenberg, Jeff: "Avoiding Technological Quicksand: Finding a Viable Technical Foundation for Digital
Preservation" (1999).
hvorpå de indkapslede filer findes, opbevares en beskrivelse og vejledning i, hvordan man får
adgang til de vejledninger og emulatorspecifikationer, som ligger sammen med den originale byte
stream. Det vil være nødvendigt at opbevare denne beskrivelse og vejledning i en umiddelbar
tilgængelig form, evt. i papir form eller på mikrofilm. Emulationsstrategien forudsætter en vis grad
af migration, idet de vejledninger og specifikationer, som indkapsles sammen med den originale
byte stream, skal bevares i en tilgængelig form og derfor med jævne mellemrum migreres til nye
formater. Ligeledes kræves det, at selve emulatorsoftwaren rekonstrueres efterhånden som de
operativsystemer og den hardware, den skal køre på, forældes. En af de mest fremtrædende fortalere
for emulationsstrategien, Jeff Rothenberg, mener at det udelukkende er nødvendigt at opbevare en
detaljeret emulatorspecifikation for at fremtidige brugere let kan kode en fungerende emulator på
enhver fremtidig computerplatform. Rothenberg forestiller sig endog at det vil være muligt at skabe
en universel emulator af en given computerplatform, som består af en bagvedliggende emulator
kode, som kun kræver en eksekutivfil, som er tilpasset den computerplatform, som emulatoren skal
køre på. På denne måde vil det kun være nødvendigt at skabe en eksekutivfil, som så at sige peger
på den bagvedliggende kode, for at få en fungerende emulator på en hvilket som helst fremtidig
computerplatform.12
Fordele og ulemper ved emulationsstrategien
Den mest oplagte fordel ved emulationsstrategien er at den originale byte stream bevares i en
tilgængelig form, og således bevares også hele det digitale dokuments udseende, funktionalitet og
ikke mindst dets ”look and feel”. Set fra historikerens synspunkt er det ikke uvæsentligt at det med
emulationsstrategien er muligt at bevare det originale dokument i en tilgængelig form. Med
emulationsstrategien er historikeren ikke begrænset til at lave beretningsslutninger, som det er
tilfældet, når man anvender migrationsstrategien. Emulationsstrategien har også den fordel, at den
ikke kræver individuelle løsninger for det enkelte digitale dokument. Når man først har udviklet en
fungerende hardware emulator, vil man have adgang til alle de originale byte streams, som er
afhængig af den emulerede computerplatform. Det er også en fordel ved emulatorstrategien, at man
undgår den risiko for datatab der er forbundet med gentagende migrationer. Der er dog stadig en
mindre risiko for datatab forbundet med flytningerne af de digitale dokumenter fra et medie til et
andet.
12 Ibid.
En ulempe ved emulationsstrategien er at det er vanskeligere at sikre tilgængeligheden. Selvom
emulatoren fungerer, vil det alligevel kræve meget af brugeren at opnå adgang til det arkiverede
dokument. For at få adgang til det digitale dokument forudsættes det at brugeren sætter sig ind i
hvordan emulatorsoftwaren og det emulerede system virker. Det vil derfor være en mere
tidskrævende og vanskelig proces at få adgang til arkivalierne via en emulator end tilfældet er i
forbindelse med migrerede udgaver af arkivalierne. For en god ordens skyld skal det dog nævnes, at
de fleste eksisterende emulatorer er forsynet med en brugergrænseflade, som gør det relativt simpelt
at betjene emulatoren. Hvis man forlader sig på en bevaringsmetode, hvor emulatoren ikke
indkapsles sammen med den arkiverede byte stream og/eller ikke vedligeholdes, men i stedet regner
med at emulatoren kan genkodes ud fra de arkiverede emulatorspecifikationer, kan man også
forestille sig problemer med tilgængeligheden. For det første kan man risikere at
emulatorspecifikationen og/eller vejledningerne er helt eller delvist ødelagt i migrationsprocessen.
For det andet kan man forestille sig at emulatorspecifikationerne (særligt for mere komplekse
platforme) vil være mere eller mindre uforståelige for fremtidens brugere, fordi det anvendte
tekniske sprog er forsvundet med den hardware, den beskriver. Endnu en ulempe er at
emulationsstrategien modsat migrationsstrategien er afhængig af adgangen til software, som kan
være underlagt copyright. Problemet med ophavsrettigheder til den forældede software, som kræves
for at få visse emulatorer til at virke skal løses juridisk før en emulationsstrategi for alvor kan
komme på tale. En indvending, som man støder på, når man beskæftiger sig med
emulationsstrategien, og som bl.a. er blevet fremført af Stewart Granger, er, at hver hardware
opsætning på en moderne computer kræver sin egen emulator. Emulatorene vil således blive meget
komplicerede at udvikle, og man vil skulle udvikle nærmest uendeligt antal unikke emulatorer for at
kunne emulere enhver tænkelig hardware opsætning.13
Eksisterende emulatorer viser imidlertid at
denne antagelse ikke nødvendigvis er rigtig. Ser man f.eks. på Amiga emulatoren WinUAE vil man
se at den kan køre flere forskellige Amiga Kickstart ROM-filer (svarer lidt til BIOS i en moderne
PC) og derfor emulere forskellige udgaver af Amigaen og forskellige operativsystemer. Med
WinUAE emulatoren kan man også indstille CPU typen, chipset, mængde af RAM og drev
hastighed og type individuelt. Det vil sige at man kan emulere en lang række forskellige hardware
opsætninger i den samme emulator. De fleste eksisterende emulatorer muliggør en sådan individuel
indstilling af de enkelte hardware elementer, eksempelvis kan MAME emulere mere end 120
forskellige CPU’ere. Det er derfor ikke utænkeligt at man i fremtiden eksempelvis vil kunne
13 Granger, Stewart Granger: "Emulation as a Digital Preservation Strategy" (2000).
udvikle en PC emulator hvor, BIOS, RAM, CPU, GPU, drev hastighed osv., kan indstilles
individuelt således at man kan emulere et tilstrækkelig bredt spektrum at hardware opsætninger til,
at man kun behøver en PC emulator for at opnå adgang til samtlige arkiverede PC dokumenter.
Hvad angår de økonomiske omkostninger der er forbundet med emulationsstrategien, så er det
oplagt, at udviklingen af præcise emulatorer er bekosteligt, men det er den ikke nødvendigvis
sammenlignet med migrationsstrategien. I den danske debat om de økonomiske aspekter ved
migrations- og emulationsstrategierne ser det ud til at være den almindelige antagelse, at
migrationsstrategien er mest rentable strategi.14
Jeg har imidlertid ikke været i stand til at finde frem
til hvilke undersøgelser, denne antagelse bygger på, og jeg kan således dårligt bedømme den. Ser
man på den internationale debat om bevaringsstrategier, danner der sig slet ikke et lige så entydigt
billede af de økonomiske fordele ved migrationsstrategien. I den hollandske undersøgelse, som jeg
tidligere har refereret til, viser der sig ligefrem en signifikant økonomisk fordel ved
emulationsstrategien, og denne fordel vokser over tid og med antallet af bevarede digitale
dokumenter. Hvis man samtidig sammenholder dette med den antagelse, at mere komplekse digitale
arkivalier kræver mere individuelle løsninger i forbindelse med migration, mens man vil være i
stand til at udvikle standardiserede emulatorer på internationalt niveau, vil jeg være tilbøjelig til at
tilslutte mig den udlægning, at emulation er den mest økonomisk rentable bevaringsstrategi. Det gør
jeg dog med det forbehold, at jeg ikke har haft adgang til de undersøgelser, der må formodes at
ligge til grund for den modsatte udlægning, som ligger til grund for den danske bevaringsstrategi.
3.0 Bevaringsstrategiens indvirkning set i forhold til digitale kulturhistoriske kilder
Kulturhistoriske kilder er en meget bred kategori, som omfatter alt, der vedrører
civilisationsprocesser. Jeg vil imidlertid begrænse mig til at se på de elementer af kulturhistorien,
der har at gøre med kunst, underholdning og kommunikation at gøre.
Hvis det skal være muligt at beskæftige sig med identitets-, køns-, mentalitets-, kunst-, diskurs-,
mikrohistorie og andre kulturhistoriske forskningsfelter, er det afgørende, at vi bevarer
kildemateriale, der kan belyse disse felter. Dette er hidtidigt sket for de ikke-digitale arkivaliers
vedkommende, men med opkomsten af en række nye typer af digitale kilder, står vi overfor den
udfordring at udforme konkrete bevaringsstrategier for disse typer kilder. Det første problem er,
hvad der skal opbevares, og hvem der skal gøre det. Jeg mener, at man kan spore en vis portion
institutionel træghed, når det gælder de typer af digitale kilder, man opbevarer. Ser man f.eks. på
14 http://www.sa.dk/sa/itogarkiv/teknologi/strat/digbevstrat.htm
computerspil, så er det et kulturmedie, som i dag er over 30 år gammelt, og som hvad angår
omsætning overstiger både film- og bogindustrien. Det er ikke usandsynligt, at der i dag er flere
mennesker, der spiller computerspil end mennesker, der læser bøger, og man må efterhånden
erkende, at computerspillet er en endog særdeles vigtig kulturel faktor. Ikke desto mindre findes der
i Danmark på nuværende tidspunkt ikke nogen langsigtet bevaringsstrategi for dette medie, og der
er ikke skabt institutioner specialiseret til bevaringen af denne kildetype – vi har ikke noget der
svarer til f.eks. Det Danske Filminstitut for computerspil.
Jeg vil nu se på en række forskellige eksempler på disse nye kildetyper og diskutere hvilke
konsekvenser, der er ved henholdsvis migration og emulation som bevaringsstrategi.
De første typer af digitale kilder, som jeg vil se på, har med kommunikation at gøre. I løbet af
ganske få år har den teknologiske udvikling frembragt en række ny digitale kommunikationsformer,
som vi ikke tidligere har haft adgang til, som f.eks. SMS/MMS, e-mail, Instant Messaging og
internettets debatfora. I forbindelse med arkivering af disse digitale kommunikationsformer vil
formålet typisk være at bevare selve formen, det vil sige dels hvordan kommunikationen foregår
rent teknisk, og dels hvordan man bruger kommunikationsmidlet. De digitale
kommunikationsmidler er meget forskellige fra ikke-digitale kommunikationsmidler, idet særlig
internettet har muliggjort kommunikation, der er løsrevet fra tid og sted, og således kan ligesindede
eller mennesker med sammenfaldende interesser i hele verden mødes virtuelt meget lettere, end de
ville kunne have gjort uden om de digitale medier. Mediernes form har således betydning for
udviklingen af sociale relationer, sprogets udvikling og også for den effekt det kommunikerede har i
omverdenen. Med bevaringen af de digitale kilder for eftertiden muliggør man således
kulturhistoriske studier af blandt andet disse elementer.
Som det første eksempel vil jeg bruge SMS/MMS. SMS/MMS er en relativt simpel
kommunikationsform, som kan bestå af rene tekststykker, billeder og små filmklip. Hvis vi
forestiller os, at der udvikles en emulator, der kan efterligne en mobiltelefons soft- eller hardware,
ville vi kunne se de originale SMS/MMS meddelelser og sandsynligvis kunne læse dem i en
displayrude, som efterligner den, man finder på en mobiltelefon. Men spørgsmålet er, om en sådan
emulering er nødvendig. SMS/MMSens indhold er relativt simpel, og man må gå ud fra, at det vil
være en enkel proces at migrere den til et nyt format, derfor kan man sige at en emulering af
mobiltelefoner med henblik på at studerer SMS/MMS beskeder er en unødvendig grundig
bevaringsstrategi. Noget af det man derimod kunne interessere sig for i forbindelse med
SMS/MMS, er den måde, hvorpå der over en meget kort periode har udviklet sig en helt ny variant
af det danske skriftsprog. Dette nye skriftsprog vil man sagtens kunne undersøge på baggrund af en
migreret bevaring af eksempler på SMS/MMS meddelelser. Men det vil kræve en meget udførlig
anotering for at man ville kunne forstå, hvorfor dette skriftsprog udvikler sig, som det gør, da
aspekter som fysisk layout af display og tastatur sandsynligvis har afgørende indvirkning på dette.
En kompleks migration ville derfor muligvis være den bedste bevaringsform, hvis historikere i
fremtiden f.eks. skulle undersøge dette SMS/MMS sprogs udvikling.
E-mailen er en digital kommunikationsform, der på visse områder ligner SMS/MMSen, men som
alligevel er en del mere kompliceret. En e-mail kan udover tekstmeddelelsen også indeholde
vedhæftede filer af enhver art og internetlinks. Dette betyder, at e-mailen har en simpel
hyperstruktur, som stiller større krav til en eventuel migration. Hvis denne hyperstruktur skulle
bevares gennem migration, ville det forudsætte, at migrationen også kunne indhente og migrerer de
internetlinks og vedhæftede filer, som e-mailen kan indeholde. Det vil sandsynligvis være en meget
krævende teknisk løsning, hvis den da overhovedet er mulig. En løsning, som virker mere
anvendelig, er PC emulation. Med en PC emulator ville det være muligt at køre det krævede
operativsystem og applikationssoftware for både at få adgang til de originale e-mail filer, de
vedhæftede filer og måske endda til arkiverede internetsider, som f.eks. dem Netarkivet15
indsamler
ved hjælp af web-crawlere. Det sidste forudsætter naturligvis, at internetsiderne er arkiverede i
deres originale format. I modsætning til SMS/MMS meddelelser vil selve indholdet af e-mail
meddelelserne også have en interesse. Ligesom man opbevarer private arkivalier, som f.eks.
brevsamlinger, for deres kulturhistoriske interesse ville det også være oplagt at arbejde for at
sådanne e-mail arkiver vil blive bevaret for eftertiden.
Instant Messaging (IM), som man bl.a. kender fra MSN Messenger, AIM og ICQ, er også en vigtig
digital kommunikationsform som kunne være interessant at bevare i en eller anden form. I dette
tilfælde er det næppe muligt at opbevare IM kommunikation og siden hen emulere den, da
kommunikationen foregår som en direkte chat mellem forskellige mennesker og ikke gemmes i
filer, der opbevares, sådan som det er tilfældet med SMS/MMS og e-mail. En IM kommunikation
kan omfatte mange mennesker på en gang, og den muliggør såvel stemme- og videokommunikation
som deling af filer. Det vil selvfølgelig være en god ide at bevare IM klienterne, således at de kan
køres under en PC emulator og afprøves gennem etableringen af netværk mellem flere PC
emulationer. Men det vigtigste vil efter min mening være en grundig anotering som indeholder en
omfattende videodokumentation, billeder og beskrivelser, der dokumenterer de mange forskellige
15 http://netarkivet.dk/
funktioner og anvendelsesmuligheder IM har. Enhver, der har skrevet gruppeprojekt på
universitetet, kender sikkert til at bruge IM, og et af de meget interessante aspekter ved denne
kommunikationsteknologi, er den effekt den har haft på vores arbejdsmønster (mennesker f.eks. kan
arbejde sammen i grupper på trods af store geografiske afstande).
En række andre eksempler på digital kommunikation indsamles i et vist omfang i dag ved hjælp af
web-crawlere, der med jævne mellemrum ”høster” dele af internettet. I Danmark varetages denne
opgave som tidligere nævnt af Netarkivet, der gennemfører 3 forskellige former for høstninger: 1)
Tværsnitshøstning, hvor man indsamler alle danske internetsider 4 gange årligt, 2) Selektiv
høstning, hvor udvalgte internetsider (ca. 80 forskellige) som f.eks. nyhedsmedier høstes med en
højere frekvens (i visse tilfælde 1 gang i timen), 3) Begivenhedshøstning, hvor et større antal
internetsider indsamles hyppigere (typisk dagligt) i forbindelse med særlige begivenheder som
f.eks. valg.16
Jeg mener imidlertid, at der er brug for endnu en høstningstype, nemlig en høstning
der i perioder laver hyppige høstninger at udvalgte fænomener. Disse fænomener kunne f.eks. være
et udvalg af internettets debatfora, YouTube, Google Video, MySpace eller Google Earth (og
særligt al den aktivitet, som foregår omkring dets community), som alle er kendetegnet ved at være
meget dynamiske og ved at skabe helt nye fællesskaber, som er uafhængige af geografisk placering.
Noget af det interessante ved fænomener som disse er, at det på mange måder har nedbrudt
forskellige hierarkier, og at de ved hjælp af ny teknologi har åbnet mulighed for at alle med relativt
enkle midler kan nå ud til utroligt mange mennesker og potentielt ændre politiske og kulturelle
dagsordner på overordnet niveau. For kunne se hvordan en sag kan udvikle sig hurtigt fra bunden
via digitale medier som f.eks. YouTube vil det være nødvendigt, at man i perioder laver hyppige
høstninger. Man kunne f.eks. kalde denne form for høstning for fænomenhøstning. Den eneste måde
at opnå afgang til disse høstninger er gennem emulation. Migration ville være alt for omfattende og
resultatet ville ikke give noget reelt billede af, hvad internettet anno 2007 er for en størrelse. En PC
emulator ville derimod umiddelbart kunne åbne de arkiverede internetsider ved hjælp af den rigtige
browser software og opnå noget, der ligner den oprindelige funktionalitet samt ”look and feel”.
Jeg vil nu gå over til at se på bevaringsstrategier i relation til Computerspil, som udgør en meget
stor andel af det kulturhistoriske digitale kildemateriale, der har med kunst og underholdning at
gøre. Computerspil er og har altid været kendetegnet ved at udgøre noget af samtidens mest
avancerede software og ved at stille store krav til hardwaren. Det er derfor også meget vanskeligt at
forestille sig andre bevaringsstrategier end emulation for denne kategori af kilder. Den eneste
16 Andersen, Bjarne: ”DK-domænet i ord og tal” (2006).
alternative løsning er reproduktion, altså en genkodning af spillet fra bunden på en ny
computerplatform. Dette er muligt med simple spil, som f.eks. computerspil fra først i 1980’erne
men det er det næppe med nutidens meget store og komplekse computerspil. Reproduktion er en
meget ressourcekrævende strategi som kun kan komme på tale i situationer hvor en emulation er
umulig f.eks. hvis det originale spil er gået tabt. I en sådan situation vil det være en mulig del af en
bevaringsstrategi at kode spillet på ny ud fra billeder og filmklip. Der er blevet eksperimenteret med
rekonstruktion af computerspil i forbindelse med undersøgelser af brugernes oplevelse af
henholdsvis den emulerede versions og den rekonstruerede versions ”look and feel” set i forhold til
det originale spil afviklet på den originale platform. I et eksperiment undersøgte man brugernes
oplevelse af ”look and feel” ved spillet Chuckie Egg i henholdsvis en emuleret og en rekonstrueret
udgave efter at de først havde prøvet det originale spil på dets originale platform, som var en BBC
Microcomputer. Resultatet af denne undersøgelse var lidt overraskende, at der ikke var nogen
nævneværdig forskel mellem brugernes vurdering af de to versioners evne til at indfange det
originale spils ”look and feel”.17
Dette ændrer dog ikke ved, at adgangen til den oprindelige byte
stream via en emulator er at foretrække frem for rekonstruktionen både set ud fra et økonomisk
synspunkt og ud fra den betragtning, at vi naturligvis skal bevare de originale dokumenter, når det
er teknisk muligt.
Hvis jeg skal konkludere på denne diskussion, vil jeg sige, at hensynet til at bevare de originale levn
må veje tungt, og at emulatorstrategien i den forbindelse er et godt redskab til at sikre, at de digitale
kilder forbliver tilgængelige. Dette siges dog med forbehold for, at der fortsat er tekniske og
juridiske problemstillinger at løse, hvis emulation skal blive den udbredte digitale bevaringsstrategi.
Samtidig er det vigtigt at få med, at emulation ikke til alle digitale kilder er det mest egnede; i
forbindelse med nogle typer af digitale kilder vil en migreret udgave i realiteten give et bedre
billede af det arkiverede dokument, end den emulerede udgave, ligesom det i visse tilfælde vil være
praktisk umuligt at vælge emulationsstrategien. Hvad angår det økonomiske aspekt ved
bevaringsstrategierne, vil jeg som tidligere nævnt stille mig tvivlende overfor den almindelige
holdning, som præger den danske diskussion, idet jeg mener at have set og fremlagt gode
argumenter for at emulationsstrategien i de fleste tilfælde er den både teknisk og økonomisk mest
overkommelige løsning.
17 Hedstrom, Margaret & Clifford Lampe: "Emulation vs. Migration: Do Users Care?" (2001).
Litteraturliste
Andersen, Bjarne: ”DK-domænet i ord og tal” (2006).
http://netarkivet.dk/publikationer/DFrevy.pdf
Bearman, David: "Reality and Chimeras in the Preservation of Electronic Records" (1999).
http://www.dlib.org/dlib/april99/bearman/04bearman.html
Gilheany Steve: "Preserving Information Forever and a Call for Emulators" (1998).
http://www.archivebuilders.com/pdf/22010v052.pdf
Granger, Stewart Granger: "Emulation as a Digital Preservation Strategy" (2000).
http://www.dlib.org/dlib/october00/granger/10granger.html
Hedstrom, Margaret & Clifford Lampe: "Emulation vs. Migration: Do Users Care?" (2001).
http://www.rlg.org/preserv/diginews/diginews5-6.html#feature1
Mellor, Phil m.fl.: "Migration on Request, a Practical Technique for Preservation".
http://www.si.umich.edu/CAMILEON/reports/migreq.pdf
Oltmans, Erik & Nanda Kol: "A Comparison Between Migration and Emulation in Terms of Costs"
(2005).
http://www.rlg.org/en/page.php?Page_ID=20571&Printable=1&Article_ID=1714
Pace, Andrew K.: "Digital Preservation: Everything New Is Old Again" (2000).
http://www.infotoday.com/cilmag/feb00/pace.htm
Ross, Seamus & Ann Gow: "Digital Archaeology: Rescuing Neglected and Damaged Data
Resources" (1999).
http://www.ukoln.ac.uk/services/elib/papers/supporting/pdf/p2.pdf
Rothenberg, Jeff: "Avoiding Technological Quicksand: Finding a Viable Technical Foundation for
Digital Preservation" (1999).
http://www.clir.org/PUBS/reports/rothenberg/pub77.pdf
Rothenberg, Jeff: "Ensuring the Longevity of Digital Information" (1999).
http://www.clir.org/PUBS/archives/ensuring.pdf
Wheatley, Paul: "Migration - a CAMiLEON discussion paper" (2001).
http://www.ariadne.ac.uk/issue29/camileon/
"Preserving Digital Information - Report of the Task Force on Archiving of Digital Information"
(1996).
ftp://ftp.rlg.org/pub/archtf/final-report.pdf
Udarbejdet af:
Daniell Marcussen
Studienr. 20001525
Januar 2007