universität zu köln ws 11/12 digitale langzeitarchivierung 17.11.2011 christina vollmert library...

Click here to load reader

Upload: sigmund-wenzler

Post on 05-Apr-2015

104 views

Category:

Documents


0 download

TRANSCRIPT

  • Folie 1
  • Universitt zu Kln WS 11/12 Digitale Langzeitarchivierung 17.11.2011 Christina Vollmert Library of Congress Collections Content Categories
  • Folie 2
  • Bilder
  • Folie 3
  • Anwendungsbereiche: Fotografien, Plakate, Grafiken, Diagramme, dokumentarische Bauzeichnungen Aufteilung in Raster- und Vektorgrafik
  • Folie 4
  • Bestimmung der Formatprferenzen Analyse der signifikanten Charakteristika der Formate
  • Folie 5
  • Bestimmung der Formatprferenzen Auflsung - nicht relevant fr Vektorgrafiken - bestimmende Gre fr die Qualitt von Rastergrafiken - zwei Varianten Gesamtzahl der Bildpunkte (z.B. 7 Megapixel) Anzahl der Bildpunkte pro Zeile (z.B. 2400 x 3000) - zwei Einheiten ppi bezieht sich auf die Lichtpunkte dpi bezieht sich auf die Bildpunkte
  • Folie 6
  • Bestimmung der Formatprferenzen Farbverwaltung - hohe hnlichkeit der Farben zwischen der Ein- und Ausgabe eines Bildes
  • Folie 7
  • Bestimmung der Formatprferenzen Wiedergabe - Bildschirm oder Papier? - Fr welchen Gebrauch?
  • Folie 8
  • Bestimmung der Formatprferenzen Ergebnisse der Analyse mit technischen Informationen der verschiedensten Formate verbinden
  • Folie 9
  • Bevorzugte Formate Rastergrafiken akzeptierte Dateiformate fr Farb- oder Graustufen Bilder: Prioritt 1 TIFF_UNC (Uncompressed Bitmap) TIFF_UNC_EXIF (Umcompressed File with Exif metadata) TIFF/EP (Electronic Photography) JP2_J2L_C_LL (JPEG 2000 Part 1 Core Coding, Lossless Compression) TIFF/IT (Image Technology)
  • Folie 10
  • Bevorzugte Formate Rastergrafiken akzeptierte Dateiformate fr Farb- oder Graustufen Bilder: Prioritt 2 JP2_J2K_C_LSY (JPEG 2000)
  • Folie 11
  • Bevorzugte Formate Rastergrafiken akzeptierte Dateiformate fr Farb- oder Graustufen Bilder: Prioritt 3 PDF/A (PDF for Long-term Preservation) PDF/X (PDF for Graphic Exchange) JPEG_DCT_BL (JPEG, DCT Encoding, Baseline)
  • Folie 12
  • Bevorzugte Formate Rastergrafiken akzeptierte Dateiformate fr Farb- oder Graustufen Bilder: Prioritt 4 PNG (Portable Network Graphics Format) Prioritt 5 GIF (Graphics Interchange Format) Prioritt 6 BMP (Microsoft Windows Bitmap Format9
  • Folie 13
  • Bevorzugte Formate Rastergrafiken akzeptierte Dateiformate fr schwarzwei Bilder TIFF_G4 (Group 4 Compression) J2L_COMP (Compound Images)
  • Folie 14
  • Bevorzugte Formate Rastergrafiken nicht erwnschte Dateiformate RAW PSD PCD EPS FlashPix
  • Folie 15
  • Bevorzugte Formate - Vektor Grafiken akzeptierte Dateiformate SVG_1_1 (Scalable Vector Graphics Ver. 1.1) SVG_1_2 (Scalable Vector Graphics Ver. 1.2) DXF (AutoCad Drawing Interchange Format)
  • Folie 16
  • Bevorzugte Formate - Vektor Grafiken nicht erwnschte Dateiformate AI (Adobe Illustrator) CDR (Corel Draw) CMX (Corel Exchange) DRW (Micrografx Draw) WMF (Windows Metafile) STEP (Standard for the Exchange of Product Model Data)
  • Folie 17
  • Bestimmung der Formatprferenzen Beispiel 1: Arbeiten von Fotografen und Werbedesignern - dokumentarische Fotografien von Tieren & Natur - Modefotografien - Architekturfotografien Farbe & Tonalitt ist von besonderer Wichtigkeit Auflsung ist wichtig, um feine Details sichtbar zu machen Archivierung sollte diese Punkte nicht beeinflussen Typ: Rastergrafik, unkomprimiert Datei Format: TIFF_UNC (RGB color, 24 bit oder grer)
  • Folie 18
  • Audio
  • Folie 19
  • Anwendungsbereiche: Kategorie 1: Aufnahmen (Musik CDs, Hrbcher, etc.) waveform Kategorie 2: Formate der Produktion solcher Aufnahmen note-based
  • Folie 20
  • Bestimmung der Formatprferenzen Wiedergabe - mono oder stereo? - Lautsprecher oder Kopfhrer? - Software ntig, um Nutzer die Kontrolle ber Lautstrke, Balance etc. zu gewhren
  • Folie 21
  • Bestimmung der Formatprferenzen Fidelity - das aufgenommene Klangbild so reproduzieren knnen, dass zwischen Original und Wiedergabe kein hrbarer Unterschied besteht High Fidelity - Abtastfrequenz & Bittiefe
  • Folie 22
  • Bestimmung der Formatprferenzen Mehrkanal-System - Ziel: mglichst realistisches rumliches Klangerlebnis zu ermglichen mehrere Klangkanle: z.B. durch Surround Sound mehrere Inhaltskanle: z.B. Deutsch oder Englischer Ton
  • Folie 23
  • Bestimmung der Formatprferenzen Downloads - usergeneriete Sounds, Samples & Patches
  • Folie 24
  • Bevorzugte Formate Waveform Generell bevorzugt werden - Formate mit hohe Abtastrate - unkromprimierte Formate - nicht schreibgeschtzte Formate
  • Folie 25
  • Bevorzugte Formate Waveform Akzeptierte Formate fr Mono/Stereo WAVE-LPCM-BWF WAVE-LPCM AIFF-LPCM MP3_FF AAC_ADIF AAC_M4A QTA_AAC WMA_WMA9_PRO WMA_WMA9
  • Folie 26
  • Bevorzugte Formate Waveform Akzeptierte Formate fr Surround Sound AAC_ADIF AAC_M4A QTA_AAC WMA_WMA9_PRO
  • Folie 27
  • Bevorzugte Formate Note-based Generell bevorzugt werden - MIDI Encodings MIDI Level 1 wird gegenber Level 2 bevorzugt
  • Folie 28
  • Bevorzugte Formate Note-based Akzeptierte Formte XMF (eXtensible Music Format) SMF (Standard MIDI File) RMID (RIFF-based MIDI File)
  • Folie 29
  • Bestimmung der Formatprferenzen Beispiel 1: CD mit klassischer Musik Wiedergabe eines originalgetreuen Klangbilds sehr wichtig Wiedergabe durch Lautsprecher oder Kopfhrer sollte mglich sein Datei Format: AAC_ADIF
  • Folie 30
  • Text
  • Folie 31
  • Anwendungsbereiche: Verschiedene Arbeiten, die hauptschlich aus Text bestehen Schwerpunkt aber auf Arbeiten, die vorranging physisch existieren. Nicht bercksichtigt werden eBooks oder Formate, die z.B. nur fr einen eBook Reader geeignet sind
  • Folie 32
  • Bestimmung der Formatprferenzen Charakteristika, die fr die Hersteller von Texten wichtig sind - Verstndlichkeit fr die Endnutzer - Qualitt des Designs/ Layouts - erfolgreiche Verbindung von Anwendungsbereich und Absicht - Integritt des Textes, dazugehrigen Diagrammen, Illustrationen, Formeln etc.
  • Folie 33
  • Bestimmung der Formatprferenzen Charakteristika, die fr die Leser heute wichtig sind - Lesbarkeit - Lese- Komfort (visuell ansprechend? Seiten gut umbltterbar/ Scrollen mglich?) - Qualitt von Design und Layout - Verstndnis von Inhalt und Kontext - Integritt der Inhalten - Navigation (z.B. durch verschiedene Kapitel oder Links) - Volltextsuche - Mglichkeit des Zitierens - Mglichkeit, bestimmte Teile auszudrucken
  • Folie 34
  • Bestimmung der Formatprferenzen Charakteristika, die fr die Leser in Zukunft wichtig sind - Verstndnis fr den zeitlichen Kontext, in der das Dokument verfasst wurde - Verstndnis dafr, in wie fern technische Vernderungen die Struktur der Navigation/ Prsentation verndert haben - Mglichkeit, den Wert des Dokuments als historischen Beweis zu berprfen
  • Folie 35
  • Bevorzugte Formate Texte mit strukturiertem Markup (z.B. XML) OEBPS_1_2 (Open eBook Publication Structure) DTB (Digital Talking Book)
  • Folie 36
  • Bevorzugte Formate Texte mit Seiten-Layout PDF/A HTML
  • Folie 37
  • Bestimmung der Formatprferenzen Beispiel 1: Poster, Broschren, Werbeanzeigen Layout & Design ist sehr wichtig Volltextsuche z.B. nicht primr wichtig Lsung: Datei Format: HTML oder PDF
  • Folie 38
  • Bewegte Bilder
  • Folie 39
  • Anwendungsbereiche: Kategorie 1: Animationen, Filme, Videos Kategorie 2: Formate, die fr die Produktion solcher Inhalte genutzt werden Physische Datentrge wie DVDs und Videos werden nicht bercksichtigt
  • Folie 40
  • Bestimmung der Formatprferenzen Wiedergabe - Ausgabe am Bildschirm/ Leinwand - falls Ton vorhanden: mono oder stereo/ Lautsprecher oder Kopfhrer - Einstellungsmglichkeiten im Bezug auf Kontraste, Helligkeit usw. - Mglichkeiten der Navigation (vorspulen, etc.)
  • Folie 41
  • Bestimmung der Formatprferenzen Auflsung - nicht relevant fr Vektorbasierte Animationen wie Flash- Dateien - Bildgre (z.B. TV- Standard 4:3) - geht einher mit der Frame-Anzahl (Standard Video: 30 Frames pro Sekunde; Film 24 Frames pro Sekunde)
  • Folie 42
  • Bestimmung der Formatprferenzen Fidelity - das aufgenommene Klangbild so reproduzieren knnen, dass zwischen Original und Wiedergabe kein hrbarer Unterschied besteht High Fidelity
  • Folie 43
  • Bestimmung der Formatprferenzen Mehrkanal-System - Ziel: mglichst realistisches rumliches Klangerlebnis zu ermglichen mehrere Klangkanle: z.B. durch Surround Sound mehrere Inhaltskanle: z.B. Deutsch oder Englischer Ton, Kommentare des Regisseurs, Sound Effekte usw
  • Folie 44
  • Bevorzugte Formate Filme/ Videos Generell werden Formate bevorzugt, die - eine hohe Bitrate - High Definition anstatt Standard Definition - hohe Bildgren vorweisen
  • Folie 45
  • Bevorzugte Formate Filme /Videos Akzeptierte Formate MPEG-2 MPEG-4_AVC MPEG-4_V MPEG-1 Komprimierte Formate wie AVI, QuickTime, WMV, etc.
  • Folie 46
  • Bevorzugte Formate Animationen Akzeptierte Formate FLA (Macromedia Flash Project File) SWF (Macromedia Flash SWF File) SVG_1_1 (Scalable Vector Graphics Vers. 1.1) SVG_1_2 (Scalable Vector Graphics Vers. 1.2)
  • Folie 47
  • Bevorzugte Formate Produktion Akzeptierte Formate fr nicht komprimierte Daten DPX_2 DCDM_1_0 MXF_GC_UNC MJP2_FF_LL AVI QuickTime WMV
  • Folie 48
  • Bevorzugte Formate Produktion Akzeptierte Formate fr komprimierte Daten MXF_GC_MPEG-2 (MXF File with MPEG2 VideoStream) MPEG-2 MPEG-4_AVC MPEG-4_V MPEG-1 AVI QuickTime WMV
  • Folie 49
  • Bestimmung der Formatprferenzen Beispiel 1: Kinofilm Auflsung und Sound sehr wichtig, ebenso Farbwiedergabe Lsung: Datei Format: DPX_2
  • Folie 50
  • Internet Archive
  • Folie 51
  • Anwendungsbereiche: Internetauftritte aller Art
  • Folie 52
  • Internet Archive Unterscheidung in Web page : a page is a set of one or more Web resources expected to be rendered simultaneously, which can be identified by the URI of the item that embeds the other resources in the set. Web site: an intellectually related set of resources often (but not always) bounded by technical division, such as content from a domain, which may include several related domains, or a subset of content from a host (Web Archive Metrics: Definitions and Framework, December 2005)
  • Folie 53
  • Internet Archive Unterscheidung in Makro- Archivierung: meist ausgehend von groen Institutionen; das gesamte Spektrum des kulturellen Erbes archivieren Mikro- Archivierung: nur ein kleiner Einblick in eine bestimmte Seite um einen bestimmten Aspekt zu archivieren
  • Folie 54
  • Internet Archive Dokumentation - Warum wurde eine bestimme Seite verfasst? Kontext und Umstnde mssen dokumentiert werden z.B. fr zuknftige Analysen
  • Folie 55
  • Bevorzugte Formate Zwei hnliche Formate, die fr Archivierung von Webseiten vom Internet Archive erstellt worden sind ARC (Archive File Format) WARC (Web Archive File Format) speichern mehrere Ressourcen von Webseiten in einer Datei
  • Folie 56
  • Datenstze
  • Folie 57
  • Anwendungsbereiche: standardisierte Datenwerte Fokus: Daten, bei denen die Werte fr ein Element auf eine bestimmte Art beschrnkt sind, z.B. integer
  • Folie 58
  • Bestimmung der Formatprferenzen Struktur - Datenstze werden immer in einer Struktur dargestellt, die die Eigenschaften der einzelnen Daten und die Beziehungen unter ihnen zeigt Syntaktische Integritt und Struktur der Werte muss erhalten bleiben
  • Folie 59
  • Bestimmung der Formatprferenzen Verstndnis - wichtig fr eine Nutzbarkeit in der Zukunft ist ein Verstndnis der Semantik der verschiedenen Elemente Semantik sollte explizit beschrieben werden, z.B. in einem expliziten Dokument (das vorzugsweise maschinenlesbar ist)
  • Folie 60
  • Bevorzugte Formate Fr Datentypen (CSV) VOT (Format der Virtual Observatories) DBF (Format der dBASE Datenbank)
  • Folie 61
  • Bevorzugte Formate Fr Reprsentation von Datenstrukturen CDF (Common Data Format) HDF (Hierarchical Data Format)
  • Folie 62
  • Bevorzugte Formate Standards fr Dokumentationen DDI (Data Documentation Initiative) ISO 19115
  • Folie 63
  • Zusammenfassung
  • Folie 64
  • InhaltEmpfohlenes Format Bilder (Rastergrafik, farbig)TIFF (und div. Untertypen) Bilder (Rastergrafik, s/w)TIFF_G4 Bilder (Vektorgrafiken)SVG Audio (mono/stereo)WAVE Audio (surround)AAC_ADIF Audio (notebased)SMF TextePDF Film/ VideoMPEG AnimationenFLA Film/ Video Produktion (unkompr.)DPX_2 Film/ Video Produktion (kompr.)MXF