digitale medienarchive als technische und gesellschaftliche voraussetzung für...

4
102 E. Stiller-Erdpresser: ~~~i~~ ~84 115. Jg. (1998), H. 2 ~i ,*.91 PC Personal Computer SDH PCM Pulse Code Modulation SSU PoP Point of Presents STM16 PSTN Public Switched Telefony Network STM64 RAM Random Access Memory UTA ROM Read Only Memory WAN RTP Real Time Protocol WWW Synchronous Digital Hirarchy Synchronisation Supply Unit Synchronous Transport Module (2.5Gbit/s) Synchronous Transport Module (ca.10Gbit/s) United Telekom Austria AG Wide Area Network World Wide Web Digitale Medienarchive als technische und gesellschaftliche Voraussetzung fª Multimedia-Anwendungen E. Stiller-Erdpresser 1 Es werden immer mehr multimediale Information in Off-line- oder On-line-Dien- sten angeboten. Immer dringender werden daher technische L6sungen ben6tigt, die eine einfache und kostengª Digitalisierung, contentbasierte Erfassung, sichere Archivierung und umfangreiche Retrievalfunktionen fª die multimedialen Daten erm6glichen. Dies ist die Voraussetzung, daB unsere wertvollen analogen Archive auch tats~ichlich in multimedialen L6sungen genutzt werden k6nnen und das beste- hende Wissen auch ª verarbeitet werden kann. Neue Einnahmequellen k6nnen damit geschaffen werden, die nicht nur zur Finanzierung der notwendigen Infrastruktur beitragen, sondem auch den befª Ausverkauf unserer Archive verhindem. Eine L6sung fª die multimediale Archivierung wird vorgestellt. Schlª digitale Medienarchive; Multimedia-L6sungen; Langzeitarchivie- rung; Speichertechnologien; AV-Kompressionsverfahren Digital media archives as technological and social prerequisite for multimedia applications. The need of multimedia information is increasing in on-line and off- line services. The importance of technological solutions for easy and valuable digi- tizing, secure archiving, content based indexing and retrieval for multimedia data is increasing as well. This is a prerequisite for our precious analogue archives to be used in multimedia applications that offers new access to existing knowledge for creating new information. It offers new business chances not only to refinance the investment of the infrastructure but also helps therefore to prevent that our existing archives will be sold out to others. A solution for multimedia archiving will be presented. Keywords: digital media archive; multimedia-applications; long-time archive; sto- rage solutions; AV-compression methods 1. Einleitung Heutige Contentbesitzer sind mit vielen Aufgaben zur Bewahrung ihrer Inhalte betraut, die Erhaltung der Inhalte stellt aber einen hohen zeitlichen und personel- ' Dr. Elisabeth Stiller-Erdpresser, Siemens AG 0sterreich, Ab- teilung AV IMS, Erdberger L~inde 26, A-1030 Wien. len Aufwand dar, der Platzbedarf ist st~indig steigend. Ein wesentliches Problem fª die Archivare ist dabei der Qualit~itsverlust: bei analogen Reproduktionen, sei es Bild, Video oder Audio, tritt bei jeder neuen Gene- ration eine Verschlechterung der Qualit~it ein. Ein gewisser Ausgleich kann durch aufwendige Rekon- stmktionsmaBnahmen erzielt werden, allerdings sind dazu immer Spezialisten n6tig, die die Qualit~it auch

Upload: e-stiller-erdpresser

Post on 10-Jul-2016

214 views

Category:

Documents


2 download

TRANSCRIPT

102 E. Stiller-Erdpresser: ~~~i~~ ~�84 115. Jg. (1998), H. 2 ~i ,*.�91

PC Personal Computer SDH PCM Pulse Code Modulation SSU PoP Point of Presents STM16 PSTN Public Switched Telefony Network STM64 RAM Random Access Memory UTA ROM Read Only Memory WAN RTP Real Time Protocol WWW

Synchronous Digital Hirarchy Synchronisation Supply Unit Synchronous Transport Module (2.5Gbit/s) Synchronous Transport Module (ca.10Gbit/s) United Telekom Austria AG Wide Area Network World Wide Web

Digitale Medienarchive als technische und gesellschaftliche Voraussetzung fª Multimedia-Anwendungen E. Stiller-Erdpresser 1

Es werden immer mehr multimediale Information in Off-line- oder On-line-Dien- sten angeboten. Immer dringender werden daher technische L6sungen ben6tigt, die eine einfache und kostengª Digitalisierung, contentbasierte Erfassung, sichere Archivierung und umfangreiche Retrievalfunktionen fª die multimedialen Daten erm6glichen. Dies ist die Voraussetzung, daB unsere wertvollen analogen Archive auch tats~ichlich in multimedialen L6sungen genutzt werden k6nnen und das beste- hende Wissen auch ª verarbeitet werden kann. Neue Einnahmequellen k6nnen damit geschaffen werden, die nicht nur zur Finanzierung der notwendigen Infrastruktur beitragen, sondem auch den befª Ausverkauf unserer Archive verhindem. Eine L6sung fª die multimediale Archivierung wird vorgestellt.

Schlª digitale Medienarchive; Multimedia-L6sungen; Langzeitarchivie- rung; Speichertechnologien; AV-Kompressionsverfahren

Digital media archives as technological and social prerequisite for multimedia applications. The need of multimedia information is increasing in on-line and off- line services. The importance of technological solutions for easy and valuable digi- tizing, secure archiving, content based indexing and retrieval for multimedia data is increasing as well. This is a prerequisite for our precious analogue archives to be used in multimedia applications that offers new access to existing knowledge for creating new information. It offers new business chances not only to refinance the investment of the infrastructure but also helps therefore to prevent that our existing archives will be sold out to others. A solution for multimedia archiving will be presented.

Keywords: digital media archive; multimedia-applications; long-time archive; sto- rage solutions; AV-compression methods

1. E in le i tung

Heutige Contentbesitzer sind mit vielen Aufgaben zur Bewahrung ihrer Inhalte betraut, die Erhaltung der Inhalte stellt aber einen hohen zeitlichen und personel-

' Dr. Elisabeth Stiller-Erdpresser, Siemens AG 0sterreich, Ab- teilung AV IMS, Erdberger L~inde 26, A-1030 Wien.

len Aufwand dar, der Platzbedarf ist st~indig steigend. Ein wesentliches Problem fª die Archivare ist dabei der Qualit~itsverlust: bei analogen Reproduktionen, sei es Bild, Video oder Audio, tritt bei jeder neuen Gene- ration eine Verschlechterung der Qualit~it ein. Ein gewisser Ausgleich kann durch aufwendige Rekon- stmktionsmaBnahmen erzielt werden, allerdings sind dazu immer Spezialisten n6tig, die die Qualit~it auch

: ~ ~ : 115. Jg. (1998), H. 2 Digitale Medienarchive als Voraussetzung fª Multimedia-Anwendungen 103

tats~ichlich beurteilen k6nnen. Eine grunds~itzliche L6sung fª dieses Problem kann aber nur durch die Digitalisierung erreicht werden, bei der jede Kopie ganz genau dem Original entspricht. Selbst Materialfehler k6nnen automatisch auf Bit-Ebene korrigiert werden.

Die Zeit ist nun reif fª digitale Archive. Wegen des geffihrdeten Zustands vieler analoger Medienobjekte ist es nicht nur h6chst dringlich notwendig mit der digitalen Archivierung zu begim~en, es ist heute auch technisch und wirtschaftlich m6glich, solche L6sun- gen aufzubauen. Nicht unwesentlich fª die Akzeptanz solcher L6sungen hat die heute bereits starke Verbrei- tung des Internets beigetragen: Viele Nutzer erkennen und nutzen die M6glichkeiten zur Wissensbeschaffung ª das Internet in weiten Bereichen, beruflich und privat. Technisch gesehen war eine wichtige Voraus- setzung, dag weltweit akzeptierte Standards fª die Komprimierung von Video- und Audio- und Bildinfor- mationen verabschiedet wurden. Dadurch ist es m6g- lich, auch tats~ichlich Multimedia-Informationen ª intemationale Netze austauschen zu k6nnen. Neue Technologien erm6glichen die technische Realisierung von digitalen Archiven: Leistungsf~ihige Server mit hohen I/O-Kapazit~iten, ausfallsichere Systeme i n Hard- und Software existieren als Standardl6sungen, neue RAID-Speichertechnologien schª vor Daten- verlust auf Harddisks, Robotersysteme erm6glichen automatisierten Zugriff auf Langzeitarchive und Band- technologien aus der Video- und Computertechnik ermtiglichen im Zusammenspiel mit Robotersystemen den Aufbau von Archiven in Tera-Byte (1 012Byte) oder Peta-Bytegr6ge (1015Byte). Basierend auf diesen Stan- dardteclmologien und unter Nutzung der Tatsache, dag jedes Jalar der Preisverfall der Hardware gleichzeitig mit einer deutlichen Leistungssteigerung einhergeht, sind solche L6sungen bereits heute erschwinglich. Zur Realisierung sollte unter diesem Aspekt eine ausbaufii- hige, skalierbare L6sung angestrebt werden, die ein Mitwachsen der Infrastruktur mit dem Wachsen der digitalen Inhalte erm6glicht und damit den Leistungs- anstieg der Standardsysteme nutzt.

2. Anwendungsm6glichkeiten

Archivierungsaufgaben treten in vielen Branchen auf, nicht nur bei den klassischen Archiven, die jedem sofort in diesem Zusammenhang einfallen wie Natio- nalbibliotheken, Museen oder Filmarchive. Industrien, die ihre Produktunterlagen oder Werbematerialien bereits in audio-visueller Form haben, wollen ihre Archive kostengª erhalten beziehungsweise fª neue Unterlagen wiederverwenden oder fª Schulun- gen benutzen. Broadcaster haben riesige Archive, die - falls ª - nur ª Katalogsysteme erschlossen sind. Die Mediendaten sind nur als Originale vorhan- den, ein Zugriff darauf ist daher nur fª einen einge-

schr'finkten Nutzerkreis m6glich. Wª diese Archive in digitaler Form mit den entsprechenden Retrieval- und Browsingmechanismen existieren, k6nnten z. B. Schulen sehr einfach die politischen oder kulturellen Beitr~ige fª den Unterricht nutzen. Umge- kehrt liegen in den Universit~iten die unterschiedlich- sten Wissensarchive vor, die fª wissenschaftliche Sendungen von Broadcastem interessant w~iren, wegen der eingeschr~inkten Zugreifbarkeit aber viel zu wenig genutzt werden. Die Nutzung dieser Informationen w~ire auch zwischen den einzelnen Instituten von gro- gem Interesse. Eine Verbindung ª digitale multime- diale Archive - auch fakult~itsª - k6nnte zur Schaffung von neuem Wissen, basierend auf bereits get~itigter Forschung, beitragen. Produzenten von CD-ROMS greifen ebenso auf Inhalte von unter- schiedlichsten digitalen Archiven zu wie der Adverti- ser, der eine spezielle Filmsequenz ben6tigt. Schall- plattenproduzenten k6nnen digitale Archive nutzen, um itu'e neuesten Ausgaben nicht nur direkt an die Rundfunkstationen zu liefern, sondem diese auch ª Kaufh~iuser ª Netzwerke anzubieten.

3. Funktion des digitalen Medienarchivs

Ftir alle Besitzer multimedialer Inhalte ist es wichtig, diese sicher zu bewahren und effiziente Tools zum Wiederauffinden spezieller Inhalte zu besitzen. Dazu geh6rt zum Beispiel, dag der User alle Inhalte zu einem gesuchten Begriff findet, welche Medien es auch immer betreffen m6ge. Zur Effizienz geh6rt auch, dag die Inhalte sehr rasch gefunden werden k6nnen. Schnelle Zugriffe zu den Speichermedien und Netz- werke mit ausreichender Kapazitfit sind dabei nur ein Teil, einen wichtigen Part fª multimediale Archive stellen die intelligenten Browsingmechanismen dar, die sehr rasch einen inhalflichen • ª die gesuchten Informationen bieten.

Digitale Medienarchive mª daher eine Reihe von Funktionen erfª die in unterschiedlichen Arbeits- pRitzen genutzt werden bzw. am Server zur Verfª stehen. Das Prinzip solcher L6sungen wird in der Abb. 1. dargestellt. Nachstehend werden die einzelnen Funktionen des Systems CARAT-ARC (Computer Aided Radio And TV) erl/~utert.

3.1 Digitalisierung Am Beginn der Arbeit steht die Digitalisierung. Unter- schiedliche Verfahren gelangen dabei je nach Medien- art zur Anwendung. Dabei besteht immer die Maxime: Je mehr Informationen das System automatisch erfas- sen und ablegen kann, desto schneller und einfacher erfolgt dieser sehr zeitaufwendige Arbeitsschritt. Die Digitalisierung erfolgt bei Audio heute entweder linear oder komprimiert. Unterschiedliche Standards fª die Komprimierung stehen heute zur Verfª Die Digi- talisierung ron Video erfolgt heute komprimiert nach

104 E. Stiller-Erdpresser: a l s . Jg. r H. 2

Einspielen, Schnitt

SchnittEinspielen' ~ A u d i ~ Video, Scannen, Images ~ ' Bearbeiten

Mitschnitt Audio,Video

Ablaufsteuerung, Ausspielstation, Audio, Video

Recherche, Audio, Video, Text

Medienpumpe

Datenbank Nearline Archiv

Online Archiv Abb. 1. Prinzipieller Aufbau und Funktionen des digitalen Medienarchivs CARAT

unterschiedlichen Verfahren, je nach sp~iterem Ver- wendungszweck (MJPEG, MPEG1, MPEG2, MPEG 4 .... ). Wichtig bei Videos ist die Erfassung von con- tentbasierten Informationen bereits wahrend der Digi- talisierung. Dies er6ffnet effiziente und innovative M6glichkeiten des Retrieval.

Die automatische Erkennung von Szenen und die Strukturierung des Videos nach diesen Szenen zerle- gen den Gesamtfilm in kurze Sequenzen, die dann ein- zeln zur Beschreibung indiziert werden k6nnen. Auto- matisch wird dabei fª jede Szene ein Keyimage gene- riert, das in stark komprimierter Forro eine weitere, contentbasierte Information fª das Wiederauffinden der Informationen darstellt. All dies wird in Echtzeit w~ihrend des eigentlichen Digitalisierungsprozesses durchgefª und legt damit den Grundstein fª die weitere Bearbeitung.

3.2 Logging

Unter Logging wird das contentbasierte Beschreiben der Inhalte verstanden. Die beschreibenden Daten - Metadaten - werden dabei in einer Datenbasis abge- legt, die mit einer Standard-Datenbank realisiert wurde. Strukturierte Wortlisten mit entsprechender Semantik fª unterschiedliche Dom~inen helfen dabei dem Archivar, genaue und umfassende Beschreibun- gen der Inhalte durchzufª Unterschiedliche Dom~inen in einem Archiv erlauben die Beschreibung des gleichen Multimedia-Objekts fª unterschiedliche Usergruppen. Vordefinierte Wortlisten erm6glichen die Indizierung ª einen definierten Wortschatz, was zur Integrit~it der Datenbeschreibung wesentlich beitr~igt, je nach Userberechtigung ist aber eine sp~itere Erweite- rung sowohl um weitere Attribute als auch um Attri- butswerte m6glich. Freetext-Eingabe stellt eine wei- tere und sehr h~iufig genutzte M6glichkeit zur Beschreibung der Inhalte dar. Die Informationen, die w~ihrend der Digitalisierung automatisch erfaf3t wur- den, wie Szenen, Shots, Keyimages, L~inge, Kompres-

sion, Format usw. werden ebenfalls in der Datenbank abgelegt. Die Erfassung der beschreibenden Daten kann unrnittelbar nach dem Digitalisieren oder auch zu jedem beliebigen sp~iteren Zeitpunkt durchgefª werden. Es k6nnen auch mehrere Archivare gleichzei- tig das gleiche Video indizieren, was wesentlich zur raschen Erfassung der Daten beitr~igt.

3.3 Speicherung und Daten-Refreshing

Der Archivserver ist in einer hierarchischen Struktur aufgebaut: am Online Server sind die Mediendaten auf RAID-Hard-Disks abgelegt, wodurch ein sehr rascher Zugriff erm6glicht wird. Die RAID-Technologie sorgt dabei fª die Sicherheit vor Datenverlust. Das Near- line-Archiv ist auf einem Juke-Box-System mit Robo- terzugriff ausgelagert, wobei die Mediendaten auf B~in- dem, MOD oder CD-ROM gespeichert werden k6n- nen. Dies erm6glicht eine kostengª Speicherung mit Netzwerkzugriff. Das hierarchische Filemanage- ment-System sorgt fª die Migration der Daten auf die unterschiedlichen Speicherhierarchien. Die Daten wer- den dabei nach unterschiedlichen Strategien in die jeweils geeignete Hierarchie transferiert. Dies kann nach Filegr6Be, nach Alter des File, Anzahl der Zugriffe usw. erfolgen. Auch Mehrfachkopien als Sicherungsdaten sind m6glich. Wichtig ist, dal3 der Zugriff auf dieses Archiv wie bei den Disks als Direkt- zugriff erfolgt. Lediglich abh~ingig vom Speicherme- dium ist die Zugriffszeit um die Einlagerung in den ent- sprechenden Recorder und ev. Spulzeiten zur Direktpo- sitionierung erforderlich, dies verl~gert naturgem~iB die Zugfiffszeit auf die Mediendaten. Das Medienar- chiv kann auch Off-line Archive verwalten, dabei wer- den die Mediendaten aus dem Netzwerk zwar ausgela- gert, die Metadaten bleiben aber im System, so da• die Daten jederzeit wiedergefunden werden k6nnen bzw. fª Browsing zur Verfª stehen. Der Archivserver mul3 skalierbar in Speichergr613e, Speichermedien, Netzwerke und Anzahl gleichzeitiger Zugriffe sein.

~~~j~ 115. Jg. (1998), H. 2 Digitale Medienarchive als Voraussetzung fª Multimedia-Anwendungen 105

Auch die Recorder mª je nach der Anforderung der Zugriffszeit konfigurierbar sein. Ein wichtiges Fea- lure ist das automatische Kopieren der Mediendaten, falls die Speichermedien aus Altersgrª zu viele Fehlstellen aufweisen. Es ist nicht mehr wichtig, das ,,ewige" Speichermaterial zu ¡ der ,,ewige" Datensatz ist damit realisiert. Auch das • auf neue Speicherarten ist damit einfach und vor allem ohne manuellen Eingriff realisierbar.

Die Metadatenbank.ist p¡ ebenfalls Bestandteil des Archivservers und kann auch bei kleineren L6sun- gen auf der selben Hardware installiert sein. Die Meta- datenbank untersteht aber in keinem Fall dem Filemi- grationssystem, um jederzeit einen raschen Zugriff auf die Metadaten zu erm6glichen.

3.4 Retrieval und Browsing

Das Wiederauffinden der Informationen in grogen Archiven stellt ein wesentliches Merkmal fª die Nutz- barkeit der Archivinhalte dar. In multimedialen Archi- ven ist es unerl~iglich, dag zu einem gesuchten Begriff auch tats¡ alle Informationen dargestellt werden k6nnen, unabh~ingig vom Medientyp. Kartenbasierter Datenzugriff mit logischen Verknª Zugriff ª Keyimages und Freetext-Recherche helfen, genaue Anfragen an das Archiv formulieren zu k6n- nen. Die Darstellung der Treffer kann nach unter- schiedlichen Methoden erfolgen, als Liste, als Keyima- ges, als Thumbnails oder als 3D-Grafik, bei der inhalt- liche Ng.he in r~iumlicher N~ihe dargestellt wird.

Bei grof3en Archiven erh~ilt man je nach Qualifizierung der Recherche eine gr6gere Anzahl an Treffem. Um fª diese Recherche nicht auf die Qualit¡ die unter Umst~inden im Nearlinearchive abgelegt sind, zugreifen zu mª wird oft ein Browsingarchiv angelegt. Darunter versteht man stark komprimierte Medieninformationen, die fª die Auswahl des Materi- als wertvolle Information liefern. Preview und Preliste- ning geben rasch und effizient Auskunft ª die Rele- vanz der Treffer fª die jeweilige Suche und bieten damit eine weitere wichtige Unterstª fª das Navigieren in der Wissensbasis.

3.5 Remote Access

Moderne L6sungen solcher Archive sind auf Client- Server-Basis realisiert. Die Zugriffe erfolgen dabei ª Netzwerke, die ª eine ausreichende Transport- kapazit~t verfª mª Der Zugriff auf das Archiv kann sowohl ª LAN fª interne Nutzer als auch ª WAN fª externe User erfolgen. Unter Nutzung von preiswerten LAN-Standardtechnologien wie 100- Mbit-Ethemet mit geswitchtem Zugang zu den einzel- nen Stationen k6nnen auch Medienarchive mit Video- anteilen realisiert werden, werm nicht zu hohe Ansprª che ah die Datenrate der einzelnen Videofiles gestellt werden. Die Netzwerkl6sung wird fª gr6Bere Archive

als helerogene L6sung mit einem starken Backbone wie ATM realisierl werden.

Fª den externen Zugriff ist die Nutzung abh/ingig davon, welche Qualit~it an 6ffentlichen WAN-Leitungen vorzufinden ist. Die Qualit~it der Dienste richtet sich dann nach der zur Verfª stehenden Bandbreite. Steht auch im WAN-Bereich ATM-Technologie zur Ver- fª - was heute nur in hochwertigen Intranet L6sun- gen vorhanden ist - ist auch ein vollwertiger Zugriff auf das Medienarchiv m6glich. Sind die Bandbreiten gerin- ger (ISDN . . . . ) so kann auf das Archiv nur in stark kom- primierter Browsing-Qualit~it zugegriffen werden.

3.6 Einbindung in Gesamtliisungen

Digitale Medienarchive k6nnen auch in Gesamtl6sun- gen fª unterschiedliche Nutzer eingebunden werden. Integration mit nachfolgenden Systemen wie z.B. Autoren- oder Abwicklungssysteme geben eine opti- male Einbindung des digitalen Medienarchivs in den Arbeitsprozess. Anbindung an On-Demand Server ermOglicht den Zugriff fª externe User. Das CARAT- Archiv wird z.B. von einer Reihe von Multimedia- Publishern zur Produktion von MM-CD-ROMs benutzt, wobei das Archiv in den kompletten Arbeits- prozess der Publisher integriert ist. Das neue Material wird fª weitere Produktionen zur Verfª gestellt und kann auf diese Weise sehr einfach wiederbenutzt werden. Das Projekt wird von der EU unterstª

4. Zusammenfassung

Medienarchive sind heute auf Grund der laufend fal- lenden Hardware-Preise und der steigenden Hardware- Leistungen ¡ Wesentliche Softwaremerk- male zur Akzeptanz von internen und extemen Usern wurden hier kurz beschrieben. Es existieren technische L/Ssungen, basierend auf Standardsystemen, die die Einfª digitaler Medienarchive erm6glichen. Generelle L6sungen mª noch auf den Gebieten Copyright, Verrechnung sowie fª die Standardisie- rung ron Interfaces geschaffen werden. Digitale Medienarchive sind eine notwendige Voraussetzung fª interaktive Multimedia-L6sungen in vielen Bran- chen. Das Anwachsen an bewahrenswerten Inhalten und die Gefahr des Zerfalls ron wertvollem Bestand macht lnvestitionen in diesem Bereich immer dringen- der. Wir sollten nicht darauf warten, daB andere unsere wertvollen Archive aufkaufen, digitalisieren und anbieten, so dag wir dann unsere eigenen Kulturinfor- mationen - von anderen aufbereitet - zukaufen mª sen. Der Einstieg in die multimediale Archivierung ist fª Contentbesitzer heute wichtiger denn je. Wir soll- ten rasch die M6glichkeit nutzen, unsere Kulturgª nicht nur aufzubewahren, sondem auch ª neue Wege anbieten und vermarkten zu k6nnen. Digitale Medienarchive sind dazu ein wichtiger Baustein.