gross denken, schlank produzieren. kostentreiber der massendigitalisierung
DESCRIPTION
Im Rahmen der laufenden Bestandsentwicklung und mit zahlreichen Drittmittelprojekten betreibt die Sächsische Landesbibliothek - Staats- und Universitätsbibliothek Dresden eines der größten Digitalisierungszentren in öffentlicher Hand. Im Vortrag werden Ausstattung, Workflow und Ergebnisse des Dresdner Digitalisierungszentrums vorgestellt und aktuelle Stückkosten für einzelne Medientypen und Bearbeitungsarten genannt. Anschließend werden Einflussgrößen beschrieben, die die Produktionskosten jeweils wesentlich beeinflussen.TRANSCRIPT
Groß denken, schlank produzieren.Kostentreiber der Massendigitalisierung
Dr. Achim Bonte
10.06.2011
2
Groß denken, schlank produzieren Aktueller Produktionsstand
• 30.000 Handschriften und Drucke mit über 5 Mio. Seiten
• 950.000 Fotos
• 16.500 Karten
• 4.000 Zeichnungen
• Erste digitalisierte Film- und Tonsequenzen
• Umfassende, medientypübergreifende Recherche im SLUB-Katalog
• Aktive Unterstützung von Kultureinrichtungen in Sachsen und anderenorts
bei Produktion und Präsentation von Digitalisaten
09.06.2011Dr. Achim Bonte
3
Groß denken, schlank produzieren Aktueller Produktionsstand
09.06.2011Dr. Achim Bonte
4
Groß denken, schlank produzieren Aktueller Produktionsstand
09.06.2011Dr. Achim Bonte
5
Groß denken, schlank produzieren Aktueller Produktionsstand
09.06.2011Dr. Achim Bonte
6
Groß denken, schlank produzieren Aktueller Produktionsstand
09.06.2011Dr. Achim Bonte
7
Groß denken, schlank produzieren Aktueller Produktionsstand
09.06.2011Dr. Achim Bonte
8
Groß denken, schlank produzieren Aktueller Produktionsstand
09.06.2011Dr. Achim Bonte
2011 2010 2009 2008
> 3.000.000 2.332.757 981.169 233.174
Digitalisierungsleistung (Images)
9
Groß denken, schlank produzieren Aktueller Produktionsstand (Drucke)
09.06.2011Dr. Achim Bonte
10
Groß denken, schlank produzieren Aktueller Produktionsstand (Drucke)
09.06.2011Dr. Achim Bonte
11
Groß denken, schlank produzieren Definitionen
• Massendigitalisierung = Produktion von > eine Million Seiten in einem
begrenzten Zeitraum bei gleichbleibend hoher Qualität
Ende 2004 Start des Google Books Library Project
März 2007 Bekanntgabe der Kooperation von BSB und Google
Dezember 2009 Verwaltungsabkommen zwischen Bund und Ländern
über die Errichtung und den Betrieb der Deutschen Digitalen Bibliothek
• Kostentreiber = Eine Maßgröße, die das Kostenvolumen beeinflusst
09.06.2011Dr. Achim Bonte
12
Groß denken, schlank produzieren Notwendigkeit von Prozesskostenanalyse und -steuerung
09.06.2011Dr. Achim Bonte
13
Groß denken, schlank produzieren Notwendigkeit von Prozesskostenanalyse und -steuerung
09.06.2011Dr. Achim Bonte
Bibliothek Zahl online
verfügbarer Drucke
Bewilligtes
Gesamtbudget :
Drucke (EUR)
Bewilligtes
Personalbudget :
Drucke (EUR)
A 2.517 180,06 153,71
B 5.510 149,90 121,78
C 7.740 78,74 53,10
D 10.388 70,99 47,46
14
Kostentreiber Zusammenstellung der Vorlagen
• Ziel: Schnellstmögliche, quasi mechanische Auswahl
• Einführung von Acryl-Keilen zur Prüfung der Aufschlagfähigkeit der Vorlagen
bereits im Magazin
• Sicherung eines gewissen Materialvorlaufs und bestimmter
Mischungsrelationen für eine möglichst kontinuierliche Beschickung der
gesamten Geräteausstattung
• Zügige Durchleitung und transparente Verbuchung von Scanvorlagen
• Breite Definition von Roboterfähigkeit (wegen deutlich überlegenem
Durchsatz des Roboters selbst bei halbautomatischem Operating)
09.06.2011Dr. Achim Bonte
15
Kostentreiber Scanner
• Ziel: Kontinuierliche Bearbeitung möglichst aller relevanten Vorlagen
• Dresdner Digitalisierungszentrum (DDZ) als Referat der Abteilung
Bestandsentwicklung
– 2 Scanroboter
– 4 Auflichtscanner
– HIT Vario digital XL
– Grazer Buchtisch
– Fotoscanner
– u.a. http://www.slub-dresden.de/ueber-uns/ddz/
09.06.2011Dr. Achim Bonte
16
Kostentreiber Durchschnittspreise für Scanprozesse
09.06.2011Dr. Achim Bonte
Grazer Buchtisch Auflichtscanner
ScanTech602i
(ProServ)
Scanroboter
Durchsatz pro Stunde
(Durchschnitt)
75 150 475
Personalkosten pro
Image (in €)
0,17 0,08 0,03
17
Kostentreiber Roboteranteile in laufenden Projekten
09.06.2011Dr. Achim Bonte
Stand 31.05.2011 Scans gesamt Scans Roboter Roboteranteil
(in %)
VD 18 1.863.452 1.093.033 58,7
VD 17 441.689 223.244 50,5
Technikgeschichte II 687.911 544.300 79,1
18
Kostentreiber Auflösung und Farbtiefe
• Nach verschiedenen Experimenten in der Frühphase gelten inzwischen
durchweg die Mindestanforderungen der DFG-Praxisregeln
• Zur Reduzierung der Speicherlast wurde an den Scanrobotern die
Auflösung von 400 auf 300 dpi reduziert
• Bitonale Digitalisierung ist bei OCR-fähigen Schrifttypen reiner Textseiten
mit gutem Kontrast ausreichend
• Frakturschriften und Schriften mit geringem Kontrast werden in Graustufen
gescannt
09.06.2011Dr. Achim Bonte
19
Kostentreiber Bildbearbeitung und Qualitätskontrolle
• Ziel: Quantität nicht auf Kosten der Qualität. Andererseits weitgehende
Vermeidung von spezifischem Aufwand
• Bildbearbeitung bei Drucken Bestandteil des Postprocessing als Batch
• Flüchtige Qualitätskontrolle nach dem Postprocess, gründlichere im Zuge
der Strukturdatenvergabe
• Zusätzlich Ausbau von Hinweismöglichkeiten für BenutzerInnen in der
Präsentationsoberfläche (Crowdsourcing-Ansatz)
• Im Fehlerfall bevorzugt neues Scannen kompletter Werke, nicht einzelner
Seiten
09.06.2011Dr. Achim Bonte
20
Kostentreiber Workflowsoftware
• Ziel: Aufbau eines nachhaltigen, selbst tragenden Workflow-Management-
Systems
• Open source-Software Goobi zur Produktion und Präsentation von
Digitalisaten
• Zusammenarbeit der Staatsbibliotheken Berlin, Dresden, Göttingen,
Hamburg und weiterer Bibliotheken sowie der Firmen Intranda und
Zeutschel
• Releasemanagement-Vereinbarung und kooperative Softwareentwicklung
in Launchpad
09.06.2011Dr. Achim Bonte
21
Kostentreiber Workflowsoftware
09.06.2011Dr. Achim Bonte
22
Kostentreiber Workflowsoftware
09.06.2011Dr. Achim Bonte
23
Kostentreiber Strukturmetadaten
• Ziel: Pragmatische Erschließung angesichts künftiger maschineller
Regelverfahren
• Die intellektuelle Vergabe von Strukturdaten ist sehr zeit- und
personalintensiv. Automatisierte Verfahren werden diesen Arbeitsschritt
stark vereinfachen (verbesserte OCR-Prozesse und Extraktionsverfahren)
• Aktuell Markierung des ersten Images eines Strukturelementes während
des Scanprozesses
09.06.2011Dr. Achim Bonte
24
Kostentreiber Speicherkonzept
• Ziel: Optimale Kombination möglicher Speichermedien bei sorgfältiger
Abwägung von Sicherheits- und Kostenaspekten
• Nutzung von Festplatten nur während der Produktion und für Zwecke der
Präsentation
• Auslagerung aller originalen Scandateien auf Band, sowie die Digitalisierung
vollständig abgeschlossen ist. Je kürzer die Durchlaufzeit der Digitalisate,
desto weniger Festplattenkapazität ist erforderlich
• Vertretbare Zugeständnisse bei Performance- und
Sicherheitsanforderungen ergeben teils erhebliche Kosteneinsparungen
(SATA Festplatten, RAID-Konfiguration, größere Festplatten …)
09.06.2011Dr. Achim Bonte
25
Kostentreiber Speicherkonzept
09.06.2011Dr. Achim Bonte
Goobi Presentation
0
5000
10000
15000
20000
25000
01.0
2.2008
01.0
4.2008
01.0
6.2008
01.0
8.2008
01.1
0.2008
01.1
2.2008
01.0
2.2009
01.0
4.2009
01.0
6.2009
01.0
8.2009
01.1
0.2009
01.1
2.2009
01.0
2.2010
01.0
4.2010
01.0
6.2010
01.0
8.2010
01.1
0.2010
01.1
2.2010
01.0
2.2011
01.0
4.2011
GB
yte Kapazität
Belegt
26
Stückkosten VD 18 auf der Basis von 8.000 Einheiten
09.06.2011Dr. Achim Bonte
Aufgabe Bearbeitungszeit/ Einheit (Minuten)
Personalkosten/ Einheit (€)
Kommentar
Projektleitung 5,98 4,04 Rückläufig
Prüfarbeiten Titelzuweisungen
4,33 2,92 Titelzuweisungen fehlerhaft
Vorbereitung 10,76 4,22
Katalogisierung 49,85 22,06
Katalogisat digitale Ausgabe
10,76 4,49 Verbundspezifisch bzw. zu automatisieren
Scanprozesse 35,87 13,29 Diverse Geräte
Strukturmetadaten 10,76 4,22
Summe 128,31 55,24
27
Stückkosten VD 18 auf der Basis von 8.000 Einheiten
09.06.2011Dr. Achim Bonte
Personalkosten /
Einheit
55,24
Sachkosten / Einheit
(Gerätejahreswert, Speicherbedarf)
25,13
Summe (€) 80,37
Vielen Dank für Ihre Aufmerksamkeit!
Groß denken, schlank produzieren.Kostentreiber der Massendigitalisierung