email archival and discovery michael prib seminar stupro cims 14.07.2009 cims

25
Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Upload: leutpald-helferich

Post on 06-Apr-2015

123 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Email Archival and Discovery

Michael PribSeminar StuPro cims

14.07.2009

cims

Page 2: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Email Archival and Discovery 14.07.2009 2cims

Agenda

• Einleitung• Email Archival and Discovery• EAD-Prototyp• Zusammenfassung• Demonstration

Page 3: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Email Archival and Discovery 14.07.2009 3cims

Einleitung

Page 4: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Email Archival and Discovery 14.07.2009 4cims

Einleitung

• Softwaregestützte Datenverwaltung- Gründe:

• riesige Datenmengen• enormer Aufwand

- Lösung: Enterprise-Content-Management (ECM)

• Anpassungsfähigkeit• Durchsatz• Sicherheit

Page 5: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Email Archival and Discovery 14.07.2009 5cims

Email Archival and Discovery (EAD)

Page 6: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Email Archival and Discovery 14.07.2009 6cims

• Mailbox-Kapazität Beschränkungen

• Information in der E-Mail

• Rechtliche Voraussetzungen

• Gerichtsbeschlüsse

Warum braucht man EAD-Systeme?

Page 7: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Email Archival and Discovery 14.07.2009 7cims

Eingliederung ein E-Mail System

Abbildung 1: E-Mail-System [2]

Page 8: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Email Archival and Discovery 14.07.2009 8cims

• Einfügen der E-Mail

• Compliance und Discovery

• Suche und Retrieval

• Löschen der E-Mails

Funktionale Anforderungen an ein EAD-System

Page 9: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Email Archival and Discovery 14.07.2009 9cims

• Zuverläsigkeit, Rechstgültigkeit, Sicherheit

• Hohe Leistung und besonders hoher Durchsatz (sehr große Datenmengen)

• Finanzielle Tragbarkeit und Rentabilität (kleine und mittlere Unternehmen)

Nicht-funktionale Anforderungen an ein EAD-System

Page 10: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Email Archival and Discovery 14.07.2009 10cims

Das EAD-Prototyp

Page 11: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Email Archival and Discovery 14.07.2009 11cims

• Entwickelt im Rahmen des CMaaS-Projekts (Content Management as a Service) in Zusammenarbeit von Uni-Stuttgart, Uni-Hamburg und IBM Deutschland Research and Development GmbH

• Serviceorientierter Ansatz

Das EAD-Prototyp

Page 12: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Email Archival and Discovery 14.07.2009 12cims

Schichtenbasierte Architektur

Abbildug 2: Prototyp-Architektur [2]

Page 13: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Email Archival and Discovery 14.07.2009 13cims

Infrastructure SoftwareHier weden die E-Mails

abgespeichert

Unveräderliche Metadaten

veränderliche Daten

Abbildung 2: Infrastructure-Software-Schicht [2]

Page 14: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Email Archival and Discovery 14.07.2009 14cims

• Indexiertes Inhalt der E-Mail (unveränderlich)– Voll-Text-Index

• Status der E-Mail (veränderlich)– Metadaten DB

• Benutzer- und Zugriffskontrolle für eine E-Mail (veränderlich)

Im Katalog abgelegte Daten

Page 15: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Email Archival and Discovery 14.07.2009 15cims

Applikationsschicht

SOAP SOAP

Eifüge-Prozess

Suche und Retrieval

Abbildung 4: Applikationsschicht [2]

Page 16: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Email Archival and Discovery 14.07.2009 16cims

• Vertikal- Vorteil: geringer

Administrations-aufwand

- Nachteil: begrenzte Skalierbarkeit (CPU Anzahl)

Horizontal- Vorteil: praktisch

unbegrenzte Skalierbarkeit

- Nachteil: großer Administrations-aufwand

Skalierarkeit

Page 17: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Email Archival and Discovery 14.07.2009 17cims

Horizontale Skalierung im Prototyp

Abbildung 6: DHT als Koordinationsschicht

Page 18: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Email Archival and Discovery 14.07.2009 18cims

Einfüge-Prozess

Abbildung 7: Einfüge-Prozess [6]

Page 19: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Email Archival and Discovery 14.07.2009 19cims

Messung

Abbildung 8: Einfüge-Prozess-Messung [6]

Page 20: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Email Archival and Discovery 14.07.2009 20cims

Verteilte Suche

Abbildung 9: Verteilte Suche

Page 21: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Email Archival and Discovery 14.07.2009 21cims

• Enterprise-Content-Management• Email Archiv and Discovery

- Sicherheit- Skalierbarkeit- Hoher Durchsatz

• Prototyp- DHT(horizontale Skalierung)- Hybrides Katalog

Zusammenfassung

Page 22: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Email Archival and Discovery 14.07.2009 22cims

Demo

Page 23: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Email Archival and Discovery 14.07.2009 23cims

• [1] Cataldo Mega, Kathleen Krebs, Frank Wagner, Norbert Ritter und Bernhard Mitschang: Content-Management-Systeme der nächsten Generation, IBM Deutschland Research & Development Universität Hamburg und Universität Stuttgart.

• [2] Frank Wagner, Kathleen Krebs, Cataldo Mega, Bernhard Mitschang, und Norbert Ritter: Email Archiving and Discovery as a Service, IBM Deutschland Research & Development Universität Hamburg und Universität Stuttgart.

• [3] Martin Russold: Erweiterung des Datenmodells für ein System zur Email Archivierung und Discovery, Abteilung Anwendersoftware, Universität Stuttgart

• [4] Alexander Moosbrugger: Evaluation of Scale-Out Characteristics of an ECM System using Overlay-Techniques to Support Dynamic Topologies , Abteilung Anwendersoftware Universität Stuttgart

Quellen (1)

Page 24: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Email Archival and Discovery 14.07.2009 24cims

• [5] IBM Deutschland Research and Development GmbH: Monitoring the EADM prototype

• [6] David Lebutsch, Alexander Moosbrugger, Frank Wagner: Enhancing Enterprise Content Management Systems for Dynamic Provisioning and Scale-out, Universität Stuttgart

• [7] Ian Sommerville: Software Engineering, Pearson Studium

Quellen (2)

Page 25: Email Archival and Discovery Michael Prib Seminar StuPro cims 14.07.2009 cims

Email Archival and Discovery 14.07.2009 25cims

Fragen?

?