e-mails und projekte systemunabhängig archivieren mit pdf/a | bitkom ecm-forum auf der dms expo...
DESCRIPTION
Referent: Dietrich von Seggern, Business Development Manager, callas software GmbH Vortrag der callas software GmbH auf dem BITKOM ECM-Forum zur DMS Expo 2013TRANSCRIPT
E-Mails und Projekte systemunabhängig archivieren mit PDF/A
Dietrich von Seggern, Business Development Manager callas software GmbH, Berlin
1) Was bedeutet systemunabhängiges archivieren?2) Anwendungsfall: Projektdokumentation bei Sika3) PDF/A-3 als systemunabhängiges Format für Projektarchive4) Warum und wie E-Mails mit PDF/A archivieren?
E-Mails und Projekte systemunabhängig archivieren mit PDF/A
Keine Abhängigkeiten von Viewing-Anwendungen- Ausschließlich Standard-Dateiformate (PDF/A)
- Kontrollierte Ausnahmen?Keine Abhängigkeiten von Verwaltungsanwendungen
- Unabhängig vom Projektdokumentationssystem, DMS, ECM und dergleichen
- Was ist wenn das Archivsystem selbst nicht mehr existiert?Das Archivformat muß vollständig sein:
- Alle relevanten Metadaten
- Bezüge zwischen ArchivdokumentenSicherheit bei Wegfall des Supports für das ArchivsystemEinfache Migration bei Systemwechsel
Systemunabhängigkeit beim Archivieren
PDF/A-1 (“Classic”)keine Attachments
Dokumentbezüge als Attachments mit PDF/A
PDF/A-1 (“Classic”)keine Attachments
Dokumentbezüge als Attachments mit PDF/A
PDF/A-2 (“Newer”)Attachments als PDF/A
PDF/A-1 (“Classic”)keine Attachments
Dokumentbezüge als Attachments mit PDF/A
PDF/A-2 (“Newer”)Attachments als PDF/A
PDF/A-3 (“Extensible”)Attachments in beliebigen Formaten
Häufig heterogene Dokumentenformate- Dokumente (Office Dateien, ...)
- Maschinenlesbare Daten (z.B. XML)
- Bilder, Audio, Filme
- Rohdaten (z.B. Meßwerte)Zum Beispiel in Engineering und Herstellung
- 3D Modelle
- Technische Dokumentation
- ProjektdokumentationUnter Umständen komplexe Beziehungen zwischen den Dokumenten
Zum Beispiel Projektakten
Anwendungsfall: Projektarchivierung bei der Sika
Sika
Projektdokumentation soll archiviert werdenDokumentation der QualitätssicherungAbsicherung, da die Produkte (z.B. Klebstoffe) in Brücken oder Fahrzeugen verwendet werdenKeine gesetzlichen Vorgaben zur Aufbewahrung
Ablösung eines PapierarchivesDigitales Archiv erlaubt schnelleren Zugriff und dient auch als Knowledgebase
“Leidvolle” Erfahrung bei der Ablösung eines DMS Systems:Projektdokumentation konnte nur manuell in ein neutrales Format überführt werden
Motivation
Dokumente sollen so archiviert werden, dass sie als Projekt zusammengefasst bleibenUnabhängigkeit vom DMS System (Hype)Erzeugung eines “Indexfiles” mit einer Übersicht und Links auf alle zum Projekt gehörenden DokumenteAutomatische Archivierung, sobald ein Projekt im DMS auf den letzten Workflow-Status gesetzt wird
Konvertierung zu lastarmen Zeiten, z.B. nachtsJedes Projekt mit den wichtigsten Metadaten (Titel, Autor, Projektnummer, etc.) archivierenMengengerüst:
17000 aktive Projekte40000 Attachments
Anforderungen
Sika / Hype: Product Development Process (1)
Erzeugung von PDF/A-3 Varianten aller Originale (Office Dokumente, vor allem Word und Excel)Erzeugung eines neuen Index PDFs für das ProjektOriginale werden “neben” den PDF/A-3 Varianten in dem Index PDF abgelegt
Sika / Hype: Product Development Process (2) Attachments
Erzeugung von PDF/A-3 Varianten aller Originale (Office Dokumente, vor allem Word und Excel)Erzeugung eines neuen Index PDFs für das ProjektOriginale werden “neben” den PDF/A-3 Varianten in dem Index PDF abgelegt
Ablauf
Export aus DMS (Hype) AutomatisierteKonvertierung nach PDF/A
Erzeugung des PDF/A-3 Containers als Indexdatei
Einbettung von Original und PDF/A Variante
Sika PDF/A-3 Archiv für Produkt: Sikaflex
Beispiel Index-Datei
In PDF/A-3:- Beziehungsart: Begleitmaterial (supplement)- Bezugspunkt: (gesamtes) Dokument
Beziehungsart muß festgelegt seinVordefinierte Werte
Quelle (source), Alternative (alternate), Begleitmaterial (supplement), ...
ErweiterbarBezugspunkt im PDF muß festgelegt sein
Dokument, Seite, Seitenbestandteil, ...Dateityp muß angegeben sein (MIME type)
MS Word z.B. “application/msword”
Was man zu PDF/A-3 wissen muß:Vorgeschriebene Metadaten für Attachments
Auffindbar, auch von anderen ProgrammenKünftig auch in PDF 2.0Kompatibel mit bisherigen Konstrukten (abwärtskompatibel)Attachments werden beim Einbetten komprimiert
Einsetzbar auch im DokumentenversandErsatz für ZIP StrukturenKonkret: ZUGFeRD Rechnungen
Standardisierte Dokument-”Archive” mit PDF/A-3
PDF/A-3 definiert einen Weg, wie auf eingebettete Dateien zugegriffen werden kann
- Expliziter Bezug- Art der Beziehung zwischen PDF und verbundener
Datei definiert- Auffindbar, auch von anderen Programmen- Künftig auch in PDF 2.0- Kompatibel mit bisherigen Konstrukten
Automatisierbare Verarbeitung ist auch Grundlage für ZUGFeRD
PDF/A-1 and PDF/A-2 sind immer Archivformate:Beliebige Dateien bei der Archivierung nach PDF/A konvertieren und validieren
PDF/A-3 als Archivformat:Archivtauglichkeit eingebetteter Dateien bei Archivierung nur teilweise prüfbarVorgelagerte Prozesse müssen ebenfalls “validiert” werden
PDF/A-3 als Archivformat
E-Mails “im Original” aufbewahren - aber was ist eigentlich das Original-E-Mail-Format?
Header / KopfzeilenBody / TextAttachments / Anhänge
persönliche Statistik: ca. 16% (jede 6. E-Mail)
E-Mail-Archivierung mit PDF/A?
Pendant zum Briefkopf in klassischer Email- Pflichtfelder: From, Date
- Sollte vorhanden sein: Message-ID, In-Reply-To (Threads)Auf dem Weg angereichert mit Tracking InformationenAber: Das eigentliche Routing geschieht über das Protokoll (SMTP)
- Nur eingeschränkt aussagekräftig und relativ einfach zu manipulieren
• “From” ist beliebig• “To”, “CC”, “BCC” ordnen nur die per SMTP übermittelte
Adressliste zu
E-Mail: Der Header
Ursprünglich reiner Text (7 bit ASCII, keine Umlaute etc.)
Erweiterungen:Einfache Formatierung (z.B. fett, kursiv)Explizite Unterstützung von länderspezifischen Encodings Umfassende Formatierung mit HTML
- Rückwärtskompatibilität durch mehrere gleichzeitig vorhandene Varianten (“alternates”), also z.B. reiner Text plus formatierter Text plus HTML
- Keine Garantie für Äquivalenz
- Mitunter im reinen Text der Hinweis: “Zum Betrachten dieser E-mail benötigen Sie eine neuere Software”
E-mail: Der Body
Dokumente- Unterschiedlichste Formate und Versionsstände
- Darstellung nur teilweise direkt im E-mail-Programm möglichAusführbares
- .exe-Dateien genauso wie Batch-, Script- oder sonstige ausführbare “Dateien”
“Archive”- ZIP vorherrschend; außerdem tar, gz, hqx, sit, ...
- Enthält eine oder mehrere Dateien in Ordnerstrukturen
- Eingepacktes kann Eingepacktes enthalten
- Eingepacktes kann im Rahmen der E-mail-Darstellungin der Regel nicht “angesehen” werden
E-Mail: Anhänge
E-mail Clients mit POP3: Konvertieren den E-Mail Datenstrom- Einzelne Dateien
• eml (Outlook Express, Thunderbird), • emlx (Apple Mail), • msg (Outlook)
- Datenbanken • mbx (Opera Mail)
Attachments meistens referenziertFormate häufig proprietär, unter Umständen offen gelegt aber Versionsänderungen unterworfen
Lokal gespeicherte E-mails
E-Mail wie empfangen oder versendet- den Datenstrom, oder
- das bereits konvertierte, lokale Format des E-Mail-Clients?
E-Mail-Datenströme: gestern – heute – morgen...- Zeigt ein E-Mail-Client in zehn Jahren die gleiche
Darstellung (Text/HTML) wie heute?
- Den E-Mail-Client mit archivieren?
- Was machen mit den Anhängen?
E-Mails “im Original” aufbewahren – aber was?
“Digitale Ausdrucke” aufbewahren- E-Mail wie im E-Mail-Programm dargestellt nach PDF/A
konvertieren
- Anhänge ebenfalls nach PDF/A konvertieren• Heute ist immer der beste Zeitpunkt für eine Konvertierung
- Wichtig: Header, Thread-Informationen in den Metadaten einfügenVollständigkeit und Unabhängigkeit vom E-Mail-ClientArchivsystem für mit Suchmöglichkeiten für
- Threads (Metadaten)
- Eingebettete Dateien (Attachments)
- Auf einer Ebene mit anderen Dokumenten zu einem Vorgang
Ggf. zusätzlich E-Mail Datenstrom aufbewahren
Doppelt hält besser
Header: In die XMP Metadaten im PDFBody: Nach PDF/A konvertieren
E-Mail nach PDF/A: Header und Body
PDF und PDF/A-3 ermöglichen die systemunabhängige Archivierung von Projekten und E-Mails indem Metadaten und Dokumentstrukturen in das Dokumentformat selbst integriert werden.
Das Original E-Mail-Format ist ein schwer zu verwaltender Datenstrom. Für Retrieval und Wiederherstellung sind alle Bestandteile (Header, Body, Anhänge) problematisch. Für E-Mails ist die doppelte Archivierung, E-Mail Datenstrom und PDF/A die sicherste Form.
Zusammenfassung
Visitenkarte callas software
h15 Mitarbeiter in Berlin MitteWeltweiter Vertrieb, vor allem OEMProdukte:
- pdfaPilot: Archivierung und PDF/A
- pdfToolbox: Publishing und Print
- Automatisierung und Integration: Kommandozeile, Softwarebibliotheken oder Hotfolder
- Interaktive Desktop-Produkte: Standalone oder Plug-In für Acrobat
Buch: “PDF/A kompakt” - Klassiker zum Thema PDF/A(-1), kostenloser DownloadGegründet 1993, PDF Produkte seit 1997Beteiligt an PDF/ISO-Normierung seit 1999
Vielen Dank für Ihre Aufmerksamkeit
Dietrich von SeggernBusiness Development [email protected]
Vortragsvideo und weitere Informationen unter:
http://www.ecm-navigator.de/termine/e-mails-und-projekte-systemunabhaengig-archivieren-mit-pdfa