Wissenschaftliche Dokumentenserver:Nutzer - Standards - Management
Thomas Severiens
Institute for Science NetworkingFachbereich PhysikCarl von Ossietzky-UniversitätOldenburg
Berlin, 7.7.2000
Anforderungen an ein Dokumentenarchiv
Berlin, 7.7.20002
benötigter Rahmen:Standards: MetaDaten
DC / vcard RDF
XML RDF MathML CML
DigSig
Dienste information systems qualifying systems
Werkzeuge Suchmaschinen dynamic thesauri Upload-tools
Dokument - mehr als nur ein Text
Berlin, 7.7.20003
Beispiele: Publikation - elektronisches Äquivalent zum Paper Dissertation PrePrint - EPrint Conference Talk Arbeitsbericht, Projektbericht, ... Web-Seite, persönliche Homepage ...
Dokument - mehr als nur ein Text
Berlin, 7.7.20004
Zusammensetzung: Text Multimedia verschiedene Versionen des Dokumentes verschiedene Formate (Dateiformate) Anmerkungen Metadaten Verknüpfungen ...
Dokument - mehr als nur ein Text
Berlin, 7.7.20005
beispielsweiseDOC-Datei
Dokument - mehr als nur ein Text
Berlin, 7.7.20006
beispielsweiseDOC-Datei
Viewer-Formatebeispielsweise
HTML, PDF, PS, ...
Archiv-Formatewie SGML
Dokument - mehr als nur ein Text
Berlin, 7.7.20007
AusgangsformatViewer-Formate Archiv-Formate
Dokument - mehr als nur ein Text
Berlin, 7.7.20008
AusgangsformatViewer-Formate Archiv-Formate
HTMLMetadaten (=Daten über Daten)Beschreiben die Datei Autor Titel Abstract Datum Linking (Verknüpfung) ...
Dokument - mehr als nur ein Text
Berlin, 7.7.20009
AusgangsformatViewer-Formate Archiv-Formate
HTML“Shadow-File” Metadaten
Stichwort: Metadaten
Berlin, 7.7.200010
Wozu Metadaten: Beschreibung des Dokumentes automatisiert lesbar
definierte Syntax definierte Semantik
Dublin-Core vcard OAiMS ...
StandardisierungInternationalisierung
Stichwort: Metadaten
Berlin, 7.7.200011
Dublin Core - Beispiel einer Semantik: wenige = 15 genau = qualified definierte Begriffe zum “Object-Description”
http://purl.org/DC
Stichwort: Metadaten
Berlin, 7.7.200012
Dublin Core - die 15 Elemente:
September 1998RFC 2413
Title FormatCreator IdentifierSubject RelationDescription SourceDate LanguagePublisher CoverageContributor RightsType
Stichwort: Metadaten
Berlin, 7.7.200013
Dublin Core - DC.Creator - die Definition:Name: Creator Identifier: Creator Definition: An entity primarily responsible
for making the content of the resource.
Comment: Examples of a Creator include a person, an organisation, or a service. Typically, the name of a Creator should be used to indicate the entity.
Stichwort: Metadaten
Berlin, 7.7.200014
vcard: Beschreibung von Personen (RFC2426)
Definierte Felder:FN, N, NICKNAME, PHOTO, BDAY, ADR, LABEL, TEL, EMAIL, MAILER, TZ, GEO, TITLE, ROLE, LOGO, AGENT, ORG, CATEGORIES, NOTE, PRODID, REV, SORT-STRING, SOUND, URL, UID, VERSION, CLASS, KEY
Beispiel einer Felddefinition:N: Family Name, Given Name, Additional Names, Honorific Prefixes, Honorific Suffixes
Stichwort: Metadaten
Berlin, 7.7.200015
vcard: Beschreibung von Personen
im Shadow-File Vorteil: fester Bestandteil des Dokuments
Nachteil: bei Änderungen aufwendig zu pflegen
extern: Datenbank oder Homepage Vorteil: leicht pflegbar - evtl. durch die Person selbst
Nachteil: geht leichter verloren
rechtliche Probleme
Stichwort: Beschreibung v. PersonenRealisation einer externen Lösung
Berlin, 7.7.200016
Personal Homepages contain all needed information
names links to publication lists description of research-activities
Advantages Information up to date rights stay with author
Problems highly incoherent syntax personal layout highly dynamic information
Solution Professional Homepages
Upload Form Metadata Global Search
Web-Form
Personal Homepage
Qualified Professional Homepage
www.physik.uni-oldenburg.de/EPS/PHP
Developed together withR. Schwänzl and J. Plümer17 Berlin, 7.7.2000
www.physik.uni-oldenburg.de/EPS/PHP
CacheCachehttp
http
http
Query
Answers
Links
Cache: Necessary to min. answering timeMaximum caching time: 1 week
professionalized homepages
Developed together withR. Schwänzl and J. Plümer
Distr.
Infor
m.
18 Berlin, 7.7.2000
Von HTML zu XML und RDF
Berlin, 7.7.200019
Shadow-File in HTML
Vorteile Alle Suchmaschinen verstehen HTML
Datei kann auch als “Inhaltsbeschreibung” für
menschliche Nutzer dienen.
Alle notwendigen Werkzeuge gibt es schon
Nachteile Lineares Datenmodell (Name - Value -Paare)
Was gibt es schon an Werkzeugen?(Autorentools)
Berlin, 7.7.20002020 . . .
www.physik.uni-oldenburg.de/EPS/mmm
Was gibt es schon an Werkzeugen?(Documentmanagementsystems)
Berlin, 7.7.200021
Erzeugung von MetaData Document-upload
Dokumenten-Pflege
XML und RDF
Berlin, 7.7.200022
Welche Vorteile bieten XML und RDF?
XML als “Ergänzung” von SGML und HTML
XML bietet ein baumförmiges Datenmodell
RDF wird in XML repräsentiert
RDF dient der “Content-Description”
RDF bietet beliebig komplexe Datenstruktur
RDF - ein Beispiel
Berlin, 7.7.200023
wurde programmiert
von
http://www.math.uos.de
S
hat als Autor
PXylo
O
X
Alion
wird behauptet von
Tamal
RDF in XML - ein Beispiel
Berlin, 7.7.200024
<?xml version="1.0"?>
<RDF
xmlns="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:DC="http://purl.org/dc/elements/1.0#">
<Description about="http://www.math.uos.de/" bagID=“X">
<DC:Creator>Xylo</DC:Creator>
</Description>
<Description about=“#X" DC:Creator=“Tamal"/>
</RDF>
...
Dokument
Berlin, 7.7.200025
AusgangsformatViewer-Formate Archiv-Formate
HTML“Shadow-File” Metadaten Beschreibung
XMLDokumentenserver für solcheDokumente gibt es schon - inkl. aller notwendigen Werkzeuge
Dokument
Berlin, 7.7.200026
AusgangsformatViewer-Formate Archiv-Formate
HTML“Shadow-File” (Metadaten) Beschreibung
XML “Shadow-File” Metadaten Authentizität
Dokument - signierbare Elemente
Berlin, 7.7.200027
AusgangsformatViewer-Formate Archiv-Formate
HTML XML Metadaten Autor(en) Titel ...
Dokument - signierbare Elemente
Berlin, 7.7.200028
AusgangsformatViewer-Formate Archiv-Formate
HTML XML Metadaten Autor(en) Titel ...
Dokument - signierbare Elemente
Berlin, 7.7.200029
AusgangsformatViewer-Formate Archiv-Formate
HTML XML Metadaten Autor(en) Titel ...
Dokument - signierbare Elemente
Berlin, 7.7.200030
AusgangsformatViewer-Formate Archiv-Formate
HTML XML Metadaten Autor(en) Titel ...
Dokument - signierbare Elementeggf. durch unterschiedliche Instanzen
Berlin, 7.7.200031
AusgangsformatViewer-Formate Archiv-Formate
HTML XML Metadaten Autor(en) Titel ...
Auf dem Weg zum „Web of Trust“
Berlin, 7.7.200032
Authentizität Alle Beteiligten brauchen Zertifikate Problematik wenig publik Werkzeuge noch unvernetzt
DigSig in XML (W3C-Arbeitsgruppe) Canonicalization Hashing
MD5, ... Signature
DSA, RSA Encoding
Base64, HMAC, ...
Auf dem Weg zum „Web of Trust“DigSig in XML - Ein Beispiel
Berlin, 7.7.200033
<Signature> <SignedInfo> <CanonicalizationMethod Name="http://www.w3.org/TR/1999/WD-xml-c14n-19991115" /> <SignatureMethod Algorithm="http://www.w3.org/2000/01/xmldsig/dsa" /> <Reference IDREF="Creator_1"> <Transforms> <CanonicalizationMethod Name="http://www.w3.org/TR/1999/WD-xml-c14n-19991115" /> <Transform Algorithm="http://www.w3.org/2000/01/xmldsig/null" /> <Encoding Algorithm="http://www.w3.org/2000/01/xmldsig/base64" /> </Transforms> <DigestMethod Algorithm="http://www.w3.org/2000/01/xmldsig/sha1" /> <DigestValue>b6cbc1f60795623cd2978e1d3de00599a5d3</DigestValue> </Reference> </SignedInfo> <SignatureValue>89f6f699669da7f326cf5778a72e3fae</SignatureValue> <KeyInfo> <keyname>solo</keyname> </KeyInfo> </Signature>
Vom Dokument zum Dokumentenserver
Berlin, 7.7.200034
AusgangsformatViewer-Formate Archiv-Formate
“Shadow-File” “Shadow-File”HTML XML
Vom Dokument zum Dokumentenserver
Berlin, 7.7.200035
AusgangsformatViewer-Formate Archiv-Formate
“Shadow-File” “Shadow-File”HTML XML
Suchmaschine Metamaker (HTML / XML) Dokumenten-Uploader DigSig-Tool Dokumentenverwaltung
CARMEN - Global-Infowww.physik.uni-oldenburg.de/carmen
Dez.1999 - Okt. 2001
Suchmaschinen
Berlin, 7.7.200036
Anforderungen: Vernetzbarkeit (lokal vs. global) Format-Vielfalt Auswertung der Metadaten Konfigurierbarkeit
Vernetzung 2. Art Open-Archives-Initiative openarchives.org
S S S
S
SS
G
GG
G G
G
B
BB
B
BNutzer
HARVEST
Berlin, 7.7.200037
Acknowledgement
Berlin, 7.7.200038
EPS European Physical Society (PhysNet) DFN (Eprint-Projekt) DFG (Dissertationen-Online) BMBF - Global-Info-Projekt (Carmen)
Roland Schwänzl, Judith Plümer (RDF-Beispiele) Michael Kaplan (DigSig-Beispiele) Eberhard R. Hilf, Kerstin Zimmermann, Michael Hohlfeld
Further Information: [email protected]