trainingsmodul 2.1 der lebenszyklus von linked open government data & metadata die mitglieder...
TRANSCRIPT
DATASUPPORT
OPEN
Trainingsmodul 2.1
Der Lebenszyklus von Linked Open Government Data & Metadata
Die Mitglieder des PwC Netzwerks unterstützen Organisationen und Individuen dabei, die Werte zu schaffen, nach denen sie suchen. Wir sind ein Netzwerk von Unternehmen mit nahezu 180.000 Mitarbeitern in 158 Ländern, die sich dazu verpflichtet fühlen Qualität in den Bereichen Assurance, Tax & Legal sowie Advisory zu liefern. Sagen Sie uns, was Ihnen wichtig ist und besuchen Sie für weitere Informationen unsere Webseite www.pwc.comPwC bezieht sich auf das PwC Netzwerk und/oder eine oder mehrere Mitgliedsfirmen, von denen jede ein rechtlich selbstständiges Unternehmen ist. Besuchen Sie unsere Webseite www.pwc.com/structure für weitere Details.
DATASUPPORTOPEN
Diese Präsentation wurde von PwC erstellt
Autoren: Michiel De Keyzer, Nikolaos Loutas and Stijn Goedertier
Metadaten der Präsentation
Folie 2
Disclaimer
1.Die Ansichten, die in dieser Präsentation vertreten werden, spiegeln ausschließlich die Meinung des Autors wider und dürfen unter keinen Umständen als offizielle Position der Europäischen Kommission interpretiert werden.Die Europäische Kommission übernimmt weder eine Garantie für die Genauigkeit der Informationen, die Inhalt dieser Präsentation sind, noch akzeptiert sie jegliche Verantwortung für die Nutzung der selbigen. Referenzen innerhalb dieser Präsentation zu spezifischen Produkten, Spezifikationen, Prozessen oder Services durch Handelsnamen, Markenzeichen, Hersteller oder ähnliches, implizieren nicht unbedingt deren Unterstützung oder Bevorzugung durch die Europäische Kommission.Der Autor hat sämtliche Anstrengungen unternommen, um sicherzustellen, dass er/sie, wo nötig, die Erlaubnis erhalten hat, die einzelnen Teile der in dieser Präsentation genutzten Manuskripte zu benutzen. Dies beinhaltet das Einholen einer Nutzungserlaubnis von den Lizenzinhabern oder deren gesetzlichen Vertretern zur Nutzung von Illustrationen, Karten, Schaubildern, die durch Rechte des geistigen Eigentums geschützt sind.
2.Diese Präsentation wurde sorgfältig von PwC zusammengestellt, jedoch gibt PwC keine Erklärung darüber ab und übernimmt keine Garantie dafür (weder ausdrücklich noch implizit), dass die Informationen in dieser Präsentation vollständig oder akkurat sind. PwC ist nicht für die Informationen in dieser Präsentation oder jedwede Entscheidung oder Konsequenz, die aus ihr resultieren, haftbar zu machen. PwC haftet nicht für etwaige Schäden, die durch die Nutzung der Informationen in dieser Präsentation entstehen sollten. Die Informationen in dieser Präsentation sind genereller Natur und einzig dafür bestimmt, eine Orientierungshilfe für Themen allgemeinen Interesses zu sein. Diese Präsentation ist kein Ersatz für professionelle Beratung zu jedwedem speziellen Thema. Kein Leser sollte auf der Basis der Themendarstellungen in dieser Präsentation handeln, ohne vorher angemessene professionelle Beratung einzuholen.
Open Data Support wird von der Europäischen Kommission, gemäß SMART 2012/0107 ‘Lot 2: Provision of services for the Publication, Access and Reuse of Open Public Data across the European Union, through existing open data portals’(Vertrag No. 30-CE-0530965/00-17) finanziert.
© 2014 European Commission
DATASUPPORTOPEN
Lernziele
Am Ende dieses Trainingsmodul sollten Sie
• einen Überblick darüber haben, was der Lebenszyklus von Linked Open Government Data (LOGD) ist;
• den Unterschied zwischen Angebot und Nachfrage für Daten kennen;
•die verschiedenen Schritte eines LOGD Lebenszyklus kennen;
• die Tools und Best Practices für jeden Schritt des Lebenszyklus kennen.
Folie 3
DATASUPPORTOPEN
Inhalt
Dieses Modul enthält ...
• einen Überblick über die existierenden Lebenszyklen für Linked Open Government Data (LOGD).
• einen hybriden Lebenszyklus für LOGD und Metadaten, der sowohl die Angebots- als auch die Nachfrageseite bedient.
• einen Überblick über vorhandene Technologien für LOGD und Metadaten, einschließlich der Open Data Interoperability Platform (ODIP).
Folie 4
DATASUPPORTOPEN
Verschiedene LOGD-LebenszyklenDer aktuelle Stand der Dinge
Folie 5
Hyland et al.
Hausenblas et al.
Villazon-Terrazas et al.
Datalift Vision
LOD2 Linked
Open Data Lifecycle
Siehe auch:http://www.w3.org/2011/gld/wiki/GLD_Life_cycle
DATASUPPORTOPEN
Unterschiedliche LOGD-Lebenszyklen Beobachtungen
•Es gibt keinen standardisierten LOGD-Lebenszyklus.
• Die meisten Ansätze sind sich bezüglich eines Kernsets an Phasen einig, z.B. die Identifizierung des Modells/seine Veröffentlichung.
• Die derzeitigen Lebenszyklen konzentrieren sich hauptsächlich auf die Bereitstellung von Open Data: Identifizierung und Auswahl von LOGD.
Modellierung und Bereinigung von LOGD.
Veröffentlichung und Verknüpfung von Daten.
•Aber was ist mit der Nachfrageseite? LOGD finden und abrufen.
Open Data integrieren und weiterverwenden.
Rückmeldungen zu LOGD geben.Folie 6
DATASUPPORTOPEN
Was sind Metadaten?
“Metadaten sind strukturierte Informationen, die beschreiben, erklären, lokalisieren, oder es anderweitig einfacher machen, eine Informationsquelle abzurufen, zu verwenden oder zu verwalten. Daten zu bestimmten Daten oder Informationen zu bestimmten Informationen werden oft Metadaten genannt.” -- National Information Standards Organization
http://www.niso.org/publications/press/UnderstandingMetadata.pdf
Folie 7
Datensatz Beschreibung (DCAT)
Datensatz
DATASUPPORTOPEN
Best Practices für die Veröffentlichung Ihrer Daten & Metadaten
1. Entwickeln Sie die Daten;
2. Benennen Sie Dinge mit URIs;
3. Verwenden Sie vorhandene Vokabulare wieder, wann immer möglich;
4. Veröffentlichen Sie von Mensch und Maschine lesbare Beschreibungen – Metadaten;
5. Konvertieren Sie die Daten in RDF;
6. Geben Sie eine passende Lizenz an;
7. Hosten Sie den verknüpften Datensatz und seine Metadaten öffentlich und geben Sie dies auch bekannt!
Das W3C Linked Data Kochbuch
Folie 8
Siehe auch:http://www.w3.org/TR/gov-data/) http://www.w3.org/2011/gld/wiki/Linked_Data_Cookbook
DATASUPPORTOPEN
LOGD- und MetadatenlebenszyklusFokussierung auf Angebot und Nachfrage
Folie 9
Select Model Publish Find Integrate Re-use
Data management
Feedback
Data Publisher
Data Consumers
Angebot Nachfrage
DATASUPPORTOPEN
LOGD & Metadaten AngebotVerwaltungen, die ihre Daten öffentlich machen und sie als Linked Data zusammen mit den entsprechenden Metadatenbeschreibungen veröffentlichen
Folie 10
DATASUPPORTOPEN
Auswahl hochwertiger Daten
Mehrere Dimensionen können im Auswahlprozess von LOGD berücksichtigt werden, sowohl aus der Sicht des Herausgebers als auch des Wiederverwenders.
• Transparenz: Erhöht die Veröffentlichung des Datensatzes die Transparenz und die Offenheit der Verwaltung gegenüber ihren Bürgern?
• Gesetzliche Anforderungen: Gibt es ein Gesetz, das die Veröffentlichung verpflichtend macht oder gibt es keine solche Auflage?
• Verbindung mit öffentlicher Aufgabe: Sind die Daten das direkte Ergebnis einer Kernaufgabe der Verwaltung oder sind sie ein Produkt einer nicht wesentlichen Aktivität?
• Aktueller Stand der Veröffentlichung: Sind die Daten bereits öffentlich verfügbar oder müssen sie noch veröffentlicht werden?
• Art des Mehrwerts: Sind die Daten für soziale Zwecke nützlich oder haben sie kommerziellen Wert?
• Zielgruppe: Sind die Daten in erster Linie für die Öffentlichkeit oder für eine Back-Office-Integration bestimmt?
Folie 11
DATASUPPORTOPEN
Auswahl aus Transparenzgründen
In einigen Fällen kann die Veröffentlichung eines Datensatzes die Transparenz und Offenheit der Verwaltung gegenüber ihren Bürgern erhöhen, z.B.:
• Parlamentsdaten, wie beispielsweise Wahlergebnisse.
• Öffentliche Haushaltspläne.
• Personalkosten der öffentlichen Verwaltungen.
Alle oben genannten Beispiele tragen zur Transparenz der Arbeit öffentlicher Verwaltungen bei.
Folie 12
DATASUPPORTOPEN
Auswahl aufgrund gesetzlicher Anforderungen
Einige Daten können einem Gesetz oder einer Verordnung unterliegen, das/die ihre Veröffentlichung anordnet, z.B.:
• Gesetzestexte, Richtlinien, Verordnungen usw.
• Vorschläge und Verhandlungen von Parlament und Komitees.
• Wahlergebnisse.
• Öffentliche Budgets und Ausgaben.
• Ausschreibungen zu Angeboten und Auftragsvergaben.
Andere Daten können ein Nebenprodukt der Verwaltungsaktivität sein und es könnte für Bürger und Unternehmen nützlich sein Zugang dazu zu haben, z.B.:
• Zustand der Infrastruktur und öffentlicher Flächen (Straßen, Bäume).
• Fahrpläne der öffentlichen Verkehrsmittel und Abholzeiten der Müllabfuhr. Folie 13
DATASUPPORTOPEN
Auswahl aufgrund eines Bezugs zur öffentlichen Aufgabe
Einige Daten können das direkte Ergebnis der primären öffentlichen Verwaltungsaufgabe sein, beispielsweise die Funktionen, die in COFOG aufgeführt sind, z.B.:
• Exekutive, gesetzgebende Organe, Finanz-/Steuerangelegenheiten usw.
• Öffentliche Ordnung und Sicherheit.• Umweltschutz.• Gesundheit.• Kultur.• Bildung.
Andere von der Verwaltung produzierte Daten sind unwesentlich (sie können vom privaten Sektor geliefert werden; und werden dies auch manchmal), z.B.:• Kartierung zu Navigationszwecken (siehe Google Street View)• Wettervorhersage (z.B. Internetseiten zum Wetter)
Folie 14
DATASUPPORTOPEN
Auswahl aufgrund öffentlicher Verfügbarkeit
Einige Daten sind bereits offen und elektronisch verfügbar, z.B. (in einigen Ländern):
• Katasterinformationen.
• Topographische Karten.
• Verkehrsinformationen.
• Wettervorhersagen.
Andere Daten können weiterhin der Öffentlichkeit vorenthalten werden (vielleicht weil es sehr schwer ist, sie zu veröffentlichen, weil sie persönliche oder vertrauliche Daten beinhalten oder weil sie teilweise der Lizenzierung durch Dritte unterliegen).
Folie 15
DATASUPPORTOPEN
Auswahl aufgrund der Art des Mehrwerts
Einige Daten können in erster Linie gesellschaftlichen Wert haben, z.B.:
• Gesetze und parlamentarische Daten (z.B. Abstimmungsverhalten der Volksvertreter)
• Informationen vor Wahlen (z.B. Programme der politischen Parteien)
• E-Demokratie und E-Partizipation (z.B. öffentliche Anhörungen)
Andere Daten können eher kommerziellen Wert (Geschäftsmodelle) haben, z.B.:
•Straßenkarten, Echtzeitverkehrsinformationen• Echtzeitwetterdaten• Wirtschaftsinformationen
Folie 16
DATASUPPORTOPEN
Auswahl aufgrund der Zielgruppe der Daten
Einige Daten sind für die Gesellschaft (Bürger und Unternehmen) bestimmt, z.B.:
• rechtliche Informationen.
• E-Demokratie, E-Partizipation und öffentliche Anhörungen.
• Beschaffung.
Andere Daten besitzen einen Wert für die interne Nutzung oder die Integration in das Backoffice, z.B.:
• Verschiedene Quellen, die zur Strafverfolgung genutzt werden.
• Indikatoren der Serviceleistungskennzahlen.
• Stellenbeschreibungen von Beamten.
Folie 17
DATASUPPORTOPEN
Auswahl aufgrund der Größe der Zielgruppe
Einige Daten sind auf große Zielgruppen und Massenmärkte ausgerichtet, z.B.:
• Verkehrsinformationen.
• Öffentliche Verkehrsmittel.
• Wahldaten.
Andere Daten sind für kleine Gruppen und Nischenmärkte von Bedeutung, z.B.:
• Informationen über Einrichtungen und finanzielle Unterstützung für Menschen mit Behinderung.
• Wirtschaftsstatistiken.
• Gerichtsentscheidungen.
Folie 18
DATASUPPORTOPEN
Hoher Mehrwert aus der Perspektive eines Wiederverwenders
Aus der Sicht eines Wiederverwenders, hängt der Mehrwert eines Datensatzes vor allem von seinem Verwendungs- und Wiederverwendungspotenzial ab, das effektiv zur Erschließung von (neuen) Geschäftsmodellen führen kann.
Das Verwendungs- und Wiederverwendungspotenzial eines Datensatzes wird bestimmt durch:
•Die Größe und die Dynamik der Zielgruppe des Datensatzes; sowie
•Die Anzahl der neuen und bestehenden Systeme und Dienstleistungen, die den
Datensatz benutzen.
Die Öffnung von Datensätzen mit einem hohen Verwendungs- und Wiederverwendungspotenzial führt zur Schaffung neuer Produkte und/oder Dienstleistungen, die un- oder mittelbare wirtschaftliche oder soziale Auswirkungen und/oder positive wirtschaftliche Externalitäten haben.
Folie 19
DATASUPPORTOPEN
Auswahl aufgrund der Bedürfnisse der ZielgruppeWas für Daten brauchen/wollen die Wiederverwender?Laut einer spanischen Studie werden die folgenden Arten von Informationen von Unternehmen am meisten wiederverwendet:
Folie 20
Geo-d
ata
Busin
ess/fina
ncia
l dat
a
Socio
-dem
ogra
phic
/sta
tistic
al d
ata
Legal
dat
a
Met
eo d
ata
Trans
port
dat
a
Oth
er
Mus
eum
and
cul
tura
l dat
a
51.1%46.8%
29.7% 27.7%
12.8% 12.8% 12.8% 10.0%
Siehe auch:http://datos.gob.es/datos/sites/default/files/files/Estudio_infomediario/121001%20RED%20007%20Final%20Report_2012%20Edition_vF_en.pdf
DATASUPPORTOPEN
Domains für Datensätze in europäischen Datenportalen
Folie 21
Source:[http://data.gov.uk/data]
Source:[http://publicdata.eu/]
Source:[http://open-data.europa.eu/en/data/dataset]
Metadaten
DATASUPPORTOPEN Folie 22
Welche Datensätze werden auf Data.gov.uk am meisten angesehen?
http://data.gov.uk/data/site-usage/publisher?month=
http://data.gov.uk/data/site-usage/dataset
nach Herausgebern nach Datensätzen
DATASUPPORTOPEN
Bei der Modellierung Ihrer Daten und Metadaten geht es darum...
• Ihre Daten in einer strukturierten, verständlichen und maschinenlesbaren Weise verfügbar zu machen.
• Wiederzuverwenden, was in Bezug auf Vokabulare und Referenzdaten bereits existiert.
• Durch die Bereinigung Ihrer Daten ein angemessenes Qualitätslevel zu erreichen.
• Lizenzinformationen bereitzustellen, damit die Konsumenten Ihrer Daten wissen, was die Bedingungen zur Weiterverwendung sind.
• Eine umfangreiche Beschreibung (Metadaten) zu liefern.
• Semantische Technologien (RDF, HTTP URIs...) für die Beschreibung Ihrer Daten zu verwenden.
Folie 23
DATASUPPORTOPEN
Modellieren Sie Ihre Daten - wiederverwenden, wenn möglich; prägen, wenn nötig
•Verwenden Sie vorhandene Vokabulare so oft wie möglich wieder.
Wenn Sie sehen, dass es für eine spezielle Domain keine wiederverwendbare, verbindliche Quelle gibt, erstellen Sie Ihre eigene mit Hilfe von:
◦ RDF Schemata (RDFS): Basis RDF Vokabular um die Klassen und die Eigenschaften von Klassen zu beschreiben.
◦ Web Ontology Language (OWL): Sprache zur Darstellung von Wissen um Ontologien zu beschreiben.
Folie 24
Siehe auch:http://www.slideshare.net/OpenDataSupport/model-your-data-metadata http//www.w3.org/TR/owl-features/ http://www.w3.org/TR/rdf-schema/
DATASUPPORTOPEN
Verwenden Sie allgemeine Vokabulare wieder, um Ihre Daten zu modellieren und zu beschreiben... (in RDF)
Universelle Vokabulare: DCMI, RDFS
Um Dinge zu benennen: rdfs:label, foaf:name, skos:prefLabel
Um Personen zu beschreiben: FOAF, vCard, Core Person Vocabulary
Um registrierte Organisationen zu beschreiben: Registered Organisation Vocabulary
Um Adressen zu beschreiben: vCard, Core Location Vocabulary
Um öffentliche Dienste zu beschreiben: Core Public Service Vocabulary
...und Metadaten...
Um Datensätze zu beschreiben (Metadaten): DCAT, DCAT Application Profile, VoID
Um Projekte zu beschreiben: DOAP, ADMS.SW
Um Interoperabilitätsassets zu beschreiben: ADMS
Folie 25
DATASUPPORTOPEN
Finden von wiederverwendbaren VokabularenJoinup
• Online-Plattform für die Suche nach und den Austausch von Interoperabilitätsassets mit ADMS. Entwickelt von dem
ISA-Programm der EK.
Folie 26http://joinup.ec.europa.eu/
Verbessern Sie die Suchresultate, indem Sie die Suche durch unterschiedliche Filter eingrenzen.
2
Geben Sie einen Suchbegriff ein um Interoperabilitätsassets zu finden, die auf verschiedenen Websites verfügbar sind.
1
Die Suchresultate beinhalten eine relevante Beschreibung der Assets sowie den Link, wo sie diese downloaden können.
3
DATASUPPORTOPEN
Finden von wiederverwendbaren VokabularenLinked Open Vocabularies
Folie 27
http://lov.okfn.org/
• Bietet Ihnen einen einfachen Zugang zum Ökosystem der Vokabulare.
• Macht die Art und Weise deutlich, wie Vokabulare miteinander verknüpft sind.
• Liefert Metriken dazu, wie Vokabulare in der LOGD-Cloud genutzt werden.
• Entwickelt von der Open Knowledge Foundation.
DATASUPPORTOPEN
Damit stellen Sie sicher, dass Daten und Metadaten auf einem angemessenen Qualitätsniveau und mit möglichst wenig Fehlern veröffentlicht werden können.
Das bedeutet:
•Fehler festzustellen.
•Formate zu transformieren und zu homogenisieren.
•Inkonsistenzen in Daten und Metadaten auszugleichen.
•Doppelte/redundante Informationen zu entfernen.
•Fehlende Informationen zu ergänzen.
•Sicherzustellen, dass die Informationen aktuell sind.
Bereinigung Ihrer Daten & Metadaten
Folie 28
Siehe auch:http://www.slideshare.net/OpenDataSupport/introduction-to-rdf-sparqlCleanse your data with Open Refine (Google Refine) - https://code.google.com/p/google-refine/
DATASUPPORTOPEN
Unternehmensname
Datum der Registrierung Land E-Mail
# Niederlassungen
Niké 1991-04-28 Belgium niké 7
BARCO15 September 1986 BE
Niké België
Coca-Cola United [email protected] 3
Datenbereinigung – Ein Beispiel
Folie 29
Formatierungs-problem
Fehlende Information
Duplikat Fehler
Redundante Information
Widersprüchliche
Informationen
Unternehmensname
Datum der Registrierung Land E-Mail
Niké 1991-04-28 BE niké@sport.org
BARCO 1986-09-05 BE [email protected]
Coca-Cola 1964-03-26 US [email protected]
Bereinigungs-operationen
DATASUPPORTOPEN
Modellieren Sie Ihre Metadaten
Das DCAT Anwendungsprofil für Datenportale in Europa (DCAT-AP) ist eine Spezifikation, die auf dem Datenkatalogvokabular (DCAT) zur Beschreibung der Datensätze des öffentlichen Sektors in Europa basiert.
DCAT-AP verbessert das Auffinden von Datensätzen des öffentlichen Sektors sowohl grenz- als auch sektorenüberschreitend.
Folie 30
Siehe auch:https://joinup.ec.europa.eu/asset/dcat_application_profile/description
DATASUPPORTOPEN
Verwenden Sie zur Namensgebung persistente Uniform Resource Identifiers (URI)
Folie 31
i.e. independent of the data originator
e.g. http://www.example.com/id/alice_brown
e.g. http://education.data.gov.uk/ministryofeducation/id/school/123456
e.g. http://education.data.gov.uk/doc/school?id=123456
e.g. http://education.data.gov.uk/doc/school/v01/123456
e.g. http://education.data.gov.uk/id/school1/123457
e.g. http://education.data.gov.uk/id/school1/123456
e.g. http://data.example.org/doc/foo/bar.rdf
e.g. http://data.example.org/doc/foo/bar.html
e.g. http://education.data.gov.uk/id/school/123456
e.g. http://{domain}/{type}/{concept}/{reference}
Follow the pattern
Re-use existing identifiers
Link multiple representations
Implement 303 redirects for real-world objects
Use a dedicated service
Avoid stating ownership
Avoid version numbers
Avoid using auto-increment
Avoid query strings
rulesfor persistent
http://education.data.gov.uk/doc/schools/123456.csv
Avoid file extensions
Siehe auch:http://www.slideshare.net/OpenDataSupport/design-and-manage-persitent-urishttps://joinup.ec.europa.eu/community/semic/document/10-rules-persistent-uris
Persistente URIs bilden die Grundlagen für Linked Data.
DATASUPPORTOPEN
Bei der Lizensierung Ihrer Daten und Metadaten geht es darum:
• Potenzielle Wiederverwender darüber zu informieren, wie Daten und Metadaten (wieder-)verwendet und/oder angepasst werden können;
• Ihre Daten und Metadaten mit Lizenzinformationen zu verbinden: Sollten diese fehlen ist das ein großes Hindernis für die Weiterverwendung der Daten und senkt den Mehrwert, den die Veröffentlichung Ihrer Daten generiert.
• Dass Open Data, per Definition, unter einer offenen Lizenz veröffentlicht werden sollten.
• Dass Metadaten unter einer Lizenz veröffentlicht werden sollten, die anzeigt, dass sie Allgemeingut sind. Damit fördern Sie die Weiterverwendung und die Auffindbarkeit Ihrer Daten.
Folie 32
Siehe auch: http://www.slideshare.net/OpenDataSupport/licence-your-data-metadata
DATASUPPORTOPEN
Offene Lizenzen
•Creative Commons (CC) (http://creativecommons.org/licenses/)
- Attribution (BY): Der Schöpfer des Werkes sollte erwähnt werden.
- Non Commercial (NC): Das Werk kann nicht für kommerzielle Zwecke verwendet werden.
- No Derivatives (ND): Das Werk kann nicht auf andere Werke angepasst oder mit diesen vereint werden.
- Share Alike (SA): Das Werk kann angepasst werden, muss aber derselben Lizenz zugeschrieben werden, wenn Sie es verfügbar machen.
- CC Zero (CC0): Das Werk ist Allgemeingut.
•Open Data Commons (http://opendatacommons.org/licenses/)
- Open Data Commons Attribution Licence (ODC-By): kompatibel mit CC BY�- Open Data Commons Open Database Licence (ODC-ODbL): kompatibel mit CC
BY SA
- Public Domain Dedication Licence (PDDL): kompatibel mit CC Zero
• The Open Government Licence (http://www.nationalarchives.gov.uk/doc/open-government-licence/)
Folie 33
Siehe auch:http://discovery.ac.uk/files/pdf/Licensing_Open_Data_A_Practical_Guide.pdf
DATASUPPORTOPEN
Bei der Veröffentlichung von Linked Data geht es darum...
… Strukturen aufzubrechen, um dadurch Mehrwerte zu schaffen.
• Machen Sie Ihre Daten und Metadaten öffentlich und im Internet leicht zugänglich.
• Verknüpfen Sie Ihre Daten und Metadaten mit anderen Daten (oder Metadaten), um: ihnen mehr Bedeutung und Inhalt zu geben;
sie in einen Kontext zu stellen;
sie zu bereichern;
Nutzern zu erlauben, immer mehr zu entdecken.
Folie 34
DATASUPPORTOPEN
Stellen Sie einen SPARQL Endpunkt bereit
Ein SPARQL Endpunkt ist ein Dienst, der es Anderen erlaubt Ihre Linked Data (und/oder Metadaten) abzufragen.
Folie 35
http://data.opendatasupport.eu
DATASUPPORTOPEN
Die Veröffentlichung Ihrer Metadaten
Veröffentlichen Sie Ihre Metadaten auf einem zentralen Datenbroker, um ihnen mehr Sichtbarkeit zu geben und um die Weiterverwendung Ihrer Datensätze zu verbessern.
Folie 36
Siehe auch:http://www.slideshare.net/OpenDataSupport/promoting-the-re-use-of-open-data-through-odip
The Open Data Interoperability Platform (ODIP):
• ODIP ist ein zentraler Datenbroker, der von der Europäischen Kommission entwickelt wurde, um die grenzüberschreitende europäische Suche nach Datensätzen zu ermöglichen.
• ODIP ermöglicht es Datenherausgebern und Datenportalen, Beschreibungsmetadaten für Datensätze zentral zu veröffentlichen.
DATASUPPORTOPEN
Beim Daten- & Metadatenmanagement geht es darum...
• Den Lebenszyklus der Daten zu verwalten: Datensätze zu erstellen, zu aktualisieren, instand zu halten und stillzulegen.
• Den Lebenszyklus der Metadaten zu verwalten.
• Prozesse zu implementieren, die sicherstellen, dass Ihre Daten und Metadaten über ein angemessenes Qualitätsniveau verfügen.
•Die Besitzverhältnisse für Daten(-sätze) und Metadaten festzulegen.
Folie 37
Siehe auch:http://www.slideshare.net/OpenDataSupport/introduction-to-metadata-management
DATASUPPORTOPEN
Sammeln Sie Feedback von den Wiederverwendern Ihrer Daten
Bitten Sie die (potenziellen) Verwender der Daten um ihr Feedback:
•Welche Daten brauchen sie.
• Wie haben sie die Daten genutzt.
• Was dachten sie über die Qualität.
• Stellen Sie sicher, dass Anfragen und Korrekturen Sie erreichen: Crowdsourcen Sie die Datenqualität!
Folie 38
data.overheid.nl
data.gov.uk
DATASUPPORTOPEN
LOGD-NachfrageDie Nachfrage von Unternehmen, Unternehmern, Forschern und Regierungen nach Linked Data
Folie 39
DATASUPPORTOPEN
Bei der Nachfrageseite des LOGD-Lebenszyklus geht es darum...
Es Datenwiederverwendern zu ermöglichen:
•Passende Datensätze zu finden;
•Datensätze für Analysezwecke und die Entwicklung von Anwendungen und Diensten zu nutzen;
•Zu wissen, was ihre Regierung tut (Transparenz);
•Kosten zu sparen.
Folie 40
Entwickler/Unternehmen integrieren Daten in Anwendungen (Services)
Öffentliche Verwaltungen teilen ihre Daten online
Bürger/Unternehmen profitieren von den Anwendungen (Services)
Entwickler/ Unternehmen suchen nach Daten
Veröffentlichung von Daten
Weiterverwendung von Daten
DATASUPPORTOPEN
Wo kann man Datensätze finden?
Datensätze werden auf verschiedenen Plattformen verfügbar gemacht, die über ganz Europa verteilt sind.
“Ein Datenbroker sammelt die Metadaten von verschiedenen Open Data Plattformen und veröffentlicht sie in einem gemeinsamen Metadatenmodell. Auf diese Weise können die Datensätze auf eine einheitliche Weise von einem einzelnen Zugangspunkt abgefragt werden.”
•Lokale Open Data Portale, z.B.
- opendatamanchester.org.uk
- Data.gent.be
•Regionale Open Data Portale z.B.
- opendata.regionpaca.fr
- Open public data of the government of Catalonia
•Nationale Open Data Portale, z.B.
- Opendata.at
- opendata.lu
•Europäische Open Data Portale, z.B.
- Open-data.europa.eu
•Open Data Broker, z.B.
- Publicdata.eu
- ODIP Folie 41
DATASUPPORTOPEN
Verwenden Sie den SPARQL-Endpunkt oder einen Faceted Browser, um Datensätze zu findenEin Benutzer kann eine SPARQL-Abfrage über einen SPARQL-Endpunkt ausführen um Datensätze zu finden oder sich einen Weg durch die Sammlung von Datensätzen zu „filtern“, die einen Faceted Browser verwenden.
Folie 42
SPARQL-Endpunkt Facettierter Browser
http://data.gov.uk/sparql
http://data.gov.uk/data/search
DATASUPPORTOPEN
Integration von Datensätzen und die Schaffung von Anwendungen & Dienstleistungen
Einige Werkzeuge für die Integration von Datensätzen:
•Karma (http://www.isi.edu/integration/karma/)
•Talend (http://www.talend.com/products/data-integration)
Folie 43
Siehe auch:http://www.slideshare.net/OpenDataSupport/introduction-to-linked-data-23402165
DATASUPPORTOPEN
Veröffentlichung von LoGD mittels Open Refine
Folie 44
DATASUPPORTOPEN
Modellierung und Veröffentlichung von Open Data mittels Open Refine Erste Schritte
1.Installieren Sie Open Refine: https://github.com/OpenRefine
2.Installieren Sie die RDF-Erweiterung: http://refine.deri.ie/
Und dann...
Beschreiben Sie Ihre Daten in einer Tabelle.
Erstellen Sie ein Projekt und laden Sie es in Open
Refine hoch.
Bilden Sie Ihre Daten auf entsprechende RDF Klassen
&
Eigenschaften ab.
Exportieren Sie die Daten nach RDF.
Folie 45
1
2
3
4
DATASUPPORTOPEN
Beschreiben Sie Ihre Daten in einer Tabelle
Folie 46
Unternehmensname
Datum der Registration Land E-Mail
Nikè 1991-04-28 BEniké@sport.org
BARCO 1986-09-05 [email protected]
Coca-Cola 1964-03-26 US [email protected]
1
DATASUPPORTOPEN
Erstellen Sie ein Projekt und laden Sie es in Google Refine hoch
Folie 47
2
Laden Sie die Tabelle hoch
Wählen Sie die entsprechenden Tabs
Erstellen Sie das Projekt
DATASUPPORTOPEN
Bilden Sie Ihre Daten auf entsprechende RDF Klassen & Eigenschaften ab (modellieren Sie Ihre Daten).
Folie 48
3
Definieren Sie ein Grundgerüst, um die Daten Ihrer Tabelle in RDF umzuwandeln.
DATASUPPORTOPEN
Exportieren Sie Ihre Daten nach RDF/XML oder Turtle
Folie 49
4
DATASUPPORTOPEN
Der LOD2-StackWerkzeuge zur Veröffentlichung und Abfrage von LOGD
Folie 50
DATASUPPORTOPEN
Veröffentlichen Sie Ihre Daten mit dem LOD2 Stack
„Der LOD2-Stack ist eine integrierte Sammlung von aufeinander abgestimmten Werkzeugen, die den Lebenszyklus von Linked (Open) Data durch Extraktion, Verfassen/Erstellen über Anreicherung, Verknüpfung, Verschmelzung bis zur Visualisierung und Instandhaltung unterstützen. Der Stack umfasst Werkzeuge von LOD2 Partnern und Dritten.” Folie 51
Source: [http://stack.lod2.eu/]
DATASUPPORTOPEN
Silk – Ein Werkzeug für die Verknüpfung Ihrer Daten
“Das Silk-Framework ist ein Instrument um Beziehungen zwischen Datenelementen verschiedener Linked Data Quellen zu finden.Datenherausgeber können Silk dazu verwenden RDF-Links von ihren Datenquellen zu anderen Datenquellen im Internet zu setzen.“
Download und weitere Informationen:
http://wifo5-03.informatik.uni-mannheim.de/bizer/silk
Folie 52
DATASUPPORTOPEN
Schlussfolgerungen
• Der LOGD- und Metadatenlebenszyklus sollte sich sowohl mit der Angebots- als auch mit der Nachfrageseite befassen.
• Die Auswahl der Daten und Metadaten, die veröffentlicht werden sollen, sollte verschiedene Dimensionen in Betracht ziehen.
• Bei der Modellierung geht es darum, die Daten und Metadaten zu strukturieren und eine angemessene Qualitätsebene zu erreichen.
• Bei der Veröffentlichung geht es darum, die Daten und Metadaten öffentlich, leicht zugänglich und durchsuchbar zu machen.
• Das Daten- und Metadatenmanagement sollte sicherstellen, dass Prozesse und Richtlinien existieren, die den Lebenszyklus der Daten und Metadaten steuern.
• Der Datenherausgeber sollte die nötigen Instrumente liefern, um Feedback von den Datenwiederverwendern zu erhalten, um dadurch die Nachfrage und Crowdsourcing Qualität nachzuvollziehen.
• Es gibt mehrere Werkzeuge für die Entwicklung und Veröffentlichung von LOGD, aber nur wenige sind von einer produktionsreifen Qualität.
Folie 53
DATASUPPORTOPEN
Gruppenfragen
Folie 54
Haben Sie auf betrieblicher Ebene eine Daten- und/oder Metadatenverwaltungsmethodik?
Existieren Angebot und Nachfrage für LOGD in Ihrem Land? Wenn ja, wer liefert was an wen?
Was sind, Ihrer Meinung nach, die größten Hindernisse bei der Bereitstellung von LOGD in Ihrem Land?
http://www.visualpharm.com
http://www.visualpharm.com
http://www.visualpharm.com
Machen Sie auch den Online-Test!
DATASUPPORTOPEN
Vielen Dank!...und jetzt IHRE Fragen?
Folie 55
DATASUPPORTOPEN
Referenzen
Folie 5:
•GLD Life cycle. W3C. http://www.w3.org/2011/gld/wiki/GLD_Life_cycle
Folie 8:
• Linked Data Cookbook. W3C. http://www.w3.org/2011/gld/wiki/Linked_Data_Cookbook
Folie 14:
• United Nations Statistics Division. COFOG (Classification of the Functions of Government). http://unstats.un.org/unsd/cr/registry/regcst.asp?Cl=4
Folie 21:
• Characterization Study of the Infomediary Sector - 2012 Edition. Datos.gob.es. http://datos.gob.es/datos/sites/default/files/files/Estudio_infomediario/121001%20RED%20007%20Final%20Report_2012%20Edition_vF_en.pdf
Folie 21:
•http://data.gov.uk/data
•http://publicdata.eu/
•http://open-data.europa.eu/en/data/dataset
Folie 21:
•http://data.gov.uk/data/site-usage/publisher?month=
•http://data.gov.uk/data/site-usage/dataset
Folien 24-25:
• Cookbook for translating Data Models to RDF Schemas. IAS Programme. https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemas
Folie 26:
• ADMS Brochure. ISA Programme. https://joinup.ec.europa.eu/elibrary/document/adms-brochure
Folie 27:
• http://lov.okfn.org/
Folie 29:
• DCAT application profile for data portals in Europe. ISA Programme. https://joinup.ec.europa.eu/asset/dcat_application_profile/description
Folie 31:
• 10 Rules for Persistent URIs. ISA Programme. https://joinup.ec.europa.eu/community/semic/document/10-rules-persistent-uris
Folien 32-33:
• Licensing Open Data: A Practical Guide. Naomi Korn and Professor Charles Oppenheim. http://discovery.ac.uk/files/pdf/Licensing_Open_Data_A_Practical_Guide.pdf
Folie 51:
• Announcement of intermediate LOD2 Stack release, March 2012. Martin Kaltenboeck. http://lod2.eu/BlogPost/1034-announcement-of-intermediate-lod2-stack-release-march-2012.html
Folie 52:
• Silk - A Link Discovery Framework for the Web of Data. University of Mannheim. http://wifo5-03.informatik.uni-mannheim.de/bizer/silk/
Folie 56
DATASUPPORTOPEN
Weiterführende Literatur (1/2)
Linked Data Cookbook. W3C.
http://www.w3.org/2011/gld/wiki/Linked_Data_Cookbook
Cookbook for translating Data Models to RDF Schemas. ISA Programme. https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemas
Publishing Open Government Data. Daniel Bennett & Adam Harvey. http://www.w3.org/TR/gov-data/
N. Korn & C. Oppenheim, Licensing Open Data: A Practical Guide.
http://discovery.ac.uk/files/pdf/Licensing_Open_Data_A_Practical_Guide.pdf
Folie 57
DATASUPPORTOPEN
Weiterführende Literatur (2/2)
Linked Open Data: The Essentials. Florian Bauer, Martin Kaltenböck.
http://www.semantic-web.at/LOD-TheEssentials.pdf
Linked Data: Evolving the Web into a Global Data Space. Tom Heath and Christian Bizer.
http://linkeddatabook.com/editions/1.0/
Linked Open Government Data. Li Ding Qualcomm, Vassilios Peristeras and Michael Hausenblas.
http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=6237454
EUCLID - Course 1: Introduction and Application Scenarios
http://www.euclid-project.eu/modules/course1Folie 58
DATASUPPORTOPEN
Verwandte Projekte und Initiativen (1/2)
LOD2 Technology Stack, http://stack.lod2.eu/
Open Data Publishing Pipeline DERI, http://sw.deri.ie/content/odpp
W3C Linked Data Cookbook,http://www.w3.org/2011/gld/wiki/Linked_Data_Cookbook
Cookbook for translating Data Models to RDF Schemas, https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemas
Folie 59
DATASUPPORTOPEN
Verwandte Projekte und Initiativen (2/2)
EUCLID FP7 Project, http://projecteuclid.org/
LOD Around The Clock FP7 project, http://latc-project.eu/
Generic Statistical Business Process Model, http://www1.unece.org/stat/platform/display/GSBPM/Generic+Statistical+Business+Process+Model+Paper
Folie 60
DATASUPPORTOPEN
Werden Sie Teil unseres Teams...
Folie 61
Besuchen Sie uns
Kontaktieren Sie uns
Lernen Sie uns kennen
Folgen Sie uns
Open Data Supporthttp://www.slideshare.net/OpenDataSupport
http://www.opendatasupport.eu Open Data Supporthttp://goo.gl/y9ZZI
@OpenDataSupport [email protected]