introducción a linked data [esp]

42
DeustoTech - Deusto Institute of Technology, University of Deusto http://www.morelab.deusto.es Linked Data Jon Lázaro, Aitor Almeida

Upload: jon-lazaro-aduna

Post on 13-Jun-2015

832 views

Category:

Technology


4 download

TRANSCRIPT

The degeneration of rationalism 1/6

DeustoTech - Deusto Institute of Technology, University of Deustohttp://www.morelab.deusto.es

Linked Data

Jon Lázaro, Aitor Almeida

Linked Data 2/42

Índice

¿Qué es Linked Data?

¿Por qué Linked Data?

Tecnología

Publicar Linked Data

Consumir Linked Data

Linked ¿Open? Data

Conclusiones

Preguntas

Índice

Linked Data 3/42

¿Qué es Linked Data?

Una serie de buenas prácticas para...

publicar

compartir

conectar

...datos e información en la Web.

¿Qué es Linked Data?

Linked Data 4/42

Principios Linked Data

Estas buenas prácticas las expuso públicamente Sir Tim Berners-Lee en TED2009 en forma de

4 principios

¿Qué es Linked Data?

Linked Data 5/42

Principios Linked Data

1. Utilizar identificadores globales para nombrar las cosas: URIs

BBDD de SensoresBizkaisense

BBDD de LocalizacionesGeoLinkedData

4. Incluir links a otras URIs, para que descubrir nuevas cosas.

3. Cuando se accede a una URI, proveer información relevante, usando estándares (RDF, SPARQL)

2. Hacer accesible la información mediante el protocolo de comunicación HTTP

http://bizkaisense/.../station/BEASAIN http://geolinked/.../municipio/Beasain

CO2

http://.../mideResiduo

13717

http://.../numeroHabitanteshttp://.../situadoEn

¿Qué es Linked Data?

Linked Data 6/42

Índice

¿Qué es Linked Data?

¿Por qué Linked Data?

Tecnología

Publicar Linked Data

Consumir Linked Data

Linked ¿Open? Data

Conclusiones

Preguntas

Índice

Linked Data 7/42

¿Por qué Linked Data?

Estado actual de la web: Web de Documentos

Mucha información pero...

Orientada a documentos, no a datos

Poco estructurada

No procesable de forma automática

¿Por qué Linked Data?

Linked Data 8/42

¿Por qué Linked Data?

Objetivo de Linked Data: Web de Datos

Evolución de la web actual en la que...

Los datos están bien estructurados

La información es procesable tanto por humanos como por máquinas

¿Por qué Linked Data?

Linked Data 9/42

¿Por qué Linked Data?

Ejemplo simple del potencial de la Web de Datos

Al hacer una búsqueda compleja en buscadores como Google...

1 resultado correcto pero incompleto

N resultados incorrectos o irrelevantes

¿Por qué Linked Data?

Linked Data 10/42

¿Por qué Linked Data?

Ejemplo simple del potencial de la Web de Datos

Busqueda compleja sobre la web de datos...

* Actualmente existen multitud herramientas que realizan traducciones

de lenguaje natural a este tipo de consultas complejas

¿Por qué Linked Data?

Linked Data 11/42

Índice

¿Qué es Linked Data?

¿Por qué Linked Data?

Tecnología

Publicar Linked Data

Consumir Linked Data

Linked ¿Open? Data

Conclusiones

Preguntas

Índice

Linked Data 12/42

¿Cómo se consigue esto?

Mediante varias tecnologías...

URI

RDF

OWL

RDF-S

SPARQL

...

Tecnología

Linked Data 13/42

Tecnologías

URI – Uniform Resource Identifier

• Identificadores únicos para recursos en la web

• Son el punto de acceso a los datos

http://dbpedia.org/resource/Pablo_Picasso

Tecnología

Linked Data 14/42

Tecnologías

RDF – Resource Description Framework

• Modelo para representar metadatos en la web

• Describen recursos de forma semántica

• Formato tripleta: Sujeto – Predicado - Objeto

http://dbpedia.org/resource/Pablo_Picasso

1881-10-25

Pablo Picasso

http://dbpedia.org/resource/Málaga

dbpedia-owl:birthDate

foaf:name

dbpedia-owl:birthPlace

Tecnología

Linked Data 15/42

Tecnologías

Serializaciones RDF: RDF/XML, Turtle, N3...

• Formatos para expresar RDF

• Sirven para compartir los datos

<rdf:Description rdf:about=” http://dbpedia.org/resource/Pablo_Picasso”>

<dbpedia-owl:birthDate>1881-10-25</dbpedia-owl:birthDate>

<dbpedia-owl:birthPlace rdf:resource=”http://dbpedia.org/resource/Málaga” />

<foaf:name>Pablo Picasso</foaf:name>

</rdf:Description>

Tecnología

Linked Data 16/42

Tecnologías

RDF-Schema y OWL

• Lenguajes para definir ontologías y vocabularios para describir los recursos

SPARQL

• Lenguaje de consultas para acceder a datos RDF

SELECT ?artista WHERE {

?artista <dbpedia-owl:birthPlace><http://dbpedia.org/resource/Málaga> .

}

Tecnología

Linked Data 17/42

Índice

¿Qué es Linked Data?

¿Por qué Linked Data?

Tecnología

Publicar Linked Data

Consumir Linked Data

Linked ¿Open? Data

Conclusiones

Preguntas

Índice

Linked Data 18/42

Publicar Linked Data

Algunos enfoques:

• Publicación de datos usando directamente serializaciones RDF y siguiendo los principios Linked Data.

• Publicando mediante CMSs como Drupal, que incorporan RDF para mostrar datos.

• Adaptando datos estructurados existentes

Publicar Linked Data

Linked Data 19/42

Publicar Linked Data

Herramientas para adaptar datos estructurados

• D2RQ, Triplify... (Bases de datos relacionales).

• TripFS (Sistema de ficheros completo).

• TripCel (Hojas de cálculo XLS)

• Google Refine + Extensión RDF (Cualquier dato bidimensional: HTML, CSV, Excel...)

• ...

Publicar Linked Data

Linked Data 20/42

Publicar Linked Data

Otras herramientas de publicación:

Librerías para manejar RDF

• Java: Jena / Sesame.

• Python: RDFlib.

• Ruby: RDF.rb.

• C/C++: Redland.

• ...

Publicar Linked Data

Linked Data 21/42

Publicar Linked Data

Otras herramientas de publicación:

Almacenamiento de tripletas RDF

• OpenLink Virtuoso

• 4Store

• SDB

• AllegroGraph

• ...

Publicar Linked Data

Linked Data 22/42

Publicar Linked Data

Otras herramientas de publicación:

SiLK

• Framework de enlazado de conjuntos de datos.

• Genera links en base a ciertas condiciones especificadas mediante su lenguaje de especificación.

Publicar Linked Data

Linked Data 23/42

Índice

¿Qué es Linked Data?

¿Por qué Linked Data?

Tecnología

Publicar Linked Data

Consumir Linked Data

Linked ¿Open? Data

Conclusiones

Preguntas

Índice

Linked Data 24/42

Consumir Linked Data

• Consultas SPARQL

• Navegadores Linked Data

• Permiten explorar Linked Data y navegar entre conceptos.

• Ej.: Tabulator, Disco...

• Buscadores Linked Data

• Buscan datos entre datasets Linked Data.

• Ej.: Falcons, Sindice, Watson...

Consumir Linked Data

Linked Data 25/42

Índice

¿Qué es Linked Data?

¿Por qué Linked Data?

Tecnología

Publicar Linked Data

Consumir Linked Data

Linked ¿Open? Data

Conclusiones

Preguntas

Índice

Linked Data 26/42

Linked ¿Open? Data

La web está formada por “silos” de información:

Bases de datos cerradas

Datos solo procesables si el editor provee métodos: SOAP, REST, FTP...

Información poco/nada estructurada

Publicación bajo formatos cerrados

Linked ¿Open? Data

Linked Data 27/42

Linked Open Data

En respuesta a ello: Linked Open Data

Datos abiertos

Fácilmente accesibles

Semánticamente estructurados

Publicados bajo formatos abiertos

Enlazados

Linked ¿Open? Data

Linked Data 28/42

Linked Open Data

Linked ¿Open? Data

Linked Data 29/42

Evaluación Linked Open Data

Abrir los datos a la web, en cualquier formato, pero bajo licencias libres.

Hacer los datos accesibles como datos estructurados.

Estructurar los datos bajo formatos no-propietarios.

Usar URIs para identificar lo publicado.

Enlazar los datos publicados con otros datos.

★★

★★★

★★★★

★★★★★

PDF

Excel

CSV

RDF

Linked Open Data

Linked ¿Open? Data

Linked Data 30/42

LOD Cloud

Linking Open Data (LOD)

Community Project del W3C para la publicación de conjuntos de datos siguiendo las directrices Linked Open

Data.

LOD Cloud

Nube de conjuntos de datos abiertos bajo Linked Data (5★) relacionados entre sí.

Linked ¿Open? Data

Linked Data 31/42

LOD Cloud

Evolución (2007)

Hechos relevantes

• DBpedia: Wikipedia Semántica

• Datasets multimedia

• Grandes datasets: Censo EEUU, FOAF...

Tamaño

• +1.000.000.000 tripletas

• +250.000 links

Linked ¿Open? Data

Linked Data 32/42

LOD Cloud

Evolución (2008)

Hechos relevantes

• +35 datasets entrelazados.

• Datasets comerciales: BBC.

• Entran empresas: Talis, OpenLink...

Tamaño

• +2.000.000.000 tripletas

• +3.000.000 links

Linked ¿Open? Data

Linked Data 33/42

LOD Cloud

Evolución (2009)

Hechos relevantes

• Nuevos datasets relevantes: OpenCalais, FreeBase, IEEE.

Tamaño

• +10.000.000.000 tripletas

• +180.000.000 links

Linked ¿Open? Data

Linked Data 34/42

LOD Cloud

Evolución (2010)

Hechos relevantes

• +100 datasets nuevos en menos de un año.

Tamaño

• +20.000.000.000 tripletas

• +250.000.000 links

Linked ¿Open? Data

Linked Data 35/42

LOD Cloud

Evolución (Actualidad)

Tamaño

• +31.000.000.000 tripletas

• +500.000.000 links

Más datasets en TheDataHub (diagrama no

actualizado desde 09/2011)

Linked ¿Open? Data

Linked Data 36/42

Linked Open Data

Beneficios de Linked Open Data

• Otras personas y aplicaciones puede acceder a los datos mediante estándares Web.

• Se puede obtener mayor información contextual siguiendo los enlaces.

• Mayor visibilidad e indexabilidad de los datos.

Linked ¿Open? Data

Linked Data 37/42

Linked ¿Closed? Data

Es posible mediante:

Control de accesso a las URIs.

Manejo de usuarios y privilegios en SPARQL.

Beneficios

Todos los beneficios en términos de procesamiento, razonamiento y contextualización que provee Linked Data.

Ejemplo de aplicación

Unión de datos (inter-intra)empresariales para su posterior procesamiento.

Linked ¿Open? Data

Linked Data 38/42

Índice

¿Qué es Linked Data?

¿Por qué Linked Data?

Tecnología

Publicar Linked Data

Consumir Linked Data

Linked ¿Open? Data

Conclusiones

Preguntas

Índice

Linked Data 39/42

Conclusiones

Linked Data es...

• Recomendaciones acerca de cómo publicar datos...

...usando nuevas tecnologías...

...para evolucionar a la Web de Datos.

Usado por...

• Instituciones como BBC, The New York Times...

• Gobiernos (Open-Government): Estados Unidos, Gran Bretaña...

• Empresas tecnológicas: Google, Yahoo...

• ...

Y que ofrece...

• Interoperabilidad, contextualización, semántica, procesamiento...

• Es resumen, la posibilidad de crear valor añadido mediante el enlazado de datos semánticos.

Conclusiones

Linked Data 40/42

Índice

¿Qué es Linked Data?

¿Por qué Linked Data?

Tecnología

Publicar Linked Data

Consumir Linked Data

Linked ¿Open? Data

Conclusiones

Preguntas

Índice

Linked Data 41/42

Preguntas

¿?También en jlazaro [at] deusto.es

Preguntas

Linked Data 42/42

Transparencias basadas en:

• Bernhard Haslhofer. “Linked Data Tutorial.” Education, March 9, 2009. http://www.slideshare.net/bhaslhofer/linked-data-tutorial

• Oscar Corcho. “Introduction to Linked Data.” September 14, 2010. http://www.slideshare.net/ocorcho/introduction-to-linked-data

Agradecimientos

Reconocimiento