introducción a linked data [esp]
TRANSCRIPT
The degeneration of rationalism 1/6
DeustoTech - Deusto Institute of Technology, University of Deustohttp://www.morelab.deusto.es
Linked Data
Jon Lázaro, Aitor Almeida
Linked Data 2/42
Índice
¿Qué es Linked Data?
¿Por qué Linked Data?
Tecnología
Publicar Linked Data
Consumir Linked Data
Linked ¿Open? Data
Conclusiones
Preguntas
Índice
Linked Data 3/42
¿Qué es Linked Data?
Una serie de buenas prácticas para...
publicar
compartir
conectar
...datos e información en la Web.
¿Qué es Linked Data?
Linked Data 4/42
Principios Linked Data
Estas buenas prácticas las expuso públicamente Sir Tim Berners-Lee en TED2009 en forma de
4 principios
¿Qué es Linked Data?
Linked Data 5/42
Principios Linked Data
1. Utilizar identificadores globales para nombrar las cosas: URIs
BBDD de SensoresBizkaisense
BBDD de LocalizacionesGeoLinkedData
4. Incluir links a otras URIs, para que descubrir nuevas cosas.
3. Cuando se accede a una URI, proveer información relevante, usando estándares (RDF, SPARQL)
2. Hacer accesible la información mediante el protocolo de comunicación HTTP
http://bizkaisense/.../station/BEASAIN http://geolinked/.../municipio/Beasain
CO2
http://.../mideResiduo
13717
http://.../numeroHabitanteshttp://.../situadoEn
¿Qué es Linked Data?
Linked Data 6/42
Índice
¿Qué es Linked Data?
¿Por qué Linked Data?
Tecnología
Publicar Linked Data
Consumir Linked Data
Linked ¿Open? Data
Conclusiones
Preguntas
Índice
Linked Data 7/42
¿Por qué Linked Data?
Estado actual de la web: Web de Documentos
Mucha información pero...
Orientada a documentos, no a datos
Poco estructurada
No procesable de forma automática
¿Por qué Linked Data?
Linked Data 8/42
¿Por qué Linked Data?
Objetivo de Linked Data: Web de Datos
Evolución de la web actual en la que...
Los datos están bien estructurados
La información es procesable tanto por humanos como por máquinas
¿Por qué Linked Data?
Linked Data 9/42
¿Por qué Linked Data?
Ejemplo simple del potencial de la Web de Datos
Al hacer una búsqueda compleja en buscadores como Google...
1 resultado correcto pero incompleto
N resultados incorrectos o irrelevantes
¿Por qué Linked Data?
Linked Data 10/42
¿Por qué Linked Data?
Ejemplo simple del potencial de la Web de Datos
Busqueda compleja sobre la web de datos...
* Actualmente existen multitud herramientas que realizan traducciones
de lenguaje natural a este tipo de consultas complejas
¿Por qué Linked Data?
Linked Data 11/42
Índice
¿Qué es Linked Data?
¿Por qué Linked Data?
Tecnología
Publicar Linked Data
Consumir Linked Data
Linked ¿Open? Data
Conclusiones
Preguntas
Índice
Linked Data 12/42
¿Cómo se consigue esto?
Mediante varias tecnologías...
URI
RDF
OWL
RDF-S
SPARQL
...
Tecnología
Linked Data 13/42
Tecnologías
URI – Uniform Resource Identifier
• Identificadores únicos para recursos en la web
• Son el punto de acceso a los datos
http://dbpedia.org/resource/Pablo_Picasso
Tecnología
Linked Data 14/42
Tecnologías
RDF – Resource Description Framework
• Modelo para representar metadatos en la web
• Describen recursos de forma semántica
• Formato tripleta: Sujeto – Predicado - Objeto
http://dbpedia.org/resource/Pablo_Picasso
1881-10-25
Pablo Picasso
http://dbpedia.org/resource/Málaga
dbpedia-owl:birthDate
foaf:name
dbpedia-owl:birthPlace
Tecnología
Linked Data 15/42
Tecnologías
Serializaciones RDF: RDF/XML, Turtle, N3...
• Formatos para expresar RDF
• Sirven para compartir los datos
<rdf:Description rdf:about=” http://dbpedia.org/resource/Pablo_Picasso”>
<dbpedia-owl:birthDate>1881-10-25</dbpedia-owl:birthDate>
<dbpedia-owl:birthPlace rdf:resource=”http://dbpedia.org/resource/Málaga” />
<foaf:name>Pablo Picasso</foaf:name>
</rdf:Description>
Tecnología
Linked Data 16/42
Tecnologías
RDF-Schema y OWL
• Lenguajes para definir ontologías y vocabularios para describir los recursos
SPARQL
• Lenguaje de consultas para acceder a datos RDF
SELECT ?artista WHERE {
?artista <dbpedia-owl:birthPlace><http://dbpedia.org/resource/Málaga> .
}
Tecnología
Linked Data 17/42
Índice
¿Qué es Linked Data?
¿Por qué Linked Data?
Tecnología
Publicar Linked Data
Consumir Linked Data
Linked ¿Open? Data
Conclusiones
Preguntas
Índice
Linked Data 18/42
Publicar Linked Data
Algunos enfoques:
• Publicación de datos usando directamente serializaciones RDF y siguiendo los principios Linked Data.
• Publicando mediante CMSs como Drupal, que incorporan RDF para mostrar datos.
• Adaptando datos estructurados existentes
Publicar Linked Data
Linked Data 19/42
Publicar Linked Data
Herramientas para adaptar datos estructurados
• D2RQ, Triplify... (Bases de datos relacionales).
• TripFS (Sistema de ficheros completo).
• TripCel (Hojas de cálculo XLS)
• Google Refine + Extensión RDF (Cualquier dato bidimensional: HTML, CSV, Excel...)
• ...
Publicar Linked Data
Linked Data 20/42
Publicar Linked Data
Otras herramientas de publicación:
Librerías para manejar RDF
• Java: Jena / Sesame.
• Python: RDFlib.
• Ruby: RDF.rb.
• C/C++: Redland.
• ...
Publicar Linked Data
Linked Data 21/42
Publicar Linked Data
Otras herramientas de publicación:
Almacenamiento de tripletas RDF
• OpenLink Virtuoso
• 4Store
• SDB
• AllegroGraph
• ...
Publicar Linked Data
Linked Data 22/42
Publicar Linked Data
Otras herramientas de publicación:
SiLK
• Framework de enlazado de conjuntos de datos.
• Genera links en base a ciertas condiciones especificadas mediante su lenguaje de especificación.
Publicar Linked Data
Linked Data 23/42
Índice
¿Qué es Linked Data?
¿Por qué Linked Data?
Tecnología
Publicar Linked Data
Consumir Linked Data
Linked ¿Open? Data
Conclusiones
Preguntas
Índice
Linked Data 24/42
Consumir Linked Data
• Consultas SPARQL
• Navegadores Linked Data
• Permiten explorar Linked Data y navegar entre conceptos.
• Ej.: Tabulator, Disco...
• Buscadores Linked Data
• Buscan datos entre datasets Linked Data.
• Ej.: Falcons, Sindice, Watson...
Consumir Linked Data
Linked Data 25/42
Índice
¿Qué es Linked Data?
¿Por qué Linked Data?
Tecnología
Publicar Linked Data
Consumir Linked Data
Linked ¿Open? Data
Conclusiones
Preguntas
Índice
Linked Data 26/42
Linked ¿Open? Data
La web está formada por “silos” de información:
Bases de datos cerradas
Datos solo procesables si el editor provee métodos: SOAP, REST, FTP...
Información poco/nada estructurada
Publicación bajo formatos cerrados
Linked ¿Open? Data
Linked Data 27/42
Linked Open Data
En respuesta a ello: Linked Open Data
Datos abiertos
Fácilmente accesibles
Semánticamente estructurados
Publicados bajo formatos abiertos
Enlazados
Linked ¿Open? Data
Linked Data 29/42
Evaluación Linked Open Data
Abrir los datos a la web, en cualquier formato, pero bajo licencias libres.
Hacer los datos accesibles como datos estructurados.
Estructurar los datos bajo formatos no-propietarios.
Usar URIs para identificar lo publicado.
Enlazar los datos publicados con otros datos.
★
★★
★★★
★★★★
★★★★★
Excel
CSV
RDF
Linked Open Data
Linked ¿Open? Data
Linked Data 30/42
LOD Cloud
Linking Open Data (LOD)
Community Project del W3C para la publicación de conjuntos de datos siguiendo las directrices Linked Open
Data.
LOD Cloud
Nube de conjuntos de datos abiertos bajo Linked Data (5★) relacionados entre sí.
Linked ¿Open? Data
Linked Data 31/42
LOD Cloud
Evolución (2007)
Hechos relevantes
• DBpedia: Wikipedia Semántica
• Datasets multimedia
• Grandes datasets: Censo EEUU, FOAF...
Tamaño
• +1.000.000.000 tripletas
• +250.000 links
Linked ¿Open? Data
Linked Data 32/42
LOD Cloud
Evolución (2008)
Hechos relevantes
• +35 datasets entrelazados.
• Datasets comerciales: BBC.
• Entran empresas: Talis, OpenLink...
Tamaño
• +2.000.000.000 tripletas
• +3.000.000 links
Linked ¿Open? Data
Linked Data 33/42
LOD Cloud
Evolución (2009)
Hechos relevantes
• Nuevos datasets relevantes: OpenCalais, FreeBase, IEEE.
Tamaño
• +10.000.000.000 tripletas
• +180.000.000 links
Linked ¿Open? Data
Linked Data 34/42
LOD Cloud
Evolución (2010)
Hechos relevantes
• +100 datasets nuevos en menos de un año.
Tamaño
• +20.000.000.000 tripletas
• +250.000.000 links
Linked ¿Open? Data
Linked Data 35/42
LOD Cloud
Evolución (Actualidad)
Tamaño
• +31.000.000.000 tripletas
• +500.000.000 links
Más datasets en TheDataHub (diagrama no
actualizado desde 09/2011)
Linked ¿Open? Data
Linked Data 36/42
Linked Open Data
Beneficios de Linked Open Data
• Otras personas y aplicaciones puede acceder a los datos mediante estándares Web.
• Se puede obtener mayor información contextual siguiendo los enlaces.
• Mayor visibilidad e indexabilidad de los datos.
Linked ¿Open? Data
Linked Data 37/42
Linked ¿Closed? Data
Es posible mediante:
Control de accesso a las URIs.
Manejo de usuarios y privilegios en SPARQL.
Beneficios
Todos los beneficios en términos de procesamiento, razonamiento y contextualización que provee Linked Data.
Ejemplo de aplicación
Unión de datos (inter-intra)empresariales para su posterior procesamiento.
Linked ¿Open? Data
Linked Data 38/42
Índice
¿Qué es Linked Data?
¿Por qué Linked Data?
Tecnología
Publicar Linked Data
Consumir Linked Data
Linked ¿Open? Data
Conclusiones
Preguntas
Índice
Linked Data 39/42
Conclusiones
Linked Data es...
• Recomendaciones acerca de cómo publicar datos...
...usando nuevas tecnologías...
...para evolucionar a la Web de Datos.
Usado por...
• Instituciones como BBC, The New York Times...
• Gobiernos (Open-Government): Estados Unidos, Gran Bretaña...
• Empresas tecnológicas: Google, Yahoo...
• ...
Y que ofrece...
• Interoperabilidad, contextualización, semántica, procesamiento...
• Es resumen, la posibilidad de crear valor añadido mediante el enlazado de datos semánticos.
Conclusiones
Linked Data 40/42
Índice
¿Qué es Linked Data?
¿Por qué Linked Data?
Tecnología
Publicar Linked Data
Consumir Linked Data
Linked ¿Open? Data
Conclusiones
Preguntas
Índice
Linked Data 42/42
Transparencias basadas en:
• Bernhard Haslhofer. “Linked Data Tutorial.” Education, March 9, 2009. http://www.slideshare.net/bhaslhofer/linked-data-tutorial
• Oscar Corcho. “Introduction to Linked Data.” September 14, 2010. http://www.slideshare.net/ocorcho/introduction-to-linked-data
Agradecimientos
Reconocimiento