sémantisation des données pour le monde environnemental
DESCRIPTION
Sémantisation des données pour le monde environnemental. Danielle Ziébelin Philippe Genoud LIG STEAMER Université de Grenoble [email protected]. Données environnementales. Que sont les données environnementales : Collections : spécimens, échantillons, prélèvements … Études Écologiques - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/1.jpg)
1
Sémantisation des données pour le monde
environnemental
Danielle ZiébelinPhilippe Genoud
LIG STEAMER Université de [email protected]
![Page 2: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/2.jpg)
2
Données environnementales
• Que sont les données environnementales :– Collections : spécimens, échantillons, prélèvements …– Études Écologiques– Séquences génomiques– Analyses d’images, LIDAR– Monitoring de la biodiversité
• Quels sont les traitements :– identifier, comparer, évaluer les populations ou des
quantités, localiser et dater des données et/ou des analyses
• Les données de la biodiversité sont – Globalement distribuées et volumineuses– Hautement hétérogènes au niveau de leur structure et leur
contenu– Augmentent rapidement
![Page 3: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/3.jpg)
3
Le web sémantique peut aider à l’intégration et au partage de données
• Métadonnées– Directive Inspire– Directive SEIS (Shared Environmental Information System )– Iso 19115, 19119,19110 …
• Vocabulaires contrôlés– LTRE (Linked Thesaurus fRamework for Environement), – EARTh (Environmental Applications)– Thésaurus Ecoplanète (ministère Ecologie), – Thesaurus AnaEE-France, – EnVoc (en relation avec Convention sur la biodiversité),– …
• Ontologies– OBOE (Extensible Observation Ontology)– SERONTO (Socio-Ecological Research and Observation oNTOlogy)– SWEET (Semantic Web for Earth and Environmental Terminology)– SSN ontology (Semantic Sensor Network Ontology)– Envo (Environment Ontology),– …
![Page 4: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/4.jpg)
4
Charactéristiques communes des architectures du web sémantiques (1)
Collecter de nouvelles données
Web
Applications WEB applications pour des utilisateurs avec un GUI adapté
Accéder à des ressources :
données ou des connaissances
Services WEB configurés pour ajouter de l’information
Quelles sont les ressources en eaux
que je peux allouer à un projet d’extraction pétrolière et gazière ?
Quelle est l’évolution de
cet écosystème
(eau, sol) par rapport au
réchauffement climatique ?
![Page 5: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/5.jpg)
5
Plan
• Introduction et objectifs• Architecture• Données et modèles de données• Ontologies• Lier les données• Requêtes sémantiques• Conclusions
![Page 6: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/6.jpg)
Exemple d’Architecture MAP-EON
6
RDF Graph
MapEON serverLOD Cloud
Query Processor (SPARQL)
Adaptator1 Adaptatorn
…
…
Data Loader
Ontology manager
Ontology Loader
OWL reasonerOWL DL
ontologies
MapEON Client
Triplestore
![Page 7: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/7.jpg)
7
Exemple d’architecture ObsBD
“Lightweight Ontology-Based Tools for Managing Observational Data” Shawn Bowers, Riley Englin, Carlos Fonseca, Paul Jewell, Lauren Joplin, Patrick Mosca, Tyler Pacheco, Jacob Troxel, Tyler Weeks, Proceedings of the First International Workshop on Semantics for Biodiversity Montpellier, France, May 27, 2013
![Page 8: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/8.jpg)
8
Technologies de Web Sémantique
•Données et Ontologies– Ontologies (RDFS/OWL )– Annotations (RDF)– Déduction (Pellet, Hermit,
BraidComposer …)– Requêtes (SPARQL)
• Services– WFS - WPS– Web services sémantiques
![Page 9: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/9.jpg)
9
Plan
• Introduction et objectifs• Architecture• Données et modèles de données• Ontologies• Lier les données• Requêtes sémantiques• Conclusions
![Page 10: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/10.jpg)
10
Données de MAP-EON • tabular data (excel file)
Measure
MeasureDescriptor
location
site type
Site Measures Set
Region
![Page 11: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/11.jpg)
11
Modèle de données de l’application
Quelques classes et relations qui décrivent les concepts utilisés dans l’application
![Page 12: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/12.jpg)
Owl class defining the rdf:type of the individual
Graphe RDFLes données sont transformées en un graphe RDF qui utilise le
vocabulaire défini dans le modèle d’application.
12
subject predicate objectobject property
individual(resource
identified by an URI)
RDF Resource Description Framework (W3C standard)
individual
literal valuedata property
rdf:type
:region
:has
Mea
sure
Set
:contains
:value
:descriptor
:symbol:unit
wgs84_pos:lon
wgs84_pos:lat
rdf:type
rdf:type
rdf:type
rdf:type
rdf:type
RDFS and OWL add semantic to RDF
![Page 13: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/13.jpg)
13
Exemple d’ontologie de Domaine
Hydrologic Ontology for Discovery (http://his.cuahsi.org/ontologyfiles.html)The purpose of this ontology is to support the discovery of time-series data collected at a fixed point, including physical, chemical, and biological measurements.
• Le graphe peut être enrichi en exploitant une ontologie de domaine
![Page 14: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/14.jpg)
14
Modèle de l’application + Ontologie de domaine
:region
:has
Mea
sure
Set
:contains
:value
:descriptor
:symbol:unit
wgs84_pos:lon
wgs84_pos:lat
rdf:type
rdf:type
rdf:type
rdf:type
rdf:type
domain ontology
rdf:type
• Le graphe peut être enrichi par des éléments de l’ontologie de domaine
![Page 15: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/15.jpg)
Weight Mass Unit
Biomass
usesStandard
Gram
is-a
Bio.EntityTree
Leaf LitterTree Leaf Wet Weight Dry Weight
Observation
Measurement
Site Species Ind Mass
GCE6 Picea Rubens 1 75.13
GCE6 Picea Rubens 2 179.81
GCE7 Picea Rubens 1 443.20
… … … …
Data
Structural Metadata
<attribute id=“att.4”> <attributeName> Mass </attributeName></attribute>
hasMeasurement
OBOE Semantic Annotation
Domain-Specific Ontology
is-a is-ais-a
is-a
has-part
hasCharacteristicis-a
part-of is-a
ofEntity
usesStandardofCharacteristic
SONet: Scientific
Observations Network
Dr. Mark SchildhauerDirector of Computing
NCEAS, UCSB USA
![Page 16: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/16.jpg)
Ontologie d’observations : OBOE
16
hasValue
Multiples modèles pour les observations : Exemples O&M, PATO/EQ, ODM, OBOE“core concepts” décrit : Entities, properties measured, units, protocols, etc.
Extensible OBservation Ontology (OBOE)
Entity
Characteristic
Observation
Measurement
Protocol Standard
hasMeasurement
ofCharacteristic
usesProtocol usesStandard
ofEntity
hasContext
1..1*
1..1
*
*
*
1..11..1
1..1**
**
Value
1..1
Observations et mesures : ISO 19156O&M : dépences directes • Feature ISO 19109• Geometry ISO 19107• Temporal ISO 19108• Coverage (fields) ISO 19123• Metadata ISO 19115-12• Meta-model ISO 19150-2• Basic datatypes ISO 19103
O&Min OWL | Simon CoxCox, OGC Abstract Specification – Topic 20: Observations and Measurements 2.0ISO 19156:2011 Geographic Information – Observations and measurements
![Page 17: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/17.jpg)
17
Plan
• Introduction et objectifs• Architecture• Données et modèles de données• Ontologies• Lier les données• Requêtes sémantiques• Conclusions
![Page 18: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/18.jpg)
18
Types d’ontologies : différents objectifsCatherine Roussey (ISTREA)
• Ontologies terminologiques :– Interopérabilité lexicale
• Ontologies de données : – Interopérabilité sur les données
• Ontologie Logique – Interopérabilité d’objets
![Page 19: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/19.jpg)
19
Types d’ontologies : différents objectifsCatherine Roussey (IRSTEA)
• Ontologies terminologiques : Interopérabilité lexicale
Concept/ Class
Term
Object/Instance
Relation
hasLabel
Property
Semantic Relation
Object Relation
Linguistic Relation
Textual DefinitionLogical Definition
isInstanceOf
hasArgument
hasName hasArgument
hasArgument
hasN
ame
hasName
*
*
*
1
** 11
* *
**
*
![Page 20: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/20.jpg)
20
Types d’ontologies : différents objectifsCatherine Roussey (IRSTEA)
Concept / Class
Term
Object/Instance
Relation
hasLabel
Property
Semantic Relation
Object Relation
Linguistic Relation
Textual DefinitionLogical Definition
isInstanceOf
hasArgument
hasName hasArgument
hasArgument
hasN
ame
hasName
*
*
1
** 11
* *
**
*
• Ontologies de données : Interopérabilité sur les données
![Page 21: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/21.jpg)
21
Types d’ontologies : différents objectifsCatherine Roussey (IRSTEA)
• Ontologie Logique : Interopérabilité d’objets / de concepts
Concept / Class
Term
Object/Instance
Relation
hasLabel
Property
Semantic Relation
Object Relation
Linguistic Relation
Textual DefinitionLogical Definition
isInstanceOf
hasArgument
hasName hasArgument
hasArgument
hasN
ame
hasName
*
*
*
1
** 11
* *
**
![Page 22: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/22.jpg)
22
Plan
• Introduction et objectifs• Architecture• Données et modèles de données• Ontologies• Lier les données• Requêtes sémantiques• Conclusions
![Page 23: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/23.jpg)
23
:region
:has
Mea
sure
Set
:contains
:descriptor
Individual :region Object Property
Owl class defining the rdf:type of the individual Data Property
legend
Lier les données au LOD cloud• Lien avec l’ontologie de domaine• Lien avec des jeux de données ouvertes
domain ontology
application ontology
rdfs:seeAlso
corresponding geonames resource
rdfs:seeAlso
corresponding DBpedia resource
![Page 24: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/24.jpg)
24
Lien avec le LOD cloud• Liens avec les descriptions RDF de geonames
http://sws.geonames.org/5892587/
resource URI
RDF description
geonames resourcedescribing Northwest Territories
![Page 25: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/25.jpg)
25
Lier des données de différentes sources
• Lier des entités et les caractéristiques de 2 ontologies : Utilise des axiomes d’inclusion et d’équivalence de OWL– Équivalence :
• propriété owl:equivalentClass • propriété owl:equivalentProperty• propriété owl:sameAs• …
• Généralisation/Spécialisation : • rdfs:subClassOf• rdfs:subPropertyOf
![Page 26: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/26.jpg)
26
Querying Data trough Ontology
Query
MultiMedia Source
Observation Data Base
Observation Data Base
Mapping
LocalSchema
LocalSchema
LocalOntology
GlobalOntology
![Page 27: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/27.jpg)
27
Caractéristiques communes des architectures du web sémantique
• Intéroperabilité et intégration de différentes ressources
• Données structurées ou non structurées– Documents– Data-bases
• Données spatio-temporelles hétérogènes– Multi-sites avec multi-acteurs– Multi-modèles – Multi-formats
![Page 28: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/28.jpg)
28
Plan
• Introduction et objectifs• Architecture• Données et modèles de données• Ontologies• Lier les données• Requêtes sémantiques• Conclusions
![Page 29: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/29.jpg)
29
Requêtes sémantiques• Accéder à des informations inférées depuis l’ontologie de
domaine• Accéder à des informations supplémentaires au travers de
données liées (linked data)
![Page 30: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/30.jpg)
30
Requêtes sémantiques
• Interroger les données avec des données inférées (SPARQL)
![Page 31: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/31.jpg)
31
Plan
• Introduction et objectifs• Architecture• Données et modèles de données• Ontologies• Lier les données• Requêtes sémantiques• Conclusions
![Page 32: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/32.jpg)
32
Retour d’expérience sur les pratiques
• Au niveau local : sources de données : – Amélioration de la qualité des données– Publication des sources de donnée avec les
métadonnées– Recherche de documentation et de liaison des
données– Architecture complexe avec des modules
nouveaux : cartographie et du spatio-temporel
• Au niveau communautaire– Standards ISO, OGC– Propriété intellectuelle, information privée et
partagée, accès publique, VGI, licences.– Infrastructures et portails.
![Page 33: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/33.jpg)
33
Retour d’expérience : les outils
• Recherche et création de liens– outils existants
• e.g. SILK A Link Discovery Framework for the Web of Data, http://wifo5-03.informatik.uni-mannheim.de/bizer/silk/)
– exploitation de l’information spatiale et temporelle
• Publication des données– outils génériques pour transformer des jeux de
données en RDF• dataLift http://datalift.org/ , • open refine (former google refine) http://openrefine.org/ )
![Page 34: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/34.jpg)
34
Travaux connexes
– GEO BON Biodiversity Observation Network within GEOSS Global Earth Observation System of Systems, Portal (global)
• Worldwide voluntary effort • GEOSS Earth Observation infrastructure
– GEO portal : web portal, search registries– GEOSS components and services registry (catalogue)– GEOSS clearinghouse (connects the differents
components)– GEOSS standards and interoperability (catalologue of
standards)– http://www.geoportal.org/web/guest/– http://wiki.ieee-earth.org/Documents/GEOSS_Tutorials/
• GEOSS Water Services
![Page 35: Sémantisation des données pour le monde environnemental](https://reader035.vdocuments.mx/reader035/viewer/2022062309/568134dc550346895d9c0ea8/html5/thumbnails/35.jpg)
35
Travaux connexes
• Shared Environmental Information System (Europe) http://ec.europa.eu/environment/seis/
• Semantic Web for Earth and Environmental Terminology (SWEET), http://sweet.jpl.nasa.gov/sweet/
• Extensible Observation Ontology (OBOE) https://code.ecoinformatics.org/code/semtools/trunk/dev/oboe/oboe.1.1rc1/oboe-core.owl
• SemantEco/SemantAqua : Rensselaer Polytechnic Institute (D. McGuinness) http://tw.rpi.edu/web/project/SemantEco
• ObsDB : Gonzaga University Washington