work package 1: models and tools allowing to specify and to build search engines dedicated to...

29
WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS) Marie-Noelle BESSAGNET 1 MOANO 16 Décembre 2010 MOANO 16/12/ 2010 Equipe T2I Laboratoire LIUPPA, UPPA Equipe IC3 Laboratoire IRIT, UPS BnF

Upload: gaetane-wolff

Post on 03-Apr-2015

104 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH

ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC

FACETS)

Marie-Noelle BESSAGNET

1MOANO 16 Décembre 2010

MO

AN

O 1

6/12

/ 20

10

Equipe T2I Laboratoire LIUPPA, UPPA

Equipe IC3Laboratoire IRIT, UPS

BnF

Page 2: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

Expertise LIUPPA

MOANO 2

Page 3: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

Information extraction/Information retrieval

MOANO 3

Page 4: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

4

Sp

atia

lInterpréter

Valider

Extraire

Tem

po

rel

Interpréter

Valider

Extraire

Th

émat

iqu

e

Interpréter

Valider

Extraire

FondsDocumentaire

Chaîne deTraitement sémantique

IndexNiveau 1

Chaîne deTraitement sémantique et statistique

Recherched’Information

Scénariosd’Usages

Page 5: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

Expertise IRIT

MOANO 5

Page 6: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

Ontologies, textes et web sémantique

MOANO 6

• Construction et évolution Terminae, ANR Dafoe et Dynamo, 1 thèse SMAC

• Représentation des connaissances Autodiag, 1 thèse

• Outils d’extraction de relations• Exploiter le langage : patrons lexico-syntaxique• Exploiter la structure XML et la mise en forme (projet GEONTO)• Relations sur plusieurs phrases : résolution d’anaphores

Corpus de textes Ontologies à composante terminologiqueConstruction d’ontologie

Extractiond’information

Recherche en botanique

Extraction de relations

PerspectivesAide à la décision

Ontologies Dynamiques

Page 7: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

Expertise BnF

MOANO 7

Ressources– Thésaurus RAMEAU– Documents sur la botanique

Expertise indexation documentaire

Page 8: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

Les membresLIUPPA

Marie-Noelle BESSAGNET, Christian SALLABERRYIRITNathalie AUSSENAC-GILLES, Mouna KAMEL

BnFMichel MINGAM

MOANO 8

Page 9: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

Découpage du WP1WP 1.0 – Preliminary study of corpus features, end-

users requirements and existing botanical ontologies

Preliminary work should focus on identifying the ontologies available in botany to encourage their reuse to accelerate the construction of a new ontology

WP 1.1: Development of methods and tools to extract concepts and relationships

Preliminary study of corpora and reusable ontology to be used for botanical document annotation

MOANO 9

Page 10: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

Découpage du WP1WP 1.2: Development of a thematic process to

index text documents based on the produced ontology

Tools for ontology-based indexing of botanical text

MOANO 10

Page 11: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

Découpage du WP1WP 1.3 Development of a platform supporting the

creation of descriptive notices (LIUPPA, BNF)

MOANO 11

Page 12: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

Place dans le projet : interactions

MOANO 12

Page 13: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

Ontologie

MOANO 13

Un exemple schématique d'ontologie : l'incontournable exemple des cubes.

Source : http://interstices.info/jcms/c_17672/ontologies-informatiques

Page 14: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

Etape 1 : création de l’ontologieUne ontologie pour quoi faire?• favoriser l'indexation conceptuelle automatique et

la recherche de documents textuels sur la botanique (e.g., comptes rendus botaniques) ;

• faciliter la compréhension de la botanique (objectif pédagogique).

Une ontologie de domaine : botaniqueUn préalable : Phase d'identification des ressources

disponibles

MOANO 14

Page 15: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

Etape 2 : un système de RI basé sur l’ontologie

Une ontologie pour quoi faire?• Améliorer la requête de l’utilisateur;• Aide à la décision

MOANO 15

Page 16: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

16Web sémantique - 3 - N. Aussenac-GillesSource Février 2006 - URFIST

Ressource ontologique et processus de recherche d’information

----- -- --- ---------- -- --- -----

Information need

Query representation

Analyse

match

---- --- ---------------------

---- --- ---------------------

---- --- ---------------------

---- --- ---------------------

---- --- ---------------------

---- --- ---------------------

Document gatheringCollection of documents

Documents representation

---- --- ---------------------

---- --- ---------------------

---- --- ---------------------

---- --- ---------------------

---- --- ---------------------

---- --- ---------------------

Indexing

---- --- ---------------------

---- --- ---------------------

---- --- ---------------------

---- --- ---------------------

---- --- ---------------------

---- --- ---------------------

Retrieved documents

Concept hierarchy, thesaurus,

ontology, ...

Page 17: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

Un système de RI basé sur l’ontologie

MOANO 17

Sp

atia

l

Interpréter

Valider

ExtraireTe

mp

ore

l

Interpréter

Valider

Extraire

Th

émat

iqu

e

Interpréter

Valider

Extraire

FondsDocumentaire

Chaîne deTraitement sémantique

Index Requête

Résultats

Page 18: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

La botaniqueCompte-rendu de sortie botanique

• Récit • Description de la flore vivant dans des biotopes à des

périodes données

« L’élément central est l’observation : c’est l’ensemble de données relatives à un ou plusieurs individus d’une même espèce observés sur un site à une certaine date par un observateur associé à un validateur / déterminateur, dans le cadre d’un ensemble 

d’observations appelé relevé. »

Corpus

MOANO 18

Page 19: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

Extrait CR sortie botanique

MOANO 19

Espace Thème : taxon

Thème

Page 20: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

Extrait CR sortie botanique

MOANO 20

Espace : biotopeThème

Page 21: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

Livres anciens« Le voyage de Tarbes, 1807 - Première grande

traversée des Pyrénées", aux éditions Loubatières, de Augustin Pyramus de Candolle. »

Comment donner accès à ce contenu scientifique?

Augustin Pyramus de Candolle (1778-1841), botaniste.

MOANO 21

Page 22: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

Livres anciensEn 2007, un groupe de botanistes a refait cette

traversée en 70 jours– Evolution de la flore– http://www.terranoos.org/fr/de-candolle/actualite.html

MOANO 22

Page 23: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

Extrait de leur récitLe val d'Esquierry

Nous partons à 6H45 du refuge d'Espingo pour rallier les Granges d'astau et rejoindre le reste de l'équipe dont nous étions séparés suite aux péripétie de la veille au port d'OO. Dans la descente, sur une falaise humide, nous trouvons une station à Saxifrage de Cluse d'une dizaine de pieds. Plante assez rare, Gérard précise qu'une station aurait été détruite lors de l'élargissement du sentier. Heureusement, la nature semble avoir encore quelques ressources. 8H15, arrivée au bivouac, nous retrouvons l'équipe. Nous mettons rapidement les échantillons d'herbier récoltés depuis trois jours dans la grande presse. Nous repartons vers 10H00 pour le val d'Esquierry. La montée à travers la prairie et la hêtraie est raide, mais assez courte. À la sortie, nous débouchons sur un immense vallon couvert de fleurs. Nous trouvons une prairie montagnarde pas encore pâturée. Nous relevons, comme de Candolle avant nous, le Millepertuis des montagnes, la Serratule fausse-centaurée, plante remarquable par la taille de son port et de son inflorescence et formant une population de quelques dizaines de pieds très localisée.

MOANO 23

Page 24: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

Contexte : La botaniqueOuvrir l’accès à la connaissance (grand public,

étudiants, décideurs, ...) au travers d’interfaces de recherche/navigation en texte.

Exploiter les connaissances des experts présentes au sein des descriptions textuelles

L’image a une place prépondérante en botanique : de nombreux croquis….

MOANO 24

Page 25: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

Des images et des croquisLe Millepertuis des montagnes, la

Serratule fausse-centaurée,

MOANO 25

Page 26: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

Un concept : Le millepertuisplusieurs termes

Noms communs : Millepertuis, herbe de la Saint-Jean.

Nom botanique : Hypericum perforatum, famille des hypéricacées ou clusiacées.

Noms anglais : St. John’s Wort, SJW.

MOANO 26

Page 27: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

Des outils pour classer, indexer et rechercher

Thésaurus : RAMEAUDes référentiels taxonomiques pour la faune et la

flore : http://www.sciena.org/serena/ : logiciel de gestion de bases de données naturalistes

MOANO 27

Page 28: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

Une taxonomie existante – Thésaurus RameauUne première base

MOANO 28

Page 29: WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS)

Des questions?

pour votre attention

MOANO 16 Décembre 2010 29