work package 1: models and tools allowing to specify and to build search engines dedicated to...
TRANSCRIPT
WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH
ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC
FACETS)
Marie-Noelle BESSAGNET
1MOANO 16 Décembre 2010
MO
AN
O 1
6/12
/ 20
10
Equipe T2I Laboratoire LIUPPA, UPPA
Equipe IC3Laboratoire IRIT, UPS
BnF
Expertise LIUPPA
MOANO 2
Information extraction/Information retrieval
MOANO 3
4
Sp
atia
lInterpréter
Valider
Extraire
Tem
po
rel
Interpréter
Valider
Extraire
Th
émat
iqu
e
Interpréter
Valider
Extraire
FondsDocumentaire
Chaîne deTraitement sémantique
IndexNiveau 1
Chaîne deTraitement sémantique et statistique
Recherched’Information
Scénariosd’Usages
Expertise IRIT
MOANO 5
Ontologies, textes et web sémantique
MOANO 6
• Construction et évolution Terminae, ANR Dafoe et Dynamo, 1 thèse SMAC
• Représentation des connaissances Autodiag, 1 thèse
• Outils d’extraction de relations• Exploiter le langage : patrons lexico-syntaxique• Exploiter la structure XML et la mise en forme (projet GEONTO)• Relations sur plusieurs phrases : résolution d’anaphores
Corpus de textes Ontologies à composante terminologiqueConstruction d’ontologie
Extractiond’information
Recherche en botanique
Extraction de relations
PerspectivesAide à la décision
Ontologies Dynamiques
Expertise BnF
MOANO 7
Ressources– Thésaurus RAMEAU– Documents sur la botanique
Expertise indexation documentaire
Les membresLIUPPA
Marie-Noelle BESSAGNET, Christian SALLABERRYIRITNathalie AUSSENAC-GILLES, Mouna KAMEL
BnFMichel MINGAM
MOANO 8
Découpage du WP1WP 1.0 – Preliminary study of corpus features, end-
users requirements and existing botanical ontologies
Preliminary work should focus on identifying the ontologies available in botany to encourage their reuse to accelerate the construction of a new ontology
WP 1.1: Development of methods and tools to extract concepts and relationships
Preliminary study of corpora and reusable ontology to be used for botanical document annotation
MOANO 9
Découpage du WP1WP 1.2: Development of a thematic process to
index text documents based on the produced ontology
Tools for ontology-based indexing of botanical text
MOANO 10
Découpage du WP1WP 1.3 Development of a platform supporting the
creation of descriptive notices (LIUPPA, BNF)
MOANO 11
Place dans le projet : interactions
MOANO 12
Ontologie
MOANO 13
Un exemple schématique d'ontologie : l'incontournable exemple des cubes.
Source : http://interstices.info/jcms/c_17672/ontologies-informatiques
Etape 1 : création de l’ontologieUne ontologie pour quoi faire?• favoriser l'indexation conceptuelle automatique et
la recherche de documents textuels sur la botanique (e.g., comptes rendus botaniques) ;
• faciliter la compréhension de la botanique (objectif pédagogique).
Une ontologie de domaine : botaniqueUn préalable : Phase d'identification des ressources
disponibles
MOANO 14
Etape 2 : un système de RI basé sur l’ontologie
Une ontologie pour quoi faire?• Améliorer la requête de l’utilisateur;• Aide à la décision
MOANO 15
16Web sémantique - 3 - N. Aussenac-GillesSource Février 2006 - URFIST
Ressource ontologique et processus de recherche d’information
----- -- --- ---------- -- --- -----
Information need
Query representation
Analyse
match
---- --- ---------------------
---- --- ---------------------
---- --- ---------------------
---- --- ---------------------
---- --- ---------------------
---- --- ---------------------
Document gatheringCollection of documents
Documents representation
---- --- ---------------------
---- --- ---------------------
---- --- ---------------------
---- --- ---------------------
---- --- ---------------------
---- --- ---------------------
Indexing
---- --- ---------------------
---- --- ---------------------
---- --- ---------------------
---- --- ---------------------
---- --- ---------------------
---- --- ---------------------
Retrieved documents
Concept hierarchy, thesaurus,
ontology, ...
Un système de RI basé sur l’ontologie
MOANO 17
Sp
atia
l
Interpréter
Valider
ExtraireTe
mp
ore
l
Interpréter
Valider
Extraire
Th
émat
iqu
e
Interpréter
Valider
Extraire
FondsDocumentaire
Chaîne deTraitement sémantique
Index Requête
Résultats
La botaniqueCompte-rendu de sortie botanique
• Récit • Description de la flore vivant dans des biotopes à des
périodes données
« L’élément central est l’observation : c’est l’ensemble de données relatives à un ou plusieurs individus d’une même espèce observés sur un site à une certaine date par un observateur associé à un validateur / déterminateur, dans le cadre d’un ensemble
d’observations appelé relevé. »
Corpus
MOANO 18
Extrait CR sortie botanique
MOANO 19
Espace Thème : taxon
Thème
Extrait CR sortie botanique
MOANO 20
Espace : biotopeThème
Livres anciens« Le voyage de Tarbes, 1807 - Première grande
traversée des Pyrénées", aux éditions Loubatières, de Augustin Pyramus de Candolle. »
Comment donner accès à ce contenu scientifique?
Augustin Pyramus de Candolle (1778-1841), botaniste.
MOANO 21
Livres anciensEn 2007, un groupe de botanistes a refait cette
traversée en 70 jours– Evolution de la flore– http://www.terranoos.org/fr/de-candolle/actualite.html
MOANO 22
Extrait de leur récitLe val d'Esquierry
Nous partons à 6H45 du refuge d'Espingo pour rallier les Granges d'astau et rejoindre le reste de l'équipe dont nous étions séparés suite aux péripétie de la veille au port d'OO. Dans la descente, sur une falaise humide, nous trouvons une station à Saxifrage de Cluse d'une dizaine de pieds. Plante assez rare, Gérard précise qu'une station aurait été détruite lors de l'élargissement du sentier. Heureusement, la nature semble avoir encore quelques ressources. 8H15, arrivée au bivouac, nous retrouvons l'équipe. Nous mettons rapidement les échantillons d'herbier récoltés depuis trois jours dans la grande presse. Nous repartons vers 10H00 pour le val d'Esquierry. La montée à travers la prairie et la hêtraie est raide, mais assez courte. À la sortie, nous débouchons sur un immense vallon couvert de fleurs. Nous trouvons une prairie montagnarde pas encore pâturée. Nous relevons, comme de Candolle avant nous, le Millepertuis des montagnes, la Serratule fausse-centaurée, plante remarquable par la taille de son port et de son inflorescence et formant une population de quelques dizaines de pieds très localisée.
MOANO 23
Contexte : La botaniqueOuvrir l’accès à la connaissance (grand public,
étudiants, décideurs, ...) au travers d’interfaces de recherche/navigation en texte.
Exploiter les connaissances des experts présentes au sein des descriptions textuelles
L’image a une place prépondérante en botanique : de nombreux croquis….
MOANO 24
Des images et des croquisLe Millepertuis des montagnes, la
Serratule fausse-centaurée,
MOANO 25
Un concept : Le millepertuisplusieurs termes
Noms communs : Millepertuis, herbe de la Saint-Jean.
Nom botanique : Hypericum perforatum, famille des hypéricacées ou clusiacées.
Noms anglais : St. John’s Wort, SJW.
MOANO 26
Des outils pour classer, indexer et rechercher
Thésaurus : RAMEAUDes référentiels taxonomiques pour la faune et la
flore : http://www.sciena.org/serena/ : logiciel de gestion de bases de données naturalistes
MOANO 27
Une taxonomie existante – Thésaurus RameauUne première base
MOANO 28
Des questions?
pour votre attention
MOANO 16 Décembre 2010 29