Annotation semantiqueUne extension a base de regles d’annotation
Conclusion et perspectives
Ontologies etendues pour l’annotation semantique
Yue Ma, Laurent Audibert, Adeline Nazarenko
Laboratoire d’Informatique de Paris-Nord (UMR CNRS 7030)Institut Galilee - Universite Paris-Nord
99, avenue Jean-Baptiste Clement93430 Villetaneuse, France
29 mai 2009
Ce travail a ete realise dans le cadre du programme Quaero,finance par OSEO, agence nationale de valorisation de la recherche.
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 1 / 23
Annotation semantiqueUne extension a base de regles d’annotation
Conclusion et perspectives
Introduction
Annotation semantique
Mettre des fragments de texte en correspondance avec les elementsd’une ontologie
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 2 / 23
Annotation semantiqueUne extension a base de regles d’annotation
Conclusion et perspectives
Introduction
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 3 / 23
Annotation semantiqueUne extension a base de regles d’annotation
Conclusion et perspectives
Introduction
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 4 / 23
Annotation semantiqueUne extension a base de regles d’annotation
Conclusion et perspectives
Sommaire
1 Annotation semantique
2 Une extension a base de regles d’annotation
3 Conclusion et perspectives
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 5 / 23
Annotation semantiqueUne extension a base de regles d’annotation
Conclusion et perspectives
Differents types d’annotationLes extensions lexicalesContexte de mise en oeuvre
Types d’annotationConcepts
Certains mots ou expressionsdenotent des concepts
Exemple : piece de theatre
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 6 / 23
Annotation semantiqueUne extension a base de regles d’annotation
Conclusion et perspectives
Differents types d’annotationLes extensions lexicalesContexte de mise en oeuvre
Types d’annotationInstances de concepts
Certains mots ou expressionsrenvoient a des instances deconcepts
Exemple : entites nommees commeMarie et Moliere
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 7 / 23
Annotation semantiqueUne extension a base de regles d’annotation
Conclusion et perspectives
Differents types d’annotationLes extensions lexicalesContexte de mise en oeuvre
Types d’annotationRoles conceptuels
Certains mots ou expressionsdenotent des roles conceptuels
Exemple : lit
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 8 / 23
Annotation semantiqueUne extension a base de regles d’annotation
Conclusion et perspectives
Differents types d’annotationLes extensions lexicalesContexte de mise en oeuvre
Types d’annotationRelations entre instances
Certains fragments de texterenvoient a des relations entreinstances
Exemple : une piece de theatre deMoliere
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 9 / 23
Annotation semantiqueUne extension a base de regles d’annotation
Conclusion et perspectives
Differents types d’annotationLes extensions lexicalesContexte de mise en oeuvre
Types d’annotationAxiomes ontologiques
Certains fragments textuels expriment des axiomesontologiques
Exemple : les genes sont des entites biologiques
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 10 / 23
Annotation semantiqueUne extension a base de regles d’annotation
Conclusion et perspectives
Differents types d’annotationLes extensions lexicalesContexte de mise en oeuvre
Extension lexicaleSysteme LingInfo
LingInfo [Buitelaar, Sintek & Kiesel, 2006] associe une decompositionlinguistique detaillee aux classes et aux proprietes de l’ontologie
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 11 / 23
Annotation semantiqueUne extension a base de regles d’annotation
Conclusion et perspectives
Differents types d’annotationLes extensions lexicalesContexte de mise en oeuvre
Extension lexicaleSysteme LexOnto
LexOnto [Cimiano, Haase, Herold, Mantel & Buitelaar, 2007] utilise unemeta-ontologie permettant de representer des relations simples entretermes et concepts, ainsi que des structures linguistiques complexes detype predicat-argument (cadres de sous-categorisation).
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 12 / 23
Annotation semantiqueUne extension a base de regles d’annotation
Conclusion et perspectives
Differents types d’annotationLes extensions lexicalesContexte de mise en oeuvre
Contexte de mise en oeuvrePlateforme d’annotation linguistique
Contexte :
Plateforme d’annotationlinguistique
Integration d’outils heterogenes
Probleme dans la plateforme Alvis :
Representation semantiquerepartie sur plusieurs niveauxI problemes de coherenceI forte dependance avec les outilsutilises en amont
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 13 / 23
Annotation semantiqueUne extension a base de regles d’annotation
Conclusion et perspectives
Differents types d’annotationLes extensions lexicalesContexte de mise en oeuvre
Contexte de mise en oeuvreExtensions lexicales existantes ?
L’ontologie rassemble en un lieu uniqueet coherent ce qui est du ressort de lasemantique
Inconvenients du niveau terminologiquepivot des systemes presentes :
Constitution manuelle ou assistee
Double-emploi avec les annotationsdes niveaux inferieurs de laplateforme
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 14 / 23
Annotation semantiqueUne extension a base de regles d’annotation
Conclusion et perspectives
Differents types d’annotationLes extensions lexicalesContexte de mise en oeuvre
Contexte de mise en oeuvreExtension a base de regles
Objectifs de l’extension :
Permettre l’annotation semantiqueautomatique
S’appuyer sur les annotations desmodules situes en amont
Comprehensible et modifiable parun etre humain
Etre inferable(semi-)automatiquement a partird’un corpus semantiquementannote
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 15 / 23
Annotation semantiqueUne extension a base de regles d’annotation
Conclusion et perspectives
Extension a base de reglesExpression des reglesOperations sur une ontologie etendue
Ontologie et Regles
Ontologie
O = 〈C ,R, I ?,RI ?,A〉 composee d’un ensemble de concepts (C ),de roles (R), d’instances (I ), de relations entre instances (RI ) etd’axiomes (A)
Regles
Une regle est la donnee d’un couple (P,C ) ou P (Premisse) decritles conditions qu’un segment de texte doit verifier pour etre annoteet C (Conclusion) indique comment annoter le segment.
Exemple de regle pour annoter le segment de texte « personne » :
(P,C ) = ([lemme={personne}], PERSONNE )
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 16 / 23
Annotation semantiqueUne extension a base de regles d’annotation
Conclusion et perspectives
Extension a base de reglesExpression des reglesOperations sur une ontologie etendue
Definition de l’extension
Extension
R = 〈RC ,RR ,RI ,RRI ,RA〉, un ensemble de regles permettantd’annoter des fragments de textes en les reliant a des concepts(RC ), des roles (RR), des instances (RI ), des relations entreinstances (RRI ) ou des axiomes (RA)
Pour chaque concept c de C il existe un couple de regles(ρc , ρci ) concluant sur c et telles que ρc ∈ RC et ρci ∈ RI
pour chaque role r de R il existe un couple de regles (ρr , ρri )concluant sur r et telles que ρr ∈ RI et ρri ∈ RRI
pour chaque axiome a de A il existe une regle ρa ∈ RA
concluant sur a
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 17 / 23
Annotation semantiqueUne extension a base de regles d’annotation
Conclusion et perspectives
Extension a base de reglesExpression des reglesOperations sur une ontologie etendue
Exemple de couple de regles
Regle d’annotation ontologique pour annoter « personne » :
ρc ∈ RC = ([lemme={personne}], PERSONNE )
Regle de peuplement ontologique pour annoter « Marie » :
ρci ∈ RI = ([entite_nommee={personne}], PERSONNE )
Si l’objectif n’est pas de peupler l’ontologie :
on peut ignorer les regles de peuplement
on peut les interpreter comme des regles conceptuelles
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 18 / 23
Annotation semantiqueUne extension a base de regles d’annotation
Conclusion et perspectives
Extension a base de reglesExpression des reglesOperations sur une ontologie etendue
Formalisme des patrons
La premisse P d’une regle (P,C ) peut etre representee par unensemble de patrons
Pour exprimer des contraintes de desambiguısation portant sur soncontexte, un patron pourrait s’ecrire sous la forme d’un triplet :P = (LC ?,T ,RC ?)
Formalismes candidats :
XPath pour des annotations en XML (sous forme de triplets)
ou XQuery (pas besoin de triplets)
SQL pour des annotations dans une base de donnees
JDOQL pour des annotations gerees par la librairie JDO
HQL pour des annotations gerees par la librairie Hibernate
. . .IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 19 / 23
Annotation semantiqueUne extension a base de regles d’annotation
Conclusion et perspectives
Extension a base de reglesExpression des reglesOperations sur une ontologie etendue
Operations sur une ontologie etendue
L’ajout d’un concept implique de preciser les patrons associes :1 selon une proposition spontanee de l’utilisateur2 ou en les inferant a partir d’annotations manuelles sur un
corpus representatif
La decomposition d’un concept impose la decomposition de sonextension :
1 qui peut etre realisee manuellement2 ou inferee apres avoir annote un corpus representatif et
reparti manuellement les annotations
La fusion de deux concepts c1 et c2 a comme extension(ρc1 ∨ ρc2, ρi1 ∨ ρi2)
La suppression d’un concept entraıne la suppression de sonextension, ou son absorption par le ou les concepts qui lesubsument
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 20 / 23
Annotation semantiqueUne extension a base de regles d’annotation
Conclusion et perspectives
Conclusion
Solution au probleme de l’annotation semantique au regard d’uneontologie dans le cadre d’une plateforme d’annotation
Tire parti des outils de TAL situes en amont
Distinction claire entre processus d’analyse linguistique etinterpretation ontologique
Interet des patrons :
Grand pouvoir expressif
Comprehensibles et modifiables par une personne
Interpretables, voire calculables, par un ordinateur
Nombreux formalismes connus et standardises existants
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 21 / 23
Annotation semantiqueUne extension a base de regles d’annotation
Conclusion et perspectives
Perspectives
Determination du formalisme des patrons
Developpement et experimentations d’un module d’annotationsemantique dans une plateforme d’annotation
Problematique prometteuse du champs de rechercheconcernant l’acquisition des regles (apprentissage incremental,active learning. . . )
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 22 / 23
Annotation semantiqueUne extension a base de regles d’annotation
Conclusion et perspectives
Paul Buitelaar, Michael Sintek, and Malte Kiesel.
A multilingual/multimedia lexicon model for ontologies.
In ESWC, pages 502–513, 2006.
Philipp Cimiano, Peter Haase, Matthias Herold, Matthias Mantel, andPaul Buitelaar.
Lexonto : A model for ontology lexicons for ontology-based nlp.
In Proceedings of OntoLex - From Text to Knowledge : TheLexicon/Ontology Interface, 2007.
IC 2009 – Y. Ma, L. Audibert, A. Nazarenko – LIPN Ontologies etendues pour l’annotation semantique 23 / 23