wordnet : une base de connaissances lexicales la mère (le père) de tous les réseaux de mots ? wn
TRANSCRIPT
![Page 1: WordNet : une base de connaissances lexicales La mère (le père) de tous les réseaux de mots ? wn](https://reader035.vdocuments.mx/reader035/viewer/2022062511/551d9d8c497959293b8c1905/html5/thumbnails/1.jpg)
WordNet : une base de connaissances lexicales
La mère (le père) de tous les réseaux de mots ?
http://www.cogsci.princeton.edu/~wn/
![Page 2: WordNet : une base de connaissances lexicales La mère (le père) de tous les réseaux de mots ? wn](https://reader035.vdocuments.mx/reader035/viewer/2022062511/551d9d8c497959293b8c1905/html5/thumbnails/2.jpg)
WordNet ? 1/4 Inspirée par des théories psycholinguistiques
et informatiques sur la mémoire lexicale humaine (Miller 85)
Fournir une recherche conceptuelle dans un dictionnaire
Donc organiser l’information lexicale en terme de signification de mots
Approximativement 155300 formes de mots et 117 600 concepts (synsets)
Version 1.0 en juin 1991. En 2006, version 2.1
![Page 3: WordNet : une base de connaissances lexicales La mère (le père) de tous les réseaux de mots ? wn](https://reader035.vdocuments.mx/reader035/viewer/2022062511/551d9d8c497959293b8c1905/html5/thumbnails/3.jpg)
Représentation sous forme de matrice lexicale
WordNet ? 2/4
Formes des mots : désignation de l’expression physique
Sens des mots : désignation du concept lexical que la forme peut exprimer
![Page 4: WordNet : une base de connaissances lexicales La mère (le père) de tous les réseaux de mots ? wn](https://reader035.vdocuments.mx/reader035/viewer/2022062511/551d9d8c497959293b8c1905/html5/thumbnails/4.jpg)
En,pSn
……
E3,3S3
E2,2S2
E1,1 E1,2S1
Formes des mots
F1 F2 F3 … Fp
Sens
des mots
WordNet ? 3/4
![Page 5: WordNet : une base de connaissances lexicales La mère (le père) de tous les réseaux de mots ? wn](https://reader035.vdocuments.mx/reader035/viewer/2022062511/551d9d8c497959293b8c1905/html5/thumbnails/5.jpg)
Relations entre les significations des mots
- Hyperonymie / Hyponymie (tree / plant)- Méronymie
Relations entre les formes des mots
- Synonymie- Antonymie (rich/poor)
WordNet ? 4/4
Organisée par des relations sémantiques (pointeurs vers des synsets) ou relations lexicales :
![Page 6: WordNet : une base de connaissances lexicales La mère (le père) de tous les réseaux de mots ? wn](https://reader035.vdocuments.mx/reader035/viewer/2022062511/551d9d8c497959293b8c1905/html5/thumbnails/6.jpg)
Organisation des noms 1/5
Une hiérarchie sémantique ( ~ 12 niveaux) 117 100 formes de mots pour 81 400
significations de mots, et 145100 paires (mot-sens)
Pas un seul réseau : distinction des noms par 25 domaines sémantiques
![Page 7: WordNet : une base de connaissances lexicales La mère (le père) de tous les réseaux de mots ? wn](https://reader035.vdocuments.mx/reader035/viewer/2022062511/551d9d8c497959293b8c1905/html5/thumbnails/7.jpg)
ProcessFeeling, emotion
PossessionEvent, happening
TimePlant, floraCommunication
Person, human being
Natural phenomenon
Cognition, knowledge …
SubstanceNatural object Body, corpus …
State, ConditionMotiveAttribute, property
ShapeLocation, placeArtifact…
RelationGroup, collectionAnimal, fauna …
Quantity, amountFoodAct, action, activity
Organisation des noms 2/5
![Page 8: WordNet : une base de connaissances lexicales La mère (le père) de tous les réseaux de mots ? wn](https://reader035.vdocuments.mx/reader035/viewer/2022062511/551d9d8c497959293b8c1905/html5/thumbnails/8.jpg)
Organisation des noms 3/5
Trois sortes de caractéristiques : Les attributs
Adjectifs qui modifient le nom Les parties
Relation de méronymie Les fonctions
Information fonctionnelle
Relation d’opposition : antonymie Collocations
![Page 9: WordNet : une base de connaissances lexicales La mère (le père) de tous les réseaux de mots ? wn](https://reader035.vdocuments.mx/reader035/viewer/2022062511/551d9d8c497959293b8c1905/html5/thumbnails/9.jpg)
Hypernym (inv. Hyponym):X is a hypernym of Y if Y is a (kind of) X
Meronym (inv. Holonym):X is a meronym of Y if
X is a part of Y or X is a substance of Y or X is a member of Y
plant / treewalk / march
mouth / facetree / forest
Antonym : an opposition lexical relation
rich / poorhappyness / unhappyness
Organisation des noms 4/5
![Page 10: WordNet : une base de connaissances lexicales La mère (le père) de tous les réseaux de mots ? wn](https://reader035.vdocuments.mx/reader035/viewer/2022062511/551d9d8c497959293b8c1905/html5/thumbnails/10.jpg)
PersonGroup Natural Object Substance
Family Relative Body Organic Substance
ArmSisterBrother Leg Flesh Bone
Hyponyme Méronyme Antonyme
Organisation des noms 5/5
![Page 11: WordNet : une base de connaissances lexicales La mère (le père) de tous les réseaux de mots ? wn](https://reader035.vdocuments.mx/reader035/viewer/2022062511/551d9d8c497959293b8c1905/html5/thumbnails/11.jpg)
Exemple : House1. house -- (a dwelling that serves as living quarters for one or more families; "he has a house on Cape Cod"; "she felt she had to get out of the house")2. house -- (an official assembly having legislative powers; "the legislature has two houses")3. house -- (a building in which something is sheltered or located; "they had a large carriage house")4. family, household, house, home, menage -- (a social unit living together; "he moved his family to Virginia"; "It was a good Christian household"; "I waited until the whole house was asleep"; "the teacher asked how many people made up his home")5. theater, theatre, house -- (a building where theatrical performances or motion-picture shows can be presented; "the house was full")6. firm, house, business firm -- (members of a business organization; "he worked for a brokerage house")7. house -- (aristocratic family line; "the House of York")8. house -- (the members of a religious community living together)9. house -- (the audience gathered together in a theatre or cinema; "the house applauded"; "he counted the house")10. house -- (play in which children take the roles of father or mother or children and pretend to interact like adults; "the children were playing house")11. sign of the zodiac, star sign, sign, mansion, house, planetary house -- ((astrology) one of 12 equal areas into which the zodiac is divided)12. house -- (the management of a gambling house or casino; "the house gets a percentage of every bet")
![Page 12: WordNet : une base de connaissances lexicales La mère (le père) de tous les réseaux de mots ? wn](https://reader035.vdocuments.mx/reader035/viewer/2022062511/551d9d8c497959293b8c1905/html5/thumbnails/12.jpg)
Exemples : synonymes
Results for "Synonyms, ordered by estimated frequency" search of noun "computer"
2 senses of computer
Sense 1computer, computing machine, computing device, data processor, electronic computer, information processing system -- (a machine for performing calculations automatically) => machine -- (any mechanical or electrical device that transmits or modifies energy to perform or assist in the performance of human tasks)
Sense 2calculator, reckoner, figurer, estimator, computer -- (an expert at calculation (or at operating calculating machines)) => expert -- (a person with special knowledge or ability who performs skillfully)
![Page 13: WordNet : une base de connaissances lexicales La mère (le père) de tous les réseaux de mots ? wn](https://reader035.vdocuments.mx/reader035/viewer/2022062511/551d9d8c497959293b8c1905/html5/thumbnails/13.jpg)
HyperonymesResults for "Hypernyms (this is a kind of...)" search of noun "computer"
Sense 1computer, computing machine, computing device, data processor, electronic computer, information processing system -- (a machine for performing calculations automatically) => machine -- (any mechanical or electrical device that transmits or modifies energy to perform or assist in the performance of human tasks) => device -- (an instrumentality invented for a particular purpose; "the device is small enough to wear on your wrist"; "a device intended to conserve water") => instrumentality, instrumentation -- (an artifact (or system of artifacts) that is instrumental in accomplishing some end) => artifact, artefact -- (a man-made object taken as a whole) => object, physical object -- (a tangible and visible entity; an entity that can cast a shadow; "it was full of rackets, balls and other objects") => entity, physical thing -- (that which is perceived or known or inferred to have its own physical existence (living or nonliving)) => whole, whole thing, unit -- (an assemblage of parts that is regarded as a single entity; "how big is that part compared to the whole?"; "the team is a unit") => object, physical object -- (a tangible and visible entity; an entity that can cast a shadow; "it was full of rackets, balls and other objects") => entity, physical thing -- (that which is perceived or known or inferred to have its own physical existence (living or nonliving))
![Page 14: WordNet : une base de connaissances lexicales La mère (le père) de tous les réseaux de mots ? wn](https://reader035.vdocuments.mx/reader035/viewer/2022062511/551d9d8c497959293b8c1905/html5/thumbnails/14.jpg)
Organisation des verbes 1/5 La plus importante catégorie lexicale et
syntaxique du langage et la plus difficile à étudier
21 000 verbes et approximativement 8 400 synsets
Répartition des verbes dans 15 fichiers distincts qui correspondent chacun à un domaine sémantique
![Page 15: WordNet : une base de connaissances lexicales La mère (le père) de tous les réseaux de mots ? wn](https://reader035.vdocuments.mx/reader035/viewer/2022062511/551d9d8c497959293b8c1905/html5/thumbnails/15.jpg)
Stative verbs Emotion or psych verbs
Verbs of change Motion verbs
Cognition verbs Perception verbs
Verbs of communication Verbs of possession
Competition verbs Verbs of social interaction
Consumption verbs Weather verbs
Contact verbs Creation verbs
Verbs if bodily functions and care
Organisation des verbes 2/5
![Page 16: WordNet : une base de connaissances lexicales La mère (le père) de tous les réseaux de mots ? wn](https://reader035.vdocuments.mx/reader035/viewer/2022062511/551d9d8c497959293b8c1905/html5/thumbnails/16.jpg)
Relations sémantiques : interaction avec implication stricte (entailment)
"Someone V1" implique "Someone V2"A verb X entails Y if X cannot be done
unless Y is, or has been, done
Exemple : "He is snoring" implique "He is sleeping"
Organisation des verbes 3/5
![Page 17: WordNet : une base de connaissances lexicales La mère (le père) de tous les réseaux de mots ? wn](https://reader035.vdocuments.mx/reader035/viewer/2022062511/551d9d8c497959293b8c1905/html5/thumbnails/17.jpg)
Entailment
Temporal inclusion No temporal inclusion
+ Troponymy
(co-extensiveness)
- Troponymy
(proper inclusion)
( limp – walk ) ( snore – sleep )
Troponym :X is a troponym of Y if to X is to Y in some manner
Organisation des verbes 4/5
![Page 18: WordNet : une base de connaissances lexicales La mère (le père) de tous les réseaux de mots ? wn](https://reader035.vdocuments.mx/reader035/viewer/2022062511/551d9d8c497959293b8c1905/html5/thumbnails/18.jpg)
Entailment
Temporal inclusion No temporal inclusion
Cause Backward
presupposition( feed – eat )
( fail – try )
Cause :A verb X causes YIf X denotes the causation of the state or activity referred to by Y
Organisation des verbes 5/5
![Page 19: WordNet : une base de connaissances lexicales La mère (le père) de tous les réseaux de mots ? wn](https://reader035.vdocuments.mx/reader035/viewer/2022062511/551d9d8c497959293b8c1905/html5/thumbnails/19.jpg)
Exemple : Entailment
Results for "This entails doing..." search of verb "eat"
Sense 1eat -- (take in solid food; "She was eating a banana"; "What did you eat for dinner last night?") => chew, masticate, manducate, jaw -- (chew (food); "He jawed his bubble gum"; "Chew your food and don't swallow it!"; "The cows were masticating the grass") => swallow, get down -- (pass through the esophagus as part of eating or drinking; "Swallow the raw fish--it won't kill you!")
![Page 20: WordNet : une base de connaissances lexicales La mère (le père) de tous les réseaux de mots ? wn](https://reader035.vdocuments.mx/reader035/viewer/2022062511/551d9d8c497959293b8c1905/html5/thumbnails/20.jpg)
Organisation des adjectifs
Adjectifs descriptifs : big, possible, …
Adjectifs relationnels : variantes stylistiques des modifieurs de noms
19 500 adjectifs organisés dans 1000 synsets
![Page 21: WordNet : une base de connaissances lexicales La mère (le père) de tous les réseaux de mots ? wn](https://reader035.vdocuments.mx/reader035/viewer/2022062511/551d9d8c497959293b8c1905/html5/thumbnails/21.jpg)
Exemple d ’application
Expansion sémantique de requête Manuelle [Voorhees, 1998] Fournit un plafond pour l'expansion sémantique. Collection de test de TREC (1993). Exemple : research, development, testing and evaluation
of a new anti-cancer drug developed anywhere in the world {cancer}, {skin_cancer}, {pharmaceutical}.
Vecteurs multi-partites : termes de départ, synonymes, hyponymes, collocations... Le poids de chaque partie peut varier.
L'expansion améliore les requêtes « courtes » mais
dégrade les « longues ».
![Page 22: WordNet : une base de connaissances lexicales La mère (le père) de tous les réseaux de mots ? wn](https://reader035.vdocuments.mx/reader035/viewer/2022062511/551d9d8c497959293b8c1905/html5/thumbnails/22.jpg)
Expansion sémantique de requête Automatique [Voorhees, 1998] Pour (tenter de) rendre compte des concepts importants
de la requête sont expansés les termes inférieurs à un plafond N dans la base
de documents un terme est ajouté s'il est lié à au moins deux termes originels de
la requête.
Les sens effectifs d'une requête courte sont rarement reliés. Les mots les reliant risquent d'être très généraux (system).
Là encore, l'obstacle est la désambiguïsation sémantique
automatique.
![Page 23: WordNet : une base de connaissances lexicales La mère (le père) de tous les réseaux de mots ? wn](https://reader035.vdocuments.mx/reader035/viewer/2022062511/551d9d8c497959293b8c1905/html5/thumbnails/23.jpg)
WordNet : critiques WordNet : 12% des entrées sont polysémiques, soit 15 400
formes [Leacock & Chodorow, 1998]. Le grand écart des fréquences.
Exemple : environ 1 400 occurrences de vendre dans 14 millions de mots (numéros du Monde tirés au hasard en 1987, 1989, 1991, 1993 et 1995). Pas une apparition du sens ‘ trahir ’, pourtant présent dans tous les dictionnaires.
La constitution de corpus suffisamment vastes pour représenter correctement tous les sens des mots polysémiques est hors de portée.
Concordance sémantique (SemCor) : 167 occurrences de 11 sens de serve. 4 de ces sens totalisent 10% des occurrences (2-3% chaque). S'entraîner à les reconnaître est impossible. Le plafond est alors de
90%.
![Page 24: WordNet : une base de connaissances lexicales La mère (le père) de tous les réseaux de mots ? wn](https://reader035.vdocuments.mx/reader035/viewer/2022062511/551d9d8c497959293b8c1905/html5/thumbnails/24.jpg)
Limites connues de WordNet Pas d'informations sur les propriétés syntaxiques de
mots. Pas de liens entre parties du discours. Noms, verbes et
adjectifs sont des continents séparés. Pas de savoir « encyclopédique ». Pas d'indications de domaine (« tennis problem ») : pas
de lien direct entre raquette, balle et filet. Densité variable. Grain très (trop ?) fin de distinction de sens (break : 63
sens !)
![Page 25: WordNet : une base de connaissances lexicales La mère (le père) de tous les réseaux de mots ? wn](https://reader035.vdocuments.mx/reader035/viewer/2022062511/551d9d8c497959293b8c1905/html5/thumbnails/25.jpg)
Bibliographie Livres :
WordNet An Electronic Lexical Database – Christiane Fellbaum 1998
EuroWordNet : a multilingual database with lexical semantic networks – Piek Vossen 1998
Adresse http : http://wordnet.princeton.edu/