informatica umanistica d: lessicografia e computer teorie psicologiche del lessico e del significato...
TRANSCRIPT
INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER
Teorie psicologiche del lessico e del significato lessicale
DEFINIZIONI NEI DIZIONARI
horse noun
1 a solid-hoofed plant-eating domesticated mammal with a flowing mane and tail, used for riding, racing, and to carry and pull loads
New Oxford Dictionary of English
GENUS
DIFFERENTIAE
DEFINIZIONI NEI DIZIONARI
contascàtti: Dispositivo installato a richiesta presso l’utente per la documentazione del traffico telefonico
(Zingarelli 1995)
maneggevole: Che si puo’ maneggiare facilmente || Fig. trattabile, arrendevole || T. mar. del vento, quando permette l’esecuzione di qualsiasi manovra
(Palazzi-Folena, 1992)
EVIDENZA IN LESSICOGRAFIA
Su che base vengono Identificate le accezioni di una parola? Sviluppate le definizioni?
WordNet: Un tentativo di fondare la ricerca lessicografica su basi psicologica
Questa settimana: Evidenza psicologica Evidenza da corpora
RAPPRESENTAZIONE LESSICALE IN PSICOLOGIA E NEI CORPORA
La psicologia e la linguistica dei corpora sono arrivate ad idee simili per quel che riguarda il significato lessicale
Queste idee possono essere utili Per sviluppare lessici piu’ accessibili Per sviluppare metodi automatici per la
scoperta delle accezioni
EVIDENZA PSICOLOGICA SUL SIGNIFICATO
Semantic priming Teorie dei concetti in psicologia:
Reti semantiche Teoria dei prototipi
Disambiguazione lessicale
SEMANTIC PRIMING
Uno degli effetti fondamentali rilevati dalla ricerca psicolinguistica a partire dagli anni ’60 Per esempio, Schvaneveldt & Meyer
1971 Udire una parola (o vedere
un’immagine) ATTIVA parole / concetti associati
SEMANTIC PRIMING: ESEMPIO (SCHVANEVELDT & MEYER)
ASSOCIAZIONI TRA PAROLE (O CONCETTI)
I risultati di Schvaneveldt ed altri portarono allo sviluppo di teorie del lessico basate sull’associazione
Ed alla compilazione di liste di parole associate sulla base di dati psicologici
RETI SEMANTICHE: RISULTATI DALLA PSICOLOGIA COGNITIVA
Collins & Quillian, 1969: tempi per decidere se un oggetto ha una certa proprieta’ aumentano a seconda della ‘distanza’ A canary is yellow A canary has feathers A canary eats food
Haviland & Clark 1974, Sanford & Garrod 1979: I looked around the house. The lounge was very spacious.
LE RETI SEMANTICHE
RETI SEMANTICHE E LESSICO
Evidenza per relazioni di iponimia
TEORIE DEI CONCETTI IN PSICOLOGIA: PROTOTIPI
La teoria dominante dei concetti in Psicologia e’ la teoria dei PROTOTIPI proposta da Rosch negli anni ’70
IL PROBLEMA DI PLATONE
For many concepts, there simply aren’t any definitions” (LM p.14)
A theory that correctly describes the behavior of perhaps three hundred words has been asserted to correctly describe the behavior of the tens of thousands of general names (Putnam)
WITTGENSTEIN: ‘GAME’
What is common to all games? Are they all ‘amusing’?
Cfr. chess
Or is there always winning and losing? Counterex: child throwing his ball at the wall
Look at the parts played by skill and luck “I can think of no better expression that
FAMILY RESEMBLANCE” ‘games form a family’
PUTNAM
the term ‘lemon’ not definable by simply conjoining its ‘definining characteristics’ yellow color / tart taste / a certain kind of peel Abnormal members (green lemon) Three legged tiger (Also: three-legged
chair, see below)
CONCLUSIONE
Le definizioni genus+differentia non riflettono la nostra conoscenza lessicale sui concetti
EVIDENZA PER TEORIA DEI PROTOTIPI
Typicality effects Is a tomato a vegetable or a fruit? ‘Is this art?’
Failures of transitivity If A is a B and B is a C, is A a C?
‘Fuzzy’ or ‘graded’ categorization
A necessary and sufficient definition should pick up all the category members and none of the non-members
But this is not what happens: Hampton (1979): no clear division between
members and non-members of 8 categories Kitchen utensils: SINK? SPONGE? Vegetables: TOMATOES? GOURDS?
Agreement on typicality judgments (‘think of a fish, any fish’) Rosch (1975): very high correlation (.97) between
subjects’s typicality rankings for 10 categories
Typicality effects
The ease with which people judge CATEGORY MEMBERSHIP depends on typicality Rips, Shoben and Smith (1973): Fast to affirm that a robin
is a bird; not so fast to affirm that a chicken is a bird Posner & Keele: similarity to visual pattern
Learning: typical items learned before atypical ones (Rosch Simpson & Miller 1976) Learning is faster if subjects are taught on typical items
Typicality affects speed of inference Rips 1975: Garrod & Sanford 1977: faster reading time for “The bird
came in through the front door” when ROBIN than when GOOSE
La teoria in breve
Manteniamo rappresentazioni dei concetti sulla base delle loro ‘features’ (TRATTI)
Per ogni classe di oggetti esistono dei rappresentanti piu’ TIPICI
Per decidere se un oggetto e’ una sedia od una poltrona calcoliamo la SOMIGLIANZA tra questo oggetto e la ‘tipica sedia’ e la ‘tipica poltrona’
FEATURE NORMS
Psychologists have been collecting concept features from subjects at least since Rosch and Mervis (1975)
Different methodologies used (from free association to very tightly controlled)
Three such databases currently available Garrard et al (2001) - GA Vinson and Vigliocco (2004) - VV McRae et al (2005) – MCRA - the largest, also
classified
SPEAKER-GENERATED FEATURES (VINSON AND VIGLIOCCO)
FEATURE NORMS (GARRARD)
What makes an item typical? Rosch & Mervis 1975
Items are typical when they have HIGH FAMILY RESEMBLANCE with members of the category:
Typical items have many of the attributes of members Do not have properties of nonmembers Irrespective of frequency: ORIOLE vs CHICKEN
Evidence 1: checked that subjects agree on typicality for several natural categories
1. Asked subjects to list attributes (actually, check)2. Weighed each attribute by how many items it occurred with within
the category1. ‘SCORE’ indicates how many common features
3. Found that score highly predictive of typicality (.84-.91)Five most typical ‘furniture’ (CHAIR, SOFA, TABLE, DRESSER, DESK) have 13 features in common
Five least typical (CLOCK, PICTURE, CLOSET, VASE, TELEPHONE) had 2 attributes in common
Rosch and Mervis 1975 (2)
Evidence 2: non-typical elements have more features in common with other categories
Evidence 3: speed of learning with artificial stimuli belonging to 2 classes Items with more features in common with
family easier to learn Items with more features in common with
contrast category harder to learn
CONCETTI COME ‘CLUSTER’
CHICKEN
GOOSE
ORIOLEROBIN
OSTRICH
FEATURE NORMS & DIZIONARI
Questi dati sui tratti tipici di concetti raccolti da soggetti potrebbero essere utili per guidare lo sviluppo di definizioni o delle relazioni semantiche in un dizionario tipo WordNet
FEATURE NORMS PER ELDIT
Un progetto congiunto European Academy Bolzano / UniTN (CIMEC) per raccogliere feature norms su parole in Italiano e Tedesco
METODI
Dati raccolti da studenti nelle scuole di Bolzano ~70 studenti di lingua madre Italiana e 70
di lingua madre tedesca Raccolto dati su 50 concetti
RISULTATI
~200 paia concetto / attributo in comune tra tutti e 70 i soggetti tedeschi ed altrettante per gli Italiani
Tipi di proprieta’ piu’ importanti: Iponimia ( il cane e’ un animale ) Parte ( il cane ha le zampe) Qualita’ esterna ( le fragole sono rosse) Comportamento ( il cane abbaia )
EVIDENZA PSICOLOGICA SULLE ACCEZIONI
Molta ricerca psicologica a partire dagli anni ’70 si e’ occupata del problema della DISAMBIGUAZIONE LESSICALE
Questo tipo di ricerca puo’ aiutare a risolvere il problema della distinzione tra OMONIMIA (gru) e POLISEMIA (bocca)
DISAMBIGUAZIONE LESSICALE: OMONIMI
DISAMBIGUAZIONE LESSICALE: POLISEMIA
CONCLUSIONI
I risultati della ricerca psicologica potrebbero aiutare nello sviluppo di nuovi dizionari Aiutando ad identificare le accezioni Assicurando che le definizioni
contengano le proprieta’ di un concetto che i parlanti della lingua trovano piu’ significative
LETTURE