base lexicale esf sfp bordeaux 12 sept 2008
TRANSCRIPT
Base lexicale trilingue ESFBase lexicale trilingue ESF
Mesure du partage orthographique Mesure du partage orthographique et du recouvrement sémantique et du recouvrement sémantique
interlangueinterlangue
Jannika LAXEN, Xavier APARICIO et Jean-Marc Jannika LAXEN, Xavier APARICIO et Jean-Marc LAVAURLAVAUR
La psychologie et les La psychologie et les langueslangues
Les langues sont au cœur du Les langues sont au cœur du développement Européendéveloppement Européen
Vecteurs d’échange de savoirs et de Vecteurs d’échange de savoirs et de connaissances connaissances
Nécessité pour les psychologues d’étudier Nécessité pour les psychologues d’étudier les mécanismes impliqués dans la les mécanismes impliqués dans la communication multilinguecommunication multilingue
Bilinguisme et psychologie Bilinguisme et psychologie cognitivecognitive
De nombreuses recherches concernent le De nombreuses recherches concernent le Bilinguisme Bilinguisme en Psychologie Cognitiveen Psychologie Cognitive
Une large part de ces recherches concerne Une large part de ces recherches concerne l’étude dul’étude du lexique mental lexique mental chez les bilingues chez les bilingues
Importance de développer des Importance de développer des outils adaptés outils adaptés aux aux études portant sur deux ou plusieurs languesétudes portant sur deux ou plusieurs langues
Objectifs généraux de la Objectifs généraux de la basebase
Objectif : rendre compte des différentes Objectif : rendre compte des différentes relations de relations de formeforme et deet de senssens entre les entre les mots de deux langues ou plus (forte mots de deux langues ou plus (forte proximité vs. faible proximité).proximité vs. faible proximité).
Influence de ces relations sur Influence de ces relations sur l’organisation et le fonctionnement du l’organisation et le fonctionnement du lexique mentallexique mental (bilingue ou multilingue)(bilingue ou multilingue)
La base trilingue ESFLa base trilingue ESF Base lexicale trilingueBase lexicale trilingue (Aparicio, Laxen et Lavaur, 2007)(Aparicio, Laxen et Lavaur, 2007)
Elle regroupe des équivalents de traduction de 3 langues Elle regroupe des équivalents de traduction de 3 langues : : Anglais (CELEX) Anglais (CELEX) Espagnol (LEXESP)Espagnol (LEXESP)Français (LEXIQUE 3)Français (LEXIQUE 3)
Elle inclut : Elle inclut : les caractéristiques fondamentales des mots les caractéristiques fondamentales des mots fréquence et nombre de lettresfréquence et nombre de lettresDes indices de comparaison entre les langues Des indices de comparaison entre les langues recouvrements orthographique et sémantique entre les recouvrements orthographique et sémantique entre les
motsmots
Organisation des équivalents Organisation des équivalents de traductionde traduction
Plusieurs indices de recouvrement Plusieurs indices de recouvrement permettent de classer les équivalents de permettent de classer les équivalents de traduction de la base : traduction de la base :
proximité orthographique proximité orthographique (IPO)(IPO)
proximité sémantiqueproximité sémantique (IRS) (IRS)
Mise au point d’un Mise au point d’un indice global de indice global de proximité (IGP)proximité (IGP) qui prend en compte ces qui prend en compte ces deux dimensionsdeux dimensions
Différents niveaux de Différents niveaux de proximitéproximité
CognatsCognats = = mots de langues différentes proches mots de langues différentes proches orthographiquement et/ou phonologiquement et ayant le même orthographiquement et/ou phonologiquement et ayant le même senssens
miroir/miroir/mirrormirror
Traités différemment par le système cognitif par rapport aux Traités différemment par le système cognitif par rapport aux autres mots « autres mots « spécifiquesspécifiques » ou « » ou « non cognatsnon cognats » » (Font et Lavaur, 2004; (Font et Lavaur, 2004; Lavaur, Aparicio, Vandeberg et Dijkstra, 2008)Lavaur, Aparicio, Vandeberg et Dijkstra, 2008)
livre/livre/bookbook
Homographes interlangues Homographes interlangues == même orthographe, sens différents. même orthographe, sens différents. (Dijkstra, Grainger & Van Heuven, 1999; Lemhöfer & Dijkstra, 2004)(Dijkstra, Grainger & Van Heuven, 1999; Lemhöfer & Dijkstra, 2004)
chair/chair/chairchair (chaise)(chaise)
Proximité OrthographiqueProximité Orthographique
Le premier indice de la base : Le premier indice de la base : IPO (Indice IPO (Indice de Partage Orthographique)de Partage Orthographique)
permet de calculer la distance formelle permet de calculer la distance formelle entre deux équivalents de traduction ou entre deux équivalents de traduction ou simplement entre deux mots simplement entre deux mots (Font et (Font et Lavaur, 2004)Lavaur, 2004)
(Nombre de lettres en commun x 2)(Nombre de lettres en commun x 2)
Nombre total de lettres des 2 motsNombre total de lettres des 2 mots
ExemplesExemples
K IPO = 0
IPO = 0,5
IPO = 1
S I R T
AF K E
IXAT
UJ EP
AF XU
AT IX
KLIMAL TI
IPO 2IPO 2
L’IPO 2 prend en compte les L’IPO 2 prend en compte les lettres communeslettres communes entre 2 équivalents de traduction dans une entre 2 équivalents de traduction dans une position donnée position donnée (Aparicio, Laxen et Lavaur, 2007) (Aparicio, Laxen et Lavaur, 2007)
(nombres de lettres en commun + 1pt par lettre dans la même position)(nombres de lettres en commun + 1pt par lettre dans la même position)
nombre total de lettres des 2 motsnombre total de lettres des 2 mots
Le principe de base est identique à celui de l’IPO mais les Le principe de base est identique à celui de l’IPO mais les données fournies par le calcul sont d’une plus grande données fournies par le calcul sont d’une plus grande précisionprécision
ExemplesExemples
LUNE O
FLEUR
IPO2 = 0,125
IPO2 = 0,5
IPO2 = 1
ANIMAL
M O N
LF OW
MINA
E R
LA
IPO3IPO3
Estime la similarité orthographique des Estime la similarité orthographique des mots des 3 langues (moyenne des IPO2 mots des 3 langues (moyenne des IPO2 pour les langues prises deux à deux, pour les langues prises deux à deux, respectivement L1-L2, respectivement L1-L2,
L1-L3, L2-L3)L1-L3, L2-L3)
∑ ∑ (IPO2)(IPO2) 33
ExemplesExemples
Moon
Falda
Skirt
IPO3 = 1
IPO3 = 0,33 IPO3 = 0
La proximité sémantiqueLa proximité sémantique
Le degré de Le degré de proximité sémantiqueproximité sémantique des équivalents de traduction est des équivalents de traduction est estimé à l’aide de plusieurs variables.estimé à l’aide de plusieurs variables.
nombre de traductions nombre de traductions
dominance de la traduction dominance de la traduction
écart sémantique entre les traductions écart sémantique entre les traductions
(1 ou 2)
(dominante ou non-dominante)
(élevé ou faible)
Modèle distribué de la mémoire Modèle distribué de la mémoire bilinguebilingue
(De Groot, 1992) (De Groot, 1992)
Une traduction
ARBRE TREE
Plusieurs traductions
FEMME WOMAN WIFEdominant non-dominant
Le recouvrement sémantique dépend du nombre de traductions d’un mot
Extension du modèle distribuéExtension du modèle distribué de la mémoire bilingue de la mémoire bilingue
(Lavaur & Laxen, 2008)(Lavaur & Laxen, 2008)
Sens proches
BATEAU BOAT SHIP dominant non-
dominant
Sens différents
TEMPS TIME WEATHER
dominant non-dominant
Le recouvrement sémantique dépend des écarts de sens entre les deux traductions du mot
IRSIRS
Comme l’IPO, Comme l’IPO, l’IRSl’IRS (Indice de Recouvrement (Indice de Recouvrement Sémantique)Sémantique) peut prendre des valeurs peut prendre des valeurs variant de 0 à 1. variant de 0 à 1.
lune lune moonmoon fille fille girlgirl fille fille daughterdaughter arbre arbre woodwood carotte carotte airplaneairplane
1
0,75
0,5
0,25
0IRS
Reconnaissance en Reconnaissance en traduction traduction
L’IRS peut être affiné avec des données L’IRS peut être affiné avec des données expérimentales (reconnaissance en expérimentales (reconnaissance en traduction). traduction).
ouinon
WOOD
**SHIPBATEAU
*BOAT
BATEAU
*ARBRESKIRTLAPIN
Résultats expérimentauxRésultats expérimentauxLaxen & Lavaur (soumis)Laxen & Lavaur (soumis)
450
500
550
600
650
700
L1L2 L2L1
Une traductionTraduction dominanteTraduction non dominante
Temps de réaction (Ms) dans les deux Temps de réaction (Ms) dans les deux sens de traduction (L1L2, L2L1)sens de traduction (L1L2, L2L1)
Indice Global de ProximitéIndice Global de Proximité
Il prend en compte l’orthographe (IPO) et la Il prend en compte l’orthographe (IPO) et la sémantique (IRS).sémantique (IRS).
Animal/AnimalLune/
Moon
Lapin/Skirt
Main/Main
Autres dimensionsAutres dimensions
Les autres dimensions Les autres dimensions ((phonologique et phonologique et morphologiquemorphologique) ) seront graduellement seront graduellement insérées à l’aide d’indices de même type insérées à l’aide d’indices de même type (recouvrement entre équivalents)(recouvrement entre équivalents)
Aparicio, Laxen, Bairstow et Lavaur (en préparation)Aparicio, Laxen, Bairstow et Lavaur (en préparation)
La dimension phonologique peut modifier considérablement les relations entre les mots.
Système phonologique différent selon les langues (TABLE/TABLE ; PUR/PURO)
*FALDA
Espagnol
*SKIRT
Anglais
Décisions lexicales, décisions de langues, EEG, reconnaissance en traduction (données chronométriques et électrophysiologiques).
Applications
MANNERMANERA**
PerspectivesPerspectives
Introduction d’une 4ème langue (Langues Introduction d’une 4ème langue (Langues proches 2 à 2 –français et espagnol; proches 2 à 2 –français et espagnol; anglais et allemand)anglais et allemand)
Anglais
Merci pour votre attention!Merci pour votre attention!
Thank you for your Thank you for your attention!attention!
¡Gracias por su atencíon!¡Gracias por su atencíon!