comment optimiser laide à la rédaction? s. verlinde ku leuven - ilt
TRANSCRIPT
Comment optimiser l’aide à la rédaction?
S. VerlindeKU Leuven - ILT
enseigne- ment
temps
résultat
archivage
dicos grammaires
temps
résultat
apprentis- sage
Aide à la rédaction?
1 objectif – 2 composantes
o aide lors de la production du texte > predictive writing aid
o aide lors de la révision du texte > corrective writing aid(Ziyuan 2012)
3 langues – 1 site
o utilisabilité/ergonomie: efficacité, efficience et satisfaction
Démo: ‘predictive writing aid’
Démo: ‘corrective writing aid’
Traitement des données
Analyse: suites de caractères
… bien …
Mais aussi: avions, entreprises, …
Analyse: motifs
… Ver + Nom …
Ver + Det + Nom
Ver + Det + Adj + NomVer + Adv + Det + NomVer + Adv + Det + Adj + NomVer + Adv + Det + Adv + Adj + Nom…Nom + Ver
Analyse: parseur?
Selon un article ce qu'est publiée il y a quelques semaines, 66pour cent des étudiants travaille comme Jobiste pendant l'été.
http://alpage.inria.fr/parserdemo
http://beta.visl.sdu.dk/visl/fr/parsing/automatic/trees.php
http://www.latl.unige.ch/
Analyse: parseur?
Analyse: parseur? > Antidote 8
Analyse: analyse syntaxique de surface?
Ou analyse syntaxique superficielleshallow parsing
identification des constituants d’une phrase(groupes nominaux, verbe)
sans structure internefonctions dans la phrase
Enrichissement: ressources
• Ressources TAL: Lefff, Dela
• Résultats d’analyses de corpus: Google n-gram
92815 dictionnaire dictionnaire Nom:Mas+SG
Enrichissement: ressources
• Ressources lexicographiques
ex. verbes support
Enrichissement: ressources
• enseignement
Correcteur orthographique (nl.)
Comment s’y prendre?
• Ressources TAL/lexicographiques: listes de formes (768385)
• Données diverses: listes d’entités nommées, de sigles, …
• Listes d’erreurs fréquentes (enseignement)
• Règles d’orthographeex. régulier: peer > peren + sap > perensap
paardenbloem, depuis le 15.10.2005, auparavant: paardebloem
unique: maan > *manen + schijn > maneschijn
• ‘Règles’ de composition de mots (analyse de corpus)ex. apparaat + nom > 2: apparaatsnoer, apparaatskosten
nom + apparaat > +370 mots composésdefensie + nom > +110 mots composésnom + defensie > 1: milieudefensieaanbieding + nom > 0
• Préfixes et suffixes + leur longueur
• Néologismes: ‘mesttsunami’
Performances? Cf. Word
Correction d’erreurs lexicales: combinaisons de mots (fr.)
Comment s’y prendre?
• Détection d’erreurs
• Correction des erreurs
Espagne (Wanner, A. Ramos) Belgique
synonymestraductions1) mesure d’affinité2) mesure de contexte lexical3) mesure de paramètres contextuels
fonctions lexicales Mel’čuk
1) fréquence2) mesure d’association3) fréquence *
mesure d’association
Fonctions lexicales: verbes support
Fonctions lexicales
Démarche
inventaire verbes support (collocatifs - 233) + noms (bases - 673)
T. FontenelleDafles
Analyse de corpus 673 bases * 233 collocatifs: fréquence + mesure d’association
Analyse linguistiquestructure prédicative des 673 basesidentification de la fonction lexicale
Programmation PHP Intégration des données
La touche finale…
Informations contextuelles
Google n-gram
Programmation PHP appariementbases + collocatifsinformations contextuelles
Programmation PHP Interface utilisateur
Et le résultat?
Références bibliographiques
• Ferraro, G. - Nazar, R. - Wanner, L. (2011). Collocations: A Challenge in Computer-Assisted Language Learning.http://olst.ling.umontreal.ca/pdf/proceedingsMTT2011.pdf
• Heift, T. – Schulze, M. (2007). Errors and intelligence in computer-assisted language learning. Parsers and pedagogues. New York: Routledge.
• Leacock, C. - Chodorow, M. - Gamon, M. - Tetreault, J. (2010). Automated grammatical error detection for language learners. San Rafael : Morgan & Claypool.
• Verlinde, S. – Peeters, G. (2012). Data access revisited: The Interactive Language Toolbox. In S. Granger – M. Paquot (éds). Electronic Lexicography. Oxford: Oxford University Press.
• Wanner, L. – Alonso Ramos, M. – e.a. (2011). Annotation of collocations in a learner corpus for building a learning environment. http://www.dicesp.com/app/webroot/files/file/LCR2011_proceedings_wanner_leo_1_.pdf
http://ilt.kuleuven.be/inlato