phraséologie et littérature : recherche documentaire ciblée sur internet

30

Upload: murcia

Post on 18-Nov-2023

0 views

Category:

Documents


0 download

TRANSCRIPT

Proximités « Didactique »Collection dirigée par Luc Collès

Adresser les commandes à votre libraire ou directement à :

Pour la Belgique :

E.M.E. & InterCommunications s.p.r.l.40, rue de HanretBE - 5380 FernelmontTél. : 00[32]81.83 42 63 et 00[32]473.93 46 57Fax : 00[32]81.83 52 63Courriel : [email protected] : www.intercommunications.be

Pour la France et la Suisse :

C.E.I. Collectif des Editeurs Indépendants37 rue de Moscou F - 75008 ParisTél : 01 45 41 14 38 Fax : 01 45 41 16 [email protected]

© E M E & InterCommunications, sprl, 2014, (B) - 1040 - Bruxelles - 5380 - Fernelmont.

Mª Isabel GONZÁLEZ REY (dir.)

OUTILS ET MÉTHODES D’APPRENTISSAGE

EN PHRASÉODIDACTIQUE

E M E

97

Phraséologie et littérature : recherche documentaire ciblée sur internet1

Mª Ángeles SOLANO RODRÍGUEZ Universidad de Murcia (Espagne)

Résumé : La compilation d'extraits d'œuvres littéraires pour l’élaboration d'un corpus parallèle bilingue était auparavant une tâche d'ampleur colossale, en particulier à l’heure de trouver les traductions correspondantes dans la langue cible. Or, actuellement, grâce à l'accessibilité généralisée à la plateforme de collaboration massive qu’est le web 2.0, c'est une tâche abordable. Comment trouver rapidement ce dont on a besoin, sans se perdre dans les méandres du web ? Les sites où chercher sont variés et abondants, bien que leur contenu ne soit pas toujours fiable. Dans ce travail, nous présentons ceux que nous avez repérés comme ayant été particulièrement utiles dans notre processus de recherche, ainsi que les moteurs de recherche les plus performants pour localiser le plus rapidement possible ce qui nous intéresse, et seulement ce qui nous intéresse.

Mots-clés : Linguistique de corpus, Phraséodidactique, Bibliothèques numériques, Livres numériques, Moteurs de recherche.

Abstract : The compilation of literary fragments for the development of a bilingual parallel corpus was previously a task of colossal magnitude, especially to find the corresponding translations in the target language. Currently, however, with accessibility to the mass collaboration web 2.0, it is an affordable task. How can a researcher quickly find what he need, without getting lost in the network? Sites to look into are diverse and abundant, although their content is not always reliable. In this work, we present sites having been particularly useful in our research process, and the more 1 Travail effectué dans le cadre du Projet de Recherche « Adquisición de la competencia idiomática y discursiva del francés lengua extranjera en contexto español : Elaboración de un corpus textual bilingüe con fines didác- ticos », ref. FFI2010-15092, financé par le Ministerio de Economía y Competi- tividad (Espagne).

98

Mª Ángeles Solano Rodríguez

efficient search engines to locate as quickly as possible what interests us, and only what interests us.

Keywords : Corpus Linguistics, Phraseodidactics, Virtual Libraries, E-Books, Search Engines.

Introduction

Les unités phraséologiques (UP) se trouvent dans toutes sortes de discours, explicatifs, descriptifs, argumentatifs et narratifs, qu’ils soient littéraires ou non. Lorsqu’en classe nous réalisons un exercice de prise de conscience phraséologique, les étudiants sont toujours surpris par leur abondance. Depuis le rejet de la méthode traditionnelle, l'utilisation de textes littéraires dans les classes de langue étrangère (LE) subit un va-et-vient dans sa considération de support approprié pour les apprentissages (voir Riquois, 2010 : 13-29). Et pourtant, la littérature et les approches pédagogiques visant la communication et l’interaction orale ne sont pas inconciliables, et l’approche actionnelle préconisée par le Cadre Européen Commun de Référence pour les Langues (CECR : 47) conseille l'utilisation de textes littéraires, non seulement en tant que ressources esthétiques, intellectuelles, affectives et culturelles, aptes à transmettre le patrimoine culturel européen, mais aussi comme support pour modeler les aspects linguistiques de la langue. Ainsi, la littérature récupère-t-elle peu à peu sa place dans les salles de classe, les enseignants ayant compris que les textes littéraires sont des documents authentiques – dans le sens que les approches communi- catives ont donné à ce terme – et qu’ils véhiculent la langue cible et sa culture, d'une manière intégrée.

Littérature, corpus et phraséodidactique

Par conséquent, nous pouvons dire que les ressources littéraires sont aptes pour développer de multiples compétences et que leurs possibilités didactiques sont nombreuses (Jesús Muros, 1998 : 3-12; Branka Kalenic, 2002 : 490), permettant, par exemple, de sensibiliser à la composante phraséologique des langues, et d’apprendre les

99

Phraséologie et littérature : recherche documentaire ciblée sur internet

unités phraséologiques de la langue cible dans des contextes réels d'utilisation. La seule exigence est que les textes soient choisis en fonction du niveau de la classe et de ses intérêts, ce qui n'est pas un problème car l'offre est très variée, nous n’avons que l’embarras du choix parmi une variété de genres, du conte aux poèmes. L’essentiel est que les textes présentent un discours actuel, non désuet, il est donc nécessaire d’avoir recours aux auteurs contemporains, et de sélectionner des fragments appropriés pour travailler en classe. Quant à la controverse adaptation vs authenticité, il faut évaluer le risque d'augmenter la difficulté de compréhension – voulant faire le contraire – lors de la manipulation des textes pour les adapter au niveau des apprenants, de peur de supprimer avec les indices textuels des pistes de lecture (Margarita Leoz Munilla, 2007 : 40-43). Avant de simplifier un texte littéraire il convient de se demander si le jeu en vaut vraiment la chandelle, car le résultat pourrait être contre-productif (voir Carmen Guillén, Ana Isabel Alario et Paloma Castro, 1994 : 96-97), outre une perte de temps.

Certes, les heures de cours laissent peu d’espace à l’enseignant pour la préparation de documents complémentaires ou substitutifs du manuel. Ceci, et aussi leur insuffisante – voire inexistante – formation en matière de phraséodidactique pourrait expliquer pourquoi il est rare que la composante phraséologique des discours soit bien abordée dans les cours de LE (voir Noelia García Rodríguez, 2010, et Amandine Guesdon, 2012). En effet, bien que les phraséologismes parsèment tous les textes et les discours des classes de LE, et même si les enseignants sont conscients de la nécessité d'enseigner non seulement le lexique simple, mais aussi les expressions, locutions et collocations de la langue cible, et font preuve d’un intérêt particulier envers la composante phraséologique de la langue qu'ils enseignent, ils ne sont pas toujours en mesure de savoir quels phraséologismes sont les plus courants et habituels dans le vocabulaire d'un locuteur natif. Comment, alors s’assurer que les textes relevés sont une source valable d’input phraséologique approprié pour la classe, quant à quantité et à qualité ?

100

Mª Ángeles Solano Rodríguez

Un corpus peut être pour un enseignant l'outil parfait pour s'assurer que ses apprenants reçoivent l’input nécessaire et adéquat dans des contextes variés, lui permettant de leur faire voir les diverses situations d’utilisation, les restrictions combinatoires, et les caractéristiques pragmatiques du vocabulaire, de mieux comprendre les phénomènes collocatifs et la relation entre le sens, le contexte et le co-texte, par le biais d’une approche réflexive et inductive à l’apprentissage.

Qu'est-ce qu’un corpus ?

John Sinclair (2004), pionnier dans le domaine des corpus pour l'enseignement des langues secondes, dit qu’un corpus est un ensemble de textes en format électronique, sélectionnés selon des critères externes afin de représenter, dans la mesure du possible, une langue ou variété de langue en tant que source de données pour la recherche linguistique, les critères externes correspondant à la fonction communicative des textes, et les critères internes étant en relation avec la nature même du langage. Un corpus, par conséquent, doit être représentatif (Gloria Corpas, 2001), une condition directement liée à la quantité et la qualité (John Sinclair, 1991), et obéir à un usage particulier (James L. McCullough, 2001). En matière d’enseignement des langues étrangères (LE) et des UP, pour l’enseignant la finalité du corpus est de pallier les limitations du manuel, de lui permettre de savoir quels sont les phraséologismes les plus fréquents, de compléter son propre idiolecte et, envers l'apprenant, d’observer les UP de la LE en contexte, afin de bien les comprendre et acquérir de manière significative.

Non obstant, tous les corpus ne mettent pas bien en évidence le vocabulaire phraséologique. En effet, dans les listes de fréquence correspondantes parmi les unités lexicales on ne trouve pas souvent des UP. María del Carmen Izquierdo Gil (2001 : 206), par exemple, a relevé que dans certaines listes de fréquence de l’espagnol on ne trouve que des unités monoverbales, ce qui indiquerait que ces listes de fréquence sont fondées sur une définition orthographique et non

101

Phraséologie et littérature : recherche documentaire ciblée sur internet

sémantique du terme unité lexicale. Ce fait, qui n'est pas isolé, met en relief une omission et une dissimulation de l'existence des unités pluri-verbales dont la présence dans toutes les langues est considérable et dont la connaissance est indispensable pour développer la compétence socio-communicative et lexico-discursive en LE (Michael McCarthy, 1990 : 67 ; Ronald Carter, 1996 : 176 ; John Sinclair, 1991 ; Dave Willis, 1999). Cela justifie pleinement la nécessité de continuer à développer et à mettre à jour les corpus visant spécifiquement à souligner la composante phraséologique des langues.

Chercher et trouver sur Internet

Tout processus de recherche et, par conséquent, comme nous l'avons vu, tout développement d’un corpus doit répondre à une finalité, et cette finalité détermine le type de documents qui doivent être réunis. Si notre objectif est de développer un outil pour aider à l'acquisition des UP du français à des adolescents et adultes espagnols, ainsi que des aspects socioculturels, le premier pas est de chercher et de réunir des textes littéraires contemporains contenant un nombre suffisamment représentatif de phraséologismes, afin de mettre en place un corpus parallèle bilingue (français-espagnol et espagnol-français) permettant d’extraire des UP dans divers con- textes d'utilisation, et leurs correspondances dans la langue cible.

Il se fait alors que l'objet de la recherche est double. D’une part, il nous faut des textes littéraires du XXIème siècle ou de la seconde moitié du XXe siècle, lesquels, afin de correspondre aux critères de représentativité, quantité et qualité, et de correspondre aux besoins pédagogiques des destinataires, devraient couvrir les différents niveaux de compétence marqués par le CECR, du A1 au C2. Cela implique une notion de texte littéraire au sens large, y compris les chansons et les bandes dessinées. D’autre part, il est également nécessaire de trouver la traduction de ces textes, en espagnol ou en français selon le cas, ce qui est peut-être le processus le moins commode, et pour lequel Internet peut nous aider.

102

Mª Ángeles Solano Rodríguez

La première étape consiste à concevoir un plan d’action. Pour chacun des corpus parallèle à développer il faut : a) trouver et sélectionner des textes littéraires originaux, b) s'assurer que leur édition en langue cible existe, c) sélectionner des fragments contenant un nombre suffisant d'UP, d) trouver les fragments retenus en langue source dans les textes en langue cible.

Pour le point de départ (les textes littéraires dans leur version originale) le plus simple est probablement d’avoir recours aux éditions en papier de nos collections privées et des bibliothèques universitaires. Mais il y a aussi les éditions électroniques, quelle que soit leur origine : des éditions en papier numérisées, ou bien des textes nativement numériques. Quoi qu’il en soit, cette première phase ne présente habituellement aucun problème, puisque dans tous les cas, nous avons l’assurance de pouvoir réunir suffisamment de fragments appropriés contenant un bon nombre d’UP. Le défi est de repérer l’édition dans la langue cible ; deux possibilités se posent : a) nous la repérons dans une des bibliothèques de notre entourage ou de celui de nos collaborateurs, b) nous ne la trouvons pas. Il nous reviendrait alors d’avoir recours au service de prêt entre bibliothèques, mais ce processus prend assez de temps et, aujourd'hui, nous avons d'autres possibilités grâce à Internet.

Toutefois, chercher des documents sur Internet et arriver à bon port n'est vraiment pas si simple, et la difficulté est exacerbée lorsque ce que nous cherchons est d’ordre littéraire. Cela est dû à l'énorme quantité d'informations et de documents disponibles sur le Web, une bibliothèque si vaste et diversifié, avec tant d'options et de détours, qu’il est facile de s’y perdre et d’abandonner la recherche sans rien trouver de valable. Ainsi, parmi tant de documents et si divers, il faut savoir séparer le bon grain de l'ivraie, et discerner les sites qui sont fiables de ceux qui ne le sont pas (voir Ania Torres Pombert, 2003 ; Mª Ángeles Martínez García, 2004).

103

Phraséologie et littérature : recherche documentaire ciblée sur internet

Les bibliothèques numériques

Dans le Web, outre les sites de presque toutes les bibliothèques traditionnelles, se trouvent également de nombreuses bibliothèques numériques. Dans les catalogues de ces organismes nous pouvons repérer toute sorte de références, mais aussi accéder directement à certains livres numériques. Les avantages par rapport aux biblio- thèques traditionnelles sont, d’après les propos de Mª Ángeles Martínez García (2004 : 9-10), l’efficacité et la précision dans la recherche et la récupération des matériaux [et] un haut degré d'accessibilité, principalement en raison de l'absence d’horaires et de frontières. Ce qui est intéressant ce sont leurs fonds numérisés et numériques. Cependant, ce patrimoine est composé, pour l'essentiel, d’œuvres anciennes dont les droits d’auteur ont expiré et qui par conséquent sont désormais du domaine public; nous faisons donc référence à d’intéressants incunables et manuscrits, ainsi que des classiques de la littérature mondiale comme par exemple le magnifique Don Quichotte interactif2 de la Bibliothèque nationale d'Espagne (BNE)3, mais non aux textes littéraires contemporains.

Dans le monde hispanique, en effet, la BNE et la Bibliothèque virtuelle Miguel de Cervantes4 sont les deux principales références ; la seconde se distingue par une classification générale en grands domaines à l'intérieur desquels on peut préciser des sous-domaines – genre, auteur, etc. – qui permet de trouver plus facilement ce que l’on cherche, du général au particulier. Une autre référence intéressante est la Bibliothèque Virtuelle Universelle5, gérée par l'Association Argentine des Bibliothèques Rurales, dont le fonds est intégré par certaines œuvres littéraires que l’on peut télécharger en format PDF.

2 http://quijote.bne.es/libro.html. 3 http://www.bne.es/. 4 http://www.cervantesvirtual.com/. 5 http://www.biblioteca.org.ar/.

104

Mª Ángeles Solano Rodríguez

Parmi les bibliothèques numériques francophones, la première référence est la collection numérique Gallica6 appartenant à la Bibliothèque Nationale de France (BNF), qui contient des manuscrits et des documents divers numérisés, facilement repérables par un système de recherche pouvant être défini par de différents critères : le type, l’auteur, la langue, l'origine, le thème et la date (jusqu'au XIXe siècle). Le fonds Gallica est une option intéressante pour ce qui nous intéresse, car il contient aussi des textes plus modernes dont on peut voir quelques pages et avec l'option, sur paiement, de télécharger le texte intégral. Finalement, nous retenons trois bonnes bibliothèques numériques qui ne contiennent, non obstant, que des ouvrages du domaine public, donc anciens. Ce sont les suivantes : ABU7, de l’Association des Bibliophiles Universels, contenant des textes intégraux en accès libre depuis 1993 ; Athéna8, de l'Université de Genève, qui possède également une grande collection de textes complets ; et aussi la Bibliothèque Électronique de Lisieux9, dont le fonds est composé surtout d’auteurs et de textes du XIXe siècle.

En dehors des contextes hispanique et francophone, il convient de souligner l’existence de la Bibliothèque Numérique Mondiale10, qui contient d'innombrables documents représentatifs du patrimoine mondial, auxquels on accède en cliquant sur une carte du monde interactive, et de la Bibliothèque Numérique Européenne (Euro- peana)11, qui réunit les ressources numériques multimédia des bibliothèques nationales, archives et musées de toute l'Europe.

En dépit de l’indéniable importance des fonds dont nous avons fait mention, étant donné que les lois européennes actuelles établissent une durée de protection qui comprend la vie de

6 http://gallica.bnf.fr. 7 http://abu.cnam.fr/. 8 http://athena.unige.ch/athena/. 9 http://www.bmlisieux.com/. 10 http://www.wdl.org/es/. 11 http://www.europeana.eu/portal/.

105

Phraséologie et littérature : recherche documentaire ciblée sur internet

l'auteur et 70 ans après sa mort12, il n'est pas facile d’y trouver des œuvres d’auteurs contemporains à libre accès au format numérique, à moins que les auteurs n’aient décidé de les mettre à la disposition des lecteurs sur leur site Web ou sur celui d’une bibliothèque numérique. Ainsi, bien que les collections des bibliothèques numériques soient vraiment intéressantes – comme nous l'avons vu – les textes littéraires numérisés plus modernes que l’on peut y trouver datent des deux premières décennies du XXe siècle, à de rares exceptions près.

Livres numériques et maisons d’édition numérique

Avec les bibliothèques numériques, sur Internet se trouvent également les maisons d’édition numériques, parmi lesquelles il faut citer la plus ancienne et consolidée, le Projet Gutenberg13, à l'origine de la première publication sous format électronique, en Juillet 1971 à l'Université de l'Illinois. Son créateur, Michael Hart, alors étudiant, eut l’idée de partager avec ses camarades de cours la Déclaration d'Indépendance américaine à l’aide de l’ordinateur ; il avait créé le premier livre électronique, auquel suivirent quelques œuvres littéraires classiques. Son idée prospéra et en 1994 le Projet Gutenberg fête son centième livre avec la mise en ligne de The Complete Works of William Shakespeare, prenant un nouvel élan à l'échelle mondiale, qui se maintient aujourd'hui, près de vingt ans après cet anniversaire et plus de quarante après ses débuts (voir Marie Lebert, 2009 : 5-11). Depuis 2012, le Projet Gutenberg dispose d'un nouveau service pour les auteurs contemporains voulant partager leur travail avec les lecteurs14, dans le but d’encourager la création et la diffusion de livres numériques.

12 En Espagne, les droits d’auteur se prolongent 80 ans pour ceux ayant décédé avant le 7 décembre 1987. 13 http://www.gutenberg.org/. 14 http://self.gutenberg.org/.

106

Mª Ángeles Solano Rodríguez

Depuis plus d’une décennie, quelques nouvelles publications – de plus en plus – sont disponibles en format numérique15, et aujourd'hui c'est le cas pour la plupart d'entre elles : sur Internet se trouve un certain nombre de maisons d’édition numériques dont les livres peuvent être téléchargés sous différents formats, gratuitement pour quelques uns et moyennant paiement pour la plupart. Parmi ces maisons d’édition numériques, nous retenons l’espagnole Libros en Red16, qui donne un bon service et dont la particularité est de mettre chaque mois une sélection différente de livres à télécharger gratuitement en format PDF.

En quête de chercheurs

Parfois, il n’y a pas un besoin immédiat de trouver le texte littéraire dans son intégralité, mais un fragment, la traduction de celui que nous avons auparavant sélectionné dans le texte source. Avec quelques points de repère (un nom propre, une date, un mot dont la traduction est sûre ...) il est relativement facile d’explorer le Web et, avec un peu de chance, de trouver ce que nous cherchons sur les portails de magazines, suppléments culturels, sites littéraires, wikis et blogs personnels. Le principal problème, en particulier dans les deux derniers cas, repose sur la fiabilité des sources, parce que s’il est vrai que les sites personnels peuvent appartenir à des spécialistes qualifiés ou à des personnes responsables ayant reproduit quelque fragment, avec une rigoureuse fidélité au texte original, ce n’est pas toujours le cas. Cependant, ces sites peuvent être très utiles au départ pour évaluer les correspondances phraséologiques de la traduction et aussi pour avoir la référence éditoriale de l'œuvre traduite.

15 En 2001, Stephen King publia exclusivement sur Internet son roman Riding the Bullet (maison d’édition Simon & Schuster). En deux jours, un demi-million d'exemplaires numériques étaient vendus, attirant de telle sorte l'attention sur une nouvelle façon de diffuser la littérature. 16 http://www.librosenred.com/.

107

Phraséologie et littérature : recherche documentaire ciblée sur internet

Quoi qu'il en soit, quand on n'a pas pu trouver ce que nous cherchons dans les bibliothèques, maisons d’édition ou bibliothèques numériques, il est temps de se tourner vers un moteur de recherche ou instrument de recherche, c'est à dire un site basé sur un robot d’indexation, qui explore et indexe automatiquement le Web pour collecter les ressources sur la base des mots-clés que nous lui donnons. Il existe de nombreux moteurs de recherche, mais tous ne suivent pas les mêmes critères. Par conséquent, en fonction de ce que nous cherchons, certains peuvent nous être plus utiles que d’autres. Parallèlement aux moteurs de recherche, il y a aussi les méta-moteurs, à savoir, des outils de recherche qui interrogent non leur propre base de données, mais celles de plusieurs moteurs de recherche à la fois, puis nous donnent une synthèse pertinente. Au premier abord, un méta-moteur peut nous sembler la solution la plus simple : il suffirait de poser la question une fois (les mots-clés) pour obtenir sans nul doute ce que nous voulons (Tracey Stanley, 1998, cité par Ania Torres Pombert, 2003 : 4-5), à condition bien sûr que l’objet de notre recherche se trouve dans la partie visible et indexée du Web et non dans le Web profond (voir Béatrice Foenix-Riou, 2011). Toutefois, les méta-moteurs ne sont pas aussi efficaces que prévu, car ils n’affichent pas tous les résultats correspondant à notre demande, parmi tous les moteurs de recherche interrogés, mais seulement entre 10 et 100 résultats de chacun d’eux (Ania Torres Pombert, op. cit.). Finalement, nous avons aussi les moteurs de recherche sémantiques, ou moteurs de recherche intelligents, qui seraient capables de penser comme des humains, et que nous sommes donc censés pouvoir interroger directement par des phrases et non des mots-clés. Dans un avenir proche, une fois consolidé le Web 3.0 ou Web sémantique (Brigitte Cord-Maunoury, 2011 : 55), cette forme de recherche sera probablement très effective, mais aujourd'hui ce n’est encore qu’une potentialité, exception faite de Cluuz – comme nous allons voir par la suite – les moteurs de recherche sémantiques ont un long chemin à parcourir avant d'être aussi efficaces qu’ils ne l’annoncent.

108

Mª Ángeles Solano Rodríguez

Afin de pouvoir tirer nos propres conclusions, quant aux moteur de recherche les plus efficaces à l’heure de trouver des textes littéraires ou des fragments de textes littéraires sous forme électronique, nous avons effectué une recherche systématique sur Internet en utilisant les mêmes mots-clés, dans le même ordre : le titre d’un ouvrage littéraire français en langue cible (l’espagnol), suivi du nom de l'auteur, suivi du titre d'un chapitre en langue cible (en l’occurrence : ejercicios de estilo, queneau, torpe). Nous avons consulté six moteurs de recherche (Ask17, Altavista18, Bing19, Excite20, Google21, Yahoo22), trois méta-moteurs (Copernic23, Dogpile24 y Metacrawler25) et quatre moteurs de recherche sémantiques (Cluuz26, Kartoo27, Quintura28 y Wolfram29).

Voici les résultats pour les moteurs de recherche : Ask. Ce que nous cherchons n'est pas parmi les dix premières

pages de résultats (une centaine de références), et nous cessons de les examiner, puisqu’on ne nous dit pas combien de références ont été trouvées.

17 http://es.ask.com/. 18 http://www.altavista.com/. 19 http://www.bing.com/. 20 http://msxml.excite.com/. 21 https://www.google.es/. 22 http://es.yahoo.com/. 23 Le méta-moteur Copernic (http://www.copernico.com, http://www. copernic.com/fr/) est un logiciel, à télécharger et installer sur l’ordinateur, dont les résultats peuvent être classés selon différents critères, et qui a recours à 65 moteurs de recherche à la fois. 24 http://www.dogpile.com/. 25 http://www.metacrawler.com/. 26 http://www.cluuz.com/. 27 http://www.kartoo.com/. 28 http://www.quintura.com/. 29 http://www.wolframalpha.com/.

109

Phraséologie et littérature : recherche documentaire ciblée sur internet

Altavista. Ne dit pas combien de références ont été trouvées, mais a repéré ce que nous cherchons, correspondant à ses références trois, cinq et six.

Bing. 325 000 résultats, dont le premier et le cinquième correspondent à ce que nous cherchons.

Excite. Ne dit pas combien de références ont été trouvées, mais a repéré ce que nous cherchons, en deuxième et sixième lieu.

Google. 4 730 résultats, dont les deux premiers correspondent à la référence que nous voulons, avec la particularité que non seulement le livre numérique est repéré mais aussi le fragment exact que l’on y cherche.

Yahoo. N’annonce pas combien de références sont trouvées, mais repère ce que nous cherchons, qui correspond à son premier et cinquième résultat.

Pour les méta-chercheurs, les résultats sont les suivants : Copernic. Donne quatre résultats valables correspondant à ses

références numéro deux, cinq, quinze et dix-sept : la deuxième, repérée par Yahoo, Bing et Ask ; la cinquième trouvée par Altavista, Fast Search et Ask ; la quinzième, repérée par Altavista et Fast Search ; et la dix-septième trouvée par Yahoo. Les références deux et quinze, et cinq et dix-sept renvoient respectivement au même résultat.

Dogpile. Montre deux résultats valables : en deuxième position, repéré par Google, et en huitième lieu, trouvé par Yahoo.

Metacrawler. Propose deux résultats valables : en deuxième position, repéré par Google, et en troisième lieu, trouvé par Yahoo.

Et finalement, voici les résultats obtenus par les moteurs de recherche sémantiques :

Cluuz. Repère ce qui nous intéresse sur deux références appropriées : la troisième et la cinquième. Puis, nous écrivons directement la question au lieu d’insérer les mots-clés (¿dónde

110

Mª Ángeles Solano Rodríguez

encontrar torpe, de ejercicios de estilo, de queneau?) ; les résultats pertinents sont alors les deux premiers, conformément à ce qu’on est en mesure d’attendre d'un moteur de recherche dit intelligent.

Kartoo. Ne nous donne aucun résultat, ni par les mots-clés ni posant la question.

Quintura. La dixième référence est le seul résultat valable dans la première page. Puis, interrogé par la question, le chercheur nous propose en premier lieu un site Web où il faut être enregistré pour télécharger sous format pdf le livre qui, apparemment, correspondrait à notre quête. Aucun autre accès plus rapide au document n’est trouvé, au moins parmi les dix premières références.

Wolfram. Ne sait pas comment interpréter nos mots-clés, ni la question directe : comprend uniquement l'anglais.

De cette expérience, nous pouvons tirer quelques conclusions: avant tout, nous sommes surpris de voir que dans tous les cas, les résultats pertinents, c'est à dire ceux qui renvoient au fragment que nous cherchons, dans son livre en format numérique, et pouvant être examiné directement en ligne, correspondent au même site : Scribd30, une référence intéressante pour des consultations sur des textes non protégés par le droit d'auteur.

Sur les cinq moteurs de recherche, quatre ont donné les résultats escomptés, les références étant correctement et clairement disposées entre les toute premières ; il s’agit des suivants, en ordre d’efficacité décroissante : Google, Bing, Yahoo, Excite et Altavista. Par la suite, nous avons voulu comparer Google avec son moteur de recherche spécialisé Google Livres, nous avons fait la même recherche pour les deux, avec les mots-clés exercices de style queneau ; le résultat a été le contraire de ce que nous attendions : Google nous a donné 19 300 résultats, le second correspondant au texte en question en format

30 http://es.scribd.com/, un portail qui s’auto-définit comme la plus grande bibliothèque en ligne du monde.

111

Phraséologie et littérature : recherche documentaire ciblée sur internet

numérique, tandis que Google Livres a identifié la référence, nous renvoyant aux sites Web de librairies traditionnelles, mais n'a pas repéré le livre en format numérique. Poussés par la curiosité, nous avons réalisé d’autres recherches parallèles du même ordre, et le résultat a toujours été le même.

Les trois méta-moteurs ont repéré les deux références les plus intéressantes pour nous, mais aucune en premier lieu. Les résultats de Copernic, comparativement avec ceux obtenus par les moteurs de recherche, sont étonnants si l'on considère que le recours direct à Ask ne nous a pas donné de résultat satisfaisant, alors que par le biais de Copernic si. Nous pouvons en déduire que Ask ne classe pas bien ses résultats et que, donc, en tant que moteur de recherche ce n’est pas une option intéressante, au moins dans le type de recherche que nous avons réalisée. Il est également frappant de constater que Copernic n'a rien trouvé à travers Bing qui, cependant, en consultation directe nous a donné comme première référence la plus appropriée. Nous en déduisons que Bing ne figure pas parmi les moteurs de recherche utilisés par Copernic. En définitive, les méta-moteurs de recherche sont une possibilité, mais ils ne marquent pas vraiment la différence.

Pour ce qui est des moteurs de recherche sémantiques, tous excepté Cluuz ont été décevants. Ce qui est réellement intéressant de ce dernier est que, outre le repérage rapide des résultats attendus, il en extrait les éléments essentiels, intègre les liens entre les différents sites Web, et explique tout cela de forme visuelle sous forme d’un graphe sémantique, avec lequel on peut interagir en cliquant sur chaque lien, ce qui permet d’avoir accès direct à l'information la plus pertinente ou bien de chercher des données additionnelles sur les liens secondaires (voir fig. 1).

112

Mª Ángeles Solano Rodríguez

Figure 1: Cluuz : graphe sémantique de la recherche réalisée

Conclusions

Si nous accordons que les principaux critères de qualité pour les recherches sur Internet sont la pertinence, la précision et la rapidité, les moteurs de recherche Google et Cluuz se sont révélés parmi tous ceux que nous avons testés les deux options les plus avantageuses pour repérer rapidement les textes en format numérique. Cependant, s’il s’agit de perdre le moins de temps possible Google est la meilleure parce que seul ce moteur de recherche a été capable de nous situer directement sur le fragment voulu dans l’ouvrage correspondant, et ceci pour chaque résultat opportun. Quoi qu'il en soit, il convient d'affiner nos recherches en utilisant quelques stratégies connues, comme ne pas nous s’en tenir à un seul mot-clé

113

Phraséologie et littérature : recherche documentaire ciblée sur internet

mais en utiliser plusieurs, avoir recours dans certains cas à des phrases-clés mises entre guillemets, ne pas utiliser les majuscules ni les accents – qui limitent les possibilités – et enfin utiliser les opérateurs booléens31, ou l'option de recherche avancée sur Google.

Mais quand l'objet de nos recherches est une œuvre littéraire, avant de recourir à la prospection aveugle à travers un moteur de recherche – ce qui peut déboucher sur des sites peu fiables – nous pouvons explorer d’abord de bons sites Web tels que ceux de la Biblioteca Virtual Miguel de Cervantes, la collection numérique Gallica de la Bibliothèque nationale de France, ou la Bibliothèque Numérique Mondiale, ainsi que le site du Projet Gutenberg.

En tout état de cause, Internet s'est révélé une aide précieuse pour le développement de corpus, et une source documentaire inesti- mable pour recueillir tout type de documents, en l’occurrence les œuvres littéraires qui sont semées d’exemples de l'usage des phraséologismes dans toutes les langues vivantes et dans tous les registres.

31 Les opérateurs booléens, ou logiques, les plus fréquents et utiles sont and/et, or/ou et not/sauf, que l’on met juste devant le mot ou la phrase à laquelle ils font référence, sans espace, et l’astérisque, que l’on met devant, au milieu ou à la fin du mot clé pour remplacer des lettres manquantes et indiquer la troncature (p.ex., pour trouver toutes les références faisant mention de la phraséologie, les phraséologismes ou les unités phraséologiques il faudrait écrire phraseologi*).

114

Mª Ángeles Solano Rodríguez

Bibliographie

CARTER, R. (1996), Vocabulary. Applied Linguistic Perspectives, London, Routledge.

CONSEIL DE L’EUROPE (2001), Cadre Européen commun de référence pour les langues. Apprendre, enseigner, évaluer. Didier. [http://www.coe.int/T/ DG4/ Portfolio/documents/cadrecommun.pdf, consulté le 02-10-2012]

CORD-MAUNOURY, B. (2011), « Former les enseignants à la didactique de l’Internet », Le français dans le monde 377, 54-55. Paris : FIPF/Clé International.

CORPAS PASTOR, G. (2001), « Compilación de un corpus ad hoc para la enseñanza de la traducción inversa especializada », TRANS : revista de traductología 5, 155-184. [http://www.trans.uma.es/Trans_5/t5_155-184_ GCorpas.pdf, consulté le 01-02-2013]

FOENIX-RIOU, B. (2011), Recherche éveillée sur Internet : mode d'emploi. Outils et méthodes pour explorer le Web : Web visible, Web invisible, Web social, Web temps réel, Paris : Lavoisier/ Cachan: Bases Publications.

GARCIA RODRIGUEZ, N. (2010), Traitement réflexif et systématisé des unités phraséologiques dans une séquence d´enseignement-apprentissage pour l´Enseignement Secondaire (travail final de master inédit), Murcia : Univer- sidad de Murcia.

GUESDON, A. (2012), De la prise de conscience à l’enseignement/apprentissage : la phraséologie en classe de FLE au niveau Bachillerato (travail final de master inédit), Murcia : Universidad de Murcia.

GUILLÉN DÍAZ, C., ALARIO TRIGUEROS, A. I. et CASTRO PRIETO, P. (1994), « Los ‘documentos auténticos’ en la renovación metodológica del área de lengua extranjera », CL&E : Comunicación, Lenguaje y Educación 24, 89-100. [http://dialnet.unirioja.es/servlet/articulo?codigo=2941416, consulté le 16-07-2012].

IZQUIERDO GIL, Mª DEL C. (2002), « Los córpora electrónicos en la enseñanza del vocabulario LE : la utilidad pedagógica de las concordancias », dans Gimeno Sanz, A. (coord.), Tecnologías de la información y de las comunicaciones en la enseñanza de ELE, Valencia : Publicaciones Univ. Politécnica de Valencia.

115

Phraséologie et littérature : recherche documentaire ciblée sur internet

KALENIC RAMŠAK, B. (2002), « El estudio de textos literarios en un aula de estudiantes no nativos », El español, lengua del mestizaje y la intercul- turalidad, actes du XIII Congreso Internacional de la Asociación para la Enseñanza del Español como Lengua Extranjera, ASELE : Murcia, 2-5 octo- bre 2002.

LEBERT, M. (2009), Une courte histoire de l'ebook, Dossiers du NEF, Université de Toronto. [http://www.etudes-francaises.net/dossiers/ebookFR.pdf, con- sulté le 10-09-2012.]

LEOZ MUNILLA, M. (2007), « El texto literario en clase de FLE » dans D. Bonnet, M. J. Chaves et N. Duchêne (coord.) Littérature, langages et arts: rencontres et création, actes du 15ème colloque, 2006, de l’Association de Professeurs de Français de l’Université Espagnole. Universidad de Huelva : 36.

MARTÍNEZ GARCÍA, Mª Á. (2004), « Recursos literarios y bibliotecas virtuales : claves para el navegante », Mundo posible. Literatura y comunicación. Enseñanza 1, 1-29.

MCCARTHY, M. (1999), « What constitutes a basic vocabulary », Studies in English Language and Linguistics 1, 233-249.

MCCULLOUGH, J. L. (2001), « Los usos de los córpora de textos en la enseñanza de lenguas » dans Trenchs Parera, M. (ed.), Nuevas Tecnologías para el autoaprendizaje y la didáctica de lenguas, Lleida : Milenio : 125-140.

MUROS NAVARRO, J. (1998), Los textos literarios como material didáctico en el aula de inglés : estudio experimental sobre el desarrollo de la competencia lingüística y discursiva de los alumnos de magisterio, Universidad de Granada. [http://digibug.ugr.es/handle/10481/14514, thèse consultée le 20-09-2012].

RIQUOIS, E. (2010), Pour une didactique des littératures en français langue étrangère : du roman légitimé au roman policier, Éditions Universitaires Européennes.

SINCLAIR, J. (1991), Corpus, Concordance, Collocation, Oxford : Oxford University Press.

SINCLAIR, J. (2004), How to use corpora in Language Teaching, Amsterdam : John Benjamins Publishing.

TORRES POMBERT, A. (2003), « El uso de los buscadores en Internet », ACIMED 11/3. [http://scielo.sld.cu/scielo. php?script=sci_arttext&pid= S1024-94352003 000300004&lng=es&nrm=iso&tlng=es. Consulté le 05-09-2012].

WILLIS, D. (1999), « Syllabus Design and the Pedagogic Corpus », Vocabulary learning in a foreign language, Paris : Bristish Council, Goethe-Institut et ENS Fontenay/St Cloud : 115-148.

319

Table des matières

PrésentationMª Isabel GONZÁLEZ REY .............................................................5

La phraséodidactique

Le problème de l’emploi actif et / ou de connaissances passives des phrasèmes chez les apprenants de langues étrangères

Stefan ETTINGER ...........................................................................17

La grammaire d’une langue peut-elle être enseignée à partir de ses unités phraséologiques ?

Dominique LEGALLOIS ..................................................................39

Expression figée et cliché de langage : quels statuts, quels effets ?

Jean-Louis DUFAYS .........................................................................59

Outils et méthodes en phraséodidactique des langues et des littératures

Phraséographie : questions théoriques et pratiques Vilmos BÁRDOSI ............................................................................75

Phraséologie et littérature : recherche documentaire ciblée sur internet

Mª Ángeles SOLANO RODRÍGUEZ.............................................97

Compétence phraséologique et Portfolio européen des langues : vivre la diversité linguistique et culturelle dans l’enseignement obligatoire

Eva IÑESTA MENA ......................................................................117

320

En lutte contre l’arbitraire : pistes méthodologiques pour un apprentissage cognititif des expressions idiomatiques en LE

Florence DETRY ...........................................................................133

Collocations transdisciplinaires : réflexion pour l’enseignement

Cristelle CAVALLA ........................................................................151

Pour un apprentissage / acquisition des collocations en Français Discipline Non Linguistique : Une approche méthodologique en phraséodidactique

Claire NICOLAS ............................................................................171

Outils et méthodes en phraséodidactique de la traduction

L’enseignement de la traduction à travers les parémiesJulia SEVILLA MUÑOZ ...............................................................195

Difficultés dans la traduction en français des structures comparatives roumaines

Anda RĂDULESCU ......................................................................215

Défigement dans la poésie française et bélarusse : approche contrastive

Yauheniya YAKUBOVICH ............................................................231

Traduction de l’interjection dans les livrets d’opéra (français-espagnol)

Ascensión SIERRA SORIANO .....................................................251

Une approche traductologique, vers un décryptage phraséologique de textes argotiques parallèles français-espagnol

Fernande RUIZ QUEMOUN........................................................281

Pour une didactique des collocations verbales en français juridique (domaine français-roumain)

Gabriela SCURTU & Daniela DINCA .........................................299

Dans la collection « Proximités – Didactique »

GONZÁLEZ Ma isabel éd., Les expressions figées en didactique des langues étrangères, Las expresiones fijas en la didáctica de las lenguas estranjeras. 2007. ISBN : 978-2-930481-30-2 23,00 € ID EME E1045675.

AUGER Nathalie, Constructions de l’interculturel dans les manuels de langue. 2007. ISBN : 978-2-930481-29-6 25,00 € ID EME E1045674.

GONZÁLEZ Ma isabel éd., Adquisición de las expresiones fijas. Metodología y recursos didácticos. Idioms Acquisition. Methodology and didactic Resources. 2007. ISBN : 978-2-930481-35-7 24,00 € ID EME E1045680.

PARPETTE Chantal et MOCHET Marie-Anne éds, L’oral en représentation(s). Décrire, enseigner, évaluer. 2008. ISBN 978-2-930481-47-0 24,00 € ID EME E1045692.

COLLÈS Luc, DEVELOTTE Christine, GERON Geneviève et TAUZER-SABATELLI Françoise, éds.,Didactique du FLE et de l’interculturel : littérature, biographie langagière et médias, 2008. ISBN 2-930342-85-4. 29,00 € ID EME E1045632.

HAUTE ECOLE BLAISE PASCAL, Catégorie Pédagogique. L’innovation de pratiques pédagogiques. Partage d’expériences européennes. 2008. ISBN : 978-2-930481-58-6 25,00 € ID EME E1045703.

GAUME  Josette, Le don en didactique. Approche épistémologique à partir de l’Essai sur le don de Marcel Mauss, 2008. ISBN 978-2-930481-69-2. 15,00 € ID EME E1045714.

DAGUES Véronique, De quoi avons-nous donc besoin ? De la nécessité d’Emile de Jean-Jacques Rousseau au besoin des apprenants de notre temps. 2009. ISBN : 978-2-930481-99-9 18,00 € ID EME E1045744

COLLES Luc, Islam - Occident. Pour un dialogue interculturel à travers des littératures francophones. 2010. ISBN : 978-2-87525-049-03 24,00 € ID EME E1045804.

LEBRUN Marlène et al., La classe de littérature. 2011. ISBN : 978-2-87525-055-1. 28,00 € ID EME E1045810.

COLLÈS Luc, L’immigration maghrébine dans la littérature française. Anthologie France-Belgique (1953-2010),  2011.  ISBN  :  978-2-8066-0022-6 18,00  € ID EME E1045874

DEFAYS Jean-Marc et al. éd., Plurilinguisme et diversité interculturelle dans les relations internationales. 2011. ISBN : 978-2-87525-096-4 17,00 € ID EME E1045851.

DERVIN Fred, VASUMATHI Badrinathan, L’enseignant non natif : identités et légitimité dans l’enseignement-apprentissage des langues étrangères 2011. ISBN : 978-2-8066-0079-0 24,00 € ID EME E1045889.

RICHER Jean-Jacques, La didactique des langues interrogée par les compétences, 2012. ISBN : 978-2-8066-0339-5 18,00 € ID EME E1045954.

DEBONO Marc et GOÏ Cécile (éds.), Regards interdisciplinaires sur l’épistémologie du divers,2012. ISBN : 978-2-8066-0775-1 24,00 € ID EME E1045968.