le corpus de référence du français contemporain (crfc)

23
Le corpus de référence du français contemporain (CRFC) 1

Upload: shannon-mcleod

Post on 15-Mar-2016

94 views

Category:

Documents


4 download

DESCRIPTION

Le corpus de référence du français contemporain (CRFC). Plan. Point de départ : les corpus existants Présentation du CRFC Études de cas. Point de départ. sérieux retard pris par la France en matière de corpus - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Le corpus de référence du français contemporain (CRFC)

Le corpus de référence du français contemporain (CRFC)

1

Page 2: Le corpus de référence du français contemporain (CRFC)

Plan

1. Point de départ : les corpus existants

2. Présentation du CRFC3. Études de cas

2

Page 3: Le corpus de référence du français contemporain (CRFC)

Point de départ

sérieux retard pris par la France en matière de corpus

Þaucune grammaire des usages effectifs du français dans différents genres

Þmanque de statistiques fiables sur le lexique (etc.)

3

Page 4: Le corpus de référence du français contemporain (CRFC)

Corpus écrits existants Frantext (surtout littéraire) Leipziger corpus français (journaux) Kölner romanistische Korpusdatenbank/Varitext (journaux) Sketchengine: frWaC, FrTenTen (Web) corpus plus spécifiques: Varilex, Emolex, Manulex, etc.

Þ              corpus de taille parfois impressionnante 

Þ                   surreprésentation des genres littéraires et journalistiques  

4

Page 5: Le corpus de référence du français contemporain (CRFC)

Corpus oraux disponibles Traitement de corpus oraux en français (TCOF): 70000 mots L'Enquête Socio-Linguistique à Orléans (ESLO 1 et 2): 6,5 millions de mots Corpus de LAngue Parlée en Interaction (CLAPI): 100000 mots Corpus de taille très modeste: p.ex. École Massy I et II, Rhapsodie, etc. Communication langagière chez le jeune enfant (CoLaJe): 3 millions de mots

D‘autres corpus en accès restreint: Corp-Aix-2 (Cresti&Moneglia 2005): 300000 mots Ciel-F: ?

Þ taille de l‘ensemble des corpus < 10 millions de mots

Þ possibilité de faire des recherches syntaxiques et phonologiques (cf. le Groupe Aixois de Recherche en Syntaxe [GARS])

Þ impossibilité de faire des recherches statistiques sur le lexique-grammaire (segments répétés, collocations, valence, …)

CAPPEAU, Paul & Magali SEIJIDO 2005. Les corpus oraux en français (inventaire 2005 v.1.1). http://www.culture.gouv.fr/culture/dglf/recherche/corpus_parole/Inventaire.pdf. CRESTI, E. & MONEGLIA, M. (éds.) 2005. C-ORAL-ROM Integrated Reference Corpora for spoken Romance Languages. Amsterdam: John Benjamins

5

Page 6: Le corpus de référence du français contemporain (CRFC)

Vue d‘ensemble du CRFC

français de Franceenviron 310 millions de motséquilibre appréciable entre contrôle

et naturel~ 60-65 millions de mots de parole

spontanée14 genrescorpus de suivi D. Siepmann, The corpus de référence du français contemporain as the first balanced corpus of French. (à paraître)

6

Page 7: Le corpus de référence du français contemporain (CRFC)

Usages

élaboration de grammaires et de dictionnaires fondés sur corpus

lexicologie et phraséologie de l‘oral

ouverture au grand public en 2018

7

Page 8: Le corpus de référence du français contemporain (CRFC)

  Section Tailleoral formel 30 m  informel 30 mpseudo-oral pièces de théâtre et scénarios de

films30 m

  sous-titres de films et de feuilletons télévisés

2,5 m

  SMS/chat 2,5 m  forums de discussion 60 m

155 mécrit écrits scientifiques et techniques 30 m  autres textes non-littéraires 30 m  romans, nouvelles et contes 30 m  journaux 45 m  revues 10 m  journaux intimes et blogs 5 m  lettres et courriels 1 m  textes divers 4 m

155 mD. Siepmann, The corpus de référence du français contemporain as the first balanced corpus of French. (à paraître)

8

Page 9: Le corpus de référence du français contemporain (CRFC)

Corpus oral

taille importante de la partie informelle: 30-35 millions de mots

gamme étendue de situations langagières75 pour cent: transcriptions provenant de

70 types d’émissions télévisées différentes (3000 h de parole)

25 pour cent: corpus existants; interviews du Figaro

9

Page 10: Le corpus de référence du français contemporain (CRFC)

Comparaison ESLO 2 – CRFC (occurrences par million de mots)

Mot-forme ESLO CRFC (oral informel/théâtre = ~ 70 m de mots)

CRFC (journaux = ~ 32 m de mots)

con 2,6 86,1 (6024) 3,1 (100)

flic 0,3 42,4 (2969) 3,0 (96)

foutre 0,9 153,8 (10765) 0,9 (29)

dragueur 0 2,8 (195) 0,18 (6)

bidouill* 0 0,94 (66) 1,0 (34)

10

Page 11: Le corpus de référence du français contemporain (CRFC)

Désavantages des gros corpus Webpléthore de données => difficultés

d‘identification de certains types de collocation

présence de biais d‘échantillonage

11

Page 12: Le corpus de référence du français contemporain (CRFC)

Biais d‘échantillonage dans Fr-Ten-Ten

12

Page 13: Le corpus de référence du français contemporain (CRFC)

13

Page 14: Le corpus de référence du français contemporain (CRFC)

Études de cas I: néologismes

vapoteur, bombasse, itinérance, agence de notation, mot-dièse, kéké, chelou, texter, …

14

Page 15: Le corpus de référence du français contemporain (CRFC)

Études de cas II: l‘oral (conceptionnel) dans les dictionnaires

II. intr. 1. a) (= abandonner) Je ne lâche pas facilement. … ne veut pas lui donner l’économe, puis finit par lâcher. Collocations + ADV mentalement ; (= s’accrocher, s’affirmer) Les Irlandais prennent le score et ne lâcheront plus malgré cet essai dès la reprise sur le poteau de coin. ; Depuis des années, je fais respecter l'ordre. Il ne faut pas lâcher maintenant. b) (= inciter qqn à abandonner ou à demander moins d’efforts aux autres) Parfois, tu as envie de lui dire "Lâche un peu." Il est tellement perfectionniste que la frustration qu'on a dans l'équipe, c'est qu'on n'arrive jamais à le satisfaire. ; C'est bon, lâche. Il est remis à sa place, c'est parfait comme ça. 2. (ne plus fonctionner ; se rompre, se détacher) … un moteur qui lâche … ; Et c'est le noeud simple qui lâche le premier. Collocations + N : corde ; frein, embrayage, soudure ; digue (a. fig.) Phraséologie les nerfs lâchent Pourquoi, je ne sais pas, les nerfs ont lâché. 3. (péter) Qui a lâché ? III. pron. 1. se lâcher (avec qqc) a) (= se laisser aller ; laisser libre cours à ses émotions) Vous vous lâchez pendant les fêtes ?; Tout le monde s’est lâché avec cette musique. ; Pour une plante de salon, on peut se lâcher. On peut se lâcher dans les formes, les couleurs... ;Ça te ferait du bien de te lâcher, tu as le droit de pleurer. b) (s’exprimer librement) Vas-y, lâche-toi, ma chérie ! Collocations + ADV complètement, totalement, vraiment 2. (= lâcher II. 1a) Encore 300 m de course. Elles ne vont pas se lâcher.

D. Siepmann, Dictionaries and spoken language: a corpus-based review of French dictionaries. (à paraître) 15

Page 16: Le corpus de référence du français contemporain (CRFC)

Études de cas II: l‘oral (conceptionnel) dans les dictionnaires

I. (appréciation positive sur ce qu’on mange ; interrogation possible) - C’est comment les œufs à la coque, Antoine ? - C’est bon. ; Ce que c’est bon ! ; Les quenelles, c’est bon. Collocations C’est bon, hein ? II. (= confirmation qu’on n’a pas besoin d’aide ou que quelque chose fonctionne; interrogation possible) Tu peux la monter là c'est bon ? C'est bon. ; -Ca va ? C'est bon ? Tout est bouclé ? Pas besoin d'un coup de main ? -Non, ça va aller. ; Tu veux que je t'aide ? -Non, c'est bon. Collocations Non, c’est bon. III. (= désir d’être laissé en paix, mécontentement, refus ; interrogation impossible) - Je vais prendre ma douche. -N'y reste pas 2 heures. -C'est bon ! ; Va te faire foutre! Trois fois, mec! - C'est bon, dégage! Collocations C’est bon, j’ai compris. IV. (= jugement que quelque chose est suffisant ou adéquat ; interrogation possible) a) (par rapport à une quantité) On est à 120 kg. – C’est bon. Arrête, Florian. ; 50 euros, c’est bon ? (en payant une note = gardez tout) C’est bon. (par rapport à la qualité) - Je ne voudrais pas qu’il y ait trop de blanc là-bas. C'est bon comme ça ? – Je pense, oui. ; (à un enfant) Plus qu’une cuillère et c’est bon. ; (= en faisant l’amour) Humm. Lèche-moi. C’est bon. b) (résolution satisfaisante par rapport à une situation antérieure) J’ai eu des frayeurs la première fois. Mais quand tu l'as fait une fois, après, c'est bon. ; Tu remues comme une petite omelette. Dès que le jaune est déstructuré, c'est bon. ; -Marc a trouvé un appart. -Tu as trouvé ? - Oui, c'est bon. ; C’est bon. Elles m’ont convaincue. ; - On a repéré l'individu, il est directement sur sa droite. - OK, c'est bon, on le tient. Collocations C’est bon, il y arrive. ; C’est bon. Impeccable. ; Allez, c’est bon. c) (= pour marquer la fin) Voilà c’est bon j’ai fini. d) (= t’inquiète pas ; il n’y a aucun problème) ah ben je sais pas il doit y avoir du jus d' orange ou quelque chose … ouais ben c'est bon je vais me débrouiller va ! ; - Tu risques plus rien ? - J'ai pris sur moi pour pas lui péter la gueule, mais c'est bon. - Il t'a donné une garantie ? -T'inquiète, ça va aller. ; - Je me suis pas échauffée. -C'est bon, échauffe-toi. ; On fait une pause ou c’est bon ? ; Il faut que je m’approche ou c’est bon là ? Collocations C’est bon là (./ ?) Mais c’est bon. C’est tout bon. e) (= en conduisant : la voie est libre) Là, va tout droit. C’est bon. f) (= pour dire que quelque chose est prêt ou pour s’assurer que quelqu’un est prêt) -Vous êtes prêts à virer ? -Oui. -C'est bon ? -Allez, virez de bord. ; C’est bon. Vous pouvez prendre le bain. Collocations C’est bon. On y va. / On peut y aller. D. Siepmann, Dictionaries and spoken language: a corpus-based review of French dictionaries. (à paraître)

16

Page 17: Le corpus de référence du français contemporain (CRFC)

Études de cas III: le subjonctif

D. Siepmann / C. Bürgel, L’élaboration d’une grammaire pédagogique à partir de corpus: l’exemple du subjonctif. In : Tinnefeld, Thomas (à paraître)

17

Page 18: Le corpus de référence du français contemporain (CRFC)

Étude de cas III: le subjonctif (1) J‘aimais bien l‘idée de laisser un produit quelque part et qu‘une personne vienne et

le demande gratuitement. (CRFC)

(2) Ça bouge le larynx et la trachée pour ne pas faire de fausse route et que ça descende bien … (CRFC)

(3) Ça permet aussi de faire que la confiture ne soit pas trop liquide. (CRFC)

(4) Je me présente à Pau, j'essaierai de faire qu'il y ait autour de moi toutes les sensibilités républicaines de la ville. (CRFC)

c‘est + ADJ (au lieu de il est); je m‘en fous; sympa; marrant; bien; pas mal; ça me fait chier; ça + me + étonner/inquiéter/faire plaisir/…; je trouve ça ADJ; il y a des chances/peu de chances/…; fais/faites gaffe/attention; pour pas/plus que (= pour que … ne … pas/plus)

(5) Ça fait peur ? Oui, que mon fils puisse … (CRFC)

(6) Tu veux quoi? Que je fasse la majorette ? (CRFC)

D. Siepmann / C. Bürgel, L’élaboration d’une grammaire pédagogique à partir de corpus: l’exemple du subjonctif. In : Tinnefeld, Thomas (à paraître)

18

Page 19: Le corpus de référence du français contemporain (CRFC)

Fonctions spécifiques de que suivi du subjonctif

1) (valeur volitive) : Qu’est-ce qu’il reste à améliorer ? Des petites choses, des petits accessoires à mettre, des boucles d’oreilles, qu’elle le fasse naturellement, que je lui dise pas qu’il manque quelque chose

2) (valeur alternative) : Que vous ayez fait ce test ou non, les médecins recommandent de ne pas prendre d'ibuprofène en cas de mal de gorge. ; Aux Etats-Unis, le showbiz est vraiment la culture, que ce soit sur le plan cinématographique, de la danse, des spectacles …

3) que = pour que (souvent avec l’impératif)Vous la renvoyez, que l'on < puisse > jouer avec.Remue bien, que les pommes < soient > couvertes de sucre.Soulève-moi ça que je < sente >.File-moi ton poing dans la figure, qu’on en < finisse >.

4) que = assez/trop … pour que J’ai passé l’âge qu’on me dise …

Page 20: Le corpus de référence du français contemporain (CRFC)

Études de cas IV: différences d‘emploi par genre: avec pour + GN

Genre (par ordre de fréquence relative)journaux

textes scientifiques

langue parlée soutenue

magazines

forums de discussion

fiction

théâtre

films

SMS

langue parlée familière 20

Ils descendirent la rue, avec pour guide les rails du tramway. (CRFC)

Page 21: Le corpus de référence du français contemporain (CRFC)

Études de cas IV: différences d‘emploi par genre: avec pour + nomjournaux langue parlée soutenueconséquence, effet, corollaire ; objectif, mission, horizon

conséquence, effet, corollaire ; objectif, mission

thème, slogan, répertoire, toile de fond, cadre, leitmotiv, supportmannequin, égérie, animateur, invité, adjoint, vedette, moniteuravantage, supplément, symbole

21

Page 22: Le corpus de référence du français contemporain (CRFC)

22

Page 23: Le corpus de référence du français contemporain (CRFC)

Le corpus de référence du français contemporain (CRFC)

23