maeda, s. (1996) phonemes as concatenable units: vcv synthesis using a vocal-tract synthesizer,...

27
Maeda, S. (1996) ‘Phonemes as concatenable units: VCV synthesis using a vocal-tract synthesizer’, proc. Sound patterns of connected speech description, models and explanation symposium (Kiel, Germany) VCVsynth Un programme de S. Maeda pour la simulation de suites de consonnes et de voyelles Présenté par Martine Toda

Upload: beatrice-dupin

Post on 04-Apr-2015

109 views

Category:

Documents


0 download

TRANSCRIPT

  • Page 1
  • Page 2
  • Maeda, S. (1996) Phonemes as concatenable units: VCV synthesis using a vocal-tract synthesizer, proc. Sound patterns of connected speech description, models and explanation symposium (Kiel, Germany) VCVsynth Un programme de S. Maeda pour la simulation de suites de consonnes et de voyelles Prsent par Martine Toda
  • Page 3
  • Pourquoi simuler des suites VCV Vous modlisez* larticulation de consonnes ou de voyelles. Cette modlisation est-elle plausible ? * Reprsentation simplifie qui ne tient compte que des caractristiques postules pertinentes. Vous pouvez synthtiser des squences et les comparer aux suites naturelles. Si votre simulation est plausible, que cela suggre- t-il au sujet des mcanismes de la parole relle ?
  • Page 4
  • Exemples dapplication // acoustiquement quivalents, mais dont la configuration articulatoire diffre Toda, M. et S. Maeda, 2008 Modeling F-pattern in fricative-vowel sequences , The Journal of the Acoustical Society of America 123(5): p.3426 Toda, M., S. Maeda, M. Aron et M.-O. Berger, 2008, Modeling subject-specific formant patterns in /asha/ sequences , actes du 8th International Seminar on Speech Production, Strasbourg (France), p. 357-360. Transitions formantiques des consonnes arabes postrieures et pharyngalises M. Yeou, 1998, Une tude exprimentale des consonnes postrieures et pharyngalises de l'arabe standard, thse de doctorat, Universit Paris 3.
  • Page 5
  • 1. Fonctionnement du programme
  • Page 6
  • Simulation VCVsynth Le programme excuter Un fichier de contrle.ctl et le rpertoire o se trouvent les fichiers de paramtres
  • Page 7
  • Fichier de contrle.ctl Rpertoire o VCVsynth va enregistrer le fichier.wav de loccurrence synthtise Rpertoire o se trouvent les fichiers de configuration glottiques et supraglottique Intensit (entier ; chelle arbitraire) de la source de bruit pour la fricative Nom des fichiers (sans lextension) de paramtres glottiques.f0,.ag0 et.agp Nom du fichier prcisant les paramtres supraglottiques (articulation).af
  • Page 8
  • Rpertoire des paramtres de simulation Fichier des paramtres supraglottiques Fichier des fonctions daire : voyelle et fricative Fichiers des paramtres glottiques
  • Page 9
  • Fichier des paramtres supraglottiques.af Nombre de cibles temporelles Nombre total de sections du conduit vocal ! Cible 1 Cible 2 Cible 3 Cible 4 Cible 5 Cible 6 Temps (en millisecondes) Fonction daire de la cible articulatoire Style de transition depuis la cible prcdente (cosinusodale, COS, ou linaire, LIN)
  • Page 10
  • Fonctions daire (analogues VTF_fric) Mention consonne ou voyelle Nombre total de sections Longueur de chacune des sections (cm) Aire de toutes les sections, de la glotte aux lvres (cm 2 ) Pour une synthse VCV, il faut un fichier pour la voyelle et un autre pour la consonne ! !
  • Page 11
  • Analogue VTF_fric, except Que la position de la source (en no. de sections partir de la glotte) peut tre prcise dans le fichier daire de la consonne (par dfaut, elle se situera la constriction maximale) Les programmes de Maeda naiment pas les zros. 0,0001 = 0 ! La longueur des sections ne demande pas tre identique entre la voyelle et la consonne, mais le nombre de sections doit tre le mme !
  • Page 12
  • Paramtres glottiques.f0 -> F0.ag0 -> niveau de base de laire glottique.agp -> amplitude doscillation de laire glottique
  • Page 13
  • ex. fichier.f0 Nombre total de cibles temporelle N.B. Les cibles temporelles des paramtres glottiques peuvent ne pas concider avec celles des paramtres supraglottiques. Cibles temporelles (ms) F0 (en Hz) Style de transition (SET pour reset)
  • Page 14
  • Dmo ;)
  • Page 15
  • 2. Illustration quivalents acoustiques du // seulement sur le plan statique !
  • Page 16
  • quivalents acoustiques du // malgr des articulations trs diffrentes 12 kHz Cavit sublinguale Chenal palatal (b) [] [s] Cf. Toda, thse (2009)
  • Page 17
  • / / palatal / / apical Spectre naturel de rfrence Simulation Continuum Simulation dun continuum // palatal/apical Toda et al. 2008, ISSP (Strasbourg) plottf.m
  • Page 18
  • Les transitions diffrent en fonction du // / / apical/ / palatal Variation de la fonction daire de /a/ // et de // /a/ (plottransition.m) spectro.m
  • Page 19
  • 3. Edition interactive des paramtres de simulation laide de linterface utilisateur synchro.m sous matlab
  • Page 20
  • Synchro.m
  • Page 21
  • 20 Que se passe-t-il en vrai ? [s] (ich habe sa gesagt) parole Dbit dair oral ePgg sa:a: g ba:a: Donnes acquises en collaboration avec H. Kim, S. Maeda et K. Honda agp F0 ag0 (af)
  • Page 22
  • Stevens 1998, p. 382-383 Aire de la constriction Aire glottale Dbit dair oral V F V
  • Page 23
  • Dmo ;-)
  • Page 24
  • Devinette 1.2.3.
  • Page 25
  • Exercices
  • Page 26
  • Exercice 1.1 Simulez la pince vlaire pour la squence /ka/, en vous servant de la voyelle /a/ postrieure t9l160.are (dans Final11\) et dun tube simple dot dune constriction de 2 cm de longueur. Comment expliquez-vous les mouvements de F1, F2, F3 et F4 daprs les dformations du conduit vocal pendant cette simulation ?
  • Page 27
  • Exercice 1.2 Reproduisez une pince vlaire laide dun /a/ antrieur, t14l160.are, se trouvant dans le rpertoire final12\. Le lieu de la constriction est-il le mme que pour un /a/ postrieur ? Les dformations du conduit vocal sont-elle plus importantes pour le /a/ antrieur que pour le /a/ postrieur ? Laquelle des voyelles un robot parlant cologique prfrerait-il pour produire la squence /ka/ ?
  • Page 28
  • Exercice 2 Transformez la fricative de la squence /aa/ (final11) en fricative voise : en vous inspirant du spectrogramme dune vraie occurrence, et en modifiant uniquement les cibles temporelles des paramtres glottiques et supraglottique.