[advanced] speech & audio signal processing

[Advanced] Speech & Audio Signal Processing ES 157/257: Speech and Audio Processing Prof. Patrick Wolfe, Harvard DEAS 02 February 2006

Upload: axelle

Post on 21-Jan-2016

128 views

Category:

Documents

7 download

Report

Download

Embed Size (px):

DESCRIPTION

[Advanced] Speech & Audio Signal Processing. ES 157/257: Speech and Audio Processing Prof. Patrick Wolfe, Harvard DEAS 02 February 2006. State of the Art in Speech/Audio. Speech and audio processing may be divided into “low-level” and “high-level” inference - PowerPoint PPT Presentation

TRANSCRIPT

[Advanced] Speech & Audio Signal Processing

ES 157/257: Speech and Audio ProcessingProf. Patrick Wolfe, Harvard DEAS

02 February 2006

Page 2: [Advanced] Speech & Audio Signal Processing

State of the Art in Speech/Audio

Speech and audio processing may be divided into “low-level” and “high-level” inference Speech enhancement, compression, and

coding are all widely used technologies This low-level work is the most mature

High-level tasks will drive future advances Speech/music database information retrieval Automatic speaker and speech recognition

But low-level issues also remain…

Page 3: [Advanced] Speech & Audio Signal Processing

Fundamental Questions

How to obtain highly structured representations of speech and audio signals? Time frequency “atoms”

as building blocks How can statistical inference

enable advances in speech signal processing? A means to obtain an

“atomic decomposition” Statistical modeling of time-

frequency coefficients provides a principled solution

Page 4: [Advanced] Speech & Audio Signal Processing

Representative Applications

Missing data in the context of VOIP: Original Missing Restored

Source / Speaker Separation Source 1 Source 2

Mixture 1 Mixture 2

Recovery 1 Recovery 2

Page 5: [Advanced] Speech & Audio Signal Processing

Digital Speech/Audio Processing

Page 6: [Advanced] Speech & Audio Signal Processing

Speech Production

Page 7: [Advanced] Speech & Audio Signal Processing

Time-Scale Modification

Page 8: [Advanced] Speech & Audio Signal Processing

Time-Scale Modification

Male & Female Speaker Original Fast Faster Slower

Trumpet Original Fast Slow

Speech and Quasi-Periodic Audio Sinewave-based Modification Voicing-dependent Rate Factor

Page 9: [Advanced] Speech & Audio Signal Processing

More Time-Scale Modification

Falling Can, Bongo Drums, Loon Original Slow

Complex Non-Speech Signals Phase-Vocoder-based Modification Event-Dependent Phase Coherence

Page 10: [Advanced] Speech & Audio Signal Processing

Pitch and Vocal Tract Change

Male & Female Speaker Original Low pitch/Long vocal

tract High pitch/Short vocal

tract

Male Speaker Original and Monotone

Sinewave-based Modification

Page 11: [Advanced] Speech & Audio Signal Processing

Speech Coding

Female Speaker Original CELP 8000 bps Sine 4800 bps Sine 2400 bps

Sinewave-based Code-Excited Linear Prediction

Male Speaker Original CELP 8000 bps Sine 4800 bps Sine 2400 bps

Page 12: [Advanced] Speech & Audio Signal Processing

Noise Reduction

Cell Phone Noise, Cocktail Party, Automobile Noise Original Enhanced

Adaptive Wiener Filter Adaptation Based on Spectral Change

Page 13: [Advanced] Speech & Audio Signal Processing

Compression

Low-noise case Original 1.5 dB Reduction 3.0 dB Reduction

Reduction of Peak-to-RMS amplitude ratio Based on Sinewave Analysis/Synthesis

High-noise case Original 1.5 dB Reduction 3.0 dB Reduction

Signal Modeling Techniques in Speech Recognitioncourses.cs.tamu.edu/.../picone1993speechSignalModelingSLIDES.pdf · Signal Modeling Techniques in Speech Recognition ... Signal Power:

1 Speech and Audio Processing and Coding (cont.) Dr Wenwu Wang Centre for Vision Speech and Signal Processing Department of Electronic Engineering [email protected]

1 Speech and Audio Processing and Recognition Dr Wenwu Wang Centre for Vision Speech and Signal Processing Department of Electronic Engineering Email:

Audio signal processing - 1 Foundations of Audio Engineering€¦ · Audio signal processing A signal processor takes an input signal, modiﬁes it, and returns an output signal

SGN–14006 Audio and Speech Processingsgn14006/PDF2015/L01-introduction.pdfImplementing an audio signal processing algorithm in Matlab – In two-person groups ! Topic(s) will be

Speech Recognition Frameworks Front End (Digital Signal Processing) – Resample to match the speech database sample rate – Break audio signal into overlapping

Design and Implementation of Noise Free Audio Speech Signal Using Fast Block Least Mean Square Algorithm

Digital Audio Signal Processing DASPhomes.esat.kuleuven.be/~dspuser/dasp/material/Slides_2017_2018... · 1 Speech & Audio Processing / Part-I Digital Audio Signal Processing DASP

Speech & Audio Processing - Part–Idspuser/dasp/... · Digital Audio Signal Processing: Introduction Version 2013-2014 Lecture-1: Introduction p. 2 Speech & Audio Processing •

Applied research and services in the Advance Integrated ... · Acoustic signal enhancement - noise reduction - echo/feedback control - room equalization Audio signal analysis - speech

Improved Speech Reconstruction from Silent Videopeleg/papers/arXiv1708... · speech audio signal of a silent video of a person speaking, and signiﬁcantly improve both intelligibility

A Speech Classification System detection: the incoming audio signal is classified according to speech/non-speech. The result is a time labelling for each speech signal. Non-speech

Digital signal processing IC for speech and audio applications · Digital signal processing IC for speech and audio applications Features • 24-bit, fixed point, 120 MIPS DSP core

Audio Two types of audio signal - Speech signal as used in a variety of interpersonal applications including telephony and video telephony - Music-quality

Audio Signal Processing Course Summaryzduan/teaching/ece472/lectures/Conclusions… · –Distortion, chorus, 3D audio, vocal removal •To make new sound –Keyboard, speech synthesis,

Audio signal classification - TUT · Audio signal classification Klapuri ... – most important for general audio classification – basis for speech and speaker recognition. Classification

Audio Signal Recognition for Speech, Music, and ...dpwe/talks/ASA-austin-2003...Electronica 10 5 15 10 5 15 0 Dan Ellis Audio Signal Reecognition 2003-11-13 - 22 / 25 Outline Pattern

Multirate Digital Signal Processing · Multirate Digital Signal Processing Deals with changing the sampling rate. Many applications of DSP such as communications, speech and audio

Digital Audio and Speech Processing Speech Processing

Audio/Speech Signal Processing An Overview - IIT Kanpurhome.iitk.ac.in/~nnaik/pdf/PPT_AudioSpeech.pdf · Signal Processing Tasks •Audio/Speech Encoding/Decoding - Codecs ( DFT –Spectral

Digital signal processing IC for speech and audio · PDF fileDigital signal processing IC for speech and audio applications ... Order code Package Packing ... 8 Package information

Speech & Audio Processing - Part–II Digital Audio Signal Processing Marc Moonen Dept. E.E./ESAT-STADIUS, KU Leuven [email protected] homes.esat.kuleuven.be/~moonen

Systemics, Cybernetics and Informaticsweb.eecs.utk.edu/~bouldin/MUGSTUFF/HTML/ICSCI_2012_brochure.pdf · Systemics, Cybernetics and Informatics ... Speech / Audio Signal Processing,

[Advanced] Speech & Audio Signal Processing ES 157/257: Speech and Audio Processing Prof. Patrick Wolfe, Harvard DEAS 02 February 2006

Speech Signal Processing

Voice Activity Detection (VAD) Problem: Determine if voice is present in a particular audio signal. Issues: loud noise classified as speech and soft speech

Le Signal Audio

SP2004F Lecture07-01 Digital Signal Processingberlin.csie.ntnu.edu.tw/PastCourses/2004-TCFST-Audio and... · 2004. 9. 4. · 2004 Speech - Berlin Chen 2 Analog Signal to Digital Signal

Speech and Audio Processing Recognition and Audio Effects ... · Digital Signal Processing and System Theory| Recognition and Audio Effects | Beamforming Slide 2 Contents Beamforming

Text-to-speech audio description: towards wider ... · Text-to-speech audio description: towards wider availability of AD ... speech synthesis software is ... Text-to-speech audio

System on Chip Technology in Audio Applications - SPSC · System on Chip Technology in Audio Applications _____ Conducted at the Signal Processing and Speech Communications Laboratory

Speech Signal Processing - Phil Garner · Speech Signal Processing Milos Cernak Introduction Speech synthesis signal processing Analysis Speech parameter generation Re-synthesis Synthesis

ELEC9344: Speech and Audio Processingeemedia.ee.unsw.edu.au/contents/elec9344/LectureNotes/Chapter 8.pdf · ELEC9344: Speech and Audio Processing ... including Speech and Audio processing,

ELEC9344:Speech & Audio Processing Australiaeemedia.ee.unsw.edu.au/contents/elec9344/LectureNotes/Chapter 4.pdf · speech signal for digital storage or transmission ... • Hybrid

Speech Signal Analysis