healthy and pathological voice assessment by means of nonlinear

12
Artigo Original http://dx.doi.org/10.4322/rbeb.2013.010 *e-mail: [email protected] Recebido: 07/08/2012 / Aceito: 23/10/2012 Classificação de sinais de vozes saudáveis e patológicas por meio da combinação entre medidas da análise dinâmica não linear e codificação preditiva linear Washington César de Almeida Costa*, Silvana Luciene do Nascimento Cunha Costa, Francisco Marcos de Assis, Benedito Guimarães Aguiar Neto Resumo Análise acústica tem sido sugerida como uma ferramenta auxiliar não invasiva e de baixo custo ao diagnóstico de patologias laríngeas. Diversas são as técnicas empregadas, entre as quais técnicas baseadas no modelo linear de produção da fala e na análise dinâmica não linear de sinais de vozes. O primeiro método é baseado na Teoria fonte-filtro, em que a fonte é a laringe e o filtro é o trato vocal. Nesse modelo, os sons surdos são modelados por uma fonte de ruído aleatório e os sons sonoros por um trem de impulsos na frequência fundamental do locutor. Na abordagem não linear são considerados aspectos da voz humana, não explorados no modelo linear, tais como: variação temporal da forma do trato vocal, as ressonâncias associadas à sua fisiologia, as perdas devido ao atrito nas paredes internas do trato vocal, a radiação do som nos lábios, o acoplamento nasal e o comportamento dinâmico associado à vibração das pregas vocais. Neste trabalho são associadas as duas abordagens e avaliado o desempenho na classificação com as características, de forma individual, e a partir da combinação das mesmas. São empregadas oito medidas oriundas da análise dinâmica não linear (dimensão de correlação, quatro medidas de entropia, expoente de Hurst, maior expoente de Lyapunov e o primeiro mínimo da função de informação mútua), além de coeficientes LPC, obtidos a partir da análise preditiva linear. Os resultados sugerem a viabilidade da técnica empregada para a discriminação entre vozes saudáveis e patológicas em geral, como também entre vozes afetadas por patologias laríngeas distintas como edema, nódulos e paralisia nas pregas vocais. Palavras-chave Patologias laríngeas, Análise acústica, Classificação de vozes patológicas, Análise dinâmica não linear, Análise preditiva linear. Healthy and pathological voice assessment by means of nonlinear dynamic analysis measures and linear predictive coding Abstract Acoustic analysis has been suggested as a noninvasive aiding and low cost tool for laryngeal disease diagnosis. Several techniques are employed using either the linear model of speech production, or the nonlinear dynamic analysis of voice signals. The first method is based on source-filter theory, in which the source is the larynx and the filter is the vocal tract. In this model, the unvoiced sounds are modeled by a random noise source and the voiced ones by impulse train at the speaker fundamental frequency. In nonlinear approach, aspects of the human voice are considered, not explored in the linear model, such as temporal variation of the vocal tract shape, resonances associated with its physiology, losses due to friction in the vocal tract inner walls, sound radiation in the lips, nose coupling and dynamic behavior associated with vocal fold vibration. This work combines the two approaches and evaluates the performance in classifying the features individually, and from their combination. Eight measures are employed derived from the nonlinear dynamic analysis (correlation dimension, four entropy measures, Hurst exponent, the largest Lyapunov exponent and the first minimum of mutual information function), besides LPC coefficients obtained from linear predictive analysis. The results suggest the feasibility of the employed technique to discriminate between healthy and pathological voices in general, but also among specific laryngeal diseases as vocal fold edema, nodules and paralysis. Keywords Laryngeal diseases, Acoustic analysis, Pathological voice assessment, Nonlinear dynamic analysis, Linear predictive analysis. Volume 29, Número 1, p. 3-14, 2013

Upload: buikien

Post on 09-Jan-2017

219 views

Category:

Documents


1 download

TRANSCRIPT

Artigo Originalhttpdxdoiorg104322rbeb2013010

e-mail washingtoncesareeufcgedubr Recebido 07082012 Aceito 23102012

Classificaccedilatildeo de sinais de vozes saudaacuteveis e patoloacutegicas por meio da combinaccedilatildeo entre medidas da anaacutelise dinacircmica natildeo linear e codificaccedilatildeo preditiva linear

Washington Ceacutesar de Almeida Costa Silvana Luciene do Nascimento Cunha Costa Francisco Marcos de Assis Benedito Guimaratildees Aguiar Neto

Resumo Anaacutelise acuacutestica tem sido sugerida como uma ferramenta auxiliar natildeo invasiva e de baixo custo ao diagnoacutestico de patologias lariacutengeas Diversas satildeo as teacutecnicas empregadas entre as quais teacutecnicas baseadas no modelo linear de produccedilatildeo da fala e na anaacutelise dinacircmica natildeo linear de sinais de vozes O primeiro meacutetodo eacute baseado na Teoria fonte-filtro em que a fonte eacute a laringe e o filtro eacute o trato vocal Nesse modelo os sons surdos satildeo modelados por uma fonte de ruiacutedo aleatoacuterio e os sons sonoros por um trem de impulsos na frequecircncia fundamental do locutor Na abordagem natildeo linear satildeo considerados aspectos da voz humana natildeo explorados no modelo linear tais como variaccedilatildeo temporal da forma do trato vocal as ressonacircncias associadas agrave sua fisiologia as perdas devido ao atrito nas paredes internas do trato vocal a radiaccedilatildeo do som nos laacutebios o acoplamento nasal e o comportamento dinacircmico associado agrave vibraccedilatildeo das pregas vocais Neste trabalho satildeo associadas as duas abordagens e avaliado o desempenho na classificaccedilatildeo com as caracteriacutesticas de forma individual e a partir da combinaccedilatildeo das mesmas Satildeo empregadas oito medidas oriundas da anaacutelise dinacircmica natildeo linear (dimensatildeo de correlaccedilatildeo quatro medidas de entropia expoente de Hurst maior expoente de Lyapunov e o primeiro miacutenimo da funccedilatildeo de informaccedilatildeo muacutetua) aleacutem de coeficientes LPC obtidos a partir da anaacutelise preditiva linear Os resultados sugerem a viabilidade da teacutecnica empregada para a discriminaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas em geral como tambeacutem entre vozes afetadas por patologias lariacutengeas distintas como edema noacutedulos e paralisia nas pregas vocaisPalavras-chave Patologias lariacutengeas Anaacutelise acuacutestica Classificaccedilatildeo de vozes patoloacutegicas

Anaacutelise dinacircmica natildeo linear Anaacutelise preditiva linear

Healthy and pathological voice assessment by means of nonlinear dynamic analysis measures and linear predictive coding

Abstract Acoustic analysis has been suggested as a noninvasive aiding and low cost tool for laryngeal disease diagnosis Several techniques are employed using either the linear model of speech production or the nonlinear dynamic analysis of voice signals The first method is based on source-filter theory in which the source is the larynx and the filter is the vocal tract In this model the unvoiced sounds are modeled by a random noise source and the voiced ones by impulse train at the speaker fundamental frequency In nonlinear approach aspects of the human voice are considered not explored in the linear model such as temporal variation of the vocal tract shape resonances associated with its physiology losses due to friction in the vocal tract inner walls sound radiation in the lips nose coupling and dynamic behavior associated with vocal fold vibration This work combines the two approaches and evaluates the performance in classifying the features individually and from their combination Eight measures are employed derived from the nonlinear dynamic analysis (correlation dimension four entropy measures Hurst exponent the largest Lyapunov exponent and the first minimum of mutual information function) besides LPC coefficients obtained from linear predictive analysis The results suggest the feasibility of the employed technique to discriminate between healthy and pathological voices in general but also among specific laryngeal diseases as vocal fold edema nodules and paralysisKeywords Laryngeal diseases Acoustic analysis Pathological voice assessment Nonlinear dynamic analysis

Linear predictive analysis

Volume 29 Nuacutemero 1 p 3-14 2013

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

IntroduccedilatildeoPatologias na laringe tecircm aumentado muito nos uacuteltimos anos devido a haacutebitos sociais natildeo saudaacuteveis ndash tabagismo e alcoolismo ndash e o abuso vocal As teacutecnicas tradicionais empregadas pela comunidade meacutedica ocorrem pela escuta da voz do paciente cujo diagnoacutestico depende da experiecircncia do profissional ou pela inspeccedilatildeo direta das pregas vocais por meio de teacutecnicas laringoscoacutepicas o que causa certo desconforto ao paciente (Godino-Llorente et al 2006)

A anaacutelise acuacutestica tem sido sugerida nas uacuteltimas deacutecadas como uma ferramenta auxiliar ao diagnoacutestico meacutedico de patologias lariacutengeas acompanhamento de terapias vocais tratamentos medicamentosos e acompanhamento antes e apoacutes cirurgias Eacute uma teacutecnica natildeo invasiva jaacute que necessita apenas da gravaccedilatildeo da voz do paciente a qual pode ser armazenada e processada Dessa forma eacute possiacutevel extrair e avaliar caracteriacutesticas e paracircmetros do sinal de voz e observar as consequecircncias causadas nos mesmos pela presenccedila de patologias na laringe Esta teacutecnica natildeo substitui o diagnoacutestico dos exames laringoscoacutepicos mas pode ser empregada em preacute-diagnoacutestico acompanhamentos de tratamentos medicamentosos poacutes-ciruacutergicos terapia vocal e indicaccedilatildeo da necessidade ou natildeo de exames mais sofisticados para um diagnoacutestico final

Por meio da anaacutelise acuacutestica utilizando teacutecnicas de processamento digital de sinais a voz do paciente pode ser gravada num computador pessoal e enviada para um especialista em outra localidade e este por meio de software especiacutefico avaliar a qualidade vocal Este sistema poderia portanto ser aplicado em redes de telemedicina nas quais os serviccedilos ofertados podem incluir o compartilhamento de arquivos de prontuaacuterios consultas exames e segunda opiniatildeo Aleacutem disso eacute possiacutevel a adoccedilatildeo de medidas simples e de baixo custo como a implantaccedilatildeo de sistemas de anaacutelise com diagnoacutesticos remotos que pode contribuir para diminuir a carecircncia de especialistas

Diversas teacutecnicas tecircm sido empregadas para quantificar e avaliar as desordens vocais provocadas por patologias lariacutengeas As teacutecnicas mais tradicionais empregam medidas tais como a frequecircncia fundamental jitter shimmer APQ HNR entre outras (Boyanov et al 1993 Manfredi et al 1999) Entretanto dependendo do grau de severidade da patologia a obtenccedilatildeo da frequecircncia fundamental se torna uma tarefa bastante complexa e o resultado obtido pode natildeo ser confiaacutevel (Godino-Llorente et al 2006) Outras teacutecnicas se baseiam no modelo linear de produccedilatildeo da fala (modelo fonte-filtro) em que a fonte eacute a laringe e o filtro eacute o trato vocal Nesse modelo os sons surdos satildeo modelados por uma fonte

de ruiacutedo aleatoacuterio e os sons sonoros por um trem de impulsos na frequecircncia fundamental do locutor (OrsquoShaughnessy 2000 Rabiner e Schafer 1978)

Uma questatildeo fundamental para que um processo automaacutetico de classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas seja eficiente eacute a escolha de quais caracteriacutesticas extraiacutedas do sinal de voz satildeo as mais apropriadas para capturar as desordens vocais provocadas pela presenccedila da patologia

Apesar do relativo sucesso do uso do modelo linear para a produccedilatildeo da fala em diversas aplicaccedilotildees estudos mais recentes tecircm apontado para a evidecircncia do caos na voz humana (Jiang et al 2006 Kokkinos e Maragos 2005 Henriacutequez et al 2009 Zhang e Jiang 2008) A anaacutelise dinacircmica natildeo linear de sinais de voz tem sido considerada por levar em conta aspectos da voz humana natildeo explorada na abordagem linear tais como variaccedilatildeo temporal da forma do trato vocal as ressonacircncias associadas agrave sua fisiologia as perdas devido ao atrito viscoso nas paredes internas do trato vocal a suavidade dessas paredes internas a radiaccedilatildeo do som nos laacutebios o acoplamento nasal e a flexibilidade (comportamento dinacircmico) associada agrave vibraccedilatildeo das pregas vocais (Kumar e Mullik 1996)

Antes de aplicar teacutecnicas natildeo lineares tais como aquelas inspiradas na teoria do caos a fenocircmenos dinacircmicos que ocorrem na natureza eacute necessaacuterio primeiro perguntar se a utilizaccedilatildeo de tais teacutecnicas avanccediladas eacute justificada pelos dados Enquanto muitos processos na natureza parecem muito improvaacuteveis a priori serem lineares a possiacutevel natureza natildeo linear pode natildeo ser evidente em aspectos especiacuteficos da sua dinacircmica O fato de que um sistema contenha componentes natildeo lineares natildeo implica necessariamente que esta natildeo linearidade tambeacutem se reflita em um sinal especiacutefico obtido a partir desse sistema (Schreiber e Schmitz 2000)

No caso particular da voz humana diversos trabalhos tecircm identificado agrave influecircncia das natildeo linearidades presentes no sistema de produccedilatildeo vocal a partir da anaacutelise do proacuteprio sinal de voz (Little et al 2007 Tokuda et al 2001) Em um desses trabalhos Max A Little (Little 2006) realizou uma investigaccedilatildeo a cerca de que sejam mantidos os pressupostos de um sistema linear variante no tempo para sinais de vozes apesar de mudanccedilas nos formantes (para diferentes vogais) ou na fonte de energia acuacutestica (ruiacutedo acuacutestico em consoantes e vibraccedilatildeo das pregas vocais em vogais) Os resultados obtidos indicaram que para a maioria dos sons vocaacutelicos tanto saudaacuteveis como patoloacutegicos a hipoacutetese de que tais sinais tenham sido gerados a partir de um sistema linear pode ser rejeitada e que modelos natildeo lineares estocaacutesticos ou determiniacutesticos podem ser mais confiaacuteveis Por outro lado no caso

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 20134

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

de sons consonontais fricativos saudaacuteveis e algumas vozes patoloacutegicas (caso da voz soprosa) natildeo se pode descartar o modelo linear

Recentes pesquisas relacionadas agraves seacuteries temporais geradas a partir dos mecanismos de produccedilatildeo da voz humana tecircm sido realizadas considerando-se as teacutecnicas da dinacircmica natildeo linear e da teoria do caos com objetivos variados dentre os quais podem ser destacados classificaccedilatildeo de fonemas (Johnson et al 2005 Kokkinos e Maragos 2005) reconhecimento automaacutetico de locutor (Petry 2002) discriminaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas diagnoacutestico de patologias lariacutengeas e avaliaccedilatildeo de efeitos de tratamentos cliacutenicos (Dajer 2006 Henriacutequez et al 2009 Jiang et al 2006 Scalassara et al 2008 Torres et al 2003 Zhang e Jiang 2008)

Para que um sistema de auxiacutelio a diagnoacutesticos possa ser implementado com eficiecircncia torna-se primordial o estudo de teacutecnicas que ofereccedilam um excelente desempenho para que o erro de diagnoacutestico seja miacutenimo A investigaccedilatildeo acerca de quais satildeo as melhores caracteriacutesticas que distinguem um sinal de voz saudaacutevel de um sinal de voz patoloacutegica e principalmente que permita distinguir entre patologias ainda eacute um campo em desenvolvimento

Na literatura especiacutefica a maioria das pesquisas se baseia em discriminar entre vozes saudaacuteveis e patoloacutegicas em geral sem no entanto discriminar entre patologias distintas Neste trabalho pretende-se investigar o potencial discriminativo de medidas oriundas da anaacutelise dinacircmica natildeo linear para classificar sinais de vozes saudaacuteveis e patoloacutegicas bem como distinguir qual patologia estaacute afetando a qualidade vocal As patologias lariacutengeas consideradas neste trabalho satildeo paralisia nas pregas vocais edemas de Reinke e noacutedulos vocais As medidas empregadas oriundas da anaacutelise dinacircmica natildeo linear satildeo Dimensatildeo de correlaccedilatildeo entropia de correlaccedilatildeo entropia aproximada entropia de Shannon entropia de Tsallis expoente de Hurst maior expoente de Lyapunov e primeiro miacutenimo da funccedilatildeo de informaccedilatildeo muacutetua A teacutecnica de anaacutelise de discriminante quadraacutetica eacute aplicada para classificar os sinais em saudaacuteveis ou patoloacutegicos considerando as caracteriacutesticas de forma individual e combinada

No intuito de melhorar as taxas de classificaccedilatildeo na discriminaccedilatildeo entre patologias eacute realizada uma combinaccedilatildeo das medidas da anaacutelise natildeo linear com coeficientes LPC (Linear Prediction Coding) obtidos a partir da anaacutelise linear para o modelo de produccedilatildeo da fala O objetivo dessa combinaccedilatildeo eacute investigar se caracteriacutesticas de abordagens diferentes podem extrair

informaccedilotildees que combinadas possam refletir mais especificamente as desordens vocais provocadas pela presenccedila de uma determinada patologia na laringe

Materiais e Meacutetodos

Base de dados

Neste trabalho os sinais processados satildeo provenientes da base de dados comercialmente disponiacutevel a Disordered Voice Database Modelo 4337 gravada pelo Massachusetts Eye and Ear Infirmary (MEEI) (Kay Elemetrics 1994) A base de dados conteacutem pronuacutencias sustentadas da vogal a sendo 53 arquivos de locutores com voz saudaacutevel e 657 com vozes patoloacutegicas (vozes afetadas por patologias lariacutengeas) Foram selecionados 130 sinais sendo os 53 sinais de vozes saudaacuteveis e 77 sinais de pacientes com patologia na laringe (31 com edema de Reinke 28 com paralisia e 18 com noacutedulos) Os sinais de vozes saudaacuteveis originalmente amostrados a uma frequecircncia de 50000 amostrass foram subamostrados a 25000 amostrass para equiparar o nuacutemero de amostras aos sinais patoloacutegicos Os sinais de vozes tecircm duraccedilatildeo meacutedia de um segundo para os sinais patoloacutegicos e de 3 segundos para os sinais de vozes saudaacuteveis Os sinais disponibilizados na base de dados satildeo previamente processados por isso natildeo conteacutem intervalos de silecircncio antes ou depois da elocuccedilatildeo Evitando assim quaisquer problemas frequentemente encontrados em iniacutecio e fim de gravaccedilatildeo

Metodologia

O sistema de classificaccedilatildeo eacute representado de forma resumida pela Figura 1 Apoacutes a aquisiccedilatildeo do sinal por um microfone o sinal armazenado em um computador pessoal eacute processado Satildeo analisados 960 ms de cada sinal de voz sendo 30 quadros de 32 ms de forma a preservar a estacionariedade A seguir eacute feita a extraccedilatildeo de caracteriacutesticas e logo apoacutes a classificaccedilatildeo dos sinais Satildeo realizadas duas abordagens distintas para a extraccedilatildeo de caracteriacutesticas uma abordagem parameacutetrica baseada no modelo linear de produccedilatildeo da fala e outra em medidas obtidas a partir da anaacutelise dinacircmica natildeo linear Na abordagem parameacutetrica os coeficientes LPC satildeo extraiacutedos de cada sinal apoacutes sua segmentaccedilatildeo configurando um vetor de ordem p (ordem do filtro de prediccedilatildeo) para cada segmento Neste trabalho satildeo utilizados diferentes valores de p (12 16 20 e 24) com o intuito de avaliar o efeito do aumento da ordem de prediccedilatildeo no desempenho da classificaccedilatildeo

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 5

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

Extraccedilatildeo de caracteriacutesticas

Apoacutes a segmentaccedilatildeo do sinal eacute realizada a extraccedilatildeo de caracteriacutesticas feitas sob as duas abordagens para o modelo de produccedilatildeo de fala (linear e natildeo linear) descritas a seguir

Anaacutelise dinacircmica natildeo linear

A anaacutelise dinacircmica de sinais pode ser feita por meio de um modelo matemaacutetico associado ao sistema de produccedilatildeo desses sinais ou por meio da anaacutelise de seacuteries temporais O ponto essencial desta anaacutelise eacute que uma seacuterie temporal conteacutem informaccedilotildees sobre variaacuteveis natildeo observaacuteveis do sistema o que permite a reconstruccedilatildeo do espaccedilo de estados (Savi 2006) Cada sinal de voz a ser analisado corresponde a uma seacuterie temporal

A teacutecnica de reconstruccedilatildeo do espaccedilo de estados eacute baseada no teorema da imersatildeo de Takens (1981) Ele demonstrou que com o uso da teacutecnica dos tempos de retardo ou meacutetodo das coordenadas defasadas eacute possiacutevel reconstruir certas propriedades topoloacutegicas do espaccedilo de estados (atrator) a partir da seacuterie temporal xi em que vetores ξi m-dimensionais satildeo reconstruiacutedos de forma que

( ) ( ) ( ( 1) )x t x t x t mi i i iξ = + τ + minus τ (1)

onde i = 1 2 T ndash (m ndash 1)τ T eacute o nuacutemero total de amostras m eacute a chamada dimensatildeo de imersatildeo e τ eacute o passo de reconstruccedilatildeo ou tempo de defasagem (Fiedler-Ferrara e Prado 1994)

A determinaccedilatildeo eficiente dos paracircmetros de reconstruccedilatildeo (tempo de defasagem e dimensatildeo de imersatildeo) eacute de extrema importacircncia para a identificaccedilatildeo dos invariantes geomeacutetricos do sistema tais como a dimensatildeo do atrator e os expoentes de Lyapunov A partir da reconstruccedilatildeo do espaccedilo de fases dos sinais analisados eacute realizada a extraccedilatildeo das medidas de dinacircmica natildeo linear

Na Figura 2 estaacute ilustrada a reconstruccedilatildeo em duas dimensotildees do atrator de um dos sinais de voz analisados utilizando (a) um passo de reconstruccedilatildeo bem menor do que o adequado (τ = 1) (b) utilizando um passo de reconstruccedilatildeo ldquooacutetimordquo determinado com o uso da funccedilatildeo de informaccedilatildeo muacutetua (τ = 5) e (c) usando um passo bem maior do que o adequado (τ = 10)

O meacutetodo utilizado para obtenccedilatildeo do passo de reconstruccedilatildeo utilizado neste trabalho eacute devido a Fraser e Swinney (1986) e estaacute baseado na funccedilatildeo de informaccedilatildeo muacutetua Neste meacutetodo o valor do tempo de defasagem ideal corresponde ao primeiro miacutenimo local quando este existir da funccedilatildeo de informaccedilatildeo muacutetua meacutedia I(τ)

a b c

Figura 2 Reconstruccedilatildeo do atrator da vogal sustentada a em um intervalo de 32 ms Paracircmetros m = 2 e a) τ = 1 amostra b) τ = 5 amostras e c) τ = 10 amostrasFigure 2 Atractor reconstruction of the sustained vowel a for a 32 ms frame Parameters m = 2 and a) τ = 1 sample b) τ = 5 samples and c) τ = 10 samples

Figura 1 Diagrama em blocos do sistema de classificaccedilatildeo de vozes patoloacutegicasFigure 1 Block diagram of pathological voices classification system

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 20136

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

Funccedilatildeo de informaccedilatildeo muacutetua

A informaccedilatildeo muacutetua meacutedia fornece as mesmas informaccedilotildees que a funccedilatildeo de correlaccedilatildeo fornece em sistemas lineares sendo na realidade um tipo de generalizaccedilatildeo para sistemas natildeo lineares (Savi 2006) Na Figura 3 estaacute ilustrado o comportamento da I(τ) em funccedilatildeo de τ para o mesmo segmento do sinal cujo atrator estaacute mostrado na Figura 2 A linha tracejada indica o ponto onde ocorre o primeiro miacutenimo de I(τ) (FMMI ndash First Minimum of Mutual Information) e assim a determinaccedilatildeo do passo de reconstruccedilatildeo ldquooacutetimordquo para este segmento (τ = 5)

A partir de um histograma de b intervalos de classe (bins) criado para estimar a distribuiccedilatildeo de probabilidade dos dados de um sinal x(t) a informaccedilatildeo muacutetua meacutedia entre x(t) e sua versatildeo defasada x(t + τ) eacute estimada por meio da expressatildeo

( ) ( ) ( )( ) ( )

21 1

( ) ( )( ) ( ) log

( ) ( )b b i j

i ji j i j

IP x t x t

P x t x tP x t P x t= =

= + τ

τ + τsum sum + τ

(2)

em que Pi(x(t)) eacute a probabilidade de que o sinal x(t) assuma um valor dentro do i-eacutesimo intervalo do histograma Pj(x(t+τ)) eacute a probabilidade de que x(t + τ) esteja no j-eacutesimo intervalo e Pij(x(t) x(t+τ)) eacute a probabilidade de que simultaneamente o sinal de x(t) esteja no i-eacutesimo intervalo e x(t + τ) no j-eacutesimo intervalo (Kantz e Schreiber 2004)

Dimensatildeo de correlaccedilatildeo

A dimensatildeo de correlaccedilatildeo uma das formas mais comuns de se calcular a dimensatildeo de um atrator eacute uma medida geomeacutetrica de uma trajetoacuteria no espaccedilo de fase que descreve o quanto dois pontos dessa trajetoacuteria satildeo correlacionados Ela mede a probabilidade de se encontrar um par aleatoacuterio de pontos dentro de um determinado volume elementar (Savi 2006)

Grassberger e Procaccia (1983) desenvolveram um algoritmo para o caacutelculo da dimensatildeo de correlaccedilatildeo em que a probabilidade de se ter dois pontos do atrator numa caixa de lado ε eacute aproximada pela probabilidade de que a distacircncia entre dois pontos seja menor que ε Esse algoritmo fornece um limite inferior e um valor aproximado para a dimensatildeo fractal (Fiedler-Ferrara e Prado 1994)

Seja q(ε) a fraccedilatildeo de pontos do atrator que estaacute dentro de uma hiperesfera de raio ε centrada no ponto ξi (i-eacutesimo vetor de imersatildeo m-dimensional) Essa fraccedilatildeo eacute expressa pela relaccedilatildeo

( )1

1( )N

i jj

qN =

ε = θ ε minus ξ minus ξsum

(3)

sendo N o nuacutemero de pontos no atrator A funccedilatildeo degrau θ(x) eacute tal que θ = 1 se x ge 0 e θ = 0 se x lt 0 Define-se a integral de correlaccedilatildeo Cm(ε) como

1( )

1( ) lim ( )1

Nm N i i j

C qN rarrinfin = ne

ε = εsumminus

(4)

A dimensatildeo de correlaccedilatildeo eacute entatildeo calculada para cada valor de m como

2 0

log ( )limlog( )

mCDεrarr

εε

(5)

ou seja D2 eacute a inclinaccedilatildeo de uma reta definida pelo graacutefico log Cm(ε) times log (ε) para um valor infinitesimal de ε

Na Figura 4 eacute apresentado o comportamento da dimensatildeo de correlaccedilatildeo em funccedilatildeo de m e de ε para um segmento de 32 ms de um sinal de voz saudaacutevel A fim de se estimar o valor de D2 em cada segmento do sinal satildeo consideradas as inclinaccedilotildees da integral de correlaccedilatildeo para diferentes dimensotildees de imersatildeo com m variando de 4 a 10

Figura 3 Funccedilatildeo de Informaccedilatildeo Muacutetua e determinaccedilatildeo do passo de reconstruccedilatildeo oacutetimo para um segmento de 32 ms da vogal sustentada aFigure 3 Mutual Information Function and the determination of optimal reconstruction step for a 32 ms frame of a sustained vowel

Figura 4 Comportamento da dimensatildeo de correlaccedilatildeo para um segmento de 32 ms de um sinal de voz saudaacutevel em funccedilatildeo da dimensatildeo de imersatildeo e do valor de ε em que as curvas correspondem as diferentes dimensotildees de imersatildeo (m = 4 10) de baixo para cima respectivamenteFigure 4 Correlation dimension behavior for a 32 ms segment of a healthy speech signal in function of the embedded dimension and ε value wherein the curves correspond to the different embedded dimensions (m = 4 hellip 10) upwards respectively

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 7

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

A partir da inspeccedilatildeo visual do comportamento dos valores da dimensatildeo de correlaccedilatildeo em funccedilatildeo de m e de ε eacute levado a efeito a determinaccedilatildeo do valor de ε que oferece o menor coeficiente de variaccedilatildeo entre as curvas dentro de um intervalo de convergecircncia O valor de D2 para o segmento eacute estimado como sendo a meacutedia dos valores obtidos de cada curva para este valor de ε Para o segmento ilustrado na Figura 4 o quadrado sobreposto ao graacutefico indica os valores encontrados (ε = 0050 e D2 = 143)

Entropia de Shannon

Dado um determinado sinal a entropia de Shannon H1 eacute definida como (Shannon 1948)

( )1 21

logM

i ii

H p p=

= minussum

(6)

em que pi eacute a probabilidade de que o sinal pertenccedila a um intervalo i e M eacute o nuacutemero de particcedilotildees em seu espaccedilo de fase

A entropia de Shannon H1 eacute a medida de informaccedilatildeo necessaacuteria para localizar um sistema em um determinado estado significando que H1 eacute a medida da incerteza sobre o sistema fiacutesico (Torres et al 2003) As medidas de entropia avaliam o grau de desordem de um sinal podendo ser empregadas para avaliar as desordens nos sinais de vozes afetados por patologias na laringe (Little et al 2007 Scalassara et al 2008)

Entropia de correlaccedilatildeo

O procedimento de Grassberger-Procaccia permite estimar a entropia de Correlaccedilatildeo K2 a partir das integrais de correlaccedilatildeo Cm(ε) (Equaccedilatildeo 4) da seguinte forma

21

( )1( ) ln( )

m

m

CKC +

εε =τ ε

(7)

em que τ eacute o passo utilizado na reconstruccedilatildeo e m eacute a dimensatildeo de imersatildeo

Na Figura 5 eacute apresentado o comportamento da entropia de correlaccedilatildeo em funccedilatildeo de m e de ε para um segmento de 32 ms de um sinal de voz patoloacutegico A fim de se estimar o valor de K2 em cada segmento do sinal satildeo consideradas as curvas com os valores da entropia de correlaccedilatildeo para diferentes dimensotildees de imersatildeo com m variando de 4 a 10 e diferentes valores de ε

A partir da inspeccedilatildeo visual do comportamento dos valores da entropia de correlaccedilatildeo em funccedilatildeo de m e de ε eacute levada a efeito a determinaccedilatildeo do valor de ε que oferece o menor coeficiente de variaccedilatildeo entre as curvas dentro de um intervalo de convergecircncia O valor de K2 para o segmento eacute estimado como sendo

a meacutedia dos valores obtidos de cada curva para este valor de ε A entropia de correlaccedilatildeo do sinal eacute tomada como sendo a meacutedia calculada sob todos os segmentos do sinal analisado No caso do segmento ilustrado na Figura 5 o quadrado sobreposto ao graacutefico indica os valores encontrados (ε = 0031 e K2 = 0184)

Entropia aproximada

A entropia aproximada ApEn eacute uma medida da informaccedilatildeo condicional meacutedia gerada por pontos divergentes numa trajetoacuteria no espaccedilo de fase (Arias-Londono et al 2011) Considerando valores fixos para m e ε e considerando os vetores dados na Equaccedilatildeo 1 a entropia aproximada eacute definida como (Pincus 1991)

1( ) lim ( ) ( )m mN

ApEn m +

rarrinfin ε = ϕ ε minus ϕ ε

(8)

em que11

1( ) ( 1) log ( )

N mm

iN m q

minus +minus

=ϕ ε = minus + εsum

(9)

e q(ε) eacute definida pela Equaccedilatildeo 3 e N eacute o nuacutemero de vetores do atrator reconstruiacutedo em uma dimensatildeo de imersatildeo miacutenima m

A capacidade de discriminar mudanccedilas de complexidade a partir de uma quantidade relativamente pequena de dados faculta a aplicaccedilatildeo da ApEn em uma variedade de contextos incluindo processos determiniacutesticos caoacuteticos e estocaacutesticos (Pincus 1991) Embora a medida da entropia aproximada natildeo seja uma medida de caos ela quantifica a regularidade do processo de imersatildeo em seacuteries temporais (Torres et al 2003)

Figura 5 Comportamento da entropia de correlaccedilatildeo para um segmento de 32 ms de um sinal de voz patoloacutegico em funccedilatildeo da dimensatildeo de imersatildeo e do valor de ε em que as curvas correspondem as diferentes dimensotildees de imersatildeo (m = 410) de baixo para cima respectivamenteFigure 5 Behavior of entropy correlation for a 32 ms frame of a pathological speech signal related to embedded dimension and ε value wherein the curves correspond to the different embedded dimensions (m = 4 hellip 10) upwards respectively

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 20138

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

Entropia de Tsallis

A entropia de Tsallis eacute uma generalizaccedilatildeo da entropia de Boltzmann-Gibbs (Chakrabarti e De 2000) Eacute definida como (Tsallis 1988)

111

qWi i

qpH k

q=minus sum=

minus (10)

em que q isin caracteriza a generalizaccedilatildeo e pi satildeo as probabilidades associadas com as W ( )W isinconfiguraccedilotildees possiacuteveis do sistema A entropia de Boltzmann-Gibbs eacute encontrada quando no limite qrarr1

A principal caracteriacutestica da entropia de Tsallis eacute a sua natildeo aditividade (Tavares 2003) Isto eacute a informaccedilatildeo contida em um sistema composto natildeo eacute a simples soma da informaccedilatildeo dos subsistemas que o compotildeem As entropias de Shannon e de Boltzmann apresentam a aditividade como uma de suas caracteriacutesticas A ideia principal da utilizaccedilatildeo da entropia de Tsallis eacute verificar a contribuiccedilatildeo do paracircmetro entroacutepico (q) na avaliaccedilatildeo de caracteriacutesticas natildeo extensivas (interaccedilotildees natildeo lineares) presentes na dinacircmica das seacuteries temporais (Silva 2010)

Expoentes de Lyapunov

Os expoentes de Lyapunov estatildeo relacionados agrave taxa meacutedia de divergecircncia ou de convergecircncia exponencial de oacuterbitas vizinhas no espaccedilo de fase Geralmente um sistema contendo pelo menos um expoente de Lyapunov positivo eacute definido como caoacutetico por outro lado um sistema sem nenhum expoente positivo eacute regular (Jiang et al 2006)

Neste trabalho eacute utilizada uma rotina do pacote TISEAN (Hegger et al 1999) a fim de se obter o crescimento exponencial meacutedio das distacircncias entre duas trajetoacuterias que eacute baseada no algoritmo de Kantz (1994) O programa basicamente gera os resultados da expressatildeo (Kantz e Schreiber 2004)

( ) 00 0

1

1 1( ) ln( ) n no

Nn n n n

n S Sn

S n s sN S +∆ +∆

= isinυ

∆ = minussum sum υ

(11)

onde S(∆n) eacute chamado de fator de crescimento (stretching factor) Sn0 satildeo os vetores de imersatildeo e υ(Sn0) eacute a vizinhanccedila de Sn0 com diacircmetro ε Na Figura 6 estaacute ilustrado o comportamento de S(∆n) em funccedilatildeo do nuacutemero de iteraccedilotildees ∆n para trecircs diferentes valores de ε e m variando de 4 a 8 A linha reta representa a inclinaccedilatildeo meacutedia das curvas mostradas e sua inclinaccedilatildeo eacute a estimaccedilatildeo para o maior expoente de Lyapunov λ1

Expoente de HurstO paracircmetro ou expoente de Hurst (Hurst 1951) eacute uma medida de autossimilaridade que vem sendo empregada em diversas aacutereas tais como gerenciamento de traacutefego autossimilar de redes de computadores (Gomes et al 2001) reconhecimento de padrotildees sonoros para avaliaccedilatildeo de sons pulmonares (Custoacutedio 1999) sistemas de reconhecimento de locutor (SantrsquoAna et al 2006) detecccedilatildeo de diferentes aacutereas do ceacuterebro (Rodriacuteguez-Saacutenchez et al 2008) e anaacutelise de sinais EEG (eletroencefalograma) (Natarajan et al 2004) entre outros Em processamento de sinais de voz este paracircmetro tem sido empregado por representar o comportamento estocaacutestico da voz (Fantinato 2008) Aleacutem disso apresenta um baixo custo computacional podendo ser obtido em tempo real durante atividade da fala (SantrsquoAna et al 2006)

Quanto maior o valor do paracircmetro de Hurst maior eacute o impacto das autocorrelaccedilotildees no desempenho do sistema Aleacutem disso pequenas variaccedilotildees no paracircmetro de Hurst podem significar mudanccedilas significativas no comportamento dos sinais caracterizando o grau de desordem do mesmo (Gomes et al 2001) O estimador RS empregado neste trabalho eacute um dos mais conhecidos e simples meacutetodos para estimar o grau de dependecircncia de uma sequecircncia amostral A estatiacutestica RS eacute a soma parcial dos desvios em relaccedilatildeo a sua meacutedia de uma sequecircncia reescalonada pelo seu desvio padratildeo (Alvarez-Ramirez et al 2008)

Se o processo estocaacutestico associado agrave sequecircncia eacute escalonada sobre certo domiacutenio n a estatiacutestica RS segue a equaccedilatildeo

HR S an= (12)

em que RS eacute a distacircncia reescalonada (dividida pelo desvio padratildeo) a eacute uma constante e H eacute o expoente de Hurst

Anaacutelise preditiva linearA ideia baacutesica na prediccedilatildeo linear eacute a de que o valor de uma amostra pode ser aproximado (predita) por

Figura 6 Comportamento de S(∆n) em funccedilatildeo do nuacutemero de iteraccedilotildees de ε e de m (m = 4 8)Figure 6 Behavior of S(∆n) related to iteration number ε and m (m = 48)

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 9

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

combinaccedilatildeo linear dos valores das amostras anteriores levando em consideraccedilatildeo a correlaccedilatildeo entre estas Os coeficientes de prediccedilatildeo linear ou coeficientes LPC (Linear Predictive Coding) satildeo estimados por minimizaccedilatildeo do erro quadraacutetico entre a amostra atual e a sua prediccedilatildeo (OrsquoShaughnessy 2000 Rabiner e Juang 1993)

O modelo linear de produccedilatildeo da fala incorpora os efeitos dos pulsos glotais trato vocal e da radiaccedilatildeo dos laacutebios como um filtro linear (Rabiner e Schafer 1978) A fonte eacute uma sequecircncia de impulsos quase perioacutedicos utilizados para gerar sons sonoros ou a adiccedilatildeo de uma sequecircncia de ruiacutedo aleatoacuterio para sons surdos

Um fator de ganho G eacute ajustado para controlar a intensidade da excitaccedilatildeo Combinando os efeitos dos pulsos glotais do trato vocal e da radiaccedilatildeo o modelo pode ser representado por uma funccedilatildeo de transferecircncia de apenas polos H(z) como

1( )

1 ( )p kk

GH zk zminus

==

minus αsum (13)

Os termos α(k) representam os coeficientes de prediccedilatildeo linear (coeficientes LPC) e p a ordem do filtro de prediccedilatildeo

O meacutetodo LPC estima cada amostra de voz baseado numa combinaccedilatildeo linear de p amostras anteriores Um valor de p maior representa um modelo mais preciso A anaacutelise LPC fornece um conjunto de paracircmetros da fala que representa o trato vocal Espera-se que qualquer mudanccedila na estrutura anatocircmica do trato vocal devido agrave patologia afete os coeficientes LPC

Classificaccedilatildeo

Apoacutes a extraccedilatildeo das caracteriacutesticas tanto pela anaacutelise linear quanto pela natildeo linear eacute realizado o processo de classificaccedilatildeo Neste processo eacute aplicada a anaacutelise discriminante quadraacutetica (QDA) com validaccedilatildeo cruzada em que satildeo utilizados 10 subconjuntos (folds) Satildeo avaliados os desempenhos de classificadores implementados com cada uma das caracteriacutesticas de forma individual e de classificadores implementados a partir da combinaccedilatildeo dessas caracteriacutesticas

Outros classificadores satildeo implementados com coeficientes LPC de ordem p variando de 12 a 24 (p = 12 16 20 e 24) Apoacutes a avaliaccedilatildeo individual de cada meacutetodo (linear e natildeo linear) satildeo construiacutedos vetores hiacutebridos em que a cada vetor LPC de ordem p satildeo adicionadas as medidas natildeo lineares Uma nova avaliaccedilatildeo de desempenho eacute realizada a partir dos vetores hiacutebridos

Para avaliaccedilatildeo de desempenho do processo de classificaccedilatildeo trecircs medidas satildeo utilizadas acuraacutecia sensibilidade e especificidade A Acuraacutecia mede a

taxa de classificaccedilatildeo correta global do teste ou seja a capacidade do teste de identificar corretamente quando haacute e quando natildeo haacute presenccedila da doenccedila A Acuraacutecia (Equaccedilatildeo 14) eacute definida como a relaccedilatildeo entre todos os sinais corretamente classificados e o nuacutemero total de sinais avaliados

VP VNAcuraacuteciaVP VN FP FN

+=+ + +

(14)

em que VP representa os verdadeiros positivos ou seja o nuacutemero de sinais classificados corretamente como patoloacutegicos VN representa os verdadeiros negativos ou seja em quantos sinais foram detectados a ausecircncia correta da patologia FP os falsos positivos ou a quantidade de sinais saudaacuteveis classificados erroneamente como patoloacutegicos e FN os falsos negativos ou seja a quantidade de sinais patoloacutegicos classificados erroneamente como saudaacuteveis

A Sensibilidade mede a capacidade do teste em identificar corretamente a doenccedila entre aqueles que a possuem ou seja o quatildeo sensiacutevel eacute o teste Eacute a relaccedilatildeo entre os sinais patoloacutegicos corretamente classificados e o nuacutemero total de sinais patoloacutegicos dada por

VPSensibilidadeVP FN

=+

(15)

A Especificidade mede a capacidade do teste em excluir corretamente aqueles que natildeo possuem a doenccedila ou seja o quatildeo especiacutefico eacute o teste Eacute a relaccedilatildeo entre os sinais saudaacuteveis corretamente classificados e o nuacutemero total de sinais saudaacuteveis

VNEspecificidadeVN FP

=+

(16)

Os resultados obtidos no processo de classificaccedilatildeo satildeo apresentados a seguir

ResultadosNa Tabela 1 satildeo apresentados os valores de acuraacutecia obtidos com o uso de cada uma das medidas da anaacutelise dinacircmica natildeo linear (MNL) para a classificaccedilatildeo entre vozes saudaacuteveis (SDL) e patoloacutegicas (PTL) usando a anaacutelise discriminante quadraacutetica (QDA ndash Quadratic Discriminant Analysis) A classe dos sinais patoloacutegicos inclui os sinais afetados por edema noacutedulos e paralisia nas pregas vocais O expoente de Hurst H foi o paracircmetro mais eficiente em capturar as desordens vocais presentes nos sinais de vozes patoloacutegicas comparadas aos sinais de vozes saudaacuteveis tendo a maior acuraacutecia no processo de classificaccedilatildeo

Na Tabela 2 satildeo apresentados inicialmente os resultados obtidos na classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas (SDL times PTL) mediante a

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201310

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

combinaccedilatildeo das medidas Observa-se que com a combinaccedilatildeo de apenas quatro medidas entre as oito foi obtida a maior acuraacutecia (9603 plusmn 411) com as medidas entropia de Shannon (H1) entropia de Tsallis (Hq) expoente de Hurst (H) e a dimensatildeo de correlaccedilatildeo (D2) O acreacutescimo das trecircs medidas ao expoente de Hurst proporcionou um aumento de cerca de 9 no valor da acuraacutecia alcanccedilada com o uso individual desta caracteriacutestica

As patologias satildeo separadas em classes diferentes (paralisia edema ou noacutedulo) e comparadas aos sinais saudaacuteveis constituindo as seguintes comparaccedilotildees saudaacutevel times edema (SDL times EDM) saudaacutevel times paralisa (SDL times PRL) e saudaacutevel times noacutedulo (SDL times NDL) Como apresentado na Tabela 2 nesses casos as taxas de acuraacutecia meacutedia satildeo superiores a 97 com todas as taxas de especificidade chegando a 100 o que significa que nenhum sinal saudaacutevel testado foi considerado patoloacutegico O expoente de Hurst e as entropias de Shannon e de Tsallis aparecem em todas as combinaccedilotildees associando-se a outras medidas no caso da discriminaccedilatildeo entre saudaacutevel e edema e entre saudaacutevel e paralisia

Na distinccedilatildeo entre patologias observa-se pela Tabela 2 mesmo com a combinaccedilatildeo das medidas

a acuraacutecia meacutedia atingiu no maacuteximo 86 enquanto que os valores de sensibilidade meacutedia natildeo chegaram a 75 Dessa forma visando aumentar o desempenho na classificaccedilatildeo foi investigada a influecircncia do uso combinado das medidas da anaacutelise natildeo linear com os coeficientes LPC na discriminaccedilatildeo entre as patologias consideradas Nas Figuras 7 a 9 satildeo mostrados os resultados obtidos na discriminaccedilatildeo entre paralisia e edema paralisia e noacutedulo e entre edema e noacutedulo respectivamente

Tabela 2 Avaliaccedilatildeo de desempenho das medidas combinadas ndash valores de acuraacutecia obtidos na classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas e entre as patologiasTable 2 Performance evaluation of combined measures - values of the obtained accuracy in classification between healthy and pathological voices and among pathologies

Classificaccedilatildeo Caracteriacutesticas Acuraacutecia () Sensibilidade () Especificidade ()SDL times PTL H1 Hq H e D2 9603 plusmn 411 9446 plusmn 513 9800 plusmn 452SDL times EDM H1 Hq H D2 e K2 9875 plusmn 283 9667 plusmn 754 100SDL times PRL FMMI H D2 e H1 ou Hq 9750 plusmn 377 9333 plusmn 1005 100SDL times NDL H1 Hq e H 9857 plusmn 323 9500 plusmn 1131 100PRL times EDM λ1 FMMI Hq ApEn D2 e K2 7700 plusmn 1459 7417 plusmn 1874 8167 plusmn 1817PRL times NDL λ1 H ApEn D2 e K2 8600 plusmn 1103 6500 plusmn 2966 9667 plusmn 1494

EDM times NDL λ1 FMMI H1 Hq H e D2 7600 plusmn 951 5500 plusmn 2639 8667 plusmn 1231

Tabela 1 Avaliaccedilatildeo de desempenho das medidas individuais ndash valores de Acuraacutecia () obtidos na classificaccedilatildeo entre vozes saudaacuteveis e vozes patoloacutegicasTable 1 Performance evaluation of individual measures ndash values of the obtained accuracy in classification between healthy and pathological voices

Medidas Saudaacutevel times Patoloacutegica Saudaacutevel times Edema Saudaacutevel times Paralisia Saudaacutevel times Noacutedulo

λ1 5451 plusmn 823 6122 plusmn 1105 5855 plusmn 999 5232 plusmn 1308FMMI 6255 plusmn 574 6022 plusmn 848 6864 plusmn 1010 5821 plusmn 1446

H1 6085 plusmn 831 6944 plusmn 882 6582 plusmn 607 7464 plusmn 803Hq 6261 plusmn 921 6744 plusmn 718 6855 plusmn 766 7607 plusmn 682H 8709 plusmn 591 8567 plusmn 513 8809 plusmn 753 9429 plusmn 528

ApEn 5660 plusmn 672 6806 plusmn 615 6929 plusmn 1351 6667 plusmn 1037D2 7936 plusmn 1077 8458 plusmn 887 8750 plusmn 809 8262 plusmn 1254K2 5288 plusmn 509 6097 plusmn 1032 6196 plusmn 1198 5738 plusmn 881

Acuraacutecia maacuteximaMaximum accuracy

Figura 7 Classificaccedilatildeo entre vozes afetadas por paralisia e sinais afetados por edema nas pregas vocaisFigure 7 Classification between voices affected by vocal fold paralysis and vocal fold edema

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 11

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

Na discriminaccedilatildeo entre paralisia e edema a taxa de acuraacutecia sai de 9655 plusmn 151 com 12 coeficientes LPC para 9924 plusmn 052 com 24 coeficientes Aleacutem do acreacutescimo na acuraacutecia meacutedia em mais de 18 em relaccedilatildeo ao uso dos melhores resultados individuais (LPC) com a combinaccedilatildeo (MNL e LPC) o erro padratildeo caiu consideravelmente aumentando a confiabilidade do teste

Na discriminaccedilatildeo entre paralisia e noacutedulo a acuraacutecia de 86 soacute com as medidas natildeo lineares cresce para valores maiores que 99 Com 12 coeficientes LPC a acuraacutecia eacute de 9919 plusmn 055 com sensibilidade 100 e especificidade meacutedia de aproximadamente 98

A acuraacutecia meacutedia na classificaccedilatildeo entre edema e noacutedulo antes de 76 com as medidas natildeo lineares e cerca de 70 com LPC chega a mais de 98 com o vetor hiacutebrido com apenas 12 coeficientes E passa dos 99 a partir de 16 coeficientes quando associados agraves medidas natildeo lineares

DiscussatildeoPelos resultados apresentados constata-se que o desempenho da classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas aumentou significativamente com a combinaccedilatildeo das medidas da anaacutelise dinacircmica natildeo linear Nos melhores resultados o expoente de Hurst que se destacou como melhor medida individual aparece em todas as combinaccedilotildees juntamente com as entropias de Shannon e de Tsallis para a classificaccedilatildeo entre os sinais de vozes saudaacuteveis e sinais afetados por paralisa edema ou noacutedulo No entanto essas medidas natildeo foram eficazes em discriminar entre patologias apresentando taxas inferiores agraves apresentadas na discriminaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas

A anaacutelise LPC comparada agraves outras medidas empregadas mostra-se mais eficaz em discriminar entre patologias Observa-se que o valor da acuraacutecia aumenta com o aumento da ordem de preditor Aleacutem disso o desempenho na classificaccedilatildeo entre patologias melhora significativamente ao combinar as medidas natildeo lineares com os coeficientes LPC

Eacute importante considerar que o aumento na ordem dos coeficientes LPC estaacute associado a um maior volume de dados a serem processados aumentando o custo computacional No entanto caso seja mais relevante a precisatildeo do diagnoacutestico do que a realizaccedilatildeo da anaacutelise em tempo real eacute possiacutevel optar por empregar uma maior quantidade de coeficientes LPC Observa-se pelos resultados que o valor da acuraacutecia natildeo teve um aumento tatildeo consideraacutevel com o aumento da ordem de prediccedilatildeo aleacutem de 16 coeficientes

ConclusatildeoA partir dos resultados obtidos constata-se que as medidas natildeo lineares conseguem capturar bem as desordens vocais provocadas por patologias nas pregas vocais como noacutedulos edemas e paralisia A consideraccedilatildeo das natildeo linearidades inerentes ao processo de produccedilatildeo da fala e sua consequente anaacutelise utilizando medidas natildeo lineares eacute eficiente em distinguir um sinal saudaacutevel de um sinal patoloacutegico comprovadamente com as patologias consideradas no trabalho (edema paralisia e noacutedulos nas pregas vocais) Entretanto observa-se que a abordagem pelo modelo linear de produccedilatildeo da fala em que os coeficientes LPC modelam o trato vocal consegue distinguir melhor as especificidades existentes nas patologias analisadas notadamente quando combinadas agrave abordagem natildeo linear As mudanccedilas nas estruturas anatocircmicas do trato vocal e da fonte (laringe) foram bem retratadas com a combinaccedilatildeo das duas abordagens sendo a principal contribuiccedilatildeo deste trabalho Com a abordagem hiacutebrida o desempenho na distinccedilatildeo entre

6012 16 20

Nuacutemero de coeficientes LPC

Paralisia times Noacutedulo

24

6468

Acu

raacuteci

a m

eacutedia

()

72768084889296

100

MNL LPC MNL + LPC

Figura 8 Classificaccedilatildeo entre vozes afetadas por paralisia e sinais afetados por noacutedulos nas pregas vocaisFigure 8 Classification between voices affected by vocal fold paralysis and vocal nodules

Figura 9 Classificaccedilatildeo entre vozes afetadas por edema e sinais afetados por noacutedulos nas pregas vocaisFigure 9 Classification between voices affected by vocal fold Edema and vocal nodules

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201312

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

as patologias obteve um aumento consideraacutevel Isto denota que o meacutetodo empregado eacute bastante promissor na tarefa de discriminar entre vozes saudaacuteveis e vozes afetadas por patologias lariacutengeas bem como entre patologias Espera-se que os meacutetodos apresentados nesta pesquisa contribuam ainda mais para a detecccedilatildeo precoce das doenccedilas da laringe auxiliando no seu diagnoacutestico ou para monitorar seu progresso buscando assegurar os cuidados cliacutenicos adequados e mais conforto aos pacientes

ReferecircnciasAlvarez-Ramirez J Echeverria JC Rodriguez E Performance of a high-dimensional RS method for Hurst exponent estimation Physica A Statistical Mechanics and its Applications 2008 387(26)6452-62 httpdxdoiorg101016jphysa200808014

Arias-Londono J Godino-Llorente J Saacuteenz-Lechoacuten N Osma-Ruiz V Castellanos-Dominguez G Automatic detection of pathological voices using complexity measures noise parameters and mel-cepstral coefficients IEEE Transactions on Biomedical Engineering 2011 58(2)370-9 httpdxdoiorg101109TBME20102089052

Boyanov B Ivanov T Hadjitodorov S Chollet G Robust hybrid pitch detector Electronic Letters 1993 29(22)1924-6 httpdxdoiorg101049el19931281

Chakrabarti CG De K Boltzmann-Gibbs entropy axiomatic characterization and application International Journal of Mathematics and Mathematical Sciences 2000 23(4)243-51 httpdxdoiorg101155S0161171200000375

Custoacutedio RF Anaacutelise Natildeo-linear no reconhecimento de padrotildees sonoros Estudo de caso para sons pulmonares [tese] Rio Grande do Sul Universidade Federal do Rio Grande do Sul 1999 119 p

Dajer ME Padrotildees visuais de sinais de voz atraveacutes de teacutecnica de anaacutelise de natildeo-linear [dissertaccedilatildeo] Satildeo Paulo Escola de Engenharia de Satildeo Carlos 2006 154 p

Fantinato PC Segmentaccedilatildeo de voz baseada na anaacutelise fractal e na transformada wavelet [dissertaccedilatildeo] Satildeo Paulo Instituto de Fiacutesica de Satildeo Carlos da Universidade de Satildeo Carlos 2008 123 p

Fiedler-Ferrara N Prado CPC Caos Uma introduccedilatildeo Satildeo Paulo Ed Edgard Blucher Ltda 1994

Fraser AM Swinney HL Independent coordinates for strange attractors from mutual information Physical Review A 1986 331134-40 httpdxdoiorg 101103PhysRevA331134

Godino-Llorente JI Goacutemez-Vilda P Blanco Velasco M Dimensionality reduction of a pathological voice quality assessment system based on gaussian mixture models and short-term cepstral parameters IEEE Transactions on Biomedical Engineering 2006 53(10)1943-53 httpdxdoiorg101109TBME2006871883

Gomes D Fonseca N Agoulmine N Souza JN Neurocomputaccedilatildeo na estimativa do paracircmetro de hurst

In SBRCrsquo2001 Anais do 19 Simpoacutesio Brasileiro de Redes de Computadores 2001 Maio Florianoacutepolis Santa Catarina Florianoacutepolis 2001 p 306-21

Grassberger P Procaccia I Measuring the strangeness of strange attractors Physica D 1983 9189-208 httpdxdoiorg1010160167-2789(83)90298-1

Hegger R Kantz H Schreiber T Practical implementation of nonlinear time series methods the tisean package Chaos 1999 9(2)413-35 httpdxdoiorg1010631166424

Henriacutequez P Alonso JB Ferrer MA Travieso CM Godino-Llorente JI Diacuteaz-De-Maria F Characterization of healthy and pathological voice through measures based on nonlinear dynamics IEEE Transactions on Audio Speech and Language Processing 2009 17(6)1186-95 httpdxdoiorg101109TASL20092016734

Hurst E Long term storage capacity of reservoirs Transactions of the American Society of Civil Engineers 1951 116770-9

Jiang JJ Zhang Y McGilligan C Chaos in voice from modeling to measurement Journal of Voice 2006 20(1)2-17 httpdxdoiorg101016jjvoice200501001

Johnson MT Povinelli RJ Lindgren AC Ye J Liu X Indrebo KM Time-domain isolated phoneme classification using reconstructed phase spaces IEEE Transactions Speech and Audio Processing 2005 13(4)458-66 httpdxdoiorg101109TSA2005848885

Kantz H A Robust Method to Estimate the maximal lyapunov exponent of a time series Physics Letters A 1994 18577-87 httpdxdoiorg1010160375-9601(94)90991-1

Kantz H Schreiber T Nonlinear time series analysis 2nd ed Cambridge University Press 2004

Kay Elemetrics Disordered Voice Database Model 4337 3th ed United Satates 1994

Kokkinos I Maragos P Nonlinear speech analysis using models for chaotic systems IEEE Transactions on Speech and Audio Processing 2005 13(6)1098-109 httpdxdoiorg101109TSA2005852982

Kumar A Mullick SK Nonlinear dynamical analysis of speech Journal Acoustic Society America 1996 100(1)615-29 httpdxdoiorg1011211415886

Little M Biomechanically informed nonlinear speech signal processing [tese] Oxford University of Oxford England 2006 164 p

Little M McSharry P Roberts S Costello D Moroz I Exploiting nonlinear recurrence and fractal scaling properties for voice disorder detection BioMedical Engineering OnLine 2007 6(23)1-19 httpdxdoiorg1011861475-925X-6-23

Manfredi C Pierazzi L Bruscaglioni P Pitch estimation for noise retrieval in time and frequency domain Medical amp Biological Engineering amp Computing 1999 37(2)532

Natarajan K Acharya UR Alias F Tiboleng T Puthusserypady SK Nonlinear analysis of EEG signals at different mental states BioMedical Engineering OnLine 2004 37 httpdxdoiorg1011861475-925X-3-7

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 13

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

OrsquoShaughnessy D Speech communications human and machine 2nd ed New York IEEE Press 2000

Petry A Reconhecimento automaacutetico de locutor utilizando medidas de invariantes dinacircmicas natildeo-lineares [tese] Rio Grande do Sul Universidade Federal do Rio Grande do Sul 2002 155 p

Pincus SM Approximate entropy as a measure of system complexity Proceedings of the National Academy of Sciences 1991 882297-301 httpdxdoiorg101073pnas8862297

Rabiner LR Schafer RW Digital processing of speech signals Upper Saddle River Prentice Hall 1978

Rabiner LR Juang BH Fundamentals of speech recognition Englewood Ciffs New Jersey Prentice Hall 1993

Rodriacuteguez-Saacutenchez A Delgado-Trejos E Orozco-Gutieacuterrez A Castellanos-Domiacutenguez G Nonlinear dynamics techniques for the detection of the brain areas using MER signals International Conference on BioMedical Engineering and Informatics 2008 2198-202 httpdxdoiorg101109BMEI2008330

SantrsquoAna R Coelho R Alcaim A Text-independent speaker recognition based on the hurst parameter and the multidimensional fractional brownian motion model IEEE Transactions on Audio Speech and Language Processing 2006 14(3)931-40 httpdxdoiorg101109TSA2005858054

Savi MA Dinacircmica natildeo-linear e Caos Rio de Janeiro E-papers 2006

Scalassara PR Dajer ME Maciel CD Pereira JC Voice signals characterization through entropy measures In BIOSIGNALS 2008 Proceedings of the International Conference on Bio-inspired Systems and

Signal Processing 2008 Jan 28-31 Madeira Portugal Madeira 2008 v 2 p 163-170

Schreiber T Schmitz A Surrogate time series Physica D 2000 142346-82 httpdxdoiorg101016S0167-2789(00)00043-9

Shannon C A Mathematical theory of communication The Bell System Technical Journal 1948 27(3)623-56

Silva LEV Ferramentas computacionais na anaacutelise da variabilidade da frequecircncia cardiacuteaca atraveacutes do paradigma natildeo extensivo no estudo de cardiopatias [dissertaccedilatildeo] Satildeo Paulo Universidade de Satildeo Paulo 2010 97 p

Takens F Detecting Strange Attractors in Turbulence In Rand DA Young L-S Dynamical systems and turbulence New York Springer-Verlag 1981 v 898 p 366-81

Tavares AHMP Aspectos matemaacuteticos da entropia [dissertaccedilatildeo] Portugal Universidade de Aveiro 2003 98 p

Tokuda I Miyano T Aihara K Surrogate analysis for detecting nonlinear dynamics in normal vowels The Journal of the Acoustical Society of America 2001 110(6)3207-17

Torres ME Gamero LG Rufiner HL Study of complexity in normal and pathological speech signals In EMBC 2003 Proceedings of the 25th Annual International Conference of the IEEE Engineering in Medicine and Biology Society 2003 17-21 Sept Cancun Meacutexico IEEE 2003 p 2339-2342 httpdxdoiorg101109IEMBS20031280385

Tsallis C Possible generalization of Boltzmann-Gibbs statistics Journal of Statistical Physics 1988 52(12)479-87 httpdxdoiorg101007BF01016429

Zhang Y Jiang JJ Acoustic analyses of sustained and running voices from patients with laryngeal pathologies Journal of Voice January 2008 22(1)1-9 httpdxdoiorg101016jjvoice200608003

Autores

Washington Ceacutesar de Almeida Costa Francisco Marcos de Assis Departamento de Engenharia Eleacutetrica ndash DEE Universidade Federal de Campina Grande ndash UFCG Campina Grande PB Brasil

Washington Ceacutesar de Almeida Costa Silvana Luciene do Nascimento Cunha Costa Coordenaccedilatildeo do Curso Superior de Bacharelado em Engenharia Eleacutetrica ndash CCSBEE Instituto Federal de Educaccedilatildeo Ciecircncia e Tecnologia da Paraiacuteba ndash IFPB Av Primeiro de Maio 720 Jaguaribe CEP 58015-430 Joatildeo Pessoa PB Brasil

Benedito Guimaratildees Aguiar Neto Universidade Presbiteriana Mackenzie CEP 01302-907 Satildeo Paulo SP Brasil

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201314

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

IntroduccedilatildeoPatologias na laringe tecircm aumentado muito nos uacuteltimos anos devido a haacutebitos sociais natildeo saudaacuteveis ndash tabagismo e alcoolismo ndash e o abuso vocal As teacutecnicas tradicionais empregadas pela comunidade meacutedica ocorrem pela escuta da voz do paciente cujo diagnoacutestico depende da experiecircncia do profissional ou pela inspeccedilatildeo direta das pregas vocais por meio de teacutecnicas laringoscoacutepicas o que causa certo desconforto ao paciente (Godino-Llorente et al 2006)

A anaacutelise acuacutestica tem sido sugerida nas uacuteltimas deacutecadas como uma ferramenta auxiliar ao diagnoacutestico meacutedico de patologias lariacutengeas acompanhamento de terapias vocais tratamentos medicamentosos e acompanhamento antes e apoacutes cirurgias Eacute uma teacutecnica natildeo invasiva jaacute que necessita apenas da gravaccedilatildeo da voz do paciente a qual pode ser armazenada e processada Dessa forma eacute possiacutevel extrair e avaliar caracteriacutesticas e paracircmetros do sinal de voz e observar as consequecircncias causadas nos mesmos pela presenccedila de patologias na laringe Esta teacutecnica natildeo substitui o diagnoacutestico dos exames laringoscoacutepicos mas pode ser empregada em preacute-diagnoacutestico acompanhamentos de tratamentos medicamentosos poacutes-ciruacutergicos terapia vocal e indicaccedilatildeo da necessidade ou natildeo de exames mais sofisticados para um diagnoacutestico final

Por meio da anaacutelise acuacutestica utilizando teacutecnicas de processamento digital de sinais a voz do paciente pode ser gravada num computador pessoal e enviada para um especialista em outra localidade e este por meio de software especiacutefico avaliar a qualidade vocal Este sistema poderia portanto ser aplicado em redes de telemedicina nas quais os serviccedilos ofertados podem incluir o compartilhamento de arquivos de prontuaacuterios consultas exames e segunda opiniatildeo Aleacutem disso eacute possiacutevel a adoccedilatildeo de medidas simples e de baixo custo como a implantaccedilatildeo de sistemas de anaacutelise com diagnoacutesticos remotos que pode contribuir para diminuir a carecircncia de especialistas

Diversas teacutecnicas tecircm sido empregadas para quantificar e avaliar as desordens vocais provocadas por patologias lariacutengeas As teacutecnicas mais tradicionais empregam medidas tais como a frequecircncia fundamental jitter shimmer APQ HNR entre outras (Boyanov et al 1993 Manfredi et al 1999) Entretanto dependendo do grau de severidade da patologia a obtenccedilatildeo da frequecircncia fundamental se torna uma tarefa bastante complexa e o resultado obtido pode natildeo ser confiaacutevel (Godino-Llorente et al 2006) Outras teacutecnicas se baseiam no modelo linear de produccedilatildeo da fala (modelo fonte-filtro) em que a fonte eacute a laringe e o filtro eacute o trato vocal Nesse modelo os sons surdos satildeo modelados por uma fonte

de ruiacutedo aleatoacuterio e os sons sonoros por um trem de impulsos na frequecircncia fundamental do locutor (OrsquoShaughnessy 2000 Rabiner e Schafer 1978)

Uma questatildeo fundamental para que um processo automaacutetico de classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas seja eficiente eacute a escolha de quais caracteriacutesticas extraiacutedas do sinal de voz satildeo as mais apropriadas para capturar as desordens vocais provocadas pela presenccedila da patologia

Apesar do relativo sucesso do uso do modelo linear para a produccedilatildeo da fala em diversas aplicaccedilotildees estudos mais recentes tecircm apontado para a evidecircncia do caos na voz humana (Jiang et al 2006 Kokkinos e Maragos 2005 Henriacutequez et al 2009 Zhang e Jiang 2008) A anaacutelise dinacircmica natildeo linear de sinais de voz tem sido considerada por levar em conta aspectos da voz humana natildeo explorada na abordagem linear tais como variaccedilatildeo temporal da forma do trato vocal as ressonacircncias associadas agrave sua fisiologia as perdas devido ao atrito viscoso nas paredes internas do trato vocal a suavidade dessas paredes internas a radiaccedilatildeo do som nos laacutebios o acoplamento nasal e a flexibilidade (comportamento dinacircmico) associada agrave vibraccedilatildeo das pregas vocais (Kumar e Mullik 1996)

Antes de aplicar teacutecnicas natildeo lineares tais como aquelas inspiradas na teoria do caos a fenocircmenos dinacircmicos que ocorrem na natureza eacute necessaacuterio primeiro perguntar se a utilizaccedilatildeo de tais teacutecnicas avanccediladas eacute justificada pelos dados Enquanto muitos processos na natureza parecem muito improvaacuteveis a priori serem lineares a possiacutevel natureza natildeo linear pode natildeo ser evidente em aspectos especiacuteficos da sua dinacircmica O fato de que um sistema contenha componentes natildeo lineares natildeo implica necessariamente que esta natildeo linearidade tambeacutem se reflita em um sinal especiacutefico obtido a partir desse sistema (Schreiber e Schmitz 2000)

No caso particular da voz humana diversos trabalhos tecircm identificado agrave influecircncia das natildeo linearidades presentes no sistema de produccedilatildeo vocal a partir da anaacutelise do proacuteprio sinal de voz (Little et al 2007 Tokuda et al 2001) Em um desses trabalhos Max A Little (Little 2006) realizou uma investigaccedilatildeo a cerca de que sejam mantidos os pressupostos de um sistema linear variante no tempo para sinais de vozes apesar de mudanccedilas nos formantes (para diferentes vogais) ou na fonte de energia acuacutestica (ruiacutedo acuacutestico em consoantes e vibraccedilatildeo das pregas vocais em vogais) Os resultados obtidos indicaram que para a maioria dos sons vocaacutelicos tanto saudaacuteveis como patoloacutegicos a hipoacutetese de que tais sinais tenham sido gerados a partir de um sistema linear pode ser rejeitada e que modelos natildeo lineares estocaacutesticos ou determiniacutesticos podem ser mais confiaacuteveis Por outro lado no caso

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 20134

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

de sons consonontais fricativos saudaacuteveis e algumas vozes patoloacutegicas (caso da voz soprosa) natildeo se pode descartar o modelo linear

Recentes pesquisas relacionadas agraves seacuteries temporais geradas a partir dos mecanismos de produccedilatildeo da voz humana tecircm sido realizadas considerando-se as teacutecnicas da dinacircmica natildeo linear e da teoria do caos com objetivos variados dentre os quais podem ser destacados classificaccedilatildeo de fonemas (Johnson et al 2005 Kokkinos e Maragos 2005) reconhecimento automaacutetico de locutor (Petry 2002) discriminaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas diagnoacutestico de patologias lariacutengeas e avaliaccedilatildeo de efeitos de tratamentos cliacutenicos (Dajer 2006 Henriacutequez et al 2009 Jiang et al 2006 Scalassara et al 2008 Torres et al 2003 Zhang e Jiang 2008)

Para que um sistema de auxiacutelio a diagnoacutesticos possa ser implementado com eficiecircncia torna-se primordial o estudo de teacutecnicas que ofereccedilam um excelente desempenho para que o erro de diagnoacutestico seja miacutenimo A investigaccedilatildeo acerca de quais satildeo as melhores caracteriacutesticas que distinguem um sinal de voz saudaacutevel de um sinal de voz patoloacutegica e principalmente que permita distinguir entre patologias ainda eacute um campo em desenvolvimento

Na literatura especiacutefica a maioria das pesquisas se baseia em discriminar entre vozes saudaacuteveis e patoloacutegicas em geral sem no entanto discriminar entre patologias distintas Neste trabalho pretende-se investigar o potencial discriminativo de medidas oriundas da anaacutelise dinacircmica natildeo linear para classificar sinais de vozes saudaacuteveis e patoloacutegicas bem como distinguir qual patologia estaacute afetando a qualidade vocal As patologias lariacutengeas consideradas neste trabalho satildeo paralisia nas pregas vocais edemas de Reinke e noacutedulos vocais As medidas empregadas oriundas da anaacutelise dinacircmica natildeo linear satildeo Dimensatildeo de correlaccedilatildeo entropia de correlaccedilatildeo entropia aproximada entropia de Shannon entropia de Tsallis expoente de Hurst maior expoente de Lyapunov e primeiro miacutenimo da funccedilatildeo de informaccedilatildeo muacutetua A teacutecnica de anaacutelise de discriminante quadraacutetica eacute aplicada para classificar os sinais em saudaacuteveis ou patoloacutegicos considerando as caracteriacutesticas de forma individual e combinada

No intuito de melhorar as taxas de classificaccedilatildeo na discriminaccedilatildeo entre patologias eacute realizada uma combinaccedilatildeo das medidas da anaacutelise natildeo linear com coeficientes LPC (Linear Prediction Coding) obtidos a partir da anaacutelise linear para o modelo de produccedilatildeo da fala O objetivo dessa combinaccedilatildeo eacute investigar se caracteriacutesticas de abordagens diferentes podem extrair

informaccedilotildees que combinadas possam refletir mais especificamente as desordens vocais provocadas pela presenccedila de uma determinada patologia na laringe

Materiais e Meacutetodos

Base de dados

Neste trabalho os sinais processados satildeo provenientes da base de dados comercialmente disponiacutevel a Disordered Voice Database Modelo 4337 gravada pelo Massachusetts Eye and Ear Infirmary (MEEI) (Kay Elemetrics 1994) A base de dados conteacutem pronuacutencias sustentadas da vogal a sendo 53 arquivos de locutores com voz saudaacutevel e 657 com vozes patoloacutegicas (vozes afetadas por patologias lariacutengeas) Foram selecionados 130 sinais sendo os 53 sinais de vozes saudaacuteveis e 77 sinais de pacientes com patologia na laringe (31 com edema de Reinke 28 com paralisia e 18 com noacutedulos) Os sinais de vozes saudaacuteveis originalmente amostrados a uma frequecircncia de 50000 amostrass foram subamostrados a 25000 amostrass para equiparar o nuacutemero de amostras aos sinais patoloacutegicos Os sinais de vozes tecircm duraccedilatildeo meacutedia de um segundo para os sinais patoloacutegicos e de 3 segundos para os sinais de vozes saudaacuteveis Os sinais disponibilizados na base de dados satildeo previamente processados por isso natildeo conteacutem intervalos de silecircncio antes ou depois da elocuccedilatildeo Evitando assim quaisquer problemas frequentemente encontrados em iniacutecio e fim de gravaccedilatildeo

Metodologia

O sistema de classificaccedilatildeo eacute representado de forma resumida pela Figura 1 Apoacutes a aquisiccedilatildeo do sinal por um microfone o sinal armazenado em um computador pessoal eacute processado Satildeo analisados 960 ms de cada sinal de voz sendo 30 quadros de 32 ms de forma a preservar a estacionariedade A seguir eacute feita a extraccedilatildeo de caracteriacutesticas e logo apoacutes a classificaccedilatildeo dos sinais Satildeo realizadas duas abordagens distintas para a extraccedilatildeo de caracteriacutesticas uma abordagem parameacutetrica baseada no modelo linear de produccedilatildeo da fala e outra em medidas obtidas a partir da anaacutelise dinacircmica natildeo linear Na abordagem parameacutetrica os coeficientes LPC satildeo extraiacutedos de cada sinal apoacutes sua segmentaccedilatildeo configurando um vetor de ordem p (ordem do filtro de prediccedilatildeo) para cada segmento Neste trabalho satildeo utilizados diferentes valores de p (12 16 20 e 24) com o intuito de avaliar o efeito do aumento da ordem de prediccedilatildeo no desempenho da classificaccedilatildeo

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 5

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

Extraccedilatildeo de caracteriacutesticas

Apoacutes a segmentaccedilatildeo do sinal eacute realizada a extraccedilatildeo de caracteriacutesticas feitas sob as duas abordagens para o modelo de produccedilatildeo de fala (linear e natildeo linear) descritas a seguir

Anaacutelise dinacircmica natildeo linear

A anaacutelise dinacircmica de sinais pode ser feita por meio de um modelo matemaacutetico associado ao sistema de produccedilatildeo desses sinais ou por meio da anaacutelise de seacuteries temporais O ponto essencial desta anaacutelise eacute que uma seacuterie temporal conteacutem informaccedilotildees sobre variaacuteveis natildeo observaacuteveis do sistema o que permite a reconstruccedilatildeo do espaccedilo de estados (Savi 2006) Cada sinal de voz a ser analisado corresponde a uma seacuterie temporal

A teacutecnica de reconstruccedilatildeo do espaccedilo de estados eacute baseada no teorema da imersatildeo de Takens (1981) Ele demonstrou que com o uso da teacutecnica dos tempos de retardo ou meacutetodo das coordenadas defasadas eacute possiacutevel reconstruir certas propriedades topoloacutegicas do espaccedilo de estados (atrator) a partir da seacuterie temporal xi em que vetores ξi m-dimensionais satildeo reconstruiacutedos de forma que

( ) ( ) ( ( 1) )x t x t x t mi i i iξ = + τ + minus τ (1)

onde i = 1 2 T ndash (m ndash 1)τ T eacute o nuacutemero total de amostras m eacute a chamada dimensatildeo de imersatildeo e τ eacute o passo de reconstruccedilatildeo ou tempo de defasagem (Fiedler-Ferrara e Prado 1994)

A determinaccedilatildeo eficiente dos paracircmetros de reconstruccedilatildeo (tempo de defasagem e dimensatildeo de imersatildeo) eacute de extrema importacircncia para a identificaccedilatildeo dos invariantes geomeacutetricos do sistema tais como a dimensatildeo do atrator e os expoentes de Lyapunov A partir da reconstruccedilatildeo do espaccedilo de fases dos sinais analisados eacute realizada a extraccedilatildeo das medidas de dinacircmica natildeo linear

Na Figura 2 estaacute ilustrada a reconstruccedilatildeo em duas dimensotildees do atrator de um dos sinais de voz analisados utilizando (a) um passo de reconstruccedilatildeo bem menor do que o adequado (τ = 1) (b) utilizando um passo de reconstruccedilatildeo ldquooacutetimordquo determinado com o uso da funccedilatildeo de informaccedilatildeo muacutetua (τ = 5) e (c) usando um passo bem maior do que o adequado (τ = 10)

O meacutetodo utilizado para obtenccedilatildeo do passo de reconstruccedilatildeo utilizado neste trabalho eacute devido a Fraser e Swinney (1986) e estaacute baseado na funccedilatildeo de informaccedilatildeo muacutetua Neste meacutetodo o valor do tempo de defasagem ideal corresponde ao primeiro miacutenimo local quando este existir da funccedilatildeo de informaccedilatildeo muacutetua meacutedia I(τ)

a b c

Figura 2 Reconstruccedilatildeo do atrator da vogal sustentada a em um intervalo de 32 ms Paracircmetros m = 2 e a) τ = 1 amostra b) τ = 5 amostras e c) τ = 10 amostrasFigure 2 Atractor reconstruction of the sustained vowel a for a 32 ms frame Parameters m = 2 and a) τ = 1 sample b) τ = 5 samples and c) τ = 10 samples

Figura 1 Diagrama em blocos do sistema de classificaccedilatildeo de vozes patoloacutegicasFigure 1 Block diagram of pathological voices classification system

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 20136

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

Funccedilatildeo de informaccedilatildeo muacutetua

A informaccedilatildeo muacutetua meacutedia fornece as mesmas informaccedilotildees que a funccedilatildeo de correlaccedilatildeo fornece em sistemas lineares sendo na realidade um tipo de generalizaccedilatildeo para sistemas natildeo lineares (Savi 2006) Na Figura 3 estaacute ilustrado o comportamento da I(τ) em funccedilatildeo de τ para o mesmo segmento do sinal cujo atrator estaacute mostrado na Figura 2 A linha tracejada indica o ponto onde ocorre o primeiro miacutenimo de I(τ) (FMMI ndash First Minimum of Mutual Information) e assim a determinaccedilatildeo do passo de reconstruccedilatildeo ldquooacutetimordquo para este segmento (τ = 5)

A partir de um histograma de b intervalos de classe (bins) criado para estimar a distribuiccedilatildeo de probabilidade dos dados de um sinal x(t) a informaccedilatildeo muacutetua meacutedia entre x(t) e sua versatildeo defasada x(t + τ) eacute estimada por meio da expressatildeo

( ) ( ) ( )( ) ( )

21 1

( ) ( )( ) ( ) log

( ) ( )b b i j

i ji j i j

IP x t x t

P x t x tP x t P x t= =

= + τ

τ + τsum sum + τ

(2)

em que Pi(x(t)) eacute a probabilidade de que o sinal x(t) assuma um valor dentro do i-eacutesimo intervalo do histograma Pj(x(t+τ)) eacute a probabilidade de que x(t + τ) esteja no j-eacutesimo intervalo e Pij(x(t) x(t+τ)) eacute a probabilidade de que simultaneamente o sinal de x(t) esteja no i-eacutesimo intervalo e x(t + τ) no j-eacutesimo intervalo (Kantz e Schreiber 2004)

Dimensatildeo de correlaccedilatildeo

A dimensatildeo de correlaccedilatildeo uma das formas mais comuns de se calcular a dimensatildeo de um atrator eacute uma medida geomeacutetrica de uma trajetoacuteria no espaccedilo de fase que descreve o quanto dois pontos dessa trajetoacuteria satildeo correlacionados Ela mede a probabilidade de se encontrar um par aleatoacuterio de pontos dentro de um determinado volume elementar (Savi 2006)

Grassberger e Procaccia (1983) desenvolveram um algoritmo para o caacutelculo da dimensatildeo de correlaccedilatildeo em que a probabilidade de se ter dois pontos do atrator numa caixa de lado ε eacute aproximada pela probabilidade de que a distacircncia entre dois pontos seja menor que ε Esse algoritmo fornece um limite inferior e um valor aproximado para a dimensatildeo fractal (Fiedler-Ferrara e Prado 1994)

Seja q(ε) a fraccedilatildeo de pontos do atrator que estaacute dentro de uma hiperesfera de raio ε centrada no ponto ξi (i-eacutesimo vetor de imersatildeo m-dimensional) Essa fraccedilatildeo eacute expressa pela relaccedilatildeo

( )1

1( )N

i jj

qN =

ε = θ ε minus ξ minus ξsum

(3)

sendo N o nuacutemero de pontos no atrator A funccedilatildeo degrau θ(x) eacute tal que θ = 1 se x ge 0 e θ = 0 se x lt 0 Define-se a integral de correlaccedilatildeo Cm(ε) como

1( )

1( ) lim ( )1

Nm N i i j

C qN rarrinfin = ne

ε = εsumminus

(4)

A dimensatildeo de correlaccedilatildeo eacute entatildeo calculada para cada valor de m como

2 0

log ( )limlog( )

mCDεrarr

εε

(5)

ou seja D2 eacute a inclinaccedilatildeo de uma reta definida pelo graacutefico log Cm(ε) times log (ε) para um valor infinitesimal de ε

Na Figura 4 eacute apresentado o comportamento da dimensatildeo de correlaccedilatildeo em funccedilatildeo de m e de ε para um segmento de 32 ms de um sinal de voz saudaacutevel A fim de se estimar o valor de D2 em cada segmento do sinal satildeo consideradas as inclinaccedilotildees da integral de correlaccedilatildeo para diferentes dimensotildees de imersatildeo com m variando de 4 a 10

Figura 3 Funccedilatildeo de Informaccedilatildeo Muacutetua e determinaccedilatildeo do passo de reconstruccedilatildeo oacutetimo para um segmento de 32 ms da vogal sustentada aFigure 3 Mutual Information Function and the determination of optimal reconstruction step for a 32 ms frame of a sustained vowel

Figura 4 Comportamento da dimensatildeo de correlaccedilatildeo para um segmento de 32 ms de um sinal de voz saudaacutevel em funccedilatildeo da dimensatildeo de imersatildeo e do valor de ε em que as curvas correspondem as diferentes dimensotildees de imersatildeo (m = 4 10) de baixo para cima respectivamenteFigure 4 Correlation dimension behavior for a 32 ms segment of a healthy speech signal in function of the embedded dimension and ε value wherein the curves correspond to the different embedded dimensions (m = 4 hellip 10) upwards respectively

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 7

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

A partir da inspeccedilatildeo visual do comportamento dos valores da dimensatildeo de correlaccedilatildeo em funccedilatildeo de m e de ε eacute levado a efeito a determinaccedilatildeo do valor de ε que oferece o menor coeficiente de variaccedilatildeo entre as curvas dentro de um intervalo de convergecircncia O valor de D2 para o segmento eacute estimado como sendo a meacutedia dos valores obtidos de cada curva para este valor de ε Para o segmento ilustrado na Figura 4 o quadrado sobreposto ao graacutefico indica os valores encontrados (ε = 0050 e D2 = 143)

Entropia de Shannon

Dado um determinado sinal a entropia de Shannon H1 eacute definida como (Shannon 1948)

( )1 21

logM

i ii

H p p=

= minussum

(6)

em que pi eacute a probabilidade de que o sinal pertenccedila a um intervalo i e M eacute o nuacutemero de particcedilotildees em seu espaccedilo de fase

A entropia de Shannon H1 eacute a medida de informaccedilatildeo necessaacuteria para localizar um sistema em um determinado estado significando que H1 eacute a medida da incerteza sobre o sistema fiacutesico (Torres et al 2003) As medidas de entropia avaliam o grau de desordem de um sinal podendo ser empregadas para avaliar as desordens nos sinais de vozes afetados por patologias na laringe (Little et al 2007 Scalassara et al 2008)

Entropia de correlaccedilatildeo

O procedimento de Grassberger-Procaccia permite estimar a entropia de Correlaccedilatildeo K2 a partir das integrais de correlaccedilatildeo Cm(ε) (Equaccedilatildeo 4) da seguinte forma

21

( )1( ) ln( )

m

m

CKC +

εε =τ ε

(7)

em que τ eacute o passo utilizado na reconstruccedilatildeo e m eacute a dimensatildeo de imersatildeo

Na Figura 5 eacute apresentado o comportamento da entropia de correlaccedilatildeo em funccedilatildeo de m e de ε para um segmento de 32 ms de um sinal de voz patoloacutegico A fim de se estimar o valor de K2 em cada segmento do sinal satildeo consideradas as curvas com os valores da entropia de correlaccedilatildeo para diferentes dimensotildees de imersatildeo com m variando de 4 a 10 e diferentes valores de ε

A partir da inspeccedilatildeo visual do comportamento dos valores da entropia de correlaccedilatildeo em funccedilatildeo de m e de ε eacute levada a efeito a determinaccedilatildeo do valor de ε que oferece o menor coeficiente de variaccedilatildeo entre as curvas dentro de um intervalo de convergecircncia O valor de K2 para o segmento eacute estimado como sendo

a meacutedia dos valores obtidos de cada curva para este valor de ε A entropia de correlaccedilatildeo do sinal eacute tomada como sendo a meacutedia calculada sob todos os segmentos do sinal analisado No caso do segmento ilustrado na Figura 5 o quadrado sobreposto ao graacutefico indica os valores encontrados (ε = 0031 e K2 = 0184)

Entropia aproximada

A entropia aproximada ApEn eacute uma medida da informaccedilatildeo condicional meacutedia gerada por pontos divergentes numa trajetoacuteria no espaccedilo de fase (Arias-Londono et al 2011) Considerando valores fixos para m e ε e considerando os vetores dados na Equaccedilatildeo 1 a entropia aproximada eacute definida como (Pincus 1991)

1( ) lim ( ) ( )m mN

ApEn m +

rarrinfin ε = ϕ ε minus ϕ ε

(8)

em que11

1( ) ( 1) log ( )

N mm

iN m q

minus +minus

=ϕ ε = minus + εsum

(9)

e q(ε) eacute definida pela Equaccedilatildeo 3 e N eacute o nuacutemero de vetores do atrator reconstruiacutedo em uma dimensatildeo de imersatildeo miacutenima m

A capacidade de discriminar mudanccedilas de complexidade a partir de uma quantidade relativamente pequena de dados faculta a aplicaccedilatildeo da ApEn em uma variedade de contextos incluindo processos determiniacutesticos caoacuteticos e estocaacutesticos (Pincus 1991) Embora a medida da entropia aproximada natildeo seja uma medida de caos ela quantifica a regularidade do processo de imersatildeo em seacuteries temporais (Torres et al 2003)

Figura 5 Comportamento da entropia de correlaccedilatildeo para um segmento de 32 ms de um sinal de voz patoloacutegico em funccedilatildeo da dimensatildeo de imersatildeo e do valor de ε em que as curvas correspondem as diferentes dimensotildees de imersatildeo (m = 410) de baixo para cima respectivamenteFigure 5 Behavior of entropy correlation for a 32 ms frame of a pathological speech signal related to embedded dimension and ε value wherein the curves correspond to the different embedded dimensions (m = 4 hellip 10) upwards respectively

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 20138

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

Entropia de Tsallis

A entropia de Tsallis eacute uma generalizaccedilatildeo da entropia de Boltzmann-Gibbs (Chakrabarti e De 2000) Eacute definida como (Tsallis 1988)

111

qWi i

qpH k

q=minus sum=

minus (10)

em que q isin caracteriza a generalizaccedilatildeo e pi satildeo as probabilidades associadas com as W ( )W isinconfiguraccedilotildees possiacuteveis do sistema A entropia de Boltzmann-Gibbs eacute encontrada quando no limite qrarr1

A principal caracteriacutestica da entropia de Tsallis eacute a sua natildeo aditividade (Tavares 2003) Isto eacute a informaccedilatildeo contida em um sistema composto natildeo eacute a simples soma da informaccedilatildeo dos subsistemas que o compotildeem As entropias de Shannon e de Boltzmann apresentam a aditividade como uma de suas caracteriacutesticas A ideia principal da utilizaccedilatildeo da entropia de Tsallis eacute verificar a contribuiccedilatildeo do paracircmetro entroacutepico (q) na avaliaccedilatildeo de caracteriacutesticas natildeo extensivas (interaccedilotildees natildeo lineares) presentes na dinacircmica das seacuteries temporais (Silva 2010)

Expoentes de Lyapunov

Os expoentes de Lyapunov estatildeo relacionados agrave taxa meacutedia de divergecircncia ou de convergecircncia exponencial de oacuterbitas vizinhas no espaccedilo de fase Geralmente um sistema contendo pelo menos um expoente de Lyapunov positivo eacute definido como caoacutetico por outro lado um sistema sem nenhum expoente positivo eacute regular (Jiang et al 2006)

Neste trabalho eacute utilizada uma rotina do pacote TISEAN (Hegger et al 1999) a fim de se obter o crescimento exponencial meacutedio das distacircncias entre duas trajetoacuterias que eacute baseada no algoritmo de Kantz (1994) O programa basicamente gera os resultados da expressatildeo (Kantz e Schreiber 2004)

( ) 00 0

1

1 1( ) ln( ) n no

Nn n n n

n S Sn

S n s sN S +∆ +∆

= isinυ

∆ = minussum sum υ

(11)

onde S(∆n) eacute chamado de fator de crescimento (stretching factor) Sn0 satildeo os vetores de imersatildeo e υ(Sn0) eacute a vizinhanccedila de Sn0 com diacircmetro ε Na Figura 6 estaacute ilustrado o comportamento de S(∆n) em funccedilatildeo do nuacutemero de iteraccedilotildees ∆n para trecircs diferentes valores de ε e m variando de 4 a 8 A linha reta representa a inclinaccedilatildeo meacutedia das curvas mostradas e sua inclinaccedilatildeo eacute a estimaccedilatildeo para o maior expoente de Lyapunov λ1

Expoente de HurstO paracircmetro ou expoente de Hurst (Hurst 1951) eacute uma medida de autossimilaridade que vem sendo empregada em diversas aacutereas tais como gerenciamento de traacutefego autossimilar de redes de computadores (Gomes et al 2001) reconhecimento de padrotildees sonoros para avaliaccedilatildeo de sons pulmonares (Custoacutedio 1999) sistemas de reconhecimento de locutor (SantrsquoAna et al 2006) detecccedilatildeo de diferentes aacutereas do ceacuterebro (Rodriacuteguez-Saacutenchez et al 2008) e anaacutelise de sinais EEG (eletroencefalograma) (Natarajan et al 2004) entre outros Em processamento de sinais de voz este paracircmetro tem sido empregado por representar o comportamento estocaacutestico da voz (Fantinato 2008) Aleacutem disso apresenta um baixo custo computacional podendo ser obtido em tempo real durante atividade da fala (SantrsquoAna et al 2006)

Quanto maior o valor do paracircmetro de Hurst maior eacute o impacto das autocorrelaccedilotildees no desempenho do sistema Aleacutem disso pequenas variaccedilotildees no paracircmetro de Hurst podem significar mudanccedilas significativas no comportamento dos sinais caracterizando o grau de desordem do mesmo (Gomes et al 2001) O estimador RS empregado neste trabalho eacute um dos mais conhecidos e simples meacutetodos para estimar o grau de dependecircncia de uma sequecircncia amostral A estatiacutestica RS eacute a soma parcial dos desvios em relaccedilatildeo a sua meacutedia de uma sequecircncia reescalonada pelo seu desvio padratildeo (Alvarez-Ramirez et al 2008)

Se o processo estocaacutestico associado agrave sequecircncia eacute escalonada sobre certo domiacutenio n a estatiacutestica RS segue a equaccedilatildeo

HR S an= (12)

em que RS eacute a distacircncia reescalonada (dividida pelo desvio padratildeo) a eacute uma constante e H eacute o expoente de Hurst

Anaacutelise preditiva linearA ideia baacutesica na prediccedilatildeo linear eacute a de que o valor de uma amostra pode ser aproximado (predita) por

Figura 6 Comportamento de S(∆n) em funccedilatildeo do nuacutemero de iteraccedilotildees de ε e de m (m = 4 8)Figure 6 Behavior of S(∆n) related to iteration number ε and m (m = 48)

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 9

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

combinaccedilatildeo linear dos valores das amostras anteriores levando em consideraccedilatildeo a correlaccedilatildeo entre estas Os coeficientes de prediccedilatildeo linear ou coeficientes LPC (Linear Predictive Coding) satildeo estimados por minimizaccedilatildeo do erro quadraacutetico entre a amostra atual e a sua prediccedilatildeo (OrsquoShaughnessy 2000 Rabiner e Juang 1993)

O modelo linear de produccedilatildeo da fala incorpora os efeitos dos pulsos glotais trato vocal e da radiaccedilatildeo dos laacutebios como um filtro linear (Rabiner e Schafer 1978) A fonte eacute uma sequecircncia de impulsos quase perioacutedicos utilizados para gerar sons sonoros ou a adiccedilatildeo de uma sequecircncia de ruiacutedo aleatoacuterio para sons surdos

Um fator de ganho G eacute ajustado para controlar a intensidade da excitaccedilatildeo Combinando os efeitos dos pulsos glotais do trato vocal e da radiaccedilatildeo o modelo pode ser representado por uma funccedilatildeo de transferecircncia de apenas polos H(z) como

1( )

1 ( )p kk

GH zk zminus

==

minus αsum (13)

Os termos α(k) representam os coeficientes de prediccedilatildeo linear (coeficientes LPC) e p a ordem do filtro de prediccedilatildeo

O meacutetodo LPC estima cada amostra de voz baseado numa combinaccedilatildeo linear de p amostras anteriores Um valor de p maior representa um modelo mais preciso A anaacutelise LPC fornece um conjunto de paracircmetros da fala que representa o trato vocal Espera-se que qualquer mudanccedila na estrutura anatocircmica do trato vocal devido agrave patologia afete os coeficientes LPC

Classificaccedilatildeo

Apoacutes a extraccedilatildeo das caracteriacutesticas tanto pela anaacutelise linear quanto pela natildeo linear eacute realizado o processo de classificaccedilatildeo Neste processo eacute aplicada a anaacutelise discriminante quadraacutetica (QDA) com validaccedilatildeo cruzada em que satildeo utilizados 10 subconjuntos (folds) Satildeo avaliados os desempenhos de classificadores implementados com cada uma das caracteriacutesticas de forma individual e de classificadores implementados a partir da combinaccedilatildeo dessas caracteriacutesticas

Outros classificadores satildeo implementados com coeficientes LPC de ordem p variando de 12 a 24 (p = 12 16 20 e 24) Apoacutes a avaliaccedilatildeo individual de cada meacutetodo (linear e natildeo linear) satildeo construiacutedos vetores hiacutebridos em que a cada vetor LPC de ordem p satildeo adicionadas as medidas natildeo lineares Uma nova avaliaccedilatildeo de desempenho eacute realizada a partir dos vetores hiacutebridos

Para avaliaccedilatildeo de desempenho do processo de classificaccedilatildeo trecircs medidas satildeo utilizadas acuraacutecia sensibilidade e especificidade A Acuraacutecia mede a

taxa de classificaccedilatildeo correta global do teste ou seja a capacidade do teste de identificar corretamente quando haacute e quando natildeo haacute presenccedila da doenccedila A Acuraacutecia (Equaccedilatildeo 14) eacute definida como a relaccedilatildeo entre todos os sinais corretamente classificados e o nuacutemero total de sinais avaliados

VP VNAcuraacuteciaVP VN FP FN

+=+ + +

(14)

em que VP representa os verdadeiros positivos ou seja o nuacutemero de sinais classificados corretamente como patoloacutegicos VN representa os verdadeiros negativos ou seja em quantos sinais foram detectados a ausecircncia correta da patologia FP os falsos positivos ou a quantidade de sinais saudaacuteveis classificados erroneamente como patoloacutegicos e FN os falsos negativos ou seja a quantidade de sinais patoloacutegicos classificados erroneamente como saudaacuteveis

A Sensibilidade mede a capacidade do teste em identificar corretamente a doenccedila entre aqueles que a possuem ou seja o quatildeo sensiacutevel eacute o teste Eacute a relaccedilatildeo entre os sinais patoloacutegicos corretamente classificados e o nuacutemero total de sinais patoloacutegicos dada por

VPSensibilidadeVP FN

=+

(15)

A Especificidade mede a capacidade do teste em excluir corretamente aqueles que natildeo possuem a doenccedila ou seja o quatildeo especiacutefico eacute o teste Eacute a relaccedilatildeo entre os sinais saudaacuteveis corretamente classificados e o nuacutemero total de sinais saudaacuteveis

VNEspecificidadeVN FP

=+

(16)

Os resultados obtidos no processo de classificaccedilatildeo satildeo apresentados a seguir

ResultadosNa Tabela 1 satildeo apresentados os valores de acuraacutecia obtidos com o uso de cada uma das medidas da anaacutelise dinacircmica natildeo linear (MNL) para a classificaccedilatildeo entre vozes saudaacuteveis (SDL) e patoloacutegicas (PTL) usando a anaacutelise discriminante quadraacutetica (QDA ndash Quadratic Discriminant Analysis) A classe dos sinais patoloacutegicos inclui os sinais afetados por edema noacutedulos e paralisia nas pregas vocais O expoente de Hurst H foi o paracircmetro mais eficiente em capturar as desordens vocais presentes nos sinais de vozes patoloacutegicas comparadas aos sinais de vozes saudaacuteveis tendo a maior acuraacutecia no processo de classificaccedilatildeo

Na Tabela 2 satildeo apresentados inicialmente os resultados obtidos na classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas (SDL times PTL) mediante a

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201310

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

combinaccedilatildeo das medidas Observa-se que com a combinaccedilatildeo de apenas quatro medidas entre as oito foi obtida a maior acuraacutecia (9603 plusmn 411) com as medidas entropia de Shannon (H1) entropia de Tsallis (Hq) expoente de Hurst (H) e a dimensatildeo de correlaccedilatildeo (D2) O acreacutescimo das trecircs medidas ao expoente de Hurst proporcionou um aumento de cerca de 9 no valor da acuraacutecia alcanccedilada com o uso individual desta caracteriacutestica

As patologias satildeo separadas em classes diferentes (paralisia edema ou noacutedulo) e comparadas aos sinais saudaacuteveis constituindo as seguintes comparaccedilotildees saudaacutevel times edema (SDL times EDM) saudaacutevel times paralisa (SDL times PRL) e saudaacutevel times noacutedulo (SDL times NDL) Como apresentado na Tabela 2 nesses casos as taxas de acuraacutecia meacutedia satildeo superiores a 97 com todas as taxas de especificidade chegando a 100 o que significa que nenhum sinal saudaacutevel testado foi considerado patoloacutegico O expoente de Hurst e as entropias de Shannon e de Tsallis aparecem em todas as combinaccedilotildees associando-se a outras medidas no caso da discriminaccedilatildeo entre saudaacutevel e edema e entre saudaacutevel e paralisia

Na distinccedilatildeo entre patologias observa-se pela Tabela 2 mesmo com a combinaccedilatildeo das medidas

a acuraacutecia meacutedia atingiu no maacuteximo 86 enquanto que os valores de sensibilidade meacutedia natildeo chegaram a 75 Dessa forma visando aumentar o desempenho na classificaccedilatildeo foi investigada a influecircncia do uso combinado das medidas da anaacutelise natildeo linear com os coeficientes LPC na discriminaccedilatildeo entre as patologias consideradas Nas Figuras 7 a 9 satildeo mostrados os resultados obtidos na discriminaccedilatildeo entre paralisia e edema paralisia e noacutedulo e entre edema e noacutedulo respectivamente

Tabela 2 Avaliaccedilatildeo de desempenho das medidas combinadas ndash valores de acuraacutecia obtidos na classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas e entre as patologiasTable 2 Performance evaluation of combined measures - values of the obtained accuracy in classification between healthy and pathological voices and among pathologies

Classificaccedilatildeo Caracteriacutesticas Acuraacutecia () Sensibilidade () Especificidade ()SDL times PTL H1 Hq H e D2 9603 plusmn 411 9446 plusmn 513 9800 plusmn 452SDL times EDM H1 Hq H D2 e K2 9875 plusmn 283 9667 plusmn 754 100SDL times PRL FMMI H D2 e H1 ou Hq 9750 plusmn 377 9333 plusmn 1005 100SDL times NDL H1 Hq e H 9857 plusmn 323 9500 plusmn 1131 100PRL times EDM λ1 FMMI Hq ApEn D2 e K2 7700 plusmn 1459 7417 plusmn 1874 8167 plusmn 1817PRL times NDL λ1 H ApEn D2 e K2 8600 plusmn 1103 6500 plusmn 2966 9667 plusmn 1494

EDM times NDL λ1 FMMI H1 Hq H e D2 7600 plusmn 951 5500 plusmn 2639 8667 plusmn 1231

Tabela 1 Avaliaccedilatildeo de desempenho das medidas individuais ndash valores de Acuraacutecia () obtidos na classificaccedilatildeo entre vozes saudaacuteveis e vozes patoloacutegicasTable 1 Performance evaluation of individual measures ndash values of the obtained accuracy in classification between healthy and pathological voices

Medidas Saudaacutevel times Patoloacutegica Saudaacutevel times Edema Saudaacutevel times Paralisia Saudaacutevel times Noacutedulo

λ1 5451 plusmn 823 6122 plusmn 1105 5855 plusmn 999 5232 plusmn 1308FMMI 6255 plusmn 574 6022 plusmn 848 6864 plusmn 1010 5821 plusmn 1446

H1 6085 plusmn 831 6944 plusmn 882 6582 plusmn 607 7464 plusmn 803Hq 6261 plusmn 921 6744 plusmn 718 6855 plusmn 766 7607 plusmn 682H 8709 plusmn 591 8567 plusmn 513 8809 plusmn 753 9429 plusmn 528

ApEn 5660 plusmn 672 6806 plusmn 615 6929 plusmn 1351 6667 plusmn 1037D2 7936 plusmn 1077 8458 plusmn 887 8750 plusmn 809 8262 plusmn 1254K2 5288 plusmn 509 6097 plusmn 1032 6196 plusmn 1198 5738 plusmn 881

Acuraacutecia maacuteximaMaximum accuracy

Figura 7 Classificaccedilatildeo entre vozes afetadas por paralisia e sinais afetados por edema nas pregas vocaisFigure 7 Classification between voices affected by vocal fold paralysis and vocal fold edema

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 11

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

Na discriminaccedilatildeo entre paralisia e edema a taxa de acuraacutecia sai de 9655 plusmn 151 com 12 coeficientes LPC para 9924 plusmn 052 com 24 coeficientes Aleacutem do acreacutescimo na acuraacutecia meacutedia em mais de 18 em relaccedilatildeo ao uso dos melhores resultados individuais (LPC) com a combinaccedilatildeo (MNL e LPC) o erro padratildeo caiu consideravelmente aumentando a confiabilidade do teste

Na discriminaccedilatildeo entre paralisia e noacutedulo a acuraacutecia de 86 soacute com as medidas natildeo lineares cresce para valores maiores que 99 Com 12 coeficientes LPC a acuraacutecia eacute de 9919 plusmn 055 com sensibilidade 100 e especificidade meacutedia de aproximadamente 98

A acuraacutecia meacutedia na classificaccedilatildeo entre edema e noacutedulo antes de 76 com as medidas natildeo lineares e cerca de 70 com LPC chega a mais de 98 com o vetor hiacutebrido com apenas 12 coeficientes E passa dos 99 a partir de 16 coeficientes quando associados agraves medidas natildeo lineares

DiscussatildeoPelos resultados apresentados constata-se que o desempenho da classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas aumentou significativamente com a combinaccedilatildeo das medidas da anaacutelise dinacircmica natildeo linear Nos melhores resultados o expoente de Hurst que se destacou como melhor medida individual aparece em todas as combinaccedilotildees juntamente com as entropias de Shannon e de Tsallis para a classificaccedilatildeo entre os sinais de vozes saudaacuteveis e sinais afetados por paralisa edema ou noacutedulo No entanto essas medidas natildeo foram eficazes em discriminar entre patologias apresentando taxas inferiores agraves apresentadas na discriminaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas

A anaacutelise LPC comparada agraves outras medidas empregadas mostra-se mais eficaz em discriminar entre patologias Observa-se que o valor da acuraacutecia aumenta com o aumento da ordem de preditor Aleacutem disso o desempenho na classificaccedilatildeo entre patologias melhora significativamente ao combinar as medidas natildeo lineares com os coeficientes LPC

Eacute importante considerar que o aumento na ordem dos coeficientes LPC estaacute associado a um maior volume de dados a serem processados aumentando o custo computacional No entanto caso seja mais relevante a precisatildeo do diagnoacutestico do que a realizaccedilatildeo da anaacutelise em tempo real eacute possiacutevel optar por empregar uma maior quantidade de coeficientes LPC Observa-se pelos resultados que o valor da acuraacutecia natildeo teve um aumento tatildeo consideraacutevel com o aumento da ordem de prediccedilatildeo aleacutem de 16 coeficientes

ConclusatildeoA partir dos resultados obtidos constata-se que as medidas natildeo lineares conseguem capturar bem as desordens vocais provocadas por patologias nas pregas vocais como noacutedulos edemas e paralisia A consideraccedilatildeo das natildeo linearidades inerentes ao processo de produccedilatildeo da fala e sua consequente anaacutelise utilizando medidas natildeo lineares eacute eficiente em distinguir um sinal saudaacutevel de um sinal patoloacutegico comprovadamente com as patologias consideradas no trabalho (edema paralisia e noacutedulos nas pregas vocais) Entretanto observa-se que a abordagem pelo modelo linear de produccedilatildeo da fala em que os coeficientes LPC modelam o trato vocal consegue distinguir melhor as especificidades existentes nas patologias analisadas notadamente quando combinadas agrave abordagem natildeo linear As mudanccedilas nas estruturas anatocircmicas do trato vocal e da fonte (laringe) foram bem retratadas com a combinaccedilatildeo das duas abordagens sendo a principal contribuiccedilatildeo deste trabalho Com a abordagem hiacutebrida o desempenho na distinccedilatildeo entre

6012 16 20

Nuacutemero de coeficientes LPC

Paralisia times Noacutedulo

24

6468

Acu

raacuteci

a m

eacutedia

()

72768084889296

100

MNL LPC MNL + LPC

Figura 8 Classificaccedilatildeo entre vozes afetadas por paralisia e sinais afetados por noacutedulos nas pregas vocaisFigure 8 Classification between voices affected by vocal fold paralysis and vocal nodules

Figura 9 Classificaccedilatildeo entre vozes afetadas por edema e sinais afetados por noacutedulos nas pregas vocaisFigure 9 Classification between voices affected by vocal fold Edema and vocal nodules

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201312

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

as patologias obteve um aumento consideraacutevel Isto denota que o meacutetodo empregado eacute bastante promissor na tarefa de discriminar entre vozes saudaacuteveis e vozes afetadas por patologias lariacutengeas bem como entre patologias Espera-se que os meacutetodos apresentados nesta pesquisa contribuam ainda mais para a detecccedilatildeo precoce das doenccedilas da laringe auxiliando no seu diagnoacutestico ou para monitorar seu progresso buscando assegurar os cuidados cliacutenicos adequados e mais conforto aos pacientes

ReferecircnciasAlvarez-Ramirez J Echeverria JC Rodriguez E Performance of a high-dimensional RS method for Hurst exponent estimation Physica A Statistical Mechanics and its Applications 2008 387(26)6452-62 httpdxdoiorg101016jphysa200808014

Arias-Londono J Godino-Llorente J Saacuteenz-Lechoacuten N Osma-Ruiz V Castellanos-Dominguez G Automatic detection of pathological voices using complexity measures noise parameters and mel-cepstral coefficients IEEE Transactions on Biomedical Engineering 2011 58(2)370-9 httpdxdoiorg101109TBME20102089052

Boyanov B Ivanov T Hadjitodorov S Chollet G Robust hybrid pitch detector Electronic Letters 1993 29(22)1924-6 httpdxdoiorg101049el19931281

Chakrabarti CG De K Boltzmann-Gibbs entropy axiomatic characterization and application International Journal of Mathematics and Mathematical Sciences 2000 23(4)243-51 httpdxdoiorg101155S0161171200000375

Custoacutedio RF Anaacutelise Natildeo-linear no reconhecimento de padrotildees sonoros Estudo de caso para sons pulmonares [tese] Rio Grande do Sul Universidade Federal do Rio Grande do Sul 1999 119 p

Dajer ME Padrotildees visuais de sinais de voz atraveacutes de teacutecnica de anaacutelise de natildeo-linear [dissertaccedilatildeo] Satildeo Paulo Escola de Engenharia de Satildeo Carlos 2006 154 p

Fantinato PC Segmentaccedilatildeo de voz baseada na anaacutelise fractal e na transformada wavelet [dissertaccedilatildeo] Satildeo Paulo Instituto de Fiacutesica de Satildeo Carlos da Universidade de Satildeo Carlos 2008 123 p

Fiedler-Ferrara N Prado CPC Caos Uma introduccedilatildeo Satildeo Paulo Ed Edgard Blucher Ltda 1994

Fraser AM Swinney HL Independent coordinates for strange attractors from mutual information Physical Review A 1986 331134-40 httpdxdoiorg 101103PhysRevA331134

Godino-Llorente JI Goacutemez-Vilda P Blanco Velasco M Dimensionality reduction of a pathological voice quality assessment system based on gaussian mixture models and short-term cepstral parameters IEEE Transactions on Biomedical Engineering 2006 53(10)1943-53 httpdxdoiorg101109TBME2006871883

Gomes D Fonseca N Agoulmine N Souza JN Neurocomputaccedilatildeo na estimativa do paracircmetro de hurst

In SBRCrsquo2001 Anais do 19 Simpoacutesio Brasileiro de Redes de Computadores 2001 Maio Florianoacutepolis Santa Catarina Florianoacutepolis 2001 p 306-21

Grassberger P Procaccia I Measuring the strangeness of strange attractors Physica D 1983 9189-208 httpdxdoiorg1010160167-2789(83)90298-1

Hegger R Kantz H Schreiber T Practical implementation of nonlinear time series methods the tisean package Chaos 1999 9(2)413-35 httpdxdoiorg1010631166424

Henriacutequez P Alonso JB Ferrer MA Travieso CM Godino-Llorente JI Diacuteaz-De-Maria F Characterization of healthy and pathological voice through measures based on nonlinear dynamics IEEE Transactions on Audio Speech and Language Processing 2009 17(6)1186-95 httpdxdoiorg101109TASL20092016734

Hurst E Long term storage capacity of reservoirs Transactions of the American Society of Civil Engineers 1951 116770-9

Jiang JJ Zhang Y McGilligan C Chaos in voice from modeling to measurement Journal of Voice 2006 20(1)2-17 httpdxdoiorg101016jjvoice200501001

Johnson MT Povinelli RJ Lindgren AC Ye J Liu X Indrebo KM Time-domain isolated phoneme classification using reconstructed phase spaces IEEE Transactions Speech and Audio Processing 2005 13(4)458-66 httpdxdoiorg101109TSA2005848885

Kantz H A Robust Method to Estimate the maximal lyapunov exponent of a time series Physics Letters A 1994 18577-87 httpdxdoiorg1010160375-9601(94)90991-1

Kantz H Schreiber T Nonlinear time series analysis 2nd ed Cambridge University Press 2004

Kay Elemetrics Disordered Voice Database Model 4337 3th ed United Satates 1994

Kokkinos I Maragos P Nonlinear speech analysis using models for chaotic systems IEEE Transactions on Speech and Audio Processing 2005 13(6)1098-109 httpdxdoiorg101109TSA2005852982

Kumar A Mullick SK Nonlinear dynamical analysis of speech Journal Acoustic Society America 1996 100(1)615-29 httpdxdoiorg1011211415886

Little M Biomechanically informed nonlinear speech signal processing [tese] Oxford University of Oxford England 2006 164 p

Little M McSharry P Roberts S Costello D Moroz I Exploiting nonlinear recurrence and fractal scaling properties for voice disorder detection BioMedical Engineering OnLine 2007 6(23)1-19 httpdxdoiorg1011861475-925X-6-23

Manfredi C Pierazzi L Bruscaglioni P Pitch estimation for noise retrieval in time and frequency domain Medical amp Biological Engineering amp Computing 1999 37(2)532

Natarajan K Acharya UR Alias F Tiboleng T Puthusserypady SK Nonlinear analysis of EEG signals at different mental states BioMedical Engineering OnLine 2004 37 httpdxdoiorg1011861475-925X-3-7

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 13

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

OrsquoShaughnessy D Speech communications human and machine 2nd ed New York IEEE Press 2000

Petry A Reconhecimento automaacutetico de locutor utilizando medidas de invariantes dinacircmicas natildeo-lineares [tese] Rio Grande do Sul Universidade Federal do Rio Grande do Sul 2002 155 p

Pincus SM Approximate entropy as a measure of system complexity Proceedings of the National Academy of Sciences 1991 882297-301 httpdxdoiorg101073pnas8862297

Rabiner LR Schafer RW Digital processing of speech signals Upper Saddle River Prentice Hall 1978

Rabiner LR Juang BH Fundamentals of speech recognition Englewood Ciffs New Jersey Prentice Hall 1993

Rodriacuteguez-Saacutenchez A Delgado-Trejos E Orozco-Gutieacuterrez A Castellanos-Domiacutenguez G Nonlinear dynamics techniques for the detection of the brain areas using MER signals International Conference on BioMedical Engineering and Informatics 2008 2198-202 httpdxdoiorg101109BMEI2008330

SantrsquoAna R Coelho R Alcaim A Text-independent speaker recognition based on the hurst parameter and the multidimensional fractional brownian motion model IEEE Transactions on Audio Speech and Language Processing 2006 14(3)931-40 httpdxdoiorg101109TSA2005858054

Savi MA Dinacircmica natildeo-linear e Caos Rio de Janeiro E-papers 2006

Scalassara PR Dajer ME Maciel CD Pereira JC Voice signals characterization through entropy measures In BIOSIGNALS 2008 Proceedings of the International Conference on Bio-inspired Systems and

Signal Processing 2008 Jan 28-31 Madeira Portugal Madeira 2008 v 2 p 163-170

Schreiber T Schmitz A Surrogate time series Physica D 2000 142346-82 httpdxdoiorg101016S0167-2789(00)00043-9

Shannon C A Mathematical theory of communication The Bell System Technical Journal 1948 27(3)623-56

Silva LEV Ferramentas computacionais na anaacutelise da variabilidade da frequecircncia cardiacuteaca atraveacutes do paradigma natildeo extensivo no estudo de cardiopatias [dissertaccedilatildeo] Satildeo Paulo Universidade de Satildeo Paulo 2010 97 p

Takens F Detecting Strange Attractors in Turbulence In Rand DA Young L-S Dynamical systems and turbulence New York Springer-Verlag 1981 v 898 p 366-81

Tavares AHMP Aspectos matemaacuteticos da entropia [dissertaccedilatildeo] Portugal Universidade de Aveiro 2003 98 p

Tokuda I Miyano T Aihara K Surrogate analysis for detecting nonlinear dynamics in normal vowels The Journal of the Acoustical Society of America 2001 110(6)3207-17

Torres ME Gamero LG Rufiner HL Study of complexity in normal and pathological speech signals In EMBC 2003 Proceedings of the 25th Annual International Conference of the IEEE Engineering in Medicine and Biology Society 2003 17-21 Sept Cancun Meacutexico IEEE 2003 p 2339-2342 httpdxdoiorg101109IEMBS20031280385

Tsallis C Possible generalization of Boltzmann-Gibbs statistics Journal of Statistical Physics 1988 52(12)479-87 httpdxdoiorg101007BF01016429

Zhang Y Jiang JJ Acoustic analyses of sustained and running voices from patients with laryngeal pathologies Journal of Voice January 2008 22(1)1-9 httpdxdoiorg101016jjvoice200608003

Autores

Washington Ceacutesar de Almeida Costa Francisco Marcos de Assis Departamento de Engenharia Eleacutetrica ndash DEE Universidade Federal de Campina Grande ndash UFCG Campina Grande PB Brasil

Washington Ceacutesar de Almeida Costa Silvana Luciene do Nascimento Cunha Costa Coordenaccedilatildeo do Curso Superior de Bacharelado em Engenharia Eleacutetrica ndash CCSBEE Instituto Federal de Educaccedilatildeo Ciecircncia e Tecnologia da Paraiacuteba ndash IFPB Av Primeiro de Maio 720 Jaguaribe CEP 58015-430 Joatildeo Pessoa PB Brasil

Benedito Guimaratildees Aguiar Neto Universidade Presbiteriana Mackenzie CEP 01302-907 Satildeo Paulo SP Brasil

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201314

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

de sons consonontais fricativos saudaacuteveis e algumas vozes patoloacutegicas (caso da voz soprosa) natildeo se pode descartar o modelo linear

Recentes pesquisas relacionadas agraves seacuteries temporais geradas a partir dos mecanismos de produccedilatildeo da voz humana tecircm sido realizadas considerando-se as teacutecnicas da dinacircmica natildeo linear e da teoria do caos com objetivos variados dentre os quais podem ser destacados classificaccedilatildeo de fonemas (Johnson et al 2005 Kokkinos e Maragos 2005) reconhecimento automaacutetico de locutor (Petry 2002) discriminaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas diagnoacutestico de patologias lariacutengeas e avaliaccedilatildeo de efeitos de tratamentos cliacutenicos (Dajer 2006 Henriacutequez et al 2009 Jiang et al 2006 Scalassara et al 2008 Torres et al 2003 Zhang e Jiang 2008)

Para que um sistema de auxiacutelio a diagnoacutesticos possa ser implementado com eficiecircncia torna-se primordial o estudo de teacutecnicas que ofereccedilam um excelente desempenho para que o erro de diagnoacutestico seja miacutenimo A investigaccedilatildeo acerca de quais satildeo as melhores caracteriacutesticas que distinguem um sinal de voz saudaacutevel de um sinal de voz patoloacutegica e principalmente que permita distinguir entre patologias ainda eacute um campo em desenvolvimento

Na literatura especiacutefica a maioria das pesquisas se baseia em discriminar entre vozes saudaacuteveis e patoloacutegicas em geral sem no entanto discriminar entre patologias distintas Neste trabalho pretende-se investigar o potencial discriminativo de medidas oriundas da anaacutelise dinacircmica natildeo linear para classificar sinais de vozes saudaacuteveis e patoloacutegicas bem como distinguir qual patologia estaacute afetando a qualidade vocal As patologias lariacutengeas consideradas neste trabalho satildeo paralisia nas pregas vocais edemas de Reinke e noacutedulos vocais As medidas empregadas oriundas da anaacutelise dinacircmica natildeo linear satildeo Dimensatildeo de correlaccedilatildeo entropia de correlaccedilatildeo entropia aproximada entropia de Shannon entropia de Tsallis expoente de Hurst maior expoente de Lyapunov e primeiro miacutenimo da funccedilatildeo de informaccedilatildeo muacutetua A teacutecnica de anaacutelise de discriminante quadraacutetica eacute aplicada para classificar os sinais em saudaacuteveis ou patoloacutegicos considerando as caracteriacutesticas de forma individual e combinada

No intuito de melhorar as taxas de classificaccedilatildeo na discriminaccedilatildeo entre patologias eacute realizada uma combinaccedilatildeo das medidas da anaacutelise natildeo linear com coeficientes LPC (Linear Prediction Coding) obtidos a partir da anaacutelise linear para o modelo de produccedilatildeo da fala O objetivo dessa combinaccedilatildeo eacute investigar se caracteriacutesticas de abordagens diferentes podem extrair

informaccedilotildees que combinadas possam refletir mais especificamente as desordens vocais provocadas pela presenccedila de uma determinada patologia na laringe

Materiais e Meacutetodos

Base de dados

Neste trabalho os sinais processados satildeo provenientes da base de dados comercialmente disponiacutevel a Disordered Voice Database Modelo 4337 gravada pelo Massachusetts Eye and Ear Infirmary (MEEI) (Kay Elemetrics 1994) A base de dados conteacutem pronuacutencias sustentadas da vogal a sendo 53 arquivos de locutores com voz saudaacutevel e 657 com vozes patoloacutegicas (vozes afetadas por patologias lariacutengeas) Foram selecionados 130 sinais sendo os 53 sinais de vozes saudaacuteveis e 77 sinais de pacientes com patologia na laringe (31 com edema de Reinke 28 com paralisia e 18 com noacutedulos) Os sinais de vozes saudaacuteveis originalmente amostrados a uma frequecircncia de 50000 amostrass foram subamostrados a 25000 amostrass para equiparar o nuacutemero de amostras aos sinais patoloacutegicos Os sinais de vozes tecircm duraccedilatildeo meacutedia de um segundo para os sinais patoloacutegicos e de 3 segundos para os sinais de vozes saudaacuteveis Os sinais disponibilizados na base de dados satildeo previamente processados por isso natildeo conteacutem intervalos de silecircncio antes ou depois da elocuccedilatildeo Evitando assim quaisquer problemas frequentemente encontrados em iniacutecio e fim de gravaccedilatildeo

Metodologia

O sistema de classificaccedilatildeo eacute representado de forma resumida pela Figura 1 Apoacutes a aquisiccedilatildeo do sinal por um microfone o sinal armazenado em um computador pessoal eacute processado Satildeo analisados 960 ms de cada sinal de voz sendo 30 quadros de 32 ms de forma a preservar a estacionariedade A seguir eacute feita a extraccedilatildeo de caracteriacutesticas e logo apoacutes a classificaccedilatildeo dos sinais Satildeo realizadas duas abordagens distintas para a extraccedilatildeo de caracteriacutesticas uma abordagem parameacutetrica baseada no modelo linear de produccedilatildeo da fala e outra em medidas obtidas a partir da anaacutelise dinacircmica natildeo linear Na abordagem parameacutetrica os coeficientes LPC satildeo extraiacutedos de cada sinal apoacutes sua segmentaccedilatildeo configurando um vetor de ordem p (ordem do filtro de prediccedilatildeo) para cada segmento Neste trabalho satildeo utilizados diferentes valores de p (12 16 20 e 24) com o intuito de avaliar o efeito do aumento da ordem de prediccedilatildeo no desempenho da classificaccedilatildeo

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 5

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

Extraccedilatildeo de caracteriacutesticas

Apoacutes a segmentaccedilatildeo do sinal eacute realizada a extraccedilatildeo de caracteriacutesticas feitas sob as duas abordagens para o modelo de produccedilatildeo de fala (linear e natildeo linear) descritas a seguir

Anaacutelise dinacircmica natildeo linear

A anaacutelise dinacircmica de sinais pode ser feita por meio de um modelo matemaacutetico associado ao sistema de produccedilatildeo desses sinais ou por meio da anaacutelise de seacuteries temporais O ponto essencial desta anaacutelise eacute que uma seacuterie temporal conteacutem informaccedilotildees sobre variaacuteveis natildeo observaacuteveis do sistema o que permite a reconstruccedilatildeo do espaccedilo de estados (Savi 2006) Cada sinal de voz a ser analisado corresponde a uma seacuterie temporal

A teacutecnica de reconstruccedilatildeo do espaccedilo de estados eacute baseada no teorema da imersatildeo de Takens (1981) Ele demonstrou que com o uso da teacutecnica dos tempos de retardo ou meacutetodo das coordenadas defasadas eacute possiacutevel reconstruir certas propriedades topoloacutegicas do espaccedilo de estados (atrator) a partir da seacuterie temporal xi em que vetores ξi m-dimensionais satildeo reconstruiacutedos de forma que

( ) ( ) ( ( 1) )x t x t x t mi i i iξ = + τ + minus τ (1)

onde i = 1 2 T ndash (m ndash 1)τ T eacute o nuacutemero total de amostras m eacute a chamada dimensatildeo de imersatildeo e τ eacute o passo de reconstruccedilatildeo ou tempo de defasagem (Fiedler-Ferrara e Prado 1994)

A determinaccedilatildeo eficiente dos paracircmetros de reconstruccedilatildeo (tempo de defasagem e dimensatildeo de imersatildeo) eacute de extrema importacircncia para a identificaccedilatildeo dos invariantes geomeacutetricos do sistema tais como a dimensatildeo do atrator e os expoentes de Lyapunov A partir da reconstruccedilatildeo do espaccedilo de fases dos sinais analisados eacute realizada a extraccedilatildeo das medidas de dinacircmica natildeo linear

Na Figura 2 estaacute ilustrada a reconstruccedilatildeo em duas dimensotildees do atrator de um dos sinais de voz analisados utilizando (a) um passo de reconstruccedilatildeo bem menor do que o adequado (τ = 1) (b) utilizando um passo de reconstruccedilatildeo ldquooacutetimordquo determinado com o uso da funccedilatildeo de informaccedilatildeo muacutetua (τ = 5) e (c) usando um passo bem maior do que o adequado (τ = 10)

O meacutetodo utilizado para obtenccedilatildeo do passo de reconstruccedilatildeo utilizado neste trabalho eacute devido a Fraser e Swinney (1986) e estaacute baseado na funccedilatildeo de informaccedilatildeo muacutetua Neste meacutetodo o valor do tempo de defasagem ideal corresponde ao primeiro miacutenimo local quando este existir da funccedilatildeo de informaccedilatildeo muacutetua meacutedia I(τ)

a b c

Figura 2 Reconstruccedilatildeo do atrator da vogal sustentada a em um intervalo de 32 ms Paracircmetros m = 2 e a) τ = 1 amostra b) τ = 5 amostras e c) τ = 10 amostrasFigure 2 Atractor reconstruction of the sustained vowel a for a 32 ms frame Parameters m = 2 and a) τ = 1 sample b) τ = 5 samples and c) τ = 10 samples

Figura 1 Diagrama em blocos do sistema de classificaccedilatildeo de vozes patoloacutegicasFigure 1 Block diagram of pathological voices classification system

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 20136

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

Funccedilatildeo de informaccedilatildeo muacutetua

A informaccedilatildeo muacutetua meacutedia fornece as mesmas informaccedilotildees que a funccedilatildeo de correlaccedilatildeo fornece em sistemas lineares sendo na realidade um tipo de generalizaccedilatildeo para sistemas natildeo lineares (Savi 2006) Na Figura 3 estaacute ilustrado o comportamento da I(τ) em funccedilatildeo de τ para o mesmo segmento do sinal cujo atrator estaacute mostrado na Figura 2 A linha tracejada indica o ponto onde ocorre o primeiro miacutenimo de I(τ) (FMMI ndash First Minimum of Mutual Information) e assim a determinaccedilatildeo do passo de reconstruccedilatildeo ldquooacutetimordquo para este segmento (τ = 5)

A partir de um histograma de b intervalos de classe (bins) criado para estimar a distribuiccedilatildeo de probabilidade dos dados de um sinal x(t) a informaccedilatildeo muacutetua meacutedia entre x(t) e sua versatildeo defasada x(t + τ) eacute estimada por meio da expressatildeo

( ) ( ) ( )( ) ( )

21 1

( ) ( )( ) ( ) log

( ) ( )b b i j

i ji j i j

IP x t x t

P x t x tP x t P x t= =

= + τ

τ + τsum sum + τ

(2)

em que Pi(x(t)) eacute a probabilidade de que o sinal x(t) assuma um valor dentro do i-eacutesimo intervalo do histograma Pj(x(t+τ)) eacute a probabilidade de que x(t + τ) esteja no j-eacutesimo intervalo e Pij(x(t) x(t+τ)) eacute a probabilidade de que simultaneamente o sinal de x(t) esteja no i-eacutesimo intervalo e x(t + τ) no j-eacutesimo intervalo (Kantz e Schreiber 2004)

Dimensatildeo de correlaccedilatildeo

A dimensatildeo de correlaccedilatildeo uma das formas mais comuns de se calcular a dimensatildeo de um atrator eacute uma medida geomeacutetrica de uma trajetoacuteria no espaccedilo de fase que descreve o quanto dois pontos dessa trajetoacuteria satildeo correlacionados Ela mede a probabilidade de se encontrar um par aleatoacuterio de pontos dentro de um determinado volume elementar (Savi 2006)

Grassberger e Procaccia (1983) desenvolveram um algoritmo para o caacutelculo da dimensatildeo de correlaccedilatildeo em que a probabilidade de se ter dois pontos do atrator numa caixa de lado ε eacute aproximada pela probabilidade de que a distacircncia entre dois pontos seja menor que ε Esse algoritmo fornece um limite inferior e um valor aproximado para a dimensatildeo fractal (Fiedler-Ferrara e Prado 1994)

Seja q(ε) a fraccedilatildeo de pontos do atrator que estaacute dentro de uma hiperesfera de raio ε centrada no ponto ξi (i-eacutesimo vetor de imersatildeo m-dimensional) Essa fraccedilatildeo eacute expressa pela relaccedilatildeo

( )1

1( )N

i jj

qN =

ε = θ ε minus ξ minus ξsum

(3)

sendo N o nuacutemero de pontos no atrator A funccedilatildeo degrau θ(x) eacute tal que θ = 1 se x ge 0 e θ = 0 se x lt 0 Define-se a integral de correlaccedilatildeo Cm(ε) como

1( )

1( ) lim ( )1

Nm N i i j

C qN rarrinfin = ne

ε = εsumminus

(4)

A dimensatildeo de correlaccedilatildeo eacute entatildeo calculada para cada valor de m como

2 0

log ( )limlog( )

mCDεrarr

εε

(5)

ou seja D2 eacute a inclinaccedilatildeo de uma reta definida pelo graacutefico log Cm(ε) times log (ε) para um valor infinitesimal de ε

Na Figura 4 eacute apresentado o comportamento da dimensatildeo de correlaccedilatildeo em funccedilatildeo de m e de ε para um segmento de 32 ms de um sinal de voz saudaacutevel A fim de se estimar o valor de D2 em cada segmento do sinal satildeo consideradas as inclinaccedilotildees da integral de correlaccedilatildeo para diferentes dimensotildees de imersatildeo com m variando de 4 a 10

Figura 3 Funccedilatildeo de Informaccedilatildeo Muacutetua e determinaccedilatildeo do passo de reconstruccedilatildeo oacutetimo para um segmento de 32 ms da vogal sustentada aFigure 3 Mutual Information Function and the determination of optimal reconstruction step for a 32 ms frame of a sustained vowel

Figura 4 Comportamento da dimensatildeo de correlaccedilatildeo para um segmento de 32 ms de um sinal de voz saudaacutevel em funccedilatildeo da dimensatildeo de imersatildeo e do valor de ε em que as curvas correspondem as diferentes dimensotildees de imersatildeo (m = 4 10) de baixo para cima respectivamenteFigure 4 Correlation dimension behavior for a 32 ms segment of a healthy speech signal in function of the embedded dimension and ε value wherein the curves correspond to the different embedded dimensions (m = 4 hellip 10) upwards respectively

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 7

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

A partir da inspeccedilatildeo visual do comportamento dos valores da dimensatildeo de correlaccedilatildeo em funccedilatildeo de m e de ε eacute levado a efeito a determinaccedilatildeo do valor de ε que oferece o menor coeficiente de variaccedilatildeo entre as curvas dentro de um intervalo de convergecircncia O valor de D2 para o segmento eacute estimado como sendo a meacutedia dos valores obtidos de cada curva para este valor de ε Para o segmento ilustrado na Figura 4 o quadrado sobreposto ao graacutefico indica os valores encontrados (ε = 0050 e D2 = 143)

Entropia de Shannon

Dado um determinado sinal a entropia de Shannon H1 eacute definida como (Shannon 1948)

( )1 21

logM

i ii

H p p=

= minussum

(6)

em que pi eacute a probabilidade de que o sinal pertenccedila a um intervalo i e M eacute o nuacutemero de particcedilotildees em seu espaccedilo de fase

A entropia de Shannon H1 eacute a medida de informaccedilatildeo necessaacuteria para localizar um sistema em um determinado estado significando que H1 eacute a medida da incerteza sobre o sistema fiacutesico (Torres et al 2003) As medidas de entropia avaliam o grau de desordem de um sinal podendo ser empregadas para avaliar as desordens nos sinais de vozes afetados por patologias na laringe (Little et al 2007 Scalassara et al 2008)

Entropia de correlaccedilatildeo

O procedimento de Grassberger-Procaccia permite estimar a entropia de Correlaccedilatildeo K2 a partir das integrais de correlaccedilatildeo Cm(ε) (Equaccedilatildeo 4) da seguinte forma

21

( )1( ) ln( )

m

m

CKC +

εε =τ ε

(7)

em que τ eacute o passo utilizado na reconstruccedilatildeo e m eacute a dimensatildeo de imersatildeo

Na Figura 5 eacute apresentado o comportamento da entropia de correlaccedilatildeo em funccedilatildeo de m e de ε para um segmento de 32 ms de um sinal de voz patoloacutegico A fim de se estimar o valor de K2 em cada segmento do sinal satildeo consideradas as curvas com os valores da entropia de correlaccedilatildeo para diferentes dimensotildees de imersatildeo com m variando de 4 a 10 e diferentes valores de ε

A partir da inspeccedilatildeo visual do comportamento dos valores da entropia de correlaccedilatildeo em funccedilatildeo de m e de ε eacute levada a efeito a determinaccedilatildeo do valor de ε que oferece o menor coeficiente de variaccedilatildeo entre as curvas dentro de um intervalo de convergecircncia O valor de K2 para o segmento eacute estimado como sendo

a meacutedia dos valores obtidos de cada curva para este valor de ε A entropia de correlaccedilatildeo do sinal eacute tomada como sendo a meacutedia calculada sob todos os segmentos do sinal analisado No caso do segmento ilustrado na Figura 5 o quadrado sobreposto ao graacutefico indica os valores encontrados (ε = 0031 e K2 = 0184)

Entropia aproximada

A entropia aproximada ApEn eacute uma medida da informaccedilatildeo condicional meacutedia gerada por pontos divergentes numa trajetoacuteria no espaccedilo de fase (Arias-Londono et al 2011) Considerando valores fixos para m e ε e considerando os vetores dados na Equaccedilatildeo 1 a entropia aproximada eacute definida como (Pincus 1991)

1( ) lim ( ) ( )m mN

ApEn m +

rarrinfin ε = ϕ ε minus ϕ ε

(8)

em que11

1( ) ( 1) log ( )

N mm

iN m q

minus +minus

=ϕ ε = minus + εsum

(9)

e q(ε) eacute definida pela Equaccedilatildeo 3 e N eacute o nuacutemero de vetores do atrator reconstruiacutedo em uma dimensatildeo de imersatildeo miacutenima m

A capacidade de discriminar mudanccedilas de complexidade a partir de uma quantidade relativamente pequena de dados faculta a aplicaccedilatildeo da ApEn em uma variedade de contextos incluindo processos determiniacutesticos caoacuteticos e estocaacutesticos (Pincus 1991) Embora a medida da entropia aproximada natildeo seja uma medida de caos ela quantifica a regularidade do processo de imersatildeo em seacuteries temporais (Torres et al 2003)

Figura 5 Comportamento da entropia de correlaccedilatildeo para um segmento de 32 ms de um sinal de voz patoloacutegico em funccedilatildeo da dimensatildeo de imersatildeo e do valor de ε em que as curvas correspondem as diferentes dimensotildees de imersatildeo (m = 410) de baixo para cima respectivamenteFigure 5 Behavior of entropy correlation for a 32 ms frame of a pathological speech signal related to embedded dimension and ε value wherein the curves correspond to the different embedded dimensions (m = 4 hellip 10) upwards respectively

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 20138

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

Entropia de Tsallis

A entropia de Tsallis eacute uma generalizaccedilatildeo da entropia de Boltzmann-Gibbs (Chakrabarti e De 2000) Eacute definida como (Tsallis 1988)

111

qWi i

qpH k

q=minus sum=

minus (10)

em que q isin caracteriza a generalizaccedilatildeo e pi satildeo as probabilidades associadas com as W ( )W isinconfiguraccedilotildees possiacuteveis do sistema A entropia de Boltzmann-Gibbs eacute encontrada quando no limite qrarr1

A principal caracteriacutestica da entropia de Tsallis eacute a sua natildeo aditividade (Tavares 2003) Isto eacute a informaccedilatildeo contida em um sistema composto natildeo eacute a simples soma da informaccedilatildeo dos subsistemas que o compotildeem As entropias de Shannon e de Boltzmann apresentam a aditividade como uma de suas caracteriacutesticas A ideia principal da utilizaccedilatildeo da entropia de Tsallis eacute verificar a contribuiccedilatildeo do paracircmetro entroacutepico (q) na avaliaccedilatildeo de caracteriacutesticas natildeo extensivas (interaccedilotildees natildeo lineares) presentes na dinacircmica das seacuteries temporais (Silva 2010)

Expoentes de Lyapunov

Os expoentes de Lyapunov estatildeo relacionados agrave taxa meacutedia de divergecircncia ou de convergecircncia exponencial de oacuterbitas vizinhas no espaccedilo de fase Geralmente um sistema contendo pelo menos um expoente de Lyapunov positivo eacute definido como caoacutetico por outro lado um sistema sem nenhum expoente positivo eacute regular (Jiang et al 2006)

Neste trabalho eacute utilizada uma rotina do pacote TISEAN (Hegger et al 1999) a fim de se obter o crescimento exponencial meacutedio das distacircncias entre duas trajetoacuterias que eacute baseada no algoritmo de Kantz (1994) O programa basicamente gera os resultados da expressatildeo (Kantz e Schreiber 2004)

( ) 00 0

1

1 1( ) ln( ) n no

Nn n n n

n S Sn

S n s sN S +∆ +∆

= isinυ

∆ = minussum sum υ

(11)

onde S(∆n) eacute chamado de fator de crescimento (stretching factor) Sn0 satildeo os vetores de imersatildeo e υ(Sn0) eacute a vizinhanccedila de Sn0 com diacircmetro ε Na Figura 6 estaacute ilustrado o comportamento de S(∆n) em funccedilatildeo do nuacutemero de iteraccedilotildees ∆n para trecircs diferentes valores de ε e m variando de 4 a 8 A linha reta representa a inclinaccedilatildeo meacutedia das curvas mostradas e sua inclinaccedilatildeo eacute a estimaccedilatildeo para o maior expoente de Lyapunov λ1

Expoente de HurstO paracircmetro ou expoente de Hurst (Hurst 1951) eacute uma medida de autossimilaridade que vem sendo empregada em diversas aacutereas tais como gerenciamento de traacutefego autossimilar de redes de computadores (Gomes et al 2001) reconhecimento de padrotildees sonoros para avaliaccedilatildeo de sons pulmonares (Custoacutedio 1999) sistemas de reconhecimento de locutor (SantrsquoAna et al 2006) detecccedilatildeo de diferentes aacutereas do ceacuterebro (Rodriacuteguez-Saacutenchez et al 2008) e anaacutelise de sinais EEG (eletroencefalograma) (Natarajan et al 2004) entre outros Em processamento de sinais de voz este paracircmetro tem sido empregado por representar o comportamento estocaacutestico da voz (Fantinato 2008) Aleacutem disso apresenta um baixo custo computacional podendo ser obtido em tempo real durante atividade da fala (SantrsquoAna et al 2006)

Quanto maior o valor do paracircmetro de Hurst maior eacute o impacto das autocorrelaccedilotildees no desempenho do sistema Aleacutem disso pequenas variaccedilotildees no paracircmetro de Hurst podem significar mudanccedilas significativas no comportamento dos sinais caracterizando o grau de desordem do mesmo (Gomes et al 2001) O estimador RS empregado neste trabalho eacute um dos mais conhecidos e simples meacutetodos para estimar o grau de dependecircncia de uma sequecircncia amostral A estatiacutestica RS eacute a soma parcial dos desvios em relaccedilatildeo a sua meacutedia de uma sequecircncia reescalonada pelo seu desvio padratildeo (Alvarez-Ramirez et al 2008)

Se o processo estocaacutestico associado agrave sequecircncia eacute escalonada sobre certo domiacutenio n a estatiacutestica RS segue a equaccedilatildeo

HR S an= (12)

em que RS eacute a distacircncia reescalonada (dividida pelo desvio padratildeo) a eacute uma constante e H eacute o expoente de Hurst

Anaacutelise preditiva linearA ideia baacutesica na prediccedilatildeo linear eacute a de que o valor de uma amostra pode ser aproximado (predita) por

Figura 6 Comportamento de S(∆n) em funccedilatildeo do nuacutemero de iteraccedilotildees de ε e de m (m = 4 8)Figure 6 Behavior of S(∆n) related to iteration number ε and m (m = 48)

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 9

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

combinaccedilatildeo linear dos valores das amostras anteriores levando em consideraccedilatildeo a correlaccedilatildeo entre estas Os coeficientes de prediccedilatildeo linear ou coeficientes LPC (Linear Predictive Coding) satildeo estimados por minimizaccedilatildeo do erro quadraacutetico entre a amostra atual e a sua prediccedilatildeo (OrsquoShaughnessy 2000 Rabiner e Juang 1993)

O modelo linear de produccedilatildeo da fala incorpora os efeitos dos pulsos glotais trato vocal e da radiaccedilatildeo dos laacutebios como um filtro linear (Rabiner e Schafer 1978) A fonte eacute uma sequecircncia de impulsos quase perioacutedicos utilizados para gerar sons sonoros ou a adiccedilatildeo de uma sequecircncia de ruiacutedo aleatoacuterio para sons surdos

Um fator de ganho G eacute ajustado para controlar a intensidade da excitaccedilatildeo Combinando os efeitos dos pulsos glotais do trato vocal e da radiaccedilatildeo o modelo pode ser representado por uma funccedilatildeo de transferecircncia de apenas polos H(z) como

1( )

1 ( )p kk

GH zk zminus

==

minus αsum (13)

Os termos α(k) representam os coeficientes de prediccedilatildeo linear (coeficientes LPC) e p a ordem do filtro de prediccedilatildeo

O meacutetodo LPC estima cada amostra de voz baseado numa combinaccedilatildeo linear de p amostras anteriores Um valor de p maior representa um modelo mais preciso A anaacutelise LPC fornece um conjunto de paracircmetros da fala que representa o trato vocal Espera-se que qualquer mudanccedila na estrutura anatocircmica do trato vocal devido agrave patologia afete os coeficientes LPC

Classificaccedilatildeo

Apoacutes a extraccedilatildeo das caracteriacutesticas tanto pela anaacutelise linear quanto pela natildeo linear eacute realizado o processo de classificaccedilatildeo Neste processo eacute aplicada a anaacutelise discriminante quadraacutetica (QDA) com validaccedilatildeo cruzada em que satildeo utilizados 10 subconjuntos (folds) Satildeo avaliados os desempenhos de classificadores implementados com cada uma das caracteriacutesticas de forma individual e de classificadores implementados a partir da combinaccedilatildeo dessas caracteriacutesticas

Outros classificadores satildeo implementados com coeficientes LPC de ordem p variando de 12 a 24 (p = 12 16 20 e 24) Apoacutes a avaliaccedilatildeo individual de cada meacutetodo (linear e natildeo linear) satildeo construiacutedos vetores hiacutebridos em que a cada vetor LPC de ordem p satildeo adicionadas as medidas natildeo lineares Uma nova avaliaccedilatildeo de desempenho eacute realizada a partir dos vetores hiacutebridos

Para avaliaccedilatildeo de desempenho do processo de classificaccedilatildeo trecircs medidas satildeo utilizadas acuraacutecia sensibilidade e especificidade A Acuraacutecia mede a

taxa de classificaccedilatildeo correta global do teste ou seja a capacidade do teste de identificar corretamente quando haacute e quando natildeo haacute presenccedila da doenccedila A Acuraacutecia (Equaccedilatildeo 14) eacute definida como a relaccedilatildeo entre todos os sinais corretamente classificados e o nuacutemero total de sinais avaliados

VP VNAcuraacuteciaVP VN FP FN

+=+ + +

(14)

em que VP representa os verdadeiros positivos ou seja o nuacutemero de sinais classificados corretamente como patoloacutegicos VN representa os verdadeiros negativos ou seja em quantos sinais foram detectados a ausecircncia correta da patologia FP os falsos positivos ou a quantidade de sinais saudaacuteveis classificados erroneamente como patoloacutegicos e FN os falsos negativos ou seja a quantidade de sinais patoloacutegicos classificados erroneamente como saudaacuteveis

A Sensibilidade mede a capacidade do teste em identificar corretamente a doenccedila entre aqueles que a possuem ou seja o quatildeo sensiacutevel eacute o teste Eacute a relaccedilatildeo entre os sinais patoloacutegicos corretamente classificados e o nuacutemero total de sinais patoloacutegicos dada por

VPSensibilidadeVP FN

=+

(15)

A Especificidade mede a capacidade do teste em excluir corretamente aqueles que natildeo possuem a doenccedila ou seja o quatildeo especiacutefico eacute o teste Eacute a relaccedilatildeo entre os sinais saudaacuteveis corretamente classificados e o nuacutemero total de sinais saudaacuteveis

VNEspecificidadeVN FP

=+

(16)

Os resultados obtidos no processo de classificaccedilatildeo satildeo apresentados a seguir

ResultadosNa Tabela 1 satildeo apresentados os valores de acuraacutecia obtidos com o uso de cada uma das medidas da anaacutelise dinacircmica natildeo linear (MNL) para a classificaccedilatildeo entre vozes saudaacuteveis (SDL) e patoloacutegicas (PTL) usando a anaacutelise discriminante quadraacutetica (QDA ndash Quadratic Discriminant Analysis) A classe dos sinais patoloacutegicos inclui os sinais afetados por edema noacutedulos e paralisia nas pregas vocais O expoente de Hurst H foi o paracircmetro mais eficiente em capturar as desordens vocais presentes nos sinais de vozes patoloacutegicas comparadas aos sinais de vozes saudaacuteveis tendo a maior acuraacutecia no processo de classificaccedilatildeo

Na Tabela 2 satildeo apresentados inicialmente os resultados obtidos na classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas (SDL times PTL) mediante a

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201310

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

combinaccedilatildeo das medidas Observa-se que com a combinaccedilatildeo de apenas quatro medidas entre as oito foi obtida a maior acuraacutecia (9603 plusmn 411) com as medidas entropia de Shannon (H1) entropia de Tsallis (Hq) expoente de Hurst (H) e a dimensatildeo de correlaccedilatildeo (D2) O acreacutescimo das trecircs medidas ao expoente de Hurst proporcionou um aumento de cerca de 9 no valor da acuraacutecia alcanccedilada com o uso individual desta caracteriacutestica

As patologias satildeo separadas em classes diferentes (paralisia edema ou noacutedulo) e comparadas aos sinais saudaacuteveis constituindo as seguintes comparaccedilotildees saudaacutevel times edema (SDL times EDM) saudaacutevel times paralisa (SDL times PRL) e saudaacutevel times noacutedulo (SDL times NDL) Como apresentado na Tabela 2 nesses casos as taxas de acuraacutecia meacutedia satildeo superiores a 97 com todas as taxas de especificidade chegando a 100 o que significa que nenhum sinal saudaacutevel testado foi considerado patoloacutegico O expoente de Hurst e as entropias de Shannon e de Tsallis aparecem em todas as combinaccedilotildees associando-se a outras medidas no caso da discriminaccedilatildeo entre saudaacutevel e edema e entre saudaacutevel e paralisia

Na distinccedilatildeo entre patologias observa-se pela Tabela 2 mesmo com a combinaccedilatildeo das medidas

a acuraacutecia meacutedia atingiu no maacuteximo 86 enquanto que os valores de sensibilidade meacutedia natildeo chegaram a 75 Dessa forma visando aumentar o desempenho na classificaccedilatildeo foi investigada a influecircncia do uso combinado das medidas da anaacutelise natildeo linear com os coeficientes LPC na discriminaccedilatildeo entre as patologias consideradas Nas Figuras 7 a 9 satildeo mostrados os resultados obtidos na discriminaccedilatildeo entre paralisia e edema paralisia e noacutedulo e entre edema e noacutedulo respectivamente

Tabela 2 Avaliaccedilatildeo de desempenho das medidas combinadas ndash valores de acuraacutecia obtidos na classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas e entre as patologiasTable 2 Performance evaluation of combined measures - values of the obtained accuracy in classification between healthy and pathological voices and among pathologies

Classificaccedilatildeo Caracteriacutesticas Acuraacutecia () Sensibilidade () Especificidade ()SDL times PTL H1 Hq H e D2 9603 plusmn 411 9446 plusmn 513 9800 plusmn 452SDL times EDM H1 Hq H D2 e K2 9875 plusmn 283 9667 plusmn 754 100SDL times PRL FMMI H D2 e H1 ou Hq 9750 plusmn 377 9333 plusmn 1005 100SDL times NDL H1 Hq e H 9857 plusmn 323 9500 plusmn 1131 100PRL times EDM λ1 FMMI Hq ApEn D2 e K2 7700 plusmn 1459 7417 plusmn 1874 8167 plusmn 1817PRL times NDL λ1 H ApEn D2 e K2 8600 plusmn 1103 6500 plusmn 2966 9667 plusmn 1494

EDM times NDL λ1 FMMI H1 Hq H e D2 7600 plusmn 951 5500 plusmn 2639 8667 plusmn 1231

Tabela 1 Avaliaccedilatildeo de desempenho das medidas individuais ndash valores de Acuraacutecia () obtidos na classificaccedilatildeo entre vozes saudaacuteveis e vozes patoloacutegicasTable 1 Performance evaluation of individual measures ndash values of the obtained accuracy in classification between healthy and pathological voices

Medidas Saudaacutevel times Patoloacutegica Saudaacutevel times Edema Saudaacutevel times Paralisia Saudaacutevel times Noacutedulo

λ1 5451 plusmn 823 6122 plusmn 1105 5855 plusmn 999 5232 plusmn 1308FMMI 6255 plusmn 574 6022 plusmn 848 6864 plusmn 1010 5821 plusmn 1446

H1 6085 plusmn 831 6944 plusmn 882 6582 plusmn 607 7464 plusmn 803Hq 6261 plusmn 921 6744 plusmn 718 6855 plusmn 766 7607 plusmn 682H 8709 plusmn 591 8567 plusmn 513 8809 plusmn 753 9429 plusmn 528

ApEn 5660 plusmn 672 6806 plusmn 615 6929 plusmn 1351 6667 plusmn 1037D2 7936 plusmn 1077 8458 plusmn 887 8750 plusmn 809 8262 plusmn 1254K2 5288 plusmn 509 6097 plusmn 1032 6196 plusmn 1198 5738 plusmn 881

Acuraacutecia maacuteximaMaximum accuracy

Figura 7 Classificaccedilatildeo entre vozes afetadas por paralisia e sinais afetados por edema nas pregas vocaisFigure 7 Classification between voices affected by vocal fold paralysis and vocal fold edema

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 11

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

Na discriminaccedilatildeo entre paralisia e edema a taxa de acuraacutecia sai de 9655 plusmn 151 com 12 coeficientes LPC para 9924 plusmn 052 com 24 coeficientes Aleacutem do acreacutescimo na acuraacutecia meacutedia em mais de 18 em relaccedilatildeo ao uso dos melhores resultados individuais (LPC) com a combinaccedilatildeo (MNL e LPC) o erro padratildeo caiu consideravelmente aumentando a confiabilidade do teste

Na discriminaccedilatildeo entre paralisia e noacutedulo a acuraacutecia de 86 soacute com as medidas natildeo lineares cresce para valores maiores que 99 Com 12 coeficientes LPC a acuraacutecia eacute de 9919 plusmn 055 com sensibilidade 100 e especificidade meacutedia de aproximadamente 98

A acuraacutecia meacutedia na classificaccedilatildeo entre edema e noacutedulo antes de 76 com as medidas natildeo lineares e cerca de 70 com LPC chega a mais de 98 com o vetor hiacutebrido com apenas 12 coeficientes E passa dos 99 a partir de 16 coeficientes quando associados agraves medidas natildeo lineares

DiscussatildeoPelos resultados apresentados constata-se que o desempenho da classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas aumentou significativamente com a combinaccedilatildeo das medidas da anaacutelise dinacircmica natildeo linear Nos melhores resultados o expoente de Hurst que se destacou como melhor medida individual aparece em todas as combinaccedilotildees juntamente com as entropias de Shannon e de Tsallis para a classificaccedilatildeo entre os sinais de vozes saudaacuteveis e sinais afetados por paralisa edema ou noacutedulo No entanto essas medidas natildeo foram eficazes em discriminar entre patologias apresentando taxas inferiores agraves apresentadas na discriminaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas

A anaacutelise LPC comparada agraves outras medidas empregadas mostra-se mais eficaz em discriminar entre patologias Observa-se que o valor da acuraacutecia aumenta com o aumento da ordem de preditor Aleacutem disso o desempenho na classificaccedilatildeo entre patologias melhora significativamente ao combinar as medidas natildeo lineares com os coeficientes LPC

Eacute importante considerar que o aumento na ordem dos coeficientes LPC estaacute associado a um maior volume de dados a serem processados aumentando o custo computacional No entanto caso seja mais relevante a precisatildeo do diagnoacutestico do que a realizaccedilatildeo da anaacutelise em tempo real eacute possiacutevel optar por empregar uma maior quantidade de coeficientes LPC Observa-se pelos resultados que o valor da acuraacutecia natildeo teve um aumento tatildeo consideraacutevel com o aumento da ordem de prediccedilatildeo aleacutem de 16 coeficientes

ConclusatildeoA partir dos resultados obtidos constata-se que as medidas natildeo lineares conseguem capturar bem as desordens vocais provocadas por patologias nas pregas vocais como noacutedulos edemas e paralisia A consideraccedilatildeo das natildeo linearidades inerentes ao processo de produccedilatildeo da fala e sua consequente anaacutelise utilizando medidas natildeo lineares eacute eficiente em distinguir um sinal saudaacutevel de um sinal patoloacutegico comprovadamente com as patologias consideradas no trabalho (edema paralisia e noacutedulos nas pregas vocais) Entretanto observa-se que a abordagem pelo modelo linear de produccedilatildeo da fala em que os coeficientes LPC modelam o trato vocal consegue distinguir melhor as especificidades existentes nas patologias analisadas notadamente quando combinadas agrave abordagem natildeo linear As mudanccedilas nas estruturas anatocircmicas do trato vocal e da fonte (laringe) foram bem retratadas com a combinaccedilatildeo das duas abordagens sendo a principal contribuiccedilatildeo deste trabalho Com a abordagem hiacutebrida o desempenho na distinccedilatildeo entre

6012 16 20

Nuacutemero de coeficientes LPC

Paralisia times Noacutedulo

24

6468

Acu

raacuteci

a m

eacutedia

()

72768084889296

100

MNL LPC MNL + LPC

Figura 8 Classificaccedilatildeo entre vozes afetadas por paralisia e sinais afetados por noacutedulos nas pregas vocaisFigure 8 Classification between voices affected by vocal fold paralysis and vocal nodules

Figura 9 Classificaccedilatildeo entre vozes afetadas por edema e sinais afetados por noacutedulos nas pregas vocaisFigure 9 Classification between voices affected by vocal fold Edema and vocal nodules

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201312

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

as patologias obteve um aumento consideraacutevel Isto denota que o meacutetodo empregado eacute bastante promissor na tarefa de discriminar entre vozes saudaacuteveis e vozes afetadas por patologias lariacutengeas bem como entre patologias Espera-se que os meacutetodos apresentados nesta pesquisa contribuam ainda mais para a detecccedilatildeo precoce das doenccedilas da laringe auxiliando no seu diagnoacutestico ou para monitorar seu progresso buscando assegurar os cuidados cliacutenicos adequados e mais conforto aos pacientes

ReferecircnciasAlvarez-Ramirez J Echeverria JC Rodriguez E Performance of a high-dimensional RS method for Hurst exponent estimation Physica A Statistical Mechanics and its Applications 2008 387(26)6452-62 httpdxdoiorg101016jphysa200808014

Arias-Londono J Godino-Llorente J Saacuteenz-Lechoacuten N Osma-Ruiz V Castellanos-Dominguez G Automatic detection of pathological voices using complexity measures noise parameters and mel-cepstral coefficients IEEE Transactions on Biomedical Engineering 2011 58(2)370-9 httpdxdoiorg101109TBME20102089052

Boyanov B Ivanov T Hadjitodorov S Chollet G Robust hybrid pitch detector Electronic Letters 1993 29(22)1924-6 httpdxdoiorg101049el19931281

Chakrabarti CG De K Boltzmann-Gibbs entropy axiomatic characterization and application International Journal of Mathematics and Mathematical Sciences 2000 23(4)243-51 httpdxdoiorg101155S0161171200000375

Custoacutedio RF Anaacutelise Natildeo-linear no reconhecimento de padrotildees sonoros Estudo de caso para sons pulmonares [tese] Rio Grande do Sul Universidade Federal do Rio Grande do Sul 1999 119 p

Dajer ME Padrotildees visuais de sinais de voz atraveacutes de teacutecnica de anaacutelise de natildeo-linear [dissertaccedilatildeo] Satildeo Paulo Escola de Engenharia de Satildeo Carlos 2006 154 p

Fantinato PC Segmentaccedilatildeo de voz baseada na anaacutelise fractal e na transformada wavelet [dissertaccedilatildeo] Satildeo Paulo Instituto de Fiacutesica de Satildeo Carlos da Universidade de Satildeo Carlos 2008 123 p

Fiedler-Ferrara N Prado CPC Caos Uma introduccedilatildeo Satildeo Paulo Ed Edgard Blucher Ltda 1994

Fraser AM Swinney HL Independent coordinates for strange attractors from mutual information Physical Review A 1986 331134-40 httpdxdoiorg 101103PhysRevA331134

Godino-Llorente JI Goacutemez-Vilda P Blanco Velasco M Dimensionality reduction of a pathological voice quality assessment system based on gaussian mixture models and short-term cepstral parameters IEEE Transactions on Biomedical Engineering 2006 53(10)1943-53 httpdxdoiorg101109TBME2006871883

Gomes D Fonseca N Agoulmine N Souza JN Neurocomputaccedilatildeo na estimativa do paracircmetro de hurst

In SBRCrsquo2001 Anais do 19 Simpoacutesio Brasileiro de Redes de Computadores 2001 Maio Florianoacutepolis Santa Catarina Florianoacutepolis 2001 p 306-21

Grassberger P Procaccia I Measuring the strangeness of strange attractors Physica D 1983 9189-208 httpdxdoiorg1010160167-2789(83)90298-1

Hegger R Kantz H Schreiber T Practical implementation of nonlinear time series methods the tisean package Chaos 1999 9(2)413-35 httpdxdoiorg1010631166424

Henriacutequez P Alonso JB Ferrer MA Travieso CM Godino-Llorente JI Diacuteaz-De-Maria F Characterization of healthy and pathological voice through measures based on nonlinear dynamics IEEE Transactions on Audio Speech and Language Processing 2009 17(6)1186-95 httpdxdoiorg101109TASL20092016734

Hurst E Long term storage capacity of reservoirs Transactions of the American Society of Civil Engineers 1951 116770-9

Jiang JJ Zhang Y McGilligan C Chaos in voice from modeling to measurement Journal of Voice 2006 20(1)2-17 httpdxdoiorg101016jjvoice200501001

Johnson MT Povinelli RJ Lindgren AC Ye J Liu X Indrebo KM Time-domain isolated phoneme classification using reconstructed phase spaces IEEE Transactions Speech and Audio Processing 2005 13(4)458-66 httpdxdoiorg101109TSA2005848885

Kantz H A Robust Method to Estimate the maximal lyapunov exponent of a time series Physics Letters A 1994 18577-87 httpdxdoiorg1010160375-9601(94)90991-1

Kantz H Schreiber T Nonlinear time series analysis 2nd ed Cambridge University Press 2004

Kay Elemetrics Disordered Voice Database Model 4337 3th ed United Satates 1994

Kokkinos I Maragos P Nonlinear speech analysis using models for chaotic systems IEEE Transactions on Speech and Audio Processing 2005 13(6)1098-109 httpdxdoiorg101109TSA2005852982

Kumar A Mullick SK Nonlinear dynamical analysis of speech Journal Acoustic Society America 1996 100(1)615-29 httpdxdoiorg1011211415886

Little M Biomechanically informed nonlinear speech signal processing [tese] Oxford University of Oxford England 2006 164 p

Little M McSharry P Roberts S Costello D Moroz I Exploiting nonlinear recurrence and fractal scaling properties for voice disorder detection BioMedical Engineering OnLine 2007 6(23)1-19 httpdxdoiorg1011861475-925X-6-23

Manfredi C Pierazzi L Bruscaglioni P Pitch estimation for noise retrieval in time and frequency domain Medical amp Biological Engineering amp Computing 1999 37(2)532

Natarajan K Acharya UR Alias F Tiboleng T Puthusserypady SK Nonlinear analysis of EEG signals at different mental states BioMedical Engineering OnLine 2004 37 httpdxdoiorg1011861475-925X-3-7

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 13

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

OrsquoShaughnessy D Speech communications human and machine 2nd ed New York IEEE Press 2000

Petry A Reconhecimento automaacutetico de locutor utilizando medidas de invariantes dinacircmicas natildeo-lineares [tese] Rio Grande do Sul Universidade Federal do Rio Grande do Sul 2002 155 p

Pincus SM Approximate entropy as a measure of system complexity Proceedings of the National Academy of Sciences 1991 882297-301 httpdxdoiorg101073pnas8862297

Rabiner LR Schafer RW Digital processing of speech signals Upper Saddle River Prentice Hall 1978

Rabiner LR Juang BH Fundamentals of speech recognition Englewood Ciffs New Jersey Prentice Hall 1993

Rodriacuteguez-Saacutenchez A Delgado-Trejos E Orozco-Gutieacuterrez A Castellanos-Domiacutenguez G Nonlinear dynamics techniques for the detection of the brain areas using MER signals International Conference on BioMedical Engineering and Informatics 2008 2198-202 httpdxdoiorg101109BMEI2008330

SantrsquoAna R Coelho R Alcaim A Text-independent speaker recognition based on the hurst parameter and the multidimensional fractional brownian motion model IEEE Transactions on Audio Speech and Language Processing 2006 14(3)931-40 httpdxdoiorg101109TSA2005858054

Savi MA Dinacircmica natildeo-linear e Caos Rio de Janeiro E-papers 2006

Scalassara PR Dajer ME Maciel CD Pereira JC Voice signals characterization through entropy measures In BIOSIGNALS 2008 Proceedings of the International Conference on Bio-inspired Systems and

Signal Processing 2008 Jan 28-31 Madeira Portugal Madeira 2008 v 2 p 163-170

Schreiber T Schmitz A Surrogate time series Physica D 2000 142346-82 httpdxdoiorg101016S0167-2789(00)00043-9

Shannon C A Mathematical theory of communication The Bell System Technical Journal 1948 27(3)623-56

Silva LEV Ferramentas computacionais na anaacutelise da variabilidade da frequecircncia cardiacuteaca atraveacutes do paradigma natildeo extensivo no estudo de cardiopatias [dissertaccedilatildeo] Satildeo Paulo Universidade de Satildeo Paulo 2010 97 p

Takens F Detecting Strange Attractors in Turbulence In Rand DA Young L-S Dynamical systems and turbulence New York Springer-Verlag 1981 v 898 p 366-81

Tavares AHMP Aspectos matemaacuteticos da entropia [dissertaccedilatildeo] Portugal Universidade de Aveiro 2003 98 p

Tokuda I Miyano T Aihara K Surrogate analysis for detecting nonlinear dynamics in normal vowels The Journal of the Acoustical Society of America 2001 110(6)3207-17

Torres ME Gamero LG Rufiner HL Study of complexity in normal and pathological speech signals In EMBC 2003 Proceedings of the 25th Annual International Conference of the IEEE Engineering in Medicine and Biology Society 2003 17-21 Sept Cancun Meacutexico IEEE 2003 p 2339-2342 httpdxdoiorg101109IEMBS20031280385

Tsallis C Possible generalization of Boltzmann-Gibbs statistics Journal of Statistical Physics 1988 52(12)479-87 httpdxdoiorg101007BF01016429

Zhang Y Jiang JJ Acoustic analyses of sustained and running voices from patients with laryngeal pathologies Journal of Voice January 2008 22(1)1-9 httpdxdoiorg101016jjvoice200608003

Autores

Washington Ceacutesar de Almeida Costa Francisco Marcos de Assis Departamento de Engenharia Eleacutetrica ndash DEE Universidade Federal de Campina Grande ndash UFCG Campina Grande PB Brasil

Washington Ceacutesar de Almeida Costa Silvana Luciene do Nascimento Cunha Costa Coordenaccedilatildeo do Curso Superior de Bacharelado em Engenharia Eleacutetrica ndash CCSBEE Instituto Federal de Educaccedilatildeo Ciecircncia e Tecnologia da Paraiacuteba ndash IFPB Av Primeiro de Maio 720 Jaguaribe CEP 58015-430 Joatildeo Pessoa PB Brasil

Benedito Guimaratildees Aguiar Neto Universidade Presbiteriana Mackenzie CEP 01302-907 Satildeo Paulo SP Brasil

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201314

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

Extraccedilatildeo de caracteriacutesticas

Apoacutes a segmentaccedilatildeo do sinal eacute realizada a extraccedilatildeo de caracteriacutesticas feitas sob as duas abordagens para o modelo de produccedilatildeo de fala (linear e natildeo linear) descritas a seguir

Anaacutelise dinacircmica natildeo linear

A anaacutelise dinacircmica de sinais pode ser feita por meio de um modelo matemaacutetico associado ao sistema de produccedilatildeo desses sinais ou por meio da anaacutelise de seacuteries temporais O ponto essencial desta anaacutelise eacute que uma seacuterie temporal conteacutem informaccedilotildees sobre variaacuteveis natildeo observaacuteveis do sistema o que permite a reconstruccedilatildeo do espaccedilo de estados (Savi 2006) Cada sinal de voz a ser analisado corresponde a uma seacuterie temporal

A teacutecnica de reconstruccedilatildeo do espaccedilo de estados eacute baseada no teorema da imersatildeo de Takens (1981) Ele demonstrou que com o uso da teacutecnica dos tempos de retardo ou meacutetodo das coordenadas defasadas eacute possiacutevel reconstruir certas propriedades topoloacutegicas do espaccedilo de estados (atrator) a partir da seacuterie temporal xi em que vetores ξi m-dimensionais satildeo reconstruiacutedos de forma que

( ) ( ) ( ( 1) )x t x t x t mi i i iξ = + τ + minus τ (1)

onde i = 1 2 T ndash (m ndash 1)τ T eacute o nuacutemero total de amostras m eacute a chamada dimensatildeo de imersatildeo e τ eacute o passo de reconstruccedilatildeo ou tempo de defasagem (Fiedler-Ferrara e Prado 1994)

A determinaccedilatildeo eficiente dos paracircmetros de reconstruccedilatildeo (tempo de defasagem e dimensatildeo de imersatildeo) eacute de extrema importacircncia para a identificaccedilatildeo dos invariantes geomeacutetricos do sistema tais como a dimensatildeo do atrator e os expoentes de Lyapunov A partir da reconstruccedilatildeo do espaccedilo de fases dos sinais analisados eacute realizada a extraccedilatildeo das medidas de dinacircmica natildeo linear

Na Figura 2 estaacute ilustrada a reconstruccedilatildeo em duas dimensotildees do atrator de um dos sinais de voz analisados utilizando (a) um passo de reconstruccedilatildeo bem menor do que o adequado (τ = 1) (b) utilizando um passo de reconstruccedilatildeo ldquooacutetimordquo determinado com o uso da funccedilatildeo de informaccedilatildeo muacutetua (τ = 5) e (c) usando um passo bem maior do que o adequado (τ = 10)

O meacutetodo utilizado para obtenccedilatildeo do passo de reconstruccedilatildeo utilizado neste trabalho eacute devido a Fraser e Swinney (1986) e estaacute baseado na funccedilatildeo de informaccedilatildeo muacutetua Neste meacutetodo o valor do tempo de defasagem ideal corresponde ao primeiro miacutenimo local quando este existir da funccedilatildeo de informaccedilatildeo muacutetua meacutedia I(τ)

a b c

Figura 2 Reconstruccedilatildeo do atrator da vogal sustentada a em um intervalo de 32 ms Paracircmetros m = 2 e a) τ = 1 amostra b) τ = 5 amostras e c) τ = 10 amostrasFigure 2 Atractor reconstruction of the sustained vowel a for a 32 ms frame Parameters m = 2 and a) τ = 1 sample b) τ = 5 samples and c) τ = 10 samples

Figura 1 Diagrama em blocos do sistema de classificaccedilatildeo de vozes patoloacutegicasFigure 1 Block diagram of pathological voices classification system

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 20136

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

Funccedilatildeo de informaccedilatildeo muacutetua

A informaccedilatildeo muacutetua meacutedia fornece as mesmas informaccedilotildees que a funccedilatildeo de correlaccedilatildeo fornece em sistemas lineares sendo na realidade um tipo de generalizaccedilatildeo para sistemas natildeo lineares (Savi 2006) Na Figura 3 estaacute ilustrado o comportamento da I(τ) em funccedilatildeo de τ para o mesmo segmento do sinal cujo atrator estaacute mostrado na Figura 2 A linha tracejada indica o ponto onde ocorre o primeiro miacutenimo de I(τ) (FMMI ndash First Minimum of Mutual Information) e assim a determinaccedilatildeo do passo de reconstruccedilatildeo ldquooacutetimordquo para este segmento (τ = 5)

A partir de um histograma de b intervalos de classe (bins) criado para estimar a distribuiccedilatildeo de probabilidade dos dados de um sinal x(t) a informaccedilatildeo muacutetua meacutedia entre x(t) e sua versatildeo defasada x(t + τ) eacute estimada por meio da expressatildeo

( ) ( ) ( )( ) ( )

21 1

( ) ( )( ) ( ) log

( ) ( )b b i j

i ji j i j

IP x t x t

P x t x tP x t P x t= =

= + τ

τ + τsum sum + τ

(2)

em que Pi(x(t)) eacute a probabilidade de que o sinal x(t) assuma um valor dentro do i-eacutesimo intervalo do histograma Pj(x(t+τ)) eacute a probabilidade de que x(t + τ) esteja no j-eacutesimo intervalo e Pij(x(t) x(t+τ)) eacute a probabilidade de que simultaneamente o sinal de x(t) esteja no i-eacutesimo intervalo e x(t + τ) no j-eacutesimo intervalo (Kantz e Schreiber 2004)

Dimensatildeo de correlaccedilatildeo

A dimensatildeo de correlaccedilatildeo uma das formas mais comuns de se calcular a dimensatildeo de um atrator eacute uma medida geomeacutetrica de uma trajetoacuteria no espaccedilo de fase que descreve o quanto dois pontos dessa trajetoacuteria satildeo correlacionados Ela mede a probabilidade de se encontrar um par aleatoacuterio de pontos dentro de um determinado volume elementar (Savi 2006)

Grassberger e Procaccia (1983) desenvolveram um algoritmo para o caacutelculo da dimensatildeo de correlaccedilatildeo em que a probabilidade de se ter dois pontos do atrator numa caixa de lado ε eacute aproximada pela probabilidade de que a distacircncia entre dois pontos seja menor que ε Esse algoritmo fornece um limite inferior e um valor aproximado para a dimensatildeo fractal (Fiedler-Ferrara e Prado 1994)

Seja q(ε) a fraccedilatildeo de pontos do atrator que estaacute dentro de uma hiperesfera de raio ε centrada no ponto ξi (i-eacutesimo vetor de imersatildeo m-dimensional) Essa fraccedilatildeo eacute expressa pela relaccedilatildeo

( )1

1( )N

i jj

qN =

ε = θ ε minus ξ minus ξsum

(3)

sendo N o nuacutemero de pontos no atrator A funccedilatildeo degrau θ(x) eacute tal que θ = 1 se x ge 0 e θ = 0 se x lt 0 Define-se a integral de correlaccedilatildeo Cm(ε) como

1( )

1( ) lim ( )1

Nm N i i j

C qN rarrinfin = ne

ε = εsumminus

(4)

A dimensatildeo de correlaccedilatildeo eacute entatildeo calculada para cada valor de m como

2 0

log ( )limlog( )

mCDεrarr

εε

(5)

ou seja D2 eacute a inclinaccedilatildeo de uma reta definida pelo graacutefico log Cm(ε) times log (ε) para um valor infinitesimal de ε

Na Figura 4 eacute apresentado o comportamento da dimensatildeo de correlaccedilatildeo em funccedilatildeo de m e de ε para um segmento de 32 ms de um sinal de voz saudaacutevel A fim de se estimar o valor de D2 em cada segmento do sinal satildeo consideradas as inclinaccedilotildees da integral de correlaccedilatildeo para diferentes dimensotildees de imersatildeo com m variando de 4 a 10

Figura 3 Funccedilatildeo de Informaccedilatildeo Muacutetua e determinaccedilatildeo do passo de reconstruccedilatildeo oacutetimo para um segmento de 32 ms da vogal sustentada aFigure 3 Mutual Information Function and the determination of optimal reconstruction step for a 32 ms frame of a sustained vowel

Figura 4 Comportamento da dimensatildeo de correlaccedilatildeo para um segmento de 32 ms de um sinal de voz saudaacutevel em funccedilatildeo da dimensatildeo de imersatildeo e do valor de ε em que as curvas correspondem as diferentes dimensotildees de imersatildeo (m = 4 10) de baixo para cima respectivamenteFigure 4 Correlation dimension behavior for a 32 ms segment of a healthy speech signal in function of the embedded dimension and ε value wherein the curves correspond to the different embedded dimensions (m = 4 hellip 10) upwards respectively

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 7

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

A partir da inspeccedilatildeo visual do comportamento dos valores da dimensatildeo de correlaccedilatildeo em funccedilatildeo de m e de ε eacute levado a efeito a determinaccedilatildeo do valor de ε que oferece o menor coeficiente de variaccedilatildeo entre as curvas dentro de um intervalo de convergecircncia O valor de D2 para o segmento eacute estimado como sendo a meacutedia dos valores obtidos de cada curva para este valor de ε Para o segmento ilustrado na Figura 4 o quadrado sobreposto ao graacutefico indica os valores encontrados (ε = 0050 e D2 = 143)

Entropia de Shannon

Dado um determinado sinal a entropia de Shannon H1 eacute definida como (Shannon 1948)

( )1 21

logM

i ii

H p p=

= minussum

(6)

em que pi eacute a probabilidade de que o sinal pertenccedila a um intervalo i e M eacute o nuacutemero de particcedilotildees em seu espaccedilo de fase

A entropia de Shannon H1 eacute a medida de informaccedilatildeo necessaacuteria para localizar um sistema em um determinado estado significando que H1 eacute a medida da incerteza sobre o sistema fiacutesico (Torres et al 2003) As medidas de entropia avaliam o grau de desordem de um sinal podendo ser empregadas para avaliar as desordens nos sinais de vozes afetados por patologias na laringe (Little et al 2007 Scalassara et al 2008)

Entropia de correlaccedilatildeo

O procedimento de Grassberger-Procaccia permite estimar a entropia de Correlaccedilatildeo K2 a partir das integrais de correlaccedilatildeo Cm(ε) (Equaccedilatildeo 4) da seguinte forma

21

( )1( ) ln( )

m

m

CKC +

εε =τ ε

(7)

em que τ eacute o passo utilizado na reconstruccedilatildeo e m eacute a dimensatildeo de imersatildeo

Na Figura 5 eacute apresentado o comportamento da entropia de correlaccedilatildeo em funccedilatildeo de m e de ε para um segmento de 32 ms de um sinal de voz patoloacutegico A fim de se estimar o valor de K2 em cada segmento do sinal satildeo consideradas as curvas com os valores da entropia de correlaccedilatildeo para diferentes dimensotildees de imersatildeo com m variando de 4 a 10 e diferentes valores de ε

A partir da inspeccedilatildeo visual do comportamento dos valores da entropia de correlaccedilatildeo em funccedilatildeo de m e de ε eacute levada a efeito a determinaccedilatildeo do valor de ε que oferece o menor coeficiente de variaccedilatildeo entre as curvas dentro de um intervalo de convergecircncia O valor de K2 para o segmento eacute estimado como sendo

a meacutedia dos valores obtidos de cada curva para este valor de ε A entropia de correlaccedilatildeo do sinal eacute tomada como sendo a meacutedia calculada sob todos os segmentos do sinal analisado No caso do segmento ilustrado na Figura 5 o quadrado sobreposto ao graacutefico indica os valores encontrados (ε = 0031 e K2 = 0184)

Entropia aproximada

A entropia aproximada ApEn eacute uma medida da informaccedilatildeo condicional meacutedia gerada por pontos divergentes numa trajetoacuteria no espaccedilo de fase (Arias-Londono et al 2011) Considerando valores fixos para m e ε e considerando os vetores dados na Equaccedilatildeo 1 a entropia aproximada eacute definida como (Pincus 1991)

1( ) lim ( ) ( )m mN

ApEn m +

rarrinfin ε = ϕ ε minus ϕ ε

(8)

em que11

1( ) ( 1) log ( )

N mm

iN m q

minus +minus

=ϕ ε = minus + εsum

(9)

e q(ε) eacute definida pela Equaccedilatildeo 3 e N eacute o nuacutemero de vetores do atrator reconstruiacutedo em uma dimensatildeo de imersatildeo miacutenima m

A capacidade de discriminar mudanccedilas de complexidade a partir de uma quantidade relativamente pequena de dados faculta a aplicaccedilatildeo da ApEn em uma variedade de contextos incluindo processos determiniacutesticos caoacuteticos e estocaacutesticos (Pincus 1991) Embora a medida da entropia aproximada natildeo seja uma medida de caos ela quantifica a regularidade do processo de imersatildeo em seacuteries temporais (Torres et al 2003)

Figura 5 Comportamento da entropia de correlaccedilatildeo para um segmento de 32 ms de um sinal de voz patoloacutegico em funccedilatildeo da dimensatildeo de imersatildeo e do valor de ε em que as curvas correspondem as diferentes dimensotildees de imersatildeo (m = 410) de baixo para cima respectivamenteFigure 5 Behavior of entropy correlation for a 32 ms frame of a pathological speech signal related to embedded dimension and ε value wherein the curves correspond to the different embedded dimensions (m = 4 hellip 10) upwards respectively

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 20138

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

Entropia de Tsallis

A entropia de Tsallis eacute uma generalizaccedilatildeo da entropia de Boltzmann-Gibbs (Chakrabarti e De 2000) Eacute definida como (Tsallis 1988)

111

qWi i

qpH k

q=minus sum=

minus (10)

em que q isin caracteriza a generalizaccedilatildeo e pi satildeo as probabilidades associadas com as W ( )W isinconfiguraccedilotildees possiacuteveis do sistema A entropia de Boltzmann-Gibbs eacute encontrada quando no limite qrarr1

A principal caracteriacutestica da entropia de Tsallis eacute a sua natildeo aditividade (Tavares 2003) Isto eacute a informaccedilatildeo contida em um sistema composto natildeo eacute a simples soma da informaccedilatildeo dos subsistemas que o compotildeem As entropias de Shannon e de Boltzmann apresentam a aditividade como uma de suas caracteriacutesticas A ideia principal da utilizaccedilatildeo da entropia de Tsallis eacute verificar a contribuiccedilatildeo do paracircmetro entroacutepico (q) na avaliaccedilatildeo de caracteriacutesticas natildeo extensivas (interaccedilotildees natildeo lineares) presentes na dinacircmica das seacuteries temporais (Silva 2010)

Expoentes de Lyapunov

Os expoentes de Lyapunov estatildeo relacionados agrave taxa meacutedia de divergecircncia ou de convergecircncia exponencial de oacuterbitas vizinhas no espaccedilo de fase Geralmente um sistema contendo pelo menos um expoente de Lyapunov positivo eacute definido como caoacutetico por outro lado um sistema sem nenhum expoente positivo eacute regular (Jiang et al 2006)

Neste trabalho eacute utilizada uma rotina do pacote TISEAN (Hegger et al 1999) a fim de se obter o crescimento exponencial meacutedio das distacircncias entre duas trajetoacuterias que eacute baseada no algoritmo de Kantz (1994) O programa basicamente gera os resultados da expressatildeo (Kantz e Schreiber 2004)

( ) 00 0

1

1 1( ) ln( ) n no

Nn n n n

n S Sn

S n s sN S +∆ +∆

= isinυ

∆ = minussum sum υ

(11)

onde S(∆n) eacute chamado de fator de crescimento (stretching factor) Sn0 satildeo os vetores de imersatildeo e υ(Sn0) eacute a vizinhanccedila de Sn0 com diacircmetro ε Na Figura 6 estaacute ilustrado o comportamento de S(∆n) em funccedilatildeo do nuacutemero de iteraccedilotildees ∆n para trecircs diferentes valores de ε e m variando de 4 a 8 A linha reta representa a inclinaccedilatildeo meacutedia das curvas mostradas e sua inclinaccedilatildeo eacute a estimaccedilatildeo para o maior expoente de Lyapunov λ1

Expoente de HurstO paracircmetro ou expoente de Hurst (Hurst 1951) eacute uma medida de autossimilaridade que vem sendo empregada em diversas aacutereas tais como gerenciamento de traacutefego autossimilar de redes de computadores (Gomes et al 2001) reconhecimento de padrotildees sonoros para avaliaccedilatildeo de sons pulmonares (Custoacutedio 1999) sistemas de reconhecimento de locutor (SantrsquoAna et al 2006) detecccedilatildeo de diferentes aacutereas do ceacuterebro (Rodriacuteguez-Saacutenchez et al 2008) e anaacutelise de sinais EEG (eletroencefalograma) (Natarajan et al 2004) entre outros Em processamento de sinais de voz este paracircmetro tem sido empregado por representar o comportamento estocaacutestico da voz (Fantinato 2008) Aleacutem disso apresenta um baixo custo computacional podendo ser obtido em tempo real durante atividade da fala (SantrsquoAna et al 2006)

Quanto maior o valor do paracircmetro de Hurst maior eacute o impacto das autocorrelaccedilotildees no desempenho do sistema Aleacutem disso pequenas variaccedilotildees no paracircmetro de Hurst podem significar mudanccedilas significativas no comportamento dos sinais caracterizando o grau de desordem do mesmo (Gomes et al 2001) O estimador RS empregado neste trabalho eacute um dos mais conhecidos e simples meacutetodos para estimar o grau de dependecircncia de uma sequecircncia amostral A estatiacutestica RS eacute a soma parcial dos desvios em relaccedilatildeo a sua meacutedia de uma sequecircncia reescalonada pelo seu desvio padratildeo (Alvarez-Ramirez et al 2008)

Se o processo estocaacutestico associado agrave sequecircncia eacute escalonada sobre certo domiacutenio n a estatiacutestica RS segue a equaccedilatildeo

HR S an= (12)

em que RS eacute a distacircncia reescalonada (dividida pelo desvio padratildeo) a eacute uma constante e H eacute o expoente de Hurst

Anaacutelise preditiva linearA ideia baacutesica na prediccedilatildeo linear eacute a de que o valor de uma amostra pode ser aproximado (predita) por

Figura 6 Comportamento de S(∆n) em funccedilatildeo do nuacutemero de iteraccedilotildees de ε e de m (m = 4 8)Figure 6 Behavior of S(∆n) related to iteration number ε and m (m = 48)

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 9

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

combinaccedilatildeo linear dos valores das amostras anteriores levando em consideraccedilatildeo a correlaccedilatildeo entre estas Os coeficientes de prediccedilatildeo linear ou coeficientes LPC (Linear Predictive Coding) satildeo estimados por minimizaccedilatildeo do erro quadraacutetico entre a amostra atual e a sua prediccedilatildeo (OrsquoShaughnessy 2000 Rabiner e Juang 1993)

O modelo linear de produccedilatildeo da fala incorpora os efeitos dos pulsos glotais trato vocal e da radiaccedilatildeo dos laacutebios como um filtro linear (Rabiner e Schafer 1978) A fonte eacute uma sequecircncia de impulsos quase perioacutedicos utilizados para gerar sons sonoros ou a adiccedilatildeo de uma sequecircncia de ruiacutedo aleatoacuterio para sons surdos

Um fator de ganho G eacute ajustado para controlar a intensidade da excitaccedilatildeo Combinando os efeitos dos pulsos glotais do trato vocal e da radiaccedilatildeo o modelo pode ser representado por uma funccedilatildeo de transferecircncia de apenas polos H(z) como

1( )

1 ( )p kk

GH zk zminus

==

minus αsum (13)

Os termos α(k) representam os coeficientes de prediccedilatildeo linear (coeficientes LPC) e p a ordem do filtro de prediccedilatildeo

O meacutetodo LPC estima cada amostra de voz baseado numa combinaccedilatildeo linear de p amostras anteriores Um valor de p maior representa um modelo mais preciso A anaacutelise LPC fornece um conjunto de paracircmetros da fala que representa o trato vocal Espera-se que qualquer mudanccedila na estrutura anatocircmica do trato vocal devido agrave patologia afete os coeficientes LPC

Classificaccedilatildeo

Apoacutes a extraccedilatildeo das caracteriacutesticas tanto pela anaacutelise linear quanto pela natildeo linear eacute realizado o processo de classificaccedilatildeo Neste processo eacute aplicada a anaacutelise discriminante quadraacutetica (QDA) com validaccedilatildeo cruzada em que satildeo utilizados 10 subconjuntos (folds) Satildeo avaliados os desempenhos de classificadores implementados com cada uma das caracteriacutesticas de forma individual e de classificadores implementados a partir da combinaccedilatildeo dessas caracteriacutesticas

Outros classificadores satildeo implementados com coeficientes LPC de ordem p variando de 12 a 24 (p = 12 16 20 e 24) Apoacutes a avaliaccedilatildeo individual de cada meacutetodo (linear e natildeo linear) satildeo construiacutedos vetores hiacutebridos em que a cada vetor LPC de ordem p satildeo adicionadas as medidas natildeo lineares Uma nova avaliaccedilatildeo de desempenho eacute realizada a partir dos vetores hiacutebridos

Para avaliaccedilatildeo de desempenho do processo de classificaccedilatildeo trecircs medidas satildeo utilizadas acuraacutecia sensibilidade e especificidade A Acuraacutecia mede a

taxa de classificaccedilatildeo correta global do teste ou seja a capacidade do teste de identificar corretamente quando haacute e quando natildeo haacute presenccedila da doenccedila A Acuraacutecia (Equaccedilatildeo 14) eacute definida como a relaccedilatildeo entre todos os sinais corretamente classificados e o nuacutemero total de sinais avaliados

VP VNAcuraacuteciaVP VN FP FN

+=+ + +

(14)

em que VP representa os verdadeiros positivos ou seja o nuacutemero de sinais classificados corretamente como patoloacutegicos VN representa os verdadeiros negativos ou seja em quantos sinais foram detectados a ausecircncia correta da patologia FP os falsos positivos ou a quantidade de sinais saudaacuteveis classificados erroneamente como patoloacutegicos e FN os falsos negativos ou seja a quantidade de sinais patoloacutegicos classificados erroneamente como saudaacuteveis

A Sensibilidade mede a capacidade do teste em identificar corretamente a doenccedila entre aqueles que a possuem ou seja o quatildeo sensiacutevel eacute o teste Eacute a relaccedilatildeo entre os sinais patoloacutegicos corretamente classificados e o nuacutemero total de sinais patoloacutegicos dada por

VPSensibilidadeVP FN

=+

(15)

A Especificidade mede a capacidade do teste em excluir corretamente aqueles que natildeo possuem a doenccedila ou seja o quatildeo especiacutefico eacute o teste Eacute a relaccedilatildeo entre os sinais saudaacuteveis corretamente classificados e o nuacutemero total de sinais saudaacuteveis

VNEspecificidadeVN FP

=+

(16)

Os resultados obtidos no processo de classificaccedilatildeo satildeo apresentados a seguir

ResultadosNa Tabela 1 satildeo apresentados os valores de acuraacutecia obtidos com o uso de cada uma das medidas da anaacutelise dinacircmica natildeo linear (MNL) para a classificaccedilatildeo entre vozes saudaacuteveis (SDL) e patoloacutegicas (PTL) usando a anaacutelise discriminante quadraacutetica (QDA ndash Quadratic Discriminant Analysis) A classe dos sinais patoloacutegicos inclui os sinais afetados por edema noacutedulos e paralisia nas pregas vocais O expoente de Hurst H foi o paracircmetro mais eficiente em capturar as desordens vocais presentes nos sinais de vozes patoloacutegicas comparadas aos sinais de vozes saudaacuteveis tendo a maior acuraacutecia no processo de classificaccedilatildeo

Na Tabela 2 satildeo apresentados inicialmente os resultados obtidos na classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas (SDL times PTL) mediante a

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201310

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

combinaccedilatildeo das medidas Observa-se que com a combinaccedilatildeo de apenas quatro medidas entre as oito foi obtida a maior acuraacutecia (9603 plusmn 411) com as medidas entropia de Shannon (H1) entropia de Tsallis (Hq) expoente de Hurst (H) e a dimensatildeo de correlaccedilatildeo (D2) O acreacutescimo das trecircs medidas ao expoente de Hurst proporcionou um aumento de cerca de 9 no valor da acuraacutecia alcanccedilada com o uso individual desta caracteriacutestica

As patologias satildeo separadas em classes diferentes (paralisia edema ou noacutedulo) e comparadas aos sinais saudaacuteveis constituindo as seguintes comparaccedilotildees saudaacutevel times edema (SDL times EDM) saudaacutevel times paralisa (SDL times PRL) e saudaacutevel times noacutedulo (SDL times NDL) Como apresentado na Tabela 2 nesses casos as taxas de acuraacutecia meacutedia satildeo superiores a 97 com todas as taxas de especificidade chegando a 100 o que significa que nenhum sinal saudaacutevel testado foi considerado patoloacutegico O expoente de Hurst e as entropias de Shannon e de Tsallis aparecem em todas as combinaccedilotildees associando-se a outras medidas no caso da discriminaccedilatildeo entre saudaacutevel e edema e entre saudaacutevel e paralisia

Na distinccedilatildeo entre patologias observa-se pela Tabela 2 mesmo com a combinaccedilatildeo das medidas

a acuraacutecia meacutedia atingiu no maacuteximo 86 enquanto que os valores de sensibilidade meacutedia natildeo chegaram a 75 Dessa forma visando aumentar o desempenho na classificaccedilatildeo foi investigada a influecircncia do uso combinado das medidas da anaacutelise natildeo linear com os coeficientes LPC na discriminaccedilatildeo entre as patologias consideradas Nas Figuras 7 a 9 satildeo mostrados os resultados obtidos na discriminaccedilatildeo entre paralisia e edema paralisia e noacutedulo e entre edema e noacutedulo respectivamente

Tabela 2 Avaliaccedilatildeo de desempenho das medidas combinadas ndash valores de acuraacutecia obtidos na classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas e entre as patologiasTable 2 Performance evaluation of combined measures - values of the obtained accuracy in classification between healthy and pathological voices and among pathologies

Classificaccedilatildeo Caracteriacutesticas Acuraacutecia () Sensibilidade () Especificidade ()SDL times PTL H1 Hq H e D2 9603 plusmn 411 9446 plusmn 513 9800 plusmn 452SDL times EDM H1 Hq H D2 e K2 9875 plusmn 283 9667 plusmn 754 100SDL times PRL FMMI H D2 e H1 ou Hq 9750 plusmn 377 9333 plusmn 1005 100SDL times NDL H1 Hq e H 9857 plusmn 323 9500 plusmn 1131 100PRL times EDM λ1 FMMI Hq ApEn D2 e K2 7700 plusmn 1459 7417 plusmn 1874 8167 plusmn 1817PRL times NDL λ1 H ApEn D2 e K2 8600 plusmn 1103 6500 plusmn 2966 9667 plusmn 1494

EDM times NDL λ1 FMMI H1 Hq H e D2 7600 plusmn 951 5500 plusmn 2639 8667 plusmn 1231

Tabela 1 Avaliaccedilatildeo de desempenho das medidas individuais ndash valores de Acuraacutecia () obtidos na classificaccedilatildeo entre vozes saudaacuteveis e vozes patoloacutegicasTable 1 Performance evaluation of individual measures ndash values of the obtained accuracy in classification between healthy and pathological voices

Medidas Saudaacutevel times Patoloacutegica Saudaacutevel times Edema Saudaacutevel times Paralisia Saudaacutevel times Noacutedulo

λ1 5451 plusmn 823 6122 plusmn 1105 5855 plusmn 999 5232 plusmn 1308FMMI 6255 plusmn 574 6022 plusmn 848 6864 plusmn 1010 5821 plusmn 1446

H1 6085 plusmn 831 6944 plusmn 882 6582 plusmn 607 7464 plusmn 803Hq 6261 plusmn 921 6744 plusmn 718 6855 plusmn 766 7607 plusmn 682H 8709 plusmn 591 8567 plusmn 513 8809 plusmn 753 9429 plusmn 528

ApEn 5660 plusmn 672 6806 plusmn 615 6929 plusmn 1351 6667 plusmn 1037D2 7936 plusmn 1077 8458 plusmn 887 8750 plusmn 809 8262 plusmn 1254K2 5288 plusmn 509 6097 plusmn 1032 6196 plusmn 1198 5738 plusmn 881

Acuraacutecia maacuteximaMaximum accuracy

Figura 7 Classificaccedilatildeo entre vozes afetadas por paralisia e sinais afetados por edema nas pregas vocaisFigure 7 Classification between voices affected by vocal fold paralysis and vocal fold edema

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 11

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

Na discriminaccedilatildeo entre paralisia e edema a taxa de acuraacutecia sai de 9655 plusmn 151 com 12 coeficientes LPC para 9924 plusmn 052 com 24 coeficientes Aleacutem do acreacutescimo na acuraacutecia meacutedia em mais de 18 em relaccedilatildeo ao uso dos melhores resultados individuais (LPC) com a combinaccedilatildeo (MNL e LPC) o erro padratildeo caiu consideravelmente aumentando a confiabilidade do teste

Na discriminaccedilatildeo entre paralisia e noacutedulo a acuraacutecia de 86 soacute com as medidas natildeo lineares cresce para valores maiores que 99 Com 12 coeficientes LPC a acuraacutecia eacute de 9919 plusmn 055 com sensibilidade 100 e especificidade meacutedia de aproximadamente 98

A acuraacutecia meacutedia na classificaccedilatildeo entre edema e noacutedulo antes de 76 com as medidas natildeo lineares e cerca de 70 com LPC chega a mais de 98 com o vetor hiacutebrido com apenas 12 coeficientes E passa dos 99 a partir de 16 coeficientes quando associados agraves medidas natildeo lineares

DiscussatildeoPelos resultados apresentados constata-se que o desempenho da classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas aumentou significativamente com a combinaccedilatildeo das medidas da anaacutelise dinacircmica natildeo linear Nos melhores resultados o expoente de Hurst que se destacou como melhor medida individual aparece em todas as combinaccedilotildees juntamente com as entropias de Shannon e de Tsallis para a classificaccedilatildeo entre os sinais de vozes saudaacuteveis e sinais afetados por paralisa edema ou noacutedulo No entanto essas medidas natildeo foram eficazes em discriminar entre patologias apresentando taxas inferiores agraves apresentadas na discriminaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas

A anaacutelise LPC comparada agraves outras medidas empregadas mostra-se mais eficaz em discriminar entre patologias Observa-se que o valor da acuraacutecia aumenta com o aumento da ordem de preditor Aleacutem disso o desempenho na classificaccedilatildeo entre patologias melhora significativamente ao combinar as medidas natildeo lineares com os coeficientes LPC

Eacute importante considerar que o aumento na ordem dos coeficientes LPC estaacute associado a um maior volume de dados a serem processados aumentando o custo computacional No entanto caso seja mais relevante a precisatildeo do diagnoacutestico do que a realizaccedilatildeo da anaacutelise em tempo real eacute possiacutevel optar por empregar uma maior quantidade de coeficientes LPC Observa-se pelos resultados que o valor da acuraacutecia natildeo teve um aumento tatildeo consideraacutevel com o aumento da ordem de prediccedilatildeo aleacutem de 16 coeficientes

ConclusatildeoA partir dos resultados obtidos constata-se que as medidas natildeo lineares conseguem capturar bem as desordens vocais provocadas por patologias nas pregas vocais como noacutedulos edemas e paralisia A consideraccedilatildeo das natildeo linearidades inerentes ao processo de produccedilatildeo da fala e sua consequente anaacutelise utilizando medidas natildeo lineares eacute eficiente em distinguir um sinal saudaacutevel de um sinal patoloacutegico comprovadamente com as patologias consideradas no trabalho (edema paralisia e noacutedulos nas pregas vocais) Entretanto observa-se que a abordagem pelo modelo linear de produccedilatildeo da fala em que os coeficientes LPC modelam o trato vocal consegue distinguir melhor as especificidades existentes nas patologias analisadas notadamente quando combinadas agrave abordagem natildeo linear As mudanccedilas nas estruturas anatocircmicas do trato vocal e da fonte (laringe) foram bem retratadas com a combinaccedilatildeo das duas abordagens sendo a principal contribuiccedilatildeo deste trabalho Com a abordagem hiacutebrida o desempenho na distinccedilatildeo entre

6012 16 20

Nuacutemero de coeficientes LPC

Paralisia times Noacutedulo

24

6468

Acu

raacuteci

a m

eacutedia

()

72768084889296

100

MNL LPC MNL + LPC

Figura 8 Classificaccedilatildeo entre vozes afetadas por paralisia e sinais afetados por noacutedulos nas pregas vocaisFigure 8 Classification between voices affected by vocal fold paralysis and vocal nodules

Figura 9 Classificaccedilatildeo entre vozes afetadas por edema e sinais afetados por noacutedulos nas pregas vocaisFigure 9 Classification between voices affected by vocal fold Edema and vocal nodules

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201312

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

as patologias obteve um aumento consideraacutevel Isto denota que o meacutetodo empregado eacute bastante promissor na tarefa de discriminar entre vozes saudaacuteveis e vozes afetadas por patologias lariacutengeas bem como entre patologias Espera-se que os meacutetodos apresentados nesta pesquisa contribuam ainda mais para a detecccedilatildeo precoce das doenccedilas da laringe auxiliando no seu diagnoacutestico ou para monitorar seu progresso buscando assegurar os cuidados cliacutenicos adequados e mais conforto aos pacientes

ReferecircnciasAlvarez-Ramirez J Echeverria JC Rodriguez E Performance of a high-dimensional RS method for Hurst exponent estimation Physica A Statistical Mechanics and its Applications 2008 387(26)6452-62 httpdxdoiorg101016jphysa200808014

Arias-Londono J Godino-Llorente J Saacuteenz-Lechoacuten N Osma-Ruiz V Castellanos-Dominguez G Automatic detection of pathological voices using complexity measures noise parameters and mel-cepstral coefficients IEEE Transactions on Biomedical Engineering 2011 58(2)370-9 httpdxdoiorg101109TBME20102089052

Boyanov B Ivanov T Hadjitodorov S Chollet G Robust hybrid pitch detector Electronic Letters 1993 29(22)1924-6 httpdxdoiorg101049el19931281

Chakrabarti CG De K Boltzmann-Gibbs entropy axiomatic characterization and application International Journal of Mathematics and Mathematical Sciences 2000 23(4)243-51 httpdxdoiorg101155S0161171200000375

Custoacutedio RF Anaacutelise Natildeo-linear no reconhecimento de padrotildees sonoros Estudo de caso para sons pulmonares [tese] Rio Grande do Sul Universidade Federal do Rio Grande do Sul 1999 119 p

Dajer ME Padrotildees visuais de sinais de voz atraveacutes de teacutecnica de anaacutelise de natildeo-linear [dissertaccedilatildeo] Satildeo Paulo Escola de Engenharia de Satildeo Carlos 2006 154 p

Fantinato PC Segmentaccedilatildeo de voz baseada na anaacutelise fractal e na transformada wavelet [dissertaccedilatildeo] Satildeo Paulo Instituto de Fiacutesica de Satildeo Carlos da Universidade de Satildeo Carlos 2008 123 p

Fiedler-Ferrara N Prado CPC Caos Uma introduccedilatildeo Satildeo Paulo Ed Edgard Blucher Ltda 1994

Fraser AM Swinney HL Independent coordinates for strange attractors from mutual information Physical Review A 1986 331134-40 httpdxdoiorg 101103PhysRevA331134

Godino-Llorente JI Goacutemez-Vilda P Blanco Velasco M Dimensionality reduction of a pathological voice quality assessment system based on gaussian mixture models and short-term cepstral parameters IEEE Transactions on Biomedical Engineering 2006 53(10)1943-53 httpdxdoiorg101109TBME2006871883

Gomes D Fonseca N Agoulmine N Souza JN Neurocomputaccedilatildeo na estimativa do paracircmetro de hurst

In SBRCrsquo2001 Anais do 19 Simpoacutesio Brasileiro de Redes de Computadores 2001 Maio Florianoacutepolis Santa Catarina Florianoacutepolis 2001 p 306-21

Grassberger P Procaccia I Measuring the strangeness of strange attractors Physica D 1983 9189-208 httpdxdoiorg1010160167-2789(83)90298-1

Hegger R Kantz H Schreiber T Practical implementation of nonlinear time series methods the tisean package Chaos 1999 9(2)413-35 httpdxdoiorg1010631166424

Henriacutequez P Alonso JB Ferrer MA Travieso CM Godino-Llorente JI Diacuteaz-De-Maria F Characterization of healthy and pathological voice through measures based on nonlinear dynamics IEEE Transactions on Audio Speech and Language Processing 2009 17(6)1186-95 httpdxdoiorg101109TASL20092016734

Hurst E Long term storage capacity of reservoirs Transactions of the American Society of Civil Engineers 1951 116770-9

Jiang JJ Zhang Y McGilligan C Chaos in voice from modeling to measurement Journal of Voice 2006 20(1)2-17 httpdxdoiorg101016jjvoice200501001

Johnson MT Povinelli RJ Lindgren AC Ye J Liu X Indrebo KM Time-domain isolated phoneme classification using reconstructed phase spaces IEEE Transactions Speech and Audio Processing 2005 13(4)458-66 httpdxdoiorg101109TSA2005848885

Kantz H A Robust Method to Estimate the maximal lyapunov exponent of a time series Physics Letters A 1994 18577-87 httpdxdoiorg1010160375-9601(94)90991-1

Kantz H Schreiber T Nonlinear time series analysis 2nd ed Cambridge University Press 2004

Kay Elemetrics Disordered Voice Database Model 4337 3th ed United Satates 1994

Kokkinos I Maragos P Nonlinear speech analysis using models for chaotic systems IEEE Transactions on Speech and Audio Processing 2005 13(6)1098-109 httpdxdoiorg101109TSA2005852982

Kumar A Mullick SK Nonlinear dynamical analysis of speech Journal Acoustic Society America 1996 100(1)615-29 httpdxdoiorg1011211415886

Little M Biomechanically informed nonlinear speech signal processing [tese] Oxford University of Oxford England 2006 164 p

Little M McSharry P Roberts S Costello D Moroz I Exploiting nonlinear recurrence and fractal scaling properties for voice disorder detection BioMedical Engineering OnLine 2007 6(23)1-19 httpdxdoiorg1011861475-925X-6-23

Manfredi C Pierazzi L Bruscaglioni P Pitch estimation for noise retrieval in time and frequency domain Medical amp Biological Engineering amp Computing 1999 37(2)532

Natarajan K Acharya UR Alias F Tiboleng T Puthusserypady SK Nonlinear analysis of EEG signals at different mental states BioMedical Engineering OnLine 2004 37 httpdxdoiorg1011861475-925X-3-7

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 13

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

OrsquoShaughnessy D Speech communications human and machine 2nd ed New York IEEE Press 2000

Petry A Reconhecimento automaacutetico de locutor utilizando medidas de invariantes dinacircmicas natildeo-lineares [tese] Rio Grande do Sul Universidade Federal do Rio Grande do Sul 2002 155 p

Pincus SM Approximate entropy as a measure of system complexity Proceedings of the National Academy of Sciences 1991 882297-301 httpdxdoiorg101073pnas8862297

Rabiner LR Schafer RW Digital processing of speech signals Upper Saddle River Prentice Hall 1978

Rabiner LR Juang BH Fundamentals of speech recognition Englewood Ciffs New Jersey Prentice Hall 1993

Rodriacuteguez-Saacutenchez A Delgado-Trejos E Orozco-Gutieacuterrez A Castellanos-Domiacutenguez G Nonlinear dynamics techniques for the detection of the brain areas using MER signals International Conference on BioMedical Engineering and Informatics 2008 2198-202 httpdxdoiorg101109BMEI2008330

SantrsquoAna R Coelho R Alcaim A Text-independent speaker recognition based on the hurst parameter and the multidimensional fractional brownian motion model IEEE Transactions on Audio Speech and Language Processing 2006 14(3)931-40 httpdxdoiorg101109TSA2005858054

Savi MA Dinacircmica natildeo-linear e Caos Rio de Janeiro E-papers 2006

Scalassara PR Dajer ME Maciel CD Pereira JC Voice signals characterization through entropy measures In BIOSIGNALS 2008 Proceedings of the International Conference on Bio-inspired Systems and

Signal Processing 2008 Jan 28-31 Madeira Portugal Madeira 2008 v 2 p 163-170

Schreiber T Schmitz A Surrogate time series Physica D 2000 142346-82 httpdxdoiorg101016S0167-2789(00)00043-9

Shannon C A Mathematical theory of communication The Bell System Technical Journal 1948 27(3)623-56

Silva LEV Ferramentas computacionais na anaacutelise da variabilidade da frequecircncia cardiacuteaca atraveacutes do paradigma natildeo extensivo no estudo de cardiopatias [dissertaccedilatildeo] Satildeo Paulo Universidade de Satildeo Paulo 2010 97 p

Takens F Detecting Strange Attractors in Turbulence In Rand DA Young L-S Dynamical systems and turbulence New York Springer-Verlag 1981 v 898 p 366-81

Tavares AHMP Aspectos matemaacuteticos da entropia [dissertaccedilatildeo] Portugal Universidade de Aveiro 2003 98 p

Tokuda I Miyano T Aihara K Surrogate analysis for detecting nonlinear dynamics in normal vowels The Journal of the Acoustical Society of America 2001 110(6)3207-17

Torres ME Gamero LG Rufiner HL Study of complexity in normal and pathological speech signals In EMBC 2003 Proceedings of the 25th Annual International Conference of the IEEE Engineering in Medicine and Biology Society 2003 17-21 Sept Cancun Meacutexico IEEE 2003 p 2339-2342 httpdxdoiorg101109IEMBS20031280385

Tsallis C Possible generalization of Boltzmann-Gibbs statistics Journal of Statistical Physics 1988 52(12)479-87 httpdxdoiorg101007BF01016429

Zhang Y Jiang JJ Acoustic analyses of sustained and running voices from patients with laryngeal pathologies Journal of Voice January 2008 22(1)1-9 httpdxdoiorg101016jjvoice200608003

Autores

Washington Ceacutesar de Almeida Costa Francisco Marcos de Assis Departamento de Engenharia Eleacutetrica ndash DEE Universidade Federal de Campina Grande ndash UFCG Campina Grande PB Brasil

Washington Ceacutesar de Almeida Costa Silvana Luciene do Nascimento Cunha Costa Coordenaccedilatildeo do Curso Superior de Bacharelado em Engenharia Eleacutetrica ndash CCSBEE Instituto Federal de Educaccedilatildeo Ciecircncia e Tecnologia da Paraiacuteba ndash IFPB Av Primeiro de Maio 720 Jaguaribe CEP 58015-430 Joatildeo Pessoa PB Brasil

Benedito Guimaratildees Aguiar Neto Universidade Presbiteriana Mackenzie CEP 01302-907 Satildeo Paulo SP Brasil

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201314

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

Funccedilatildeo de informaccedilatildeo muacutetua

A informaccedilatildeo muacutetua meacutedia fornece as mesmas informaccedilotildees que a funccedilatildeo de correlaccedilatildeo fornece em sistemas lineares sendo na realidade um tipo de generalizaccedilatildeo para sistemas natildeo lineares (Savi 2006) Na Figura 3 estaacute ilustrado o comportamento da I(τ) em funccedilatildeo de τ para o mesmo segmento do sinal cujo atrator estaacute mostrado na Figura 2 A linha tracejada indica o ponto onde ocorre o primeiro miacutenimo de I(τ) (FMMI ndash First Minimum of Mutual Information) e assim a determinaccedilatildeo do passo de reconstruccedilatildeo ldquooacutetimordquo para este segmento (τ = 5)

A partir de um histograma de b intervalos de classe (bins) criado para estimar a distribuiccedilatildeo de probabilidade dos dados de um sinal x(t) a informaccedilatildeo muacutetua meacutedia entre x(t) e sua versatildeo defasada x(t + τ) eacute estimada por meio da expressatildeo

( ) ( ) ( )( ) ( )

21 1

( ) ( )( ) ( ) log

( ) ( )b b i j

i ji j i j

IP x t x t

P x t x tP x t P x t= =

= + τ

τ + τsum sum + τ

(2)

em que Pi(x(t)) eacute a probabilidade de que o sinal x(t) assuma um valor dentro do i-eacutesimo intervalo do histograma Pj(x(t+τ)) eacute a probabilidade de que x(t + τ) esteja no j-eacutesimo intervalo e Pij(x(t) x(t+τ)) eacute a probabilidade de que simultaneamente o sinal de x(t) esteja no i-eacutesimo intervalo e x(t + τ) no j-eacutesimo intervalo (Kantz e Schreiber 2004)

Dimensatildeo de correlaccedilatildeo

A dimensatildeo de correlaccedilatildeo uma das formas mais comuns de se calcular a dimensatildeo de um atrator eacute uma medida geomeacutetrica de uma trajetoacuteria no espaccedilo de fase que descreve o quanto dois pontos dessa trajetoacuteria satildeo correlacionados Ela mede a probabilidade de se encontrar um par aleatoacuterio de pontos dentro de um determinado volume elementar (Savi 2006)

Grassberger e Procaccia (1983) desenvolveram um algoritmo para o caacutelculo da dimensatildeo de correlaccedilatildeo em que a probabilidade de se ter dois pontos do atrator numa caixa de lado ε eacute aproximada pela probabilidade de que a distacircncia entre dois pontos seja menor que ε Esse algoritmo fornece um limite inferior e um valor aproximado para a dimensatildeo fractal (Fiedler-Ferrara e Prado 1994)

Seja q(ε) a fraccedilatildeo de pontos do atrator que estaacute dentro de uma hiperesfera de raio ε centrada no ponto ξi (i-eacutesimo vetor de imersatildeo m-dimensional) Essa fraccedilatildeo eacute expressa pela relaccedilatildeo

( )1

1( )N

i jj

qN =

ε = θ ε minus ξ minus ξsum

(3)

sendo N o nuacutemero de pontos no atrator A funccedilatildeo degrau θ(x) eacute tal que θ = 1 se x ge 0 e θ = 0 se x lt 0 Define-se a integral de correlaccedilatildeo Cm(ε) como

1( )

1( ) lim ( )1

Nm N i i j

C qN rarrinfin = ne

ε = εsumminus

(4)

A dimensatildeo de correlaccedilatildeo eacute entatildeo calculada para cada valor de m como

2 0

log ( )limlog( )

mCDεrarr

εε

(5)

ou seja D2 eacute a inclinaccedilatildeo de uma reta definida pelo graacutefico log Cm(ε) times log (ε) para um valor infinitesimal de ε

Na Figura 4 eacute apresentado o comportamento da dimensatildeo de correlaccedilatildeo em funccedilatildeo de m e de ε para um segmento de 32 ms de um sinal de voz saudaacutevel A fim de se estimar o valor de D2 em cada segmento do sinal satildeo consideradas as inclinaccedilotildees da integral de correlaccedilatildeo para diferentes dimensotildees de imersatildeo com m variando de 4 a 10

Figura 3 Funccedilatildeo de Informaccedilatildeo Muacutetua e determinaccedilatildeo do passo de reconstruccedilatildeo oacutetimo para um segmento de 32 ms da vogal sustentada aFigure 3 Mutual Information Function and the determination of optimal reconstruction step for a 32 ms frame of a sustained vowel

Figura 4 Comportamento da dimensatildeo de correlaccedilatildeo para um segmento de 32 ms de um sinal de voz saudaacutevel em funccedilatildeo da dimensatildeo de imersatildeo e do valor de ε em que as curvas correspondem as diferentes dimensotildees de imersatildeo (m = 4 10) de baixo para cima respectivamenteFigure 4 Correlation dimension behavior for a 32 ms segment of a healthy speech signal in function of the embedded dimension and ε value wherein the curves correspond to the different embedded dimensions (m = 4 hellip 10) upwards respectively

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 7

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

A partir da inspeccedilatildeo visual do comportamento dos valores da dimensatildeo de correlaccedilatildeo em funccedilatildeo de m e de ε eacute levado a efeito a determinaccedilatildeo do valor de ε que oferece o menor coeficiente de variaccedilatildeo entre as curvas dentro de um intervalo de convergecircncia O valor de D2 para o segmento eacute estimado como sendo a meacutedia dos valores obtidos de cada curva para este valor de ε Para o segmento ilustrado na Figura 4 o quadrado sobreposto ao graacutefico indica os valores encontrados (ε = 0050 e D2 = 143)

Entropia de Shannon

Dado um determinado sinal a entropia de Shannon H1 eacute definida como (Shannon 1948)

( )1 21

logM

i ii

H p p=

= minussum

(6)

em que pi eacute a probabilidade de que o sinal pertenccedila a um intervalo i e M eacute o nuacutemero de particcedilotildees em seu espaccedilo de fase

A entropia de Shannon H1 eacute a medida de informaccedilatildeo necessaacuteria para localizar um sistema em um determinado estado significando que H1 eacute a medida da incerteza sobre o sistema fiacutesico (Torres et al 2003) As medidas de entropia avaliam o grau de desordem de um sinal podendo ser empregadas para avaliar as desordens nos sinais de vozes afetados por patologias na laringe (Little et al 2007 Scalassara et al 2008)

Entropia de correlaccedilatildeo

O procedimento de Grassberger-Procaccia permite estimar a entropia de Correlaccedilatildeo K2 a partir das integrais de correlaccedilatildeo Cm(ε) (Equaccedilatildeo 4) da seguinte forma

21

( )1( ) ln( )

m

m

CKC +

εε =τ ε

(7)

em que τ eacute o passo utilizado na reconstruccedilatildeo e m eacute a dimensatildeo de imersatildeo

Na Figura 5 eacute apresentado o comportamento da entropia de correlaccedilatildeo em funccedilatildeo de m e de ε para um segmento de 32 ms de um sinal de voz patoloacutegico A fim de se estimar o valor de K2 em cada segmento do sinal satildeo consideradas as curvas com os valores da entropia de correlaccedilatildeo para diferentes dimensotildees de imersatildeo com m variando de 4 a 10 e diferentes valores de ε

A partir da inspeccedilatildeo visual do comportamento dos valores da entropia de correlaccedilatildeo em funccedilatildeo de m e de ε eacute levada a efeito a determinaccedilatildeo do valor de ε que oferece o menor coeficiente de variaccedilatildeo entre as curvas dentro de um intervalo de convergecircncia O valor de K2 para o segmento eacute estimado como sendo

a meacutedia dos valores obtidos de cada curva para este valor de ε A entropia de correlaccedilatildeo do sinal eacute tomada como sendo a meacutedia calculada sob todos os segmentos do sinal analisado No caso do segmento ilustrado na Figura 5 o quadrado sobreposto ao graacutefico indica os valores encontrados (ε = 0031 e K2 = 0184)

Entropia aproximada

A entropia aproximada ApEn eacute uma medida da informaccedilatildeo condicional meacutedia gerada por pontos divergentes numa trajetoacuteria no espaccedilo de fase (Arias-Londono et al 2011) Considerando valores fixos para m e ε e considerando os vetores dados na Equaccedilatildeo 1 a entropia aproximada eacute definida como (Pincus 1991)

1( ) lim ( ) ( )m mN

ApEn m +

rarrinfin ε = ϕ ε minus ϕ ε

(8)

em que11

1( ) ( 1) log ( )

N mm

iN m q

minus +minus

=ϕ ε = minus + εsum

(9)

e q(ε) eacute definida pela Equaccedilatildeo 3 e N eacute o nuacutemero de vetores do atrator reconstruiacutedo em uma dimensatildeo de imersatildeo miacutenima m

A capacidade de discriminar mudanccedilas de complexidade a partir de uma quantidade relativamente pequena de dados faculta a aplicaccedilatildeo da ApEn em uma variedade de contextos incluindo processos determiniacutesticos caoacuteticos e estocaacutesticos (Pincus 1991) Embora a medida da entropia aproximada natildeo seja uma medida de caos ela quantifica a regularidade do processo de imersatildeo em seacuteries temporais (Torres et al 2003)

Figura 5 Comportamento da entropia de correlaccedilatildeo para um segmento de 32 ms de um sinal de voz patoloacutegico em funccedilatildeo da dimensatildeo de imersatildeo e do valor de ε em que as curvas correspondem as diferentes dimensotildees de imersatildeo (m = 410) de baixo para cima respectivamenteFigure 5 Behavior of entropy correlation for a 32 ms frame of a pathological speech signal related to embedded dimension and ε value wherein the curves correspond to the different embedded dimensions (m = 4 hellip 10) upwards respectively

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 20138

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

Entropia de Tsallis

A entropia de Tsallis eacute uma generalizaccedilatildeo da entropia de Boltzmann-Gibbs (Chakrabarti e De 2000) Eacute definida como (Tsallis 1988)

111

qWi i

qpH k

q=minus sum=

minus (10)

em que q isin caracteriza a generalizaccedilatildeo e pi satildeo as probabilidades associadas com as W ( )W isinconfiguraccedilotildees possiacuteveis do sistema A entropia de Boltzmann-Gibbs eacute encontrada quando no limite qrarr1

A principal caracteriacutestica da entropia de Tsallis eacute a sua natildeo aditividade (Tavares 2003) Isto eacute a informaccedilatildeo contida em um sistema composto natildeo eacute a simples soma da informaccedilatildeo dos subsistemas que o compotildeem As entropias de Shannon e de Boltzmann apresentam a aditividade como uma de suas caracteriacutesticas A ideia principal da utilizaccedilatildeo da entropia de Tsallis eacute verificar a contribuiccedilatildeo do paracircmetro entroacutepico (q) na avaliaccedilatildeo de caracteriacutesticas natildeo extensivas (interaccedilotildees natildeo lineares) presentes na dinacircmica das seacuteries temporais (Silva 2010)

Expoentes de Lyapunov

Os expoentes de Lyapunov estatildeo relacionados agrave taxa meacutedia de divergecircncia ou de convergecircncia exponencial de oacuterbitas vizinhas no espaccedilo de fase Geralmente um sistema contendo pelo menos um expoente de Lyapunov positivo eacute definido como caoacutetico por outro lado um sistema sem nenhum expoente positivo eacute regular (Jiang et al 2006)

Neste trabalho eacute utilizada uma rotina do pacote TISEAN (Hegger et al 1999) a fim de se obter o crescimento exponencial meacutedio das distacircncias entre duas trajetoacuterias que eacute baseada no algoritmo de Kantz (1994) O programa basicamente gera os resultados da expressatildeo (Kantz e Schreiber 2004)

( ) 00 0

1

1 1( ) ln( ) n no

Nn n n n

n S Sn

S n s sN S +∆ +∆

= isinυ

∆ = minussum sum υ

(11)

onde S(∆n) eacute chamado de fator de crescimento (stretching factor) Sn0 satildeo os vetores de imersatildeo e υ(Sn0) eacute a vizinhanccedila de Sn0 com diacircmetro ε Na Figura 6 estaacute ilustrado o comportamento de S(∆n) em funccedilatildeo do nuacutemero de iteraccedilotildees ∆n para trecircs diferentes valores de ε e m variando de 4 a 8 A linha reta representa a inclinaccedilatildeo meacutedia das curvas mostradas e sua inclinaccedilatildeo eacute a estimaccedilatildeo para o maior expoente de Lyapunov λ1

Expoente de HurstO paracircmetro ou expoente de Hurst (Hurst 1951) eacute uma medida de autossimilaridade que vem sendo empregada em diversas aacutereas tais como gerenciamento de traacutefego autossimilar de redes de computadores (Gomes et al 2001) reconhecimento de padrotildees sonoros para avaliaccedilatildeo de sons pulmonares (Custoacutedio 1999) sistemas de reconhecimento de locutor (SantrsquoAna et al 2006) detecccedilatildeo de diferentes aacutereas do ceacuterebro (Rodriacuteguez-Saacutenchez et al 2008) e anaacutelise de sinais EEG (eletroencefalograma) (Natarajan et al 2004) entre outros Em processamento de sinais de voz este paracircmetro tem sido empregado por representar o comportamento estocaacutestico da voz (Fantinato 2008) Aleacutem disso apresenta um baixo custo computacional podendo ser obtido em tempo real durante atividade da fala (SantrsquoAna et al 2006)

Quanto maior o valor do paracircmetro de Hurst maior eacute o impacto das autocorrelaccedilotildees no desempenho do sistema Aleacutem disso pequenas variaccedilotildees no paracircmetro de Hurst podem significar mudanccedilas significativas no comportamento dos sinais caracterizando o grau de desordem do mesmo (Gomes et al 2001) O estimador RS empregado neste trabalho eacute um dos mais conhecidos e simples meacutetodos para estimar o grau de dependecircncia de uma sequecircncia amostral A estatiacutestica RS eacute a soma parcial dos desvios em relaccedilatildeo a sua meacutedia de uma sequecircncia reescalonada pelo seu desvio padratildeo (Alvarez-Ramirez et al 2008)

Se o processo estocaacutestico associado agrave sequecircncia eacute escalonada sobre certo domiacutenio n a estatiacutestica RS segue a equaccedilatildeo

HR S an= (12)

em que RS eacute a distacircncia reescalonada (dividida pelo desvio padratildeo) a eacute uma constante e H eacute o expoente de Hurst

Anaacutelise preditiva linearA ideia baacutesica na prediccedilatildeo linear eacute a de que o valor de uma amostra pode ser aproximado (predita) por

Figura 6 Comportamento de S(∆n) em funccedilatildeo do nuacutemero de iteraccedilotildees de ε e de m (m = 4 8)Figure 6 Behavior of S(∆n) related to iteration number ε and m (m = 48)

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 9

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

combinaccedilatildeo linear dos valores das amostras anteriores levando em consideraccedilatildeo a correlaccedilatildeo entre estas Os coeficientes de prediccedilatildeo linear ou coeficientes LPC (Linear Predictive Coding) satildeo estimados por minimizaccedilatildeo do erro quadraacutetico entre a amostra atual e a sua prediccedilatildeo (OrsquoShaughnessy 2000 Rabiner e Juang 1993)

O modelo linear de produccedilatildeo da fala incorpora os efeitos dos pulsos glotais trato vocal e da radiaccedilatildeo dos laacutebios como um filtro linear (Rabiner e Schafer 1978) A fonte eacute uma sequecircncia de impulsos quase perioacutedicos utilizados para gerar sons sonoros ou a adiccedilatildeo de uma sequecircncia de ruiacutedo aleatoacuterio para sons surdos

Um fator de ganho G eacute ajustado para controlar a intensidade da excitaccedilatildeo Combinando os efeitos dos pulsos glotais do trato vocal e da radiaccedilatildeo o modelo pode ser representado por uma funccedilatildeo de transferecircncia de apenas polos H(z) como

1( )

1 ( )p kk

GH zk zminus

==

minus αsum (13)

Os termos α(k) representam os coeficientes de prediccedilatildeo linear (coeficientes LPC) e p a ordem do filtro de prediccedilatildeo

O meacutetodo LPC estima cada amostra de voz baseado numa combinaccedilatildeo linear de p amostras anteriores Um valor de p maior representa um modelo mais preciso A anaacutelise LPC fornece um conjunto de paracircmetros da fala que representa o trato vocal Espera-se que qualquer mudanccedila na estrutura anatocircmica do trato vocal devido agrave patologia afete os coeficientes LPC

Classificaccedilatildeo

Apoacutes a extraccedilatildeo das caracteriacutesticas tanto pela anaacutelise linear quanto pela natildeo linear eacute realizado o processo de classificaccedilatildeo Neste processo eacute aplicada a anaacutelise discriminante quadraacutetica (QDA) com validaccedilatildeo cruzada em que satildeo utilizados 10 subconjuntos (folds) Satildeo avaliados os desempenhos de classificadores implementados com cada uma das caracteriacutesticas de forma individual e de classificadores implementados a partir da combinaccedilatildeo dessas caracteriacutesticas

Outros classificadores satildeo implementados com coeficientes LPC de ordem p variando de 12 a 24 (p = 12 16 20 e 24) Apoacutes a avaliaccedilatildeo individual de cada meacutetodo (linear e natildeo linear) satildeo construiacutedos vetores hiacutebridos em que a cada vetor LPC de ordem p satildeo adicionadas as medidas natildeo lineares Uma nova avaliaccedilatildeo de desempenho eacute realizada a partir dos vetores hiacutebridos

Para avaliaccedilatildeo de desempenho do processo de classificaccedilatildeo trecircs medidas satildeo utilizadas acuraacutecia sensibilidade e especificidade A Acuraacutecia mede a

taxa de classificaccedilatildeo correta global do teste ou seja a capacidade do teste de identificar corretamente quando haacute e quando natildeo haacute presenccedila da doenccedila A Acuraacutecia (Equaccedilatildeo 14) eacute definida como a relaccedilatildeo entre todos os sinais corretamente classificados e o nuacutemero total de sinais avaliados

VP VNAcuraacuteciaVP VN FP FN

+=+ + +

(14)

em que VP representa os verdadeiros positivos ou seja o nuacutemero de sinais classificados corretamente como patoloacutegicos VN representa os verdadeiros negativos ou seja em quantos sinais foram detectados a ausecircncia correta da patologia FP os falsos positivos ou a quantidade de sinais saudaacuteveis classificados erroneamente como patoloacutegicos e FN os falsos negativos ou seja a quantidade de sinais patoloacutegicos classificados erroneamente como saudaacuteveis

A Sensibilidade mede a capacidade do teste em identificar corretamente a doenccedila entre aqueles que a possuem ou seja o quatildeo sensiacutevel eacute o teste Eacute a relaccedilatildeo entre os sinais patoloacutegicos corretamente classificados e o nuacutemero total de sinais patoloacutegicos dada por

VPSensibilidadeVP FN

=+

(15)

A Especificidade mede a capacidade do teste em excluir corretamente aqueles que natildeo possuem a doenccedila ou seja o quatildeo especiacutefico eacute o teste Eacute a relaccedilatildeo entre os sinais saudaacuteveis corretamente classificados e o nuacutemero total de sinais saudaacuteveis

VNEspecificidadeVN FP

=+

(16)

Os resultados obtidos no processo de classificaccedilatildeo satildeo apresentados a seguir

ResultadosNa Tabela 1 satildeo apresentados os valores de acuraacutecia obtidos com o uso de cada uma das medidas da anaacutelise dinacircmica natildeo linear (MNL) para a classificaccedilatildeo entre vozes saudaacuteveis (SDL) e patoloacutegicas (PTL) usando a anaacutelise discriminante quadraacutetica (QDA ndash Quadratic Discriminant Analysis) A classe dos sinais patoloacutegicos inclui os sinais afetados por edema noacutedulos e paralisia nas pregas vocais O expoente de Hurst H foi o paracircmetro mais eficiente em capturar as desordens vocais presentes nos sinais de vozes patoloacutegicas comparadas aos sinais de vozes saudaacuteveis tendo a maior acuraacutecia no processo de classificaccedilatildeo

Na Tabela 2 satildeo apresentados inicialmente os resultados obtidos na classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas (SDL times PTL) mediante a

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201310

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

combinaccedilatildeo das medidas Observa-se que com a combinaccedilatildeo de apenas quatro medidas entre as oito foi obtida a maior acuraacutecia (9603 plusmn 411) com as medidas entropia de Shannon (H1) entropia de Tsallis (Hq) expoente de Hurst (H) e a dimensatildeo de correlaccedilatildeo (D2) O acreacutescimo das trecircs medidas ao expoente de Hurst proporcionou um aumento de cerca de 9 no valor da acuraacutecia alcanccedilada com o uso individual desta caracteriacutestica

As patologias satildeo separadas em classes diferentes (paralisia edema ou noacutedulo) e comparadas aos sinais saudaacuteveis constituindo as seguintes comparaccedilotildees saudaacutevel times edema (SDL times EDM) saudaacutevel times paralisa (SDL times PRL) e saudaacutevel times noacutedulo (SDL times NDL) Como apresentado na Tabela 2 nesses casos as taxas de acuraacutecia meacutedia satildeo superiores a 97 com todas as taxas de especificidade chegando a 100 o que significa que nenhum sinal saudaacutevel testado foi considerado patoloacutegico O expoente de Hurst e as entropias de Shannon e de Tsallis aparecem em todas as combinaccedilotildees associando-se a outras medidas no caso da discriminaccedilatildeo entre saudaacutevel e edema e entre saudaacutevel e paralisia

Na distinccedilatildeo entre patologias observa-se pela Tabela 2 mesmo com a combinaccedilatildeo das medidas

a acuraacutecia meacutedia atingiu no maacuteximo 86 enquanto que os valores de sensibilidade meacutedia natildeo chegaram a 75 Dessa forma visando aumentar o desempenho na classificaccedilatildeo foi investigada a influecircncia do uso combinado das medidas da anaacutelise natildeo linear com os coeficientes LPC na discriminaccedilatildeo entre as patologias consideradas Nas Figuras 7 a 9 satildeo mostrados os resultados obtidos na discriminaccedilatildeo entre paralisia e edema paralisia e noacutedulo e entre edema e noacutedulo respectivamente

Tabela 2 Avaliaccedilatildeo de desempenho das medidas combinadas ndash valores de acuraacutecia obtidos na classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas e entre as patologiasTable 2 Performance evaluation of combined measures - values of the obtained accuracy in classification between healthy and pathological voices and among pathologies

Classificaccedilatildeo Caracteriacutesticas Acuraacutecia () Sensibilidade () Especificidade ()SDL times PTL H1 Hq H e D2 9603 plusmn 411 9446 plusmn 513 9800 plusmn 452SDL times EDM H1 Hq H D2 e K2 9875 plusmn 283 9667 plusmn 754 100SDL times PRL FMMI H D2 e H1 ou Hq 9750 plusmn 377 9333 plusmn 1005 100SDL times NDL H1 Hq e H 9857 plusmn 323 9500 plusmn 1131 100PRL times EDM λ1 FMMI Hq ApEn D2 e K2 7700 plusmn 1459 7417 plusmn 1874 8167 plusmn 1817PRL times NDL λ1 H ApEn D2 e K2 8600 plusmn 1103 6500 plusmn 2966 9667 plusmn 1494

EDM times NDL λ1 FMMI H1 Hq H e D2 7600 plusmn 951 5500 plusmn 2639 8667 plusmn 1231

Tabela 1 Avaliaccedilatildeo de desempenho das medidas individuais ndash valores de Acuraacutecia () obtidos na classificaccedilatildeo entre vozes saudaacuteveis e vozes patoloacutegicasTable 1 Performance evaluation of individual measures ndash values of the obtained accuracy in classification between healthy and pathological voices

Medidas Saudaacutevel times Patoloacutegica Saudaacutevel times Edema Saudaacutevel times Paralisia Saudaacutevel times Noacutedulo

λ1 5451 plusmn 823 6122 plusmn 1105 5855 plusmn 999 5232 plusmn 1308FMMI 6255 plusmn 574 6022 plusmn 848 6864 plusmn 1010 5821 plusmn 1446

H1 6085 plusmn 831 6944 plusmn 882 6582 plusmn 607 7464 plusmn 803Hq 6261 plusmn 921 6744 plusmn 718 6855 plusmn 766 7607 plusmn 682H 8709 plusmn 591 8567 plusmn 513 8809 plusmn 753 9429 plusmn 528

ApEn 5660 plusmn 672 6806 plusmn 615 6929 plusmn 1351 6667 plusmn 1037D2 7936 plusmn 1077 8458 plusmn 887 8750 plusmn 809 8262 plusmn 1254K2 5288 plusmn 509 6097 plusmn 1032 6196 plusmn 1198 5738 plusmn 881

Acuraacutecia maacuteximaMaximum accuracy

Figura 7 Classificaccedilatildeo entre vozes afetadas por paralisia e sinais afetados por edema nas pregas vocaisFigure 7 Classification between voices affected by vocal fold paralysis and vocal fold edema

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 11

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

Na discriminaccedilatildeo entre paralisia e edema a taxa de acuraacutecia sai de 9655 plusmn 151 com 12 coeficientes LPC para 9924 plusmn 052 com 24 coeficientes Aleacutem do acreacutescimo na acuraacutecia meacutedia em mais de 18 em relaccedilatildeo ao uso dos melhores resultados individuais (LPC) com a combinaccedilatildeo (MNL e LPC) o erro padratildeo caiu consideravelmente aumentando a confiabilidade do teste

Na discriminaccedilatildeo entre paralisia e noacutedulo a acuraacutecia de 86 soacute com as medidas natildeo lineares cresce para valores maiores que 99 Com 12 coeficientes LPC a acuraacutecia eacute de 9919 plusmn 055 com sensibilidade 100 e especificidade meacutedia de aproximadamente 98

A acuraacutecia meacutedia na classificaccedilatildeo entre edema e noacutedulo antes de 76 com as medidas natildeo lineares e cerca de 70 com LPC chega a mais de 98 com o vetor hiacutebrido com apenas 12 coeficientes E passa dos 99 a partir de 16 coeficientes quando associados agraves medidas natildeo lineares

DiscussatildeoPelos resultados apresentados constata-se que o desempenho da classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas aumentou significativamente com a combinaccedilatildeo das medidas da anaacutelise dinacircmica natildeo linear Nos melhores resultados o expoente de Hurst que se destacou como melhor medida individual aparece em todas as combinaccedilotildees juntamente com as entropias de Shannon e de Tsallis para a classificaccedilatildeo entre os sinais de vozes saudaacuteveis e sinais afetados por paralisa edema ou noacutedulo No entanto essas medidas natildeo foram eficazes em discriminar entre patologias apresentando taxas inferiores agraves apresentadas na discriminaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas

A anaacutelise LPC comparada agraves outras medidas empregadas mostra-se mais eficaz em discriminar entre patologias Observa-se que o valor da acuraacutecia aumenta com o aumento da ordem de preditor Aleacutem disso o desempenho na classificaccedilatildeo entre patologias melhora significativamente ao combinar as medidas natildeo lineares com os coeficientes LPC

Eacute importante considerar que o aumento na ordem dos coeficientes LPC estaacute associado a um maior volume de dados a serem processados aumentando o custo computacional No entanto caso seja mais relevante a precisatildeo do diagnoacutestico do que a realizaccedilatildeo da anaacutelise em tempo real eacute possiacutevel optar por empregar uma maior quantidade de coeficientes LPC Observa-se pelos resultados que o valor da acuraacutecia natildeo teve um aumento tatildeo consideraacutevel com o aumento da ordem de prediccedilatildeo aleacutem de 16 coeficientes

ConclusatildeoA partir dos resultados obtidos constata-se que as medidas natildeo lineares conseguem capturar bem as desordens vocais provocadas por patologias nas pregas vocais como noacutedulos edemas e paralisia A consideraccedilatildeo das natildeo linearidades inerentes ao processo de produccedilatildeo da fala e sua consequente anaacutelise utilizando medidas natildeo lineares eacute eficiente em distinguir um sinal saudaacutevel de um sinal patoloacutegico comprovadamente com as patologias consideradas no trabalho (edema paralisia e noacutedulos nas pregas vocais) Entretanto observa-se que a abordagem pelo modelo linear de produccedilatildeo da fala em que os coeficientes LPC modelam o trato vocal consegue distinguir melhor as especificidades existentes nas patologias analisadas notadamente quando combinadas agrave abordagem natildeo linear As mudanccedilas nas estruturas anatocircmicas do trato vocal e da fonte (laringe) foram bem retratadas com a combinaccedilatildeo das duas abordagens sendo a principal contribuiccedilatildeo deste trabalho Com a abordagem hiacutebrida o desempenho na distinccedilatildeo entre

6012 16 20

Nuacutemero de coeficientes LPC

Paralisia times Noacutedulo

24

6468

Acu

raacuteci

a m

eacutedia

()

72768084889296

100

MNL LPC MNL + LPC

Figura 8 Classificaccedilatildeo entre vozes afetadas por paralisia e sinais afetados por noacutedulos nas pregas vocaisFigure 8 Classification between voices affected by vocal fold paralysis and vocal nodules

Figura 9 Classificaccedilatildeo entre vozes afetadas por edema e sinais afetados por noacutedulos nas pregas vocaisFigure 9 Classification between voices affected by vocal fold Edema and vocal nodules

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201312

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

as patologias obteve um aumento consideraacutevel Isto denota que o meacutetodo empregado eacute bastante promissor na tarefa de discriminar entre vozes saudaacuteveis e vozes afetadas por patologias lariacutengeas bem como entre patologias Espera-se que os meacutetodos apresentados nesta pesquisa contribuam ainda mais para a detecccedilatildeo precoce das doenccedilas da laringe auxiliando no seu diagnoacutestico ou para monitorar seu progresso buscando assegurar os cuidados cliacutenicos adequados e mais conforto aos pacientes

ReferecircnciasAlvarez-Ramirez J Echeverria JC Rodriguez E Performance of a high-dimensional RS method for Hurst exponent estimation Physica A Statistical Mechanics and its Applications 2008 387(26)6452-62 httpdxdoiorg101016jphysa200808014

Arias-Londono J Godino-Llorente J Saacuteenz-Lechoacuten N Osma-Ruiz V Castellanos-Dominguez G Automatic detection of pathological voices using complexity measures noise parameters and mel-cepstral coefficients IEEE Transactions on Biomedical Engineering 2011 58(2)370-9 httpdxdoiorg101109TBME20102089052

Boyanov B Ivanov T Hadjitodorov S Chollet G Robust hybrid pitch detector Electronic Letters 1993 29(22)1924-6 httpdxdoiorg101049el19931281

Chakrabarti CG De K Boltzmann-Gibbs entropy axiomatic characterization and application International Journal of Mathematics and Mathematical Sciences 2000 23(4)243-51 httpdxdoiorg101155S0161171200000375

Custoacutedio RF Anaacutelise Natildeo-linear no reconhecimento de padrotildees sonoros Estudo de caso para sons pulmonares [tese] Rio Grande do Sul Universidade Federal do Rio Grande do Sul 1999 119 p

Dajer ME Padrotildees visuais de sinais de voz atraveacutes de teacutecnica de anaacutelise de natildeo-linear [dissertaccedilatildeo] Satildeo Paulo Escola de Engenharia de Satildeo Carlos 2006 154 p

Fantinato PC Segmentaccedilatildeo de voz baseada na anaacutelise fractal e na transformada wavelet [dissertaccedilatildeo] Satildeo Paulo Instituto de Fiacutesica de Satildeo Carlos da Universidade de Satildeo Carlos 2008 123 p

Fiedler-Ferrara N Prado CPC Caos Uma introduccedilatildeo Satildeo Paulo Ed Edgard Blucher Ltda 1994

Fraser AM Swinney HL Independent coordinates for strange attractors from mutual information Physical Review A 1986 331134-40 httpdxdoiorg 101103PhysRevA331134

Godino-Llorente JI Goacutemez-Vilda P Blanco Velasco M Dimensionality reduction of a pathological voice quality assessment system based on gaussian mixture models and short-term cepstral parameters IEEE Transactions on Biomedical Engineering 2006 53(10)1943-53 httpdxdoiorg101109TBME2006871883

Gomes D Fonseca N Agoulmine N Souza JN Neurocomputaccedilatildeo na estimativa do paracircmetro de hurst

In SBRCrsquo2001 Anais do 19 Simpoacutesio Brasileiro de Redes de Computadores 2001 Maio Florianoacutepolis Santa Catarina Florianoacutepolis 2001 p 306-21

Grassberger P Procaccia I Measuring the strangeness of strange attractors Physica D 1983 9189-208 httpdxdoiorg1010160167-2789(83)90298-1

Hegger R Kantz H Schreiber T Practical implementation of nonlinear time series methods the tisean package Chaos 1999 9(2)413-35 httpdxdoiorg1010631166424

Henriacutequez P Alonso JB Ferrer MA Travieso CM Godino-Llorente JI Diacuteaz-De-Maria F Characterization of healthy and pathological voice through measures based on nonlinear dynamics IEEE Transactions on Audio Speech and Language Processing 2009 17(6)1186-95 httpdxdoiorg101109TASL20092016734

Hurst E Long term storage capacity of reservoirs Transactions of the American Society of Civil Engineers 1951 116770-9

Jiang JJ Zhang Y McGilligan C Chaos in voice from modeling to measurement Journal of Voice 2006 20(1)2-17 httpdxdoiorg101016jjvoice200501001

Johnson MT Povinelli RJ Lindgren AC Ye J Liu X Indrebo KM Time-domain isolated phoneme classification using reconstructed phase spaces IEEE Transactions Speech and Audio Processing 2005 13(4)458-66 httpdxdoiorg101109TSA2005848885

Kantz H A Robust Method to Estimate the maximal lyapunov exponent of a time series Physics Letters A 1994 18577-87 httpdxdoiorg1010160375-9601(94)90991-1

Kantz H Schreiber T Nonlinear time series analysis 2nd ed Cambridge University Press 2004

Kay Elemetrics Disordered Voice Database Model 4337 3th ed United Satates 1994

Kokkinos I Maragos P Nonlinear speech analysis using models for chaotic systems IEEE Transactions on Speech and Audio Processing 2005 13(6)1098-109 httpdxdoiorg101109TSA2005852982

Kumar A Mullick SK Nonlinear dynamical analysis of speech Journal Acoustic Society America 1996 100(1)615-29 httpdxdoiorg1011211415886

Little M Biomechanically informed nonlinear speech signal processing [tese] Oxford University of Oxford England 2006 164 p

Little M McSharry P Roberts S Costello D Moroz I Exploiting nonlinear recurrence and fractal scaling properties for voice disorder detection BioMedical Engineering OnLine 2007 6(23)1-19 httpdxdoiorg1011861475-925X-6-23

Manfredi C Pierazzi L Bruscaglioni P Pitch estimation for noise retrieval in time and frequency domain Medical amp Biological Engineering amp Computing 1999 37(2)532

Natarajan K Acharya UR Alias F Tiboleng T Puthusserypady SK Nonlinear analysis of EEG signals at different mental states BioMedical Engineering OnLine 2004 37 httpdxdoiorg1011861475-925X-3-7

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 13

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

OrsquoShaughnessy D Speech communications human and machine 2nd ed New York IEEE Press 2000

Petry A Reconhecimento automaacutetico de locutor utilizando medidas de invariantes dinacircmicas natildeo-lineares [tese] Rio Grande do Sul Universidade Federal do Rio Grande do Sul 2002 155 p

Pincus SM Approximate entropy as a measure of system complexity Proceedings of the National Academy of Sciences 1991 882297-301 httpdxdoiorg101073pnas8862297

Rabiner LR Schafer RW Digital processing of speech signals Upper Saddle River Prentice Hall 1978

Rabiner LR Juang BH Fundamentals of speech recognition Englewood Ciffs New Jersey Prentice Hall 1993

Rodriacuteguez-Saacutenchez A Delgado-Trejos E Orozco-Gutieacuterrez A Castellanos-Domiacutenguez G Nonlinear dynamics techniques for the detection of the brain areas using MER signals International Conference on BioMedical Engineering and Informatics 2008 2198-202 httpdxdoiorg101109BMEI2008330

SantrsquoAna R Coelho R Alcaim A Text-independent speaker recognition based on the hurst parameter and the multidimensional fractional brownian motion model IEEE Transactions on Audio Speech and Language Processing 2006 14(3)931-40 httpdxdoiorg101109TSA2005858054

Savi MA Dinacircmica natildeo-linear e Caos Rio de Janeiro E-papers 2006

Scalassara PR Dajer ME Maciel CD Pereira JC Voice signals characterization through entropy measures In BIOSIGNALS 2008 Proceedings of the International Conference on Bio-inspired Systems and

Signal Processing 2008 Jan 28-31 Madeira Portugal Madeira 2008 v 2 p 163-170

Schreiber T Schmitz A Surrogate time series Physica D 2000 142346-82 httpdxdoiorg101016S0167-2789(00)00043-9

Shannon C A Mathematical theory of communication The Bell System Technical Journal 1948 27(3)623-56

Silva LEV Ferramentas computacionais na anaacutelise da variabilidade da frequecircncia cardiacuteaca atraveacutes do paradigma natildeo extensivo no estudo de cardiopatias [dissertaccedilatildeo] Satildeo Paulo Universidade de Satildeo Paulo 2010 97 p

Takens F Detecting Strange Attractors in Turbulence In Rand DA Young L-S Dynamical systems and turbulence New York Springer-Verlag 1981 v 898 p 366-81

Tavares AHMP Aspectos matemaacuteticos da entropia [dissertaccedilatildeo] Portugal Universidade de Aveiro 2003 98 p

Tokuda I Miyano T Aihara K Surrogate analysis for detecting nonlinear dynamics in normal vowels The Journal of the Acoustical Society of America 2001 110(6)3207-17

Torres ME Gamero LG Rufiner HL Study of complexity in normal and pathological speech signals In EMBC 2003 Proceedings of the 25th Annual International Conference of the IEEE Engineering in Medicine and Biology Society 2003 17-21 Sept Cancun Meacutexico IEEE 2003 p 2339-2342 httpdxdoiorg101109IEMBS20031280385

Tsallis C Possible generalization of Boltzmann-Gibbs statistics Journal of Statistical Physics 1988 52(12)479-87 httpdxdoiorg101007BF01016429

Zhang Y Jiang JJ Acoustic analyses of sustained and running voices from patients with laryngeal pathologies Journal of Voice January 2008 22(1)1-9 httpdxdoiorg101016jjvoice200608003

Autores

Washington Ceacutesar de Almeida Costa Francisco Marcos de Assis Departamento de Engenharia Eleacutetrica ndash DEE Universidade Federal de Campina Grande ndash UFCG Campina Grande PB Brasil

Washington Ceacutesar de Almeida Costa Silvana Luciene do Nascimento Cunha Costa Coordenaccedilatildeo do Curso Superior de Bacharelado em Engenharia Eleacutetrica ndash CCSBEE Instituto Federal de Educaccedilatildeo Ciecircncia e Tecnologia da Paraiacuteba ndash IFPB Av Primeiro de Maio 720 Jaguaribe CEP 58015-430 Joatildeo Pessoa PB Brasil

Benedito Guimaratildees Aguiar Neto Universidade Presbiteriana Mackenzie CEP 01302-907 Satildeo Paulo SP Brasil

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201314

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

A partir da inspeccedilatildeo visual do comportamento dos valores da dimensatildeo de correlaccedilatildeo em funccedilatildeo de m e de ε eacute levado a efeito a determinaccedilatildeo do valor de ε que oferece o menor coeficiente de variaccedilatildeo entre as curvas dentro de um intervalo de convergecircncia O valor de D2 para o segmento eacute estimado como sendo a meacutedia dos valores obtidos de cada curva para este valor de ε Para o segmento ilustrado na Figura 4 o quadrado sobreposto ao graacutefico indica os valores encontrados (ε = 0050 e D2 = 143)

Entropia de Shannon

Dado um determinado sinal a entropia de Shannon H1 eacute definida como (Shannon 1948)

( )1 21

logM

i ii

H p p=

= minussum

(6)

em que pi eacute a probabilidade de que o sinal pertenccedila a um intervalo i e M eacute o nuacutemero de particcedilotildees em seu espaccedilo de fase

A entropia de Shannon H1 eacute a medida de informaccedilatildeo necessaacuteria para localizar um sistema em um determinado estado significando que H1 eacute a medida da incerteza sobre o sistema fiacutesico (Torres et al 2003) As medidas de entropia avaliam o grau de desordem de um sinal podendo ser empregadas para avaliar as desordens nos sinais de vozes afetados por patologias na laringe (Little et al 2007 Scalassara et al 2008)

Entropia de correlaccedilatildeo

O procedimento de Grassberger-Procaccia permite estimar a entropia de Correlaccedilatildeo K2 a partir das integrais de correlaccedilatildeo Cm(ε) (Equaccedilatildeo 4) da seguinte forma

21

( )1( ) ln( )

m

m

CKC +

εε =τ ε

(7)

em que τ eacute o passo utilizado na reconstruccedilatildeo e m eacute a dimensatildeo de imersatildeo

Na Figura 5 eacute apresentado o comportamento da entropia de correlaccedilatildeo em funccedilatildeo de m e de ε para um segmento de 32 ms de um sinal de voz patoloacutegico A fim de se estimar o valor de K2 em cada segmento do sinal satildeo consideradas as curvas com os valores da entropia de correlaccedilatildeo para diferentes dimensotildees de imersatildeo com m variando de 4 a 10 e diferentes valores de ε

A partir da inspeccedilatildeo visual do comportamento dos valores da entropia de correlaccedilatildeo em funccedilatildeo de m e de ε eacute levada a efeito a determinaccedilatildeo do valor de ε que oferece o menor coeficiente de variaccedilatildeo entre as curvas dentro de um intervalo de convergecircncia O valor de K2 para o segmento eacute estimado como sendo

a meacutedia dos valores obtidos de cada curva para este valor de ε A entropia de correlaccedilatildeo do sinal eacute tomada como sendo a meacutedia calculada sob todos os segmentos do sinal analisado No caso do segmento ilustrado na Figura 5 o quadrado sobreposto ao graacutefico indica os valores encontrados (ε = 0031 e K2 = 0184)

Entropia aproximada

A entropia aproximada ApEn eacute uma medida da informaccedilatildeo condicional meacutedia gerada por pontos divergentes numa trajetoacuteria no espaccedilo de fase (Arias-Londono et al 2011) Considerando valores fixos para m e ε e considerando os vetores dados na Equaccedilatildeo 1 a entropia aproximada eacute definida como (Pincus 1991)

1( ) lim ( ) ( )m mN

ApEn m +

rarrinfin ε = ϕ ε minus ϕ ε

(8)

em que11

1( ) ( 1) log ( )

N mm

iN m q

minus +minus

=ϕ ε = minus + εsum

(9)

e q(ε) eacute definida pela Equaccedilatildeo 3 e N eacute o nuacutemero de vetores do atrator reconstruiacutedo em uma dimensatildeo de imersatildeo miacutenima m

A capacidade de discriminar mudanccedilas de complexidade a partir de uma quantidade relativamente pequena de dados faculta a aplicaccedilatildeo da ApEn em uma variedade de contextos incluindo processos determiniacutesticos caoacuteticos e estocaacutesticos (Pincus 1991) Embora a medida da entropia aproximada natildeo seja uma medida de caos ela quantifica a regularidade do processo de imersatildeo em seacuteries temporais (Torres et al 2003)

Figura 5 Comportamento da entropia de correlaccedilatildeo para um segmento de 32 ms de um sinal de voz patoloacutegico em funccedilatildeo da dimensatildeo de imersatildeo e do valor de ε em que as curvas correspondem as diferentes dimensotildees de imersatildeo (m = 410) de baixo para cima respectivamenteFigure 5 Behavior of entropy correlation for a 32 ms frame of a pathological speech signal related to embedded dimension and ε value wherein the curves correspond to the different embedded dimensions (m = 4 hellip 10) upwards respectively

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 20138

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

Entropia de Tsallis

A entropia de Tsallis eacute uma generalizaccedilatildeo da entropia de Boltzmann-Gibbs (Chakrabarti e De 2000) Eacute definida como (Tsallis 1988)

111

qWi i

qpH k

q=minus sum=

minus (10)

em que q isin caracteriza a generalizaccedilatildeo e pi satildeo as probabilidades associadas com as W ( )W isinconfiguraccedilotildees possiacuteveis do sistema A entropia de Boltzmann-Gibbs eacute encontrada quando no limite qrarr1

A principal caracteriacutestica da entropia de Tsallis eacute a sua natildeo aditividade (Tavares 2003) Isto eacute a informaccedilatildeo contida em um sistema composto natildeo eacute a simples soma da informaccedilatildeo dos subsistemas que o compotildeem As entropias de Shannon e de Boltzmann apresentam a aditividade como uma de suas caracteriacutesticas A ideia principal da utilizaccedilatildeo da entropia de Tsallis eacute verificar a contribuiccedilatildeo do paracircmetro entroacutepico (q) na avaliaccedilatildeo de caracteriacutesticas natildeo extensivas (interaccedilotildees natildeo lineares) presentes na dinacircmica das seacuteries temporais (Silva 2010)

Expoentes de Lyapunov

Os expoentes de Lyapunov estatildeo relacionados agrave taxa meacutedia de divergecircncia ou de convergecircncia exponencial de oacuterbitas vizinhas no espaccedilo de fase Geralmente um sistema contendo pelo menos um expoente de Lyapunov positivo eacute definido como caoacutetico por outro lado um sistema sem nenhum expoente positivo eacute regular (Jiang et al 2006)

Neste trabalho eacute utilizada uma rotina do pacote TISEAN (Hegger et al 1999) a fim de se obter o crescimento exponencial meacutedio das distacircncias entre duas trajetoacuterias que eacute baseada no algoritmo de Kantz (1994) O programa basicamente gera os resultados da expressatildeo (Kantz e Schreiber 2004)

( ) 00 0

1

1 1( ) ln( ) n no

Nn n n n

n S Sn

S n s sN S +∆ +∆

= isinυ

∆ = minussum sum υ

(11)

onde S(∆n) eacute chamado de fator de crescimento (stretching factor) Sn0 satildeo os vetores de imersatildeo e υ(Sn0) eacute a vizinhanccedila de Sn0 com diacircmetro ε Na Figura 6 estaacute ilustrado o comportamento de S(∆n) em funccedilatildeo do nuacutemero de iteraccedilotildees ∆n para trecircs diferentes valores de ε e m variando de 4 a 8 A linha reta representa a inclinaccedilatildeo meacutedia das curvas mostradas e sua inclinaccedilatildeo eacute a estimaccedilatildeo para o maior expoente de Lyapunov λ1

Expoente de HurstO paracircmetro ou expoente de Hurst (Hurst 1951) eacute uma medida de autossimilaridade que vem sendo empregada em diversas aacutereas tais como gerenciamento de traacutefego autossimilar de redes de computadores (Gomes et al 2001) reconhecimento de padrotildees sonoros para avaliaccedilatildeo de sons pulmonares (Custoacutedio 1999) sistemas de reconhecimento de locutor (SantrsquoAna et al 2006) detecccedilatildeo de diferentes aacutereas do ceacuterebro (Rodriacuteguez-Saacutenchez et al 2008) e anaacutelise de sinais EEG (eletroencefalograma) (Natarajan et al 2004) entre outros Em processamento de sinais de voz este paracircmetro tem sido empregado por representar o comportamento estocaacutestico da voz (Fantinato 2008) Aleacutem disso apresenta um baixo custo computacional podendo ser obtido em tempo real durante atividade da fala (SantrsquoAna et al 2006)

Quanto maior o valor do paracircmetro de Hurst maior eacute o impacto das autocorrelaccedilotildees no desempenho do sistema Aleacutem disso pequenas variaccedilotildees no paracircmetro de Hurst podem significar mudanccedilas significativas no comportamento dos sinais caracterizando o grau de desordem do mesmo (Gomes et al 2001) O estimador RS empregado neste trabalho eacute um dos mais conhecidos e simples meacutetodos para estimar o grau de dependecircncia de uma sequecircncia amostral A estatiacutestica RS eacute a soma parcial dos desvios em relaccedilatildeo a sua meacutedia de uma sequecircncia reescalonada pelo seu desvio padratildeo (Alvarez-Ramirez et al 2008)

Se o processo estocaacutestico associado agrave sequecircncia eacute escalonada sobre certo domiacutenio n a estatiacutestica RS segue a equaccedilatildeo

HR S an= (12)

em que RS eacute a distacircncia reescalonada (dividida pelo desvio padratildeo) a eacute uma constante e H eacute o expoente de Hurst

Anaacutelise preditiva linearA ideia baacutesica na prediccedilatildeo linear eacute a de que o valor de uma amostra pode ser aproximado (predita) por

Figura 6 Comportamento de S(∆n) em funccedilatildeo do nuacutemero de iteraccedilotildees de ε e de m (m = 4 8)Figure 6 Behavior of S(∆n) related to iteration number ε and m (m = 48)

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 9

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

combinaccedilatildeo linear dos valores das amostras anteriores levando em consideraccedilatildeo a correlaccedilatildeo entre estas Os coeficientes de prediccedilatildeo linear ou coeficientes LPC (Linear Predictive Coding) satildeo estimados por minimizaccedilatildeo do erro quadraacutetico entre a amostra atual e a sua prediccedilatildeo (OrsquoShaughnessy 2000 Rabiner e Juang 1993)

O modelo linear de produccedilatildeo da fala incorpora os efeitos dos pulsos glotais trato vocal e da radiaccedilatildeo dos laacutebios como um filtro linear (Rabiner e Schafer 1978) A fonte eacute uma sequecircncia de impulsos quase perioacutedicos utilizados para gerar sons sonoros ou a adiccedilatildeo de uma sequecircncia de ruiacutedo aleatoacuterio para sons surdos

Um fator de ganho G eacute ajustado para controlar a intensidade da excitaccedilatildeo Combinando os efeitos dos pulsos glotais do trato vocal e da radiaccedilatildeo o modelo pode ser representado por uma funccedilatildeo de transferecircncia de apenas polos H(z) como

1( )

1 ( )p kk

GH zk zminus

==

minus αsum (13)

Os termos α(k) representam os coeficientes de prediccedilatildeo linear (coeficientes LPC) e p a ordem do filtro de prediccedilatildeo

O meacutetodo LPC estima cada amostra de voz baseado numa combinaccedilatildeo linear de p amostras anteriores Um valor de p maior representa um modelo mais preciso A anaacutelise LPC fornece um conjunto de paracircmetros da fala que representa o trato vocal Espera-se que qualquer mudanccedila na estrutura anatocircmica do trato vocal devido agrave patologia afete os coeficientes LPC

Classificaccedilatildeo

Apoacutes a extraccedilatildeo das caracteriacutesticas tanto pela anaacutelise linear quanto pela natildeo linear eacute realizado o processo de classificaccedilatildeo Neste processo eacute aplicada a anaacutelise discriminante quadraacutetica (QDA) com validaccedilatildeo cruzada em que satildeo utilizados 10 subconjuntos (folds) Satildeo avaliados os desempenhos de classificadores implementados com cada uma das caracteriacutesticas de forma individual e de classificadores implementados a partir da combinaccedilatildeo dessas caracteriacutesticas

Outros classificadores satildeo implementados com coeficientes LPC de ordem p variando de 12 a 24 (p = 12 16 20 e 24) Apoacutes a avaliaccedilatildeo individual de cada meacutetodo (linear e natildeo linear) satildeo construiacutedos vetores hiacutebridos em que a cada vetor LPC de ordem p satildeo adicionadas as medidas natildeo lineares Uma nova avaliaccedilatildeo de desempenho eacute realizada a partir dos vetores hiacutebridos

Para avaliaccedilatildeo de desempenho do processo de classificaccedilatildeo trecircs medidas satildeo utilizadas acuraacutecia sensibilidade e especificidade A Acuraacutecia mede a

taxa de classificaccedilatildeo correta global do teste ou seja a capacidade do teste de identificar corretamente quando haacute e quando natildeo haacute presenccedila da doenccedila A Acuraacutecia (Equaccedilatildeo 14) eacute definida como a relaccedilatildeo entre todos os sinais corretamente classificados e o nuacutemero total de sinais avaliados

VP VNAcuraacuteciaVP VN FP FN

+=+ + +

(14)

em que VP representa os verdadeiros positivos ou seja o nuacutemero de sinais classificados corretamente como patoloacutegicos VN representa os verdadeiros negativos ou seja em quantos sinais foram detectados a ausecircncia correta da patologia FP os falsos positivos ou a quantidade de sinais saudaacuteveis classificados erroneamente como patoloacutegicos e FN os falsos negativos ou seja a quantidade de sinais patoloacutegicos classificados erroneamente como saudaacuteveis

A Sensibilidade mede a capacidade do teste em identificar corretamente a doenccedila entre aqueles que a possuem ou seja o quatildeo sensiacutevel eacute o teste Eacute a relaccedilatildeo entre os sinais patoloacutegicos corretamente classificados e o nuacutemero total de sinais patoloacutegicos dada por

VPSensibilidadeVP FN

=+

(15)

A Especificidade mede a capacidade do teste em excluir corretamente aqueles que natildeo possuem a doenccedila ou seja o quatildeo especiacutefico eacute o teste Eacute a relaccedilatildeo entre os sinais saudaacuteveis corretamente classificados e o nuacutemero total de sinais saudaacuteveis

VNEspecificidadeVN FP

=+

(16)

Os resultados obtidos no processo de classificaccedilatildeo satildeo apresentados a seguir

ResultadosNa Tabela 1 satildeo apresentados os valores de acuraacutecia obtidos com o uso de cada uma das medidas da anaacutelise dinacircmica natildeo linear (MNL) para a classificaccedilatildeo entre vozes saudaacuteveis (SDL) e patoloacutegicas (PTL) usando a anaacutelise discriminante quadraacutetica (QDA ndash Quadratic Discriminant Analysis) A classe dos sinais patoloacutegicos inclui os sinais afetados por edema noacutedulos e paralisia nas pregas vocais O expoente de Hurst H foi o paracircmetro mais eficiente em capturar as desordens vocais presentes nos sinais de vozes patoloacutegicas comparadas aos sinais de vozes saudaacuteveis tendo a maior acuraacutecia no processo de classificaccedilatildeo

Na Tabela 2 satildeo apresentados inicialmente os resultados obtidos na classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas (SDL times PTL) mediante a

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201310

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

combinaccedilatildeo das medidas Observa-se que com a combinaccedilatildeo de apenas quatro medidas entre as oito foi obtida a maior acuraacutecia (9603 plusmn 411) com as medidas entropia de Shannon (H1) entropia de Tsallis (Hq) expoente de Hurst (H) e a dimensatildeo de correlaccedilatildeo (D2) O acreacutescimo das trecircs medidas ao expoente de Hurst proporcionou um aumento de cerca de 9 no valor da acuraacutecia alcanccedilada com o uso individual desta caracteriacutestica

As patologias satildeo separadas em classes diferentes (paralisia edema ou noacutedulo) e comparadas aos sinais saudaacuteveis constituindo as seguintes comparaccedilotildees saudaacutevel times edema (SDL times EDM) saudaacutevel times paralisa (SDL times PRL) e saudaacutevel times noacutedulo (SDL times NDL) Como apresentado na Tabela 2 nesses casos as taxas de acuraacutecia meacutedia satildeo superiores a 97 com todas as taxas de especificidade chegando a 100 o que significa que nenhum sinal saudaacutevel testado foi considerado patoloacutegico O expoente de Hurst e as entropias de Shannon e de Tsallis aparecem em todas as combinaccedilotildees associando-se a outras medidas no caso da discriminaccedilatildeo entre saudaacutevel e edema e entre saudaacutevel e paralisia

Na distinccedilatildeo entre patologias observa-se pela Tabela 2 mesmo com a combinaccedilatildeo das medidas

a acuraacutecia meacutedia atingiu no maacuteximo 86 enquanto que os valores de sensibilidade meacutedia natildeo chegaram a 75 Dessa forma visando aumentar o desempenho na classificaccedilatildeo foi investigada a influecircncia do uso combinado das medidas da anaacutelise natildeo linear com os coeficientes LPC na discriminaccedilatildeo entre as patologias consideradas Nas Figuras 7 a 9 satildeo mostrados os resultados obtidos na discriminaccedilatildeo entre paralisia e edema paralisia e noacutedulo e entre edema e noacutedulo respectivamente

Tabela 2 Avaliaccedilatildeo de desempenho das medidas combinadas ndash valores de acuraacutecia obtidos na classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas e entre as patologiasTable 2 Performance evaluation of combined measures - values of the obtained accuracy in classification between healthy and pathological voices and among pathologies

Classificaccedilatildeo Caracteriacutesticas Acuraacutecia () Sensibilidade () Especificidade ()SDL times PTL H1 Hq H e D2 9603 plusmn 411 9446 plusmn 513 9800 plusmn 452SDL times EDM H1 Hq H D2 e K2 9875 plusmn 283 9667 plusmn 754 100SDL times PRL FMMI H D2 e H1 ou Hq 9750 plusmn 377 9333 plusmn 1005 100SDL times NDL H1 Hq e H 9857 plusmn 323 9500 plusmn 1131 100PRL times EDM λ1 FMMI Hq ApEn D2 e K2 7700 plusmn 1459 7417 plusmn 1874 8167 plusmn 1817PRL times NDL λ1 H ApEn D2 e K2 8600 plusmn 1103 6500 plusmn 2966 9667 plusmn 1494

EDM times NDL λ1 FMMI H1 Hq H e D2 7600 plusmn 951 5500 plusmn 2639 8667 plusmn 1231

Tabela 1 Avaliaccedilatildeo de desempenho das medidas individuais ndash valores de Acuraacutecia () obtidos na classificaccedilatildeo entre vozes saudaacuteveis e vozes patoloacutegicasTable 1 Performance evaluation of individual measures ndash values of the obtained accuracy in classification between healthy and pathological voices

Medidas Saudaacutevel times Patoloacutegica Saudaacutevel times Edema Saudaacutevel times Paralisia Saudaacutevel times Noacutedulo

λ1 5451 plusmn 823 6122 plusmn 1105 5855 plusmn 999 5232 plusmn 1308FMMI 6255 plusmn 574 6022 plusmn 848 6864 plusmn 1010 5821 plusmn 1446

H1 6085 plusmn 831 6944 plusmn 882 6582 plusmn 607 7464 plusmn 803Hq 6261 plusmn 921 6744 plusmn 718 6855 plusmn 766 7607 plusmn 682H 8709 plusmn 591 8567 plusmn 513 8809 plusmn 753 9429 plusmn 528

ApEn 5660 plusmn 672 6806 plusmn 615 6929 plusmn 1351 6667 plusmn 1037D2 7936 plusmn 1077 8458 plusmn 887 8750 plusmn 809 8262 plusmn 1254K2 5288 plusmn 509 6097 plusmn 1032 6196 plusmn 1198 5738 plusmn 881

Acuraacutecia maacuteximaMaximum accuracy

Figura 7 Classificaccedilatildeo entre vozes afetadas por paralisia e sinais afetados por edema nas pregas vocaisFigure 7 Classification between voices affected by vocal fold paralysis and vocal fold edema

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 11

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

Na discriminaccedilatildeo entre paralisia e edema a taxa de acuraacutecia sai de 9655 plusmn 151 com 12 coeficientes LPC para 9924 plusmn 052 com 24 coeficientes Aleacutem do acreacutescimo na acuraacutecia meacutedia em mais de 18 em relaccedilatildeo ao uso dos melhores resultados individuais (LPC) com a combinaccedilatildeo (MNL e LPC) o erro padratildeo caiu consideravelmente aumentando a confiabilidade do teste

Na discriminaccedilatildeo entre paralisia e noacutedulo a acuraacutecia de 86 soacute com as medidas natildeo lineares cresce para valores maiores que 99 Com 12 coeficientes LPC a acuraacutecia eacute de 9919 plusmn 055 com sensibilidade 100 e especificidade meacutedia de aproximadamente 98

A acuraacutecia meacutedia na classificaccedilatildeo entre edema e noacutedulo antes de 76 com as medidas natildeo lineares e cerca de 70 com LPC chega a mais de 98 com o vetor hiacutebrido com apenas 12 coeficientes E passa dos 99 a partir de 16 coeficientes quando associados agraves medidas natildeo lineares

DiscussatildeoPelos resultados apresentados constata-se que o desempenho da classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas aumentou significativamente com a combinaccedilatildeo das medidas da anaacutelise dinacircmica natildeo linear Nos melhores resultados o expoente de Hurst que se destacou como melhor medida individual aparece em todas as combinaccedilotildees juntamente com as entropias de Shannon e de Tsallis para a classificaccedilatildeo entre os sinais de vozes saudaacuteveis e sinais afetados por paralisa edema ou noacutedulo No entanto essas medidas natildeo foram eficazes em discriminar entre patologias apresentando taxas inferiores agraves apresentadas na discriminaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas

A anaacutelise LPC comparada agraves outras medidas empregadas mostra-se mais eficaz em discriminar entre patologias Observa-se que o valor da acuraacutecia aumenta com o aumento da ordem de preditor Aleacutem disso o desempenho na classificaccedilatildeo entre patologias melhora significativamente ao combinar as medidas natildeo lineares com os coeficientes LPC

Eacute importante considerar que o aumento na ordem dos coeficientes LPC estaacute associado a um maior volume de dados a serem processados aumentando o custo computacional No entanto caso seja mais relevante a precisatildeo do diagnoacutestico do que a realizaccedilatildeo da anaacutelise em tempo real eacute possiacutevel optar por empregar uma maior quantidade de coeficientes LPC Observa-se pelos resultados que o valor da acuraacutecia natildeo teve um aumento tatildeo consideraacutevel com o aumento da ordem de prediccedilatildeo aleacutem de 16 coeficientes

ConclusatildeoA partir dos resultados obtidos constata-se que as medidas natildeo lineares conseguem capturar bem as desordens vocais provocadas por patologias nas pregas vocais como noacutedulos edemas e paralisia A consideraccedilatildeo das natildeo linearidades inerentes ao processo de produccedilatildeo da fala e sua consequente anaacutelise utilizando medidas natildeo lineares eacute eficiente em distinguir um sinal saudaacutevel de um sinal patoloacutegico comprovadamente com as patologias consideradas no trabalho (edema paralisia e noacutedulos nas pregas vocais) Entretanto observa-se que a abordagem pelo modelo linear de produccedilatildeo da fala em que os coeficientes LPC modelam o trato vocal consegue distinguir melhor as especificidades existentes nas patologias analisadas notadamente quando combinadas agrave abordagem natildeo linear As mudanccedilas nas estruturas anatocircmicas do trato vocal e da fonte (laringe) foram bem retratadas com a combinaccedilatildeo das duas abordagens sendo a principal contribuiccedilatildeo deste trabalho Com a abordagem hiacutebrida o desempenho na distinccedilatildeo entre

6012 16 20

Nuacutemero de coeficientes LPC

Paralisia times Noacutedulo

24

6468

Acu

raacuteci

a m

eacutedia

()

72768084889296

100

MNL LPC MNL + LPC

Figura 8 Classificaccedilatildeo entre vozes afetadas por paralisia e sinais afetados por noacutedulos nas pregas vocaisFigure 8 Classification between voices affected by vocal fold paralysis and vocal nodules

Figura 9 Classificaccedilatildeo entre vozes afetadas por edema e sinais afetados por noacutedulos nas pregas vocaisFigure 9 Classification between voices affected by vocal fold Edema and vocal nodules

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201312

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

as patologias obteve um aumento consideraacutevel Isto denota que o meacutetodo empregado eacute bastante promissor na tarefa de discriminar entre vozes saudaacuteveis e vozes afetadas por patologias lariacutengeas bem como entre patologias Espera-se que os meacutetodos apresentados nesta pesquisa contribuam ainda mais para a detecccedilatildeo precoce das doenccedilas da laringe auxiliando no seu diagnoacutestico ou para monitorar seu progresso buscando assegurar os cuidados cliacutenicos adequados e mais conforto aos pacientes

ReferecircnciasAlvarez-Ramirez J Echeverria JC Rodriguez E Performance of a high-dimensional RS method for Hurst exponent estimation Physica A Statistical Mechanics and its Applications 2008 387(26)6452-62 httpdxdoiorg101016jphysa200808014

Arias-Londono J Godino-Llorente J Saacuteenz-Lechoacuten N Osma-Ruiz V Castellanos-Dominguez G Automatic detection of pathological voices using complexity measures noise parameters and mel-cepstral coefficients IEEE Transactions on Biomedical Engineering 2011 58(2)370-9 httpdxdoiorg101109TBME20102089052

Boyanov B Ivanov T Hadjitodorov S Chollet G Robust hybrid pitch detector Electronic Letters 1993 29(22)1924-6 httpdxdoiorg101049el19931281

Chakrabarti CG De K Boltzmann-Gibbs entropy axiomatic characterization and application International Journal of Mathematics and Mathematical Sciences 2000 23(4)243-51 httpdxdoiorg101155S0161171200000375

Custoacutedio RF Anaacutelise Natildeo-linear no reconhecimento de padrotildees sonoros Estudo de caso para sons pulmonares [tese] Rio Grande do Sul Universidade Federal do Rio Grande do Sul 1999 119 p

Dajer ME Padrotildees visuais de sinais de voz atraveacutes de teacutecnica de anaacutelise de natildeo-linear [dissertaccedilatildeo] Satildeo Paulo Escola de Engenharia de Satildeo Carlos 2006 154 p

Fantinato PC Segmentaccedilatildeo de voz baseada na anaacutelise fractal e na transformada wavelet [dissertaccedilatildeo] Satildeo Paulo Instituto de Fiacutesica de Satildeo Carlos da Universidade de Satildeo Carlos 2008 123 p

Fiedler-Ferrara N Prado CPC Caos Uma introduccedilatildeo Satildeo Paulo Ed Edgard Blucher Ltda 1994

Fraser AM Swinney HL Independent coordinates for strange attractors from mutual information Physical Review A 1986 331134-40 httpdxdoiorg 101103PhysRevA331134

Godino-Llorente JI Goacutemez-Vilda P Blanco Velasco M Dimensionality reduction of a pathological voice quality assessment system based on gaussian mixture models and short-term cepstral parameters IEEE Transactions on Biomedical Engineering 2006 53(10)1943-53 httpdxdoiorg101109TBME2006871883

Gomes D Fonseca N Agoulmine N Souza JN Neurocomputaccedilatildeo na estimativa do paracircmetro de hurst

In SBRCrsquo2001 Anais do 19 Simpoacutesio Brasileiro de Redes de Computadores 2001 Maio Florianoacutepolis Santa Catarina Florianoacutepolis 2001 p 306-21

Grassberger P Procaccia I Measuring the strangeness of strange attractors Physica D 1983 9189-208 httpdxdoiorg1010160167-2789(83)90298-1

Hegger R Kantz H Schreiber T Practical implementation of nonlinear time series methods the tisean package Chaos 1999 9(2)413-35 httpdxdoiorg1010631166424

Henriacutequez P Alonso JB Ferrer MA Travieso CM Godino-Llorente JI Diacuteaz-De-Maria F Characterization of healthy and pathological voice through measures based on nonlinear dynamics IEEE Transactions on Audio Speech and Language Processing 2009 17(6)1186-95 httpdxdoiorg101109TASL20092016734

Hurst E Long term storage capacity of reservoirs Transactions of the American Society of Civil Engineers 1951 116770-9

Jiang JJ Zhang Y McGilligan C Chaos in voice from modeling to measurement Journal of Voice 2006 20(1)2-17 httpdxdoiorg101016jjvoice200501001

Johnson MT Povinelli RJ Lindgren AC Ye J Liu X Indrebo KM Time-domain isolated phoneme classification using reconstructed phase spaces IEEE Transactions Speech and Audio Processing 2005 13(4)458-66 httpdxdoiorg101109TSA2005848885

Kantz H A Robust Method to Estimate the maximal lyapunov exponent of a time series Physics Letters A 1994 18577-87 httpdxdoiorg1010160375-9601(94)90991-1

Kantz H Schreiber T Nonlinear time series analysis 2nd ed Cambridge University Press 2004

Kay Elemetrics Disordered Voice Database Model 4337 3th ed United Satates 1994

Kokkinos I Maragos P Nonlinear speech analysis using models for chaotic systems IEEE Transactions on Speech and Audio Processing 2005 13(6)1098-109 httpdxdoiorg101109TSA2005852982

Kumar A Mullick SK Nonlinear dynamical analysis of speech Journal Acoustic Society America 1996 100(1)615-29 httpdxdoiorg1011211415886

Little M Biomechanically informed nonlinear speech signal processing [tese] Oxford University of Oxford England 2006 164 p

Little M McSharry P Roberts S Costello D Moroz I Exploiting nonlinear recurrence and fractal scaling properties for voice disorder detection BioMedical Engineering OnLine 2007 6(23)1-19 httpdxdoiorg1011861475-925X-6-23

Manfredi C Pierazzi L Bruscaglioni P Pitch estimation for noise retrieval in time and frequency domain Medical amp Biological Engineering amp Computing 1999 37(2)532

Natarajan K Acharya UR Alias F Tiboleng T Puthusserypady SK Nonlinear analysis of EEG signals at different mental states BioMedical Engineering OnLine 2004 37 httpdxdoiorg1011861475-925X-3-7

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 13

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

OrsquoShaughnessy D Speech communications human and machine 2nd ed New York IEEE Press 2000

Petry A Reconhecimento automaacutetico de locutor utilizando medidas de invariantes dinacircmicas natildeo-lineares [tese] Rio Grande do Sul Universidade Federal do Rio Grande do Sul 2002 155 p

Pincus SM Approximate entropy as a measure of system complexity Proceedings of the National Academy of Sciences 1991 882297-301 httpdxdoiorg101073pnas8862297

Rabiner LR Schafer RW Digital processing of speech signals Upper Saddle River Prentice Hall 1978

Rabiner LR Juang BH Fundamentals of speech recognition Englewood Ciffs New Jersey Prentice Hall 1993

Rodriacuteguez-Saacutenchez A Delgado-Trejos E Orozco-Gutieacuterrez A Castellanos-Domiacutenguez G Nonlinear dynamics techniques for the detection of the brain areas using MER signals International Conference on BioMedical Engineering and Informatics 2008 2198-202 httpdxdoiorg101109BMEI2008330

SantrsquoAna R Coelho R Alcaim A Text-independent speaker recognition based on the hurst parameter and the multidimensional fractional brownian motion model IEEE Transactions on Audio Speech and Language Processing 2006 14(3)931-40 httpdxdoiorg101109TSA2005858054

Savi MA Dinacircmica natildeo-linear e Caos Rio de Janeiro E-papers 2006

Scalassara PR Dajer ME Maciel CD Pereira JC Voice signals characterization through entropy measures In BIOSIGNALS 2008 Proceedings of the International Conference on Bio-inspired Systems and

Signal Processing 2008 Jan 28-31 Madeira Portugal Madeira 2008 v 2 p 163-170

Schreiber T Schmitz A Surrogate time series Physica D 2000 142346-82 httpdxdoiorg101016S0167-2789(00)00043-9

Shannon C A Mathematical theory of communication The Bell System Technical Journal 1948 27(3)623-56

Silva LEV Ferramentas computacionais na anaacutelise da variabilidade da frequecircncia cardiacuteaca atraveacutes do paradigma natildeo extensivo no estudo de cardiopatias [dissertaccedilatildeo] Satildeo Paulo Universidade de Satildeo Paulo 2010 97 p

Takens F Detecting Strange Attractors in Turbulence In Rand DA Young L-S Dynamical systems and turbulence New York Springer-Verlag 1981 v 898 p 366-81

Tavares AHMP Aspectos matemaacuteticos da entropia [dissertaccedilatildeo] Portugal Universidade de Aveiro 2003 98 p

Tokuda I Miyano T Aihara K Surrogate analysis for detecting nonlinear dynamics in normal vowels The Journal of the Acoustical Society of America 2001 110(6)3207-17

Torres ME Gamero LG Rufiner HL Study of complexity in normal and pathological speech signals In EMBC 2003 Proceedings of the 25th Annual International Conference of the IEEE Engineering in Medicine and Biology Society 2003 17-21 Sept Cancun Meacutexico IEEE 2003 p 2339-2342 httpdxdoiorg101109IEMBS20031280385

Tsallis C Possible generalization of Boltzmann-Gibbs statistics Journal of Statistical Physics 1988 52(12)479-87 httpdxdoiorg101007BF01016429

Zhang Y Jiang JJ Acoustic analyses of sustained and running voices from patients with laryngeal pathologies Journal of Voice January 2008 22(1)1-9 httpdxdoiorg101016jjvoice200608003

Autores

Washington Ceacutesar de Almeida Costa Francisco Marcos de Assis Departamento de Engenharia Eleacutetrica ndash DEE Universidade Federal de Campina Grande ndash UFCG Campina Grande PB Brasil

Washington Ceacutesar de Almeida Costa Silvana Luciene do Nascimento Cunha Costa Coordenaccedilatildeo do Curso Superior de Bacharelado em Engenharia Eleacutetrica ndash CCSBEE Instituto Federal de Educaccedilatildeo Ciecircncia e Tecnologia da Paraiacuteba ndash IFPB Av Primeiro de Maio 720 Jaguaribe CEP 58015-430 Joatildeo Pessoa PB Brasil

Benedito Guimaratildees Aguiar Neto Universidade Presbiteriana Mackenzie CEP 01302-907 Satildeo Paulo SP Brasil

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201314

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

Entropia de Tsallis

A entropia de Tsallis eacute uma generalizaccedilatildeo da entropia de Boltzmann-Gibbs (Chakrabarti e De 2000) Eacute definida como (Tsallis 1988)

111

qWi i

qpH k

q=minus sum=

minus (10)

em que q isin caracteriza a generalizaccedilatildeo e pi satildeo as probabilidades associadas com as W ( )W isinconfiguraccedilotildees possiacuteveis do sistema A entropia de Boltzmann-Gibbs eacute encontrada quando no limite qrarr1

A principal caracteriacutestica da entropia de Tsallis eacute a sua natildeo aditividade (Tavares 2003) Isto eacute a informaccedilatildeo contida em um sistema composto natildeo eacute a simples soma da informaccedilatildeo dos subsistemas que o compotildeem As entropias de Shannon e de Boltzmann apresentam a aditividade como uma de suas caracteriacutesticas A ideia principal da utilizaccedilatildeo da entropia de Tsallis eacute verificar a contribuiccedilatildeo do paracircmetro entroacutepico (q) na avaliaccedilatildeo de caracteriacutesticas natildeo extensivas (interaccedilotildees natildeo lineares) presentes na dinacircmica das seacuteries temporais (Silva 2010)

Expoentes de Lyapunov

Os expoentes de Lyapunov estatildeo relacionados agrave taxa meacutedia de divergecircncia ou de convergecircncia exponencial de oacuterbitas vizinhas no espaccedilo de fase Geralmente um sistema contendo pelo menos um expoente de Lyapunov positivo eacute definido como caoacutetico por outro lado um sistema sem nenhum expoente positivo eacute regular (Jiang et al 2006)

Neste trabalho eacute utilizada uma rotina do pacote TISEAN (Hegger et al 1999) a fim de se obter o crescimento exponencial meacutedio das distacircncias entre duas trajetoacuterias que eacute baseada no algoritmo de Kantz (1994) O programa basicamente gera os resultados da expressatildeo (Kantz e Schreiber 2004)

( ) 00 0

1

1 1( ) ln( ) n no

Nn n n n

n S Sn

S n s sN S +∆ +∆

= isinυ

∆ = minussum sum υ

(11)

onde S(∆n) eacute chamado de fator de crescimento (stretching factor) Sn0 satildeo os vetores de imersatildeo e υ(Sn0) eacute a vizinhanccedila de Sn0 com diacircmetro ε Na Figura 6 estaacute ilustrado o comportamento de S(∆n) em funccedilatildeo do nuacutemero de iteraccedilotildees ∆n para trecircs diferentes valores de ε e m variando de 4 a 8 A linha reta representa a inclinaccedilatildeo meacutedia das curvas mostradas e sua inclinaccedilatildeo eacute a estimaccedilatildeo para o maior expoente de Lyapunov λ1

Expoente de HurstO paracircmetro ou expoente de Hurst (Hurst 1951) eacute uma medida de autossimilaridade que vem sendo empregada em diversas aacutereas tais como gerenciamento de traacutefego autossimilar de redes de computadores (Gomes et al 2001) reconhecimento de padrotildees sonoros para avaliaccedilatildeo de sons pulmonares (Custoacutedio 1999) sistemas de reconhecimento de locutor (SantrsquoAna et al 2006) detecccedilatildeo de diferentes aacutereas do ceacuterebro (Rodriacuteguez-Saacutenchez et al 2008) e anaacutelise de sinais EEG (eletroencefalograma) (Natarajan et al 2004) entre outros Em processamento de sinais de voz este paracircmetro tem sido empregado por representar o comportamento estocaacutestico da voz (Fantinato 2008) Aleacutem disso apresenta um baixo custo computacional podendo ser obtido em tempo real durante atividade da fala (SantrsquoAna et al 2006)

Quanto maior o valor do paracircmetro de Hurst maior eacute o impacto das autocorrelaccedilotildees no desempenho do sistema Aleacutem disso pequenas variaccedilotildees no paracircmetro de Hurst podem significar mudanccedilas significativas no comportamento dos sinais caracterizando o grau de desordem do mesmo (Gomes et al 2001) O estimador RS empregado neste trabalho eacute um dos mais conhecidos e simples meacutetodos para estimar o grau de dependecircncia de uma sequecircncia amostral A estatiacutestica RS eacute a soma parcial dos desvios em relaccedilatildeo a sua meacutedia de uma sequecircncia reescalonada pelo seu desvio padratildeo (Alvarez-Ramirez et al 2008)

Se o processo estocaacutestico associado agrave sequecircncia eacute escalonada sobre certo domiacutenio n a estatiacutestica RS segue a equaccedilatildeo

HR S an= (12)

em que RS eacute a distacircncia reescalonada (dividida pelo desvio padratildeo) a eacute uma constante e H eacute o expoente de Hurst

Anaacutelise preditiva linearA ideia baacutesica na prediccedilatildeo linear eacute a de que o valor de uma amostra pode ser aproximado (predita) por

Figura 6 Comportamento de S(∆n) em funccedilatildeo do nuacutemero de iteraccedilotildees de ε e de m (m = 4 8)Figure 6 Behavior of S(∆n) related to iteration number ε and m (m = 48)

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 9

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

combinaccedilatildeo linear dos valores das amostras anteriores levando em consideraccedilatildeo a correlaccedilatildeo entre estas Os coeficientes de prediccedilatildeo linear ou coeficientes LPC (Linear Predictive Coding) satildeo estimados por minimizaccedilatildeo do erro quadraacutetico entre a amostra atual e a sua prediccedilatildeo (OrsquoShaughnessy 2000 Rabiner e Juang 1993)

O modelo linear de produccedilatildeo da fala incorpora os efeitos dos pulsos glotais trato vocal e da radiaccedilatildeo dos laacutebios como um filtro linear (Rabiner e Schafer 1978) A fonte eacute uma sequecircncia de impulsos quase perioacutedicos utilizados para gerar sons sonoros ou a adiccedilatildeo de uma sequecircncia de ruiacutedo aleatoacuterio para sons surdos

Um fator de ganho G eacute ajustado para controlar a intensidade da excitaccedilatildeo Combinando os efeitos dos pulsos glotais do trato vocal e da radiaccedilatildeo o modelo pode ser representado por uma funccedilatildeo de transferecircncia de apenas polos H(z) como

1( )

1 ( )p kk

GH zk zminus

==

minus αsum (13)

Os termos α(k) representam os coeficientes de prediccedilatildeo linear (coeficientes LPC) e p a ordem do filtro de prediccedilatildeo

O meacutetodo LPC estima cada amostra de voz baseado numa combinaccedilatildeo linear de p amostras anteriores Um valor de p maior representa um modelo mais preciso A anaacutelise LPC fornece um conjunto de paracircmetros da fala que representa o trato vocal Espera-se que qualquer mudanccedila na estrutura anatocircmica do trato vocal devido agrave patologia afete os coeficientes LPC

Classificaccedilatildeo

Apoacutes a extraccedilatildeo das caracteriacutesticas tanto pela anaacutelise linear quanto pela natildeo linear eacute realizado o processo de classificaccedilatildeo Neste processo eacute aplicada a anaacutelise discriminante quadraacutetica (QDA) com validaccedilatildeo cruzada em que satildeo utilizados 10 subconjuntos (folds) Satildeo avaliados os desempenhos de classificadores implementados com cada uma das caracteriacutesticas de forma individual e de classificadores implementados a partir da combinaccedilatildeo dessas caracteriacutesticas

Outros classificadores satildeo implementados com coeficientes LPC de ordem p variando de 12 a 24 (p = 12 16 20 e 24) Apoacutes a avaliaccedilatildeo individual de cada meacutetodo (linear e natildeo linear) satildeo construiacutedos vetores hiacutebridos em que a cada vetor LPC de ordem p satildeo adicionadas as medidas natildeo lineares Uma nova avaliaccedilatildeo de desempenho eacute realizada a partir dos vetores hiacutebridos

Para avaliaccedilatildeo de desempenho do processo de classificaccedilatildeo trecircs medidas satildeo utilizadas acuraacutecia sensibilidade e especificidade A Acuraacutecia mede a

taxa de classificaccedilatildeo correta global do teste ou seja a capacidade do teste de identificar corretamente quando haacute e quando natildeo haacute presenccedila da doenccedila A Acuraacutecia (Equaccedilatildeo 14) eacute definida como a relaccedilatildeo entre todos os sinais corretamente classificados e o nuacutemero total de sinais avaliados

VP VNAcuraacuteciaVP VN FP FN

+=+ + +

(14)

em que VP representa os verdadeiros positivos ou seja o nuacutemero de sinais classificados corretamente como patoloacutegicos VN representa os verdadeiros negativos ou seja em quantos sinais foram detectados a ausecircncia correta da patologia FP os falsos positivos ou a quantidade de sinais saudaacuteveis classificados erroneamente como patoloacutegicos e FN os falsos negativos ou seja a quantidade de sinais patoloacutegicos classificados erroneamente como saudaacuteveis

A Sensibilidade mede a capacidade do teste em identificar corretamente a doenccedila entre aqueles que a possuem ou seja o quatildeo sensiacutevel eacute o teste Eacute a relaccedilatildeo entre os sinais patoloacutegicos corretamente classificados e o nuacutemero total de sinais patoloacutegicos dada por

VPSensibilidadeVP FN

=+

(15)

A Especificidade mede a capacidade do teste em excluir corretamente aqueles que natildeo possuem a doenccedila ou seja o quatildeo especiacutefico eacute o teste Eacute a relaccedilatildeo entre os sinais saudaacuteveis corretamente classificados e o nuacutemero total de sinais saudaacuteveis

VNEspecificidadeVN FP

=+

(16)

Os resultados obtidos no processo de classificaccedilatildeo satildeo apresentados a seguir

ResultadosNa Tabela 1 satildeo apresentados os valores de acuraacutecia obtidos com o uso de cada uma das medidas da anaacutelise dinacircmica natildeo linear (MNL) para a classificaccedilatildeo entre vozes saudaacuteveis (SDL) e patoloacutegicas (PTL) usando a anaacutelise discriminante quadraacutetica (QDA ndash Quadratic Discriminant Analysis) A classe dos sinais patoloacutegicos inclui os sinais afetados por edema noacutedulos e paralisia nas pregas vocais O expoente de Hurst H foi o paracircmetro mais eficiente em capturar as desordens vocais presentes nos sinais de vozes patoloacutegicas comparadas aos sinais de vozes saudaacuteveis tendo a maior acuraacutecia no processo de classificaccedilatildeo

Na Tabela 2 satildeo apresentados inicialmente os resultados obtidos na classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas (SDL times PTL) mediante a

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201310

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

combinaccedilatildeo das medidas Observa-se que com a combinaccedilatildeo de apenas quatro medidas entre as oito foi obtida a maior acuraacutecia (9603 plusmn 411) com as medidas entropia de Shannon (H1) entropia de Tsallis (Hq) expoente de Hurst (H) e a dimensatildeo de correlaccedilatildeo (D2) O acreacutescimo das trecircs medidas ao expoente de Hurst proporcionou um aumento de cerca de 9 no valor da acuraacutecia alcanccedilada com o uso individual desta caracteriacutestica

As patologias satildeo separadas em classes diferentes (paralisia edema ou noacutedulo) e comparadas aos sinais saudaacuteveis constituindo as seguintes comparaccedilotildees saudaacutevel times edema (SDL times EDM) saudaacutevel times paralisa (SDL times PRL) e saudaacutevel times noacutedulo (SDL times NDL) Como apresentado na Tabela 2 nesses casos as taxas de acuraacutecia meacutedia satildeo superiores a 97 com todas as taxas de especificidade chegando a 100 o que significa que nenhum sinal saudaacutevel testado foi considerado patoloacutegico O expoente de Hurst e as entropias de Shannon e de Tsallis aparecem em todas as combinaccedilotildees associando-se a outras medidas no caso da discriminaccedilatildeo entre saudaacutevel e edema e entre saudaacutevel e paralisia

Na distinccedilatildeo entre patologias observa-se pela Tabela 2 mesmo com a combinaccedilatildeo das medidas

a acuraacutecia meacutedia atingiu no maacuteximo 86 enquanto que os valores de sensibilidade meacutedia natildeo chegaram a 75 Dessa forma visando aumentar o desempenho na classificaccedilatildeo foi investigada a influecircncia do uso combinado das medidas da anaacutelise natildeo linear com os coeficientes LPC na discriminaccedilatildeo entre as patologias consideradas Nas Figuras 7 a 9 satildeo mostrados os resultados obtidos na discriminaccedilatildeo entre paralisia e edema paralisia e noacutedulo e entre edema e noacutedulo respectivamente

Tabela 2 Avaliaccedilatildeo de desempenho das medidas combinadas ndash valores de acuraacutecia obtidos na classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas e entre as patologiasTable 2 Performance evaluation of combined measures - values of the obtained accuracy in classification between healthy and pathological voices and among pathologies

Classificaccedilatildeo Caracteriacutesticas Acuraacutecia () Sensibilidade () Especificidade ()SDL times PTL H1 Hq H e D2 9603 plusmn 411 9446 plusmn 513 9800 plusmn 452SDL times EDM H1 Hq H D2 e K2 9875 plusmn 283 9667 plusmn 754 100SDL times PRL FMMI H D2 e H1 ou Hq 9750 plusmn 377 9333 plusmn 1005 100SDL times NDL H1 Hq e H 9857 plusmn 323 9500 plusmn 1131 100PRL times EDM λ1 FMMI Hq ApEn D2 e K2 7700 plusmn 1459 7417 plusmn 1874 8167 plusmn 1817PRL times NDL λ1 H ApEn D2 e K2 8600 plusmn 1103 6500 plusmn 2966 9667 plusmn 1494

EDM times NDL λ1 FMMI H1 Hq H e D2 7600 plusmn 951 5500 plusmn 2639 8667 plusmn 1231

Tabela 1 Avaliaccedilatildeo de desempenho das medidas individuais ndash valores de Acuraacutecia () obtidos na classificaccedilatildeo entre vozes saudaacuteveis e vozes patoloacutegicasTable 1 Performance evaluation of individual measures ndash values of the obtained accuracy in classification between healthy and pathological voices

Medidas Saudaacutevel times Patoloacutegica Saudaacutevel times Edema Saudaacutevel times Paralisia Saudaacutevel times Noacutedulo

λ1 5451 plusmn 823 6122 plusmn 1105 5855 plusmn 999 5232 plusmn 1308FMMI 6255 plusmn 574 6022 plusmn 848 6864 plusmn 1010 5821 plusmn 1446

H1 6085 plusmn 831 6944 plusmn 882 6582 plusmn 607 7464 plusmn 803Hq 6261 plusmn 921 6744 plusmn 718 6855 plusmn 766 7607 plusmn 682H 8709 plusmn 591 8567 plusmn 513 8809 plusmn 753 9429 plusmn 528

ApEn 5660 plusmn 672 6806 plusmn 615 6929 plusmn 1351 6667 plusmn 1037D2 7936 plusmn 1077 8458 plusmn 887 8750 plusmn 809 8262 plusmn 1254K2 5288 plusmn 509 6097 plusmn 1032 6196 plusmn 1198 5738 plusmn 881

Acuraacutecia maacuteximaMaximum accuracy

Figura 7 Classificaccedilatildeo entre vozes afetadas por paralisia e sinais afetados por edema nas pregas vocaisFigure 7 Classification between voices affected by vocal fold paralysis and vocal fold edema

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 11

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

Na discriminaccedilatildeo entre paralisia e edema a taxa de acuraacutecia sai de 9655 plusmn 151 com 12 coeficientes LPC para 9924 plusmn 052 com 24 coeficientes Aleacutem do acreacutescimo na acuraacutecia meacutedia em mais de 18 em relaccedilatildeo ao uso dos melhores resultados individuais (LPC) com a combinaccedilatildeo (MNL e LPC) o erro padratildeo caiu consideravelmente aumentando a confiabilidade do teste

Na discriminaccedilatildeo entre paralisia e noacutedulo a acuraacutecia de 86 soacute com as medidas natildeo lineares cresce para valores maiores que 99 Com 12 coeficientes LPC a acuraacutecia eacute de 9919 plusmn 055 com sensibilidade 100 e especificidade meacutedia de aproximadamente 98

A acuraacutecia meacutedia na classificaccedilatildeo entre edema e noacutedulo antes de 76 com as medidas natildeo lineares e cerca de 70 com LPC chega a mais de 98 com o vetor hiacutebrido com apenas 12 coeficientes E passa dos 99 a partir de 16 coeficientes quando associados agraves medidas natildeo lineares

DiscussatildeoPelos resultados apresentados constata-se que o desempenho da classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas aumentou significativamente com a combinaccedilatildeo das medidas da anaacutelise dinacircmica natildeo linear Nos melhores resultados o expoente de Hurst que se destacou como melhor medida individual aparece em todas as combinaccedilotildees juntamente com as entropias de Shannon e de Tsallis para a classificaccedilatildeo entre os sinais de vozes saudaacuteveis e sinais afetados por paralisa edema ou noacutedulo No entanto essas medidas natildeo foram eficazes em discriminar entre patologias apresentando taxas inferiores agraves apresentadas na discriminaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas

A anaacutelise LPC comparada agraves outras medidas empregadas mostra-se mais eficaz em discriminar entre patologias Observa-se que o valor da acuraacutecia aumenta com o aumento da ordem de preditor Aleacutem disso o desempenho na classificaccedilatildeo entre patologias melhora significativamente ao combinar as medidas natildeo lineares com os coeficientes LPC

Eacute importante considerar que o aumento na ordem dos coeficientes LPC estaacute associado a um maior volume de dados a serem processados aumentando o custo computacional No entanto caso seja mais relevante a precisatildeo do diagnoacutestico do que a realizaccedilatildeo da anaacutelise em tempo real eacute possiacutevel optar por empregar uma maior quantidade de coeficientes LPC Observa-se pelos resultados que o valor da acuraacutecia natildeo teve um aumento tatildeo consideraacutevel com o aumento da ordem de prediccedilatildeo aleacutem de 16 coeficientes

ConclusatildeoA partir dos resultados obtidos constata-se que as medidas natildeo lineares conseguem capturar bem as desordens vocais provocadas por patologias nas pregas vocais como noacutedulos edemas e paralisia A consideraccedilatildeo das natildeo linearidades inerentes ao processo de produccedilatildeo da fala e sua consequente anaacutelise utilizando medidas natildeo lineares eacute eficiente em distinguir um sinal saudaacutevel de um sinal patoloacutegico comprovadamente com as patologias consideradas no trabalho (edema paralisia e noacutedulos nas pregas vocais) Entretanto observa-se que a abordagem pelo modelo linear de produccedilatildeo da fala em que os coeficientes LPC modelam o trato vocal consegue distinguir melhor as especificidades existentes nas patologias analisadas notadamente quando combinadas agrave abordagem natildeo linear As mudanccedilas nas estruturas anatocircmicas do trato vocal e da fonte (laringe) foram bem retratadas com a combinaccedilatildeo das duas abordagens sendo a principal contribuiccedilatildeo deste trabalho Com a abordagem hiacutebrida o desempenho na distinccedilatildeo entre

6012 16 20

Nuacutemero de coeficientes LPC

Paralisia times Noacutedulo

24

6468

Acu

raacuteci

a m

eacutedia

()

72768084889296

100

MNL LPC MNL + LPC

Figura 8 Classificaccedilatildeo entre vozes afetadas por paralisia e sinais afetados por noacutedulos nas pregas vocaisFigure 8 Classification between voices affected by vocal fold paralysis and vocal nodules

Figura 9 Classificaccedilatildeo entre vozes afetadas por edema e sinais afetados por noacutedulos nas pregas vocaisFigure 9 Classification between voices affected by vocal fold Edema and vocal nodules

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201312

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

as patologias obteve um aumento consideraacutevel Isto denota que o meacutetodo empregado eacute bastante promissor na tarefa de discriminar entre vozes saudaacuteveis e vozes afetadas por patologias lariacutengeas bem como entre patologias Espera-se que os meacutetodos apresentados nesta pesquisa contribuam ainda mais para a detecccedilatildeo precoce das doenccedilas da laringe auxiliando no seu diagnoacutestico ou para monitorar seu progresso buscando assegurar os cuidados cliacutenicos adequados e mais conforto aos pacientes

ReferecircnciasAlvarez-Ramirez J Echeverria JC Rodriguez E Performance of a high-dimensional RS method for Hurst exponent estimation Physica A Statistical Mechanics and its Applications 2008 387(26)6452-62 httpdxdoiorg101016jphysa200808014

Arias-Londono J Godino-Llorente J Saacuteenz-Lechoacuten N Osma-Ruiz V Castellanos-Dominguez G Automatic detection of pathological voices using complexity measures noise parameters and mel-cepstral coefficients IEEE Transactions on Biomedical Engineering 2011 58(2)370-9 httpdxdoiorg101109TBME20102089052

Boyanov B Ivanov T Hadjitodorov S Chollet G Robust hybrid pitch detector Electronic Letters 1993 29(22)1924-6 httpdxdoiorg101049el19931281

Chakrabarti CG De K Boltzmann-Gibbs entropy axiomatic characterization and application International Journal of Mathematics and Mathematical Sciences 2000 23(4)243-51 httpdxdoiorg101155S0161171200000375

Custoacutedio RF Anaacutelise Natildeo-linear no reconhecimento de padrotildees sonoros Estudo de caso para sons pulmonares [tese] Rio Grande do Sul Universidade Federal do Rio Grande do Sul 1999 119 p

Dajer ME Padrotildees visuais de sinais de voz atraveacutes de teacutecnica de anaacutelise de natildeo-linear [dissertaccedilatildeo] Satildeo Paulo Escola de Engenharia de Satildeo Carlos 2006 154 p

Fantinato PC Segmentaccedilatildeo de voz baseada na anaacutelise fractal e na transformada wavelet [dissertaccedilatildeo] Satildeo Paulo Instituto de Fiacutesica de Satildeo Carlos da Universidade de Satildeo Carlos 2008 123 p

Fiedler-Ferrara N Prado CPC Caos Uma introduccedilatildeo Satildeo Paulo Ed Edgard Blucher Ltda 1994

Fraser AM Swinney HL Independent coordinates for strange attractors from mutual information Physical Review A 1986 331134-40 httpdxdoiorg 101103PhysRevA331134

Godino-Llorente JI Goacutemez-Vilda P Blanco Velasco M Dimensionality reduction of a pathological voice quality assessment system based on gaussian mixture models and short-term cepstral parameters IEEE Transactions on Biomedical Engineering 2006 53(10)1943-53 httpdxdoiorg101109TBME2006871883

Gomes D Fonseca N Agoulmine N Souza JN Neurocomputaccedilatildeo na estimativa do paracircmetro de hurst

In SBRCrsquo2001 Anais do 19 Simpoacutesio Brasileiro de Redes de Computadores 2001 Maio Florianoacutepolis Santa Catarina Florianoacutepolis 2001 p 306-21

Grassberger P Procaccia I Measuring the strangeness of strange attractors Physica D 1983 9189-208 httpdxdoiorg1010160167-2789(83)90298-1

Hegger R Kantz H Schreiber T Practical implementation of nonlinear time series methods the tisean package Chaos 1999 9(2)413-35 httpdxdoiorg1010631166424

Henriacutequez P Alonso JB Ferrer MA Travieso CM Godino-Llorente JI Diacuteaz-De-Maria F Characterization of healthy and pathological voice through measures based on nonlinear dynamics IEEE Transactions on Audio Speech and Language Processing 2009 17(6)1186-95 httpdxdoiorg101109TASL20092016734

Hurst E Long term storage capacity of reservoirs Transactions of the American Society of Civil Engineers 1951 116770-9

Jiang JJ Zhang Y McGilligan C Chaos in voice from modeling to measurement Journal of Voice 2006 20(1)2-17 httpdxdoiorg101016jjvoice200501001

Johnson MT Povinelli RJ Lindgren AC Ye J Liu X Indrebo KM Time-domain isolated phoneme classification using reconstructed phase spaces IEEE Transactions Speech and Audio Processing 2005 13(4)458-66 httpdxdoiorg101109TSA2005848885

Kantz H A Robust Method to Estimate the maximal lyapunov exponent of a time series Physics Letters A 1994 18577-87 httpdxdoiorg1010160375-9601(94)90991-1

Kantz H Schreiber T Nonlinear time series analysis 2nd ed Cambridge University Press 2004

Kay Elemetrics Disordered Voice Database Model 4337 3th ed United Satates 1994

Kokkinos I Maragos P Nonlinear speech analysis using models for chaotic systems IEEE Transactions on Speech and Audio Processing 2005 13(6)1098-109 httpdxdoiorg101109TSA2005852982

Kumar A Mullick SK Nonlinear dynamical analysis of speech Journal Acoustic Society America 1996 100(1)615-29 httpdxdoiorg1011211415886

Little M Biomechanically informed nonlinear speech signal processing [tese] Oxford University of Oxford England 2006 164 p

Little M McSharry P Roberts S Costello D Moroz I Exploiting nonlinear recurrence and fractal scaling properties for voice disorder detection BioMedical Engineering OnLine 2007 6(23)1-19 httpdxdoiorg1011861475-925X-6-23

Manfredi C Pierazzi L Bruscaglioni P Pitch estimation for noise retrieval in time and frequency domain Medical amp Biological Engineering amp Computing 1999 37(2)532

Natarajan K Acharya UR Alias F Tiboleng T Puthusserypady SK Nonlinear analysis of EEG signals at different mental states BioMedical Engineering OnLine 2004 37 httpdxdoiorg1011861475-925X-3-7

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 13

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

OrsquoShaughnessy D Speech communications human and machine 2nd ed New York IEEE Press 2000

Petry A Reconhecimento automaacutetico de locutor utilizando medidas de invariantes dinacircmicas natildeo-lineares [tese] Rio Grande do Sul Universidade Federal do Rio Grande do Sul 2002 155 p

Pincus SM Approximate entropy as a measure of system complexity Proceedings of the National Academy of Sciences 1991 882297-301 httpdxdoiorg101073pnas8862297

Rabiner LR Schafer RW Digital processing of speech signals Upper Saddle River Prentice Hall 1978

Rabiner LR Juang BH Fundamentals of speech recognition Englewood Ciffs New Jersey Prentice Hall 1993

Rodriacuteguez-Saacutenchez A Delgado-Trejos E Orozco-Gutieacuterrez A Castellanos-Domiacutenguez G Nonlinear dynamics techniques for the detection of the brain areas using MER signals International Conference on BioMedical Engineering and Informatics 2008 2198-202 httpdxdoiorg101109BMEI2008330

SantrsquoAna R Coelho R Alcaim A Text-independent speaker recognition based on the hurst parameter and the multidimensional fractional brownian motion model IEEE Transactions on Audio Speech and Language Processing 2006 14(3)931-40 httpdxdoiorg101109TSA2005858054

Savi MA Dinacircmica natildeo-linear e Caos Rio de Janeiro E-papers 2006

Scalassara PR Dajer ME Maciel CD Pereira JC Voice signals characterization through entropy measures In BIOSIGNALS 2008 Proceedings of the International Conference on Bio-inspired Systems and

Signal Processing 2008 Jan 28-31 Madeira Portugal Madeira 2008 v 2 p 163-170

Schreiber T Schmitz A Surrogate time series Physica D 2000 142346-82 httpdxdoiorg101016S0167-2789(00)00043-9

Shannon C A Mathematical theory of communication The Bell System Technical Journal 1948 27(3)623-56

Silva LEV Ferramentas computacionais na anaacutelise da variabilidade da frequecircncia cardiacuteaca atraveacutes do paradigma natildeo extensivo no estudo de cardiopatias [dissertaccedilatildeo] Satildeo Paulo Universidade de Satildeo Paulo 2010 97 p

Takens F Detecting Strange Attractors in Turbulence In Rand DA Young L-S Dynamical systems and turbulence New York Springer-Verlag 1981 v 898 p 366-81

Tavares AHMP Aspectos matemaacuteticos da entropia [dissertaccedilatildeo] Portugal Universidade de Aveiro 2003 98 p

Tokuda I Miyano T Aihara K Surrogate analysis for detecting nonlinear dynamics in normal vowels The Journal of the Acoustical Society of America 2001 110(6)3207-17

Torres ME Gamero LG Rufiner HL Study of complexity in normal and pathological speech signals In EMBC 2003 Proceedings of the 25th Annual International Conference of the IEEE Engineering in Medicine and Biology Society 2003 17-21 Sept Cancun Meacutexico IEEE 2003 p 2339-2342 httpdxdoiorg101109IEMBS20031280385

Tsallis C Possible generalization of Boltzmann-Gibbs statistics Journal of Statistical Physics 1988 52(12)479-87 httpdxdoiorg101007BF01016429

Zhang Y Jiang JJ Acoustic analyses of sustained and running voices from patients with laryngeal pathologies Journal of Voice January 2008 22(1)1-9 httpdxdoiorg101016jjvoice200608003

Autores

Washington Ceacutesar de Almeida Costa Francisco Marcos de Assis Departamento de Engenharia Eleacutetrica ndash DEE Universidade Federal de Campina Grande ndash UFCG Campina Grande PB Brasil

Washington Ceacutesar de Almeida Costa Silvana Luciene do Nascimento Cunha Costa Coordenaccedilatildeo do Curso Superior de Bacharelado em Engenharia Eleacutetrica ndash CCSBEE Instituto Federal de Educaccedilatildeo Ciecircncia e Tecnologia da Paraiacuteba ndash IFPB Av Primeiro de Maio 720 Jaguaribe CEP 58015-430 Joatildeo Pessoa PB Brasil

Benedito Guimaratildees Aguiar Neto Universidade Presbiteriana Mackenzie CEP 01302-907 Satildeo Paulo SP Brasil

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201314

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

combinaccedilatildeo linear dos valores das amostras anteriores levando em consideraccedilatildeo a correlaccedilatildeo entre estas Os coeficientes de prediccedilatildeo linear ou coeficientes LPC (Linear Predictive Coding) satildeo estimados por minimizaccedilatildeo do erro quadraacutetico entre a amostra atual e a sua prediccedilatildeo (OrsquoShaughnessy 2000 Rabiner e Juang 1993)

O modelo linear de produccedilatildeo da fala incorpora os efeitos dos pulsos glotais trato vocal e da radiaccedilatildeo dos laacutebios como um filtro linear (Rabiner e Schafer 1978) A fonte eacute uma sequecircncia de impulsos quase perioacutedicos utilizados para gerar sons sonoros ou a adiccedilatildeo de uma sequecircncia de ruiacutedo aleatoacuterio para sons surdos

Um fator de ganho G eacute ajustado para controlar a intensidade da excitaccedilatildeo Combinando os efeitos dos pulsos glotais do trato vocal e da radiaccedilatildeo o modelo pode ser representado por uma funccedilatildeo de transferecircncia de apenas polos H(z) como

1( )

1 ( )p kk

GH zk zminus

==

minus αsum (13)

Os termos α(k) representam os coeficientes de prediccedilatildeo linear (coeficientes LPC) e p a ordem do filtro de prediccedilatildeo

O meacutetodo LPC estima cada amostra de voz baseado numa combinaccedilatildeo linear de p amostras anteriores Um valor de p maior representa um modelo mais preciso A anaacutelise LPC fornece um conjunto de paracircmetros da fala que representa o trato vocal Espera-se que qualquer mudanccedila na estrutura anatocircmica do trato vocal devido agrave patologia afete os coeficientes LPC

Classificaccedilatildeo

Apoacutes a extraccedilatildeo das caracteriacutesticas tanto pela anaacutelise linear quanto pela natildeo linear eacute realizado o processo de classificaccedilatildeo Neste processo eacute aplicada a anaacutelise discriminante quadraacutetica (QDA) com validaccedilatildeo cruzada em que satildeo utilizados 10 subconjuntos (folds) Satildeo avaliados os desempenhos de classificadores implementados com cada uma das caracteriacutesticas de forma individual e de classificadores implementados a partir da combinaccedilatildeo dessas caracteriacutesticas

Outros classificadores satildeo implementados com coeficientes LPC de ordem p variando de 12 a 24 (p = 12 16 20 e 24) Apoacutes a avaliaccedilatildeo individual de cada meacutetodo (linear e natildeo linear) satildeo construiacutedos vetores hiacutebridos em que a cada vetor LPC de ordem p satildeo adicionadas as medidas natildeo lineares Uma nova avaliaccedilatildeo de desempenho eacute realizada a partir dos vetores hiacutebridos

Para avaliaccedilatildeo de desempenho do processo de classificaccedilatildeo trecircs medidas satildeo utilizadas acuraacutecia sensibilidade e especificidade A Acuraacutecia mede a

taxa de classificaccedilatildeo correta global do teste ou seja a capacidade do teste de identificar corretamente quando haacute e quando natildeo haacute presenccedila da doenccedila A Acuraacutecia (Equaccedilatildeo 14) eacute definida como a relaccedilatildeo entre todos os sinais corretamente classificados e o nuacutemero total de sinais avaliados

VP VNAcuraacuteciaVP VN FP FN

+=+ + +

(14)

em que VP representa os verdadeiros positivos ou seja o nuacutemero de sinais classificados corretamente como patoloacutegicos VN representa os verdadeiros negativos ou seja em quantos sinais foram detectados a ausecircncia correta da patologia FP os falsos positivos ou a quantidade de sinais saudaacuteveis classificados erroneamente como patoloacutegicos e FN os falsos negativos ou seja a quantidade de sinais patoloacutegicos classificados erroneamente como saudaacuteveis

A Sensibilidade mede a capacidade do teste em identificar corretamente a doenccedila entre aqueles que a possuem ou seja o quatildeo sensiacutevel eacute o teste Eacute a relaccedilatildeo entre os sinais patoloacutegicos corretamente classificados e o nuacutemero total de sinais patoloacutegicos dada por

VPSensibilidadeVP FN

=+

(15)

A Especificidade mede a capacidade do teste em excluir corretamente aqueles que natildeo possuem a doenccedila ou seja o quatildeo especiacutefico eacute o teste Eacute a relaccedilatildeo entre os sinais saudaacuteveis corretamente classificados e o nuacutemero total de sinais saudaacuteveis

VNEspecificidadeVN FP

=+

(16)

Os resultados obtidos no processo de classificaccedilatildeo satildeo apresentados a seguir

ResultadosNa Tabela 1 satildeo apresentados os valores de acuraacutecia obtidos com o uso de cada uma das medidas da anaacutelise dinacircmica natildeo linear (MNL) para a classificaccedilatildeo entre vozes saudaacuteveis (SDL) e patoloacutegicas (PTL) usando a anaacutelise discriminante quadraacutetica (QDA ndash Quadratic Discriminant Analysis) A classe dos sinais patoloacutegicos inclui os sinais afetados por edema noacutedulos e paralisia nas pregas vocais O expoente de Hurst H foi o paracircmetro mais eficiente em capturar as desordens vocais presentes nos sinais de vozes patoloacutegicas comparadas aos sinais de vozes saudaacuteveis tendo a maior acuraacutecia no processo de classificaccedilatildeo

Na Tabela 2 satildeo apresentados inicialmente os resultados obtidos na classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas (SDL times PTL) mediante a

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201310

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

combinaccedilatildeo das medidas Observa-se que com a combinaccedilatildeo de apenas quatro medidas entre as oito foi obtida a maior acuraacutecia (9603 plusmn 411) com as medidas entropia de Shannon (H1) entropia de Tsallis (Hq) expoente de Hurst (H) e a dimensatildeo de correlaccedilatildeo (D2) O acreacutescimo das trecircs medidas ao expoente de Hurst proporcionou um aumento de cerca de 9 no valor da acuraacutecia alcanccedilada com o uso individual desta caracteriacutestica

As patologias satildeo separadas em classes diferentes (paralisia edema ou noacutedulo) e comparadas aos sinais saudaacuteveis constituindo as seguintes comparaccedilotildees saudaacutevel times edema (SDL times EDM) saudaacutevel times paralisa (SDL times PRL) e saudaacutevel times noacutedulo (SDL times NDL) Como apresentado na Tabela 2 nesses casos as taxas de acuraacutecia meacutedia satildeo superiores a 97 com todas as taxas de especificidade chegando a 100 o que significa que nenhum sinal saudaacutevel testado foi considerado patoloacutegico O expoente de Hurst e as entropias de Shannon e de Tsallis aparecem em todas as combinaccedilotildees associando-se a outras medidas no caso da discriminaccedilatildeo entre saudaacutevel e edema e entre saudaacutevel e paralisia

Na distinccedilatildeo entre patologias observa-se pela Tabela 2 mesmo com a combinaccedilatildeo das medidas

a acuraacutecia meacutedia atingiu no maacuteximo 86 enquanto que os valores de sensibilidade meacutedia natildeo chegaram a 75 Dessa forma visando aumentar o desempenho na classificaccedilatildeo foi investigada a influecircncia do uso combinado das medidas da anaacutelise natildeo linear com os coeficientes LPC na discriminaccedilatildeo entre as patologias consideradas Nas Figuras 7 a 9 satildeo mostrados os resultados obtidos na discriminaccedilatildeo entre paralisia e edema paralisia e noacutedulo e entre edema e noacutedulo respectivamente

Tabela 2 Avaliaccedilatildeo de desempenho das medidas combinadas ndash valores de acuraacutecia obtidos na classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas e entre as patologiasTable 2 Performance evaluation of combined measures - values of the obtained accuracy in classification between healthy and pathological voices and among pathologies

Classificaccedilatildeo Caracteriacutesticas Acuraacutecia () Sensibilidade () Especificidade ()SDL times PTL H1 Hq H e D2 9603 plusmn 411 9446 plusmn 513 9800 plusmn 452SDL times EDM H1 Hq H D2 e K2 9875 plusmn 283 9667 plusmn 754 100SDL times PRL FMMI H D2 e H1 ou Hq 9750 plusmn 377 9333 plusmn 1005 100SDL times NDL H1 Hq e H 9857 plusmn 323 9500 plusmn 1131 100PRL times EDM λ1 FMMI Hq ApEn D2 e K2 7700 plusmn 1459 7417 plusmn 1874 8167 plusmn 1817PRL times NDL λ1 H ApEn D2 e K2 8600 plusmn 1103 6500 plusmn 2966 9667 plusmn 1494

EDM times NDL λ1 FMMI H1 Hq H e D2 7600 plusmn 951 5500 plusmn 2639 8667 plusmn 1231

Tabela 1 Avaliaccedilatildeo de desempenho das medidas individuais ndash valores de Acuraacutecia () obtidos na classificaccedilatildeo entre vozes saudaacuteveis e vozes patoloacutegicasTable 1 Performance evaluation of individual measures ndash values of the obtained accuracy in classification between healthy and pathological voices

Medidas Saudaacutevel times Patoloacutegica Saudaacutevel times Edema Saudaacutevel times Paralisia Saudaacutevel times Noacutedulo

λ1 5451 plusmn 823 6122 plusmn 1105 5855 plusmn 999 5232 plusmn 1308FMMI 6255 plusmn 574 6022 plusmn 848 6864 plusmn 1010 5821 plusmn 1446

H1 6085 plusmn 831 6944 plusmn 882 6582 plusmn 607 7464 plusmn 803Hq 6261 plusmn 921 6744 plusmn 718 6855 plusmn 766 7607 plusmn 682H 8709 plusmn 591 8567 plusmn 513 8809 plusmn 753 9429 plusmn 528

ApEn 5660 plusmn 672 6806 plusmn 615 6929 plusmn 1351 6667 plusmn 1037D2 7936 plusmn 1077 8458 plusmn 887 8750 plusmn 809 8262 plusmn 1254K2 5288 plusmn 509 6097 plusmn 1032 6196 plusmn 1198 5738 plusmn 881

Acuraacutecia maacuteximaMaximum accuracy

Figura 7 Classificaccedilatildeo entre vozes afetadas por paralisia e sinais afetados por edema nas pregas vocaisFigure 7 Classification between voices affected by vocal fold paralysis and vocal fold edema

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 11

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

Na discriminaccedilatildeo entre paralisia e edema a taxa de acuraacutecia sai de 9655 plusmn 151 com 12 coeficientes LPC para 9924 plusmn 052 com 24 coeficientes Aleacutem do acreacutescimo na acuraacutecia meacutedia em mais de 18 em relaccedilatildeo ao uso dos melhores resultados individuais (LPC) com a combinaccedilatildeo (MNL e LPC) o erro padratildeo caiu consideravelmente aumentando a confiabilidade do teste

Na discriminaccedilatildeo entre paralisia e noacutedulo a acuraacutecia de 86 soacute com as medidas natildeo lineares cresce para valores maiores que 99 Com 12 coeficientes LPC a acuraacutecia eacute de 9919 plusmn 055 com sensibilidade 100 e especificidade meacutedia de aproximadamente 98

A acuraacutecia meacutedia na classificaccedilatildeo entre edema e noacutedulo antes de 76 com as medidas natildeo lineares e cerca de 70 com LPC chega a mais de 98 com o vetor hiacutebrido com apenas 12 coeficientes E passa dos 99 a partir de 16 coeficientes quando associados agraves medidas natildeo lineares

DiscussatildeoPelos resultados apresentados constata-se que o desempenho da classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas aumentou significativamente com a combinaccedilatildeo das medidas da anaacutelise dinacircmica natildeo linear Nos melhores resultados o expoente de Hurst que se destacou como melhor medida individual aparece em todas as combinaccedilotildees juntamente com as entropias de Shannon e de Tsallis para a classificaccedilatildeo entre os sinais de vozes saudaacuteveis e sinais afetados por paralisa edema ou noacutedulo No entanto essas medidas natildeo foram eficazes em discriminar entre patologias apresentando taxas inferiores agraves apresentadas na discriminaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas

A anaacutelise LPC comparada agraves outras medidas empregadas mostra-se mais eficaz em discriminar entre patologias Observa-se que o valor da acuraacutecia aumenta com o aumento da ordem de preditor Aleacutem disso o desempenho na classificaccedilatildeo entre patologias melhora significativamente ao combinar as medidas natildeo lineares com os coeficientes LPC

Eacute importante considerar que o aumento na ordem dos coeficientes LPC estaacute associado a um maior volume de dados a serem processados aumentando o custo computacional No entanto caso seja mais relevante a precisatildeo do diagnoacutestico do que a realizaccedilatildeo da anaacutelise em tempo real eacute possiacutevel optar por empregar uma maior quantidade de coeficientes LPC Observa-se pelos resultados que o valor da acuraacutecia natildeo teve um aumento tatildeo consideraacutevel com o aumento da ordem de prediccedilatildeo aleacutem de 16 coeficientes

ConclusatildeoA partir dos resultados obtidos constata-se que as medidas natildeo lineares conseguem capturar bem as desordens vocais provocadas por patologias nas pregas vocais como noacutedulos edemas e paralisia A consideraccedilatildeo das natildeo linearidades inerentes ao processo de produccedilatildeo da fala e sua consequente anaacutelise utilizando medidas natildeo lineares eacute eficiente em distinguir um sinal saudaacutevel de um sinal patoloacutegico comprovadamente com as patologias consideradas no trabalho (edema paralisia e noacutedulos nas pregas vocais) Entretanto observa-se que a abordagem pelo modelo linear de produccedilatildeo da fala em que os coeficientes LPC modelam o trato vocal consegue distinguir melhor as especificidades existentes nas patologias analisadas notadamente quando combinadas agrave abordagem natildeo linear As mudanccedilas nas estruturas anatocircmicas do trato vocal e da fonte (laringe) foram bem retratadas com a combinaccedilatildeo das duas abordagens sendo a principal contribuiccedilatildeo deste trabalho Com a abordagem hiacutebrida o desempenho na distinccedilatildeo entre

6012 16 20

Nuacutemero de coeficientes LPC

Paralisia times Noacutedulo

24

6468

Acu

raacuteci

a m

eacutedia

()

72768084889296

100

MNL LPC MNL + LPC

Figura 8 Classificaccedilatildeo entre vozes afetadas por paralisia e sinais afetados por noacutedulos nas pregas vocaisFigure 8 Classification between voices affected by vocal fold paralysis and vocal nodules

Figura 9 Classificaccedilatildeo entre vozes afetadas por edema e sinais afetados por noacutedulos nas pregas vocaisFigure 9 Classification between voices affected by vocal fold Edema and vocal nodules

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201312

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

as patologias obteve um aumento consideraacutevel Isto denota que o meacutetodo empregado eacute bastante promissor na tarefa de discriminar entre vozes saudaacuteveis e vozes afetadas por patologias lariacutengeas bem como entre patologias Espera-se que os meacutetodos apresentados nesta pesquisa contribuam ainda mais para a detecccedilatildeo precoce das doenccedilas da laringe auxiliando no seu diagnoacutestico ou para monitorar seu progresso buscando assegurar os cuidados cliacutenicos adequados e mais conforto aos pacientes

ReferecircnciasAlvarez-Ramirez J Echeverria JC Rodriguez E Performance of a high-dimensional RS method for Hurst exponent estimation Physica A Statistical Mechanics and its Applications 2008 387(26)6452-62 httpdxdoiorg101016jphysa200808014

Arias-Londono J Godino-Llorente J Saacuteenz-Lechoacuten N Osma-Ruiz V Castellanos-Dominguez G Automatic detection of pathological voices using complexity measures noise parameters and mel-cepstral coefficients IEEE Transactions on Biomedical Engineering 2011 58(2)370-9 httpdxdoiorg101109TBME20102089052

Boyanov B Ivanov T Hadjitodorov S Chollet G Robust hybrid pitch detector Electronic Letters 1993 29(22)1924-6 httpdxdoiorg101049el19931281

Chakrabarti CG De K Boltzmann-Gibbs entropy axiomatic characterization and application International Journal of Mathematics and Mathematical Sciences 2000 23(4)243-51 httpdxdoiorg101155S0161171200000375

Custoacutedio RF Anaacutelise Natildeo-linear no reconhecimento de padrotildees sonoros Estudo de caso para sons pulmonares [tese] Rio Grande do Sul Universidade Federal do Rio Grande do Sul 1999 119 p

Dajer ME Padrotildees visuais de sinais de voz atraveacutes de teacutecnica de anaacutelise de natildeo-linear [dissertaccedilatildeo] Satildeo Paulo Escola de Engenharia de Satildeo Carlos 2006 154 p

Fantinato PC Segmentaccedilatildeo de voz baseada na anaacutelise fractal e na transformada wavelet [dissertaccedilatildeo] Satildeo Paulo Instituto de Fiacutesica de Satildeo Carlos da Universidade de Satildeo Carlos 2008 123 p

Fiedler-Ferrara N Prado CPC Caos Uma introduccedilatildeo Satildeo Paulo Ed Edgard Blucher Ltda 1994

Fraser AM Swinney HL Independent coordinates for strange attractors from mutual information Physical Review A 1986 331134-40 httpdxdoiorg 101103PhysRevA331134

Godino-Llorente JI Goacutemez-Vilda P Blanco Velasco M Dimensionality reduction of a pathological voice quality assessment system based on gaussian mixture models and short-term cepstral parameters IEEE Transactions on Biomedical Engineering 2006 53(10)1943-53 httpdxdoiorg101109TBME2006871883

Gomes D Fonseca N Agoulmine N Souza JN Neurocomputaccedilatildeo na estimativa do paracircmetro de hurst

In SBRCrsquo2001 Anais do 19 Simpoacutesio Brasileiro de Redes de Computadores 2001 Maio Florianoacutepolis Santa Catarina Florianoacutepolis 2001 p 306-21

Grassberger P Procaccia I Measuring the strangeness of strange attractors Physica D 1983 9189-208 httpdxdoiorg1010160167-2789(83)90298-1

Hegger R Kantz H Schreiber T Practical implementation of nonlinear time series methods the tisean package Chaos 1999 9(2)413-35 httpdxdoiorg1010631166424

Henriacutequez P Alonso JB Ferrer MA Travieso CM Godino-Llorente JI Diacuteaz-De-Maria F Characterization of healthy and pathological voice through measures based on nonlinear dynamics IEEE Transactions on Audio Speech and Language Processing 2009 17(6)1186-95 httpdxdoiorg101109TASL20092016734

Hurst E Long term storage capacity of reservoirs Transactions of the American Society of Civil Engineers 1951 116770-9

Jiang JJ Zhang Y McGilligan C Chaos in voice from modeling to measurement Journal of Voice 2006 20(1)2-17 httpdxdoiorg101016jjvoice200501001

Johnson MT Povinelli RJ Lindgren AC Ye J Liu X Indrebo KM Time-domain isolated phoneme classification using reconstructed phase spaces IEEE Transactions Speech and Audio Processing 2005 13(4)458-66 httpdxdoiorg101109TSA2005848885

Kantz H A Robust Method to Estimate the maximal lyapunov exponent of a time series Physics Letters A 1994 18577-87 httpdxdoiorg1010160375-9601(94)90991-1

Kantz H Schreiber T Nonlinear time series analysis 2nd ed Cambridge University Press 2004

Kay Elemetrics Disordered Voice Database Model 4337 3th ed United Satates 1994

Kokkinos I Maragos P Nonlinear speech analysis using models for chaotic systems IEEE Transactions on Speech and Audio Processing 2005 13(6)1098-109 httpdxdoiorg101109TSA2005852982

Kumar A Mullick SK Nonlinear dynamical analysis of speech Journal Acoustic Society America 1996 100(1)615-29 httpdxdoiorg1011211415886

Little M Biomechanically informed nonlinear speech signal processing [tese] Oxford University of Oxford England 2006 164 p

Little M McSharry P Roberts S Costello D Moroz I Exploiting nonlinear recurrence and fractal scaling properties for voice disorder detection BioMedical Engineering OnLine 2007 6(23)1-19 httpdxdoiorg1011861475-925X-6-23

Manfredi C Pierazzi L Bruscaglioni P Pitch estimation for noise retrieval in time and frequency domain Medical amp Biological Engineering amp Computing 1999 37(2)532

Natarajan K Acharya UR Alias F Tiboleng T Puthusserypady SK Nonlinear analysis of EEG signals at different mental states BioMedical Engineering OnLine 2004 37 httpdxdoiorg1011861475-925X-3-7

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 13

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

OrsquoShaughnessy D Speech communications human and machine 2nd ed New York IEEE Press 2000

Petry A Reconhecimento automaacutetico de locutor utilizando medidas de invariantes dinacircmicas natildeo-lineares [tese] Rio Grande do Sul Universidade Federal do Rio Grande do Sul 2002 155 p

Pincus SM Approximate entropy as a measure of system complexity Proceedings of the National Academy of Sciences 1991 882297-301 httpdxdoiorg101073pnas8862297

Rabiner LR Schafer RW Digital processing of speech signals Upper Saddle River Prentice Hall 1978

Rabiner LR Juang BH Fundamentals of speech recognition Englewood Ciffs New Jersey Prentice Hall 1993

Rodriacuteguez-Saacutenchez A Delgado-Trejos E Orozco-Gutieacuterrez A Castellanos-Domiacutenguez G Nonlinear dynamics techniques for the detection of the brain areas using MER signals International Conference on BioMedical Engineering and Informatics 2008 2198-202 httpdxdoiorg101109BMEI2008330

SantrsquoAna R Coelho R Alcaim A Text-independent speaker recognition based on the hurst parameter and the multidimensional fractional brownian motion model IEEE Transactions on Audio Speech and Language Processing 2006 14(3)931-40 httpdxdoiorg101109TSA2005858054

Savi MA Dinacircmica natildeo-linear e Caos Rio de Janeiro E-papers 2006

Scalassara PR Dajer ME Maciel CD Pereira JC Voice signals characterization through entropy measures In BIOSIGNALS 2008 Proceedings of the International Conference on Bio-inspired Systems and

Signal Processing 2008 Jan 28-31 Madeira Portugal Madeira 2008 v 2 p 163-170

Schreiber T Schmitz A Surrogate time series Physica D 2000 142346-82 httpdxdoiorg101016S0167-2789(00)00043-9

Shannon C A Mathematical theory of communication The Bell System Technical Journal 1948 27(3)623-56

Silva LEV Ferramentas computacionais na anaacutelise da variabilidade da frequecircncia cardiacuteaca atraveacutes do paradigma natildeo extensivo no estudo de cardiopatias [dissertaccedilatildeo] Satildeo Paulo Universidade de Satildeo Paulo 2010 97 p

Takens F Detecting Strange Attractors in Turbulence In Rand DA Young L-S Dynamical systems and turbulence New York Springer-Verlag 1981 v 898 p 366-81

Tavares AHMP Aspectos matemaacuteticos da entropia [dissertaccedilatildeo] Portugal Universidade de Aveiro 2003 98 p

Tokuda I Miyano T Aihara K Surrogate analysis for detecting nonlinear dynamics in normal vowels The Journal of the Acoustical Society of America 2001 110(6)3207-17

Torres ME Gamero LG Rufiner HL Study of complexity in normal and pathological speech signals In EMBC 2003 Proceedings of the 25th Annual International Conference of the IEEE Engineering in Medicine and Biology Society 2003 17-21 Sept Cancun Meacutexico IEEE 2003 p 2339-2342 httpdxdoiorg101109IEMBS20031280385

Tsallis C Possible generalization of Boltzmann-Gibbs statistics Journal of Statistical Physics 1988 52(12)479-87 httpdxdoiorg101007BF01016429

Zhang Y Jiang JJ Acoustic analyses of sustained and running voices from patients with laryngeal pathologies Journal of Voice January 2008 22(1)1-9 httpdxdoiorg101016jjvoice200608003

Autores

Washington Ceacutesar de Almeida Costa Francisco Marcos de Assis Departamento de Engenharia Eleacutetrica ndash DEE Universidade Federal de Campina Grande ndash UFCG Campina Grande PB Brasil

Washington Ceacutesar de Almeida Costa Silvana Luciene do Nascimento Cunha Costa Coordenaccedilatildeo do Curso Superior de Bacharelado em Engenharia Eleacutetrica ndash CCSBEE Instituto Federal de Educaccedilatildeo Ciecircncia e Tecnologia da Paraiacuteba ndash IFPB Av Primeiro de Maio 720 Jaguaribe CEP 58015-430 Joatildeo Pessoa PB Brasil

Benedito Guimaratildees Aguiar Neto Universidade Presbiteriana Mackenzie CEP 01302-907 Satildeo Paulo SP Brasil

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201314

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

combinaccedilatildeo das medidas Observa-se que com a combinaccedilatildeo de apenas quatro medidas entre as oito foi obtida a maior acuraacutecia (9603 plusmn 411) com as medidas entropia de Shannon (H1) entropia de Tsallis (Hq) expoente de Hurst (H) e a dimensatildeo de correlaccedilatildeo (D2) O acreacutescimo das trecircs medidas ao expoente de Hurst proporcionou um aumento de cerca de 9 no valor da acuraacutecia alcanccedilada com o uso individual desta caracteriacutestica

As patologias satildeo separadas em classes diferentes (paralisia edema ou noacutedulo) e comparadas aos sinais saudaacuteveis constituindo as seguintes comparaccedilotildees saudaacutevel times edema (SDL times EDM) saudaacutevel times paralisa (SDL times PRL) e saudaacutevel times noacutedulo (SDL times NDL) Como apresentado na Tabela 2 nesses casos as taxas de acuraacutecia meacutedia satildeo superiores a 97 com todas as taxas de especificidade chegando a 100 o que significa que nenhum sinal saudaacutevel testado foi considerado patoloacutegico O expoente de Hurst e as entropias de Shannon e de Tsallis aparecem em todas as combinaccedilotildees associando-se a outras medidas no caso da discriminaccedilatildeo entre saudaacutevel e edema e entre saudaacutevel e paralisia

Na distinccedilatildeo entre patologias observa-se pela Tabela 2 mesmo com a combinaccedilatildeo das medidas

a acuraacutecia meacutedia atingiu no maacuteximo 86 enquanto que os valores de sensibilidade meacutedia natildeo chegaram a 75 Dessa forma visando aumentar o desempenho na classificaccedilatildeo foi investigada a influecircncia do uso combinado das medidas da anaacutelise natildeo linear com os coeficientes LPC na discriminaccedilatildeo entre as patologias consideradas Nas Figuras 7 a 9 satildeo mostrados os resultados obtidos na discriminaccedilatildeo entre paralisia e edema paralisia e noacutedulo e entre edema e noacutedulo respectivamente

Tabela 2 Avaliaccedilatildeo de desempenho das medidas combinadas ndash valores de acuraacutecia obtidos na classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas e entre as patologiasTable 2 Performance evaluation of combined measures - values of the obtained accuracy in classification between healthy and pathological voices and among pathologies

Classificaccedilatildeo Caracteriacutesticas Acuraacutecia () Sensibilidade () Especificidade ()SDL times PTL H1 Hq H e D2 9603 plusmn 411 9446 plusmn 513 9800 plusmn 452SDL times EDM H1 Hq H D2 e K2 9875 plusmn 283 9667 plusmn 754 100SDL times PRL FMMI H D2 e H1 ou Hq 9750 plusmn 377 9333 plusmn 1005 100SDL times NDL H1 Hq e H 9857 plusmn 323 9500 plusmn 1131 100PRL times EDM λ1 FMMI Hq ApEn D2 e K2 7700 plusmn 1459 7417 plusmn 1874 8167 plusmn 1817PRL times NDL λ1 H ApEn D2 e K2 8600 plusmn 1103 6500 plusmn 2966 9667 plusmn 1494

EDM times NDL λ1 FMMI H1 Hq H e D2 7600 plusmn 951 5500 plusmn 2639 8667 plusmn 1231

Tabela 1 Avaliaccedilatildeo de desempenho das medidas individuais ndash valores de Acuraacutecia () obtidos na classificaccedilatildeo entre vozes saudaacuteveis e vozes patoloacutegicasTable 1 Performance evaluation of individual measures ndash values of the obtained accuracy in classification between healthy and pathological voices

Medidas Saudaacutevel times Patoloacutegica Saudaacutevel times Edema Saudaacutevel times Paralisia Saudaacutevel times Noacutedulo

λ1 5451 plusmn 823 6122 plusmn 1105 5855 plusmn 999 5232 plusmn 1308FMMI 6255 plusmn 574 6022 plusmn 848 6864 plusmn 1010 5821 plusmn 1446

H1 6085 plusmn 831 6944 plusmn 882 6582 plusmn 607 7464 plusmn 803Hq 6261 plusmn 921 6744 plusmn 718 6855 plusmn 766 7607 plusmn 682H 8709 plusmn 591 8567 plusmn 513 8809 plusmn 753 9429 plusmn 528

ApEn 5660 plusmn 672 6806 plusmn 615 6929 plusmn 1351 6667 plusmn 1037D2 7936 plusmn 1077 8458 plusmn 887 8750 plusmn 809 8262 plusmn 1254K2 5288 plusmn 509 6097 plusmn 1032 6196 plusmn 1198 5738 plusmn 881

Acuraacutecia maacuteximaMaximum accuracy

Figura 7 Classificaccedilatildeo entre vozes afetadas por paralisia e sinais afetados por edema nas pregas vocaisFigure 7 Classification between voices affected by vocal fold paralysis and vocal fold edema

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 11

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

Na discriminaccedilatildeo entre paralisia e edema a taxa de acuraacutecia sai de 9655 plusmn 151 com 12 coeficientes LPC para 9924 plusmn 052 com 24 coeficientes Aleacutem do acreacutescimo na acuraacutecia meacutedia em mais de 18 em relaccedilatildeo ao uso dos melhores resultados individuais (LPC) com a combinaccedilatildeo (MNL e LPC) o erro padratildeo caiu consideravelmente aumentando a confiabilidade do teste

Na discriminaccedilatildeo entre paralisia e noacutedulo a acuraacutecia de 86 soacute com as medidas natildeo lineares cresce para valores maiores que 99 Com 12 coeficientes LPC a acuraacutecia eacute de 9919 plusmn 055 com sensibilidade 100 e especificidade meacutedia de aproximadamente 98

A acuraacutecia meacutedia na classificaccedilatildeo entre edema e noacutedulo antes de 76 com as medidas natildeo lineares e cerca de 70 com LPC chega a mais de 98 com o vetor hiacutebrido com apenas 12 coeficientes E passa dos 99 a partir de 16 coeficientes quando associados agraves medidas natildeo lineares

DiscussatildeoPelos resultados apresentados constata-se que o desempenho da classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas aumentou significativamente com a combinaccedilatildeo das medidas da anaacutelise dinacircmica natildeo linear Nos melhores resultados o expoente de Hurst que se destacou como melhor medida individual aparece em todas as combinaccedilotildees juntamente com as entropias de Shannon e de Tsallis para a classificaccedilatildeo entre os sinais de vozes saudaacuteveis e sinais afetados por paralisa edema ou noacutedulo No entanto essas medidas natildeo foram eficazes em discriminar entre patologias apresentando taxas inferiores agraves apresentadas na discriminaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas

A anaacutelise LPC comparada agraves outras medidas empregadas mostra-se mais eficaz em discriminar entre patologias Observa-se que o valor da acuraacutecia aumenta com o aumento da ordem de preditor Aleacutem disso o desempenho na classificaccedilatildeo entre patologias melhora significativamente ao combinar as medidas natildeo lineares com os coeficientes LPC

Eacute importante considerar que o aumento na ordem dos coeficientes LPC estaacute associado a um maior volume de dados a serem processados aumentando o custo computacional No entanto caso seja mais relevante a precisatildeo do diagnoacutestico do que a realizaccedilatildeo da anaacutelise em tempo real eacute possiacutevel optar por empregar uma maior quantidade de coeficientes LPC Observa-se pelos resultados que o valor da acuraacutecia natildeo teve um aumento tatildeo consideraacutevel com o aumento da ordem de prediccedilatildeo aleacutem de 16 coeficientes

ConclusatildeoA partir dos resultados obtidos constata-se que as medidas natildeo lineares conseguem capturar bem as desordens vocais provocadas por patologias nas pregas vocais como noacutedulos edemas e paralisia A consideraccedilatildeo das natildeo linearidades inerentes ao processo de produccedilatildeo da fala e sua consequente anaacutelise utilizando medidas natildeo lineares eacute eficiente em distinguir um sinal saudaacutevel de um sinal patoloacutegico comprovadamente com as patologias consideradas no trabalho (edema paralisia e noacutedulos nas pregas vocais) Entretanto observa-se que a abordagem pelo modelo linear de produccedilatildeo da fala em que os coeficientes LPC modelam o trato vocal consegue distinguir melhor as especificidades existentes nas patologias analisadas notadamente quando combinadas agrave abordagem natildeo linear As mudanccedilas nas estruturas anatocircmicas do trato vocal e da fonte (laringe) foram bem retratadas com a combinaccedilatildeo das duas abordagens sendo a principal contribuiccedilatildeo deste trabalho Com a abordagem hiacutebrida o desempenho na distinccedilatildeo entre

6012 16 20

Nuacutemero de coeficientes LPC

Paralisia times Noacutedulo

24

6468

Acu

raacuteci

a m

eacutedia

()

72768084889296

100

MNL LPC MNL + LPC

Figura 8 Classificaccedilatildeo entre vozes afetadas por paralisia e sinais afetados por noacutedulos nas pregas vocaisFigure 8 Classification between voices affected by vocal fold paralysis and vocal nodules

Figura 9 Classificaccedilatildeo entre vozes afetadas por edema e sinais afetados por noacutedulos nas pregas vocaisFigure 9 Classification between voices affected by vocal fold Edema and vocal nodules

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201312

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

as patologias obteve um aumento consideraacutevel Isto denota que o meacutetodo empregado eacute bastante promissor na tarefa de discriminar entre vozes saudaacuteveis e vozes afetadas por patologias lariacutengeas bem como entre patologias Espera-se que os meacutetodos apresentados nesta pesquisa contribuam ainda mais para a detecccedilatildeo precoce das doenccedilas da laringe auxiliando no seu diagnoacutestico ou para monitorar seu progresso buscando assegurar os cuidados cliacutenicos adequados e mais conforto aos pacientes

ReferecircnciasAlvarez-Ramirez J Echeverria JC Rodriguez E Performance of a high-dimensional RS method for Hurst exponent estimation Physica A Statistical Mechanics and its Applications 2008 387(26)6452-62 httpdxdoiorg101016jphysa200808014

Arias-Londono J Godino-Llorente J Saacuteenz-Lechoacuten N Osma-Ruiz V Castellanos-Dominguez G Automatic detection of pathological voices using complexity measures noise parameters and mel-cepstral coefficients IEEE Transactions on Biomedical Engineering 2011 58(2)370-9 httpdxdoiorg101109TBME20102089052

Boyanov B Ivanov T Hadjitodorov S Chollet G Robust hybrid pitch detector Electronic Letters 1993 29(22)1924-6 httpdxdoiorg101049el19931281

Chakrabarti CG De K Boltzmann-Gibbs entropy axiomatic characterization and application International Journal of Mathematics and Mathematical Sciences 2000 23(4)243-51 httpdxdoiorg101155S0161171200000375

Custoacutedio RF Anaacutelise Natildeo-linear no reconhecimento de padrotildees sonoros Estudo de caso para sons pulmonares [tese] Rio Grande do Sul Universidade Federal do Rio Grande do Sul 1999 119 p

Dajer ME Padrotildees visuais de sinais de voz atraveacutes de teacutecnica de anaacutelise de natildeo-linear [dissertaccedilatildeo] Satildeo Paulo Escola de Engenharia de Satildeo Carlos 2006 154 p

Fantinato PC Segmentaccedilatildeo de voz baseada na anaacutelise fractal e na transformada wavelet [dissertaccedilatildeo] Satildeo Paulo Instituto de Fiacutesica de Satildeo Carlos da Universidade de Satildeo Carlos 2008 123 p

Fiedler-Ferrara N Prado CPC Caos Uma introduccedilatildeo Satildeo Paulo Ed Edgard Blucher Ltda 1994

Fraser AM Swinney HL Independent coordinates for strange attractors from mutual information Physical Review A 1986 331134-40 httpdxdoiorg 101103PhysRevA331134

Godino-Llorente JI Goacutemez-Vilda P Blanco Velasco M Dimensionality reduction of a pathological voice quality assessment system based on gaussian mixture models and short-term cepstral parameters IEEE Transactions on Biomedical Engineering 2006 53(10)1943-53 httpdxdoiorg101109TBME2006871883

Gomes D Fonseca N Agoulmine N Souza JN Neurocomputaccedilatildeo na estimativa do paracircmetro de hurst

In SBRCrsquo2001 Anais do 19 Simpoacutesio Brasileiro de Redes de Computadores 2001 Maio Florianoacutepolis Santa Catarina Florianoacutepolis 2001 p 306-21

Grassberger P Procaccia I Measuring the strangeness of strange attractors Physica D 1983 9189-208 httpdxdoiorg1010160167-2789(83)90298-1

Hegger R Kantz H Schreiber T Practical implementation of nonlinear time series methods the tisean package Chaos 1999 9(2)413-35 httpdxdoiorg1010631166424

Henriacutequez P Alonso JB Ferrer MA Travieso CM Godino-Llorente JI Diacuteaz-De-Maria F Characterization of healthy and pathological voice through measures based on nonlinear dynamics IEEE Transactions on Audio Speech and Language Processing 2009 17(6)1186-95 httpdxdoiorg101109TASL20092016734

Hurst E Long term storage capacity of reservoirs Transactions of the American Society of Civil Engineers 1951 116770-9

Jiang JJ Zhang Y McGilligan C Chaos in voice from modeling to measurement Journal of Voice 2006 20(1)2-17 httpdxdoiorg101016jjvoice200501001

Johnson MT Povinelli RJ Lindgren AC Ye J Liu X Indrebo KM Time-domain isolated phoneme classification using reconstructed phase spaces IEEE Transactions Speech and Audio Processing 2005 13(4)458-66 httpdxdoiorg101109TSA2005848885

Kantz H A Robust Method to Estimate the maximal lyapunov exponent of a time series Physics Letters A 1994 18577-87 httpdxdoiorg1010160375-9601(94)90991-1

Kantz H Schreiber T Nonlinear time series analysis 2nd ed Cambridge University Press 2004

Kay Elemetrics Disordered Voice Database Model 4337 3th ed United Satates 1994

Kokkinos I Maragos P Nonlinear speech analysis using models for chaotic systems IEEE Transactions on Speech and Audio Processing 2005 13(6)1098-109 httpdxdoiorg101109TSA2005852982

Kumar A Mullick SK Nonlinear dynamical analysis of speech Journal Acoustic Society America 1996 100(1)615-29 httpdxdoiorg1011211415886

Little M Biomechanically informed nonlinear speech signal processing [tese] Oxford University of Oxford England 2006 164 p

Little M McSharry P Roberts S Costello D Moroz I Exploiting nonlinear recurrence and fractal scaling properties for voice disorder detection BioMedical Engineering OnLine 2007 6(23)1-19 httpdxdoiorg1011861475-925X-6-23

Manfredi C Pierazzi L Bruscaglioni P Pitch estimation for noise retrieval in time and frequency domain Medical amp Biological Engineering amp Computing 1999 37(2)532

Natarajan K Acharya UR Alias F Tiboleng T Puthusserypady SK Nonlinear analysis of EEG signals at different mental states BioMedical Engineering OnLine 2004 37 httpdxdoiorg1011861475-925X-3-7

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 13

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

OrsquoShaughnessy D Speech communications human and machine 2nd ed New York IEEE Press 2000

Petry A Reconhecimento automaacutetico de locutor utilizando medidas de invariantes dinacircmicas natildeo-lineares [tese] Rio Grande do Sul Universidade Federal do Rio Grande do Sul 2002 155 p

Pincus SM Approximate entropy as a measure of system complexity Proceedings of the National Academy of Sciences 1991 882297-301 httpdxdoiorg101073pnas8862297

Rabiner LR Schafer RW Digital processing of speech signals Upper Saddle River Prentice Hall 1978

Rabiner LR Juang BH Fundamentals of speech recognition Englewood Ciffs New Jersey Prentice Hall 1993

Rodriacuteguez-Saacutenchez A Delgado-Trejos E Orozco-Gutieacuterrez A Castellanos-Domiacutenguez G Nonlinear dynamics techniques for the detection of the brain areas using MER signals International Conference on BioMedical Engineering and Informatics 2008 2198-202 httpdxdoiorg101109BMEI2008330

SantrsquoAna R Coelho R Alcaim A Text-independent speaker recognition based on the hurst parameter and the multidimensional fractional brownian motion model IEEE Transactions on Audio Speech and Language Processing 2006 14(3)931-40 httpdxdoiorg101109TSA2005858054

Savi MA Dinacircmica natildeo-linear e Caos Rio de Janeiro E-papers 2006

Scalassara PR Dajer ME Maciel CD Pereira JC Voice signals characterization through entropy measures In BIOSIGNALS 2008 Proceedings of the International Conference on Bio-inspired Systems and

Signal Processing 2008 Jan 28-31 Madeira Portugal Madeira 2008 v 2 p 163-170

Schreiber T Schmitz A Surrogate time series Physica D 2000 142346-82 httpdxdoiorg101016S0167-2789(00)00043-9

Shannon C A Mathematical theory of communication The Bell System Technical Journal 1948 27(3)623-56

Silva LEV Ferramentas computacionais na anaacutelise da variabilidade da frequecircncia cardiacuteaca atraveacutes do paradigma natildeo extensivo no estudo de cardiopatias [dissertaccedilatildeo] Satildeo Paulo Universidade de Satildeo Paulo 2010 97 p

Takens F Detecting Strange Attractors in Turbulence In Rand DA Young L-S Dynamical systems and turbulence New York Springer-Verlag 1981 v 898 p 366-81

Tavares AHMP Aspectos matemaacuteticos da entropia [dissertaccedilatildeo] Portugal Universidade de Aveiro 2003 98 p

Tokuda I Miyano T Aihara K Surrogate analysis for detecting nonlinear dynamics in normal vowels The Journal of the Acoustical Society of America 2001 110(6)3207-17

Torres ME Gamero LG Rufiner HL Study of complexity in normal and pathological speech signals In EMBC 2003 Proceedings of the 25th Annual International Conference of the IEEE Engineering in Medicine and Biology Society 2003 17-21 Sept Cancun Meacutexico IEEE 2003 p 2339-2342 httpdxdoiorg101109IEMBS20031280385

Tsallis C Possible generalization of Boltzmann-Gibbs statistics Journal of Statistical Physics 1988 52(12)479-87 httpdxdoiorg101007BF01016429

Zhang Y Jiang JJ Acoustic analyses of sustained and running voices from patients with laryngeal pathologies Journal of Voice January 2008 22(1)1-9 httpdxdoiorg101016jjvoice200608003

Autores

Washington Ceacutesar de Almeida Costa Francisco Marcos de Assis Departamento de Engenharia Eleacutetrica ndash DEE Universidade Federal de Campina Grande ndash UFCG Campina Grande PB Brasil

Washington Ceacutesar de Almeida Costa Silvana Luciene do Nascimento Cunha Costa Coordenaccedilatildeo do Curso Superior de Bacharelado em Engenharia Eleacutetrica ndash CCSBEE Instituto Federal de Educaccedilatildeo Ciecircncia e Tecnologia da Paraiacuteba ndash IFPB Av Primeiro de Maio 720 Jaguaribe CEP 58015-430 Joatildeo Pessoa PB Brasil

Benedito Guimaratildees Aguiar Neto Universidade Presbiteriana Mackenzie CEP 01302-907 Satildeo Paulo SP Brasil

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201314

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

Na discriminaccedilatildeo entre paralisia e edema a taxa de acuraacutecia sai de 9655 plusmn 151 com 12 coeficientes LPC para 9924 plusmn 052 com 24 coeficientes Aleacutem do acreacutescimo na acuraacutecia meacutedia em mais de 18 em relaccedilatildeo ao uso dos melhores resultados individuais (LPC) com a combinaccedilatildeo (MNL e LPC) o erro padratildeo caiu consideravelmente aumentando a confiabilidade do teste

Na discriminaccedilatildeo entre paralisia e noacutedulo a acuraacutecia de 86 soacute com as medidas natildeo lineares cresce para valores maiores que 99 Com 12 coeficientes LPC a acuraacutecia eacute de 9919 plusmn 055 com sensibilidade 100 e especificidade meacutedia de aproximadamente 98

A acuraacutecia meacutedia na classificaccedilatildeo entre edema e noacutedulo antes de 76 com as medidas natildeo lineares e cerca de 70 com LPC chega a mais de 98 com o vetor hiacutebrido com apenas 12 coeficientes E passa dos 99 a partir de 16 coeficientes quando associados agraves medidas natildeo lineares

DiscussatildeoPelos resultados apresentados constata-se que o desempenho da classificaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas aumentou significativamente com a combinaccedilatildeo das medidas da anaacutelise dinacircmica natildeo linear Nos melhores resultados o expoente de Hurst que se destacou como melhor medida individual aparece em todas as combinaccedilotildees juntamente com as entropias de Shannon e de Tsallis para a classificaccedilatildeo entre os sinais de vozes saudaacuteveis e sinais afetados por paralisa edema ou noacutedulo No entanto essas medidas natildeo foram eficazes em discriminar entre patologias apresentando taxas inferiores agraves apresentadas na discriminaccedilatildeo entre vozes saudaacuteveis e patoloacutegicas

A anaacutelise LPC comparada agraves outras medidas empregadas mostra-se mais eficaz em discriminar entre patologias Observa-se que o valor da acuraacutecia aumenta com o aumento da ordem de preditor Aleacutem disso o desempenho na classificaccedilatildeo entre patologias melhora significativamente ao combinar as medidas natildeo lineares com os coeficientes LPC

Eacute importante considerar que o aumento na ordem dos coeficientes LPC estaacute associado a um maior volume de dados a serem processados aumentando o custo computacional No entanto caso seja mais relevante a precisatildeo do diagnoacutestico do que a realizaccedilatildeo da anaacutelise em tempo real eacute possiacutevel optar por empregar uma maior quantidade de coeficientes LPC Observa-se pelos resultados que o valor da acuraacutecia natildeo teve um aumento tatildeo consideraacutevel com o aumento da ordem de prediccedilatildeo aleacutem de 16 coeficientes

ConclusatildeoA partir dos resultados obtidos constata-se que as medidas natildeo lineares conseguem capturar bem as desordens vocais provocadas por patologias nas pregas vocais como noacutedulos edemas e paralisia A consideraccedilatildeo das natildeo linearidades inerentes ao processo de produccedilatildeo da fala e sua consequente anaacutelise utilizando medidas natildeo lineares eacute eficiente em distinguir um sinal saudaacutevel de um sinal patoloacutegico comprovadamente com as patologias consideradas no trabalho (edema paralisia e noacutedulos nas pregas vocais) Entretanto observa-se que a abordagem pelo modelo linear de produccedilatildeo da fala em que os coeficientes LPC modelam o trato vocal consegue distinguir melhor as especificidades existentes nas patologias analisadas notadamente quando combinadas agrave abordagem natildeo linear As mudanccedilas nas estruturas anatocircmicas do trato vocal e da fonte (laringe) foram bem retratadas com a combinaccedilatildeo das duas abordagens sendo a principal contribuiccedilatildeo deste trabalho Com a abordagem hiacutebrida o desempenho na distinccedilatildeo entre

6012 16 20

Nuacutemero de coeficientes LPC

Paralisia times Noacutedulo

24

6468

Acu

raacuteci

a m

eacutedia

()

72768084889296

100

MNL LPC MNL + LPC

Figura 8 Classificaccedilatildeo entre vozes afetadas por paralisia e sinais afetados por noacutedulos nas pregas vocaisFigure 8 Classification between voices affected by vocal fold paralysis and vocal nodules

Figura 9 Classificaccedilatildeo entre vozes afetadas por edema e sinais afetados por noacutedulos nas pregas vocaisFigure 9 Classification between voices affected by vocal fold Edema and vocal nodules

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201312

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

as patologias obteve um aumento consideraacutevel Isto denota que o meacutetodo empregado eacute bastante promissor na tarefa de discriminar entre vozes saudaacuteveis e vozes afetadas por patologias lariacutengeas bem como entre patologias Espera-se que os meacutetodos apresentados nesta pesquisa contribuam ainda mais para a detecccedilatildeo precoce das doenccedilas da laringe auxiliando no seu diagnoacutestico ou para monitorar seu progresso buscando assegurar os cuidados cliacutenicos adequados e mais conforto aos pacientes

ReferecircnciasAlvarez-Ramirez J Echeverria JC Rodriguez E Performance of a high-dimensional RS method for Hurst exponent estimation Physica A Statistical Mechanics and its Applications 2008 387(26)6452-62 httpdxdoiorg101016jphysa200808014

Arias-Londono J Godino-Llorente J Saacuteenz-Lechoacuten N Osma-Ruiz V Castellanos-Dominguez G Automatic detection of pathological voices using complexity measures noise parameters and mel-cepstral coefficients IEEE Transactions on Biomedical Engineering 2011 58(2)370-9 httpdxdoiorg101109TBME20102089052

Boyanov B Ivanov T Hadjitodorov S Chollet G Robust hybrid pitch detector Electronic Letters 1993 29(22)1924-6 httpdxdoiorg101049el19931281

Chakrabarti CG De K Boltzmann-Gibbs entropy axiomatic characterization and application International Journal of Mathematics and Mathematical Sciences 2000 23(4)243-51 httpdxdoiorg101155S0161171200000375

Custoacutedio RF Anaacutelise Natildeo-linear no reconhecimento de padrotildees sonoros Estudo de caso para sons pulmonares [tese] Rio Grande do Sul Universidade Federal do Rio Grande do Sul 1999 119 p

Dajer ME Padrotildees visuais de sinais de voz atraveacutes de teacutecnica de anaacutelise de natildeo-linear [dissertaccedilatildeo] Satildeo Paulo Escola de Engenharia de Satildeo Carlos 2006 154 p

Fantinato PC Segmentaccedilatildeo de voz baseada na anaacutelise fractal e na transformada wavelet [dissertaccedilatildeo] Satildeo Paulo Instituto de Fiacutesica de Satildeo Carlos da Universidade de Satildeo Carlos 2008 123 p

Fiedler-Ferrara N Prado CPC Caos Uma introduccedilatildeo Satildeo Paulo Ed Edgard Blucher Ltda 1994

Fraser AM Swinney HL Independent coordinates for strange attractors from mutual information Physical Review A 1986 331134-40 httpdxdoiorg 101103PhysRevA331134

Godino-Llorente JI Goacutemez-Vilda P Blanco Velasco M Dimensionality reduction of a pathological voice quality assessment system based on gaussian mixture models and short-term cepstral parameters IEEE Transactions on Biomedical Engineering 2006 53(10)1943-53 httpdxdoiorg101109TBME2006871883

Gomes D Fonseca N Agoulmine N Souza JN Neurocomputaccedilatildeo na estimativa do paracircmetro de hurst

In SBRCrsquo2001 Anais do 19 Simpoacutesio Brasileiro de Redes de Computadores 2001 Maio Florianoacutepolis Santa Catarina Florianoacutepolis 2001 p 306-21

Grassberger P Procaccia I Measuring the strangeness of strange attractors Physica D 1983 9189-208 httpdxdoiorg1010160167-2789(83)90298-1

Hegger R Kantz H Schreiber T Practical implementation of nonlinear time series methods the tisean package Chaos 1999 9(2)413-35 httpdxdoiorg1010631166424

Henriacutequez P Alonso JB Ferrer MA Travieso CM Godino-Llorente JI Diacuteaz-De-Maria F Characterization of healthy and pathological voice through measures based on nonlinear dynamics IEEE Transactions on Audio Speech and Language Processing 2009 17(6)1186-95 httpdxdoiorg101109TASL20092016734

Hurst E Long term storage capacity of reservoirs Transactions of the American Society of Civil Engineers 1951 116770-9

Jiang JJ Zhang Y McGilligan C Chaos in voice from modeling to measurement Journal of Voice 2006 20(1)2-17 httpdxdoiorg101016jjvoice200501001

Johnson MT Povinelli RJ Lindgren AC Ye J Liu X Indrebo KM Time-domain isolated phoneme classification using reconstructed phase spaces IEEE Transactions Speech and Audio Processing 2005 13(4)458-66 httpdxdoiorg101109TSA2005848885

Kantz H A Robust Method to Estimate the maximal lyapunov exponent of a time series Physics Letters A 1994 18577-87 httpdxdoiorg1010160375-9601(94)90991-1

Kantz H Schreiber T Nonlinear time series analysis 2nd ed Cambridge University Press 2004

Kay Elemetrics Disordered Voice Database Model 4337 3th ed United Satates 1994

Kokkinos I Maragos P Nonlinear speech analysis using models for chaotic systems IEEE Transactions on Speech and Audio Processing 2005 13(6)1098-109 httpdxdoiorg101109TSA2005852982

Kumar A Mullick SK Nonlinear dynamical analysis of speech Journal Acoustic Society America 1996 100(1)615-29 httpdxdoiorg1011211415886

Little M Biomechanically informed nonlinear speech signal processing [tese] Oxford University of Oxford England 2006 164 p

Little M McSharry P Roberts S Costello D Moroz I Exploiting nonlinear recurrence and fractal scaling properties for voice disorder detection BioMedical Engineering OnLine 2007 6(23)1-19 httpdxdoiorg1011861475-925X-6-23

Manfredi C Pierazzi L Bruscaglioni P Pitch estimation for noise retrieval in time and frequency domain Medical amp Biological Engineering amp Computing 1999 37(2)532

Natarajan K Acharya UR Alias F Tiboleng T Puthusserypady SK Nonlinear analysis of EEG signals at different mental states BioMedical Engineering OnLine 2004 37 httpdxdoiorg1011861475-925X-3-7

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 13

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

OrsquoShaughnessy D Speech communications human and machine 2nd ed New York IEEE Press 2000

Petry A Reconhecimento automaacutetico de locutor utilizando medidas de invariantes dinacircmicas natildeo-lineares [tese] Rio Grande do Sul Universidade Federal do Rio Grande do Sul 2002 155 p

Pincus SM Approximate entropy as a measure of system complexity Proceedings of the National Academy of Sciences 1991 882297-301 httpdxdoiorg101073pnas8862297

Rabiner LR Schafer RW Digital processing of speech signals Upper Saddle River Prentice Hall 1978

Rabiner LR Juang BH Fundamentals of speech recognition Englewood Ciffs New Jersey Prentice Hall 1993

Rodriacuteguez-Saacutenchez A Delgado-Trejos E Orozco-Gutieacuterrez A Castellanos-Domiacutenguez G Nonlinear dynamics techniques for the detection of the brain areas using MER signals International Conference on BioMedical Engineering and Informatics 2008 2198-202 httpdxdoiorg101109BMEI2008330

SantrsquoAna R Coelho R Alcaim A Text-independent speaker recognition based on the hurst parameter and the multidimensional fractional brownian motion model IEEE Transactions on Audio Speech and Language Processing 2006 14(3)931-40 httpdxdoiorg101109TSA2005858054

Savi MA Dinacircmica natildeo-linear e Caos Rio de Janeiro E-papers 2006

Scalassara PR Dajer ME Maciel CD Pereira JC Voice signals characterization through entropy measures In BIOSIGNALS 2008 Proceedings of the International Conference on Bio-inspired Systems and

Signal Processing 2008 Jan 28-31 Madeira Portugal Madeira 2008 v 2 p 163-170

Schreiber T Schmitz A Surrogate time series Physica D 2000 142346-82 httpdxdoiorg101016S0167-2789(00)00043-9

Shannon C A Mathematical theory of communication The Bell System Technical Journal 1948 27(3)623-56

Silva LEV Ferramentas computacionais na anaacutelise da variabilidade da frequecircncia cardiacuteaca atraveacutes do paradigma natildeo extensivo no estudo de cardiopatias [dissertaccedilatildeo] Satildeo Paulo Universidade de Satildeo Paulo 2010 97 p

Takens F Detecting Strange Attractors in Turbulence In Rand DA Young L-S Dynamical systems and turbulence New York Springer-Verlag 1981 v 898 p 366-81

Tavares AHMP Aspectos matemaacuteticos da entropia [dissertaccedilatildeo] Portugal Universidade de Aveiro 2003 98 p

Tokuda I Miyano T Aihara K Surrogate analysis for detecting nonlinear dynamics in normal vowels The Journal of the Acoustical Society of America 2001 110(6)3207-17

Torres ME Gamero LG Rufiner HL Study of complexity in normal and pathological speech signals In EMBC 2003 Proceedings of the 25th Annual International Conference of the IEEE Engineering in Medicine and Biology Society 2003 17-21 Sept Cancun Meacutexico IEEE 2003 p 2339-2342 httpdxdoiorg101109IEMBS20031280385

Tsallis C Possible generalization of Boltzmann-Gibbs statistics Journal of Statistical Physics 1988 52(12)479-87 httpdxdoiorg101007BF01016429

Zhang Y Jiang JJ Acoustic analyses of sustained and running voices from patients with laryngeal pathologies Journal of Voice January 2008 22(1)1-9 httpdxdoiorg101016jjvoice200608003

Autores

Washington Ceacutesar de Almeida Costa Francisco Marcos de Assis Departamento de Engenharia Eleacutetrica ndash DEE Universidade Federal de Campina Grande ndash UFCG Campina Grande PB Brasil

Washington Ceacutesar de Almeida Costa Silvana Luciene do Nascimento Cunha Costa Coordenaccedilatildeo do Curso Superior de Bacharelado em Engenharia Eleacutetrica ndash CCSBEE Instituto Federal de Educaccedilatildeo Ciecircncia e Tecnologia da Paraiacuteba ndash IFPB Av Primeiro de Maio 720 Jaguaribe CEP 58015-430 Joatildeo Pessoa PB Brasil

Benedito Guimaratildees Aguiar Neto Universidade Presbiteriana Mackenzie CEP 01302-907 Satildeo Paulo SP Brasil

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201314

Classificaccedilatildeo de sinais de voz por anaacutelise dinacircmica natildeo linear e anaacutelise LPC

as patologias obteve um aumento consideraacutevel Isto denota que o meacutetodo empregado eacute bastante promissor na tarefa de discriminar entre vozes saudaacuteveis e vozes afetadas por patologias lariacutengeas bem como entre patologias Espera-se que os meacutetodos apresentados nesta pesquisa contribuam ainda mais para a detecccedilatildeo precoce das doenccedilas da laringe auxiliando no seu diagnoacutestico ou para monitorar seu progresso buscando assegurar os cuidados cliacutenicos adequados e mais conforto aos pacientes

ReferecircnciasAlvarez-Ramirez J Echeverria JC Rodriguez E Performance of a high-dimensional RS method for Hurst exponent estimation Physica A Statistical Mechanics and its Applications 2008 387(26)6452-62 httpdxdoiorg101016jphysa200808014

Arias-Londono J Godino-Llorente J Saacuteenz-Lechoacuten N Osma-Ruiz V Castellanos-Dominguez G Automatic detection of pathological voices using complexity measures noise parameters and mel-cepstral coefficients IEEE Transactions on Biomedical Engineering 2011 58(2)370-9 httpdxdoiorg101109TBME20102089052

Boyanov B Ivanov T Hadjitodorov S Chollet G Robust hybrid pitch detector Electronic Letters 1993 29(22)1924-6 httpdxdoiorg101049el19931281

Chakrabarti CG De K Boltzmann-Gibbs entropy axiomatic characterization and application International Journal of Mathematics and Mathematical Sciences 2000 23(4)243-51 httpdxdoiorg101155S0161171200000375

Custoacutedio RF Anaacutelise Natildeo-linear no reconhecimento de padrotildees sonoros Estudo de caso para sons pulmonares [tese] Rio Grande do Sul Universidade Federal do Rio Grande do Sul 1999 119 p

Dajer ME Padrotildees visuais de sinais de voz atraveacutes de teacutecnica de anaacutelise de natildeo-linear [dissertaccedilatildeo] Satildeo Paulo Escola de Engenharia de Satildeo Carlos 2006 154 p

Fantinato PC Segmentaccedilatildeo de voz baseada na anaacutelise fractal e na transformada wavelet [dissertaccedilatildeo] Satildeo Paulo Instituto de Fiacutesica de Satildeo Carlos da Universidade de Satildeo Carlos 2008 123 p

Fiedler-Ferrara N Prado CPC Caos Uma introduccedilatildeo Satildeo Paulo Ed Edgard Blucher Ltda 1994

Fraser AM Swinney HL Independent coordinates for strange attractors from mutual information Physical Review A 1986 331134-40 httpdxdoiorg 101103PhysRevA331134

Godino-Llorente JI Goacutemez-Vilda P Blanco Velasco M Dimensionality reduction of a pathological voice quality assessment system based on gaussian mixture models and short-term cepstral parameters IEEE Transactions on Biomedical Engineering 2006 53(10)1943-53 httpdxdoiorg101109TBME2006871883

Gomes D Fonseca N Agoulmine N Souza JN Neurocomputaccedilatildeo na estimativa do paracircmetro de hurst

In SBRCrsquo2001 Anais do 19 Simpoacutesio Brasileiro de Redes de Computadores 2001 Maio Florianoacutepolis Santa Catarina Florianoacutepolis 2001 p 306-21

Grassberger P Procaccia I Measuring the strangeness of strange attractors Physica D 1983 9189-208 httpdxdoiorg1010160167-2789(83)90298-1

Hegger R Kantz H Schreiber T Practical implementation of nonlinear time series methods the tisean package Chaos 1999 9(2)413-35 httpdxdoiorg1010631166424

Henriacutequez P Alonso JB Ferrer MA Travieso CM Godino-Llorente JI Diacuteaz-De-Maria F Characterization of healthy and pathological voice through measures based on nonlinear dynamics IEEE Transactions on Audio Speech and Language Processing 2009 17(6)1186-95 httpdxdoiorg101109TASL20092016734

Hurst E Long term storage capacity of reservoirs Transactions of the American Society of Civil Engineers 1951 116770-9

Jiang JJ Zhang Y McGilligan C Chaos in voice from modeling to measurement Journal of Voice 2006 20(1)2-17 httpdxdoiorg101016jjvoice200501001

Johnson MT Povinelli RJ Lindgren AC Ye J Liu X Indrebo KM Time-domain isolated phoneme classification using reconstructed phase spaces IEEE Transactions Speech and Audio Processing 2005 13(4)458-66 httpdxdoiorg101109TSA2005848885

Kantz H A Robust Method to Estimate the maximal lyapunov exponent of a time series Physics Letters A 1994 18577-87 httpdxdoiorg1010160375-9601(94)90991-1

Kantz H Schreiber T Nonlinear time series analysis 2nd ed Cambridge University Press 2004

Kay Elemetrics Disordered Voice Database Model 4337 3th ed United Satates 1994

Kokkinos I Maragos P Nonlinear speech analysis using models for chaotic systems IEEE Transactions on Speech and Audio Processing 2005 13(6)1098-109 httpdxdoiorg101109TSA2005852982

Kumar A Mullick SK Nonlinear dynamical analysis of speech Journal Acoustic Society America 1996 100(1)615-29 httpdxdoiorg1011211415886

Little M Biomechanically informed nonlinear speech signal processing [tese] Oxford University of Oxford England 2006 164 p

Little M McSharry P Roberts S Costello D Moroz I Exploiting nonlinear recurrence and fractal scaling properties for voice disorder detection BioMedical Engineering OnLine 2007 6(23)1-19 httpdxdoiorg1011861475-925X-6-23

Manfredi C Pierazzi L Bruscaglioni P Pitch estimation for noise retrieval in time and frequency domain Medical amp Biological Engineering amp Computing 1999 37(2)532

Natarajan K Acharya UR Alias F Tiboleng T Puthusserypady SK Nonlinear analysis of EEG signals at different mental states BioMedical Engineering OnLine 2004 37 httpdxdoiorg1011861475-925X-3-7

Rev Bras Eng Biom v 29 n 1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 2013 13

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

OrsquoShaughnessy D Speech communications human and machine 2nd ed New York IEEE Press 2000

Petry A Reconhecimento automaacutetico de locutor utilizando medidas de invariantes dinacircmicas natildeo-lineares [tese] Rio Grande do Sul Universidade Federal do Rio Grande do Sul 2002 155 p

Pincus SM Approximate entropy as a measure of system complexity Proceedings of the National Academy of Sciences 1991 882297-301 httpdxdoiorg101073pnas8862297

Rabiner LR Schafer RW Digital processing of speech signals Upper Saddle River Prentice Hall 1978

Rabiner LR Juang BH Fundamentals of speech recognition Englewood Ciffs New Jersey Prentice Hall 1993

Rodriacuteguez-Saacutenchez A Delgado-Trejos E Orozco-Gutieacuterrez A Castellanos-Domiacutenguez G Nonlinear dynamics techniques for the detection of the brain areas using MER signals International Conference on BioMedical Engineering and Informatics 2008 2198-202 httpdxdoiorg101109BMEI2008330

SantrsquoAna R Coelho R Alcaim A Text-independent speaker recognition based on the hurst parameter and the multidimensional fractional brownian motion model IEEE Transactions on Audio Speech and Language Processing 2006 14(3)931-40 httpdxdoiorg101109TSA2005858054

Savi MA Dinacircmica natildeo-linear e Caos Rio de Janeiro E-papers 2006

Scalassara PR Dajer ME Maciel CD Pereira JC Voice signals characterization through entropy measures In BIOSIGNALS 2008 Proceedings of the International Conference on Bio-inspired Systems and

Signal Processing 2008 Jan 28-31 Madeira Portugal Madeira 2008 v 2 p 163-170

Schreiber T Schmitz A Surrogate time series Physica D 2000 142346-82 httpdxdoiorg101016S0167-2789(00)00043-9

Shannon C A Mathematical theory of communication The Bell System Technical Journal 1948 27(3)623-56

Silva LEV Ferramentas computacionais na anaacutelise da variabilidade da frequecircncia cardiacuteaca atraveacutes do paradigma natildeo extensivo no estudo de cardiopatias [dissertaccedilatildeo] Satildeo Paulo Universidade de Satildeo Paulo 2010 97 p

Takens F Detecting Strange Attractors in Turbulence In Rand DA Young L-S Dynamical systems and turbulence New York Springer-Verlag 1981 v 898 p 366-81

Tavares AHMP Aspectos matemaacuteticos da entropia [dissertaccedilatildeo] Portugal Universidade de Aveiro 2003 98 p

Tokuda I Miyano T Aihara K Surrogate analysis for detecting nonlinear dynamics in normal vowels The Journal of the Acoustical Society of America 2001 110(6)3207-17

Torres ME Gamero LG Rufiner HL Study of complexity in normal and pathological speech signals In EMBC 2003 Proceedings of the 25th Annual International Conference of the IEEE Engineering in Medicine and Biology Society 2003 17-21 Sept Cancun Meacutexico IEEE 2003 p 2339-2342 httpdxdoiorg101109IEMBS20031280385

Tsallis C Possible generalization of Boltzmann-Gibbs statistics Journal of Statistical Physics 1988 52(12)479-87 httpdxdoiorg101007BF01016429

Zhang Y Jiang JJ Acoustic analyses of sustained and running voices from patients with laryngeal pathologies Journal of Voice January 2008 22(1)1-9 httpdxdoiorg101016jjvoice200608003

Autores

Washington Ceacutesar de Almeida Costa Francisco Marcos de Assis Departamento de Engenharia Eleacutetrica ndash DEE Universidade Federal de Campina Grande ndash UFCG Campina Grande PB Brasil

Washington Ceacutesar de Almeida Costa Silvana Luciene do Nascimento Cunha Costa Coordenaccedilatildeo do Curso Superior de Bacharelado em Engenharia Eleacutetrica ndash CCSBEE Instituto Federal de Educaccedilatildeo Ciecircncia e Tecnologia da Paraiacuteba ndash IFPB Av Primeiro de Maio 720 Jaguaribe CEP 58015-430 Joatildeo Pessoa PB Brasil

Benedito Guimaratildees Aguiar Neto Universidade Presbiteriana Mackenzie CEP 01302-907 Satildeo Paulo SP Brasil

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201314

Costa WCA Costa SLNC Assis FM Aguiar Neto BG

OrsquoShaughnessy D Speech communications human and machine 2nd ed New York IEEE Press 2000

Petry A Reconhecimento automaacutetico de locutor utilizando medidas de invariantes dinacircmicas natildeo-lineares [tese] Rio Grande do Sul Universidade Federal do Rio Grande do Sul 2002 155 p

Pincus SM Approximate entropy as a measure of system complexity Proceedings of the National Academy of Sciences 1991 882297-301 httpdxdoiorg101073pnas8862297

Rabiner LR Schafer RW Digital processing of speech signals Upper Saddle River Prentice Hall 1978

Rabiner LR Juang BH Fundamentals of speech recognition Englewood Ciffs New Jersey Prentice Hall 1993

Rodriacuteguez-Saacutenchez A Delgado-Trejos E Orozco-Gutieacuterrez A Castellanos-Domiacutenguez G Nonlinear dynamics techniques for the detection of the brain areas using MER signals International Conference on BioMedical Engineering and Informatics 2008 2198-202 httpdxdoiorg101109BMEI2008330

SantrsquoAna R Coelho R Alcaim A Text-independent speaker recognition based on the hurst parameter and the multidimensional fractional brownian motion model IEEE Transactions on Audio Speech and Language Processing 2006 14(3)931-40 httpdxdoiorg101109TSA2005858054

Savi MA Dinacircmica natildeo-linear e Caos Rio de Janeiro E-papers 2006

Scalassara PR Dajer ME Maciel CD Pereira JC Voice signals characterization through entropy measures In BIOSIGNALS 2008 Proceedings of the International Conference on Bio-inspired Systems and

Signal Processing 2008 Jan 28-31 Madeira Portugal Madeira 2008 v 2 p 163-170

Schreiber T Schmitz A Surrogate time series Physica D 2000 142346-82 httpdxdoiorg101016S0167-2789(00)00043-9

Shannon C A Mathematical theory of communication The Bell System Technical Journal 1948 27(3)623-56

Silva LEV Ferramentas computacionais na anaacutelise da variabilidade da frequecircncia cardiacuteaca atraveacutes do paradigma natildeo extensivo no estudo de cardiopatias [dissertaccedilatildeo] Satildeo Paulo Universidade de Satildeo Paulo 2010 97 p

Takens F Detecting Strange Attractors in Turbulence In Rand DA Young L-S Dynamical systems and turbulence New York Springer-Verlag 1981 v 898 p 366-81

Tavares AHMP Aspectos matemaacuteticos da entropia [dissertaccedilatildeo] Portugal Universidade de Aveiro 2003 98 p

Tokuda I Miyano T Aihara K Surrogate analysis for detecting nonlinear dynamics in normal vowels The Journal of the Acoustical Society of America 2001 110(6)3207-17

Torres ME Gamero LG Rufiner HL Study of complexity in normal and pathological speech signals In EMBC 2003 Proceedings of the 25th Annual International Conference of the IEEE Engineering in Medicine and Biology Society 2003 17-21 Sept Cancun Meacutexico IEEE 2003 p 2339-2342 httpdxdoiorg101109IEMBS20031280385

Tsallis C Possible generalization of Boltzmann-Gibbs statistics Journal of Statistical Physics 1988 52(12)479-87 httpdxdoiorg101007BF01016429

Zhang Y Jiang JJ Acoustic analyses of sustained and running voices from patients with laryngeal pathologies Journal of Voice January 2008 22(1)1-9 httpdxdoiorg101016jjvoice200608003

Autores

Washington Ceacutesar de Almeida Costa Francisco Marcos de Assis Departamento de Engenharia Eleacutetrica ndash DEE Universidade Federal de Campina Grande ndash UFCG Campina Grande PB Brasil

Washington Ceacutesar de Almeida Costa Silvana Luciene do Nascimento Cunha Costa Coordenaccedilatildeo do Curso Superior de Bacharelado em Engenharia Eleacutetrica ndash CCSBEE Instituto Federal de Educaccedilatildeo Ciecircncia e Tecnologia da Paraiacuteba ndash IFPB Av Primeiro de Maio 720 Jaguaribe CEP 58015-430 Joatildeo Pessoa PB Brasil

Benedito Guimaratildees Aguiar Neto Universidade Presbiteriana Mackenzie CEP 01302-907 Satildeo Paulo SP Brasil

Rev Bras Eng Biom v 29 n1 p 3-14 mar 2013Braz J Biom Eng 29(1) 3-14 Mar 201314