anÁlise de desempenho de um algoritmo de estimaÇÃo de...

ANÁLISE DE DESEMPENHO DE UM ALGORITMO DE

ESTIMAÇÃO DE DIREÇÕES DE CHEGADA DE FONTES

SONORAS VEICULARES

Gracielle Hellene de Amorim Augusto

Projeto de Graduação apresentado ao Curso

de Engenharia Eletrônica e de Computação

da Escola Politécnica, Universidade Federal

do Rio de Janeiro, como parte dos requisitos

necessários à obtenção do título de Enge-

nheira.

Orientadora: Mariane Rembold Petraglia

Co-orientadora: Gabriela Dantas Rocha

Rio de Janeiro Agosto de 2019

UNIVERSIDADE FEDERAL DO RIO DE JANEIRO

Escola Politécnica - Departamento de Eletrônica e de Computação

Centro de Tecnologia, bloco H, sala H-217, Cidade Universitária

Rio de Janeiro - RJ CEP 21949-900

Este exemplar é de propriedade da Universidade Federal do Rio de Janeiro, que

poderá incluí-lo em base de dados, armazenar em computador, microfilmar ou adotar

qualquer forma de arquivamento.

É permitida a menção, reprodução parcial ou integral e a transmissão entre bibli-

otecas deste trabalho, sem modificação de seu texto, em qualquer meio que esteja

ou venha a ser fixado, para pesquisa acadêmica, comentários e citações, desde que

sem finalidade comercial e que seja feita a referência bibliográfica completa.

Os conceitos expressos neste trabalho são de responsabilidade do(s) autor(es).

iv

DEDICATÓRIA

Dedico esse trabalho a minha mãe e a minha avó, que nunca deixaram de acreditar

em mim e que não mediram esforços para me proporcionar as condições necessárias

para a conclusão do meu curso.

v

AGRADECIMENTO

Gostaria de agradecer primeiramente a Deus por me guardar e sustentar durante

essa longa caminhada. Sem Ele eu nada seria.

Agradeço à minha orientadora, Mariane, pela oportunidade dada e por estar sem-

pre à disposição e à Gabriela, por todo apoio, atenção e disponibilidade durante esse

processo.

Agradeço aos meus colegas de faculdade pelos vários dias e noites de estudo em

grupo, pelas boas conversas, almoços no bandejão e a infinidade de materiais de

estudo compartilhados.

Aos meus amigos da vida toda que me provam todos os dias que há amigos mais

chegados que um irmão. Em especial, agradeço às minhas amigas Barbara, por

todos os dias de praia, exercícios físicos e profundas conversas e Marina, por se fazer

presente nas pequenas, mas importantes, coisas do dia-a-dia e por torcer sempre

pelo meu sucesso.

Por fim, agradeço imensamente à minha família. Aos meus pais por investirem

em meus estudos e minha avó Laura por me cobrir em orações e fazer questão de

dar o "dinheirinho da passagem"todo o mês.

Deixo esse último parágrafo de agradecimento dedicado à minha mãe, por todo

o incentivo e dedicação para que eu não tivesse nenhuma preocupação além da

faculdade. Essa graduação é nossa!

vi

RESUMO

A Organização Mundial de Saúde (OMS) considera o ruído urbano um problema

de saúde pública, sendo o seu controle um elemento importante da qualidade de

vida urbana. Para analisar como o ruído afeta os indivíduos da sociedade, faz-se

necessário o uso de mapas acústicos que se mostram ineficientes por não expressarem

a real impressão sonora do ambiente e por serem de difícil compreensão. Uma

alternativa para se avaliar o ruído sonoro é o desenvolvimento de uma ferramenta de

realidade virtual acústica que reproduz o som tridimensional do local de interesse.

Tem-se como objetivo deste trabalho a análise de desempenho do algoritmo de

estimação da direção de chegada a partir das características espectrais dos sinais de

áudio registrados, efetuando-se filtragens dos sinais em diferentes faixas de frequên-

cia, e da variação da distância entre os microfones e entre os microfones e a fonte,

para a escolha de uma melhor configuração adequada para experimentos futuros.

Este trabalho apresenta um sistema composto por um arranjo de microfones que

registra dados de áudio, os quais são enviados para uma etapa de processamento.

Nela, estima-se a direção de chegada unidimensional do sinal baseada na diferença

do tempo de chegada do sinal entre dois sensores. É utilizado o método GCC-

PHAT para o processamento do som, o qual é baseado na função correlação cruzada

generalizada. Uma segunda etapa lida com a multiplicidade das fontes de ruído,

representadas pelos diferentes elementos de um automóvel.

Palavras-Chave: arranjo de sensores, direção de chegada, algoritmo GCC-PHAT,

processamento de sinais, filtragem digital, ruído urbano.

vii

ABSTRACT

The World Health Organization (WHO) considers urban noise a public health

problem, and its control is an important element of urban quality of life. To analyze

how noise affects individuals in society, it is necessary to use acoustic maps that are

inefficient because they do not express the real sound impression of the environment

and are difficult to understand. An alternative for assessing environmental noise

is the development of an acoustic virtual reality tool that reproduces the three-

dimensional sound of the place of interest.

The objective of this work is to analyse the performance of the direction of arrival

estimation algorithm according to the spectral characteristics of the recorded audio

signals, through filtering the signals in different frequency bands, and to the distance

variations between the microphones. and between the microphones and the source,

for choosing a better setup suitable for future experiments.

This work presents a system composed of a microphone array that records audio

data, which is then sent to a processing stage. It estimates the one-dimensional

signal direction of arrival based on the difference in the signal arrival times between

two sensors. The GCC-PHATmethod is used for sound processing, which is based on

the generalized cross correlation function. A second step deals with the multiplicity

of noise sources, represented by the different elements of a car.

Key-words: array processing, direction of arrival, GCC-PHAT algorithm, signal

processing, digital filtering, environmental noise.

viii

SIGLAS

DOA - Direction of Arrival

GCC - Generalized Cross-Correlation

PHAT - Phase Transform

TDD - Time Delay Difference

UFRJ - Universidade Federal do Rio de Janeiro

INMETRO - Instituto Nacional de Metrologia, Qualidade e Tecnologia

ix

Sumário

1 Introdução 1

1.1 Tema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.3 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.4 Metodologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.5 Descrição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2 Teoria de Estimação da Direção de Chegada 5

2.1 Metódo GCC- PHAT . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.2 Separação de Fontes com Deslocamento Paralelo . . . . . . . . . . . . 8

2.3 Curvas teóricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.3.1 Arranjo horizontal . . . . . . . . . . . . . . . . . . . . . . . . 10

2.3.2 Arranjo vertical . . . . . . . . . . . . . . . . . . . . . . . . . . 12

3 Explicação do Experimento 15

4 Resultados 18

4.1 Diferentes filtragens . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

4.1.1 Filtros Passa-baixas . . . . . . . . . . . . . . . . . . . . . . . . 19

4.1.2 Filtros Passa-faixa . . . . . . . . . . . . . . . . . . . . . . . . 19

4.1.3 Filtros Passa-altas . . . . . . . . . . . . . . . . . . . . . . . . 20

4.1.4 Análise das filtragens . . . . . . . . . . . . . . . . . . . . . . . 21

4.2 Variação entre a distância da fonte e os sensores . . . . . . . . . . . . 21

4.3 Variação da distância entre os microfones . . . . . . . . . . . . . . . . 22

4.4 Variação da velocidade do veículo . . . . . . . . . . . . . . . . . . . . 23

x

5 Conclusões 26

Bibliografia 27

xi

Lista de Figuras

2.1 Esquema para localização de fontes sonoras com dois microfones . . . 6

2.2 Curva com deslocamento temporal . . . . . . . . . . . . . . . . . . . 9

2.3 Modelo tridimensional do arranjo horizontal de microfones . . . . . . 11

2.4 Curva teórica do TDD para o arranjo horizontal com uma fonte a 30

km/h . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.5 Modelo tridimensional do arranjo vertical de microfones . . . . . . . . 13

2.6 Curva teórica do TDD para o arranjo vertical com uma fonte a 30km/h 14

2.7 Ângulo azimutal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

3.1 Vista superior do experimento . . . . . . . . . . . . . . . . . . . . . . 15

3.2 Arranjo de microfones . . . . . . . . . . . . . . . . . . . . . . . . . . 16

4.1 GCC-PHAT com sinal sem filtragem . . . . . . . . . . . . . . . . . . 19

4.2 GCC-PHAT com filtros passa-baixas . . . . . . . . . . . . . . . . . . 20

4.3 GCC-PHAT com filtros passa-faixa . . . . . . . . . . . . . . . . . . . 20

4.4 GCC-PHAT com filtros passa-altas . . . . . . . . . . . . . . . . . . . 21

4.5 Resultados comparativo das filtragens . . . . . . . . . . . . . . . . . . 22

4.6 Modelo teórico com variação da distância entre a fonte e o arranjo . . 23

4.7 Resultados para arranjos horizontais . . . . . . . . . . . . . . . . . . 23

4.8 Resultados para arranjos verticais . . . . . . . . . . . . . . . . . . . . 24

4.9 Variação da velocidade do veiculo . . . . . . . . . . . . . . . . . . . . 25

xii

Capítulo 1

Introdução

1.1 Tema

O tema do trabalho desenvolvido é a localização de fontes sonoras a partir da

estimação da direção de chegada, DOA (direction of arrival). Essa estimação é feita

utilizando-se um conjunto de microfones em um arranjo de geometria conhecida,

que capturam os sinais sonoros e, a partir deles, pode-se estimar o posicionamento

das fontes através de alguns dos métodos propostos na literatura. Neste trabalho

foi utilizado o algoritmo baseado na função correlação cruzada generalizada com

transformada de fase (conhecido como GCC-PHAT, Generalized Cross-Correlation

with Phase Transform[1]), devido a sua eficiência computacional e bom desempenho.

O método é aplicado em trechos de sinais sonoros que foram gravados em um

ambiente urbano por um arranjo de microfones. Os sinais de áudio contém sons de

veículos motorizados característicos do trânsito das cidades.

1.2 Motivação

A Organização Mundial da Saúde (OMS) considera o ruído urbano um problema

de saúde pública, sendo um elemento importante na avaliação da qualidade de vida

urbana [2]. Para estudar como o ruído afeta os indivíduos da sociedade, é necessário

se analisar mapas acústicos [3], os quais possuem aspectos técnicos e psicoacústicos

que geralmente não expressam a real impressão sonora do ambiente e são de difícil

1

compreensão para a população e para os responsáveis pela tomada de decisão sobre

possíveis impactos de intervenções urbanas [4].

Para que a sociedade e os órgãos competentes obtenham parâmetros realistas de

avaliação do ruído, faz-se necessário o desenvolvimento de uma ferramenta de reali-

dade virtual acústica que reproduz o som tridimensional ouvido em uma determinada

localidade.

O termo sistema de audibilização é utilizado para explicar o processo de geração

de som tridimensional. Esse processo é desafiador, pois os modelos acústicos devem

envolver toda a complexidade urbana para obter uma resposta realista, incluindo a

caracterização das fontes sonoras para a geração dos sons utilizados na simulação.

A principal fonte de ruído nas cidades são os veículos. Esses possuem diferentes

formas de uso, manutenção e fabricação e, cada uma de suas partes tem sua con-

tribuição no som emitido: o motor, o escapamento, o rolamento e etc. O ruído de

cada componente possui uma característica própria, a qual deve ser observada para

que seja possível se gerar, através de simulação, o som que seria percebido por um

indivíduo.

1.3 Objetivos

Este trabalho tem como objetivo observar o comportamento do método de esti-

mação da direção de chegada de fontes sonoras veiculares ao se aplicar mudanças

nos sinais de áudio de entrada. Deseja-se realizar a análise da influencia das ca-

racterísticas espectrais dos sinais de áudio, registrados com auxílio de microfones, a

partir de filtragens dos sinais capturados em diferentes faixas de frequência. Além

disso, deseja-se avaliar o comportamento do método a partir de variações das dis-

tâncias entre os microfones e a fonte, e entre os dois microfones, e também dos eixos

(horizontal ou vertical) onde se encontram os microfones.

2

1.4 Metodologia

Foram registrados áudios de veículos em movimento no Instituto Nacional de

Metrologia, Qualidade e Tecnologia (INMETRO), no Rio de Janeiro, em uma loca-

lidade pouco ruidosa. Como resultado, o nível do ruído de fundo nos sinais gravados

é pouco relevante quando comparado ao ruído emitido pelos carros, favorecendo a

estimação da DOA das fontes principais.

A partir dos áudios obtidos com um arranjo circular de 11 microfones, encontra-se

uma estimativa para a diferença de atraso ∆t entre os sinais que chegam em dois

desses microfones. Com isso, pode-se encontrar o ângulo φ que corresponde ao posi-

cionamento da fonte. Para a implementação do método foi seguido o procedimento

contido em [5] e modificado em [6].

Com o objetivo de obter um padrão de comparação para a estimativa da direção de

chegada, foi derivada uma curva teórica para cada fonte sonora baseada na geometria

do problema. As medidas de distâncias e velocidades utilizadas no cálculo da curva

teórica foram realizadas no dia e local das gravações dos áudios. Os resultados

obtidos são exibidos em gráficos gerados no MATLAB, sendo feitas comparações

com os valores teóricos calculados.

Como forma de análise foram feitas filtragens utilizando filtros passa-baixas, passa-

faixa e passa-altas, em diferentes faixas de frequências, para saber se há como separar

o ruído de cada parte do veículo. Outra análise realizada levou em consideração a

distância do veículo aos sensores, para avaliar como a imprecisão nesta medida pode

afetar a curva teórica. Por fim, as distâncias entre os dois microfones utilizados fo-

ram variadas, tanto na horizontal como na vertical, para saber a melhor configuração

para uso futuro do sistema.

1.5 Descrição

No Capítulo 2 será apresentada a teoria referente ao algoritmo utilizado para a

estimação da direção de chegada. O Capítulo 3 apresenta uma descrição do sistema

experimental empregado e da metodologia utilizada para realizar a aquisição dos

3

sinais de áudio. Os resultados obtidos com as variações realizadas na implementação

do algoritmo são apresentados no Capítulo 4. Por fim, o Capítulo 5 encerra com as

conclusões do trabalho.

4

Capítulo 2

Teoria de Estimação da Direção de

Chegada

Neste capítulo é abordada uma estratégia para a localização unidimensional de

fontes sonoras. Utilizam-se os sinais obtidos por dois microfones em conjunto com

métodos computacionais para a obtenção da diferença de atraso, TDD (Time Delay

Difference), entre esses sinais.

A partir da Figura 2.1, utilizando um modelo ideal hipotético de propagação

do som em ondas planas, podemos obter a seguinte equação para o ângulo φ, que

correspondente à direção da fonte em relação à linha definida pelos microfones:

φ = arccos(vsτ0

d

)(2.1)

sendo vs a velocidade do som, τ0 a diferença de atraso entre os sinais de dois micro-

fones e d a distância entre os microfones.

A seguir será abordado o método GCC - PHAT que utiliza a função de correlação

cruzada generalizada para fazer a estimativa do TDD.

2.1 Metódo GCC- PHAT

Neste método de correlação cruzada, pode-se estimar a diferença de atraso entre

os sinais dos dois microfones a partir do valor máximo da correlação entre eles. Os

5

Figura 2.1: Esquema para localização de fontes sonoras com dois microfones

sinais nos microfones podem ser modelados, de acordo com a Fig. 2.1, da seguinte

forma:

x1(t) = s(t) + r1(t)

x2(t) = s(t− τ0) + r2(t), (2.2)

sendo s(t) o sinal emitido pela fonte e r1(t) e r2(t) as componentes do ruído.

Para a implementação do algoritmo, faz-se a amostragem do sinal analógico da Eq.

(2.2) em intervalos iguais a T para termos a sua representação em tempo discreto,

ou seja,

x1(nT ) = s(nT ) + r1(nT ),

x2(nT ) = s(T (n− τ0/T )) + r2(nT ). (2.3)

Aplicando-se a Transformada de Fourier à Eq. (2.3), temos:

X1(ejΩ) = S(ejΩ) +R1(ejΩ)

X2(ejΩ) = S(ejΩ)e−jΩτ0T +R2(ejΩ). (2.4)

Pode-se supor que os ruídos r1(nT ) e r2(nT ) possuem média zero e são processos

descorrelacionados. Com isso, o espectro de potência cruzado é dado por

Sx1x2(Ω) = EX1(ejΩ)X∗

2 (ejΩ)

= Sss(Ω)ejΩτ0T , (2.5)

6

com E . sendo o operador média estatística e Sss(Ω) o espectro de potência do

sinal da fonte s(n).

De posse de Sx1x2(Ω), pode-se obter a função correlação cruzada generalizada,

Rx1x2(n):

Rx1x2(n) =1

2π

π∫−π

ψ12(ejΩ)Sx1x2(Ω)ejΩndΩ, (2.6)

onde utiliza-se a função ψ12(ejΩ) como peso.

A função peso é usada para criar um pico dominante na função GCC, facilitando

a procura pelo ponto máximo da correlação cruzada. Para concentrar essa energia

de Rx1x2(n) em uma faixa de tempo estreita, a função peso deve agir como um filtro

branqueador [7], gerando assim um espectro de potência plano. Para isso, uma

função peso apropriada é dada por

ψ12(ejΩ) =1

|Sx1x2(Ω)|, (2.7)

a qual gera o algoritmo denominado GCC-PHAT.

Os processos aleatórios representados pelos sinais dos microfones x1(n) e x2(n)

precisariam ser conhecidos para infinitas realizações ao longo do tempo para calcular

o valor exato da função GCC da Eq. (2.6), o que não é possível na prática. Devido

às limitações de ter apenas uma realização e pela maioria dos processos não serem

estacionários como um todo, o operador valor esperado na Eq. (2.5) é substituído

pela média temporal ao ser utilizada a hipótese de ergodicidade.

Além disso, nos curtos espaços de tempo onde o sinal é considerado estacionário,

utiliza-se a média temporal. Na prática, aplica-se uma janela w(n) do tipo Ham-

ming de comprimento N . Duas janelas em sequência podem ainda apresentar uma

sobreposição de N −M amostras, em que M é a quantidade de avanço, em número

de amostras, entre duas janelas.

Após a aplicação de w(n), calculamos as Transformadas Discretas de Fourier

(DFTs) dos sinais, dadas por:

Xi(m, k) =N−1∑n=0

xi(mM + n)w(n)e−j2πNnk, (2.8)

7

em que i = 1, 2 representam os sinais dos microfones 1 e 2, m = 0, 1, 2, ... o índice

da janela e k = 0, 1, ..., N − 1 o índice da frequência. Utilizando uma ponderação

exponencial de dados passados, temos a estimativa do espectro de potência a partir

do sinal janelado, ou seja,

Sx1x2(m, k) = αSx1x2(m− 1, k) + (1− α)X1(m, k)X∗2 (m, k), (2.9)

com α = 0.7 na implementação utilizada neste trabalho.

Podemos então chegar a uma estimativa para a função GCC-PHAT aplicando-se

a transformada inversa de Fourier (IDFT) à Eq. (2.9):

Rx1x2(m,n) =1

N

N−1∑k=0

Sx1x2(m, k)∣∣∣Sx1x2(m, k)∣∣∣ej 2πN nk, n = 0, 1, ..., N − 1. (2.10)

Por fim, a partir de Rx1x2(m,n) podemos calcular, para cada janela m, o atraso

entre os sinais dos dois microfones pela equação:

τ0m

T≈ n0m = arg max

nRx1x2(m,n). (2.11)

O valor máximo para o atraso é limitado fisicamente pela distância entre os micro-

fones (τ0max = d/vs), não sendo necessário buscar o máximo entre todos os valores

possíveis de n ∈ [0, N − 1]. Para os casos onde o atraso é fracionário, deve-se realizar

uma interpolação de Rx1x2(m,n) antes da aplicação da IDFT. Utiliza-se a técnica

zero padding para implementar essa operação. Ela consiste na inclusão de zeros no

final do sinal fazendo com que a transformada inversa seja feita com mais pontos,

resultando no sinal Rx1x2(m,n) interpolado.

2.2 Separação de Fontes com Deslocamento Para-

lelo

Para a aplicação tratada neste trabalho, é desejável separar as contribuições das

diferentes fontes de ruído e, para isso, foi inserida no algoritmo uma etapa adicional

de processamento, a qual busca diversos valores de pico na função correlação cruzada

generalizada, em vez de um único valor máximo[6]. Essa estratégia serve para tratar

de fontes em movimento paralelo, como pode ser observado na Fig. 2.2.

8

Figura 2.2: Curva com deslocamento temporal

Essa etapa utiliza os valores da função GCC-PHAT como uma imagem e em se-

guida os converte em valores binários. Essa imagem é processada usando operações

morfológicas para eliminar ruído e, em seguida, os pontos com valor lógico alto são

separados em dois vetores, que representam as duas fontes de ruído principais. Duas

curvas são ajustadas aos pontos selecionados, uma para cada vetor. De posse desse

resultado, calcula-se o erro entre as curvas encontradas e os dados reais, sendo elimi-

nados os pontos para os quais o erro excede um valor tolerado. Com a ausência dos

pontos discrepantes, os novos dados são utilizados para ajustar duas novas curvas.

Maiores detalhes sobre o processamento podem ser encontrados em [6].

Na Fig. 2.2, pode-se observar duas curvas com atraso temporal próximo de t = 0, 5

s. Com velocidade constante de 30 km/h chega-se a distância de 2, 5 m, a qual é

compatível com o espaço entre as rodas dianteiras e traseiras dos carros. De posse

desses dados, chega-se à conclusão de que essas curvas deslocadas correspondem a

diferentes fontes de ruído existentes em um mesmo veículo (gerados pelos dois pneus

9

em contato com o solo).

2.3 Curvas teóricas

É possível prever o comportamento da curva que descreve a direção de chegada

do sinal ao conjunto de microfones a partir de medidas das distâncias e velocidades

realizadas durante os experimentos. Calcula-se, assim, a diferença entre o caminho

percorrido pelo sinal da fonte até dois microfones do arranjo, determinando-se em

seguida a diferença de atraso (TDD) e a direção de chegada (DOA).

Foram utilizados dois microfones na mesma linha horizontal e dois na mesma linha

vertical para os testes. As curvas teóricas referentes a esses dois cenários diferentes

são descritas a seguir.

2.3.1 Arranjo horizontal

A partir da Figura 2.3, pode-se determinar a distância l entre a fonte e um dos

microfones do arranjo. Foi considerado que a fonte se encontra no plano z=0 e os

microfones no plano y=0. São conhecidos a altura h entre o chão e o arranjo, a

distância sy entre o plano dos microfones e a reta que contém a trajetória do veículo

e a velocidade v que ele se desloca ao longo do eixo x.x

A velocidade do automóvel é mantida constante e com direção paralela ao eixo

x, ou seja, v = vx . No exemplo é considerado o movimento no sentido positivo de

x, caso contrário, apenas seria invertido o sinal de vx. Diante disto, a componente

horizontal do posicionamento da fonte sx(t) é dada por

sx(t) = vx(t− t0) (2.12)

onde t0 marca o momento em que o veículo cruza o eixo x.

Através das relações trigonométricas a seguir, podemos resolver o problema mos-

trado na Fig. 2.3:

s2(t) = s2y + s2

x(t), (2.13)

l2(t) = h2 + s2(t). (2.14)

10

Figura 2.3: Modelo tridimensional do arranjo horizontal de microfones

Substituindo Eq. (2.13) em Eq. (2.14), obtemos a distância de um sensor qualquer

até o eixo horizontal do arranjo:

l2(t) = h2 + s2y + s2

x(t). (2.15)

Sendo li a distância entre a a fonte e o microfone mi, i=1,2 e sendo a distância

entre m1 e m2 igual a d, temos

l21(t) = h2 + s2y + s2

x(t) (2.16)

l22(t) = h2 + s2y + (sx(t) + d)2 (2.17)

Por fim, a diferença de atraso TDD e a direção de chegada DOA são calculados,

respectivamente, por

τ =l2(t)− l1(t)

vx, (2.18)

φ = arccos

(l2(t)− l1(t)

d

). (2.19)

11

Pode-se observar que, no caso de vx > 0, enquanto t < t0, o valor de sx(t) dado

na Eq. (2.12) é negativo, gerando l1 > l2, segundo as Eqs. (2.16) e (2.17). Isso

nos mostra que, quando a fonte se aproxima dos microfones, tem-se uma diferença

de atraso τ < 0 e, quando a fonte se afasta, tem-se uma diferença de atraso τ > 0.

É possível visualizar essa situação na Fig. 2.4, onde é mostrada a curva teórica da

diferença de atraso entre o sinal de dois microfones para vx = 30 km/h e t0 = 5 s.

Figura 2.4: Curva teórica do TDD para o arranjo horizontal com uma fonte a 30

km/h

2.3.2 Arranjo vertical

Seguindo o mesmo equacionamento utilizado para o arranjo horizontal, pode-se

determinar a distância l entre a fonte e um dos microfones do arranjo como visto na

Fig. 2.5. Utilizando as relações apresentadas nas Eqs. (2.12), (2.13), (2.14) e (2.15),

sendo li a distância entre a fonte e o microfone mi, i=1,2 e d a distância entre m1

e m2, temos:

l21(t) = h2 + s2y + s2

x(t) (2.20)

12

l22(t) = (h+ d)2 + s2y + s2

x(t) (2.21)

Figura 2.5: Modelo tridimensional do arranjo vertical de microfones

Por fim, a diferença de atraso TDD e a direção de chegada DOA, para o arranjo

vertical, são calculados, respectivamente, por

τ =l2(t)− l1(t)

vx, (2.22)

φ = arccos

(l2(t)− l1(t)

d

). (2.23)

Pode-se observar na Fig. 2.6 que o ângulo encontrado quando o veículo passa

em frente aos microfones (t = 5s) é próximo a φ = 60. Esse valor representa o

ângulo da fonte em relação ao arranjo de microfones, como mostrado na Fig. 2.7.

A partir desse ângulo é possível encontrar a altura P da fonte detectada. Dada a

altura do arranjo e a distância do veículo até o plano dos microfones (Fig. 2.6),

calcula-se x = 1, 8/ tan 60 = 1, 04 e então P = 0, 16 m. Ou seja, o arranjo vertical

de microfones detecta a fonte sonora a 16 cm do chão, indicando que a principal

fonte de ruído do veículo deve ser gerada pelo contato entre os pneus e o chão.

13

Figura 2.6: Curva teórica do TDD para o arranjo vertical com uma fonte a 30km/h

Figura 2.7: Ângulo azimutal

14

Capítulo 3

Explicação do Experimento

Neste capítulo será descrito como foram obtidos os parâmetros fornecidos ao algo-

ritmo apresentado no Capítulo 2 para a estimação da direção de chegada de fontes

acústicas.

As medições experimentais foram feitas no Instituto Nacional de Metrologia, Qua-

lidade e Tecnologia (INMETRO), no Rio de Janeiro, em uma localidade pouco rui-

dosa, resultando em ruído ambiente praticamente imperceptível. A configuração do

experimento realizado é ilustrada na Fig. 3.1 e consiste em um conjunto de micro-

fones dispostos em um círculo de 0,25 m de diâmetro, que registram o ruído gerado

por um veículo ao passar em uma via urbana. Esse veículo teve sua velocidade

mantida constante em uma trajetória reta, paralela ao plano de microfones.

Figura 3.1: Vista superior do experimento

15

Dispondo de onze microfones (Fig. 3.2) fixos em um suporte com seu centro

erguido a 1, 20 m do chão, escolheu-se pares de microfones na horizontal e pares de

microfones na vertical para a estimação das direções de chegada. Foram comparados

resultados com microfones diametralmente opostos e com posição mais próxima e

mais afastadas, tanto na vertical quanto na horizontal. Para isso, foram utilizados

os pares (4,10), (6,8), (1,7) e (3,5), indicados na Fig. 3.2.

Figura 3.2: Arranjo de microfones

Os experimentos foram realizados com quatro modelos diferentes de automóveis,

que passaram pelo arranjo de microfones com velocidades constantes iguais a 30, 50,

70 km/h ou com aceleração constante [8]. A distância entre o automóvel e o arranjo

em cada teste foi estimada através da análise do vídeo que continha a passagem

do automóvel e marcações predeterminadas no asfalto. Dessa forma, foi analisada

a influência de diferentes fatores, que foram variados, sobre o ruído gerado pelo

16

automóvel.

A captação foi feita com microfones BSWA MPA416 e um módulo de aquisição

de áudio da National Instruments, cedidos pelo Laboratório de Acústica e Vibra-

ções (Lavi), vinculado ao Programa de Engenharia Mecânica da Coppe/UFRJ, com

frequência de amostragem de Fs = 25600 Hz e o software MATLAB foi utilizado

para o processamento dos sinais.

Por fim, após toda a aquisição de dados, foi feita a filtragem dos sinais com

filtros passa-baixas, passa-faixa e passa-altas, com diferentes faixas de passagem,

com o objetivo de separar os diferentes ruídos gerados pelo veículo e/ou avaliar as

componentes de frequência apropriadas para estimação das DOAs.

17

Capítulo 4

Resultados

São apresentados a seguir os resultados da estimação da direção de chegada obti-

dos através das diferentes filtragens, mudanças nas distâncias entre os microfones e

variação da distância entre a fonte e os sensores.

4.1 Diferentes filtragens

Foram utilizados três tipos de filtragens e duas faixas de frequência para cada um

deles:

1. Passa-baixas de 0 a 500 Hz e de 0 a 1500 Hz;

2. Passa-faixa de 500 a 1500 Hz e de 500 a 3000 Hz;

3. Passa-altas a partir de 500 Hz e a partir de 2000 Hz.

Os sinais dos microfones foram passados por cada um desses seis filtros e em

seguida fornecidos ao algoritmo de estimação da direção de chegada. A partir dessas

simulações pode-se identificar em qual banda há uma melhor separação do ruído de

cada parte do veículo sem comprometer o sinal original.

Para fins de comparação temos na Fig. 4.1 a função correlação cruzada generali-

zada obtida usando o sinal original. Nas próximas seções apresentamos os resultados

obtidos aplicando as filtragens com suas respectivas faixas.

18

Figura 4.1: GCC-PHAT com sinal sem filtragem

4.1.1 Filtros Passa-baixas

Como pode-se observar na Fig. 4.2, o processamento com os filtros passa-baixas

gerou grande perda de informação importante do ruido para as duas frequências de

corte escolhidas. O ruído gerado pelos pneus é uma das principais fontes de ruído do

carro e tem a maior parte da sua energia concentrada entre 700 e 1300 Hz [9, 10], o

que justifica o resultado obtido usando o filtro passa-baixas com frequência de corte

de 500 Hz, onde as curvas geradas pelos sons dos pneus não são visíveis.

4.1.2 Filtros Passa-faixa

Foram utilizadas duas faixas de frequência nos testes com a filtragem passa-faixa:

de 500 a 1500 Hz e de 500 a 3000 Hz. Em ambos os testes pode-se observar uma

maior proximidade do resultado obtido com o do sinal original, sendo que só na

faixa de 500 a 3000 Hz tem-se uma melhor visualização da separação de fontes, o

que demonstra que há uma grande perda de energia do sinal com a filtragem na

19

(a) Até 500 Hz (b) Até 1500 Hz

Figura 4.2: GCC-PHAT com filtros passa-baixas

faixa de 500 a 1500 Hz.

(a) 500 a 1500Hz (b) 500 a 3000Hz

Figura 4.3: GCC-PHAT com filtros passa-faixa

4.1.3 Filtros Passa-altas

Comparando as Figs. 4.4 e 4.1, pode-se observar que o resultado obtido pelo

algoritmo GCC-PHAT usando o sinal filtrado pelo passa-altas ficou muito próximo

do obtido com o sinal original. Ou seja, o resultado nesse caso não apresentou

melhoras relevantes que justifiquem a inclusão do processo de filtragem ao método.

20

(a) A partir de 500 Hz (b) A partir de 2000 Hz

Figura 4.4: GCC-PHAT com filtros passa-altas

4.1.4 Análise das filtragens

A partir da Fig. 4.5, que contém as correlações cruzadas e as curvas teóricas e

estimadas do TDD dos melhores casos para cada tipo de filtragem, pode-se observar

com mais clareza a curva estimada não conseguindo distinguir o sinal no caso do filtro

passa-baixas, como esperado, já que componentes importantes do sinal encontram-se

na faixa de frequências que foi retirada. A partir da análise dos resultados dos filtros

seguintes, pode-se observar que o ruído possui ainda grande parte de sua energia

além da faixa de 3000 Hz, fazendo com que o uso do filtro passa-faixa entre 500 Hz

a 3000 Hz não seja recomendado.

Finalmente, analisando o resultado obtido com o filtro passa-altas a partir de 2000

Hz pode-se perceber que o ruído, apesar de ter seu pico próximo de 1000 Hz, ainda

possui muita informação nessa faixa analisada.

4.2 Variação entre a distância da fonte e os sensores

Através da análise do vídeo de cada teste, foi medida a distância em que o veículo

passou em relação ao arranjo de microfones. Para o cálculo da curva teórica da Eq.

(2.18) foi utilizado o valor padrão de 2,0 m e para a curva estimada foi utilizado o

valor medido.

21

(a) Passa-baixa de 0 a 1500Hz (b) Passa-faixa de 500 a 3000Hz

(c) Passa-alta a partir de 2000Hz (d) Sem filtragem

Figura 4.5: Resultados comparativo das filtragens

Como verificado na Fig. 4.6, as curvas possuem valores muito próximos. Nesse

teste, em específico, o veículo passou a 1,8 m do arranjo, o que explica a pequena

diferença entre elas.

4.3 Variação da distância entre os microfones

Nesse processo buscou-se entender a melhor disposição entre os microfones para

um funcionamento mais eficiente do algoritmo. Foram utilizados os pares de micro-

fones mais afastados (4 e 10) e os mais próximos (6 e 8), na horizontal; na vertical

foram usados os pares (1 e 7) e (3 e 5), conforme pode ser visto na Fig. 3.2.

22

(a) 1,8 m em relação à fonte (b) 2,0 m em relação à fonte

Figura 4.6: Modelo teórico com variação da distância entre a fonte e o arranjo

Analisando a Fig. 4.7 para o arranjo horizontal e a Fig. 4.8 para o arranjo

vertical, pode-se concluir que os microfones mais afastados fornecem curvas mais

bem definidas, sendo portanto a melhor escolha de configuração.

(a) Microfones 4 e 10 (b) Microfones 6 e 8

Figura 4.7: Resultados para arranjos horizontais

4.4 Variação da velocidade do veículo

Nesse processo buscou-se entender como a variação da velocidade influencia na

curva de diferença de atraso. Foram utilizadas as velocidades de 30km/h, 50km/h,

70km/h e aceleração constante, como pode ser visto na Fig.4.9.

23

(a) Microfones 1 e 7 (b) Microfones 3 e 5

Figura 4.8: Resultados para arranjos verticais

Pode-se concluir que velocidades menores geram curvas mais bem definidas e

espaçadas, facilitando a medição.

24

(a) 30km/h (b) 50km/h

(c) 70km/h (d) Aceleração constante

Figura 4.9: Variação da velocidade do veiculo

25

Capítulo 5

Conclusões

Este trabalho buscou, através da implementação de alguns tipos de filtragens e

variações de alguns parâmetros do experimento, analisar quais modificações trariam

mais eficiência para o processo de estimação de direção de chega de fontes sonoras

veiculares.

Ao testar os diferentes tipos de filtragem foi possível concluir que não houve ganho

com a inclusão desse processamento, já que no caso dos filtros passa-baixas e passa-

faixa houve perda de componentes importantes do sinal e com o filtro passa-altas o

resultado ficou muito próximo do obtido com o sinal original.

Dos resultados obtidos com a variação da distância do par de microfones, podemos

concluir que a configuração com microfones mais afastados gerou gráficos mais bem

definidos de correlações cruzadas e, consequentemente, melhores estimativas das

direções de chegada.

Sobre os resultados com a variação entre a distância da fonte e dos microfones,

pode-se concluir que o modelo teórico da curva de diferença de atraso e o modelo

estimado possuem boa correspondência mesmo quando o valor dessa distância é

impreciso.

Por fim, com os resultados da variação da velocidade do veículo pode-se concluir

que velocidades mais baixas geram gráficos mais bem definidos e espaçados que

melhoram a estimativa da direção de chegada.

26

Referências Bibliográficas

[1] KNAPP, C., CARTER, G., “The generalized correlation method for estimation

of time delay”, IEEE transactions on acoustics, speech, and signal processing,

v. 24, n. 4, pp. 320–327, 1976.

[2] ORGANIZATION, W. H., OTHERS, “Burden of disease from environmental

noise: Quantification of healthy life years lost in Europe”. In: Burden of disease

from environmental noise: quantification of healthy life years lost in Europe,

pp. 126–126, 2011.

[3] PINTO, F. A. D. N. C., MARDONES, M. D. M., “Noise mapping of densely

populated neighborhoods: example of Copacabana, Rio de Janeiro, Brazil”,

Environmental monitoring and assessment, v. 155, n. 1-4, pp. 309–318, 2009.

[4] BRAMBILLA, G., GALLO, V., ASDRUBALI, F., et al., “The perceived quality

of soundscape in three urban parks in Rome”, The Journal of the Acoustical

Society of America, v. 134, n. 1, pp. 832–839, 2013.

[5] DOBLINGER, G., Localization and tracking of acoustical sources. Springer,

2006.

[6] ROCHA, G., “Estimação das direções de chegada de fontes sonoras veiculares

usano arranjo de microfones”, Universidade Federal do Rio de Janeiro, , 2018.

[7] HAYES, M. H., Statistical digital signal processing and modeling. John Wiley

& Sons, 2009.

[8] GABRIELA D. ROCHA, FELIPE R. PETRAGLIA, J. C. B. T. M. R. P.,

“Direction of arrival estimation of acoustic vehicular sources”, Electrical Engi-

neering Department, Federal University of Rio de Janeiro, , 2019.

27

[9] SANDBERG, U., “The multi-coincidence peak around 1000 Hz in tyre/road

noise spectra”. In: Euronoise Conference, paper ID, v. 498, Citeseer, 2003.

[10] CLAR-GARCIA, D., VELASCO-SANCHEZ, E., CAMPILLO-DAVO, N.,

et al., “A new methodology to assess sound power level of tyre/road noise un-

der laboratory controlled conditions in drum test facilities”, Applied Acoustics,

v. 110, pp. 23–32, 2016.

28

anÁlise de desempenho de um algoritmo de estimaÇÃo de...

Documents