anÁlise de desempenho de um algoritmo de estimaÇÃo de...
TRANSCRIPT
ANÁLISE DE DESEMPENHO DE UM ALGORITMO DE
ESTIMAÇÃO DE DIREÇÕES DE CHEGADA DE FONTES
SONORAS VEICULARES
Gracielle Hellene de Amorim Augusto
Projeto de Graduação apresentado ao Curso
de Engenharia Eletrônica e de Computação
da Escola Politécnica, Universidade Federal
do Rio de Janeiro, como parte dos requisitos
necessários à obtenção do título de Enge-
nheira.
Orientadora: Mariane Rembold Petraglia
Co-orientadora: Gabriela Dantas Rocha
Rio de Janeiro Agosto de 2019
UNIVERSIDADE FEDERAL DO RIO DE JANEIRO
Escola Politécnica - Departamento de Eletrônica e de Computação
Centro de Tecnologia, bloco H, sala H-217, Cidade Universitária
Rio de Janeiro - RJ CEP 21949-900
Este exemplar é de propriedade da Universidade Federal do Rio de Janeiro, que
poderá incluí-lo em base de dados, armazenar em computador, microfilmar ou adotar
qualquer forma de arquivamento.
É permitida a menção, reprodução parcial ou integral e a transmissão entre bibli-
otecas deste trabalho, sem modificação de seu texto, em qualquer meio que esteja
ou venha a ser fixado, para pesquisa acadêmica, comentários e citações, desde que
sem finalidade comercial e que seja feita a referência bibliográfica completa.
Os conceitos expressos neste trabalho são de responsabilidade do(s) autor(es).
iv
DEDICATÓRIA
Dedico esse trabalho a minha mãe e a minha avó, que nunca deixaram de acreditar
em mim e que não mediram esforços para me proporcionar as condições necessárias
para a conclusão do meu curso.
v
AGRADECIMENTO
Gostaria de agradecer primeiramente a Deus por me guardar e sustentar durante
essa longa caminhada. Sem Ele eu nada seria.
Agradeço à minha orientadora, Mariane, pela oportunidade dada e por estar sem-
pre à disposição e à Gabriela, por todo apoio, atenção e disponibilidade durante esse
processo.
Agradeço aos meus colegas de faculdade pelos vários dias e noites de estudo em
grupo, pelas boas conversas, almoços no bandejão e a infinidade de materiais de
estudo compartilhados.
Aos meus amigos da vida toda que me provam todos os dias que há amigos mais
chegados que um irmão. Em especial, agradeço às minhas amigas Barbara, por
todos os dias de praia, exercícios físicos e profundas conversas e Marina, por se fazer
presente nas pequenas, mas importantes, coisas do dia-a-dia e por torcer sempre
pelo meu sucesso.
Por fim, agradeço imensamente à minha família. Aos meus pais por investirem
em meus estudos e minha avó Laura por me cobrir em orações e fazer questão de
dar o "dinheirinho da passagem"todo o mês.
Deixo esse último parágrafo de agradecimento dedicado à minha mãe, por todo
o incentivo e dedicação para que eu não tivesse nenhuma preocupação além da
faculdade. Essa graduação é nossa!
vi
RESUMO
A Organização Mundial de Saúde (OMS) considera o ruído urbano um problema
de saúde pública, sendo o seu controle um elemento importante da qualidade de
vida urbana. Para analisar como o ruído afeta os indivíduos da sociedade, faz-se
necessário o uso de mapas acústicos que se mostram ineficientes por não expressarem
a real impressão sonora do ambiente e por serem de difícil compreensão. Uma
alternativa para se avaliar o ruído sonoro é o desenvolvimento de uma ferramenta de
realidade virtual acústica que reproduz o som tridimensional do local de interesse.
Tem-se como objetivo deste trabalho a análise de desempenho do algoritmo de
estimação da direção de chegada a partir das características espectrais dos sinais de
áudio registrados, efetuando-se filtragens dos sinais em diferentes faixas de frequên-
cia, e da variação da distância entre os microfones e entre os microfones e a fonte,
para a escolha de uma melhor configuração adequada para experimentos futuros.
Este trabalho apresenta um sistema composto por um arranjo de microfones que
registra dados de áudio, os quais são enviados para uma etapa de processamento.
Nela, estima-se a direção de chegada unidimensional do sinal baseada na diferença
do tempo de chegada do sinal entre dois sensores. É utilizado o método GCC-
PHAT para o processamento do som, o qual é baseado na função correlação cruzada
generalizada. Uma segunda etapa lida com a multiplicidade das fontes de ruído,
representadas pelos diferentes elementos de um automóvel.
Palavras-Chave: arranjo de sensores, direção de chegada, algoritmo GCC-PHAT,
processamento de sinais, filtragem digital, ruído urbano.
vii
ABSTRACT
The World Health Organization (WHO) considers urban noise a public health
problem, and its control is an important element of urban quality of life. To analyze
how noise affects individuals in society, it is necessary to use acoustic maps that are
inefficient because they do not express the real sound impression of the environment
and are difficult to understand. An alternative for assessing environmental noise
is the development of an acoustic virtual reality tool that reproduces the three-
dimensional sound of the place of interest.
The objective of this work is to analyse the performance of the direction of arrival
estimation algorithm according to the spectral characteristics of the recorded audio
signals, through filtering the signals in different frequency bands, and to the distance
variations between the microphones. and between the microphones and the source,
for choosing a better setup suitable for future experiments.
This work presents a system composed of a microphone array that records audio
data, which is then sent to a processing stage. It estimates the one-dimensional
signal direction of arrival based on the difference in the signal arrival times between
two sensors. The GCC-PHATmethod is used for sound processing, which is based on
the generalized cross correlation function. A second step deals with the multiplicity
of noise sources, represented by the different elements of a car.
Key-words: array processing, direction of arrival, GCC-PHAT algorithm, signal
processing, digital filtering, environmental noise.
viii
SIGLAS
DOA - Direction of Arrival
GCC - Generalized Cross-Correlation
PHAT - Phase Transform
TDD - Time Delay Difference
UFRJ - Universidade Federal do Rio de Janeiro
INMETRO - Instituto Nacional de Metrologia, Qualidade e Tecnologia
ix
Sumário
1 Introdução 1
1.1 Tema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.3 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.4 Metodologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.5 Descrição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2 Teoria de Estimação da Direção de Chegada 5
2.1 Metódo GCC- PHAT . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 Separação de Fontes com Deslocamento Paralelo . . . . . . . . . . . . 8
2.3 Curvas teóricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.3.1 Arranjo horizontal . . . . . . . . . . . . . . . . . . . . . . . . 10
2.3.2 Arranjo vertical . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3 Explicação do Experimento 15
4 Resultados 18
4.1 Diferentes filtragens . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
4.1.1 Filtros Passa-baixas . . . . . . . . . . . . . . . . . . . . . . . . 19
4.1.2 Filtros Passa-faixa . . . . . . . . . . . . . . . . . . . . . . . . 19
4.1.3 Filtros Passa-altas . . . . . . . . . . . . . . . . . . . . . . . . 20
4.1.4 Análise das filtragens . . . . . . . . . . . . . . . . . . . . . . . 21
4.2 Variação entre a distância da fonte e os sensores . . . . . . . . . . . . 21
4.3 Variação da distância entre os microfones . . . . . . . . . . . . . . . . 22
4.4 Variação da velocidade do veículo . . . . . . . . . . . . . . . . . . . . 23
x
5 Conclusões 26
Bibliografia 27
xi
Lista de Figuras
2.1 Esquema para localização de fontes sonoras com dois microfones . . . 6
2.2 Curva com deslocamento temporal . . . . . . . . . . . . . . . . . . . 9
2.3 Modelo tridimensional do arranjo horizontal de microfones . . . . . . 11
2.4 Curva teórica do TDD para o arranjo horizontal com uma fonte a 30
km/h . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.5 Modelo tridimensional do arranjo vertical de microfones . . . . . . . . 13
2.6 Curva teórica do TDD para o arranjo vertical com uma fonte a 30km/h 14
2.7 Ângulo azimutal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.1 Vista superior do experimento . . . . . . . . . . . . . . . . . . . . . . 15
3.2 Arranjo de microfones . . . . . . . . . . . . . . . . . . . . . . . . . . 16
4.1 GCC-PHAT com sinal sem filtragem . . . . . . . . . . . . . . . . . . 19
4.2 GCC-PHAT com filtros passa-baixas . . . . . . . . . . . . . . . . . . 20
4.3 GCC-PHAT com filtros passa-faixa . . . . . . . . . . . . . . . . . . . 20
4.4 GCC-PHAT com filtros passa-altas . . . . . . . . . . . . . . . . . . . 21
4.5 Resultados comparativo das filtragens . . . . . . . . . . . . . . . . . . 22
4.6 Modelo teórico com variação da distância entre a fonte e o arranjo . . 23
4.7 Resultados para arranjos horizontais . . . . . . . . . . . . . . . . . . 23
4.8 Resultados para arranjos verticais . . . . . . . . . . . . . . . . . . . . 24
4.9 Variação da velocidade do veiculo . . . . . . . . . . . . . . . . . . . . 25
xii
Capítulo 1
Introdução
1.1 Tema
O tema do trabalho desenvolvido é a localização de fontes sonoras a partir da
estimação da direção de chegada, DOA (direction of arrival). Essa estimação é feita
utilizando-se um conjunto de microfones em um arranjo de geometria conhecida,
que capturam os sinais sonoros e, a partir deles, pode-se estimar o posicionamento
das fontes através de alguns dos métodos propostos na literatura. Neste trabalho
foi utilizado o algoritmo baseado na função correlação cruzada generalizada com
transformada de fase (conhecido como GCC-PHAT, Generalized Cross-Correlation
with Phase Transform[1]), devido a sua eficiência computacional e bom desempenho.
O método é aplicado em trechos de sinais sonoros que foram gravados em um
ambiente urbano por um arranjo de microfones. Os sinais de áudio contém sons de
veículos motorizados característicos do trânsito das cidades.
1.2 Motivação
A Organização Mundial da Saúde (OMS) considera o ruído urbano um problema
de saúde pública, sendo um elemento importante na avaliação da qualidade de vida
urbana [2]. Para estudar como o ruído afeta os indivíduos da sociedade, é necessário
se analisar mapas acústicos [3], os quais possuem aspectos técnicos e psicoacústicos
que geralmente não expressam a real impressão sonora do ambiente e são de difícil
1
compreensão para a população e para os responsáveis pela tomada de decisão sobre
possíveis impactos de intervenções urbanas [4].
Para que a sociedade e os órgãos competentes obtenham parâmetros realistas de
avaliação do ruído, faz-se necessário o desenvolvimento de uma ferramenta de reali-
dade virtual acústica que reproduz o som tridimensional ouvido em uma determinada
localidade.
O termo sistema de audibilização é utilizado para explicar o processo de geração
de som tridimensional. Esse processo é desafiador, pois os modelos acústicos devem
envolver toda a complexidade urbana para obter uma resposta realista, incluindo a
caracterização das fontes sonoras para a geração dos sons utilizados na simulação.
A principal fonte de ruído nas cidades são os veículos. Esses possuem diferentes
formas de uso, manutenção e fabricação e, cada uma de suas partes tem sua con-
tribuição no som emitido: o motor, o escapamento, o rolamento e etc. O ruído de
cada componente possui uma característica própria, a qual deve ser observada para
que seja possível se gerar, através de simulação, o som que seria percebido por um
indivíduo.
1.3 Objetivos
Este trabalho tem como objetivo observar o comportamento do método de esti-
mação da direção de chegada de fontes sonoras veiculares ao se aplicar mudanças
nos sinais de áudio de entrada. Deseja-se realizar a análise da influencia das ca-
racterísticas espectrais dos sinais de áudio, registrados com auxílio de microfones, a
partir de filtragens dos sinais capturados em diferentes faixas de frequência. Além
disso, deseja-se avaliar o comportamento do método a partir de variações das dis-
tâncias entre os microfones e a fonte, e entre os dois microfones, e também dos eixos
(horizontal ou vertical) onde se encontram os microfones.
2
1.4 Metodologia
Foram registrados áudios de veículos em movimento no Instituto Nacional de
Metrologia, Qualidade e Tecnologia (INMETRO), no Rio de Janeiro, em uma loca-
lidade pouco ruidosa. Como resultado, o nível do ruído de fundo nos sinais gravados
é pouco relevante quando comparado ao ruído emitido pelos carros, favorecendo a
estimação da DOA das fontes principais.
A partir dos áudios obtidos com um arranjo circular de 11 microfones, encontra-se
uma estimativa para a diferença de atraso ∆t entre os sinais que chegam em dois
desses microfones. Com isso, pode-se encontrar o ângulo φ que corresponde ao posi-
cionamento da fonte. Para a implementação do método foi seguido o procedimento
contido em [5] e modificado em [6].
Com o objetivo de obter um padrão de comparação para a estimativa da direção de
chegada, foi derivada uma curva teórica para cada fonte sonora baseada na geometria
do problema. As medidas de distâncias e velocidades utilizadas no cálculo da curva
teórica foram realizadas no dia e local das gravações dos áudios. Os resultados
obtidos são exibidos em gráficos gerados no MATLAB, sendo feitas comparações
com os valores teóricos calculados.
Como forma de análise foram feitas filtragens utilizando filtros passa-baixas, passa-
faixa e passa-altas, em diferentes faixas de frequências, para saber se há como separar
o ruído de cada parte do veículo. Outra análise realizada levou em consideração a
distância do veículo aos sensores, para avaliar como a imprecisão nesta medida pode
afetar a curva teórica. Por fim, as distâncias entre os dois microfones utilizados fo-
ram variadas, tanto na horizontal como na vertical, para saber a melhor configuração
para uso futuro do sistema.
1.5 Descrição
No Capítulo 2 será apresentada a teoria referente ao algoritmo utilizado para a
estimação da direção de chegada. O Capítulo 3 apresenta uma descrição do sistema
experimental empregado e da metodologia utilizada para realizar a aquisição dos
3
sinais de áudio. Os resultados obtidos com as variações realizadas na implementação
do algoritmo são apresentados no Capítulo 4. Por fim, o Capítulo 5 encerra com as
conclusões do trabalho.
4
Capítulo 2
Teoria de Estimação da Direção de
Chegada
Neste capítulo é abordada uma estratégia para a localização unidimensional de
fontes sonoras. Utilizam-se os sinais obtidos por dois microfones em conjunto com
métodos computacionais para a obtenção da diferença de atraso, TDD (Time Delay
Difference), entre esses sinais.
A partir da Figura 2.1, utilizando um modelo ideal hipotético de propagação
do som em ondas planas, podemos obter a seguinte equação para o ângulo φ, que
correspondente à direção da fonte em relação à linha definida pelos microfones:
φ = arccos(vsτ0
d
)(2.1)
sendo vs a velocidade do som, τ0 a diferença de atraso entre os sinais de dois micro-
fones e d a distância entre os microfones.
A seguir será abordado o método GCC - PHAT que utiliza a função de correlação
cruzada generalizada para fazer a estimativa do TDD.
2.1 Metódo GCC- PHAT
Neste método de correlação cruzada, pode-se estimar a diferença de atraso entre
os sinais dos dois microfones a partir do valor máximo da correlação entre eles. Os
5
Figura 2.1: Esquema para localização de fontes sonoras com dois microfones
sinais nos microfones podem ser modelados, de acordo com a Fig. 2.1, da seguinte
forma:
x1(t) = s(t) + r1(t)
x2(t) = s(t− τ0) + r2(t), (2.2)
sendo s(t) o sinal emitido pela fonte e r1(t) e r2(t) as componentes do ruído.
Para a implementação do algoritmo, faz-se a amostragem do sinal analógico da Eq.
(2.2) em intervalos iguais a T para termos a sua representação em tempo discreto,
ou seja,
x1(nT ) = s(nT ) + r1(nT ),
x2(nT ) = s(T (n− τ0/T )) + r2(nT ). (2.3)
Aplicando-se a Transformada de Fourier à Eq. (2.3), temos:
X1(ejΩ) = S(ejΩ) +R1(ejΩ)
X2(ejΩ) = S(ejΩ)e−jΩτ0T +R2(ejΩ). (2.4)
Pode-se supor que os ruídos r1(nT ) e r2(nT ) possuem média zero e são processos
descorrelacionados. Com isso, o espectro de potência cruzado é dado por
Sx1x2(Ω) = EX1(ejΩ)X∗
2 (ejΩ)
= Sss(Ω)ejΩτ0T , (2.5)
6
com E . sendo o operador média estatística e Sss(Ω) o espectro de potência do
sinal da fonte s(n).
De posse de Sx1x2(Ω), pode-se obter a função correlação cruzada generalizada,
Rx1x2(n):
Rx1x2(n) =1
2π
π∫−π
ψ12(ejΩ)Sx1x2(Ω)ejΩndΩ, (2.6)
onde utiliza-se a função ψ12(ejΩ) como peso.
A função peso é usada para criar um pico dominante na função GCC, facilitando
a procura pelo ponto máximo da correlação cruzada. Para concentrar essa energia
de Rx1x2(n) em uma faixa de tempo estreita, a função peso deve agir como um filtro
branqueador [7], gerando assim um espectro de potência plano. Para isso, uma
função peso apropriada é dada por
ψ12(ejΩ) =1
|Sx1x2(Ω)|, (2.7)
a qual gera o algoritmo denominado GCC-PHAT.
Os processos aleatórios representados pelos sinais dos microfones x1(n) e x2(n)
precisariam ser conhecidos para infinitas realizações ao longo do tempo para calcular
o valor exato da função GCC da Eq. (2.6), o que não é possível na prática. Devido
às limitações de ter apenas uma realização e pela maioria dos processos não serem
estacionários como um todo, o operador valor esperado na Eq. (2.5) é substituído
pela média temporal ao ser utilizada a hipótese de ergodicidade.
Além disso, nos curtos espaços de tempo onde o sinal é considerado estacionário,
utiliza-se a média temporal. Na prática, aplica-se uma janela w(n) do tipo Ham-
ming de comprimento N . Duas janelas em sequência podem ainda apresentar uma
sobreposição de N −M amostras, em que M é a quantidade de avanço, em número
de amostras, entre duas janelas.
Após a aplicação de w(n), calculamos as Transformadas Discretas de Fourier
(DFTs) dos sinais, dadas por:
Xi(m, k) =N−1∑n=0
xi(mM + n)w(n)e−j2πNnk, (2.8)
7
em que i = 1, 2 representam os sinais dos microfones 1 e 2, m = 0, 1, 2, ... o índice
da janela e k = 0, 1, ..., N − 1 o índice da frequência. Utilizando uma ponderação
exponencial de dados passados, temos a estimativa do espectro de potência a partir
do sinal janelado, ou seja,
Sx1x2(m, k) = αSx1x2(m− 1, k) + (1− α)X1(m, k)X∗2 (m, k), (2.9)
com α = 0.7 na implementação utilizada neste trabalho.
Podemos então chegar a uma estimativa para a função GCC-PHAT aplicando-se
a transformada inversa de Fourier (IDFT) à Eq. (2.9):
Rx1x2(m,n) =1
N
N−1∑k=0
Sx1x2(m, k)∣∣∣Sx1x2(m, k)∣∣∣ej 2πN nk, n = 0, 1, ..., N − 1. (2.10)
Por fim, a partir de Rx1x2(m,n) podemos calcular, para cada janela m, o atraso
entre os sinais dos dois microfones pela equação:
τ0m
T≈ n0m = arg max
nRx1x2(m,n). (2.11)
O valor máximo para o atraso é limitado fisicamente pela distância entre os micro-
fones (τ0max = d/vs), não sendo necessário buscar o máximo entre todos os valores
possíveis de n ∈ [0, N − 1]. Para os casos onde o atraso é fracionário, deve-se realizar
uma interpolação de Rx1x2(m,n) antes da aplicação da IDFT. Utiliza-se a técnica
zero padding para implementar essa operação. Ela consiste na inclusão de zeros no
final do sinal fazendo com que a transformada inversa seja feita com mais pontos,
resultando no sinal Rx1x2(m,n) interpolado.
2.2 Separação de Fontes com Deslocamento Para-
lelo
Para a aplicação tratada neste trabalho, é desejável separar as contribuições das
diferentes fontes de ruído e, para isso, foi inserida no algoritmo uma etapa adicional
de processamento, a qual busca diversos valores de pico na função correlação cruzada
generalizada, em vez de um único valor máximo[6]. Essa estratégia serve para tratar
de fontes em movimento paralelo, como pode ser observado na Fig. 2.2.
8
Figura 2.2: Curva com deslocamento temporal
Essa etapa utiliza os valores da função GCC-PHAT como uma imagem e em se-
guida os converte em valores binários. Essa imagem é processada usando operações
morfológicas para eliminar ruído e, em seguida, os pontos com valor lógico alto são
separados em dois vetores, que representam as duas fontes de ruído principais. Duas
curvas são ajustadas aos pontos selecionados, uma para cada vetor. De posse desse
resultado, calcula-se o erro entre as curvas encontradas e os dados reais, sendo elimi-
nados os pontos para os quais o erro excede um valor tolerado. Com a ausência dos
pontos discrepantes, os novos dados são utilizados para ajustar duas novas curvas.
Maiores detalhes sobre o processamento podem ser encontrados em [6].
Na Fig. 2.2, pode-se observar duas curvas com atraso temporal próximo de t = 0, 5
s. Com velocidade constante de 30 km/h chega-se a distância de 2, 5 m, a qual é
compatível com o espaço entre as rodas dianteiras e traseiras dos carros. De posse
desses dados, chega-se à conclusão de que essas curvas deslocadas correspondem a
diferentes fontes de ruído existentes em um mesmo veículo (gerados pelos dois pneus
9
em contato com o solo).
2.3 Curvas teóricas
É possível prever o comportamento da curva que descreve a direção de chegada
do sinal ao conjunto de microfones a partir de medidas das distâncias e velocidades
realizadas durante os experimentos. Calcula-se, assim, a diferença entre o caminho
percorrido pelo sinal da fonte até dois microfones do arranjo, determinando-se em
seguida a diferença de atraso (TDD) e a direção de chegada (DOA).
Foram utilizados dois microfones na mesma linha horizontal e dois na mesma linha
vertical para os testes. As curvas teóricas referentes a esses dois cenários diferentes
são descritas a seguir.
2.3.1 Arranjo horizontal
A partir da Figura 2.3, pode-se determinar a distância l entre a fonte e um dos
microfones do arranjo. Foi considerado que a fonte se encontra no plano z=0 e os
microfones no plano y=0. São conhecidos a altura h entre o chão e o arranjo, a
distância sy entre o plano dos microfones e a reta que contém a trajetória do veículo
e a velocidade v que ele se desloca ao longo do eixo x.x
A velocidade do automóvel é mantida constante e com direção paralela ao eixo
x, ou seja, v = vx . No exemplo é considerado o movimento no sentido positivo de
x, caso contrário, apenas seria invertido o sinal de vx. Diante disto, a componente
horizontal do posicionamento da fonte sx(t) é dada por
sx(t) = vx(t− t0) (2.12)
onde t0 marca o momento em que o veículo cruza o eixo x.
Através das relações trigonométricas a seguir, podemos resolver o problema mos-
trado na Fig. 2.3:
s2(t) = s2y + s2
x(t), (2.13)
l2(t) = h2 + s2(t). (2.14)
10
Figura 2.3: Modelo tridimensional do arranjo horizontal de microfones
Substituindo Eq. (2.13) em Eq. (2.14), obtemos a distância de um sensor qualquer
até o eixo horizontal do arranjo:
l2(t) = h2 + s2y + s2
x(t). (2.15)
Sendo li a distância entre a a fonte e o microfone mi, i=1,2 e sendo a distância
entre m1 e m2 igual a d, temos
l21(t) = h2 + s2y + s2
x(t) (2.16)
l22(t) = h2 + s2y + (sx(t) + d)2 (2.17)
Por fim, a diferença de atraso TDD e a direção de chegada DOA são calculados,
respectivamente, por
τ =l2(t)− l1(t)
vx, (2.18)
φ = arccos
(l2(t)− l1(t)
d
). (2.19)
11
Pode-se observar que, no caso de vx > 0, enquanto t < t0, o valor de sx(t) dado
na Eq. (2.12) é negativo, gerando l1 > l2, segundo as Eqs. (2.16) e (2.17). Isso
nos mostra que, quando a fonte se aproxima dos microfones, tem-se uma diferença
de atraso τ < 0 e, quando a fonte se afasta, tem-se uma diferença de atraso τ > 0.
É possível visualizar essa situação na Fig. 2.4, onde é mostrada a curva teórica da
diferença de atraso entre o sinal de dois microfones para vx = 30 km/h e t0 = 5 s.
Figura 2.4: Curva teórica do TDD para o arranjo horizontal com uma fonte a 30
km/h
2.3.2 Arranjo vertical
Seguindo o mesmo equacionamento utilizado para o arranjo horizontal, pode-se
determinar a distância l entre a fonte e um dos microfones do arranjo como visto na
Fig. 2.5. Utilizando as relações apresentadas nas Eqs. (2.12), (2.13), (2.14) e (2.15),
sendo li a distância entre a fonte e o microfone mi, i=1,2 e d a distância entre m1
e m2, temos:
l21(t) = h2 + s2y + s2
x(t) (2.20)
12
l22(t) = (h+ d)2 + s2y + s2
x(t) (2.21)
Figura 2.5: Modelo tridimensional do arranjo vertical de microfones
Por fim, a diferença de atraso TDD e a direção de chegada DOA, para o arranjo
vertical, são calculados, respectivamente, por
τ =l2(t)− l1(t)
vx, (2.22)
φ = arccos
(l2(t)− l1(t)
d
). (2.23)
Pode-se observar na Fig. 2.6 que o ângulo encontrado quando o veículo passa
em frente aos microfones (t = 5s) é próximo a φ = 60. Esse valor representa o
ângulo da fonte em relação ao arranjo de microfones, como mostrado na Fig. 2.7.
A partir desse ângulo é possível encontrar a altura P da fonte detectada. Dada a
altura do arranjo e a distância do veículo até o plano dos microfones (Fig. 2.6),
calcula-se x = 1, 8/ tan 60 = 1, 04 e então P = 0, 16 m. Ou seja, o arranjo vertical
de microfones detecta a fonte sonora a 16 cm do chão, indicando que a principal
fonte de ruído do veículo deve ser gerada pelo contato entre os pneus e o chão.
13
Figura 2.6: Curva teórica do TDD para o arranjo vertical com uma fonte a 30km/h
Figura 2.7: Ângulo azimutal
14
Capítulo 3
Explicação do Experimento
Neste capítulo será descrito como foram obtidos os parâmetros fornecidos ao algo-
ritmo apresentado no Capítulo 2 para a estimação da direção de chegada de fontes
acústicas.
As medições experimentais foram feitas no Instituto Nacional de Metrologia, Qua-
lidade e Tecnologia (INMETRO), no Rio de Janeiro, em uma localidade pouco rui-
dosa, resultando em ruído ambiente praticamente imperceptível. A configuração do
experimento realizado é ilustrada na Fig. 3.1 e consiste em um conjunto de micro-
fones dispostos em um círculo de 0,25 m de diâmetro, que registram o ruído gerado
por um veículo ao passar em uma via urbana. Esse veículo teve sua velocidade
mantida constante em uma trajetória reta, paralela ao plano de microfones.
Figura 3.1: Vista superior do experimento
15
Dispondo de onze microfones (Fig. 3.2) fixos em um suporte com seu centro
erguido a 1, 20 m do chão, escolheu-se pares de microfones na horizontal e pares de
microfones na vertical para a estimação das direções de chegada. Foram comparados
resultados com microfones diametralmente opostos e com posição mais próxima e
mais afastadas, tanto na vertical quanto na horizontal. Para isso, foram utilizados
os pares (4,10), (6,8), (1,7) e (3,5), indicados na Fig. 3.2.
Figura 3.2: Arranjo de microfones
Os experimentos foram realizados com quatro modelos diferentes de automóveis,
que passaram pelo arranjo de microfones com velocidades constantes iguais a 30, 50,
70 km/h ou com aceleração constante [8]. A distância entre o automóvel e o arranjo
em cada teste foi estimada através da análise do vídeo que continha a passagem
do automóvel e marcações predeterminadas no asfalto. Dessa forma, foi analisada
a influência de diferentes fatores, que foram variados, sobre o ruído gerado pelo
16
automóvel.
A captação foi feita com microfones BSWA MPA416 e um módulo de aquisição
de áudio da National Instruments, cedidos pelo Laboratório de Acústica e Vibra-
ções (Lavi), vinculado ao Programa de Engenharia Mecânica da Coppe/UFRJ, com
frequência de amostragem de Fs = 25600 Hz e o software MATLAB foi utilizado
para o processamento dos sinais.
Por fim, após toda a aquisição de dados, foi feita a filtragem dos sinais com
filtros passa-baixas, passa-faixa e passa-altas, com diferentes faixas de passagem,
com o objetivo de separar os diferentes ruídos gerados pelo veículo e/ou avaliar as
componentes de frequência apropriadas para estimação das DOAs.
17
Capítulo 4
Resultados
São apresentados a seguir os resultados da estimação da direção de chegada obti-
dos através das diferentes filtragens, mudanças nas distâncias entre os microfones e
variação da distância entre a fonte e os sensores.
4.1 Diferentes filtragens
Foram utilizados três tipos de filtragens e duas faixas de frequência para cada um
deles:
1. Passa-baixas de 0 a 500 Hz e de 0 a 1500 Hz;
2. Passa-faixa de 500 a 1500 Hz e de 500 a 3000 Hz;
3. Passa-altas a partir de 500 Hz e a partir de 2000 Hz.
Os sinais dos microfones foram passados por cada um desses seis filtros e em
seguida fornecidos ao algoritmo de estimação da direção de chegada. A partir dessas
simulações pode-se identificar em qual banda há uma melhor separação do ruído de
cada parte do veículo sem comprometer o sinal original.
Para fins de comparação temos na Fig. 4.1 a função correlação cruzada generali-
zada obtida usando o sinal original. Nas próximas seções apresentamos os resultados
obtidos aplicando as filtragens com suas respectivas faixas.
18
Figura 4.1: GCC-PHAT com sinal sem filtragem
4.1.1 Filtros Passa-baixas
Como pode-se observar na Fig. 4.2, o processamento com os filtros passa-baixas
gerou grande perda de informação importante do ruido para as duas frequências de
corte escolhidas. O ruído gerado pelos pneus é uma das principais fontes de ruído do
carro e tem a maior parte da sua energia concentrada entre 700 e 1300 Hz [9, 10], o
que justifica o resultado obtido usando o filtro passa-baixas com frequência de corte
de 500 Hz, onde as curvas geradas pelos sons dos pneus não são visíveis.
4.1.2 Filtros Passa-faixa
Foram utilizadas duas faixas de frequência nos testes com a filtragem passa-faixa:
de 500 a 1500 Hz e de 500 a 3000 Hz. Em ambos os testes pode-se observar uma
maior proximidade do resultado obtido com o do sinal original, sendo que só na
faixa de 500 a 3000 Hz tem-se uma melhor visualização da separação de fontes, o
que demonstra que há uma grande perda de energia do sinal com a filtragem na
19
(a) Até 500 Hz (b) Até 1500 Hz
Figura 4.2: GCC-PHAT com filtros passa-baixas
faixa de 500 a 1500 Hz.
(a) 500 a 1500Hz (b) 500 a 3000Hz
Figura 4.3: GCC-PHAT com filtros passa-faixa
4.1.3 Filtros Passa-altas
Comparando as Figs. 4.4 e 4.1, pode-se observar que o resultado obtido pelo
algoritmo GCC-PHAT usando o sinal filtrado pelo passa-altas ficou muito próximo
do obtido com o sinal original. Ou seja, o resultado nesse caso não apresentou
melhoras relevantes que justifiquem a inclusão do processo de filtragem ao método.
20
(a) A partir de 500 Hz (b) A partir de 2000 Hz
Figura 4.4: GCC-PHAT com filtros passa-altas
4.1.4 Análise das filtragens
A partir da Fig. 4.5, que contém as correlações cruzadas e as curvas teóricas e
estimadas do TDD dos melhores casos para cada tipo de filtragem, pode-se observar
com mais clareza a curva estimada não conseguindo distinguir o sinal no caso do filtro
passa-baixas, como esperado, já que componentes importantes do sinal encontram-se
na faixa de frequências que foi retirada. A partir da análise dos resultados dos filtros
seguintes, pode-se observar que o ruído possui ainda grande parte de sua energia
além da faixa de 3000 Hz, fazendo com que o uso do filtro passa-faixa entre 500 Hz
a 3000 Hz não seja recomendado.
Finalmente, analisando o resultado obtido com o filtro passa-altas a partir de 2000
Hz pode-se perceber que o ruído, apesar de ter seu pico próximo de 1000 Hz, ainda
possui muita informação nessa faixa analisada.
4.2 Variação entre a distância da fonte e os sensores
Através da análise do vídeo de cada teste, foi medida a distância em que o veículo
passou em relação ao arranjo de microfones. Para o cálculo da curva teórica da Eq.
(2.18) foi utilizado o valor padrão de 2,0 m e para a curva estimada foi utilizado o
valor medido.
21
(a) Passa-baixa de 0 a 1500Hz (b) Passa-faixa de 500 a 3000Hz
(c) Passa-alta a partir de 2000Hz (d) Sem filtragem
Figura 4.5: Resultados comparativo das filtragens
Como verificado na Fig. 4.6, as curvas possuem valores muito próximos. Nesse
teste, em específico, o veículo passou a 1,8 m do arranjo, o que explica a pequena
diferença entre elas.
4.3 Variação da distância entre os microfones
Nesse processo buscou-se entender a melhor disposição entre os microfones para
um funcionamento mais eficiente do algoritmo. Foram utilizados os pares de micro-
fones mais afastados (4 e 10) e os mais próximos (6 e 8), na horizontal; na vertical
foram usados os pares (1 e 7) e (3 e 5), conforme pode ser visto na Fig. 3.2.
22
(a) 1,8 m em relação à fonte (b) 2,0 m em relação à fonte
Figura 4.6: Modelo teórico com variação da distância entre a fonte e o arranjo
Analisando a Fig. 4.7 para o arranjo horizontal e a Fig. 4.8 para o arranjo
vertical, pode-se concluir que os microfones mais afastados fornecem curvas mais
bem definidas, sendo portanto a melhor escolha de configuração.
(a) Microfones 4 e 10 (b) Microfones 6 e 8
Figura 4.7: Resultados para arranjos horizontais
4.4 Variação da velocidade do veículo
Nesse processo buscou-se entender como a variação da velocidade influencia na
curva de diferença de atraso. Foram utilizadas as velocidades de 30km/h, 50km/h,
70km/h e aceleração constante, como pode ser visto na Fig.4.9.
23
(a) Microfones 1 e 7 (b) Microfones 3 e 5
Figura 4.8: Resultados para arranjos verticais
Pode-se concluir que velocidades menores geram curvas mais bem definidas e
espaçadas, facilitando a medição.
24
(a) 30km/h (b) 50km/h
(c) 70km/h (d) Aceleração constante
Figura 4.9: Variação da velocidade do veiculo
25
Capítulo 5
Conclusões
Este trabalho buscou, através da implementação de alguns tipos de filtragens e
variações de alguns parâmetros do experimento, analisar quais modificações trariam
mais eficiência para o processo de estimação de direção de chega de fontes sonoras
veiculares.
Ao testar os diferentes tipos de filtragem foi possível concluir que não houve ganho
com a inclusão desse processamento, já que no caso dos filtros passa-baixas e passa-
faixa houve perda de componentes importantes do sinal e com o filtro passa-altas o
resultado ficou muito próximo do obtido com o sinal original.
Dos resultados obtidos com a variação da distância do par de microfones, podemos
concluir que a configuração com microfones mais afastados gerou gráficos mais bem
definidos de correlações cruzadas e, consequentemente, melhores estimativas das
direções de chegada.
Sobre os resultados com a variação entre a distância da fonte e dos microfones,
pode-se concluir que o modelo teórico da curva de diferença de atraso e o modelo
estimado possuem boa correspondência mesmo quando o valor dessa distância é
impreciso.
Por fim, com os resultados da variação da velocidade do veículo pode-se concluir
que velocidades mais baixas geram gráficos mais bem definidos e espaçados que
melhoram a estimativa da direção de chegada.
26
Referências Bibliográficas
[1] KNAPP, C., CARTER, G., “The generalized correlation method for estimation
of time delay”, IEEE transactions on acoustics, speech, and signal processing,
v. 24, n. 4, pp. 320–327, 1976.
[2] ORGANIZATION, W. H., OTHERS, “Burden of disease from environmental
noise: Quantification of healthy life years lost in Europe”. In: Burden of disease
from environmental noise: quantification of healthy life years lost in Europe,
pp. 126–126, 2011.
[3] PINTO, F. A. D. N. C., MARDONES, M. D. M., “Noise mapping of densely
populated neighborhoods: example of Copacabana, Rio de Janeiro, Brazil”,
Environmental monitoring and assessment, v. 155, n. 1-4, pp. 309–318, 2009.
[4] BRAMBILLA, G., GALLO, V., ASDRUBALI, F., et al., “The perceived quality
of soundscape in three urban parks in Rome”, The Journal of the Acoustical
Society of America, v. 134, n. 1, pp. 832–839, 2013.
[5] DOBLINGER, G., Localization and tracking of acoustical sources. Springer,
2006.
[6] ROCHA, G., “Estimação das direções de chegada de fontes sonoras veiculares
usano arranjo de microfones”, Universidade Federal do Rio de Janeiro, , 2018.
[7] HAYES, M. H., Statistical digital signal processing and modeling. John Wiley
& Sons, 2009.
[8] GABRIELA D. ROCHA, FELIPE R. PETRAGLIA, J. C. B. T. M. R. P.,
“Direction of arrival estimation of acoustic vehicular sources”, Electrical Engi-
neering Department, Federal University of Rio de Janeiro, , 2019.
27
[9] SANDBERG, U., “The multi-coincidence peak around 1000 Hz in tyre/road
noise spectra”. In: Euronoise Conference, paper ID, v. 498, Citeseer, 2003.
[10] CLAR-GARCIA, D., VELASCO-SANCHEZ, E., CAMPILLO-DAVO, N.,
et al., “A new methodology to assess sound power level of tyre/road noise un-
der laboratory controlled conditions in drum test facilities”, Applied Acoustics,
v. 110, pp. 23–32, 2016.
28