3 estimação espectral - puc-rio

3 Estimação espectral

A essência do problema de estimação espectral pode ser resumida pela

seguinte frase: “A partir de uma gravação finita de uma seqüência de dados

estacionários, estimar como a potência total está distribuída no domínio da

freqüência” [16].

Dentre as diversas aplicações da estimação espectral nos mais variados

campos das ciências (Economia, Meteorologia, Astronomia, Sismologia,

Medicina, etc), destaca-se para o contexto deste trabalho a aplicação para sistemas

de radar e sonar, de determinação da direção das fontes, recentemente estendida

para aplicações com arranjos de antenas em sistemas rádio-móveis.

Há duas macro abordagens para o problema da análise espectral. Uma delas

tem por idéia básica aplicar um filtro passa-banda de faixa estreita ao sinal

estudado, varrendo toda a faixa de freqüências de interesse. A potência de saída

do filtro dividida pela largura de faixa do filtro é usada como uma medida do

conteúdo espectral do sinal original. Este procedimento corresponde

essencialmente ao que os chamados métodos “clássicos” (ou “não-paramétricos”)

de análise espectral fazem. A outra abordagem, conhecida como “paramétrica”,

postula um modelo para os dados, o que provê uma forma de parametrizar o

espectro, conseqüentemente reduzindo o problema a se estimar os parâmetros para

o modelo assumido.

Os métodos paramétricos podem oferecer estimativas espectrais mais

precisas que os não-paramétricos nos casos onde os dados de fato satisfazem o

modelo assumido. Entretanto, no caso mais provável em que os dados não

satisfaçam aos modelos assumidos, os métodos clássicos podem atuar melhor que

os paramétricos devido à sensibilidade destes últimos a desvios do sinal realista

com relação ao modelo. Tal observação tem motivado um interesse renovado na

abordagem não-paramétrica para estimação espectral.

Este capítulo apresenta resumidamente os principais fundamentos da teoria

de estimação espectral, em particular no que se refere a sinais aleatórios, que

DBD

PUC-Rio - Certificação Digital Nº 0016247/CA

3 Estimação espectral 45

representam melhor o comportamento dos sinais na prática. Inicialmente a

densidade espectral de potência, função essencial para a análise espectral, é

apresentada. Em seguida, os métodos clássicos e os paramétricos são discutidos,

sendo que para estes últimos apenas os que produzem estimativas de espectro de

linha são abordados, pois esta é a situação de interesse para a tese. Por fim, os

princípios previamente apresentados são adaptados para a aplicação específica de

interesse, que é a estimação do espectro espacial.

3.1. Densidade espectral de potência de um sinal aleatório

Seja uma seqüência de variáveis aleatórias {y(t); t = 0, ±1, ±2,...}

representando um sinal discreto no tempo. Duas hipóteses sobre o sinal são

assumidas para definir-se sua densidade espectral de potência (PSD – Power

Spectral Density):

- média zero, ou seja, E{y(t)} = 0 para todo t;

- covariância r(k) = E{y(t) y*(t – k)} dependente apenas do retardo k

entre as duas amostras tomadas.

Em outras palavras, assume-se que {y(t)} é uma seqüência estacionária no

sentido amplo. Outra definição importante é a de matriz covariância de {y(t)},

dada por:

(3.1)

( ) ( ) ( ) ( )( ) ( ) ( )

( ) ( ) ( ) ( )

−−

−−−

=

0121

2011210

***

*

rrmrmr

mrrrmrmrrr

L

MOOOM

MOOOM

OO

L

R

A PSD pode ser definida como a transformada de Fourier discreta no tempo

(DTFT – Discrete-Time Fourier Transform) da covariância, ou seja:

(3.2) ( ) ( )∑∞

∞==

−=k

kiekr ϖωφ

Uma segunda definição de PSD é dada por:

DBD



( )

∑=

−

∞→

2

1

1limN

t

ti

Nety

NE ω (3.3)

que é equivalente à definição anterior de PSD quando a seqüência covariância

{r(k)} decai suficientemente rápido, de modo que:

( )∑−=∞→

=N

NkNkrk

N01lim (3.4)

Observa-se que a PSD é periódica com período igual a 2π. Com isso, a

freqüência angular ω ∈ [-π, π], ou alternativamente a freqüência f =ω/2π ∈ [-½,

½]. A associação com a freqüência original do sinal contínuo associado (F) é dada

por: F = f ⋅ FS, onde FS é a freqüência de amostragem, que segundo o critério de

Nyquist deve ser ≥ 2 ⋅ F0 (componente frequencial mais alta do espectro contínuo

original) para evitar o efeito de aliasing.

Dadas as definições de PSD, pode-se formalizar um pouco mais a definição

do problema de estimação espectral dada no início do capítulo para: “A partir de

um conjunto finito de amostras {y(1), ..., y(N)} de um processo estacionário no

sentido amplo, determinar uma estimativa φ de sua PSD φ ,para ω ∈ [-π,

π]. A grande limitação da qualidade da estimativa está associada normalmente ao

pequeno número N de amostras disponíveis para o processamento. Em diversas

aplicações, como o custo de se obter grandes seqüências de dados é muito grande,

N é feito pequeno.

( )ωˆ ( )ω

3.2. Métodos não-paramétricos

Os métodos não-paramétricos se baseiam inteiramente nas definições da

PSD das eqs. (3.2) e (3.3) para prover estimativas espectrais. Tais métodos se

constituem nas formas clássicas de estimativa espectral.

Inicialmente serão apresentados dois estimadores, o “periodograma” e o

“correlograma”, derivados das eqs. (3.3) e (3.2) respectivamente. Pode-se provar

que tais métodos são equivalentes sob circunstâncias relaxadas. Tais métodos

provêm alta resolução para larguras dos dados longas o suficiente, mas considera-

DBD



se que eles são estimadores pobres, pois sua variância é alta e não decresce com

um maior número de amostras dos dados.

A variância elevada do periodograma e do correlograma motivaram o

desenvolvimento de métodos modificados que apresentam menor variância, às

custas de uma menor resolução. Dada a relativa equivalência de suas propriedades

e de seus desempenhos, apenas alguns deles serão detalhados neste texto.

3.2.1. Periodograma e correlograma

O periodograma se baseia na definição da PSD dada pela eq. (3.3), e sua

fórmula é dada por:

( ) ( )2

1

1ˆ ∑=

−=N

t

tip ety

Nωωφ (3.5)

O correlograma, por sua vez, baseia-se na definição da eq. (3.2) da PSD,

com formulação dada por:

(3.6) ( ) ( )( )∑−

−−=

−=1

1

ˆˆN

Nk

kic ekr ωωφ

A covariância (ou autocovariância) r(k) pode ser estimada de duas formas

distintas:

( ) ( ) ( ) 0,11

* ≥−−

= ∑+=

kktytykN

krN

kt

) (3.7)

( ) ( ) ( ) 0,11

* ≥−= ∑+=

kktytyN

krN

kt

) (3.8)

A estimativa de r(k) dada pela eq. (3.7) é dita “não-polarizada”, e a da eq.

(3.8) é “polarizada”. Pode-se provar que a versão polarizada do correlograma

coincide com a definição de periodograma.

Prova-se ainda que ambas estimativas são assintoticamente não-polarizadas,

mas apresentam variância alta, mesmo para um número de amostras N elevado.

DBD



Esta variância alta é a responsável pelo desempenho considerado pobre do

periodograma e do correlograma como estimadores.

A análise da polarização (bias – valor esperado) do periodograma leva

naturalmente ao surgimento de um termo na equação associada que pode ser

interpretado como um filtro ou uma janela triangular. Esta janela é ainda

conhecida como janela de Bartlett. No domínio espectral, a janela triangular

(ilustrada na Figura 2) é equacionada por:

( ) ( )( )

2

221

=

ωω

ωsen

NsenN

WB (3.9)

Figura 2 Janela de Bartlett (triangular).

Observa-se a presença marcante de um lobo principal, e diversos lóbulos

laterais. O efeito mais marcante do lobo principal é o de espalhar o espectro

(smearing). A Figura 3 ilustra este efeito, que acaba por limitar a resolução da

estimativa. Para a janela de Bartlett, este limite é aproximadamente 1/N.

Figura 3 Efeito de suavização ou espalhamento (smearing) causado pela largura do lobo

principal da janela.

DBD



O efeito principal dos lóbulos laterais é a transferência de potência das

bandas que concentram a maior parte do sinal para bandas que contém menos ou

nenhuma potência. Tal efeito é chamado de “vazamento” espectral (spectral

leakage), e está ilustrado na Figura 4.

Figura 4 Efeito de “vazamento” espectral (spectral leakage) causado pela presença dos

lóbulos laterais da janela.

3.2.2. Métodos baseados no periodograma

Considerando-se a diminuição da variância uma forma de melhoria da

estimativa espectral, ainda que ao preço da redução da resolução, existem diversos

procedimentos baseados nas estimativas básicas do periodograma ou do

correlograma. Dentre eles, dois se destacam: Blackman-Tukey (janelamento e

suavização); e Bartlett (média).

Uma das possibilidades de se melhorar a estimativa espectral é aplicando

uma janela à função de covariância estimada. Este método, conhecido como

procedimento de Blackman-Tukey, resulta numa suavização da estimativa

espectral pela convolução desta com a janela (exemplificada na Figura 5), e a

estimativa toma a forma:

(3.10) ( ) ( ) ( )( )∑−

−−=

−=1

1

ˆˆM

Mk

kiBT ekrkw ωωφ

DBD



Figura 5 Janela utilizada no procedimento de Blackman-Tukey.

A eficiência deste procedimento depende do projeto da janela. Quanto maior

a largura M da janela, menor a polarização da estimativa, porém maior a

variância. E a escolha do formato da janela estabelece um compromisso entre

espalhamento (resolução) e vazamento espectral.

O procedimento de Bartlett também reduz a variância do periodograma. Já

que as propriedades estatísticas do periodograma não melhoram com larguras

maiores dos dados, Bartlett sugeriu uma forma mais eficiente de usar um

segmento longo de dados específico: partindo este segmento em pedaços menores

e tomando a média dos periodogramas resultantes, como ilustrado na Figura 6. A

estimativa Bartlett é calculada como:

( ) ( )∑=

=L

jjB L 1

ˆ1ˆ ωφωφ (3.11)

A estimativa de Bartlett na verdade pode ser interpretada como similar à de

Blackman-Tukey com janela retangular. Esta estimativa apresenta alta resolução,

mas com grande vazamento espectral e variância também relativamente grande.

Figura 6 Procedimento de Bartlett: segmentação dos dados e média dos sub-blocos

resultantes.

DBD



3.3. Métodos paramétricos para espectros de linha

Para os métodos não-paramétricos apresentados anteriormente, nenhuma

hipótese a respeito do sinal estudado precisou ser estabelecida, à exceção da

estacionaridade. Os métodos “paramétricos” ou “baseados em modelagem”

assumem que o sinal satisfaz a um modelo gerador com forma funcional

conhecida, e então o processo continua estimando-se os parâmetros para o modelo

assumido, como ilustrado na Figura 7. Nos casos em que o modelo assumido é

uma boa aproximação da realidade, é de se esperar que os métodos paramétricos

gerem estimativas espectrais melhores que as técnicas não-paramétricas. Deve-se

lembrar sempre, entretanto, que esta última abordagem permanece útil para as

aplicações onde há pouca ou nenhuma informação sobre o sinal em questão.

Figura 7 Diagrama de blocos ilustrando o processo de estimativa espectral paramétrica.

Ao se estudar os métodos paramétricos, costuma-se distinguir entre os

voltados para espectros “racionais” ou para os espectros “de linha”. Para o

primeiro, o espectro é modelado como uma função racional de e-iω, como na

equação a seguir:

( )∑∑

≤−

≤−

=nk

kik

mkki

k

e

eω

ω

ρ

γωφ (3.12)

O teorema de Weierstrass (do Cálculo) postula que qualquer PSD contínua

pode ser aproximada por uma PSD racional na forma acima, com a condição que

os índices m e n sejam escolhidos “grandes o suficiente”. Isto na verdade

representa um dos problemas: a escolha dos índices não é uma tarefa simples.

Mais ainda: nem sempre a PSD é contínua.

DBD



A PSD racional pode ser fatorada como a seguir:

( ) ( )( )

( )( ) m

m

nn

zbzbzB

zazazA

AB

−−

−−

+++=

+++=

=

L

L1

1

11

22

1

1

σωω

ωφ

(3.13)

onde σ2 é um escalar positivo. A PSD racional pode ser associada com um sinal

obtido à saída de um filtro cuja função de transferência é B(ω)/A(ω), alimentado

em sua entrada por um sinal de ruído branco com potência igual a σ2. Ou seja, o

problema da estimação espectral é reduzido para um problema de modelagem de

sinal. Um sinal que apresente m e n ≠ 0 é chamado de “auto-regressivo de média

móvel” (ARMA – Auto-Regressive Moving Average). Quando m = 0 o sinal é dito

“auto-regressivo” (AR – Auto-Regressive) e quando n = 0 o sinal é dito “de média

móvel” (MA – Moving Average).

Quando o sinal pode ser descrito essencialmente por um modelo senoidal,

como na eq. (3.14), o espectro pode ser tomado como de linha ao invés de

racional. Este é o caso dos sinais encontrados em diversas aplicações, inclusive na

de sondagem de AOA e TOA em sistemas rádio-móveis.

(3.14) ( ) ( ) ( )

( ) ( ) (∑∑=

+

=

==

=+=n

k

tik

n

kk

kketxtx

ttetxty

11

,2,1

φωα

K

)

No modelo acima, x(t) representa o sinal senoidal complexo sem ruído;

{αk}, {ωk}, e {φk} são respectivamente suas amplitudes, freqüências (angulares) e

fases iniciais; e(t) é um ruído aditivo. Embora na prática a maioria dos sinais

encontrados seja real, em aplicações de comunicações é sempre possível

transmitir-se componentes em fase e em quadratura, a partir das quais reconstrói-

se a envoltória complexa do sinal.

O ruído {e(t)} é usualmente assumido como branco circular. Tal hipótese,

embora nem sempre corresponda à realidade, também não pode ser considerada

DBD



restritiva. Em particular, se a forma do espectro de ruído é conhecida, é possível

aplicar um filtro para tornar o ruído branco.

Quando o ruído não é branco e possui forma espectral desconhecida, ainda

assim é possível se obter estimativas espectrais precisas através do método não-

linear por mínimos quadrados (NLS – Nonlinear Least Squares). As propriedades

das estimativas NLS quando o ruído é colorido ou de forma desconhecida são bem

parecidas com as encontradas para o caso de ruído branco, apenas com as

amplitudes dos sinais senoidais “ajustadas” para as correspondentes relações

sinal-ruído locais (em cada freqüência ωk). Outros métodos, entretanto, como os

baseados em sub-espaço, dependem fortemente da hipótese que o ruído seja

branco.

Algumas hipóteses adicionais ainda são necessárias para prosseguir com a

estimativa da PSD espectral discreta (de linha). As amplitudes αk > 0 e as

freqüências ωk ∈ [-π, π]. As fases iniciais são consideradas como variáveis

aleatórias independentes de distribuição uniforme sobre [-π, π]. Com estas

hipóteses, é possível calcular a covariância r(k) do sinal y(t), e aplicando uma

DTFT a ela, obtém-se a PSD φ(ω), cujas equações seguem abaixo.

(3.15) ( ) ( ) ( ){ } 0,2

12*

kn

p

kip

pektytyEkr δσα ω +=−= ∑ =

(3.16) ( ) ( ) 2

1

22 σωωδαπωφ −= ∑=

n

ppp +

Nas eqs. (3.15 - 3.16) acima, δ(ω - ωp) é a função delta de Dirac. Um

exemplo de PSD conforme o equacionamento acima está ilustrado na Figura 8.

Fica óbvio o porquê do espectro ser chamado de linha ou discreto.

Figura 8 Exemplo de espectro de linha: sinal com 3 componentes harmônicas

contaminado por ruído branco.

DBD



A discussão prévia evidencia que a análise espectral baseada no modelo

paramétrico de PSD da eq. (3.16) reduz o problema a estimar os parâmetros do

sinal y(t) da eq. (3.14). Na maioria das aplicações, incluindo a aplicação foco

deste texto, os parâmetros de maior interesse são as localizações das linhas

espectrais, ou seja, as freqüências senoidais ωk. O foco passa a ser então o de

estimação frequencial, ou seja, determinar {ωk}k=1..n a partir de um conjunto de

observações {y(t)}t=1..N. Uma vez tendo sido determinadas as freqüências, a

estimação dos demais parâmetros se torna um simples problema de regressão

linear. Mais precisamente, para um conjunto dado {ωk} as observações y(t) podem

ser descritas como uma função de regressão linear cujos coeficientes são iguais

aos remanescentes desconhecidos { }ki

kke βα φ ≡ , como na eq. (3.17).

) (3.17) ()(1

teetyn

k

tik

k +=∑=

ωβ

Uma forma de se obter {βk}, se desejado, é através de um método por

mínimos quadrados (LS – Least Squares). Alternativamente, as potências {αk2} -

para um dado conjunto {ωk} - podem ser determinadas a partir da versão amostral

da eq. (3.15), dada por:

(3.18) ( ) resíduosekrn

p

kip

p += ∑=1

2ˆ ωα

onde os resíduos surgem pela limitação do número de amostras coletadas (finito).

A eq. (3.18) também representa um problema de regressão linear, com os

coeficientes desconhecidos dados por {αp2}.

Alguns dos principais métodos paramétricos descritos a seguir são

conhecidos como “métodos de alta-resolução”. Tal denominação se deve a sua

habilidade em resolver componentes discretas espectrais separadas em freqüência

(f = ω/2π) por menos que 1/N ciclos por intervalo amostral, que é o limite para os

métodos clássicos. Entretanto, deve-se destacar que a comparação entre os

métodos de alta-resolução e os clássicos chega a ser injusta partindo-se do

princípio que estes últimos nada assumem quanto aos dados analisados, enquanto

DBD



que os de alta-resolução exploram uma descrição exata do sinal estudado. Devido

à essa informação adicional assumida, é esperado que um método paramétrico

ofereça melhor resolução que um não-paramétrico. Por outro lado, quando não há

componentes espectrais com separação menor que o limite 1/N, o periodograma

convencional é um bom estimador espectral, podendo apresentar desempenho

equivalente ao dos métodos de alta-resolução. Em particular, o periodograma

convencional foi evidenciado, pois ele é o estimador não-paramétrico de melhor

resolução, já que ele pode ser entendido como um estimador de Blackman-Tuckey

com janela retangular, que é a janela que permite a maior resolução.

Assume-se, na descrição dos métodos a seguir, que o número de

componentes senoidais n é conhecido. Na prática, entretanto, determinar este

número corresponde a mais um problema de estimação a partir dos dados

disponíveis.

3.3.1. Método não-linear por mínimos quadrados

Uma abordagem intuitiva para a análise espectral, baseada no modelo de

regressão não-linear da eq. (3.14), consiste em determinar os parâmetros

desconhecidos como aqueles que minimizam a seguinte função:

( ) ( ) ( )2

1 1,, ∑ ∑

= =

+−=N

t

n

k

tik

kketyF ϕωαϕαω (3.19)

onde ω é o vetor que contém as freqüências ωk, e analogamente para α e ϕ. O

modelo senoidal determinado acima apresenta a menor distância (quadrática) para

os dados observados . Uma vez que a função F acima é não-linear com

relação a seus argumentos {ω, α, ϕ}, o método que obtém estimativas destes

parâmetros, segundo a minimização acima, é chamado não linear por mínimos

quadrados (NLS – Nonlinear Least Squares). E quando o ruído e(t) é gaussiano e

branco, a minimização acima pode ser interpretada ainda como o método de

máxima verossimilhança (ML – Maximum Likelihood). Neste caso, pode-se

provar que a estimativa dada pela minimização previamente citada produz os

valores mais prováveis para “explicar” a seqüência de dados observada.

( ){ }Ntty 1=

DBD



O critério na eq. (3.19) depende tanto de {αk}, quanto de {ϕk}, bem como

de {ωk}. Entretanto, ele pode ser “concentrado com relação aos parâmetros de

perturbação” {αk, ϕk}, conforme explicado a seguir. Utilizando a notação:

(3.20) kikk e ϕαβ =

(3.21) [ Tnβββ L1= ]

]

)

]

(3.22) ( ) ( )[ TNyyY L1=

(3.23)

=n

n

iNiN

ii

ee

eeB

ωω

ωω

L

MM

L

1

1

a função F da eq. (3.19) pode ser reescrita como:

(3.24) ( ) ( ββ BYBYF −−= *

A matriz de Vandermonde1 B na eq. (3.23) apresenta posto de coluna

completo igual a n sob a condição que N ≥ n; neste caso, (B*B)-1 existe. A função

F pode ser então reescrita de forma mais conveniente como a seguir:

( )[ ] [ ] ( )[ ] ( ) YBBBBYYYYBBBBBYBBBF *1****1***

*1* −−−−+−−= ββ (3.24)

Para qualquer escolha de ω em B (que seja tal que

para k ≠ p), pode-se escolher B para tornar o gradiente de F em (3.24)

igual a um vetor nulo. Com isso, os vetores β e ω que minimizam F são:

[ Tnωω ,,1 K=

pk ωω ≠

1 Uma matriz A ∈ Cmxn é dita de Vandermonde se apresenta a seguinte estrutura:

, onde zk ∈ C e são normalmente assumidos distintos.

=

−− 111

1

11

mn

m

n

zz

zzA

L

MM

L

DBD



( ) ωωβ ˆ*1*ˆ

=

−= YBBB (3.25)

(3.26) ( ) YBBBBY *1**maxargˆ −=

ωω

A estimativa de ω converge à medida que N → ∞ (ela é dita “consistente”),

e pode-se provar que, quando o ruído é gaussiano e branco, a matriz covariância

dos erros tende assintoticamente para a matriz limitante de Cramér-Rao. Ou seja,

o método proporciona uma estimativa de excelente precisão.

Outra vantagem associada ao método NLS, particularmente quando

comparado aos métodos sub-espaciais apresentados a seguir, é que o método não

depende criticamente da hipótese de ruído branco. Mesmo quando o ruído não é

branco, a estimativa NLS ainda permanece consistente. E mesmo quando o ruído

é colorido, prova-se que a estimativa NLS permanece como o método mais

preciso.

A grande desvantagem do método NLS se deve à forma multimodal

complicada, com um máximo global para a eq. (3.26) muito agudo. Ou seja,

encontrar ω com um algoritmo de busca requer uma inicialização muito precisa.

E apesar de se encontrar na literatura diversos métodos de inicialização, nenhum

efetivamente pode garantir convergência para o máximo global.

ˆ

3.3.2. Método de Pisarenko e MUSIC

Os métodos de Pisarenko [17] e MUSIC (MUltiple SIgnal Classification –

classificação de sinais múltiplos) [18] são derivados do chamado “modelo de

matriz covariância”. Para descrever este modelo, sejam as seguintes matrizes:

(3.27) ( ) ( )[ ]( ) ( )[ ] ( )nmaaA

eea

n

Tmii

×== −−−

ωωω ωω

K

K

1

11

onde m (número de amostras) é um inteiro positivo. A matriz A é uma matriz de

Vandermonde, que goza da seguinte propriedade quanto a seu posto:

posto(A) = n (para m ≥ n) (3.28)

DBD



Dada a notação acima, e tomando o sinal y(t) da eq. (3.14), têm-se:

(3.29) ( )

( )( )

( )

( ) ( )tetxA

mty

tyty

ty ~~

1

1~ +=

+−

−=∆

M

(3.30) ( ) ( ) ( )[ ]( ) ( ) ( )[ ]T

Tn

mtetete

txtxtx

1~

~1

+−=

=

K

K

A matriz covariância do vetor da eq. (3.29) é dada por: )(~ ty

(3.31) ( ) ( ){ } IAPAtytyER 2**~~ σ+==∆

onde a matriz P é dada por:

(3.32) ( ) ( ){ }

==2

21

*

0

0~~

n

txtxEPα

αO

As equações acima constituem o modelo de matriz covariância dos dados

analisados. A autoestrutura de R contém informação completa sobre as

freqüências {ωk}, daí a utilidade da eq. (3.31).

Conforme previamente mencionado, os métodos de Pisarenko e MUSIC são

derivados do modelo acima descrito, com m > n. Sejam λ1 ≥ λ2 ≥ ... ≥ λm os

autovalores de R na eq. (3.31), arrumados em ordem decrescente. Sejam {s1, ...,

sn} os autovetores ortonormais associados com {λ1, ..., λn}, e seja ainda {g1, ...,

gm-n} um conjunto de autovetores ortonormais correspondentes a {λn+1, ..., λm}.

Como o posto de APA* é igual a n, esta matriz apresenta n autovalores

estritamente positivos, e os (m – n) restantes são todos nulos. Combinando esta

observação com o fato que λ , onde são os

autovalores de APA

( )mkkk ,,1~ 2 K=+= σλ { }m

kk 1~

=λ* (arrumados em ordem decrescente), chega-se ao seguinte

resultado:

DBD



(3.33)

+==

=>

mnkpara

nkpara

k

k

,,1

,,12

2

K

K

σλ

σλ

O conjunto de autovalores de R pode ser então dividido em dois sub-

conjuntos. Os autovetores associados com cada um destes subconjuntos possuem

propriedades interessantes que são utilizadas para a estimação frequencial. Sejam

as matrizes:

[ ] ( )[ ] (( nmmggG

nmssS

nm

n

−×=

×=

−K

K

1

1

)) (3.34)

compostas pela justaposição dos autovetores dos dois subconjuntos em questão. A

matriz covariância R da eq. (3.31) pode ser escrita em função de seus autovalores

como: { }mkk 1=λ

(3.35) [ ]

=

*

*1

GS

GSR

mλ

λO

Das eqs. (3.31) e (3.33) tem-se:

(3.36)

==+=

+

m

n

GGGGAPARGλ

λσσ

0

0122* O

Ou seja, na equação acima, percebe-se que APA*G é nula. Mais ainda, como

AP tem posto completo, na verdade quem se anula é o termo A*G. Em outras

palavras, as colunas {gk} de G pertencem ao subespaço nulo de A*. Como o posto

de A é igual a n, a dimensão do subespaço nulo de A* é igual a (m – n) que

também é a dimensão do subespaço de G. Com isso, pode-se afirmar que o

subespaço de G é igual ao subespaço nulo de A*, ou seja, que os vetores {gk}

geram ambos os subespaços. Analogamente, prova-se que o subespaço de S é

DBD



igual ao subespaço de A. Os subespaços de S e de G são usualmente chamados de

“subespaço de sinal” e “subespaço de ruído”, respectivamente.

Da discussão prévia, chega-se à conclusão chave que os valores originais de

freqüência { } são as únicas soluções da equação: nkk 1=ω

(3.37) ( ) ( ) nmqualquerparaaGGa >= 0** ωω

O algoritmo MUSIC utiliza o resultado chave acima para calcular

estimativas frequenciais, de acordo com o seguinte roteiro. Inicialmente, calcula-

se a matriz covariância amostral:

∑=

=N

mt

tytyN

R )(~)(~1ˆ * (3.38)

e sua autodecomposição. Analogamente, sejam e G as matrizes

correspondentes a S e G respectivamente, mas construídas a partir dos autovetores

e { de . O segundo passo é determinar as estimativas

frequenciais como as localizações dos n picos mais altos da função:

S ˆ

{ }nss ˆ,,ˆ1 K } Rnmgg −ˆ,,ˆ1 K

( ) ( )

[ ππωωω

,,ˆˆ1

**−∈

aGGa] (3.39)

que é chamada algumas vezes de “pseudo-espectro”, já que ele indica a presença

das componentes senoidais no sinal estudado, mas não é uma PSD verdadeira. Por

causa desta característica, este procedimento é conhecido como “MUSIC

espectral”.

Para m = n + 1 (valor mínimo possível), o algoritmo MUSIC se reduz ao

chamado método de Pisarenko, que foi a primeira proposta de estimação

frequencial sub-espacial. Computacionalmente, este método é a versão mais

simples possível do MUSIC, com o benefício adicional de não haver a

necessidade de separar os autovalores de sinal dos de ruído (é simplesmente o

menor valor). Entretanto, a precisão do MUSIC cresce significativamente com m,

DBD



e, portanto, o preço pago pela simplicidade computacional do método de

Pisarenko pode ser uma precisão estatística relativamente pobre.

3.3.3. ESPRIT

Sejam:

(3.40) [ ] nmAIA m ×−= − )1(011

(3.41) [ ] nmAIA m ×−= − )1(0 12

onde A é definida como na eq. (3.27), Im-1 é a matriz identidade de dimensão (m-

1)×(m-1) e as matrizes [ ] e são (m-1)×m. É facilmente

verificável que:

01−mI [ 10 −mI ]

]]

(3.42) DAA 12 =

onde a matriz D é dada por:

(3.43)

=−

−

ni

i

e

eD

ω

ω

0

01

O

Uma vez que D é uma matriz unitária2 a transformação na eq. (3.42) é uma

rotação. O método ESPRIT (Estimation of Signal Parameters by Rotational

Invariance Techniques – estimação de parâmetros de sinal por técnicas de

invariância rotacional) [19] baseia-se na transformação expressa na eq. (3.42)

como detalhado a seguir. A exemplo das eqs. (3.40) e (3.41), sejam:

(3.44) [ SIS m 011 −=

(3.45) [ SIS m 12 0 −=

2 Dada uma matriz quadrada A, a matriz composta pela justaposição de vetores coluna que

são os autovetores de A é dita “unitária”.

DBD



onde S é definida como na eq. (3.34). Ainda se referindo à descrição do MUSIC,

como o subespaço de S e A são os mesmos, tem-se que:

(3.46) ACS =

onde C é a matriz não-singular n×n (uma vez que tanto S quanto A têm posto de

coluna completo) dada por:

(3.47) 1* −Λ= SPAC

com a matriz Λ definida por:

(3.48)

−

−=Λ

2

21

0

0

σλ

σλ

n

O

Utilizando as eqs. (3.40) a (3.42) e (3.46) pode-se escrever:

(3.49) Φ==== −1

11122 SDCCSDCACAS

onde

(3.50) DCC 1−=Φ

Devido à estrutura de Vandermonde de A, as matrizes A1 e A2 apresentam

posto de coluna completo (igual a n). Com a eq. (3.46) em vista, S1 e S2 também

devem apresentar posto de coluna completo. Com isso, da eq. (3.49) a matriz Φ é

dada exclusivamente por:

(3.51) ( ) 2*1

11

*1 SSSS −

=Φ

DBD



A fórmula acima expressa Φ como uma função de algumas grandezas que

podem ser estimadas a partir das amostras disponíveis. A importância de se poder

estimar Φ reside no fato de que Φ e D apresentam os mesmos autovalores. A eq.

(3.50) é dita uma “transformação de similaridade” entre Φ e D.

Do exposto, o método ESPRIT estima as freqüências { } como

, onde { } são os autovalores da seguinte estimativa da matriz Φ:

nkk 1=ω

( kνarg− ) nkk 1ˆ=ν

(3.52) ( ) 2*1

11

*1

ˆ SSSS −=Φ

Deve-se ressaltar que a estimativa de Φ dada pela equação acima é obtida

implicitamente pela solução do seguinte sistema linear de equações:

(3.53) 21ˆˆˆ SS ≅Φ

por um método LS. Na prática, foi constatado empiricamente que uma maior

precisão pode ser obtida se a eq. (3.53) for resolvida por um método LS “total” (o

erro quadrático é tomado separadamente nos dois lados da equação).

A precisão estatística do ESPRIT é similar à dos demais métodos sub-

espaciais. Na verdade, na maioria dos casos o ESPRIT pode produzir estimativas

um pouco mais precisas que os demais métodos, a um custo computacional

similar. Mais ainda, no ESPRIT não há o problema da separação das “raízes”

(autovalores) de sinal das “raízes” de ruído, como observado na eq. (3.52). Em

função destes pontos positivos, o ESPRIT é usualmente o método recomendado

como a primeira escolha em aplicações de estimação frequencial.

3.4. Métodos espaciais

O problema de localizar n fontes radiantes usando-se um arranjo de m

sensores passivos, como ilustrado na Figura 9, é abordado aqui. A energia

irradiada pelas fontes pode ser acústica, eletromagnética, mecânica, etc e os

sensores podem ser quaisquer transdutores que convertam a energia recebida em

sinais elétricos. No caso em evidência desta tese, os sensores são antenas que

captam a energia eletromagnética irradiada por outras antenas de um sistema de

DBD



comunicações. O problema consiste essencialmente em determinar como a

energia está distribuída pelo espaço (no caso, ar), com as posições das fontes

representando pontos no espaço com alta concentração de energia. Daí a

denominação do problema como de “estimação espectral espacial”. Mais ainda, o

problema em questão apresenta forte ligação com o problema da estimação

espectral temporal, abordado nas seções anteriores deste texto, e que são a base

das soluções adotadas para o problema da localização de fontes.

Figura 9 Ilustração do problema da localização de fontes.

As fontes da Figura 9 geram um campo ondulatório que viaja através do

espaço e é amostrado, tanto no espaço quanto no tempo, pelo arranjo de sensores.

Analogamente à amostragem temporal, a amostragem espacial provê mais

informação sobre as ondas que chegam, à medida que a abertura do arranjo

aumenta. Uma definição simplificada para abertura é o espaço ocupado pelo

arranjo em unidades de comprimento de onda do sinal. Não é surpresa, portanto,

que um arranjo de sensores seja capaz de prover desempenho bem superior que

uma antena isolada, em aplicações como antenas inteligentes e sistemas de

localização.

O desenvolvimento do modelo de arranjo (array model) é baseado em

algumas hipóteses simplificadoras. Para começar, as fontes atendem à condição de

campo distante do arranjo. Para a abordagem nesta seção, assume-se ainda um

problema bidimensional (2D), ou seja, as fontes e os sensores ocupam um mesmo

plano no espaço. As fontes são consideradas emissores pontuais. O meio de

propagação é homogêneo, e as ondas ao chegarem nos sensores são planas. Sob

estas hipóteses, o único parâmetro que caracteriza as posições das fontes é o

chamado ângulo de chegada (AOA) ou direção de chegada (DOA).

DBD



Outra hipótese assumida no desenvolvimento do modelo de arranjo é que o

número de fontes n é conhecido. Na prática, entretanto, a estimação de n é um

problema de importância significativa, normalmente referido como “problema de

detecção”. E por fim, assume-se que os sensores no arranjo podem ser modelados

como sistemas lineares invariantes no tempo, com funções de transferência e

localizações conhecidas. Em suma, assume-se que o arranjo está “calibrado”.

3.4.1. Modelo de arranjo

Inicialmente será considerado o caso de um único emissor. Estabelecido o

modelo para este caso, o modelo geral para um número qualquer de fontes é

obtido simplesmente pelo princípio da superposição.

Seja uma onda incidente em um arranjo e seja x(t) o valor do sinal medido

em um ponto de referência, no instante t. O “ponto de referência” pode ser um dos

sensores do arranjo (mais comum), ou qualquer outro ponto próximo o suficiente

do arranjo para que as hipóteses assumidas para o problema se mantenham. Os

sinais recebidos pelos elementos do arranjo são ondas contínuas e, portanto, t é

uma variável contínua por enquanto.

Seja τk o tempo necessário para que a onda viaje do ponto de referência ao

sensor k (k = 1, ..., m). A saída do sensor k pode ser escrita como:

( ) ( ) ( ) ( )tetxthty kkkk +−∗= τ (3.54)

onde ( )thk é a resposta ao impulso do k-ésimo sensor, “*” denota a operação de

convolução, e ( )tek é um ruído aditivo. Na eq. (3.54), ( )thk é assumido

conhecido e o sinal de entrada x(t), assim como o retardo τk são desconhecidos. Os

parâmetros que caracterizam a localização da fonte entram na eq. (3.54) através de

{τk}. Portanto, o problema de localização da fonte é basicamente o de se estimar o

tempo de retardo para a entrada desconhecida.

A transformada de Fourier do sinal de saída do sensor k pode ser escrita

como:

DBD



( ) ( ) ( ) ( )ωωωω ωτk

ikk EeXHY k += − (3.55)

Como o problema em questão envolve sinais de comunicações, assume-se

que o sinal x(t) é um sinal modulado real, ou seja, um sinal passa-banda. Para fins

de processamento de sinal, é mais conveniente trabalhar-se com o sinal em banda

básica original s(t). Sendo ωc a freqüência da portadora, no domínio da freqüência

têm-se as seguintes relações entre x(t) e s(t), que também é chamada de envoltória

complexa de x(t):

(3.56) ( ) ( ) ( )( cc SSX ωωωωω −+−= ∗ )+

( ) ( ) ( )tietts ϕα= (3.57)

( ) ( )[ ] ( ) ( )( tttetstx cti c ϕωαω +== cos2Re2 ) (3.58)

Substituindo a eq. (3.56) na eq. (3.55), tem-se:

( ) ( ) ( ) ( )[ ] ( )ωωωωωωω ωτk

icckk EeSSHY k +−−+−= −∗ (3.59)

Seja o sinal demodulado do sensor k e Y sua transformada de

Fourier:

( )tyk~ ( )ωk

~

( ) ( ) tikk

cetyty ω−=~ (3.60)

( ) ( ) ( ) ( )[ ] ( ) ( cki

cckk EeSSHY kc ωωωωωωωω τωω ++−−++= +−∗ 2~ ) (3.61)

Utilizando um filtro passa-baixas para eliminar a componente em torno de

2ωc, tem-se:

( ) ( ) ( ) ( ) ( cki

ckk EeSHY kc ωωωωωω τωω +++= +− )

)

(3.62)

onde e são as parcelas filtradas de ( )ckH ωω + ( ckE ωω + ( )ckH ωω + e

( )cωω +kE , respectivamente.

DBD



Adota-se agora a chamada hipótese faixa-estreita, na qual |S(ω)| decresce

rapidamente com o aumento de |ω|. Com isso, a eq. (3.62) pode ser aproximada

para:

(3.63) ( ) ( ) ( ) ( )cki

ckk EeSHY kc ωωωωω τω ++= −

(3.64) ( ) ( ) ( ) ( )tetseHty ki

ckkkc += − τωω

onde ek(t) é na verdade a transformada inversa de Ek(ω + ωc).

A implementação em hardware requerida para se obter {yk(t)} está ilustrada

na Figura 10. No esquema desta figura, amostras das componentes real e

imaginária do sinal analógico em banda básica yk(t) são geradas, e em seguida

digitalizadas. A taxa de amostragem tende a ser baixa, pois está associada à

largura do sinal em banda básica, aplicando-se o critério de Nyquist. Esta versão

amostrada digitalmente de {yk(t)} é utilizada por um “processador digital” para

estimar a DOA. A forma digital de {yk(t)} satisfaz a uma equação análoga à eq.

(3.64). Para não haver confusão de notação entre as versões analógica e digital de

{yk(t)}, a partir daqui a variável temporal t assumirá o domínio discreto, tomando

os valores t = 1, ..., N.

Figura 10 Diagrama em blocos simplificado do processamento analógico em um

elemento (sensor) receptor de um arranjo.

O conceito de “vetor diretor” ou “vetor de transferência do arranjo”

(direction vector ou array transfer vector, respectivamente [22-24]) assume a

forma de:

DBD



(3.65) ( ) ( ) ( )[ Ticm

ic

mcc eHeHa τωτω ωωθ −−= K11 ]

]

]

}

]

onde θ denota a DOA da fonte, que é o parâmetro de interesse no problema em

questão. Uma vez que se assume o conhecimento prévio das funções de

transferência e das posições dos sensores no arranjo, o vetor na eq. (3.65) é função

unicamente de θ, como indicado pela notação usada. A partir das eqs. (3.65) e

(3.64), tem-se:

(3.66) ( ) ( ) ( ) ( )tetsaty += θ

onde

(3.67) ( ) ( ) ( )[ Tm tytyty K1=

(3.68) ( ) ( ) ( )[ Tm tetete K1=

são os vetores de saída do arranjo e de ruído aditivo, respectivamente. Cabe

salientar que θ entra na eq. (3.65) não só através de {τk}, mas também através de

{Hk(ωc)}. Em alguns casos, os sensores são considerados onidirecionais sobre o

domínio DOA de interesse, e então { são independentes de θ. Mais

ainda, em certos casos os sensores são assumidos idênticos. Nesta situação, se o

sinal H(ω

( ) mkckH 1=ω

c)s(t) for redefinido como s(t) e o primeiro sensor for selecionado como

o ponto de referência, a eq. (3.65) pode ser simplificada para:

(3.69) ( ) [ Tii mcc eea τωτωθ −−= K21

A extensão da eq. (3.66) para o caso de fontes múltiplas é direta, dada a

hipótese que os elementos do arranjo são lineares. O princípio da superposição

leva ao seguinte modelo de arranjo:

DBD



(3.70) ( ) ( ) ( )[ ]( )

( )( ) ( ) ( )tetsAte

ts

tsaaty

n

n +≡+

= MK

1

1 θθ

onde θk é a DOA da k-ésima fonte e s(t) o sinal correspondente à k-ésima fonte. A

matriz A é usualmente chamada de array manifold. É interessante salientar que o

modelo acima se baseia principalmente na hipótese faixa-estreita. A hipótese de

onda plana ainda não foi usada até aqui. Esta hipótese é utilizada para derivar a

dependência explícita de {τk} como função de θ. Para exemplificar esta

dependência, uma geometria especial para o arranjo será abordada: a uniforme

linear.

A Figura 11 ilustra um arranjo com m sensores idênticos uniformemente

separados ao longo de uma linha. Tal arranjo é comumente referido como um

arranjo linear uniforme (ULA – Uniform Linear Array). Seja d a distância entre

dois sensores consecutivos, e θ a DOA do sinal iluminando o arranjo, medida no

sentido anti-horário com relação à normal à linha dos sensores. Então, sob a

hipótese de ondas planas e que o primeiro elemento é escolhido como o ponto de

referência, tem-se:

( ) ( ) [ °°−∈−= 90,90,sen1 θθ

τ parac

dkk ]

]

(3.71)

onde c é a velocidade de propagação da onda incidente (velocidade da luz no caso

de ondas eletromagnéticas). Inserindo a eq. (3.71) na eq. (3.69) tem-se:

(3.72) ( ) ( )[ Tcdmicdi cc eea /sen1/sen1 θωθωθ −−−= K

Figura 11 Exemplo de arranjo linear uniforme (ULA).

DBD



A restrição de θ para pertencer ao intervalo [-90o, 90o] é uma limitação de

ULAs: duas fontes em localizações simétricas com relação à linha do arranjo

compreendem conjuntos idênticos de retardos {τk}, não podendo ser distinguidas

uma da outra. Na prática, esta ambigüidade é eliminada usando-se sensores que

recebam sinais apenas dentro do intervalo permitido.

Sendo λ o comprimento de onda do sinal, define-se:

λθθ sensen d

cdff cs == (3.73)

Com a notação acima, o vetor de transferência do arranjo descrito pela eq.

(3.72) pode ser reescrito como:

(3.74) ( ) ( )[ Tmii ss eea ωωθ 11 −−−= K ]

que é um vetor de Vandermonde completamente análogo ao vetor composto pelas

amostras uniformes de um sinal senoidal { }ti se ω− .

Explorando a analogia acima, inicialmente chama-se fs (ωs = 2πfs) de

“freqüência espacial”. Em segundo lugar, recordando o teorema da amostragem

de Nyquist, se um sinal senoidal contínuo no tempo com freqüência fc deve ser

amostrado de modo a não produzir efeitos de aliasing, a taxa amostral deve

satisfazer a f0 ≥ 2fc. No caso da ULA em questão, verifica-se que o vetor na eq.

(3.74) é definido unicamente (ou seja, sem aliasing espacial) se e somente se |ωs|

≤ π. Ou equivalentemente:

221 sen λθ ≤⇔≤ df s (3.75)

que é satisfeito se d ≤ λ/2. Uma vez que a ULA pode ser interpretada como um

amostrador espacial uniforme da onda incidente, este último critério simplesmente

diz que o período amostral (espacial) d deve ser menor que metade do

DBD



comprimento de onda do sinal. Por analogia, este resultado é usualmente

interprestado como teorema amostral de Nyquist espacial.

Com o modelo de arranjo da eq. (3.70), o problema de se encontrar DOAs

pode ser reduzido ao de estimação dos parâmetros {θk} naquela equação. Como

há uma analogia direta entre a eq. (3.70) e o modelo para sinais senoidais ruidosos

da eq. (3.29), é de se esperar que a maioria dos métodos disponíveis para a

estimativa espectral temporal também possam ser utilizados para o problema da

estimação de DOA.

3.4.2. Métodos não-paramétricos

Os métodos aqui descritos não fazem nenhuma hipótese inicial sobre a

estrutura de covariância dos dados. Como tais, eles são ditos “não paramétricos”.

Entretanto, nesses métodos o arranjo precisa estar calibrado, é necessário o

conhecimento prévio do vetor de transferência a(θ) associado ao arranjo.

A Figura 12 faz uma analogia entre uma filtragem temporal FIR (Finite

Impulse Response – resposta ao impulso finita) e uma filtragem espacial usando

um arranjo de sensores. No caso temporal discreto, um filtro FIR é definido por:

(3.76) ( ) ( ) ( )∑−

=

∗≡−=1

0

m

kkF tyhktuhty

onde {hk} são os pesos dos filtros, u(t) é o sinal na entrada do filtro e:

(3.77) [ ∗−= 10 mhhh K ]

] (3.78) ( ) ( ) ( )[ Tmtututy 1+−= K

De forma análoga, as amostras espaciais { obtidas com um arranjo

de sensores podem ser usadas para definir um filtro espacial:

( )}mkk ty 1=

(3.79) ( ) ( )tyhtyF∗=

DBD



Figura 12 Analogia entre amostragem/filtragem temporal e as correspondentes

operações espaciais desempenhadas por um arranjo de sensores.

A saída (sem ruído) filtrada espacialmente de um arranjo iluminado por uma

frente de onda faixa-estreita com envoltória complexa s(t) e DOA igual a θ é dada

por:

( ) ( )[ ] ( )tsahtyF θ∗= (3.80)

Esta equação mostra claramente que o filtro espacial pode ser selecionado para

amplificar (atenuar) os sinais chegando de uma dada direção θ, fazendo h*a(θ) na

eq. (3.80) grande (pequeno). A abordagem aqui apresentada é conhecida como

“por banco de filtros”, e consiste resumidamente no seguinte. Se um filtro h é

projetado tal que deixe passar sem distorção os sinais com uma dada DOA θ e

atenue todas as outras DOAs diferentes de θ o máximo possível, então a potência

do sinal filtrado espacialmente na eq. (3.79), que é dada por:

( ){ } ( ) ( ){ tytyERRhhtyE F∗∗ == ,2 } (3.81)

deve apresentar uma boa indicação da quantidade de energia chegando na direção

θ. Portanto, h*Rh deve apresentar picos nas DOAs das fontes localizadas no

campo de visão do arranjo quando avaliadas sobre o domínio de DOAs de

interesse. Este fato é explorado para fins de estimação de DOA, como nos

métodos de “conformação de feixe” (beamforming) [20] e de Capon [21].

No método por conformação de feixe, o filtro associado deve atender à

seguinte condição:

DBD



(3.82) ( ) 1min =∗∗ θahasujeitohhh

A solução para o problema acima é dada por:

(3.83) ( ) ( ) ( )θθθ aaah ∗= /

Quando os sensores são idênticos, tem-se que:

(3.84) ( ) ( ) maa =∗ θθ

o que reduz a eq. (3.83) a:

(3.85) ( ) mah /θ=

que inserida na eq. (3.81) resulta em:

( ){ } ( ) ( ) 22 / mRaatyE F θθ∗= (3.86)

Como a matriz covariância teórica não pode ser determinada de maneira exata a

partir do conjunto finito de amostras disponíveis, em seu lugar toma-se sua

estimativa:

( ) ( )∑=

∗=N

t

tytyN

R1

1ˆ (3.87)

Desta forma e omitindo o termo 1/m2 em (3.86), que não traz influencia alguma à

estimação de DOA, obtém-se o método por conformação de feixe que determina

as DOAs como os n picos mais altos da função:

(3.88) ( ) ( )θθ aRa ˆ∗

DBD



A expressão acima é análoga à encontrada para o periodograma de

Blackman-Tukey (BT) com janela de Bartlett de largura 2m + 1. Ou seja, o

método por conformação de feixe é uma extensão espacial direta do

periodograma. De fato, a função na eq. (3.88) pode ser entendida como tendo sido

obtida pela média dos “periodogramas espaciais” sobre o conjunto de snapshots3

disponíveis (t = 1, ..., N):

( ) ( ) 2tya θ∗ (3.89)

A conexão supracitada entre a conformação de feixe e o periodograma BT

inclui as propriedades de resolução de ambos os métodos. Prova-se que a largura

de feixe do filtro espacial usado na conformação de feixe é aproximadamente

igual ao inverso da abertura do arranjo (em unidades de comprimentos de onda).

A analogia entre o periodograma BT e a conformação de feixe apresenta

alguns pontos de divergência. Por exemplo, a consistência da estimativa não

apresenta analogia total. Prova-se que a estimativa de DOA é consistente apenas

quando existe uma única direção de origem (n = 1). No caso geral de múltiplas

fontes, a estimativa é inconsistente.

Outra divergência na analogia supracitada, ainda que aparentemente

pequena, diz respeito à escolha da largura da janela (m). Para o periodograma BT,

a largura da janela de Bartlett é escolhida de acordo com a conveniência do

usuário, enquanto que na conformação de feixe m é fixo. Embora aparentemente

irrelevante, esta diferença tem grande impacto nas supracitadas propriedades de

consistência da conformação de feixe. Mais precisamente, prova-se que as

estimativas espectrais temporais por periodogramas com janela de Bartlett são

consistentes se m cresce sem limites à medida que o número de amostras N tende

a infinito. Para a conformação de feixe, por outro lado, o valor de m é limitado por

considerações físicas. Isto impede que a conformação de feixe apresente

estimativas consistentes no caso de fontes múltiplas. Uma dificuldade adicional

no caso espacial é que os sinais podem estar correlacionados um com o outro,

enquanto que no caso da estimação frequencial temporal os sinais são sempre

descorrelatados.

3Uma snapshot é o vetor y(t) obtido da amostragem no instante de tempo t.

DBD



Resumindo, para que se obtenha uma estimativa de DOA razoavelmente

precisa por conformação de feixe no caso geral (múltiplas fontes), é preciso

inicialmente que o modelo de arranjo da eq. (3.70) se aplique ao problema. Neste

caso, é preciso ainda que a separação mínima entre as DOAs seja maior que a

largura de feixe do arranjo (o que implica em m grande), que os sinais estejam

descorrelacionados, e que o ruído seja espacialmente branco. Quando estas

condições são obtidas, o problema geral se “desacopla” aproximadamente em n

espectros de fonte única, resultando em uma estimativa confiável.

O projeto de filtro espacial associado ao método de Capon é dado por:

(3.90) ( ) 1min =∗∗ θahasujeitoRhhh

A garantia que o sinal não seja distorcido para uma dada DOA é a mesma da

abordagem por conformação de feixe: . A outra condição associada ao

projeto do filtro é que distingue os dois métodos. Para atenuar as demais DOAs

que não a(s) desejada(s), no método de Capon a formulação é “dependente dos

dados” (aqui representados pela matriz covariância R), enquanto que na

conformação de feixe ela era independente. Conseqüentemente, o objetivo do

filtro de Capon apontado para uma certa DOA θ é atenuar qualquer outro sinal

que realmente incida sobre o arranjo vindo de uma DOA ≠ θ, enquanto que o

filtro de conformação de feixe distribui igualmente seu esforço para todas as

outras DOAs ≠ θ, mesmo que não haja sinal em várias destas DOAs.

( ) 1=∗ θah

A solução para a eq. (3.90) é dada por:

( )( ) ( )θθ

θaRa

aRh 1

1

−∗

−

= (3.91)

e quando inserida na eq. (3.81), que expressa a potência de saída, resulta em:

( ){ }( ) ( )θθ aRa

tyE F 12 1

−∗= (3.92)

DBD



Mais uma vez, como não é possível obter a matriz covariância R exata, usa-se

uma estimativa na equação acima. Com isso, as estimativas de DOA pelo método

de Capon são dadas pelos n picos mais altos da função:

( ) ( )θθ aRa 1ˆ

1−∗

(3.93)

Há uma hipótese implícita na equação acima que a matriz exista. Isto

pode ser garantido sob condições não muito restritivas; em particular, existe

com probabilidade 1 se N ≥ m e se o termo de ruído apresenta uma matriz

covariância espacial positivo-definida.

1ˆ −R1ˆ −R

Verifica-se empiricamente que a estimação de DOA pelo método de Capon

apresenta desempenho superior ao da conformação de feixe. A vantagem comum

aos dois métodos não paramétricos é que nada se assume quanto às propriedades

estatísticas dos dados, sendo apropriados portanto, às situações nas quais não se

disponha daquelas informações. Entretanto, quando tais informações são

disponíveis, por exemplo na forma de um modelo de covariância dos dados, o

desempenho dos métodos não paramétricos não se iguala ao da abordagem

baseada em modelos (paramétrica).

3.4.3. Métodos paramétricos

O modelo de arranjo da eq. (3.70) será utilizado aqui. Mais ainda, assume-se

que o ruído é espacialmente branco, com componentes apresentando variância

idêntica de modo que:

( ) ( ){ } IteteE 2σ=∗ (3.94)

Por sua vez, a matriz covariância do sinal:

( ) ( ){ }tstsEP ∗= (3.95)

é assumida não-singular (embora não necessariamente diagonal). Portanto os

sinais podem estar parcialmente correlacionados. Quando os sinais estão

DBD



totalmente correlacionados, de modo que P seja singular, diz-se que eles são

“coerentes”. Por fim, assume-se que os sinais e o ruído são descorrelatados um do

outro.

Sob as hipóteses anteriores, a matriz covariância teórica do vetor de saída do

arranjo é dada por:

( ) ( ){ } IAPAtytyER 2σ+== ∗∗ (3.96)

Há uma analogia direta entre o modelo de arranjo da eq. (3.70) com as

hipóteses acima expressas pelas eqs. (3.94) a (3.96) e com o modelo

correspondente para a estimativa espectral temporal do sub-capítulo 3.3. Mais

especificamente, o modelo de “regressão não linear” do arranjo expresso pela eq.

(3.70) é análogo à eq. (3.29), e o modelo de covariância do arranjo da eq. (3.96) é

praticamente o mesmo que o da eq. (3.31). Como conseqüência dessas analogias,

todos os métodos introduzidos no sub-capítulo 3.3 para estimação frequencial

podem ser usados também para estimação de DOA sem qualquer modificação

essencial. Os principais métodos daquele sub-capítulo serão revistos aqui,

destacando as diferenças entre as duas aplicações (estimação frequencial × DOA).

Um dos métodos paramétricos que merece destaque é o método NLS

(Nonlinear Least Squares- não linear por mínimos quadrados), que determina as

DOAs desconhecidas como sendo os elementos que minimizam a seguinte

função:

( ) ( )∑=

−=N

t

tAstyN

f1

21 (3.97)

A minimização com relação a {s(t)} resulta em:

(3.98) ( ) ( ) ( ) NttyAAAts ,,11K== ∗−∗

Após alguma manipulação algébrica das equações acima, prova-se que as

estimativas NLS de DOA são dadas por:

DBD



4{ }{ }

( )[ ]RAAAAtrk

kˆmaxargˆ 1 ∗−∗=

θθ (3.99)

Pode-se provar que a conformação de feixe apresenta uma solução

aproximada para o problema NLS acima, sempre que se saiba de antemão que as

DOAs estejam bem separadas umas das outras. Para compreender de modo

simplificado esta possibilidade, suponha-se que a busca pelos argumentos que

maximizam a eq. (3.99) seja restringida a um conjunto de DOAs bem afastadas

umas das outras (de acordo com a informação a priori de que as DOAs

verdadeiras pertencem a este conjunto). Num conjunto como este, sob

condições fracas, e portanto a função na eq. (3.99) pode ser aproximada para:

mIAA ≅∗

( )[ ] ( ) ( k

n

kk aRa

mRAAAAtr θθ∑

=

∗∗−∗ ≅1

1 ˆ1ˆ )

(3.100)

A função argumento do somatório no lado direito da equação acima é igual à

função determinada no método por conformação de feixe da eq. (3.88). Este

somatório é maximizado justamente com as estimativas de DOA obtidas por

conformação de feixe, que são os picos da eq. (3.88), dentro do conjunto

considerado.

Uma diferença entre a eq. (3.99) e o problema de otimização correspondente

na aplicação de estimação frequencial reside no fato de que, neste último, apenas

uma snapshot de dados está disponível, em contraste com as N snapshots

disponíveis na aplicação de estimação de DOA. Outra diferença ainda mais

importante é que para os casos não ULA, a matriz A na eq. (3.99) não apresenta a

estrutura de Vandermonde da matriz correspondente na eq. (3.25) da aplicação

frequencial. Conseqüentemente, diversos algoritmos utilizados para resolver

(aproximadamente) o problema de estimação frequencial não mais se aplicam à

solução da eq. (3.99), a menos que o arranjo seja ULA.

O algoritmo MUSIC desenvolvido no sub-capítulo 3.3 para aplicação de

estimação frequencial, pode ser utilizado sem modificação para estimação de

4O traço de uma matriz é definido como tr mmCA ×∈ ( ) ∑=

≡m

iiiAA

1

DBD



DOA. Há apenas algumas pequenas diferenças entre as aplicações frequencial e

espacial, conforme enunciadas a seguir.

Inicialmente, na aplicação espacial a geometria ULA admite a flexibilidade

de escolha quanto ao tipo de estimação MUSIC: a espectral da eq. (3.39); ou a

Root MUSIC, que busca as raízes da eq. (3.37). Para a maioria das outras

geometrias, apenas o MUSIC espectral se aplica.

Em segundo lugar, o algoritmo MUSIC padrão da eq. (3.39) falha no caso

de sinais coerentes, pois nesta situação a condição de posto assumida não mais se

mantém – o posto de APA* = n na eq. (3.31). Entretanto, para arranjos ULA é

possível utilizar-se o chamado algoritmo MUSIC “modificado” (próprio para

sinais coerentes).

O algoritmo ESPRIT [25] por sua vez, pode ser utilizado para estimação de

DOA exatamente como é feito para estimação frequencial. No caso não ULA, o

ESPRIT pode ser utilizado apenas em certas situações. Mais precisamente, o

ESPRIT pode ser usado para estimação de DOA somente se o arranjo utilizado

contiver dois sub-arranjos idênticos deslocados um do outro por um vetor

deslocamento conhecido, como ilustrado na Figura 13. Matematicamente, esta

condição pode ser formulada da seguinte forma. Seja m o número de sensores

nos dois sub-arranjos gêmeos, e sejam A1 e A2 as sub-matrizes de A

correspondentes a estes sub-arranjos. Uma vez que os sensores no arranjo são

numerados arbitrariamente, não há restrição quanto a assumir que A1 é composto

pelas primeiras m linhas em A e A2 das últimas m , ou seja:

[ ] ( nmAIA m ×= 01 ) (3.101)

[ ] ( nmAIA m ×= 02 ) (3.102)

onde mI denota a matriz identidade m×m . Observa-se que os dois sub-arranjos

se sobrepõem se 2/mm > ; caso contrário, elas podem não se sobrepor. Se o

arranjo for construído propositalmente para atender à condição de sub-arranjos do

ESPRIT, então normalmente 2/m=m e os dois sub-arranjos não se sobrepõem.

DBD



Figura 13 Condição para o uso do ESPRIT na aplicação de estimação de DOA: sub-

arranjos idênticos afastados por um vetor deslocamento conhecido.

Matematicamente, o requisito do ESPRIT significa que:

(3.103) DAA 12 =

com a matriz D definida por:

( )

( )

=−

−

nc

c

i

i

e

eD

θτω

θτω

0

01

O (3.104)

e com τ denotando o tempo necessário para que uma frente de onda incidente

sobre o arranjo na direção θ percorra a distância entre os pontos de referência dos

dois sub-arranjos gêmeos. Se θ é medido com relação à perpendicular da linha

entre os pontos centrais dos sub-arranjos, como ilustrado na figura 3.12, então um

cálculo similar ao que levou à eq. (3.71) mostra que:

( )θ

(3.105) ( ) cd /senθθτ =

onde d é a distância entre os dois sub-arranjos. Portanto, as estimativas das DOAs

podem ser obtidas prontamente a partir das estimativas dos elementos da diagonal

de D na eq. (3.104).

As eqs. (3.103) e (3.104) são basicamente equivalentes às eqs. (3.42) e

(3.43) do sub-capítulo 3.3, e portanto o método ESPRIT de estimação de DOA é

análogo ao estimador ESPRIT frequencial.

DBD



O método ESPRIT de estimação de DOA determina as estimativas de DOA

resolvendo um problema n × n de autovalores, assim como é feito na aplicação

frequencial. Não há busca envolvida, ao contrário dos métodos previamente

citados. Mais ainda, não existe o problema de separar as “DOAs de sinal” das

“DOAs de ruído”, também contrastando com métodos como o MUSIC. Por outro

lado, o ESPRIT só pode ser utilizado com a configuração de arranjo especial

citada previamente. Em particular, este requisito limita o número de fontes

solucionáveis em mn < (já que tanto A1 quanto A2 devem apresentar posto de

coluna completo). Deve-se salientar que os dois sub-arranjos não precisam estar

calibrados, embora eles precisem ser idênticos, e o ESPRIT pode ser sensível a

diferenças entre os dois sub-arranjos, da mesma forma que outros métodos como o

MUSIC são sensíveis a imperfeições na calibração dos arranjos. Por fim, percebe-

se ainda que o ESPRIT não é utilizável no caso de sinais coerentes, assim como

observado para os demais métodos paramétricos (à exceção do NLS).

DBD


3 estimação espectral - puc-rio

Documents