3 estimação espectral - puc-rio
TRANSCRIPT
3 Estimação espectral
A essência do problema de estimação espectral pode ser resumida pela
seguinte frase: “A partir de uma gravação finita de uma seqüência de dados
estacionários, estimar como a potência total está distribuída no domínio da
freqüência” [16].
Dentre as diversas aplicações da estimação espectral nos mais variados
campos das ciências (Economia, Meteorologia, Astronomia, Sismologia,
Medicina, etc), destaca-se para o contexto deste trabalho a aplicação para sistemas
de radar e sonar, de determinação da direção das fontes, recentemente estendida
para aplicações com arranjos de antenas em sistemas rádio-móveis.
Há duas macro abordagens para o problema da análise espectral. Uma delas
tem por idéia básica aplicar um filtro passa-banda de faixa estreita ao sinal
estudado, varrendo toda a faixa de freqüências de interesse. A potência de saída
do filtro dividida pela largura de faixa do filtro é usada como uma medida do
conteúdo espectral do sinal original. Este procedimento corresponde
essencialmente ao que os chamados métodos “clássicos” (ou “não-paramétricos”)
de análise espectral fazem. A outra abordagem, conhecida como “paramétrica”,
postula um modelo para os dados, o que provê uma forma de parametrizar o
espectro, conseqüentemente reduzindo o problema a se estimar os parâmetros para
o modelo assumido.
Os métodos paramétricos podem oferecer estimativas espectrais mais
precisas que os não-paramétricos nos casos onde os dados de fato satisfazem o
modelo assumido. Entretanto, no caso mais provável em que os dados não
satisfaçam aos modelos assumidos, os métodos clássicos podem atuar melhor que
os paramétricos devido à sensibilidade destes últimos a desvios do sinal realista
com relação ao modelo. Tal observação tem motivado um interesse renovado na
abordagem não-paramétrica para estimação espectral.
Este capítulo apresenta resumidamente os principais fundamentos da teoria
de estimação espectral, em particular no que se refere a sinais aleatórios, que
3 Estimação espectral 45
representam melhor o comportamento dos sinais na prática. Inicialmente a
densidade espectral de potência, função essencial para a análise espectral, é
apresentada. Em seguida, os métodos clássicos e os paramétricos são discutidos,
sendo que para estes últimos apenas os que produzem estimativas de espectro de
linha são abordados, pois esta é a situação de interesse para a tese. Por fim, os
princípios previamente apresentados são adaptados para a aplicação específica de
interesse, que é a estimação do espectro espacial.
3.1. Densidade espectral de potência de um sinal aleatório
Seja uma seqüência de variáveis aleatórias {y(t); t = 0, ±1, ±2,...}
representando um sinal discreto no tempo. Duas hipóteses sobre o sinal são
assumidas para definir-se sua densidade espectral de potência (PSD – Power
Spectral Density):
- média zero, ou seja, E{y(t)} = 0 para todo t;
- covariância r(k) = E{y(t) y*(t – k)} dependente apenas do retardo k
entre as duas amostras tomadas.
Em outras palavras, assume-se que {y(t)} é uma seqüência estacionária no
sentido amplo. Outra definição importante é a de matriz covariância de {y(t)},
dada por:
(3.1)
( ) ( ) ( ) ( )( ) ( ) ( )
( ) ( ) ( ) ( )
−−
−−−
=
0121
2011210
***
*
rrmrmr
mrrrmrmrrr
L
MOOOM
MOOOM
OO
L
R
A PSD pode ser definida como a transformada de Fourier discreta no tempo
(DTFT – Discrete-Time Fourier Transform) da covariância, ou seja:
(3.2) ( ) ( )∑∞
∞==
−=k
kiekr ϖωφ
Uma segunda definição de PSD é dada por:
3 Estimação espectral 46
( )
∑=
−
∞→
2
1
1limN
t
ti
Nety
NE ω (3.3)
que é equivalente à definição anterior de PSD quando a seqüência covariância
{r(k)} decai suficientemente rápido, de modo que:
( )∑−=∞→
=N
NkNkrk
N01lim (3.4)
Observa-se que a PSD é periódica com período igual a 2π. Com isso, a
freqüência angular ω ∈ [-π, π], ou alternativamente a freqüência f =ω/2π ∈ [-½,
½]. A associação com a freqüência original do sinal contínuo associado (F) é dada
por: F = f ⋅ FS, onde FS é a freqüência de amostragem, que segundo o critério de
Nyquist deve ser ≥ 2 ⋅ F0 (componente frequencial mais alta do espectro contínuo
original) para evitar o efeito de aliasing.
Dadas as definições de PSD, pode-se formalizar um pouco mais a definição
do problema de estimação espectral dada no início do capítulo para: “A partir de
um conjunto finito de amostras {y(1), ..., y(N)} de um processo estacionário no
sentido amplo, determinar uma estimativa φ de sua PSD φ ,para ω ∈ [-π,
π]. A grande limitação da qualidade da estimativa está associada normalmente ao
pequeno número N de amostras disponíveis para o processamento. Em diversas
aplicações, como o custo de se obter grandes seqüências de dados é muito grande,
N é feito pequeno.
( )ωˆ ( )ω
3.2. Métodos não-paramétricos
Os métodos não-paramétricos se baseiam inteiramente nas definições da
PSD das eqs. (3.2) e (3.3) para prover estimativas espectrais. Tais métodos se
constituem nas formas clássicas de estimativa espectral.
Inicialmente serão apresentados dois estimadores, o “periodograma” e o
“correlograma”, derivados das eqs. (3.3) e (3.2) respectivamente. Pode-se provar
que tais métodos são equivalentes sob circunstâncias relaxadas. Tais métodos
provêm alta resolução para larguras dos dados longas o suficiente, mas considera-
3 Estimação espectral 47
se que eles são estimadores pobres, pois sua variância é alta e não decresce com
um maior número de amostras dos dados.
A variância elevada do periodograma e do correlograma motivaram o
desenvolvimento de métodos modificados que apresentam menor variância, às
custas de uma menor resolução. Dada a relativa equivalência de suas propriedades
e de seus desempenhos, apenas alguns deles serão detalhados neste texto.
3.2.1. Periodograma e correlograma
O periodograma se baseia na definição da PSD dada pela eq. (3.3), e sua
fórmula é dada por:
( ) ( )2
1
1ˆ ∑=
−=N
t
tip ety
Nωωφ (3.5)
O correlograma, por sua vez, baseia-se na definição da eq. (3.2) da PSD,
com formulação dada por:
(3.6) ( ) ( )( )∑−
−−=
−=1
1
ˆˆN
Nk
kic ekr ωωφ
A covariância (ou autocovariância) r(k) pode ser estimada de duas formas
distintas:
( ) ( ) ( ) 0,11
* ≥−−
= ∑+=
kktytykN
krN
kt
) (3.7)
( ) ( ) ( ) 0,11
* ≥−= ∑+=
kktytyN
krN
kt
) (3.8)
A estimativa de r(k) dada pela eq. (3.7) é dita “não-polarizada”, e a da eq.
(3.8) é “polarizada”. Pode-se provar que a versão polarizada do correlograma
coincide com a definição de periodograma.
Prova-se ainda que ambas estimativas são assintoticamente não-polarizadas,
mas apresentam variância alta, mesmo para um número de amostras N elevado.
3 Estimação espectral 48
Esta variância alta é a responsável pelo desempenho considerado pobre do
periodograma e do correlograma como estimadores.
A análise da polarização (bias – valor esperado) do periodograma leva
naturalmente ao surgimento de um termo na equação associada que pode ser
interpretado como um filtro ou uma janela triangular. Esta janela é ainda
conhecida como janela de Bartlett. No domínio espectral, a janela triangular
(ilustrada na Figura 2) é equacionada por:
( ) ( )( )
2
221
=
ωω
ωsen
NsenN
WB (3.9)
Figura 2 Janela de Bartlett (triangular).
Observa-se a presença marcante de um lobo principal, e diversos lóbulos
laterais. O efeito mais marcante do lobo principal é o de espalhar o espectro
(smearing). A Figura 3 ilustra este efeito, que acaba por limitar a resolução da
estimativa. Para a janela de Bartlett, este limite é aproximadamente 1/N.
Figura 3 Efeito de suavização ou espalhamento (smearing) causado pela largura do lobo
principal da janela.
3 Estimação espectral 49
O efeito principal dos lóbulos laterais é a transferência de potência das
bandas que concentram a maior parte do sinal para bandas que contém menos ou
nenhuma potência. Tal efeito é chamado de “vazamento” espectral (spectral
leakage), e está ilustrado na Figura 4.
Figura 4 Efeito de “vazamento” espectral (spectral leakage) causado pela presença dos
lóbulos laterais da janela.
3.2.2. Métodos baseados no periodograma
Considerando-se a diminuição da variância uma forma de melhoria da
estimativa espectral, ainda que ao preço da redução da resolução, existem diversos
procedimentos baseados nas estimativas básicas do periodograma ou do
correlograma. Dentre eles, dois se destacam: Blackman-Tukey (janelamento e
suavização); e Bartlett (média).
Uma das possibilidades de se melhorar a estimativa espectral é aplicando
uma janela à função de covariância estimada. Este método, conhecido como
procedimento de Blackman-Tukey, resulta numa suavização da estimativa
espectral pela convolução desta com a janela (exemplificada na Figura 5), e a
estimativa toma a forma:
(3.10) ( ) ( ) ( )( )∑−
−−=
−=1
1
ˆˆM
Mk
kiBT ekrkw ωωφ
3 Estimação espectral 50
Figura 5 Janela utilizada no procedimento de Blackman-Tukey.
A eficiência deste procedimento depende do projeto da janela. Quanto maior
a largura M da janela, menor a polarização da estimativa, porém maior a
variância. E a escolha do formato da janela estabelece um compromisso entre
espalhamento (resolução) e vazamento espectral.
O procedimento de Bartlett também reduz a variância do periodograma. Já
que as propriedades estatísticas do periodograma não melhoram com larguras
maiores dos dados, Bartlett sugeriu uma forma mais eficiente de usar um
segmento longo de dados específico: partindo este segmento em pedaços menores
e tomando a média dos periodogramas resultantes, como ilustrado na Figura 6. A
estimativa Bartlett é calculada como:
( ) ( )∑=
=L
jjB L 1
ˆ1ˆ ωφωφ (3.11)
A estimativa de Bartlett na verdade pode ser interpretada como similar à de
Blackman-Tukey com janela retangular. Esta estimativa apresenta alta resolução,
mas com grande vazamento espectral e variância também relativamente grande.
Figura 6 Procedimento de Bartlett: segmentação dos dados e média dos sub-blocos
resultantes.
3 Estimação espectral 51
3.3. Métodos paramétricos para espectros de linha
Para os métodos não-paramétricos apresentados anteriormente, nenhuma
hipótese a respeito do sinal estudado precisou ser estabelecida, à exceção da
estacionaridade. Os métodos “paramétricos” ou “baseados em modelagem”
assumem que o sinal satisfaz a um modelo gerador com forma funcional
conhecida, e então o processo continua estimando-se os parâmetros para o modelo
assumido, como ilustrado na Figura 7. Nos casos em que o modelo assumido é
uma boa aproximação da realidade, é de se esperar que os métodos paramétricos
gerem estimativas espectrais melhores que as técnicas não-paramétricas. Deve-se
lembrar sempre, entretanto, que esta última abordagem permanece útil para as
aplicações onde há pouca ou nenhuma informação sobre o sinal em questão.
Figura 7 Diagrama de blocos ilustrando o processo de estimativa espectral paramétrica.
Ao se estudar os métodos paramétricos, costuma-se distinguir entre os
voltados para espectros “racionais” ou para os espectros “de linha”. Para o
primeiro, o espectro é modelado como uma função racional de e-iω, como na
equação a seguir:
( )∑∑
≤−
≤−
=nk
kik
mkki
k
e
eω
ω
ρ
γωφ (3.12)
O teorema de Weierstrass (do Cálculo) postula que qualquer PSD contínua
pode ser aproximada por uma PSD racional na forma acima, com a condição que
os índices m e n sejam escolhidos “grandes o suficiente”. Isto na verdade
representa um dos problemas: a escolha dos índices não é uma tarefa simples.
Mais ainda: nem sempre a PSD é contínua.
3 Estimação espectral 52
A PSD racional pode ser fatorada como a seguir:
( ) ( )( )
( )( ) m
m
nn
zbzbzB
zazazA
AB
−−
−−
+++=
+++=
=
L
L1
1
11
22
1
1
σωω
ωφ
(3.13)
onde σ2 é um escalar positivo. A PSD racional pode ser associada com um sinal
obtido à saída de um filtro cuja função de transferência é B(ω)/A(ω), alimentado
em sua entrada por um sinal de ruído branco com potência igual a σ2. Ou seja, o
problema da estimação espectral é reduzido para um problema de modelagem de
sinal. Um sinal que apresente m e n ≠ 0 é chamado de “auto-regressivo de média
móvel” (ARMA – Auto-Regressive Moving Average). Quando m = 0 o sinal é dito
“auto-regressivo” (AR – Auto-Regressive) e quando n = 0 o sinal é dito “de média
móvel” (MA – Moving Average).
Quando o sinal pode ser descrito essencialmente por um modelo senoidal,
como na eq. (3.14), o espectro pode ser tomado como de linha ao invés de
racional. Este é o caso dos sinais encontrados em diversas aplicações, inclusive na
de sondagem de AOA e TOA em sistemas rádio-móveis.
(3.14) ( ) ( ) ( )
( ) ( ) (∑∑=
+
=
==
=+=n
k
tik
n
kk
kketxtx
ttetxty
11
,2,1
φωα
K
)
No modelo acima, x(t) representa o sinal senoidal complexo sem ruído;
{αk}, {ωk}, e {φk} são respectivamente suas amplitudes, freqüências (angulares) e
fases iniciais; e(t) é um ruído aditivo. Embora na prática a maioria dos sinais
encontrados seja real, em aplicações de comunicações é sempre possível
transmitir-se componentes em fase e em quadratura, a partir das quais reconstrói-
se a envoltória complexa do sinal.
O ruído {e(t)} é usualmente assumido como branco circular. Tal hipótese,
embora nem sempre corresponda à realidade, também não pode ser considerada
3 Estimação espectral 53
restritiva. Em particular, se a forma do espectro de ruído é conhecida, é possível
aplicar um filtro para tornar o ruído branco.
Quando o ruído não é branco e possui forma espectral desconhecida, ainda
assim é possível se obter estimativas espectrais precisas através do método não-
linear por mínimos quadrados (NLS – Nonlinear Least Squares). As propriedades
das estimativas NLS quando o ruído é colorido ou de forma desconhecida são bem
parecidas com as encontradas para o caso de ruído branco, apenas com as
amplitudes dos sinais senoidais “ajustadas” para as correspondentes relações
sinal-ruído locais (em cada freqüência ωk). Outros métodos, entretanto, como os
baseados em sub-espaço, dependem fortemente da hipótese que o ruído seja
branco.
Algumas hipóteses adicionais ainda são necessárias para prosseguir com a
estimativa da PSD espectral discreta (de linha). As amplitudes αk > 0 e as
freqüências ωk ∈ [-π, π]. As fases iniciais são consideradas como variáveis
aleatórias independentes de distribuição uniforme sobre [-π, π]. Com estas
hipóteses, é possível calcular a covariância r(k) do sinal y(t), e aplicando uma
DTFT a ela, obtém-se a PSD φ(ω), cujas equações seguem abaixo.
(3.15) ( ) ( ) ( ){ } 0,2
12*
kn
p
kip
pektytyEkr δσα ω +=−= ∑ =
(3.16) ( ) ( ) 2
1
22 σωωδαπωφ −= ∑=
n
ppp +
Nas eqs. (3.15 - 3.16) acima, δ(ω - ωp) é a função delta de Dirac. Um
exemplo de PSD conforme o equacionamento acima está ilustrado na Figura 8.
Fica óbvio o porquê do espectro ser chamado de linha ou discreto.
Figura 8 Exemplo de espectro de linha: sinal com 3 componentes harmônicas
contaminado por ruído branco.
3 Estimação espectral 54
A discussão prévia evidencia que a análise espectral baseada no modelo
paramétrico de PSD da eq. (3.16) reduz o problema a estimar os parâmetros do
sinal y(t) da eq. (3.14). Na maioria das aplicações, incluindo a aplicação foco
deste texto, os parâmetros de maior interesse são as localizações das linhas
espectrais, ou seja, as freqüências senoidais ωk. O foco passa a ser então o de
estimação frequencial, ou seja, determinar {ωk}k=1..n a partir de um conjunto de
observações {y(t)}t=1..N. Uma vez tendo sido determinadas as freqüências, a
estimação dos demais parâmetros se torna um simples problema de regressão
linear. Mais precisamente, para um conjunto dado {ωk} as observações y(t) podem
ser descritas como uma função de regressão linear cujos coeficientes são iguais
aos remanescentes desconhecidos { }ki
kke βα φ ≡ , como na eq. (3.17).
) (3.17) ()(1
teetyn
k
tik
k +=∑=
ωβ
Uma forma de se obter {βk}, se desejado, é através de um método por
mínimos quadrados (LS – Least Squares). Alternativamente, as potências {αk2} -
para um dado conjunto {ωk} - podem ser determinadas a partir da versão amostral
da eq. (3.15), dada por:
(3.18) ( ) resíduosekrn
p
kip
p += ∑=1
2ˆ ωα
onde os resíduos surgem pela limitação do número de amostras coletadas (finito).
A eq. (3.18) também representa um problema de regressão linear, com os
coeficientes desconhecidos dados por {αp2}.
Alguns dos principais métodos paramétricos descritos a seguir são
conhecidos como “métodos de alta-resolução”. Tal denominação se deve a sua
habilidade em resolver componentes discretas espectrais separadas em freqüência
(f = ω/2π) por menos que 1/N ciclos por intervalo amostral, que é o limite para os
métodos clássicos. Entretanto, deve-se destacar que a comparação entre os
métodos de alta-resolução e os clássicos chega a ser injusta partindo-se do
princípio que estes últimos nada assumem quanto aos dados analisados, enquanto
3 Estimação espectral 55
que os de alta-resolução exploram uma descrição exata do sinal estudado. Devido
à essa informação adicional assumida, é esperado que um método paramétrico
ofereça melhor resolução que um não-paramétrico. Por outro lado, quando não há
componentes espectrais com separação menor que o limite 1/N, o periodograma
convencional é um bom estimador espectral, podendo apresentar desempenho
equivalente ao dos métodos de alta-resolução. Em particular, o periodograma
convencional foi evidenciado, pois ele é o estimador não-paramétrico de melhor
resolução, já que ele pode ser entendido como um estimador de Blackman-Tuckey
com janela retangular, que é a janela que permite a maior resolução.
Assume-se, na descrição dos métodos a seguir, que o número de
componentes senoidais n é conhecido. Na prática, entretanto, determinar este
número corresponde a mais um problema de estimação a partir dos dados
disponíveis.
3.3.1. Método não-linear por mínimos quadrados
Uma abordagem intuitiva para a análise espectral, baseada no modelo de
regressão não-linear da eq. (3.14), consiste em determinar os parâmetros
desconhecidos como aqueles que minimizam a seguinte função:
( ) ( ) ( )2
1 1,, ∑ ∑
= =
+−=N
t
n
k
tik
kketyF ϕωαϕαω (3.19)
onde ω é o vetor que contém as freqüências ωk, e analogamente para α e ϕ. O
modelo senoidal determinado acima apresenta a menor distância (quadrática) para
os dados observados . Uma vez que a função F acima é não-linear com
relação a seus argumentos {ω, α, ϕ}, o método que obtém estimativas destes
parâmetros, segundo a minimização acima, é chamado não linear por mínimos
quadrados (NLS – Nonlinear Least Squares). E quando o ruído e(t) é gaussiano e
branco, a minimização acima pode ser interpretada ainda como o método de
máxima verossimilhança (ML – Maximum Likelihood). Neste caso, pode-se
provar que a estimativa dada pela minimização previamente citada produz os
valores mais prováveis para “explicar” a seqüência de dados observada.
( ){ }Ntty 1=
3 Estimação espectral 56
O critério na eq. (3.19) depende tanto de {αk}, quanto de {ϕk}, bem como
de {ωk}. Entretanto, ele pode ser “concentrado com relação aos parâmetros de
perturbação” {αk, ϕk}, conforme explicado a seguir. Utilizando a notação:
(3.20) kikk e ϕαβ =
(3.21) [ Tnβββ L1= ]
]
)
]
(3.22) ( ) ( )[ TNyyY L1=
(3.23)
=n
n
iNiN
ii
ee
eeB
ωω
ωω
L
MM
L
1
1
a função F da eq. (3.19) pode ser reescrita como:
(3.24) ( ) ( ββ BYBYF −−= *
A matriz de Vandermonde1 B na eq. (3.23) apresenta posto de coluna
completo igual a n sob a condição que N ≥ n; neste caso, (B*B)-1 existe. A função
F pode ser então reescrita de forma mais conveniente como a seguir:
( )[ ] [ ] ( )[ ] ( ) YBBBBYYYYBBBBBYBBBF *1****1***
*1* −−−−+−−= ββ (3.24)
Para qualquer escolha de ω em B (que seja tal que
para k ≠ p), pode-se escolher B para tornar o gradiente de F em (3.24)
igual a um vetor nulo. Com isso, os vetores β e ω que minimizam F são:
[ Tnωω ,,1 K=
pk ωω ≠
1 Uma matriz A ∈ Cmxn é dita de Vandermonde se apresenta a seguinte estrutura:
, onde zk ∈ C e são normalmente assumidos distintos.
=
−− 111
1
11
mn
m
n
zz
zzA
L
MM
L
3 Estimação espectral 57
( ) ωωβ ˆ*1*ˆ
=
−= YBBB (3.25)
(3.26) ( ) YBBBBY *1**maxargˆ −=
ωω
A estimativa de ω converge à medida que N → ∞ (ela é dita “consistente”),
e pode-se provar que, quando o ruído é gaussiano e branco, a matriz covariância
dos erros tende assintoticamente para a matriz limitante de Cramér-Rao. Ou seja,
o método proporciona uma estimativa de excelente precisão.
Outra vantagem associada ao método NLS, particularmente quando
comparado aos métodos sub-espaciais apresentados a seguir, é que o método não
depende criticamente da hipótese de ruído branco. Mesmo quando o ruído não é
branco, a estimativa NLS ainda permanece consistente. E mesmo quando o ruído
é colorido, prova-se que a estimativa NLS permanece como o método mais
preciso.
A grande desvantagem do método NLS se deve à forma multimodal
complicada, com um máximo global para a eq. (3.26) muito agudo. Ou seja,
encontrar ω com um algoritmo de busca requer uma inicialização muito precisa.
E apesar de se encontrar na literatura diversos métodos de inicialização, nenhum
efetivamente pode garantir convergência para o máximo global.
ˆ
3.3.2. Método de Pisarenko e MUSIC
Os métodos de Pisarenko [17] e MUSIC (MUltiple SIgnal Classification –
classificação de sinais múltiplos) [18] são derivados do chamado “modelo de
matriz covariância”. Para descrever este modelo, sejam as seguintes matrizes:
(3.27) ( ) ( )[ ]( ) ( )[ ] ( )nmaaA
eea
n
Tmii
×== −−−
ωωω ωω
K
K
1
11
onde m (número de amostras) é um inteiro positivo. A matriz A é uma matriz de
Vandermonde, que goza da seguinte propriedade quanto a seu posto:
posto(A) = n (para m ≥ n) (3.28)
3 Estimação espectral 58
Dada a notação acima, e tomando o sinal y(t) da eq. (3.14), têm-se:
(3.29) ( )
( )( )
( )
( ) ( )tetxA
mty
tyty
ty ~~
1
1~ +=
+−
−=∆
M
(3.30) ( ) ( ) ( )[ ]( ) ( ) ( )[ ]T
Tn
mtetete
txtxtx
1~
~1
+−=
=
K
K
A matriz covariância do vetor da eq. (3.29) é dada por: )(~ ty
(3.31) ( ) ( ){ } IAPAtytyER 2**~~ σ+==∆
onde a matriz P é dada por:
(3.32) ( ) ( ){ }
==2
21
*
0
0~~
n
txtxEPα
αO
As equações acima constituem o modelo de matriz covariância dos dados
analisados. A autoestrutura de R contém informação completa sobre as
freqüências {ωk}, daí a utilidade da eq. (3.31).
Conforme previamente mencionado, os métodos de Pisarenko e MUSIC são
derivados do modelo acima descrito, com m > n. Sejam λ1 ≥ λ2 ≥ ... ≥ λm os
autovalores de R na eq. (3.31), arrumados em ordem decrescente. Sejam {s1, ...,
sn} os autovetores ortonormais associados com {λ1, ..., λn}, e seja ainda {g1, ...,
gm-n} um conjunto de autovetores ortonormais correspondentes a {λn+1, ..., λm}.
Como o posto de APA* é igual a n, esta matriz apresenta n autovalores
estritamente positivos, e os (m – n) restantes são todos nulos. Combinando esta
observação com o fato que λ , onde são os
autovalores de APA
( )mkkk ,,1~ 2 K=+= σλ { }m
kk 1~
=λ* (arrumados em ordem decrescente), chega-se ao seguinte
resultado:
3 Estimação espectral 59
(3.33)
+==
=>
mnkpara
nkpara
k
k
,,1
,,12
2
K
K
σλ
σλ
O conjunto de autovalores de R pode ser então dividido em dois sub-
conjuntos. Os autovetores associados com cada um destes subconjuntos possuem
propriedades interessantes que são utilizadas para a estimação frequencial. Sejam
as matrizes:
[ ] ( )[ ] (( nmmggG
nmssS
nm
n
−×=
×=
−K
K
1
1
)) (3.34)
compostas pela justaposição dos autovetores dos dois subconjuntos em questão. A
matriz covariância R da eq. (3.31) pode ser escrita em função de seus autovalores
como: { }mkk 1=λ
(3.35) [ ]
=
*
*1
GS
GSR
mλ
λO
Das eqs. (3.31) e (3.33) tem-se:
(3.36)
==+=
+
m
n
GGGGAPARGλ
λσσ
0
0122* O
Ou seja, na equação acima, percebe-se que APA*G é nula. Mais ainda, como
AP tem posto completo, na verdade quem se anula é o termo A*G. Em outras
palavras, as colunas {gk} de G pertencem ao subespaço nulo de A*. Como o posto
de A é igual a n, a dimensão do subespaço nulo de A* é igual a (m – n) que
também é a dimensão do subespaço de G. Com isso, pode-se afirmar que o
subespaço de G é igual ao subespaço nulo de A*, ou seja, que os vetores {gk}
geram ambos os subespaços. Analogamente, prova-se que o subespaço de S é
3 Estimação espectral 60
igual ao subespaço de A. Os subespaços de S e de G são usualmente chamados de
“subespaço de sinal” e “subespaço de ruído”, respectivamente.
Da discussão prévia, chega-se à conclusão chave que os valores originais de
freqüência { } são as únicas soluções da equação: nkk 1=ω
(3.37) ( ) ( ) nmqualquerparaaGGa >= 0** ωω
O algoritmo MUSIC utiliza o resultado chave acima para calcular
estimativas frequenciais, de acordo com o seguinte roteiro. Inicialmente, calcula-
se a matriz covariância amostral:
∑=
=N
mt
tytyN
R )(~)(~1ˆ * (3.38)
e sua autodecomposição. Analogamente, sejam e G as matrizes
correspondentes a S e G respectivamente, mas construídas a partir dos autovetores
e { de . O segundo passo é determinar as estimativas
frequenciais como as localizações dos n picos mais altos da função:
S ˆ
{ }nss ˆ,,ˆ1 K } Rnmgg −ˆ,,ˆ1 K
( ) ( )
[ ππωωω
,,ˆˆ1
**−∈
aGGa] (3.39)
que é chamada algumas vezes de “pseudo-espectro”, já que ele indica a presença
das componentes senoidais no sinal estudado, mas não é uma PSD verdadeira. Por
causa desta característica, este procedimento é conhecido como “MUSIC
espectral”.
Para m = n + 1 (valor mínimo possível), o algoritmo MUSIC se reduz ao
chamado método de Pisarenko, que foi a primeira proposta de estimação
frequencial sub-espacial. Computacionalmente, este método é a versão mais
simples possível do MUSIC, com o benefício adicional de não haver a
necessidade de separar os autovalores de sinal dos de ruído (é simplesmente o
menor valor). Entretanto, a precisão do MUSIC cresce significativamente com m,
3 Estimação espectral 61
e, portanto, o preço pago pela simplicidade computacional do método de
Pisarenko pode ser uma precisão estatística relativamente pobre.
3.3.3. ESPRIT
Sejam:
(3.40) [ ] nmAIA m ×−= − )1(011
(3.41) [ ] nmAIA m ×−= − )1(0 12
onde A é definida como na eq. (3.27), Im-1 é a matriz identidade de dimensão (m-
1)×(m-1) e as matrizes [ ] e são (m-1)×m. É facilmente
verificável que:
01−mI [ 10 −mI ]
]]
(3.42) DAA 12 =
onde a matriz D é dada por:
(3.43)
=−
−
ni
i
e
eD
ω
ω
0
01
O
Uma vez que D é uma matriz unitária2 a transformação na eq. (3.42) é uma
rotação. O método ESPRIT (Estimation of Signal Parameters by Rotational
Invariance Techniques – estimação de parâmetros de sinal por técnicas de
invariância rotacional) [19] baseia-se na transformação expressa na eq. (3.42)
como detalhado a seguir. A exemplo das eqs. (3.40) e (3.41), sejam:
(3.44) [ SIS m 011 −=
(3.45) [ SIS m 12 0 −=
2 Dada uma matriz quadrada A, a matriz composta pela justaposição de vetores coluna que
são os autovetores de A é dita “unitária”.
3 Estimação espectral 62
onde S é definida como na eq. (3.34). Ainda se referindo à descrição do MUSIC,
como o subespaço de S e A são os mesmos, tem-se que:
(3.46) ACS =
onde C é a matriz não-singular n×n (uma vez que tanto S quanto A têm posto de
coluna completo) dada por:
(3.47) 1* −Λ= SPAC
com a matriz Λ definida por:
(3.48)
−
−=Λ
2
21
0
0
σλ
σλ
n
O
Utilizando as eqs. (3.40) a (3.42) e (3.46) pode-se escrever:
(3.49) Φ==== −1
11122 SDCCSDCACAS
onde
(3.50) DCC 1−=Φ
Devido à estrutura de Vandermonde de A, as matrizes A1 e A2 apresentam
posto de coluna completo (igual a n). Com a eq. (3.46) em vista, S1 e S2 também
devem apresentar posto de coluna completo. Com isso, da eq. (3.49) a matriz Φ é
dada exclusivamente por:
(3.51) ( ) 2*1
11
*1 SSSS −
=Φ
3 Estimação espectral 63
A fórmula acima expressa Φ como uma função de algumas grandezas que
podem ser estimadas a partir das amostras disponíveis. A importância de se poder
estimar Φ reside no fato de que Φ e D apresentam os mesmos autovalores. A eq.
(3.50) é dita uma “transformação de similaridade” entre Φ e D.
Do exposto, o método ESPRIT estima as freqüências { } como
, onde { } são os autovalores da seguinte estimativa da matriz Φ:
nkk 1=ω
( kνarg− ) nkk 1ˆ=ν
(3.52) ( ) 2*1
11
*1
ˆ SSSS −=Φ
Deve-se ressaltar que a estimativa de Φ dada pela equação acima é obtida
implicitamente pela solução do seguinte sistema linear de equações:
(3.53) 21ˆˆˆ SS ≅Φ
por um método LS. Na prática, foi constatado empiricamente que uma maior
precisão pode ser obtida se a eq. (3.53) for resolvida por um método LS “total” (o
erro quadrático é tomado separadamente nos dois lados da equação).
A precisão estatística do ESPRIT é similar à dos demais métodos sub-
espaciais. Na verdade, na maioria dos casos o ESPRIT pode produzir estimativas
um pouco mais precisas que os demais métodos, a um custo computacional
similar. Mais ainda, no ESPRIT não há o problema da separação das “raízes”
(autovalores) de sinal das “raízes” de ruído, como observado na eq. (3.52). Em
função destes pontos positivos, o ESPRIT é usualmente o método recomendado
como a primeira escolha em aplicações de estimação frequencial.
3.4. Métodos espaciais
O problema de localizar n fontes radiantes usando-se um arranjo de m
sensores passivos, como ilustrado na Figura 9, é abordado aqui. A energia
irradiada pelas fontes pode ser acústica, eletromagnética, mecânica, etc e os
sensores podem ser quaisquer transdutores que convertam a energia recebida em
sinais elétricos. No caso em evidência desta tese, os sensores são antenas que
captam a energia eletromagnética irradiada por outras antenas de um sistema de
3 Estimação espectral 64
comunicações. O problema consiste essencialmente em determinar como a
energia está distribuída pelo espaço (no caso, ar), com as posições das fontes
representando pontos no espaço com alta concentração de energia. Daí a
denominação do problema como de “estimação espectral espacial”. Mais ainda, o
problema em questão apresenta forte ligação com o problema da estimação
espectral temporal, abordado nas seções anteriores deste texto, e que são a base
das soluções adotadas para o problema da localização de fontes.
Figura 9 Ilustração do problema da localização de fontes.
As fontes da Figura 9 geram um campo ondulatório que viaja através do
espaço e é amostrado, tanto no espaço quanto no tempo, pelo arranjo de sensores.
Analogamente à amostragem temporal, a amostragem espacial provê mais
informação sobre as ondas que chegam, à medida que a abertura do arranjo
aumenta. Uma definição simplificada para abertura é o espaço ocupado pelo
arranjo em unidades de comprimento de onda do sinal. Não é surpresa, portanto,
que um arranjo de sensores seja capaz de prover desempenho bem superior que
uma antena isolada, em aplicações como antenas inteligentes e sistemas de
localização.
O desenvolvimento do modelo de arranjo (array model) é baseado em
algumas hipóteses simplificadoras. Para começar, as fontes atendem à condição de
campo distante do arranjo. Para a abordagem nesta seção, assume-se ainda um
problema bidimensional (2D), ou seja, as fontes e os sensores ocupam um mesmo
plano no espaço. As fontes são consideradas emissores pontuais. O meio de
propagação é homogêneo, e as ondas ao chegarem nos sensores são planas. Sob
estas hipóteses, o único parâmetro que caracteriza as posições das fontes é o
chamado ângulo de chegada (AOA) ou direção de chegada (DOA).
3 Estimação espectral 65
Outra hipótese assumida no desenvolvimento do modelo de arranjo é que o
número de fontes n é conhecido. Na prática, entretanto, a estimação de n é um
problema de importância significativa, normalmente referido como “problema de
detecção”. E por fim, assume-se que os sensores no arranjo podem ser modelados
como sistemas lineares invariantes no tempo, com funções de transferência e
localizações conhecidas. Em suma, assume-se que o arranjo está “calibrado”.
3.4.1. Modelo de arranjo
Inicialmente será considerado o caso de um único emissor. Estabelecido o
modelo para este caso, o modelo geral para um número qualquer de fontes é
obtido simplesmente pelo princípio da superposição.
Seja uma onda incidente em um arranjo e seja x(t) o valor do sinal medido
em um ponto de referência, no instante t. O “ponto de referência” pode ser um dos
sensores do arranjo (mais comum), ou qualquer outro ponto próximo o suficiente
do arranjo para que as hipóteses assumidas para o problema se mantenham. Os
sinais recebidos pelos elementos do arranjo são ondas contínuas e, portanto, t é
uma variável contínua por enquanto.
Seja τk o tempo necessário para que a onda viaje do ponto de referência ao
sensor k (k = 1, ..., m). A saída do sensor k pode ser escrita como:
( ) ( ) ( ) ( )tetxthty kkkk +−∗= τ (3.54)
onde ( )thk é a resposta ao impulso do k-ésimo sensor, “*” denota a operação de
convolução, e ( )tek é um ruído aditivo. Na eq. (3.54), ( )thk é assumido
conhecido e o sinal de entrada x(t), assim como o retardo τk são desconhecidos. Os
parâmetros que caracterizam a localização da fonte entram na eq. (3.54) através de
{τk}. Portanto, o problema de localização da fonte é basicamente o de se estimar o
tempo de retardo para a entrada desconhecida.
A transformada de Fourier do sinal de saída do sensor k pode ser escrita
como:
3 Estimação espectral 66
( ) ( ) ( ) ( )ωωωω ωτk
ikk EeXHY k += − (3.55)
Como o problema em questão envolve sinais de comunicações, assume-se
que o sinal x(t) é um sinal modulado real, ou seja, um sinal passa-banda. Para fins
de processamento de sinal, é mais conveniente trabalhar-se com o sinal em banda
básica original s(t). Sendo ωc a freqüência da portadora, no domínio da freqüência
têm-se as seguintes relações entre x(t) e s(t), que também é chamada de envoltória
complexa de x(t):
(3.56) ( ) ( ) ( )( cc SSX ωωωωω −+−= ∗ )+
( ) ( ) ( )tietts ϕα= (3.57)
( ) ( )[ ] ( ) ( )( tttetstx cti c ϕωαω +== cos2Re2 ) (3.58)
Substituindo a eq. (3.56) na eq. (3.55), tem-se:
( ) ( ) ( ) ( )[ ] ( )ωωωωωωω ωτk
icckk EeSSHY k +−−+−= −∗ (3.59)
Seja o sinal demodulado do sensor k e Y sua transformada de
Fourier:
( )tyk~ ( )ωk
~
( ) ( ) tikk
cetyty ω−=~ (3.60)
( ) ( ) ( ) ( )[ ] ( ) ( cki
cckk EeSSHY kc ωωωωωωωω τωω ++−−++= +−∗ 2~ ) (3.61)
Utilizando um filtro passa-baixas para eliminar a componente em torno de
2ωc, tem-se:
( ) ( ) ( ) ( ) ( cki
ckk EeSHY kc ωωωωωω τωω +++= +− )
)
(3.62)
onde e são as parcelas filtradas de ( )ckH ωω + ( ckE ωω + ( )ckH ωω + e
( )cωω +kE , respectivamente.
3 Estimação espectral 67
Adota-se agora a chamada hipótese faixa-estreita, na qual |S(ω)| decresce
rapidamente com o aumento de |ω|. Com isso, a eq. (3.62) pode ser aproximada
para:
(3.63) ( ) ( ) ( ) ( )cki
ckk EeSHY kc ωωωωω τω ++= −
(3.64) ( ) ( ) ( ) ( )tetseHty ki
ckkkc += − τωω
onde ek(t) é na verdade a transformada inversa de Ek(ω + ωc).
A implementação em hardware requerida para se obter {yk(t)} está ilustrada
na Figura 10. No esquema desta figura, amostras das componentes real e
imaginária do sinal analógico em banda básica yk(t) são geradas, e em seguida
digitalizadas. A taxa de amostragem tende a ser baixa, pois está associada à
largura do sinal em banda básica, aplicando-se o critério de Nyquist. Esta versão
amostrada digitalmente de {yk(t)} é utilizada por um “processador digital” para
estimar a DOA. A forma digital de {yk(t)} satisfaz a uma equação análoga à eq.
(3.64). Para não haver confusão de notação entre as versões analógica e digital de
{yk(t)}, a partir daqui a variável temporal t assumirá o domínio discreto, tomando
os valores t = 1, ..., N.
Figura 10 Diagrama em blocos simplificado do processamento analógico em um
elemento (sensor) receptor de um arranjo.
O conceito de “vetor diretor” ou “vetor de transferência do arranjo”
(direction vector ou array transfer vector, respectivamente [22-24]) assume a
forma de:
3 Estimação espectral 68
(3.65) ( ) ( ) ( )[ Ticm
ic
mcc eHeHa τωτω ωωθ −−= K11 ]
]
]
}
]
onde θ denota a DOA da fonte, que é o parâmetro de interesse no problema em
questão. Uma vez que se assume o conhecimento prévio das funções de
transferência e das posições dos sensores no arranjo, o vetor na eq. (3.65) é função
unicamente de θ, como indicado pela notação usada. A partir das eqs. (3.65) e
(3.64), tem-se:
(3.66) ( ) ( ) ( ) ( )tetsaty += θ
onde
(3.67) ( ) ( ) ( )[ Tm tytyty K1=
(3.68) ( ) ( ) ( )[ Tm tetete K1=
são os vetores de saída do arranjo e de ruído aditivo, respectivamente. Cabe
salientar que θ entra na eq. (3.65) não só através de {τk}, mas também através de
{Hk(ωc)}. Em alguns casos, os sensores são considerados onidirecionais sobre o
domínio DOA de interesse, e então { são independentes de θ. Mais
ainda, em certos casos os sensores são assumidos idênticos. Nesta situação, se o
sinal H(ω
( ) mkckH 1=ω
c)s(t) for redefinido como s(t) e o primeiro sensor for selecionado como
o ponto de referência, a eq. (3.65) pode ser simplificada para:
(3.69) ( ) [ Tii mcc eea τωτωθ −−= K21
A extensão da eq. (3.66) para o caso de fontes múltiplas é direta, dada a
hipótese que os elementos do arranjo são lineares. O princípio da superposição
leva ao seguinte modelo de arranjo:
3 Estimação espectral 69
(3.70) ( ) ( ) ( )[ ]( )
( )( ) ( ) ( )tetsAte
ts
tsaaty
n
n +≡+
= MK
1
1 θθ
onde θk é a DOA da k-ésima fonte e s(t) o sinal correspondente à k-ésima fonte. A
matriz A é usualmente chamada de array manifold. É interessante salientar que o
modelo acima se baseia principalmente na hipótese faixa-estreita. A hipótese de
onda plana ainda não foi usada até aqui. Esta hipótese é utilizada para derivar a
dependência explícita de {τk} como função de θ. Para exemplificar esta
dependência, uma geometria especial para o arranjo será abordada: a uniforme
linear.
A Figura 11 ilustra um arranjo com m sensores idênticos uniformemente
separados ao longo de uma linha. Tal arranjo é comumente referido como um
arranjo linear uniforme (ULA – Uniform Linear Array). Seja d a distância entre
dois sensores consecutivos, e θ a DOA do sinal iluminando o arranjo, medida no
sentido anti-horário com relação à normal à linha dos sensores. Então, sob a
hipótese de ondas planas e que o primeiro elemento é escolhido como o ponto de
referência, tem-se:
( ) ( ) [ °°−∈−= 90,90,sen1 θθ
τ parac
dkk ]
]
(3.71)
onde c é a velocidade de propagação da onda incidente (velocidade da luz no caso
de ondas eletromagnéticas). Inserindo a eq. (3.71) na eq. (3.69) tem-se:
(3.72) ( ) ( )[ Tcdmicdi cc eea /sen1/sen1 θωθωθ −−−= K
Figura 11 Exemplo de arranjo linear uniforme (ULA).
3 Estimação espectral 70
A restrição de θ para pertencer ao intervalo [-90o, 90o] é uma limitação de
ULAs: duas fontes em localizações simétricas com relação à linha do arranjo
compreendem conjuntos idênticos de retardos {τk}, não podendo ser distinguidas
uma da outra. Na prática, esta ambigüidade é eliminada usando-se sensores que
recebam sinais apenas dentro do intervalo permitido.
Sendo λ o comprimento de onda do sinal, define-se:
λθθ sensen d
cdff cs == (3.73)
Com a notação acima, o vetor de transferência do arranjo descrito pela eq.
(3.72) pode ser reescrito como:
(3.74) ( ) ( )[ Tmii ss eea ωωθ 11 −−−= K ]
que é um vetor de Vandermonde completamente análogo ao vetor composto pelas
amostras uniformes de um sinal senoidal { }ti se ω− .
Explorando a analogia acima, inicialmente chama-se fs (ωs = 2πfs) de
“freqüência espacial”. Em segundo lugar, recordando o teorema da amostragem
de Nyquist, se um sinal senoidal contínuo no tempo com freqüência fc deve ser
amostrado de modo a não produzir efeitos de aliasing, a taxa amostral deve
satisfazer a f0 ≥ 2fc. No caso da ULA em questão, verifica-se que o vetor na eq.
(3.74) é definido unicamente (ou seja, sem aliasing espacial) se e somente se |ωs|
≤ π. Ou equivalentemente:
221 sen λθ ≤⇔≤ df s (3.75)
que é satisfeito se d ≤ λ/2. Uma vez que a ULA pode ser interpretada como um
amostrador espacial uniforme da onda incidente, este último critério simplesmente
diz que o período amostral (espacial) d deve ser menor que metade do
3 Estimação espectral 71
comprimento de onda do sinal. Por analogia, este resultado é usualmente
interprestado como teorema amostral de Nyquist espacial.
Com o modelo de arranjo da eq. (3.70), o problema de se encontrar DOAs
pode ser reduzido ao de estimação dos parâmetros {θk} naquela equação. Como
há uma analogia direta entre a eq. (3.70) e o modelo para sinais senoidais ruidosos
da eq. (3.29), é de se esperar que a maioria dos métodos disponíveis para a
estimativa espectral temporal também possam ser utilizados para o problema da
estimação de DOA.
3.4.2. Métodos não-paramétricos
Os métodos aqui descritos não fazem nenhuma hipótese inicial sobre a
estrutura de covariância dos dados. Como tais, eles são ditos “não paramétricos”.
Entretanto, nesses métodos o arranjo precisa estar calibrado, é necessário o
conhecimento prévio do vetor de transferência a(θ) associado ao arranjo.
A Figura 12 faz uma analogia entre uma filtragem temporal FIR (Finite
Impulse Response – resposta ao impulso finita) e uma filtragem espacial usando
um arranjo de sensores. No caso temporal discreto, um filtro FIR é definido por:
(3.76) ( ) ( ) ( )∑−
=
∗≡−=1
0
m
kkF tyhktuhty
onde {hk} são os pesos dos filtros, u(t) é o sinal na entrada do filtro e:
(3.77) [ ∗−= 10 mhhh K ]
] (3.78) ( ) ( ) ( )[ Tmtututy 1+−= K
De forma análoga, as amostras espaciais { obtidas com um arranjo
de sensores podem ser usadas para definir um filtro espacial:
( )}mkk ty 1=
(3.79) ( ) ( )tyhtyF∗=
3 Estimação espectral 72
Figura 12 Analogia entre amostragem/filtragem temporal e as correspondentes
operações espaciais desempenhadas por um arranjo de sensores.
A saída (sem ruído) filtrada espacialmente de um arranjo iluminado por uma
frente de onda faixa-estreita com envoltória complexa s(t) e DOA igual a θ é dada
por:
( ) ( )[ ] ( )tsahtyF θ∗= (3.80)
Esta equação mostra claramente que o filtro espacial pode ser selecionado para
amplificar (atenuar) os sinais chegando de uma dada direção θ, fazendo h*a(θ) na
eq. (3.80) grande (pequeno). A abordagem aqui apresentada é conhecida como
“por banco de filtros”, e consiste resumidamente no seguinte. Se um filtro h é
projetado tal que deixe passar sem distorção os sinais com uma dada DOA θ e
atenue todas as outras DOAs diferentes de θ o máximo possível, então a potência
do sinal filtrado espacialmente na eq. (3.79), que é dada por:
( ){ } ( ) ( ){ tytyERRhhtyE F∗∗ == ,2 } (3.81)
deve apresentar uma boa indicação da quantidade de energia chegando na direção
θ. Portanto, h*Rh deve apresentar picos nas DOAs das fontes localizadas no
campo de visão do arranjo quando avaliadas sobre o domínio de DOAs de
interesse. Este fato é explorado para fins de estimação de DOA, como nos
métodos de “conformação de feixe” (beamforming) [20] e de Capon [21].
No método por conformação de feixe, o filtro associado deve atender à
seguinte condição:
3 Estimação espectral 73
(3.82) ( ) 1min =∗∗ θahasujeitohhh
A solução para o problema acima é dada por:
(3.83) ( ) ( ) ( )θθθ aaah ∗= /
Quando os sensores são idênticos, tem-se que:
(3.84) ( ) ( ) maa =∗ θθ
o que reduz a eq. (3.83) a:
(3.85) ( ) mah /θ=
que inserida na eq. (3.81) resulta em:
( ){ } ( ) ( ) 22 / mRaatyE F θθ∗= (3.86)
Como a matriz covariância teórica não pode ser determinada de maneira exata a
partir do conjunto finito de amostras disponíveis, em seu lugar toma-se sua
estimativa:
( ) ( )∑=
∗=N
t
tytyN
R1
1ˆ (3.87)
Desta forma e omitindo o termo 1/m2 em (3.86), que não traz influencia alguma à
estimação de DOA, obtém-se o método por conformação de feixe que determina
as DOAs como os n picos mais altos da função:
(3.88) ( ) ( )θθ aRa ˆ∗
3 Estimação espectral 74
A expressão acima é análoga à encontrada para o periodograma de
Blackman-Tukey (BT) com janela de Bartlett de largura 2m + 1. Ou seja, o
método por conformação de feixe é uma extensão espacial direta do
periodograma. De fato, a função na eq. (3.88) pode ser entendida como tendo sido
obtida pela média dos “periodogramas espaciais” sobre o conjunto de snapshots3
disponíveis (t = 1, ..., N):
( ) ( ) 2tya θ∗ (3.89)
A conexão supracitada entre a conformação de feixe e o periodograma BT
inclui as propriedades de resolução de ambos os métodos. Prova-se que a largura
de feixe do filtro espacial usado na conformação de feixe é aproximadamente
igual ao inverso da abertura do arranjo (em unidades de comprimentos de onda).
A analogia entre o periodograma BT e a conformação de feixe apresenta
alguns pontos de divergência. Por exemplo, a consistência da estimativa não
apresenta analogia total. Prova-se que a estimativa de DOA é consistente apenas
quando existe uma única direção de origem (n = 1). No caso geral de múltiplas
fontes, a estimativa é inconsistente.
Outra divergência na analogia supracitada, ainda que aparentemente
pequena, diz respeito à escolha da largura da janela (m). Para o periodograma BT,
a largura da janela de Bartlett é escolhida de acordo com a conveniência do
usuário, enquanto que na conformação de feixe m é fixo. Embora aparentemente
irrelevante, esta diferença tem grande impacto nas supracitadas propriedades de
consistência da conformação de feixe. Mais precisamente, prova-se que as
estimativas espectrais temporais por periodogramas com janela de Bartlett são
consistentes se m cresce sem limites à medida que o número de amostras N tende
a infinito. Para a conformação de feixe, por outro lado, o valor de m é limitado por
considerações físicas. Isto impede que a conformação de feixe apresente
estimativas consistentes no caso de fontes múltiplas. Uma dificuldade adicional
no caso espacial é que os sinais podem estar correlacionados um com o outro,
enquanto que no caso da estimação frequencial temporal os sinais são sempre
descorrelatados.
3Uma snapshot é o vetor y(t) obtido da amostragem no instante de tempo t.
3 Estimação espectral 75
Resumindo, para que se obtenha uma estimativa de DOA razoavelmente
precisa por conformação de feixe no caso geral (múltiplas fontes), é preciso
inicialmente que o modelo de arranjo da eq. (3.70) se aplique ao problema. Neste
caso, é preciso ainda que a separação mínima entre as DOAs seja maior que a
largura de feixe do arranjo (o que implica em m grande), que os sinais estejam
descorrelacionados, e que o ruído seja espacialmente branco. Quando estas
condições são obtidas, o problema geral se “desacopla” aproximadamente em n
espectros de fonte única, resultando em uma estimativa confiável.
O projeto de filtro espacial associado ao método de Capon é dado por:
(3.90) ( ) 1min =∗∗ θahasujeitoRhhh
A garantia que o sinal não seja distorcido para uma dada DOA é a mesma da
abordagem por conformação de feixe: . A outra condição associada ao
projeto do filtro é que distingue os dois métodos. Para atenuar as demais DOAs
que não a(s) desejada(s), no método de Capon a formulação é “dependente dos
dados” (aqui representados pela matriz covariância R), enquanto que na
conformação de feixe ela era independente. Conseqüentemente, o objetivo do
filtro de Capon apontado para uma certa DOA θ é atenuar qualquer outro sinal
que realmente incida sobre o arranjo vindo de uma DOA ≠ θ, enquanto que o
filtro de conformação de feixe distribui igualmente seu esforço para todas as
outras DOAs ≠ θ, mesmo que não haja sinal em várias destas DOAs.
( ) 1=∗ θah
A solução para a eq. (3.90) é dada por:
( )( ) ( )θθ
θaRa
aRh 1
1
−∗
−
= (3.91)
e quando inserida na eq. (3.81), que expressa a potência de saída, resulta em:
( ){ }( ) ( )θθ aRa
tyE F 12 1
−∗= (3.92)
3 Estimação espectral 76
Mais uma vez, como não é possível obter a matriz covariância R exata, usa-se
uma estimativa na equação acima. Com isso, as estimativas de DOA pelo método
de Capon são dadas pelos n picos mais altos da função:
( ) ( )θθ aRa 1ˆ
1−∗
(3.93)
Há uma hipótese implícita na equação acima que a matriz exista. Isto
pode ser garantido sob condições não muito restritivas; em particular, existe
com probabilidade 1 se N ≥ m e se o termo de ruído apresenta uma matriz
covariância espacial positivo-definida.
1ˆ −R1ˆ −R
Verifica-se empiricamente que a estimação de DOA pelo método de Capon
apresenta desempenho superior ao da conformação de feixe. A vantagem comum
aos dois métodos não paramétricos é que nada se assume quanto às propriedades
estatísticas dos dados, sendo apropriados portanto, às situações nas quais não se
disponha daquelas informações. Entretanto, quando tais informações são
disponíveis, por exemplo na forma de um modelo de covariância dos dados, o
desempenho dos métodos não paramétricos não se iguala ao da abordagem
baseada em modelos (paramétrica).
3.4.3. Métodos paramétricos
O modelo de arranjo da eq. (3.70) será utilizado aqui. Mais ainda, assume-se
que o ruído é espacialmente branco, com componentes apresentando variância
idêntica de modo que:
( ) ( ){ } IteteE 2σ=∗ (3.94)
Por sua vez, a matriz covariância do sinal:
( ) ( ){ }tstsEP ∗= (3.95)
é assumida não-singular (embora não necessariamente diagonal). Portanto os
sinais podem estar parcialmente correlacionados. Quando os sinais estão
3 Estimação espectral 77
totalmente correlacionados, de modo que P seja singular, diz-se que eles são
“coerentes”. Por fim, assume-se que os sinais e o ruído são descorrelatados um do
outro.
Sob as hipóteses anteriores, a matriz covariância teórica do vetor de saída do
arranjo é dada por:
( ) ( ){ } IAPAtytyER 2σ+== ∗∗ (3.96)
Há uma analogia direta entre o modelo de arranjo da eq. (3.70) com as
hipóteses acima expressas pelas eqs. (3.94) a (3.96) e com o modelo
correspondente para a estimativa espectral temporal do sub-capítulo 3.3. Mais
especificamente, o modelo de “regressão não linear” do arranjo expresso pela eq.
(3.70) é análogo à eq. (3.29), e o modelo de covariância do arranjo da eq. (3.96) é
praticamente o mesmo que o da eq. (3.31). Como conseqüência dessas analogias,
todos os métodos introduzidos no sub-capítulo 3.3 para estimação frequencial
podem ser usados também para estimação de DOA sem qualquer modificação
essencial. Os principais métodos daquele sub-capítulo serão revistos aqui,
destacando as diferenças entre as duas aplicações (estimação frequencial × DOA).
Um dos métodos paramétricos que merece destaque é o método NLS
(Nonlinear Least Squares- não linear por mínimos quadrados), que determina as
DOAs desconhecidas como sendo os elementos que minimizam a seguinte
função:
( ) ( )∑=
−=N
t
tAstyN
f1
21 (3.97)
A minimização com relação a {s(t)} resulta em:
(3.98) ( ) ( ) ( ) NttyAAAts ,,11K== ∗−∗
Após alguma manipulação algébrica das equações acima, prova-se que as
estimativas NLS de DOA são dadas por:
3 Estimação espectral 78
4{ }{ }
( )[ ]RAAAAtrk
kˆmaxargˆ 1 ∗−∗=
θθ (3.99)
Pode-se provar que a conformação de feixe apresenta uma solução
aproximada para o problema NLS acima, sempre que se saiba de antemão que as
DOAs estejam bem separadas umas das outras. Para compreender de modo
simplificado esta possibilidade, suponha-se que a busca pelos argumentos que
maximizam a eq. (3.99) seja restringida a um conjunto de DOAs bem afastadas
umas das outras (de acordo com a informação a priori de que as DOAs
verdadeiras pertencem a este conjunto). Num conjunto como este, sob
condições fracas, e portanto a função na eq. (3.99) pode ser aproximada para:
mIAA ≅∗
( )[ ] ( ) ( k
n
kk aRa
mRAAAAtr θθ∑
=
∗∗−∗ ≅1
1 ˆ1ˆ )
(3.100)
A função argumento do somatório no lado direito da equação acima é igual à
função determinada no método por conformação de feixe da eq. (3.88). Este
somatório é maximizado justamente com as estimativas de DOA obtidas por
conformação de feixe, que são os picos da eq. (3.88), dentro do conjunto
considerado.
Uma diferença entre a eq. (3.99) e o problema de otimização correspondente
na aplicação de estimação frequencial reside no fato de que, neste último, apenas
uma snapshot de dados está disponível, em contraste com as N snapshots
disponíveis na aplicação de estimação de DOA. Outra diferença ainda mais
importante é que para os casos não ULA, a matriz A na eq. (3.99) não apresenta a
estrutura de Vandermonde da matriz correspondente na eq. (3.25) da aplicação
frequencial. Conseqüentemente, diversos algoritmos utilizados para resolver
(aproximadamente) o problema de estimação frequencial não mais se aplicam à
solução da eq. (3.99), a menos que o arranjo seja ULA.
O algoritmo MUSIC desenvolvido no sub-capítulo 3.3 para aplicação de
estimação frequencial, pode ser utilizado sem modificação para estimação de
4O traço de uma matriz é definido como tr mmCA ×∈ ( ) ∑=
≡m
iiiAA
1
3 Estimação espectral 79
DOA. Há apenas algumas pequenas diferenças entre as aplicações frequencial e
espacial, conforme enunciadas a seguir.
Inicialmente, na aplicação espacial a geometria ULA admite a flexibilidade
de escolha quanto ao tipo de estimação MUSIC: a espectral da eq. (3.39); ou a
Root MUSIC, que busca as raízes da eq. (3.37). Para a maioria das outras
geometrias, apenas o MUSIC espectral se aplica.
Em segundo lugar, o algoritmo MUSIC padrão da eq. (3.39) falha no caso
de sinais coerentes, pois nesta situação a condição de posto assumida não mais se
mantém – o posto de APA* = n na eq. (3.31). Entretanto, para arranjos ULA é
possível utilizar-se o chamado algoritmo MUSIC “modificado” (próprio para
sinais coerentes).
O algoritmo ESPRIT [25] por sua vez, pode ser utilizado para estimação de
DOA exatamente como é feito para estimação frequencial. No caso não ULA, o
ESPRIT pode ser utilizado apenas em certas situações. Mais precisamente, o
ESPRIT pode ser usado para estimação de DOA somente se o arranjo utilizado
contiver dois sub-arranjos idênticos deslocados um do outro por um vetor
deslocamento conhecido, como ilustrado na Figura 13. Matematicamente, esta
condição pode ser formulada da seguinte forma. Seja m o número de sensores
nos dois sub-arranjos gêmeos, e sejam A1 e A2 as sub-matrizes de A
correspondentes a estes sub-arranjos. Uma vez que os sensores no arranjo são
numerados arbitrariamente, não há restrição quanto a assumir que A1 é composto
pelas primeiras m linhas em A e A2 das últimas m , ou seja:
[ ] ( nmAIA m ×= 01 ) (3.101)
[ ] ( nmAIA m ×= 02 ) (3.102)
onde mI denota a matriz identidade m×m . Observa-se que os dois sub-arranjos
se sobrepõem se 2/mm > ; caso contrário, elas podem não se sobrepor. Se o
arranjo for construído propositalmente para atender à condição de sub-arranjos do
ESPRIT, então normalmente 2/m=m e os dois sub-arranjos não se sobrepõem.
3 Estimação espectral 80
Figura 13 Condição para o uso do ESPRIT na aplicação de estimação de DOA: sub-
arranjos idênticos afastados por um vetor deslocamento conhecido.
Matematicamente, o requisito do ESPRIT significa que:
(3.103) DAA 12 =
com a matriz D definida por:
( )
( )
=−
−
nc
c
i
i
e
eD
θτω
θτω
0
01
O (3.104)
e com τ denotando o tempo necessário para que uma frente de onda incidente
sobre o arranjo na direção θ percorra a distância entre os pontos de referência dos
dois sub-arranjos gêmeos. Se θ é medido com relação à perpendicular da linha
entre os pontos centrais dos sub-arranjos, como ilustrado na figura 3.12, então um
cálculo similar ao que levou à eq. (3.71) mostra que:
( )θ
(3.105) ( ) cd /senθθτ =
onde d é a distância entre os dois sub-arranjos. Portanto, as estimativas das DOAs
podem ser obtidas prontamente a partir das estimativas dos elementos da diagonal
de D na eq. (3.104).
As eqs. (3.103) e (3.104) são basicamente equivalentes às eqs. (3.42) e
(3.43) do sub-capítulo 3.3, e portanto o método ESPRIT de estimação de DOA é
análogo ao estimador ESPRIT frequencial.
3 Estimação espectral 81
O método ESPRIT de estimação de DOA determina as estimativas de DOA
resolvendo um problema n × n de autovalores, assim como é feito na aplicação
frequencial. Não há busca envolvida, ao contrário dos métodos previamente
citados. Mais ainda, não existe o problema de separar as “DOAs de sinal” das
“DOAs de ruído”, também contrastando com métodos como o MUSIC. Por outro
lado, o ESPRIT só pode ser utilizado com a configuração de arranjo especial
citada previamente. Em particular, este requisito limita o número de fontes
solucionáveis em mn < (já que tanto A1 quanto A2 devem apresentar posto de
coluna completo). Deve-se salientar que os dois sub-arranjos não precisam estar
calibrados, embora eles precisem ser idênticos, e o ESPRIT pode ser sensível a
diferenças entre os dois sub-arranjos, da mesma forma que outros métodos como o
MUSIC são sensíveis a imperfeições na calibração dos arranjos. Por fim, percebe-
se ainda que o ESPRIT não é utilizável no caso de sinais coerentes, assim como
observado para os demais métodos paramétricos (à exceção do NLS).