4 solucionador iterativo proposto · parâmetros dos solucionadores iterativos. o método permite...
Post on 23-Aug-2020
5 Views
Preview:
TRANSCRIPT
132
137
4 Solucionador Iterativo Proposto
41 Introduccedilatildeo
Apoacutes terem sido apresentados nos capiacutetulos anteriores os fundamentos
necessaacuterios para a compreensatildeo das caracteriacutesticas do problema este capiacutetulo
descreve o solucionador iterativo proposto para resolver o subproblema linear
esparso associado ao meacutetodo de Newton-Raphson do problema de fluxo de
carga O solucionador eacute desenvolvido buscando agregar eficiecircncia e robustez
evitando as limitaccedilotildees das teacutecnicas numeacutericas analisadas nos capiacutetulos
anteriores
A fim de atingir as metas acima eacute proposto um preacute-condicionador baseado no
algoritmo de Doolittle (Bodewig 1956 Wilkinson 1965 Dahlquist amp Bjoumlrk 1974
Hoffman 2001) denominado deste ponto em diante de ILU(ξ) Aliado ao preacute-
condicionador tambeacutem se propotildee uma regra de preenchimento baseada no erro
resultante apoacutes o descarte de elementos explorando certas caracteriacutesticas do
meacutetodo de Doolittle visando facilitar o caacutelculo do referido erro
Consequumlentemente a regra pode decidir eficientemente se um dado elemento
em ambos os fatores triangulares L e U deve ser preenchido ou descartado
Neste capiacutetulo tambeacutem eacute proposto um meacutetodo para ajuste dos valores dos
paracircmetros dos solucionadores iterativos O meacutetodo permite identificar intervalos
de valores permissiacuteveis para cada um dos paracircmetros visando garantir a
robustez e melhorar o desempenho do solucionador
42 O Estado da Arte dos Solucionadores de Sistemas Lineares
Um solucionador eacute um termo geneacuterico associado a um programa computacional
que soluciona um problema matemaacutetico Dentro deste contexto um solucionador
de sistemas de equaccedilotildees lineares eacute um programa computacional que inclui um
133
137
meacutetodo numeacuterico de soluccedilatildeo de sistemas de equaccedilotildees lineares (direto ou
iterativo) e estrateacutegias numeacutericas desenvolvidas para melhorar seu desempenho
computacional
421 Solucionadores Diretos
Embora o estudo e avaliaccedilatildeo dos meacutetodos diretos natildeo seja um dos objetivos
desta tese existe a necessidade de adotar um solucionador direto para realizar
comparaccedilotildees com o solucionador iterativo que estaacute sendo proposto aqui Na
Tabela 41 apresenta-se uma siacutentese das principais caracteriacutesticas dos
solucionadores diretos mais usados em diversas aacutereas da engenharia e da
ciecircncia Como se pode observar na primeira coluna satildeo listados os nomes dos
solucionadores na segunda o tipo de meacutetodo direto adotado pelo solucionador
na terceira os tipos de reordenamento da matriz de coeficientes adotados pelo
solucionador e finalmente na uacuteltima coluna satildeo listadas as referecircncias para
cada solucionador nas quais pode-se obter maiores detalhes
Pode-se afirmar que existem basicamente 4 grandes categorias de meacutetodos
diretos usados nos solucionadores conhecidos como atualizaccedilatildeo imediata (right-
looking) atualizaccedilatildeo retrasada (left-looking) meacutetodo supernodal meacutetodo
multifrontal ou combinaccedilotildees destes Pode-se dizer tambeacutem que a maioria utiliza
o conjunto de sub-rotinas BLAS disponibilizada por (Dongarra et al 1990) para
realizar as principais operaccedilotildees esparsas de aacutelgebra linear (vetor matriz-vetor e
matriz-matriz)
Os solucionadores realizam fatoraccedilotildees do tipo LU sendo que o SPARSPAK e os
solucionadores do Matlab podem tambeacutem realizar fatoraccedilotildees do tipo QR Todos
os solucionadores satildeo capazes de operar com matrizes simeacutetricas e natildeo-
simeacutetricas Os meacutetodos de reordenamento disponiacuteveis satildeo do tipo grau miacutenimo
(minimum degree) e variantes como o miacutenimo preenchimento (minimum fill) grau
miacutenimo por colunas (column minimum degree) Markowitz e outros tambeacutem satildeo
considerados o reordenamento por divisatildeo encaixadauacutenico-sentido (nestedone-
way dissection) permutaccedilotildees por blocos triangulares e de reduccedilatildeo de largura de
banda como o conhecido Cuthill Mckee reverso RCM (Reverse Cuthill Mckee)
134
137
Tabela 41 ndash Caracteriacutesticas baacutesicas dos solucionadores diretos mais usados
Solucionador Tipo de Meacutetodo Direto Estrateacutegias
Implementadas Referecircncia
MA28 Atualizaccedilatildeo imediata
Markowitz Miacutenimo grau
e Bloco triangular (Duff amp Reid 1979)
SPARSPAK Atualizaccedilatildeo retrasada Miacutenimo grau
Divisatildeo encaixada e Cuthill Mckee reverso
(George amp Liu 1981)
Solucionadores de MATLAB
Vaacuterios Miacutenimo grau
Bloco triangular e Cuthill Mckee reverso
(Gilbert et al 1992)
MA48 Atualizaccedilatildeo retrasada Miacutenimo grau
Bloco triangular (Duff amp Reid 1996)
SuperLU Atualizaccedilatildeo retrasada
Supernodal Miacutenimo grau (Demmel et al 1999)
SuperLU _DIST Atualizaccedilatildeo imediata
Supernodal Miacutenimo grau (Li amp Demmel 2003)
PARDISO Atualizaccedilatildeo
imediataretrasada Supernodal
Miacutenimo grau e Divisatildeo encaixada
(Schenk amp Gartner 2001)
WSMP Multifrontal Miacutenimo grau
Divisatildeo encaixada e Bloco triangular
(Gupta 2002)
Solucionadores de Mathematica
Vaacuterios Miacutenimo grau
Divisatildeo encaixada e Bloco triangular
(Wolfram 2003)
UMFPACK Multifrontal Miacutenimo grau
e Escalonamento (Davis 2004)
Nestes solucionadores os aspectos a serem levados em consideraccedilatildeo para
desenvolver os algoritmos complexos heuriacutesticas e estrateacutegias apresentadas na
Tabela 41 basicamente satildeo a geraccedilatildeo do menor nuacutemero de elementos natildeo-
nulos possiacutevel durante o processo de fatoraccedilatildeo e tambeacutem a conservaccedilatildeo da
estabilidade numeacuterica mediante as estrateacutegias de reordenamento e
monitoramentoeleiccedilatildeo dos elementos pivocircs respectivamente
Neste trabalho o solucionador MA28 representaraacute os solucionadores diretos
quando realizadas as comparaccedilotildees de desempenho com o solucionador iterativo
proposto nesta tese Este solucionador foi escolhido principalmente porque
permite calcular o nuacutemero de operaccedilotildees de ponto flutuante pela facilidade para
ser acondicionado dentro do programa de fluxo de carga pela disponibilidade
135
137
total do coacutedigo do solucionador em linguagem FORTRAN e desempenho similar
a outros solucionadores diretos O MA28 permuta tanto linhas como colunas na
matriz de coeficientes A utilizando duas matrizes P e Q Este solucionador usa
principalmente as estrateacutegias de Markowitz e miacutenimo grau visando manter as
propriedades esparsas e o controle da perda da exatidatildeo devido aos erros de
arredondamento (Duff amp Reid 1979) Ambas as estrateacutegias satildeo executadas de
forma dinacircmica durante o processo de fatoraccedilatildeo (PmiddotAmiddotQ = LmiddotU)
No proacuteximo capiacutetulo satildeo usados dois programas computacionais ndash ANAREDE e
ORGANON (Chaves 2008 Jardim amp Stott 2005 CEPEL 2007) para validar os
resultados dos experimentos numeacutericos e realizar comparaccedilotildees principalmente
em termos de robustez e eficiecircncia computacional O ORGANON eacute um sistema
utilizado para avaliaccedilatildeo da seguranccedila de redes eleacutetricas de potecircncia que
emprega computaccedilatildeo de alto desempenho utilizando teacutecnicas numeacutericas
avanccediladas algoritmos especializados arquitetura construtiva flexiacutevel e
processamento distribuiacutedo (Chaves 2008) No ORGANON o problema de fluxo
de carga eacute solucionado de duas formas usando-se os modelos estaacuteticos da rede
eleacutetrica e o algoritmo de Newton-Raphson ou usando-se modelos dinacircmicos da
rede eleacutetrica e o meacutetodo de dinacircmica sinteacutetica (Jardim amp Stott 2005) Em
(Chaves 2008) satildeo feitas diversas e diferentes aplicaccedilotildees com este programa
em estudos de fluxo de potecircncia atraveacutes do meacutetodo convencional de Newton-
Raphson completo ou com o meacutetodo de Fluxo de Potecircncia de Dinacircmica Sinteacutetica
(FPDS) Este uacuteltimo obteacutem a soluccedilatildeo para o problema de fluxo de potecircncia (caso
essa exista) mesmo para casos em que os meacutetodos convencionais falhem e
ainda apenas soluccedilotildees estaacuteveis
Jaacute o programa de anaacutelise de redes (ANAREDE ndash versatildeo 090403) eacute um conjunto
de aplicaccedilotildees computacionais algoritmos e meacutetodos eficientes adequados agrave
realizaccedilatildeo de estudos nas aacutereas de operaccedilatildeo e de planejamento de sistemas
eleacutetricos de potecircncia No ANAREDE a soluccedilatildeo das equaccedilotildees da rede eleacutetrica eacute
realizada pelo algoritmo Newton-Raphson e o reordenamento da matriz
Jacobiana para preservar a esparsidade eacute efetuado utilizando a teacutecnica MD
(CEPEL 2007)
136
137
422 Solucionadores Iterativos Aplicados em Problemas de Sistemas de Energia Eleacutetrica
Na Tabela 42 apresenta-se uma siacutentese do estado da arte dos solucionadores
iterativos quando aplicados ao problema de fluxo de carga A maior parte das
informaccedilotildees associadas com os meacutetodos iterativos e estrateacutegias de preacute-
condicionamento de cada um destes solucionadores jaacute foi apresentada nas
seccedilotildees 241 242 e 34 dos capiacutetulos anteriores Algumas informaccedilotildees
associadas com outras estrateacutegias e teacutecnicas numeacutericas consideradas em
alguns destes solucionadores e que ainda natildeo foram mencionadas satildeo
apresentadas nas uacuteltimas duas colunas da Tabela 42 sendo estas
Em (Flueck e Chiang 1998) combina-se a teacutecnica de reordenamento RCM com
o meacutetodo GMRES e o preacute-condicionador fixo FastD Todas as simulaccedilotildees foram
realizadas usando RCM e um sistema de 8027 barras sendo o solucionador
proposto 50 mais raacutepido que o tradicional solucionador direto de fatoraccedilatildeo LU
Em (Dag e Semlyen 2003) o solucionador proposto usa teacutecnicas de
escalonamento na matriz Brsquo do meacutetodo desacoplado raacutepido obtendo-se bons
resultados em termos de robustez Poreacutem em (de Leon 2003) a proposta de
Dag eacute fortemente criticada pelo uso dos meacutetodos desacoplados junto aos
meacutetodos iterativos
Em (Pessanha et al 2009) avaliam-se os efeitos do reordenamento RCM e da
teacutecnica de maacuteximo produto transversal com escalonamento na qualidade do preacute-
condicionador ILUT(τρ) quase-fixo Os resultados mostram que este tipo de
preprocessamento da matriz Jacobiana melhora significativamente a qualidade
do preacute-condicionador consequentemente a robustez do solucionador
Nas uacuteltimas linhas da Tabela 42 apresentam-se as caracteriacutesticas baacutesicas do
solucionador proposto nesta tese destacando-se o preacute-condicionador ILU(ξ) com
regra de preenchimento baseada no erro Nas proacuteximas seccedilotildees todos os
componentes do solucionador proposto satildeo tratados com maiores detalhes
137
137
Tabela 42 ndash Caracteriacutesticas dos solucionadores iterativos usados em aplicaccedilotildees de fluxo de carga
Autor Ano Meacutetodo
Iterativo
Estrateacutegias Usadas
Preacute-condicionador Regra de Eliminaccedilatildeo Reordenamento Escalonamento
Galiana 1994 GConjugado Cholesky Incomp M=Lrsquo∙LrsquoT(0) Sem novos elementos natildeo-nulos mdash mdash
Mori 1996 Tchebychev Cholesky Incompleto Sem novos elementos natildeo-nulos mdash mdash
Semlyen 1996 GMRES(m) mdash mdash mdash mdash
Borges 1996(97) BiCGStab M = L∙U da primeira Iteraccedilatildeo mdash mdash mdash
Pai 1997 GMRES ILU(k) Niacutevel de novos elementos natildeo-nulos mdash mdash
Flueck 1998 GMRES(m) FastD M = Brsquo mdash RCM mdash
Alves 1999 GConjugado Cholesky completo mdash MD MST mdash
De Leoacuten 2002 BiCGStab GMRES QMR CGS BiCG + ILU() Com paracircmetro limitante
limitante
mdash mdash
Dag 2003 GConjugado Aproximaccedilatildeo da Inversa Polinocircmio de Chebyshev mdash D1∙Brsquo∙D2
Chen 2006 GMRES(m) Aprox da Inversa Adaptativa mdash mdash mdash
Mori 2007 BiCGStab ILU(k) Niacutevel de novos elementos natildeo-nulos mdash mdash
Pessanha 2009 GMRES ILUT( ρ) quase-fixo
Duplo paracircmetro limitante e ρ RCM mdash
Khaitan 2010 GMRES M = L∙U Multifrontal quase-fixo mdash RCM mdash
Solucionador Proposto GMRES ILU(ξ) Baseada no Erro MD mdash
138
137
43 Solucionador Iterativo Para Fluxo de Carga
O solucionador desenvolvido eacute composto basicamente pelo meacutetodo iterativo de
subespaccedilos de Krylov GMRES (vide Capiacutetulo 2) e pela estrateacutegia de preacute-
condicionamento de fatoraccedilatildeo incompleta ILU(ξ) com suporte da teacutecnica de
reordenamento Miacutenimo Grau (MD) A estrateacutegia de reinicializaccedilatildeo GMRES(m)
(apresentada em 26) usada para limitar o tamanho dos subespaccedilos de Krylov a
um valor maacuteximo ―m natildeo faz parte do solucionador uma vez que a estrateacutegia
de preacute-condicionamento forccedila a convergecircncia do GMRES em poucas iteraccedilotildees
lineares (uma ou duas iteraccedilotildees) Portanto jaacute que poucas iteraccedilotildees estatildeo
associadas a subespaccedilos pequenos entatildeo natildeo eacute necessaacuterio estabelecer um
valor maacuteximo ―m
Nesta tese adota-se a teacutecnica de reordenamento MD porque a mesma acarreta
a reduccedilatildeo significativa do nuacutemero de novos elementos natildeo-nulos gerados
reduzindo o esforccedilo computacional realizado para construir e usar o preacute-
condicionador Alem disso este tipo de reordenamento aumenta a taxa de
convergecircncia do meacutetodo iterativo GMRES O solucionador eacute denominado de
GMRES+ILU(ξ)+MD e foi implementado em um programa computacional de
fluxo de carga desenvolvido em linguagem Fortran da forma apresentada no
fluxograma da Figura 41 Seus componentes estatildeo destacados na cor vermelha
numerados por algarismos romanos na mesma ordem em que satildeo aplicados
Observa-se que antes de iniciadas as iteraccedilotildees Newton-Raphson eacute calculada a
sequumlecircncia de reordenamento usando-se a teacutecnica MD matematicamente
representada pela matriz de permutaccedilotildees P Na praacutetica eacute gerado um vetor com
a sequumlecircncia de reordenamento que permitiraacute montar a matriz Jacobiana jaacute
reordenada em cada iteraccedilatildeo k do algoritmo Newton-Raphson Esse vetor
tambeacutem eacute usado para reordenar os resiacuteduos de potecircncia ativa e reativa
armazenados no vetor bk Cada vez que o teste de convergecircncia do algoritmo
Newton-Raphson natildeo for satisfeito uma nova matriz Jacobiana reordenada eacute
montada A partir das informaccedilotildees da matriz Jacobiana reordenada a estrateacutegia
de preacute-condicionamento ILU(ξ) constroacutei um preacute-condicionador Mk que em
seguida seraacute usado para obter explicitamente o novo sistema linear preacute-
condicionado (41) a ser solucionado pelo meacutetodo iterativo GMRES Finalmente
139
137
as incoacutegnitas satildeo atualizadas em (42) O procedimento eacute repetido ateacute que o
teste de convergecircncia do algoritmo Newton-Raphson seja satisfeito
1 T 1k k kM P J P x M P b (41)
T
k 1 k
v vP x
(42)
Figura 41 ndash Fluxograma do Solucionador Iterativo para o problema de fluxo de carga
O programa de fluxo de carga modela as barras de acordo como seu tipo (PQ
PV e de referecircncia) as linhas de transmissatildeo transformadores e
140
137
transformadores defasadores satildeo representados pelos seus circuitos ᴨ
equivalentes Os tapes variaacuteveis sob carga podem ainda ter a atuaccedilatildeo contiacutenua
ou discreta As cargas das barras satildeo normalmente modeladas como potecircncias
ativa e reativa constantes ou podem ser expressas como uma funccedilatildeo da
magnitude da tensatildeo da barra Natildeo satildeo modelados elos de corrente contiacutenua
No algoritmo de fluxo de carga consideram-se o controle de variaccedilatildeo automaacutetica
de tape e os limites de geraccedilatildeo de potecircncia reativa
44 Regra de Preenchimento Baseada no Caacutelculo do Erro Associado ao Elemento Descartado
Uma forma simples de estimar o erro total R originado pelos elementos
descartados devido agraves regras de preenchimento da fatoraccedilatildeo incompleta eacute
usando-se (310) (Mori et al 1996 Saad 2003) Nesta equaccedilatildeo o produto dos
fatores triangulares incompletos eacute igual ao preacute-condicionador M e o produto dos
fatores triangulares completos eacute igual agrave matriz de coeficientes A como mostrado
em (311) Desta forma o erro R permite vislumbrar quatildeo diferente se tornou
o preacute-condicionador em relaccedilatildeo aos fatores triangulares completos apoacutes o
descarte de seus elementos
Um preacute-condicionador sem regra de preenchimento efetua completamente o
caacutelculo dos fatores triangulares Neste caso o preacute-condicionador M se iguala agrave
matriz de coeficientes (M = L∙U = A) o que resulta na convergecircncia do meacutetodo
GMRES em uma uacutenica iteraccedilatildeo com erro R nulo Poreacutem o nuacutemero de
operaccedilotildees de ponto flutuante ainda eacute consideraacutevel Para se obter esta reduccedilatildeo eacute
necessaacuterio usar uma regra de preenchimento que descarte o maior nuacutemero de
elementos nos fatores triangulares e sem que isso provoque o aumento do erro
R consequumlentemente afetando o desempenho do GMRES
R A M (43)
R L U L U (44)
Como exemplo na Figura 36 satildeo apresentados dois graacuteficos que ilustram como
os erros produzidos pelo descarte dos fatores triangulares natildeo-nulos podem se
alastrar ateacute em posiccedilotildees de elementos jaacute preenchidos O experimento foi
141
137
apresentado na seccedilatildeo 332 do capiacutetulo anterior para o sistema brasileiro de
3513 barras usando-se o preacute-condicionador ILU(0) para o caacutelculo dos fatores
incompletos No graacutefico da Figura 36(a) mostra-se que 8797 dos elementos
do preacute-condicionador M (83078) satildeo distintos dos encontrados na matriz
Jacobiana O graacutefico do erro em 42(b) permite se ter uma ideacuteia da dimensatildeo
destas diferenccedilas Dos 38738 elementos com erros entre 0 e 001 (pontos
azuis) 11360 tecircm erro igual a zero (elementos idecircnticos) e 27378 tecircm erros
menores que 001 Os erros nesta faixa de valores normalmente natildeo prejudicam
a convergecircncia do GMRES
As outras faixas de valores associadas aos pontos de cores verde amarelo e
vermelho normalmente prejudicam a convergecircncia do GMRES Esses erros
devem ser evitados e satildeo gerados quando alguns elementos importantes satildeo
descartados durante a fatoraccedilatildeo ILU(0) O maior erro provocado entre os
elementos de M e da Jacobiana eacute de 401931 e o erro total para este preacute-
condicionador eacute de 10632middot105 (norma de Frobenius) Para evitar que os erros
se propaguem enquanto eacute realizada a fatoraccedilatildeo eacute necessaacuterio calcular o erro
associado a cada elemento dos fatores triangulares antes de seu preenchimento
ou descarte Este erro deve tambeacutem considerar os erros propagados nos
caacutelculos futuros onde o elemento seja requerido Se este valor for zero ou
proacuteximo de zero entatildeo o elemento pode ser descartado caso contraacuterio deve ser
preenchido
a) Produto dos fatores incompletos (LrsquoUrsquo) do preacute-condicionador ILU(0)
b) Matriz R para o preacute-condicionador ILU(0)
Figura 42 ndash Erros produzidos pela regra de preenchimento com o preacute-condicionador ILU(0) para a matriz Jacobiana do sistema brasileiro de 3513 barras
142
Sejam L e U os fatores triangulares completos Lrsquo e Ursquo os fatores triangulares
incompletos apoacutes o descarte de um uacutenico elemento Lik o elemento descartado
em Lrsquo e Uki o elemento descartado em Ursquo (Lik = 0 ou Uki = 0) Usando a equaccedilatildeo
(311) (Mori et al 1996 Saad 2003 Benzi et al 1999b Benzi 2002) eacute possiacutevel
calcular o erro associado ao elemento Lik (45) e o erro associado ao elemento
Uki (46) Como mencionado anteriormente esses erros permitem ter uma ideacuteia
de quatildeo diferente se torna o preacute-condicionador M dos fatores triangulares
completos apoacutes os elementos Lik e Uki serem descartados Como os erros estatildeo
associados a um uacutenico elemento descartado as equaccedilotildees (45) e (46) podem
ser reescritas como em (47) e (48) respectivamente
R = L U - L Usdot sdot (45)
R = L U - L Usdot sdot (46)
)ik(LR = (L -L) Usdot (47)
)ik(UR = L (U-U)sdot (48)
Verifica-se que tanto a matriz diferenccedila (L-Lrsquo) como tambeacutem (U-Ursquo) possuem
apenas um elemento natildeo nulo Lik (descartado em Lrsquo) e Uki (descartado em Ursquo)
respectivamente como apresentado em (49) e (410)
ik
0
0 0
0 0 0
0 0 0 0
L L =
0 0 0 0 0
0 0 L 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
( - )
⋮ ⋱
⋯
⋯
⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱
⋯ ⋯ ⋯
(49)
143
ki
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 U 0 0
0 0 0 0 0
(U - U) =
0 0 0 0
0 0 0
0 0
0
⋯ ⋯ ⋯
⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯
⋯
⋯
⋱ ⋮
(410)
Pela substituiccedilatildeo de (49) e (410) nos produtos (L-Lrsquo)middotU como Lmiddot(U-Ursquo) resulta
em (411) e (412)
ik kk ik kk+1 ik ki ik kn
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
L - L) U =
0 0 0 0 0 0
0 0 L U L U L U L U
0 0 0 0 0 0
0 0 0 0 0 0
(
sdot
sdot sdot sdot sdot
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(411)
ki
k+1k ki
ik ki
nk ki
0 0 0 0 0
0 0 0 0 0
0 0 U 0 0
L (U - U) = 0 0 L U 0 0
0 0 L U 0 0
0 0 L U 0 0
sdot sdot
sdot
sdot
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
(412)
Conforme mencionado no capiacutetulo anterior uma das dificuldades para propor
uma regra de preenchimento estaacute em se reduzir o nuacutemero de operaccedilotildees
associadas com sua execuccedilatildeo dentro do algoritmo de preacute-condicionamento
144
Neste trabalho propotildee-se usar a norma-1 em (47) para o caacutelculo do erro
associado a um elemento de L e a norma-infin em (48) para o caacutelculo do erro
associado a um dado elemento de U como apresentado em (413) e (414) As
referidas normas aproveitam a estrutura das matrizes (411) e (412) evitando-se
a realizaccedilatildeo de operaccedilotildees adicionais sendo requeridas ao inveacutes disto apenas
comparaccedilotildees entre elementos Portanto substituindo (411) em (413) e (412)
em (414) e calculando-se as normas satildeo obtidas as equaccedilotildees (415) e (416)
que devem ser usadas na regra de preenchimento
)1ik(LR = (L -L) Usdot (413)
ki(U )R = L (U-U) infinsdot (414)
ik ik km(L )R = L max U m = [kn]sdot (415)
ki ki mk(U )R U max 1 L m=[k+1n]= sdot (416)
Na Figura 43 satildeo destacados em vermelho todos os elementos dos fatores
triangulares que satildeo requeridos para calcular o erro produzido quando o
elemento Lik (no quadrado) eacute descartado Jaacute na Figura 44 satildeo destacados em
azul todos os elementos necessaacuterios para calcular o erro produzido quando o
elemento Uki (encerrado no quadrado) eacute descartado Observa-se que para que
esta regra possa ser implementada tanto no fator triangular U como em L o
algoritmo de fatoraccedilatildeo deve ser capaz de calcular os elementos Ukk Ukk+1
Ukn (em vermelho) antes de decidir se o elemento Lik deve ser preenchido ou
descartado Semelhantemente deve ser capaz de calcular os elementos Lk+1k
Lnk (em azul) antes de decidir se o elemento Uki deve ser preenchido ou
descartado
145
Figura 43 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Lik
Figura 44 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Uki
45 Adequaccedilatildeo da Regra Baseada no Erro
Nesta seccedilatildeo a regra de preenchimento baseada no erro eacute adequada para ser
usada no preacute-condicionador ILUT(τρ) analisado no capiacutetulo anterior O preacute-
condicionador resultante seraacute chamado de preacute-condicionador de duplo
paracircmetro limitante ILUT(ξτ) Neste preacute-condicionador natildeo eacute mais necessaacuterio
usar o paracircmetro ρ
Conforme visto no Capiacutetulo 3 o algoritmo de fatoraccedilatildeo usado neste preacute-
condicionador eacute o IKJ e deriva da eliminaccedilatildeo de Gauss (Saad 2003) Este tipo
de algoritmo permite calcular os elementos Ukk Ukk+1 Ukn antes de decidir se
o elemento Lik deve ser preenchido ou descartado Poreacutem o algoritmo IKJ natildeo
permite calcular os elementos Lk+1k Lnk antes de decidir se o elemento Uki
deve ser preenchido ou descartado porque no mesmo os elementos de L e U
146
satildeo calculados por linhas uma de cada vez Portanto a regra baseada no erro
pode ser aplicada apenas nos elementos do fator L enquanto que uma variante
da regra convencional usada no ILUT(τρ) eacute usada para os elementos de U
O caacutelculo da norma-2 usada na regra de preenchimento convencional dada pela
raiz quadrada da soma dos quadrados dos elementos da linha pode exigir
consideraacutevel esforccedilo computacional dependendo da dimensatildeo da matriz de
coeficientes Portanto ao inveacutes de se usar esta norma para descartar os
elementos em U recomenda-se realizar a meacutedia aritmeacutetica dos elementos da i-
eacutesima linha da matriz de coeficientes original Este procedimento reduz o nuacutemero
de operaccedilotildees de ponto flutuante sem comprometer a qualidade do preacute-
condicionador No entanto a eficiecircncia de ambas as heuriacutesticas eacute inferior agrave da
regra baseada no erro para preenchimento dos elementos proposta no presente
trabalho O resultado eacute um preacute-condicionador que aplica dois criteacuterios para
definir sua regra de preenchimento da seguinte forma
De acordo com a relaccedilatildeo dada por (417) um elemento Lik eacute descartado se o
erro resultante for menor que a toleracircncia ξ usada para todas as linhas de L
Caso contraacuterio calcula-se Lik usando-se o elemento aik da matriz resultante do
processo de eliminaccedilatildeo de Gauss ateacute a correspondente etapa Jaacute para um
elemento Uik este eacute descartado se for menor que uma certa toleracircncia relativa
τi obtida multiplicando-se a toleracircncia absoluta τ pela meacutedia aritmeacutetica dos
elementos da i-eacutesima linha da matriz de coeficientes original O caacutelculo de w eacute
efetuado de acordo com o algoritmo de fatoraccedilatildeo IKJ apresentado no capiacutetulo
anterior
ik
ikik
(L )
ik (L )k=(1i-1)
kk
0 R= aL
RU
lt ξ ge ξ
(417)
ik
k i
k k ik=(i+1n)
0 w =U
w w
lt ge
ττ
(418)
A adaptaccedilatildeo da regra baseada no erro no preacute-condicionador ILUT(τρ) falha
devido ao fato do algoritmo de fatoraccedilatildeo IKJ natildeo permitir a aplicaccedilatildeo da regra
147
em ambos os fatores triangulares L e U dificultando a exploraccedilatildeo das vantagens
do uso desta regra A seguir mostra-se uma proposta para superar estes
problemas utilizando-se outro algoritmo de fatoraccedilatildeo que permite aplicar a regra
em ambos os fatores triangulares
46 Preacute-condicionador ILU( ξ) Baseado no Caacutelculo do Erro
Nesta seccedilatildeo propotildee-se uma eficiente e robusta estrateacutegia de preacute-
condicionamento da fatoraccedilatildeo incompleta ILU(ξ) derivada de uma versatildeo do
algoritmo de eliminaccedilatildeo de Gauss conhecido como Doolittle A maior vantagem
deste algoritmo eacute que permite usar de forma efetiva a regra de preenchimento
baseada no erro em ambos os fatores triangulares L e U
Os fatores L e U satildeo apresentados em (419) e (420) Os elementos da diagonal
de L satildeo iguais a um e a primeira linha de U eacute igual agrave primeira linha da matriz de
coeficientes A As equaccedilotildees usadas pelo algoritmo de Doolittle para calcular os
elementos dos fatores triangulares satildeo apresentadas em (422) e podem ser
obtidas ao se igualar cada elemento do produto dos fatores triangulares LmiddotU de
(419) e (420) aos elementos da matriz de coeficientes A apresentada em (421)
Estas equaccedilotildees podem ser implementadas computacionalmente de diferentes
formas todas baseadas na eliminaccedilatildeo de Gauss Teoricamente os diferentes
tipos de eliminaccedilatildeo de Gauss realizam o mesmo nuacutemero de operaccedilotildees de ponto
flutuante No entanto no contexto da fatoraccedilatildeo incompleta estas variantes
resultam em importantes diferenccedilas praacuteticas quando o interesse eacute utilizar a regra
de preenchimento baseada no erro
k-11
k1 kk 1
i1 ik 1 ik
n1 nk 1 nk ni
1 0 0 0 0
L 1 0 0 0
L L 1 0 0L
L L L 1 0
L L L L 1
minus
minus
minus
=
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(419)
148
11 1k 1 1k 1i 1n
k-1k-1 k-1k k-1i k-1n
kk ki kn
ii in
nn
U U U U U
0 U U U U
0 0 U U UU
0 0 0 U U
0 0 0 0 U
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(420)
11 1k 1 1k 1i 1n
k-11 k-1k-1 k-1k k-1i k-1n
k1 kk-1 kk ki kn
i1 ik-1 ik ii in
n1 nk-1 nk ni nn
a a a a a
a a a a a
a a a a aA
a a a a a
a a a a a
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(421)
k-1
ki ki kj jij=1
k-1
ik ij jkj=1
ikkk
U =a - [L U ] i=kn
a - [L U ]
L = i=k+1nU
sum
sum (422)
As equaccedilotildees de Doolittle podem gerar algoritmos de eliminaccedilatildeo de Gauss que
calculam os elementos dos fatores triangulares por linhas de forma similar agrave
fatoraccedilatildeo IKJ ou por colunas (Bodewig 1956 Wilkinson 1965 Dahlquist amp
Bjoumlrk 1974 Hoffman 2001) Em ambos algoritmos natildeo seria possiacutevel usar a
regra de preenchimento baseada no erro A partir de (422) propotildee-se usar o
algoritmo de eliminaccedilatildeo de Gauss apresentado na Figura 45 que permite
calcular os elementos dos fatores triangulares simultaneamente por linhas em U
e por colunas em L como mostrado na Figura 46
No passo k da eliminaccedilatildeo de Gauss os elementos da k-eacutesima linha de U e a k-
eacutesima coluna de L (identificados por linhas tracejadas) satildeo calculados utilizando
elementos jaacute computados anteriormente nas linhas e colunas de U e L Por
exemplo para se calcular o elemento Uki satildeo usados os elementos destacados
em azul enquanto que para calcular o elemento Lik satildeo usados os elementos
149
destacados em vermelho Observa-se que este algoritmo permite calcular
elementos de L em linhas posteriores agrave linha k Esta caracteriacutestica possibilita o
uso em U da regra de preenchimento baseada no erro
1 Para i = 1n Faccedila
2 min = Ji in
3 Para k = in Faccedila
4 Para j = 1i-1 Faccedila
5 mk = mk - LijmiddotUjk
6 Fim ndash Faccedila
7 Fim ndash Faccedila
8 Registrar Umax = maxmin
9 ni+1n = J i+1ni
10 Para k = i+1n Faccedila
11 Para j = 1i-1 Faccedila
12 nk = nk ndash LkjmiddotUji
13 Fim ndash Faccedila
14 Fim ndash Faccedila
15 n = nUii
16 Registrar Lmax = maxni+1n
17 Aplicar a regra de preenchimento baseada no erro em m e n
18 Ui in = m in
19 L i+1ni = n i+1n
20 Fim ndash Faccedila
Figura 45 ndash Algoritmo do preacute-condicionador ILU(ξ)
Figura 46 ndash Elementos necessaacuterios para calcular os elementos Lik e Uki durante a fatoraccedilatildeo triangular
150
No algoritmo da Figura 45 observa-se que no passo k os elementos da linha de
U satildeo armazenados no vetor m enquanto que os elementos da coluna de L satildeo
armazenados no vetor n (passos 5 e 12 respectivamente) Uma vez calculados
ambos os vetores procura-se o maior elemento de m sendo armazenado em
Umax e o maior elemento de n armazenado em Lmax (passos 8 e 16
respectivamente) Ambos os valores maacuteximos (em valores absolutos) satildeo
usados pela regra de preenchimento no passo 17 para descartar em m e n os
elementos associados com os menores erros e preencher a linha de U e a
coluna de L da seguinte forma
De acordo com as relaccedilotildees dadas por (423) e (424) tanto um elemento Lki
como tambeacutem um elemento Uik satildeo descartados se seus erros associados
foram menores que uma dada toleracircncia ξ usada para todas as colunas de L e
linhas de U Caso contraacuterio Lki eacute preenchido usando-se o valor armazenado
em nk e Uik eacute preenchido usando-se o valor armazenado em mk
ik
ikik
(U )
(U )kk=(in)
0 R =U
m R
lt ξ ge ξ
(423)
ik
ikki
(L )
(L )ki=(1+1n)
0 R=L
n R
lt ξ ge ξ
(424)
Como observado na Figura 46 o algoritmo da Figura 45 permite encontrar os
elementos Ukk Ukk+1 Ukn necessaacuterios para se calcular o erro associado ao
elemento Lki e os elementos Lk+1k Lnk que por sua vez satildeo necessaacuterios para
se calcular o erro associado ao elemento Uik Nota-se que os elementos
necessaacuterios para calcular o erro (passo k) satildeo calculados neste mesmo passo
portanto natildeo eacute necessaacuterio realizar grandes buscas de elementos nas matrizes L
e U Igualmente tambeacutem natildeo eacute necessaacuterio armazenar valores Umax Lmax ou
erros do passo k porque natildeo seratildeo mais necessaacuterios nos proacuteximos passos
Observe-se que natildeo eacute necessaacuterio multiplicar o paracircmetro ξ por alguma norma ou
meacutedia aritmeacutetica dos elementos da matriz de coeficientes como realizado no
preacute-condicionador ILUT(τρ) porque o erro independe dos valores dos elementos
151
da matriz de coeficientes Este preacute-condicionador usa apenas um uacutenico
paracircmetro ξ Esta caracteriacutestica facilita o ajuste dos paracircmetros do solucionador
como seraacute visto nas proacuteximas seccedilotildees e no proacuteximo capiacutetulo
47 Meacutetodo Convencional Para Ajuste dos Paracircmetros dos Solucionadores
O ajuste dos paracircmetros de um solucionador iterativo eacute considerado fundamental
para garantir sua robustez e eficiecircncia computacional principalmente em
anaacutelises mais complexas como aquelas que solucionam vaacuterios fluxos de carga
com diferentes pontos de operaccedilatildeo Nesses casos a escolha de valores
apropriados para os paracircmetros se torna ainda mais relevante
A ideacuteia fundamental eacute escolher os valores dos paracircmetros que permitam
preencher o menor nuacutemero de elementos sem prejudicar a qualidade do preacute-
condicionador isto eacute sem tornaacute-lo muito diferente de A Poreacutem a escolha de
valores apropriados para os paracircmetros eacute uma tarefa difiacutecil jaacute que existe uma
interdependecircncia com as toleracircncias relativa e absoluta do GMRES e com o tipo
de problema que estaacute sendo solucionado
Pouco tem sido pesquisado em relaccedilatildeo a este tema apenas em (de Leon amp
Semlyen 2002) apresenta-se uma foacutermula que permite calcular para cada
sistema eleacutetrico o valor do paracircmetro limitante τ no preacute-condicionador ILU(τ)
dado por (322) onde τ eacute igual agrave metade do nuacutemero de equaccedilotildees totais Neq do
sistema linear Na praacutetica estaacute foacutermula natildeo garante robustez nem o melhor
desempenho do solucionador
eq
12 N
τ =sdot
(425)
No entanto o procedimento convencional define primeiro valores arbitraacuterios para
as duas toleracircncias absoluta e relativa do GMRES Nas simulaccedilotildees realizadas
nos capiacutetulos anteriores se usou toleracircncias iguais (10-5) e menores que a
toleracircncia usada no teste de convergecircncia do algoritmo Newton-Raphson pois
toleracircncias maiores costumam impedir a convergecircncia do Newton-Raphson
152
Uma vez definidas as toleracircncias a escolha dos paracircmetros do preacute-
condicionador eacute realizada com base em tentativa e erro
Este meacutetodo natildeo considera a possibilidade de encontrar melhores desempenhos
para outras toleracircncias do GMRES que natildeo necessariamente devem ser
consideradas iguais Durante o procedimento de tentativa e erro o meacutetodo pode
encontrar um miacutenimo nuacutemero de operaccedilotildees local (MFLOPSL) associado com τL
como ilustrado na Figura 47 que natildeo necessariamente eacute o menor possiacutevel
(MFLOPSG) Observa-se que para obter o miacutenimo nuacutemero de operaccedilotildees global
(MFLOPSG) o procedimento de tentativa e erro deveria comeccedilar com um valor
de τ proacuteximo de τG
Figura 47 ndash Procedimento de tentativa e erro para busca de valores de um paracircmetro do preacute-condicionador
Quando o preacute-condicionador possui um segundo paracircmetro o procedimento de
tentativa e erro eacute repetido para este segundo paracircmetro fixando-se o primeiro
paracircmetro
48 Meacutetodo Proposto Para Ajuste dos Paracircmetros dos Solucio nadores
O meacutetodo proposto consiste em realizar sucessivas simulaccedilotildees de fluxo de
carga variando simultaneamente todos os paracircmetros do solucionador e
registrando o nuacutemero de operaccedilotildees de ponto flutuante para cada caso gerado O
objetivo eacute encontrar regiotildees de valores para os paracircmetros onde o solucionador
153
apresente alto desempenho permitindo estabelecer e recomendar faixas para os
valores dos paracircmetros onde o solucionador garante convergecircncia com a maior
eficiecircncia possiacutevel O meacutetodo tambeacutem permite identificar as faixas de valores
onde o solucionador natildeo converge
O meacutetodo eacute ilustrado para ajustar os paracircmetros de duas configuraccedilotildees de
solucionador iterativo sendo estas o solucionador proposto neste trabalho
identificado como GMRES+ILU(ξ)+MD e o solucionador GMRES+ILUT(τρ)+MD
apresentado no capiacutetulo 2 Na Tabela 43 especificam-se os paracircmetros
associados a cada solucionador
Tabela 43 ndash Paracircmetros usados nos solucionadores
Solucionadores Meacutetodo Iterativo Preacute-condicionador
GMRES+ILU(ξ)+MD atol rtol
ξ
GMRES+ILUT(τρ)+MD τ ρ
481 Passos Fundamentais
Esta seccedilatildeo apresenta de maneira sucinta os passos envolvidos no meacutetodo para
ajuste dos paracircmetros dos solucionadores onde uma descriccedilatildeo geral eacute
mostrada na Figura 48 O primeiro passo refere-se agrave definiccedilatildeo do espaccedilo de
busca onde satildeo procurados os valores para os paracircmetros que garantem alto
desempenho do solucionador O segundo refere-se aos experimentos numeacutericos
realizados para avaliar o desempenho do solucionador considerando-se todas as
combinaccedilotildees possiacuteveis dos valores de seus paracircmetros definidos no espaccedilo de
busca O passo seguinte tem como objetivo calcular as faixas de valores
recomendaacuteveis para as toleracircncias absoluta e relativa do GMRES Finalmente o
quarto passo calcula as faixas de valores recomendaacuteveis para os paracircmetros do
preacute-condicionador
154
Figura 48 ndash Passos fundamentais para delimitaccedilatildeo dos paracircmetros do solucionador
Nas proacuteximas seccedilotildees os passos mais relevantes no contexto deste trabalho satildeo
discutidos mais detalhadamente
482 Estabelecimento do Espaccedilo de Busca
Para definir o espaccedilo de busca primeiramente deve-se estabelecer o domiacutenio de
cada paracircmetro isto eacute um valor miacutenimo e maacuteximo para cada toleracircncia do
GMRES e para cada paracircmetro do preacute-condicionador como mostrado na Tabela
44 e na Figura 49 Depois devem ser definidos valores intermediaacuterios para cada
paracircmetro sendo que o nuacutemero de valores totais eacute definido em funccedilatildeo do grau
de precisatildeo que se deseja conseguir nos paracircmetros
Finalmente o espaccedilo de busca eacute definido por todas as combinaccedilotildees possiacuteveis
entre as toleracircncias absoluta e relativa do GMRES como apresentado na Figura
49(a) e por todas as combinaccedilotildees possiacuteveis realizadas entre os paracircmetros do
preacute-condicionador como mostrado na Figura 49(b-c)
Para os valores especificados na Tabela 44 existem (m x n) combinaccedilotildees
possiacuteveis entre a toleracircncia absoluta e relativa (ver Figura 49(a)) e (q x p)
combinaccedilotildees possiacuteveis entre os paracircmetros τ e ρ do preacute-condicionador ILUT(τρ)
(ver Figura 49(c)) No caso do preacute-condicionador ILU(ξ) natildeo existem
combinaccedilotildees jaacute que este preacute-condicionador possui somente um uacutenico
paracircmetro Poreacutem existem k valores possiacuteveis para ξ (ver Figura 49(b))
Estabelecer Espaccedilo de Busca
Experimentos numeacutericos
Delimitar paracircmetros do preacute-condicionador
Delimitar toleracircncias do GMRES
155
Tabela 44 ndash Domiacutenios dos paracircmetros usados nos solucionadores
Paracircmetros Maacuteximo Miacutenimo Nuacutemero total de valores
atol atol1 atoln n
rtol rtol1 rtolm m
ξ ξ1 ξk k
τ τ1 τq q
ρ ρ1 ρp P
a) Espaccedilo de busca das toleracircncias do GMRES
b) Espaccedilo de busca dos paracircmetros do preacute-condicionador ILUT(ξ)
c) Espaccedilo de busca dos paracircmetros do preacute-
condicionador ILUT(τρ)
Figura 49 ndash Espaccedilo de busca dos paracircmetros do solucionador
483 Experimentos Numeacutericos
No segundo passo para cada combinaccedilatildeo das toleracircncias absoluta e relativa
(atolrtol) do espaccedilo de busca da Figura 49(a) satildeo simulados tantos Fluxos de
Carga quanto combinaccedilotildees dos paracircmetros do preacute-condicionador existam
registrando-se o nuacutemero de operaccedilotildees de ponto flutuante (MFLOPS) para cada
156
combinaccedilatildeo dos paracircmetros do preacute-condicionador Portanto para cada
combinaccedilatildeo (atolrtol) eacute gerado um graacutefico de eficiecircncia computacional (em
MFLOPS) em funccedilatildeo dos paracircmetros do preacute-condicionador como mostrado na
Figura 410(a) para o preacute-condicionador ILUT(τρ) e na Figura 410(b) para o
preacute-condicionador ILU(ξ)
a) Graacutefico de eficiecircncia para o preacute-condicionador ILUT(τρ)
b) Graacutefico de eficiecircncia para o preacute-condicionador ILU(ξ)
Figura 410 ndash Graacuteficos de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
Para cada graacutefico gerado eacute registrado o nuacutemero de operaccedilotildees de ponto flutuante
miacutenimo (MFLOPSmiacuten) e este valor eacute associado agrave sua correspondente combinaccedilatildeo
(atolrtol) Apoacutes terem sido realizados todos os experimentos e registrados todos
os MFLOPSmiacuten associados a todas as combinaccedilotildees (atolrtol) eacute gerado o graacutefico
de alta eficiecircncia Este graacutefico apresenta em escala de cores todos MFLOPSmiacuten
em funccedilatildeo de suas correspondentes combinaccedilotildees (atolrtol) como mostrado na
Figura 411 sendo que a cor azul estaacute associada com os menores MFLOPSmiacuten a
157
cor vermelha com os maiores MFLOPSmiacuten e em negrito os casos natildeo
convergentes
Observa-se que entre todos os valores registrados para MFLOPSmiacuten existe uma
regiatildeo que conteacutem os casos com os menores MFLOPSmiacuten Este valor chamado
de MFLOPSoacuteti eacute o nuacutemero miacutenimo de operaccedilotildees possiacutevel (global) e estaacute
associado com a regiatildeo quadrada em azul escuro segmentada pelas linhas
brancas Os pontos brancos indicam as posiccedilotildees de todas as combinaccedilotildees que
possuem nuacutemero de operaccedilotildees igual a MFLOPSoacuteti
Figura 411 ndash Graacuteficos de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
484 Delimitaccedilatildeo das Toleracircncias do GMRES
No terceiro passo a partir do graacutefico de alta eficiecircncia apresentado na sua forma
bidimensional na Figura 412 eacute segmentada a regiatildeo dos MFLOPSoacuteti Neste
caso esta regiatildeo eacute o quadrado azul do centro do graacutefico onde cada ponto
branco estaacute associado a uma combinaccedilatildeo (atolrtol) que apresenta o menor
nuacutemero de operaccedilotildees possiacutevel em todo o espaccedilo de busca (MFLOPSoacuteti) Este
graacutefico permite encontrar as faixas de valores (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do meacutetodo GMRES associadas ao melhor
desempenho possiacutevel
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
133
137
meacutetodo numeacuterico de soluccedilatildeo de sistemas de equaccedilotildees lineares (direto ou
iterativo) e estrateacutegias numeacutericas desenvolvidas para melhorar seu desempenho
computacional
421 Solucionadores Diretos
Embora o estudo e avaliaccedilatildeo dos meacutetodos diretos natildeo seja um dos objetivos
desta tese existe a necessidade de adotar um solucionador direto para realizar
comparaccedilotildees com o solucionador iterativo que estaacute sendo proposto aqui Na
Tabela 41 apresenta-se uma siacutentese das principais caracteriacutesticas dos
solucionadores diretos mais usados em diversas aacutereas da engenharia e da
ciecircncia Como se pode observar na primeira coluna satildeo listados os nomes dos
solucionadores na segunda o tipo de meacutetodo direto adotado pelo solucionador
na terceira os tipos de reordenamento da matriz de coeficientes adotados pelo
solucionador e finalmente na uacuteltima coluna satildeo listadas as referecircncias para
cada solucionador nas quais pode-se obter maiores detalhes
Pode-se afirmar que existem basicamente 4 grandes categorias de meacutetodos
diretos usados nos solucionadores conhecidos como atualizaccedilatildeo imediata (right-
looking) atualizaccedilatildeo retrasada (left-looking) meacutetodo supernodal meacutetodo
multifrontal ou combinaccedilotildees destes Pode-se dizer tambeacutem que a maioria utiliza
o conjunto de sub-rotinas BLAS disponibilizada por (Dongarra et al 1990) para
realizar as principais operaccedilotildees esparsas de aacutelgebra linear (vetor matriz-vetor e
matriz-matriz)
Os solucionadores realizam fatoraccedilotildees do tipo LU sendo que o SPARSPAK e os
solucionadores do Matlab podem tambeacutem realizar fatoraccedilotildees do tipo QR Todos
os solucionadores satildeo capazes de operar com matrizes simeacutetricas e natildeo-
simeacutetricas Os meacutetodos de reordenamento disponiacuteveis satildeo do tipo grau miacutenimo
(minimum degree) e variantes como o miacutenimo preenchimento (minimum fill) grau
miacutenimo por colunas (column minimum degree) Markowitz e outros tambeacutem satildeo
considerados o reordenamento por divisatildeo encaixadauacutenico-sentido (nestedone-
way dissection) permutaccedilotildees por blocos triangulares e de reduccedilatildeo de largura de
banda como o conhecido Cuthill Mckee reverso RCM (Reverse Cuthill Mckee)
134
137
Tabela 41 ndash Caracteriacutesticas baacutesicas dos solucionadores diretos mais usados
Solucionador Tipo de Meacutetodo Direto Estrateacutegias
Implementadas Referecircncia
MA28 Atualizaccedilatildeo imediata
Markowitz Miacutenimo grau
e Bloco triangular (Duff amp Reid 1979)
SPARSPAK Atualizaccedilatildeo retrasada Miacutenimo grau
Divisatildeo encaixada e Cuthill Mckee reverso
(George amp Liu 1981)
Solucionadores de MATLAB
Vaacuterios Miacutenimo grau
Bloco triangular e Cuthill Mckee reverso
(Gilbert et al 1992)
MA48 Atualizaccedilatildeo retrasada Miacutenimo grau
Bloco triangular (Duff amp Reid 1996)
SuperLU Atualizaccedilatildeo retrasada
Supernodal Miacutenimo grau (Demmel et al 1999)
SuperLU _DIST Atualizaccedilatildeo imediata
Supernodal Miacutenimo grau (Li amp Demmel 2003)
PARDISO Atualizaccedilatildeo
imediataretrasada Supernodal
Miacutenimo grau e Divisatildeo encaixada
(Schenk amp Gartner 2001)
WSMP Multifrontal Miacutenimo grau
Divisatildeo encaixada e Bloco triangular
(Gupta 2002)
Solucionadores de Mathematica
Vaacuterios Miacutenimo grau
Divisatildeo encaixada e Bloco triangular
(Wolfram 2003)
UMFPACK Multifrontal Miacutenimo grau
e Escalonamento (Davis 2004)
Nestes solucionadores os aspectos a serem levados em consideraccedilatildeo para
desenvolver os algoritmos complexos heuriacutesticas e estrateacutegias apresentadas na
Tabela 41 basicamente satildeo a geraccedilatildeo do menor nuacutemero de elementos natildeo-
nulos possiacutevel durante o processo de fatoraccedilatildeo e tambeacutem a conservaccedilatildeo da
estabilidade numeacuterica mediante as estrateacutegias de reordenamento e
monitoramentoeleiccedilatildeo dos elementos pivocircs respectivamente
Neste trabalho o solucionador MA28 representaraacute os solucionadores diretos
quando realizadas as comparaccedilotildees de desempenho com o solucionador iterativo
proposto nesta tese Este solucionador foi escolhido principalmente porque
permite calcular o nuacutemero de operaccedilotildees de ponto flutuante pela facilidade para
ser acondicionado dentro do programa de fluxo de carga pela disponibilidade
135
137
total do coacutedigo do solucionador em linguagem FORTRAN e desempenho similar
a outros solucionadores diretos O MA28 permuta tanto linhas como colunas na
matriz de coeficientes A utilizando duas matrizes P e Q Este solucionador usa
principalmente as estrateacutegias de Markowitz e miacutenimo grau visando manter as
propriedades esparsas e o controle da perda da exatidatildeo devido aos erros de
arredondamento (Duff amp Reid 1979) Ambas as estrateacutegias satildeo executadas de
forma dinacircmica durante o processo de fatoraccedilatildeo (PmiddotAmiddotQ = LmiddotU)
No proacuteximo capiacutetulo satildeo usados dois programas computacionais ndash ANAREDE e
ORGANON (Chaves 2008 Jardim amp Stott 2005 CEPEL 2007) para validar os
resultados dos experimentos numeacutericos e realizar comparaccedilotildees principalmente
em termos de robustez e eficiecircncia computacional O ORGANON eacute um sistema
utilizado para avaliaccedilatildeo da seguranccedila de redes eleacutetricas de potecircncia que
emprega computaccedilatildeo de alto desempenho utilizando teacutecnicas numeacutericas
avanccediladas algoritmos especializados arquitetura construtiva flexiacutevel e
processamento distribuiacutedo (Chaves 2008) No ORGANON o problema de fluxo
de carga eacute solucionado de duas formas usando-se os modelos estaacuteticos da rede
eleacutetrica e o algoritmo de Newton-Raphson ou usando-se modelos dinacircmicos da
rede eleacutetrica e o meacutetodo de dinacircmica sinteacutetica (Jardim amp Stott 2005) Em
(Chaves 2008) satildeo feitas diversas e diferentes aplicaccedilotildees com este programa
em estudos de fluxo de potecircncia atraveacutes do meacutetodo convencional de Newton-
Raphson completo ou com o meacutetodo de Fluxo de Potecircncia de Dinacircmica Sinteacutetica
(FPDS) Este uacuteltimo obteacutem a soluccedilatildeo para o problema de fluxo de potecircncia (caso
essa exista) mesmo para casos em que os meacutetodos convencionais falhem e
ainda apenas soluccedilotildees estaacuteveis
Jaacute o programa de anaacutelise de redes (ANAREDE ndash versatildeo 090403) eacute um conjunto
de aplicaccedilotildees computacionais algoritmos e meacutetodos eficientes adequados agrave
realizaccedilatildeo de estudos nas aacutereas de operaccedilatildeo e de planejamento de sistemas
eleacutetricos de potecircncia No ANAREDE a soluccedilatildeo das equaccedilotildees da rede eleacutetrica eacute
realizada pelo algoritmo Newton-Raphson e o reordenamento da matriz
Jacobiana para preservar a esparsidade eacute efetuado utilizando a teacutecnica MD
(CEPEL 2007)
136
137
422 Solucionadores Iterativos Aplicados em Problemas de Sistemas de Energia Eleacutetrica
Na Tabela 42 apresenta-se uma siacutentese do estado da arte dos solucionadores
iterativos quando aplicados ao problema de fluxo de carga A maior parte das
informaccedilotildees associadas com os meacutetodos iterativos e estrateacutegias de preacute-
condicionamento de cada um destes solucionadores jaacute foi apresentada nas
seccedilotildees 241 242 e 34 dos capiacutetulos anteriores Algumas informaccedilotildees
associadas com outras estrateacutegias e teacutecnicas numeacutericas consideradas em
alguns destes solucionadores e que ainda natildeo foram mencionadas satildeo
apresentadas nas uacuteltimas duas colunas da Tabela 42 sendo estas
Em (Flueck e Chiang 1998) combina-se a teacutecnica de reordenamento RCM com
o meacutetodo GMRES e o preacute-condicionador fixo FastD Todas as simulaccedilotildees foram
realizadas usando RCM e um sistema de 8027 barras sendo o solucionador
proposto 50 mais raacutepido que o tradicional solucionador direto de fatoraccedilatildeo LU
Em (Dag e Semlyen 2003) o solucionador proposto usa teacutecnicas de
escalonamento na matriz Brsquo do meacutetodo desacoplado raacutepido obtendo-se bons
resultados em termos de robustez Poreacutem em (de Leon 2003) a proposta de
Dag eacute fortemente criticada pelo uso dos meacutetodos desacoplados junto aos
meacutetodos iterativos
Em (Pessanha et al 2009) avaliam-se os efeitos do reordenamento RCM e da
teacutecnica de maacuteximo produto transversal com escalonamento na qualidade do preacute-
condicionador ILUT(τρ) quase-fixo Os resultados mostram que este tipo de
preprocessamento da matriz Jacobiana melhora significativamente a qualidade
do preacute-condicionador consequentemente a robustez do solucionador
Nas uacuteltimas linhas da Tabela 42 apresentam-se as caracteriacutesticas baacutesicas do
solucionador proposto nesta tese destacando-se o preacute-condicionador ILU(ξ) com
regra de preenchimento baseada no erro Nas proacuteximas seccedilotildees todos os
componentes do solucionador proposto satildeo tratados com maiores detalhes
137
137
Tabela 42 ndash Caracteriacutesticas dos solucionadores iterativos usados em aplicaccedilotildees de fluxo de carga
Autor Ano Meacutetodo
Iterativo
Estrateacutegias Usadas
Preacute-condicionador Regra de Eliminaccedilatildeo Reordenamento Escalonamento
Galiana 1994 GConjugado Cholesky Incomp M=Lrsquo∙LrsquoT(0) Sem novos elementos natildeo-nulos mdash mdash
Mori 1996 Tchebychev Cholesky Incompleto Sem novos elementos natildeo-nulos mdash mdash
Semlyen 1996 GMRES(m) mdash mdash mdash mdash
Borges 1996(97) BiCGStab M = L∙U da primeira Iteraccedilatildeo mdash mdash mdash
Pai 1997 GMRES ILU(k) Niacutevel de novos elementos natildeo-nulos mdash mdash
Flueck 1998 GMRES(m) FastD M = Brsquo mdash RCM mdash
Alves 1999 GConjugado Cholesky completo mdash MD MST mdash
De Leoacuten 2002 BiCGStab GMRES QMR CGS BiCG + ILU() Com paracircmetro limitante
limitante
mdash mdash
Dag 2003 GConjugado Aproximaccedilatildeo da Inversa Polinocircmio de Chebyshev mdash D1∙Brsquo∙D2
Chen 2006 GMRES(m) Aprox da Inversa Adaptativa mdash mdash mdash
Mori 2007 BiCGStab ILU(k) Niacutevel de novos elementos natildeo-nulos mdash mdash
Pessanha 2009 GMRES ILUT( ρ) quase-fixo
Duplo paracircmetro limitante e ρ RCM mdash
Khaitan 2010 GMRES M = L∙U Multifrontal quase-fixo mdash RCM mdash
Solucionador Proposto GMRES ILU(ξ) Baseada no Erro MD mdash
138
137
43 Solucionador Iterativo Para Fluxo de Carga
O solucionador desenvolvido eacute composto basicamente pelo meacutetodo iterativo de
subespaccedilos de Krylov GMRES (vide Capiacutetulo 2) e pela estrateacutegia de preacute-
condicionamento de fatoraccedilatildeo incompleta ILU(ξ) com suporte da teacutecnica de
reordenamento Miacutenimo Grau (MD) A estrateacutegia de reinicializaccedilatildeo GMRES(m)
(apresentada em 26) usada para limitar o tamanho dos subespaccedilos de Krylov a
um valor maacuteximo ―m natildeo faz parte do solucionador uma vez que a estrateacutegia
de preacute-condicionamento forccedila a convergecircncia do GMRES em poucas iteraccedilotildees
lineares (uma ou duas iteraccedilotildees) Portanto jaacute que poucas iteraccedilotildees estatildeo
associadas a subespaccedilos pequenos entatildeo natildeo eacute necessaacuterio estabelecer um
valor maacuteximo ―m
Nesta tese adota-se a teacutecnica de reordenamento MD porque a mesma acarreta
a reduccedilatildeo significativa do nuacutemero de novos elementos natildeo-nulos gerados
reduzindo o esforccedilo computacional realizado para construir e usar o preacute-
condicionador Alem disso este tipo de reordenamento aumenta a taxa de
convergecircncia do meacutetodo iterativo GMRES O solucionador eacute denominado de
GMRES+ILU(ξ)+MD e foi implementado em um programa computacional de
fluxo de carga desenvolvido em linguagem Fortran da forma apresentada no
fluxograma da Figura 41 Seus componentes estatildeo destacados na cor vermelha
numerados por algarismos romanos na mesma ordem em que satildeo aplicados
Observa-se que antes de iniciadas as iteraccedilotildees Newton-Raphson eacute calculada a
sequumlecircncia de reordenamento usando-se a teacutecnica MD matematicamente
representada pela matriz de permutaccedilotildees P Na praacutetica eacute gerado um vetor com
a sequumlecircncia de reordenamento que permitiraacute montar a matriz Jacobiana jaacute
reordenada em cada iteraccedilatildeo k do algoritmo Newton-Raphson Esse vetor
tambeacutem eacute usado para reordenar os resiacuteduos de potecircncia ativa e reativa
armazenados no vetor bk Cada vez que o teste de convergecircncia do algoritmo
Newton-Raphson natildeo for satisfeito uma nova matriz Jacobiana reordenada eacute
montada A partir das informaccedilotildees da matriz Jacobiana reordenada a estrateacutegia
de preacute-condicionamento ILU(ξ) constroacutei um preacute-condicionador Mk que em
seguida seraacute usado para obter explicitamente o novo sistema linear preacute-
condicionado (41) a ser solucionado pelo meacutetodo iterativo GMRES Finalmente
139
137
as incoacutegnitas satildeo atualizadas em (42) O procedimento eacute repetido ateacute que o
teste de convergecircncia do algoritmo Newton-Raphson seja satisfeito
1 T 1k k kM P J P x M P b (41)
T
k 1 k
v vP x
(42)
Figura 41 ndash Fluxograma do Solucionador Iterativo para o problema de fluxo de carga
O programa de fluxo de carga modela as barras de acordo como seu tipo (PQ
PV e de referecircncia) as linhas de transmissatildeo transformadores e
140
137
transformadores defasadores satildeo representados pelos seus circuitos ᴨ
equivalentes Os tapes variaacuteveis sob carga podem ainda ter a atuaccedilatildeo contiacutenua
ou discreta As cargas das barras satildeo normalmente modeladas como potecircncias
ativa e reativa constantes ou podem ser expressas como uma funccedilatildeo da
magnitude da tensatildeo da barra Natildeo satildeo modelados elos de corrente contiacutenua
No algoritmo de fluxo de carga consideram-se o controle de variaccedilatildeo automaacutetica
de tape e os limites de geraccedilatildeo de potecircncia reativa
44 Regra de Preenchimento Baseada no Caacutelculo do Erro Associado ao Elemento Descartado
Uma forma simples de estimar o erro total R originado pelos elementos
descartados devido agraves regras de preenchimento da fatoraccedilatildeo incompleta eacute
usando-se (310) (Mori et al 1996 Saad 2003) Nesta equaccedilatildeo o produto dos
fatores triangulares incompletos eacute igual ao preacute-condicionador M e o produto dos
fatores triangulares completos eacute igual agrave matriz de coeficientes A como mostrado
em (311) Desta forma o erro R permite vislumbrar quatildeo diferente se tornou
o preacute-condicionador em relaccedilatildeo aos fatores triangulares completos apoacutes o
descarte de seus elementos
Um preacute-condicionador sem regra de preenchimento efetua completamente o
caacutelculo dos fatores triangulares Neste caso o preacute-condicionador M se iguala agrave
matriz de coeficientes (M = L∙U = A) o que resulta na convergecircncia do meacutetodo
GMRES em uma uacutenica iteraccedilatildeo com erro R nulo Poreacutem o nuacutemero de
operaccedilotildees de ponto flutuante ainda eacute consideraacutevel Para se obter esta reduccedilatildeo eacute
necessaacuterio usar uma regra de preenchimento que descarte o maior nuacutemero de
elementos nos fatores triangulares e sem que isso provoque o aumento do erro
R consequumlentemente afetando o desempenho do GMRES
R A M (43)
R L U L U (44)
Como exemplo na Figura 36 satildeo apresentados dois graacuteficos que ilustram como
os erros produzidos pelo descarte dos fatores triangulares natildeo-nulos podem se
alastrar ateacute em posiccedilotildees de elementos jaacute preenchidos O experimento foi
141
137
apresentado na seccedilatildeo 332 do capiacutetulo anterior para o sistema brasileiro de
3513 barras usando-se o preacute-condicionador ILU(0) para o caacutelculo dos fatores
incompletos No graacutefico da Figura 36(a) mostra-se que 8797 dos elementos
do preacute-condicionador M (83078) satildeo distintos dos encontrados na matriz
Jacobiana O graacutefico do erro em 42(b) permite se ter uma ideacuteia da dimensatildeo
destas diferenccedilas Dos 38738 elementos com erros entre 0 e 001 (pontos
azuis) 11360 tecircm erro igual a zero (elementos idecircnticos) e 27378 tecircm erros
menores que 001 Os erros nesta faixa de valores normalmente natildeo prejudicam
a convergecircncia do GMRES
As outras faixas de valores associadas aos pontos de cores verde amarelo e
vermelho normalmente prejudicam a convergecircncia do GMRES Esses erros
devem ser evitados e satildeo gerados quando alguns elementos importantes satildeo
descartados durante a fatoraccedilatildeo ILU(0) O maior erro provocado entre os
elementos de M e da Jacobiana eacute de 401931 e o erro total para este preacute-
condicionador eacute de 10632middot105 (norma de Frobenius) Para evitar que os erros
se propaguem enquanto eacute realizada a fatoraccedilatildeo eacute necessaacuterio calcular o erro
associado a cada elemento dos fatores triangulares antes de seu preenchimento
ou descarte Este erro deve tambeacutem considerar os erros propagados nos
caacutelculos futuros onde o elemento seja requerido Se este valor for zero ou
proacuteximo de zero entatildeo o elemento pode ser descartado caso contraacuterio deve ser
preenchido
a) Produto dos fatores incompletos (LrsquoUrsquo) do preacute-condicionador ILU(0)
b) Matriz R para o preacute-condicionador ILU(0)
Figura 42 ndash Erros produzidos pela regra de preenchimento com o preacute-condicionador ILU(0) para a matriz Jacobiana do sistema brasileiro de 3513 barras
142
Sejam L e U os fatores triangulares completos Lrsquo e Ursquo os fatores triangulares
incompletos apoacutes o descarte de um uacutenico elemento Lik o elemento descartado
em Lrsquo e Uki o elemento descartado em Ursquo (Lik = 0 ou Uki = 0) Usando a equaccedilatildeo
(311) (Mori et al 1996 Saad 2003 Benzi et al 1999b Benzi 2002) eacute possiacutevel
calcular o erro associado ao elemento Lik (45) e o erro associado ao elemento
Uki (46) Como mencionado anteriormente esses erros permitem ter uma ideacuteia
de quatildeo diferente se torna o preacute-condicionador M dos fatores triangulares
completos apoacutes os elementos Lik e Uki serem descartados Como os erros estatildeo
associados a um uacutenico elemento descartado as equaccedilotildees (45) e (46) podem
ser reescritas como em (47) e (48) respectivamente
R = L U - L Usdot sdot (45)
R = L U - L Usdot sdot (46)
)ik(LR = (L -L) Usdot (47)
)ik(UR = L (U-U)sdot (48)
Verifica-se que tanto a matriz diferenccedila (L-Lrsquo) como tambeacutem (U-Ursquo) possuem
apenas um elemento natildeo nulo Lik (descartado em Lrsquo) e Uki (descartado em Ursquo)
respectivamente como apresentado em (49) e (410)
ik
0
0 0
0 0 0
0 0 0 0
L L =
0 0 0 0 0
0 0 L 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
( - )
⋮ ⋱
⋯
⋯
⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱
⋯ ⋯ ⋯
(49)
143
ki
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 U 0 0
0 0 0 0 0
(U - U) =
0 0 0 0
0 0 0
0 0
0
⋯ ⋯ ⋯
⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯
⋯
⋯
⋱ ⋮
(410)
Pela substituiccedilatildeo de (49) e (410) nos produtos (L-Lrsquo)middotU como Lmiddot(U-Ursquo) resulta
em (411) e (412)
ik kk ik kk+1 ik ki ik kn
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
L - L) U =
0 0 0 0 0 0
0 0 L U L U L U L U
0 0 0 0 0 0
0 0 0 0 0 0
(
sdot
sdot sdot sdot sdot
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(411)
ki
k+1k ki
ik ki
nk ki
0 0 0 0 0
0 0 0 0 0
0 0 U 0 0
L (U - U) = 0 0 L U 0 0
0 0 L U 0 0
0 0 L U 0 0
sdot sdot
sdot
sdot
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
(412)
Conforme mencionado no capiacutetulo anterior uma das dificuldades para propor
uma regra de preenchimento estaacute em se reduzir o nuacutemero de operaccedilotildees
associadas com sua execuccedilatildeo dentro do algoritmo de preacute-condicionamento
144
Neste trabalho propotildee-se usar a norma-1 em (47) para o caacutelculo do erro
associado a um elemento de L e a norma-infin em (48) para o caacutelculo do erro
associado a um dado elemento de U como apresentado em (413) e (414) As
referidas normas aproveitam a estrutura das matrizes (411) e (412) evitando-se
a realizaccedilatildeo de operaccedilotildees adicionais sendo requeridas ao inveacutes disto apenas
comparaccedilotildees entre elementos Portanto substituindo (411) em (413) e (412)
em (414) e calculando-se as normas satildeo obtidas as equaccedilotildees (415) e (416)
que devem ser usadas na regra de preenchimento
)1ik(LR = (L -L) Usdot (413)
ki(U )R = L (U-U) infinsdot (414)
ik ik km(L )R = L max U m = [kn]sdot (415)
ki ki mk(U )R U max 1 L m=[k+1n]= sdot (416)
Na Figura 43 satildeo destacados em vermelho todos os elementos dos fatores
triangulares que satildeo requeridos para calcular o erro produzido quando o
elemento Lik (no quadrado) eacute descartado Jaacute na Figura 44 satildeo destacados em
azul todos os elementos necessaacuterios para calcular o erro produzido quando o
elemento Uki (encerrado no quadrado) eacute descartado Observa-se que para que
esta regra possa ser implementada tanto no fator triangular U como em L o
algoritmo de fatoraccedilatildeo deve ser capaz de calcular os elementos Ukk Ukk+1
Ukn (em vermelho) antes de decidir se o elemento Lik deve ser preenchido ou
descartado Semelhantemente deve ser capaz de calcular os elementos Lk+1k
Lnk (em azul) antes de decidir se o elemento Uki deve ser preenchido ou
descartado
145
Figura 43 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Lik
Figura 44 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Uki
45 Adequaccedilatildeo da Regra Baseada no Erro
Nesta seccedilatildeo a regra de preenchimento baseada no erro eacute adequada para ser
usada no preacute-condicionador ILUT(τρ) analisado no capiacutetulo anterior O preacute-
condicionador resultante seraacute chamado de preacute-condicionador de duplo
paracircmetro limitante ILUT(ξτ) Neste preacute-condicionador natildeo eacute mais necessaacuterio
usar o paracircmetro ρ
Conforme visto no Capiacutetulo 3 o algoritmo de fatoraccedilatildeo usado neste preacute-
condicionador eacute o IKJ e deriva da eliminaccedilatildeo de Gauss (Saad 2003) Este tipo
de algoritmo permite calcular os elementos Ukk Ukk+1 Ukn antes de decidir se
o elemento Lik deve ser preenchido ou descartado Poreacutem o algoritmo IKJ natildeo
permite calcular os elementos Lk+1k Lnk antes de decidir se o elemento Uki
deve ser preenchido ou descartado porque no mesmo os elementos de L e U
146
satildeo calculados por linhas uma de cada vez Portanto a regra baseada no erro
pode ser aplicada apenas nos elementos do fator L enquanto que uma variante
da regra convencional usada no ILUT(τρ) eacute usada para os elementos de U
O caacutelculo da norma-2 usada na regra de preenchimento convencional dada pela
raiz quadrada da soma dos quadrados dos elementos da linha pode exigir
consideraacutevel esforccedilo computacional dependendo da dimensatildeo da matriz de
coeficientes Portanto ao inveacutes de se usar esta norma para descartar os
elementos em U recomenda-se realizar a meacutedia aritmeacutetica dos elementos da i-
eacutesima linha da matriz de coeficientes original Este procedimento reduz o nuacutemero
de operaccedilotildees de ponto flutuante sem comprometer a qualidade do preacute-
condicionador No entanto a eficiecircncia de ambas as heuriacutesticas eacute inferior agrave da
regra baseada no erro para preenchimento dos elementos proposta no presente
trabalho O resultado eacute um preacute-condicionador que aplica dois criteacuterios para
definir sua regra de preenchimento da seguinte forma
De acordo com a relaccedilatildeo dada por (417) um elemento Lik eacute descartado se o
erro resultante for menor que a toleracircncia ξ usada para todas as linhas de L
Caso contraacuterio calcula-se Lik usando-se o elemento aik da matriz resultante do
processo de eliminaccedilatildeo de Gauss ateacute a correspondente etapa Jaacute para um
elemento Uik este eacute descartado se for menor que uma certa toleracircncia relativa
τi obtida multiplicando-se a toleracircncia absoluta τ pela meacutedia aritmeacutetica dos
elementos da i-eacutesima linha da matriz de coeficientes original O caacutelculo de w eacute
efetuado de acordo com o algoritmo de fatoraccedilatildeo IKJ apresentado no capiacutetulo
anterior
ik
ikik
(L )
ik (L )k=(1i-1)
kk
0 R= aL
RU
lt ξ ge ξ
(417)
ik
k i
k k ik=(i+1n)
0 w =U
w w
lt ge
ττ
(418)
A adaptaccedilatildeo da regra baseada no erro no preacute-condicionador ILUT(τρ) falha
devido ao fato do algoritmo de fatoraccedilatildeo IKJ natildeo permitir a aplicaccedilatildeo da regra
147
em ambos os fatores triangulares L e U dificultando a exploraccedilatildeo das vantagens
do uso desta regra A seguir mostra-se uma proposta para superar estes
problemas utilizando-se outro algoritmo de fatoraccedilatildeo que permite aplicar a regra
em ambos os fatores triangulares
46 Preacute-condicionador ILU( ξ) Baseado no Caacutelculo do Erro
Nesta seccedilatildeo propotildee-se uma eficiente e robusta estrateacutegia de preacute-
condicionamento da fatoraccedilatildeo incompleta ILU(ξ) derivada de uma versatildeo do
algoritmo de eliminaccedilatildeo de Gauss conhecido como Doolittle A maior vantagem
deste algoritmo eacute que permite usar de forma efetiva a regra de preenchimento
baseada no erro em ambos os fatores triangulares L e U
Os fatores L e U satildeo apresentados em (419) e (420) Os elementos da diagonal
de L satildeo iguais a um e a primeira linha de U eacute igual agrave primeira linha da matriz de
coeficientes A As equaccedilotildees usadas pelo algoritmo de Doolittle para calcular os
elementos dos fatores triangulares satildeo apresentadas em (422) e podem ser
obtidas ao se igualar cada elemento do produto dos fatores triangulares LmiddotU de
(419) e (420) aos elementos da matriz de coeficientes A apresentada em (421)
Estas equaccedilotildees podem ser implementadas computacionalmente de diferentes
formas todas baseadas na eliminaccedilatildeo de Gauss Teoricamente os diferentes
tipos de eliminaccedilatildeo de Gauss realizam o mesmo nuacutemero de operaccedilotildees de ponto
flutuante No entanto no contexto da fatoraccedilatildeo incompleta estas variantes
resultam em importantes diferenccedilas praacuteticas quando o interesse eacute utilizar a regra
de preenchimento baseada no erro
k-11
k1 kk 1
i1 ik 1 ik
n1 nk 1 nk ni
1 0 0 0 0
L 1 0 0 0
L L 1 0 0L
L L L 1 0
L L L L 1
minus
minus
minus
=
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(419)
148
11 1k 1 1k 1i 1n
k-1k-1 k-1k k-1i k-1n
kk ki kn
ii in
nn
U U U U U
0 U U U U
0 0 U U UU
0 0 0 U U
0 0 0 0 U
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(420)
11 1k 1 1k 1i 1n
k-11 k-1k-1 k-1k k-1i k-1n
k1 kk-1 kk ki kn
i1 ik-1 ik ii in
n1 nk-1 nk ni nn
a a a a a
a a a a a
a a a a aA
a a a a a
a a a a a
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(421)
k-1
ki ki kj jij=1
k-1
ik ij jkj=1
ikkk
U =a - [L U ] i=kn
a - [L U ]
L = i=k+1nU
sum
sum (422)
As equaccedilotildees de Doolittle podem gerar algoritmos de eliminaccedilatildeo de Gauss que
calculam os elementos dos fatores triangulares por linhas de forma similar agrave
fatoraccedilatildeo IKJ ou por colunas (Bodewig 1956 Wilkinson 1965 Dahlquist amp
Bjoumlrk 1974 Hoffman 2001) Em ambos algoritmos natildeo seria possiacutevel usar a
regra de preenchimento baseada no erro A partir de (422) propotildee-se usar o
algoritmo de eliminaccedilatildeo de Gauss apresentado na Figura 45 que permite
calcular os elementos dos fatores triangulares simultaneamente por linhas em U
e por colunas em L como mostrado na Figura 46
No passo k da eliminaccedilatildeo de Gauss os elementos da k-eacutesima linha de U e a k-
eacutesima coluna de L (identificados por linhas tracejadas) satildeo calculados utilizando
elementos jaacute computados anteriormente nas linhas e colunas de U e L Por
exemplo para se calcular o elemento Uki satildeo usados os elementos destacados
em azul enquanto que para calcular o elemento Lik satildeo usados os elementos
149
destacados em vermelho Observa-se que este algoritmo permite calcular
elementos de L em linhas posteriores agrave linha k Esta caracteriacutestica possibilita o
uso em U da regra de preenchimento baseada no erro
1 Para i = 1n Faccedila
2 min = Ji in
3 Para k = in Faccedila
4 Para j = 1i-1 Faccedila
5 mk = mk - LijmiddotUjk
6 Fim ndash Faccedila
7 Fim ndash Faccedila
8 Registrar Umax = maxmin
9 ni+1n = J i+1ni
10 Para k = i+1n Faccedila
11 Para j = 1i-1 Faccedila
12 nk = nk ndash LkjmiddotUji
13 Fim ndash Faccedila
14 Fim ndash Faccedila
15 n = nUii
16 Registrar Lmax = maxni+1n
17 Aplicar a regra de preenchimento baseada no erro em m e n
18 Ui in = m in
19 L i+1ni = n i+1n
20 Fim ndash Faccedila
Figura 45 ndash Algoritmo do preacute-condicionador ILU(ξ)
Figura 46 ndash Elementos necessaacuterios para calcular os elementos Lik e Uki durante a fatoraccedilatildeo triangular
150
No algoritmo da Figura 45 observa-se que no passo k os elementos da linha de
U satildeo armazenados no vetor m enquanto que os elementos da coluna de L satildeo
armazenados no vetor n (passos 5 e 12 respectivamente) Uma vez calculados
ambos os vetores procura-se o maior elemento de m sendo armazenado em
Umax e o maior elemento de n armazenado em Lmax (passos 8 e 16
respectivamente) Ambos os valores maacuteximos (em valores absolutos) satildeo
usados pela regra de preenchimento no passo 17 para descartar em m e n os
elementos associados com os menores erros e preencher a linha de U e a
coluna de L da seguinte forma
De acordo com as relaccedilotildees dadas por (423) e (424) tanto um elemento Lki
como tambeacutem um elemento Uik satildeo descartados se seus erros associados
foram menores que uma dada toleracircncia ξ usada para todas as colunas de L e
linhas de U Caso contraacuterio Lki eacute preenchido usando-se o valor armazenado
em nk e Uik eacute preenchido usando-se o valor armazenado em mk
ik
ikik
(U )
(U )kk=(in)
0 R =U
m R
lt ξ ge ξ
(423)
ik
ikki
(L )
(L )ki=(1+1n)
0 R=L
n R
lt ξ ge ξ
(424)
Como observado na Figura 46 o algoritmo da Figura 45 permite encontrar os
elementos Ukk Ukk+1 Ukn necessaacuterios para se calcular o erro associado ao
elemento Lki e os elementos Lk+1k Lnk que por sua vez satildeo necessaacuterios para
se calcular o erro associado ao elemento Uik Nota-se que os elementos
necessaacuterios para calcular o erro (passo k) satildeo calculados neste mesmo passo
portanto natildeo eacute necessaacuterio realizar grandes buscas de elementos nas matrizes L
e U Igualmente tambeacutem natildeo eacute necessaacuterio armazenar valores Umax Lmax ou
erros do passo k porque natildeo seratildeo mais necessaacuterios nos proacuteximos passos
Observe-se que natildeo eacute necessaacuterio multiplicar o paracircmetro ξ por alguma norma ou
meacutedia aritmeacutetica dos elementos da matriz de coeficientes como realizado no
preacute-condicionador ILUT(τρ) porque o erro independe dos valores dos elementos
151
da matriz de coeficientes Este preacute-condicionador usa apenas um uacutenico
paracircmetro ξ Esta caracteriacutestica facilita o ajuste dos paracircmetros do solucionador
como seraacute visto nas proacuteximas seccedilotildees e no proacuteximo capiacutetulo
47 Meacutetodo Convencional Para Ajuste dos Paracircmetros dos Solucionadores
O ajuste dos paracircmetros de um solucionador iterativo eacute considerado fundamental
para garantir sua robustez e eficiecircncia computacional principalmente em
anaacutelises mais complexas como aquelas que solucionam vaacuterios fluxos de carga
com diferentes pontos de operaccedilatildeo Nesses casos a escolha de valores
apropriados para os paracircmetros se torna ainda mais relevante
A ideacuteia fundamental eacute escolher os valores dos paracircmetros que permitam
preencher o menor nuacutemero de elementos sem prejudicar a qualidade do preacute-
condicionador isto eacute sem tornaacute-lo muito diferente de A Poreacutem a escolha de
valores apropriados para os paracircmetros eacute uma tarefa difiacutecil jaacute que existe uma
interdependecircncia com as toleracircncias relativa e absoluta do GMRES e com o tipo
de problema que estaacute sendo solucionado
Pouco tem sido pesquisado em relaccedilatildeo a este tema apenas em (de Leon amp
Semlyen 2002) apresenta-se uma foacutermula que permite calcular para cada
sistema eleacutetrico o valor do paracircmetro limitante τ no preacute-condicionador ILU(τ)
dado por (322) onde τ eacute igual agrave metade do nuacutemero de equaccedilotildees totais Neq do
sistema linear Na praacutetica estaacute foacutermula natildeo garante robustez nem o melhor
desempenho do solucionador
eq
12 N
τ =sdot
(425)
No entanto o procedimento convencional define primeiro valores arbitraacuterios para
as duas toleracircncias absoluta e relativa do GMRES Nas simulaccedilotildees realizadas
nos capiacutetulos anteriores se usou toleracircncias iguais (10-5) e menores que a
toleracircncia usada no teste de convergecircncia do algoritmo Newton-Raphson pois
toleracircncias maiores costumam impedir a convergecircncia do Newton-Raphson
152
Uma vez definidas as toleracircncias a escolha dos paracircmetros do preacute-
condicionador eacute realizada com base em tentativa e erro
Este meacutetodo natildeo considera a possibilidade de encontrar melhores desempenhos
para outras toleracircncias do GMRES que natildeo necessariamente devem ser
consideradas iguais Durante o procedimento de tentativa e erro o meacutetodo pode
encontrar um miacutenimo nuacutemero de operaccedilotildees local (MFLOPSL) associado com τL
como ilustrado na Figura 47 que natildeo necessariamente eacute o menor possiacutevel
(MFLOPSG) Observa-se que para obter o miacutenimo nuacutemero de operaccedilotildees global
(MFLOPSG) o procedimento de tentativa e erro deveria comeccedilar com um valor
de τ proacuteximo de τG
Figura 47 ndash Procedimento de tentativa e erro para busca de valores de um paracircmetro do preacute-condicionador
Quando o preacute-condicionador possui um segundo paracircmetro o procedimento de
tentativa e erro eacute repetido para este segundo paracircmetro fixando-se o primeiro
paracircmetro
48 Meacutetodo Proposto Para Ajuste dos Paracircmetros dos Solucio nadores
O meacutetodo proposto consiste em realizar sucessivas simulaccedilotildees de fluxo de
carga variando simultaneamente todos os paracircmetros do solucionador e
registrando o nuacutemero de operaccedilotildees de ponto flutuante para cada caso gerado O
objetivo eacute encontrar regiotildees de valores para os paracircmetros onde o solucionador
153
apresente alto desempenho permitindo estabelecer e recomendar faixas para os
valores dos paracircmetros onde o solucionador garante convergecircncia com a maior
eficiecircncia possiacutevel O meacutetodo tambeacutem permite identificar as faixas de valores
onde o solucionador natildeo converge
O meacutetodo eacute ilustrado para ajustar os paracircmetros de duas configuraccedilotildees de
solucionador iterativo sendo estas o solucionador proposto neste trabalho
identificado como GMRES+ILU(ξ)+MD e o solucionador GMRES+ILUT(τρ)+MD
apresentado no capiacutetulo 2 Na Tabela 43 especificam-se os paracircmetros
associados a cada solucionador
Tabela 43 ndash Paracircmetros usados nos solucionadores
Solucionadores Meacutetodo Iterativo Preacute-condicionador
GMRES+ILU(ξ)+MD atol rtol
ξ
GMRES+ILUT(τρ)+MD τ ρ
481 Passos Fundamentais
Esta seccedilatildeo apresenta de maneira sucinta os passos envolvidos no meacutetodo para
ajuste dos paracircmetros dos solucionadores onde uma descriccedilatildeo geral eacute
mostrada na Figura 48 O primeiro passo refere-se agrave definiccedilatildeo do espaccedilo de
busca onde satildeo procurados os valores para os paracircmetros que garantem alto
desempenho do solucionador O segundo refere-se aos experimentos numeacutericos
realizados para avaliar o desempenho do solucionador considerando-se todas as
combinaccedilotildees possiacuteveis dos valores de seus paracircmetros definidos no espaccedilo de
busca O passo seguinte tem como objetivo calcular as faixas de valores
recomendaacuteveis para as toleracircncias absoluta e relativa do GMRES Finalmente o
quarto passo calcula as faixas de valores recomendaacuteveis para os paracircmetros do
preacute-condicionador
154
Figura 48 ndash Passos fundamentais para delimitaccedilatildeo dos paracircmetros do solucionador
Nas proacuteximas seccedilotildees os passos mais relevantes no contexto deste trabalho satildeo
discutidos mais detalhadamente
482 Estabelecimento do Espaccedilo de Busca
Para definir o espaccedilo de busca primeiramente deve-se estabelecer o domiacutenio de
cada paracircmetro isto eacute um valor miacutenimo e maacuteximo para cada toleracircncia do
GMRES e para cada paracircmetro do preacute-condicionador como mostrado na Tabela
44 e na Figura 49 Depois devem ser definidos valores intermediaacuterios para cada
paracircmetro sendo que o nuacutemero de valores totais eacute definido em funccedilatildeo do grau
de precisatildeo que se deseja conseguir nos paracircmetros
Finalmente o espaccedilo de busca eacute definido por todas as combinaccedilotildees possiacuteveis
entre as toleracircncias absoluta e relativa do GMRES como apresentado na Figura
49(a) e por todas as combinaccedilotildees possiacuteveis realizadas entre os paracircmetros do
preacute-condicionador como mostrado na Figura 49(b-c)
Para os valores especificados na Tabela 44 existem (m x n) combinaccedilotildees
possiacuteveis entre a toleracircncia absoluta e relativa (ver Figura 49(a)) e (q x p)
combinaccedilotildees possiacuteveis entre os paracircmetros τ e ρ do preacute-condicionador ILUT(τρ)
(ver Figura 49(c)) No caso do preacute-condicionador ILU(ξ) natildeo existem
combinaccedilotildees jaacute que este preacute-condicionador possui somente um uacutenico
paracircmetro Poreacutem existem k valores possiacuteveis para ξ (ver Figura 49(b))
Estabelecer Espaccedilo de Busca
Experimentos numeacutericos
Delimitar paracircmetros do preacute-condicionador
Delimitar toleracircncias do GMRES
155
Tabela 44 ndash Domiacutenios dos paracircmetros usados nos solucionadores
Paracircmetros Maacuteximo Miacutenimo Nuacutemero total de valores
atol atol1 atoln n
rtol rtol1 rtolm m
ξ ξ1 ξk k
τ τ1 τq q
ρ ρ1 ρp P
a) Espaccedilo de busca das toleracircncias do GMRES
b) Espaccedilo de busca dos paracircmetros do preacute-condicionador ILUT(ξ)
c) Espaccedilo de busca dos paracircmetros do preacute-
condicionador ILUT(τρ)
Figura 49 ndash Espaccedilo de busca dos paracircmetros do solucionador
483 Experimentos Numeacutericos
No segundo passo para cada combinaccedilatildeo das toleracircncias absoluta e relativa
(atolrtol) do espaccedilo de busca da Figura 49(a) satildeo simulados tantos Fluxos de
Carga quanto combinaccedilotildees dos paracircmetros do preacute-condicionador existam
registrando-se o nuacutemero de operaccedilotildees de ponto flutuante (MFLOPS) para cada
156
combinaccedilatildeo dos paracircmetros do preacute-condicionador Portanto para cada
combinaccedilatildeo (atolrtol) eacute gerado um graacutefico de eficiecircncia computacional (em
MFLOPS) em funccedilatildeo dos paracircmetros do preacute-condicionador como mostrado na
Figura 410(a) para o preacute-condicionador ILUT(τρ) e na Figura 410(b) para o
preacute-condicionador ILU(ξ)
a) Graacutefico de eficiecircncia para o preacute-condicionador ILUT(τρ)
b) Graacutefico de eficiecircncia para o preacute-condicionador ILU(ξ)
Figura 410 ndash Graacuteficos de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
Para cada graacutefico gerado eacute registrado o nuacutemero de operaccedilotildees de ponto flutuante
miacutenimo (MFLOPSmiacuten) e este valor eacute associado agrave sua correspondente combinaccedilatildeo
(atolrtol) Apoacutes terem sido realizados todos os experimentos e registrados todos
os MFLOPSmiacuten associados a todas as combinaccedilotildees (atolrtol) eacute gerado o graacutefico
de alta eficiecircncia Este graacutefico apresenta em escala de cores todos MFLOPSmiacuten
em funccedilatildeo de suas correspondentes combinaccedilotildees (atolrtol) como mostrado na
Figura 411 sendo que a cor azul estaacute associada com os menores MFLOPSmiacuten a
157
cor vermelha com os maiores MFLOPSmiacuten e em negrito os casos natildeo
convergentes
Observa-se que entre todos os valores registrados para MFLOPSmiacuten existe uma
regiatildeo que conteacutem os casos com os menores MFLOPSmiacuten Este valor chamado
de MFLOPSoacuteti eacute o nuacutemero miacutenimo de operaccedilotildees possiacutevel (global) e estaacute
associado com a regiatildeo quadrada em azul escuro segmentada pelas linhas
brancas Os pontos brancos indicam as posiccedilotildees de todas as combinaccedilotildees que
possuem nuacutemero de operaccedilotildees igual a MFLOPSoacuteti
Figura 411 ndash Graacuteficos de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
484 Delimitaccedilatildeo das Toleracircncias do GMRES
No terceiro passo a partir do graacutefico de alta eficiecircncia apresentado na sua forma
bidimensional na Figura 412 eacute segmentada a regiatildeo dos MFLOPSoacuteti Neste
caso esta regiatildeo eacute o quadrado azul do centro do graacutefico onde cada ponto
branco estaacute associado a uma combinaccedilatildeo (atolrtol) que apresenta o menor
nuacutemero de operaccedilotildees possiacutevel em todo o espaccedilo de busca (MFLOPSoacuteti) Este
graacutefico permite encontrar as faixas de valores (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do meacutetodo GMRES associadas ao melhor
desempenho possiacutevel
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
134
137
Tabela 41 ndash Caracteriacutesticas baacutesicas dos solucionadores diretos mais usados
Solucionador Tipo de Meacutetodo Direto Estrateacutegias
Implementadas Referecircncia
MA28 Atualizaccedilatildeo imediata
Markowitz Miacutenimo grau
e Bloco triangular (Duff amp Reid 1979)
SPARSPAK Atualizaccedilatildeo retrasada Miacutenimo grau
Divisatildeo encaixada e Cuthill Mckee reverso
(George amp Liu 1981)
Solucionadores de MATLAB
Vaacuterios Miacutenimo grau
Bloco triangular e Cuthill Mckee reverso
(Gilbert et al 1992)
MA48 Atualizaccedilatildeo retrasada Miacutenimo grau
Bloco triangular (Duff amp Reid 1996)
SuperLU Atualizaccedilatildeo retrasada
Supernodal Miacutenimo grau (Demmel et al 1999)
SuperLU _DIST Atualizaccedilatildeo imediata
Supernodal Miacutenimo grau (Li amp Demmel 2003)
PARDISO Atualizaccedilatildeo
imediataretrasada Supernodal
Miacutenimo grau e Divisatildeo encaixada
(Schenk amp Gartner 2001)
WSMP Multifrontal Miacutenimo grau
Divisatildeo encaixada e Bloco triangular
(Gupta 2002)
Solucionadores de Mathematica
Vaacuterios Miacutenimo grau
Divisatildeo encaixada e Bloco triangular
(Wolfram 2003)
UMFPACK Multifrontal Miacutenimo grau
e Escalonamento (Davis 2004)
Nestes solucionadores os aspectos a serem levados em consideraccedilatildeo para
desenvolver os algoritmos complexos heuriacutesticas e estrateacutegias apresentadas na
Tabela 41 basicamente satildeo a geraccedilatildeo do menor nuacutemero de elementos natildeo-
nulos possiacutevel durante o processo de fatoraccedilatildeo e tambeacutem a conservaccedilatildeo da
estabilidade numeacuterica mediante as estrateacutegias de reordenamento e
monitoramentoeleiccedilatildeo dos elementos pivocircs respectivamente
Neste trabalho o solucionador MA28 representaraacute os solucionadores diretos
quando realizadas as comparaccedilotildees de desempenho com o solucionador iterativo
proposto nesta tese Este solucionador foi escolhido principalmente porque
permite calcular o nuacutemero de operaccedilotildees de ponto flutuante pela facilidade para
ser acondicionado dentro do programa de fluxo de carga pela disponibilidade
135
137
total do coacutedigo do solucionador em linguagem FORTRAN e desempenho similar
a outros solucionadores diretos O MA28 permuta tanto linhas como colunas na
matriz de coeficientes A utilizando duas matrizes P e Q Este solucionador usa
principalmente as estrateacutegias de Markowitz e miacutenimo grau visando manter as
propriedades esparsas e o controle da perda da exatidatildeo devido aos erros de
arredondamento (Duff amp Reid 1979) Ambas as estrateacutegias satildeo executadas de
forma dinacircmica durante o processo de fatoraccedilatildeo (PmiddotAmiddotQ = LmiddotU)
No proacuteximo capiacutetulo satildeo usados dois programas computacionais ndash ANAREDE e
ORGANON (Chaves 2008 Jardim amp Stott 2005 CEPEL 2007) para validar os
resultados dos experimentos numeacutericos e realizar comparaccedilotildees principalmente
em termos de robustez e eficiecircncia computacional O ORGANON eacute um sistema
utilizado para avaliaccedilatildeo da seguranccedila de redes eleacutetricas de potecircncia que
emprega computaccedilatildeo de alto desempenho utilizando teacutecnicas numeacutericas
avanccediladas algoritmos especializados arquitetura construtiva flexiacutevel e
processamento distribuiacutedo (Chaves 2008) No ORGANON o problema de fluxo
de carga eacute solucionado de duas formas usando-se os modelos estaacuteticos da rede
eleacutetrica e o algoritmo de Newton-Raphson ou usando-se modelos dinacircmicos da
rede eleacutetrica e o meacutetodo de dinacircmica sinteacutetica (Jardim amp Stott 2005) Em
(Chaves 2008) satildeo feitas diversas e diferentes aplicaccedilotildees com este programa
em estudos de fluxo de potecircncia atraveacutes do meacutetodo convencional de Newton-
Raphson completo ou com o meacutetodo de Fluxo de Potecircncia de Dinacircmica Sinteacutetica
(FPDS) Este uacuteltimo obteacutem a soluccedilatildeo para o problema de fluxo de potecircncia (caso
essa exista) mesmo para casos em que os meacutetodos convencionais falhem e
ainda apenas soluccedilotildees estaacuteveis
Jaacute o programa de anaacutelise de redes (ANAREDE ndash versatildeo 090403) eacute um conjunto
de aplicaccedilotildees computacionais algoritmos e meacutetodos eficientes adequados agrave
realizaccedilatildeo de estudos nas aacutereas de operaccedilatildeo e de planejamento de sistemas
eleacutetricos de potecircncia No ANAREDE a soluccedilatildeo das equaccedilotildees da rede eleacutetrica eacute
realizada pelo algoritmo Newton-Raphson e o reordenamento da matriz
Jacobiana para preservar a esparsidade eacute efetuado utilizando a teacutecnica MD
(CEPEL 2007)
136
137
422 Solucionadores Iterativos Aplicados em Problemas de Sistemas de Energia Eleacutetrica
Na Tabela 42 apresenta-se uma siacutentese do estado da arte dos solucionadores
iterativos quando aplicados ao problema de fluxo de carga A maior parte das
informaccedilotildees associadas com os meacutetodos iterativos e estrateacutegias de preacute-
condicionamento de cada um destes solucionadores jaacute foi apresentada nas
seccedilotildees 241 242 e 34 dos capiacutetulos anteriores Algumas informaccedilotildees
associadas com outras estrateacutegias e teacutecnicas numeacutericas consideradas em
alguns destes solucionadores e que ainda natildeo foram mencionadas satildeo
apresentadas nas uacuteltimas duas colunas da Tabela 42 sendo estas
Em (Flueck e Chiang 1998) combina-se a teacutecnica de reordenamento RCM com
o meacutetodo GMRES e o preacute-condicionador fixo FastD Todas as simulaccedilotildees foram
realizadas usando RCM e um sistema de 8027 barras sendo o solucionador
proposto 50 mais raacutepido que o tradicional solucionador direto de fatoraccedilatildeo LU
Em (Dag e Semlyen 2003) o solucionador proposto usa teacutecnicas de
escalonamento na matriz Brsquo do meacutetodo desacoplado raacutepido obtendo-se bons
resultados em termos de robustez Poreacutem em (de Leon 2003) a proposta de
Dag eacute fortemente criticada pelo uso dos meacutetodos desacoplados junto aos
meacutetodos iterativos
Em (Pessanha et al 2009) avaliam-se os efeitos do reordenamento RCM e da
teacutecnica de maacuteximo produto transversal com escalonamento na qualidade do preacute-
condicionador ILUT(τρ) quase-fixo Os resultados mostram que este tipo de
preprocessamento da matriz Jacobiana melhora significativamente a qualidade
do preacute-condicionador consequentemente a robustez do solucionador
Nas uacuteltimas linhas da Tabela 42 apresentam-se as caracteriacutesticas baacutesicas do
solucionador proposto nesta tese destacando-se o preacute-condicionador ILU(ξ) com
regra de preenchimento baseada no erro Nas proacuteximas seccedilotildees todos os
componentes do solucionador proposto satildeo tratados com maiores detalhes
137
137
Tabela 42 ndash Caracteriacutesticas dos solucionadores iterativos usados em aplicaccedilotildees de fluxo de carga
Autor Ano Meacutetodo
Iterativo
Estrateacutegias Usadas
Preacute-condicionador Regra de Eliminaccedilatildeo Reordenamento Escalonamento
Galiana 1994 GConjugado Cholesky Incomp M=Lrsquo∙LrsquoT(0) Sem novos elementos natildeo-nulos mdash mdash
Mori 1996 Tchebychev Cholesky Incompleto Sem novos elementos natildeo-nulos mdash mdash
Semlyen 1996 GMRES(m) mdash mdash mdash mdash
Borges 1996(97) BiCGStab M = L∙U da primeira Iteraccedilatildeo mdash mdash mdash
Pai 1997 GMRES ILU(k) Niacutevel de novos elementos natildeo-nulos mdash mdash
Flueck 1998 GMRES(m) FastD M = Brsquo mdash RCM mdash
Alves 1999 GConjugado Cholesky completo mdash MD MST mdash
De Leoacuten 2002 BiCGStab GMRES QMR CGS BiCG + ILU() Com paracircmetro limitante
limitante
mdash mdash
Dag 2003 GConjugado Aproximaccedilatildeo da Inversa Polinocircmio de Chebyshev mdash D1∙Brsquo∙D2
Chen 2006 GMRES(m) Aprox da Inversa Adaptativa mdash mdash mdash
Mori 2007 BiCGStab ILU(k) Niacutevel de novos elementos natildeo-nulos mdash mdash
Pessanha 2009 GMRES ILUT( ρ) quase-fixo
Duplo paracircmetro limitante e ρ RCM mdash
Khaitan 2010 GMRES M = L∙U Multifrontal quase-fixo mdash RCM mdash
Solucionador Proposto GMRES ILU(ξ) Baseada no Erro MD mdash
138
137
43 Solucionador Iterativo Para Fluxo de Carga
O solucionador desenvolvido eacute composto basicamente pelo meacutetodo iterativo de
subespaccedilos de Krylov GMRES (vide Capiacutetulo 2) e pela estrateacutegia de preacute-
condicionamento de fatoraccedilatildeo incompleta ILU(ξ) com suporte da teacutecnica de
reordenamento Miacutenimo Grau (MD) A estrateacutegia de reinicializaccedilatildeo GMRES(m)
(apresentada em 26) usada para limitar o tamanho dos subespaccedilos de Krylov a
um valor maacuteximo ―m natildeo faz parte do solucionador uma vez que a estrateacutegia
de preacute-condicionamento forccedila a convergecircncia do GMRES em poucas iteraccedilotildees
lineares (uma ou duas iteraccedilotildees) Portanto jaacute que poucas iteraccedilotildees estatildeo
associadas a subespaccedilos pequenos entatildeo natildeo eacute necessaacuterio estabelecer um
valor maacuteximo ―m
Nesta tese adota-se a teacutecnica de reordenamento MD porque a mesma acarreta
a reduccedilatildeo significativa do nuacutemero de novos elementos natildeo-nulos gerados
reduzindo o esforccedilo computacional realizado para construir e usar o preacute-
condicionador Alem disso este tipo de reordenamento aumenta a taxa de
convergecircncia do meacutetodo iterativo GMRES O solucionador eacute denominado de
GMRES+ILU(ξ)+MD e foi implementado em um programa computacional de
fluxo de carga desenvolvido em linguagem Fortran da forma apresentada no
fluxograma da Figura 41 Seus componentes estatildeo destacados na cor vermelha
numerados por algarismos romanos na mesma ordem em que satildeo aplicados
Observa-se que antes de iniciadas as iteraccedilotildees Newton-Raphson eacute calculada a
sequumlecircncia de reordenamento usando-se a teacutecnica MD matematicamente
representada pela matriz de permutaccedilotildees P Na praacutetica eacute gerado um vetor com
a sequumlecircncia de reordenamento que permitiraacute montar a matriz Jacobiana jaacute
reordenada em cada iteraccedilatildeo k do algoritmo Newton-Raphson Esse vetor
tambeacutem eacute usado para reordenar os resiacuteduos de potecircncia ativa e reativa
armazenados no vetor bk Cada vez que o teste de convergecircncia do algoritmo
Newton-Raphson natildeo for satisfeito uma nova matriz Jacobiana reordenada eacute
montada A partir das informaccedilotildees da matriz Jacobiana reordenada a estrateacutegia
de preacute-condicionamento ILU(ξ) constroacutei um preacute-condicionador Mk que em
seguida seraacute usado para obter explicitamente o novo sistema linear preacute-
condicionado (41) a ser solucionado pelo meacutetodo iterativo GMRES Finalmente
139
137
as incoacutegnitas satildeo atualizadas em (42) O procedimento eacute repetido ateacute que o
teste de convergecircncia do algoritmo Newton-Raphson seja satisfeito
1 T 1k k kM P J P x M P b (41)
T
k 1 k
v vP x
(42)
Figura 41 ndash Fluxograma do Solucionador Iterativo para o problema de fluxo de carga
O programa de fluxo de carga modela as barras de acordo como seu tipo (PQ
PV e de referecircncia) as linhas de transmissatildeo transformadores e
140
137
transformadores defasadores satildeo representados pelos seus circuitos ᴨ
equivalentes Os tapes variaacuteveis sob carga podem ainda ter a atuaccedilatildeo contiacutenua
ou discreta As cargas das barras satildeo normalmente modeladas como potecircncias
ativa e reativa constantes ou podem ser expressas como uma funccedilatildeo da
magnitude da tensatildeo da barra Natildeo satildeo modelados elos de corrente contiacutenua
No algoritmo de fluxo de carga consideram-se o controle de variaccedilatildeo automaacutetica
de tape e os limites de geraccedilatildeo de potecircncia reativa
44 Regra de Preenchimento Baseada no Caacutelculo do Erro Associado ao Elemento Descartado
Uma forma simples de estimar o erro total R originado pelos elementos
descartados devido agraves regras de preenchimento da fatoraccedilatildeo incompleta eacute
usando-se (310) (Mori et al 1996 Saad 2003) Nesta equaccedilatildeo o produto dos
fatores triangulares incompletos eacute igual ao preacute-condicionador M e o produto dos
fatores triangulares completos eacute igual agrave matriz de coeficientes A como mostrado
em (311) Desta forma o erro R permite vislumbrar quatildeo diferente se tornou
o preacute-condicionador em relaccedilatildeo aos fatores triangulares completos apoacutes o
descarte de seus elementos
Um preacute-condicionador sem regra de preenchimento efetua completamente o
caacutelculo dos fatores triangulares Neste caso o preacute-condicionador M se iguala agrave
matriz de coeficientes (M = L∙U = A) o que resulta na convergecircncia do meacutetodo
GMRES em uma uacutenica iteraccedilatildeo com erro R nulo Poreacutem o nuacutemero de
operaccedilotildees de ponto flutuante ainda eacute consideraacutevel Para se obter esta reduccedilatildeo eacute
necessaacuterio usar uma regra de preenchimento que descarte o maior nuacutemero de
elementos nos fatores triangulares e sem que isso provoque o aumento do erro
R consequumlentemente afetando o desempenho do GMRES
R A M (43)
R L U L U (44)
Como exemplo na Figura 36 satildeo apresentados dois graacuteficos que ilustram como
os erros produzidos pelo descarte dos fatores triangulares natildeo-nulos podem se
alastrar ateacute em posiccedilotildees de elementos jaacute preenchidos O experimento foi
141
137
apresentado na seccedilatildeo 332 do capiacutetulo anterior para o sistema brasileiro de
3513 barras usando-se o preacute-condicionador ILU(0) para o caacutelculo dos fatores
incompletos No graacutefico da Figura 36(a) mostra-se que 8797 dos elementos
do preacute-condicionador M (83078) satildeo distintos dos encontrados na matriz
Jacobiana O graacutefico do erro em 42(b) permite se ter uma ideacuteia da dimensatildeo
destas diferenccedilas Dos 38738 elementos com erros entre 0 e 001 (pontos
azuis) 11360 tecircm erro igual a zero (elementos idecircnticos) e 27378 tecircm erros
menores que 001 Os erros nesta faixa de valores normalmente natildeo prejudicam
a convergecircncia do GMRES
As outras faixas de valores associadas aos pontos de cores verde amarelo e
vermelho normalmente prejudicam a convergecircncia do GMRES Esses erros
devem ser evitados e satildeo gerados quando alguns elementos importantes satildeo
descartados durante a fatoraccedilatildeo ILU(0) O maior erro provocado entre os
elementos de M e da Jacobiana eacute de 401931 e o erro total para este preacute-
condicionador eacute de 10632middot105 (norma de Frobenius) Para evitar que os erros
se propaguem enquanto eacute realizada a fatoraccedilatildeo eacute necessaacuterio calcular o erro
associado a cada elemento dos fatores triangulares antes de seu preenchimento
ou descarte Este erro deve tambeacutem considerar os erros propagados nos
caacutelculos futuros onde o elemento seja requerido Se este valor for zero ou
proacuteximo de zero entatildeo o elemento pode ser descartado caso contraacuterio deve ser
preenchido
a) Produto dos fatores incompletos (LrsquoUrsquo) do preacute-condicionador ILU(0)
b) Matriz R para o preacute-condicionador ILU(0)
Figura 42 ndash Erros produzidos pela regra de preenchimento com o preacute-condicionador ILU(0) para a matriz Jacobiana do sistema brasileiro de 3513 barras
142
Sejam L e U os fatores triangulares completos Lrsquo e Ursquo os fatores triangulares
incompletos apoacutes o descarte de um uacutenico elemento Lik o elemento descartado
em Lrsquo e Uki o elemento descartado em Ursquo (Lik = 0 ou Uki = 0) Usando a equaccedilatildeo
(311) (Mori et al 1996 Saad 2003 Benzi et al 1999b Benzi 2002) eacute possiacutevel
calcular o erro associado ao elemento Lik (45) e o erro associado ao elemento
Uki (46) Como mencionado anteriormente esses erros permitem ter uma ideacuteia
de quatildeo diferente se torna o preacute-condicionador M dos fatores triangulares
completos apoacutes os elementos Lik e Uki serem descartados Como os erros estatildeo
associados a um uacutenico elemento descartado as equaccedilotildees (45) e (46) podem
ser reescritas como em (47) e (48) respectivamente
R = L U - L Usdot sdot (45)
R = L U - L Usdot sdot (46)
)ik(LR = (L -L) Usdot (47)
)ik(UR = L (U-U)sdot (48)
Verifica-se que tanto a matriz diferenccedila (L-Lrsquo) como tambeacutem (U-Ursquo) possuem
apenas um elemento natildeo nulo Lik (descartado em Lrsquo) e Uki (descartado em Ursquo)
respectivamente como apresentado em (49) e (410)
ik
0
0 0
0 0 0
0 0 0 0
L L =
0 0 0 0 0
0 0 L 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
( - )
⋮ ⋱
⋯
⋯
⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱
⋯ ⋯ ⋯
(49)
143
ki
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 U 0 0
0 0 0 0 0
(U - U) =
0 0 0 0
0 0 0
0 0
0
⋯ ⋯ ⋯
⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯
⋯
⋯
⋱ ⋮
(410)
Pela substituiccedilatildeo de (49) e (410) nos produtos (L-Lrsquo)middotU como Lmiddot(U-Ursquo) resulta
em (411) e (412)
ik kk ik kk+1 ik ki ik kn
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
L - L) U =
0 0 0 0 0 0
0 0 L U L U L U L U
0 0 0 0 0 0
0 0 0 0 0 0
(
sdot
sdot sdot sdot sdot
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(411)
ki
k+1k ki
ik ki
nk ki
0 0 0 0 0
0 0 0 0 0
0 0 U 0 0
L (U - U) = 0 0 L U 0 0
0 0 L U 0 0
0 0 L U 0 0
sdot sdot
sdot
sdot
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
(412)
Conforme mencionado no capiacutetulo anterior uma das dificuldades para propor
uma regra de preenchimento estaacute em se reduzir o nuacutemero de operaccedilotildees
associadas com sua execuccedilatildeo dentro do algoritmo de preacute-condicionamento
144
Neste trabalho propotildee-se usar a norma-1 em (47) para o caacutelculo do erro
associado a um elemento de L e a norma-infin em (48) para o caacutelculo do erro
associado a um dado elemento de U como apresentado em (413) e (414) As
referidas normas aproveitam a estrutura das matrizes (411) e (412) evitando-se
a realizaccedilatildeo de operaccedilotildees adicionais sendo requeridas ao inveacutes disto apenas
comparaccedilotildees entre elementos Portanto substituindo (411) em (413) e (412)
em (414) e calculando-se as normas satildeo obtidas as equaccedilotildees (415) e (416)
que devem ser usadas na regra de preenchimento
)1ik(LR = (L -L) Usdot (413)
ki(U )R = L (U-U) infinsdot (414)
ik ik km(L )R = L max U m = [kn]sdot (415)
ki ki mk(U )R U max 1 L m=[k+1n]= sdot (416)
Na Figura 43 satildeo destacados em vermelho todos os elementos dos fatores
triangulares que satildeo requeridos para calcular o erro produzido quando o
elemento Lik (no quadrado) eacute descartado Jaacute na Figura 44 satildeo destacados em
azul todos os elementos necessaacuterios para calcular o erro produzido quando o
elemento Uki (encerrado no quadrado) eacute descartado Observa-se que para que
esta regra possa ser implementada tanto no fator triangular U como em L o
algoritmo de fatoraccedilatildeo deve ser capaz de calcular os elementos Ukk Ukk+1
Ukn (em vermelho) antes de decidir se o elemento Lik deve ser preenchido ou
descartado Semelhantemente deve ser capaz de calcular os elementos Lk+1k
Lnk (em azul) antes de decidir se o elemento Uki deve ser preenchido ou
descartado
145
Figura 43 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Lik
Figura 44 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Uki
45 Adequaccedilatildeo da Regra Baseada no Erro
Nesta seccedilatildeo a regra de preenchimento baseada no erro eacute adequada para ser
usada no preacute-condicionador ILUT(τρ) analisado no capiacutetulo anterior O preacute-
condicionador resultante seraacute chamado de preacute-condicionador de duplo
paracircmetro limitante ILUT(ξτ) Neste preacute-condicionador natildeo eacute mais necessaacuterio
usar o paracircmetro ρ
Conforme visto no Capiacutetulo 3 o algoritmo de fatoraccedilatildeo usado neste preacute-
condicionador eacute o IKJ e deriva da eliminaccedilatildeo de Gauss (Saad 2003) Este tipo
de algoritmo permite calcular os elementos Ukk Ukk+1 Ukn antes de decidir se
o elemento Lik deve ser preenchido ou descartado Poreacutem o algoritmo IKJ natildeo
permite calcular os elementos Lk+1k Lnk antes de decidir se o elemento Uki
deve ser preenchido ou descartado porque no mesmo os elementos de L e U
146
satildeo calculados por linhas uma de cada vez Portanto a regra baseada no erro
pode ser aplicada apenas nos elementos do fator L enquanto que uma variante
da regra convencional usada no ILUT(τρ) eacute usada para os elementos de U
O caacutelculo da norma-2 usada na regra de preenchimento convencional dada pela
raiz quadrada da soma dos quadrados dos elementos da linha pode exigir
consideraacutevel esforccedilo computacional dependendo da dimensatildeo da matriz de
coeficientes Portanto ao inveacutes de se usar esta norma para descartar os
elementos em U recomenda-se realizar a meacutedia aritmeacutetica dos elementos da i-
eacutesima linha da matriz de coeficientes original Este procedimento reduz o nuacutemero
de operaccedilotildees de ponto flutuante sem comprometer a qualidade do preacute-
condicionador No entanto a eficiecircncia de ambas as heuriacutesticas eacute inferior agrave da
regra baseada no erro para preenchimento dos elementos proposta no presente
trabalho O resultado eacute um preacute-condicionador que aplica dois criteacuterios para
definir sua regra de preenchimento da seguinte forma
De acordo com a relaccedilatildeo dada por (417) um elemento Lik eacute descartado se o
erro resultante for menor que a toleracircncia ξ usada para todas as linhas de L
Caso contraacuterio calcula-se Lik usando-se o elemento aik da matriz resultante do
processo de eliminaccedilatildeo de Gauss ateacute a correspondente etapa Jaacute para um
elemento Uik este eacute descartado se for menor que uma certa toleracircncia relativa
τi obtida multiplicando-se a toleracircncia absoluta τ pela meacutedia aritmeacutetica dos
elementos da i-eacutesima linha da matriz de coeficientes original O caacutelculo de w eacute
efetuado de acordo com o algoritmo de fatoraccedilatildeo IKJ apresentado no capiacutetulo
anterior
ik
ikik
(L )
ik (L )k=(1i-1)
kk
0 R= aL
RU
lt ξ ge ξ
(417)
ik
k i
k k ik=(i+1n)
0 w =U
w w
lt ge
ττ
(418)
A adaptaccedilatildeo da regra baseada no erro no preacute-condicionador ILUT(τρ) falha
devido ao fato do algoritmo de fatoraccedilatildeo IKJ natildeo permitir a aplicaccedilatildeo da regra
147
em ambos os fatores triangulares L e U dificultando a exploraccedilatildeo das vantagens
do uso desta regra A seguir mostra-se uma proposta para superar estes
problemas utilizando-se outro algoritmo de fatoraccedilatildeo que permite aplicar a regra
em ambos os fatores triangulares
46 Preacute-condicionador ILU( ξ) Baseado no Caacutelculo do Erro
Nesta seccedilatildeo propotildee-se uma eficiente e robusta estrateacutegia de preacute-
condicionamento da fatoraccedilatildeo incompleta ILU(ξ) derivada de uma versatildeo do
algoritmo de eliminaccedilatildeo de Gauss conhecido como Doolittle A maior vantagem
deste algoritmo eacute que permite usar de forma efetiva a regra de preenchimento
baseada no erro em ambos os fatores triangulares L e U
Os fatores L e U satildeo apresentados em (419) e (420) Os elementos da diagonal
de L satildeo iguais a um e a primeira linha de U eacute igual agrave primeira linha da matriz de
coeficientes A As equaccedilotildees usadas pelo algoritmo de Doolittle para calcular os
elementos dos fatores triangulares satildeo apresentadas em (422) e podem ser
obtidas ao se igualar cada elemento do produto dos fatores triangulares LmiddotU de
(419) e (420) aos elementos da matriz de coeficientes A apresentada em (421)
Estas equaccedilotildees podem ser implementadas computacionalmente de diferentes
formas todas baseadas na eliminaccedilatildeo de Gauss Teoricamente os diferentes
tipos de eliminaccedilatildeo de Gauss realizam o mesmo nuacutemero de operaccedilotildees de ponto
flutuante No entanto no contexto da fatoraccedilatildeo incompleta estas variantes
resultam em importantes diferenccedilas praacuteticas quando o interesse eacute utilizar a regra
de preenchimento baseada no erro
k-11
k1 kk 1
i1 ik 1 ik
n1 nk 1 nk ni
1 0 0 0 0
L 1 0 0 0
L L 1 0 0L
L L L 1 0
L L L L 1
minus
minus
minus
=
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(419)
148
11 1k 1 1k 1i 1n
k-1k-1 k-1k k-1i k-1n
kk ki kn
ii in
nn
U U U U U
0 U U U U
0 0 U U UU
0 0 0 U U
0 0 0 0 U
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(420)
11 1k 1 1k 1i 1n
k-11 k-1k-1 k-1k k-1i k-1n
k1 kk-1 kk ki kn
i1 ik-1 ik ii in
n1 nk-1 nk ni nn
a a a a a
a a a a a
a a a a aA
a a a a a
a a a a a
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(421)
k-1
ki ki kj jij=1
k-1
ik ij jkj=1
ikkk
U =a - [L U ] i=kn
a - [L U ]
L = i=k+1nU
sum
sum (422)
As equaccedilotildees de Doolittle podem gerar algoritmos de eliminaccedilatildeo de Gauss que
calculam os elementos dos fatores triangulares por linhas de forma similar agrave
fatoraccedilatildeo IKJ ou por colunas (Bodewig 1956 Wilkinson 1965 Dahlquist amp
Bjoumlrk 1974 Hoffman 2001) Em ambos algoritmos natildeo seria possiacutevel usar a
regra de preenchimento baseada no erro A partir de (422) propotildee-se usar o
algoritmo de eliminaccedilatildeo de Gauss apresentado na Figura 45 que permite
calcular os elementos dos fatores triangulares simultaneamente por linhas em U
e por colunas em L como mostrado na Figura 46
No passo k da eliminaccedilatildeo de Gauss os elementos da k-eacutesima linha de U e a k-
eacutesima coluna de L (identificados por linhas tracejadas) satildeo calculados utilizando
elementos jaacute computados anteriormente nas linhas e colunas de U e L Por
exemplo para se calcular o elemento Uki satildeo usados os elementos destacados
em azul enquanto que para calcular o elemento Lik satildeo usados os elementos
149
destacados em vermelho Observa-se que este algoritmo permite calcular
elementos de L em linhas posteriores agrave linha k Esta caracteriacutestica possibilita o
uso em U da regra de preenchimento baseada no erro
1 Para i = 1n Faccedila
2 min = Ji in
3 Para k = in Faccedila
4 Para j = 1i-1 Faccedila
5 mk = mk - LijmiddotUjk
6 Fim ndash Faccedila
7 Fim ndash Faccedila
8 Registrar Umax = maxmin
9 ni+1n = J i+1ni
10 Para k = i+1n Faccedila
11 Para j = 1i-1 Faccedila
12 nk = nk ndash LkjmiddotUji
13 Fim ndash Faccedila
14 Fim ndash Faccedila
15 n = nUii
16 Registrar Lmax = maxni+1n
17 Aplicar a regra de preenchimento baseada no erro em m e n
18 Ui in = m in
19 L i+1ni = n i+1n
20 Fim ndash Faccedila
Figura 45 ndash Algoritmo do preacute-condicionador ILU(ξ)
Figura 46 ndash Elementos necessaacuterios para calcular os elementos Lik e Uki durante a fatoraccedilatildeo triangular
150
No algoritmo da Figura 45 observa-se que no passo k os elementos da linha de
U satildeo armazenados no vetor m enquanto que os elementos da coluna de L satildeo
armazenados no vetor n (passos 5 e 12 respectivamente) Uma vez calculados
ambos os vetores procura-se o maior elemento de m sendo armazenado em
Umax e o maior elemento de n armazenado em Lmax (passos 8 e 16
respectivamente) Ambos os valores maacuteximos (em valores absolutos) satildeo
usados pela regra de preenchimento no passo 17 para descartar em m e n os
elementos associados com os menores erros e preencher a linha de U e a
coluna de L da seguinte forma
De acordo com as relaccedilotildees dadas por (423) e (424) tanto um elemento Lki
como tambeacutem um elemento Uik satildeo descartados se seus erros associados
foram menores que uma dada toleracircncia ξ usada para todas as colunas de L e
linhas de U Caso contraacuterio Lki eacute preenchido usando-se o valor armazenado
em nk e Uik eacute preenchido usando-se o valor armazenado em mk
ik
ikik
(U )
(U )kk=(in)
0 R =U
m R
lt ξ ge ξ
(423)
ik
ikki
(L )
(L )ki=(1+1n)
0 R=L
n R
lt ξ ge ξ
(424)
Como observado na Figura 46 o algoritmo da Figura 45 permite encontrar os
elementos Ukk Ukk+1 Ukn necessaacuterios para se calcular o erro associado ao
elemento Lki e os elementos Lk+1k Lnk que por sua vez satildeo necessaacuterios para
se calcular o erro associado ao elemento Uik Nota-se que os elementos
necessaacuterios para calcular o erro (passo k) satildeo calculados neste mesmo passo
portanto natildeo eacute necessaacuterio realizar grandes buscas de elementos nas matrizes L
e U Igualmente tambeacutem natildeo eacute necessaacuterio armazenar valores Umax Lmax ou
erros do passo k porque natildeo seratildeo mais necessaacuterios nos proacuteximos passos
Observe-se que natildeo eacute necessaacuterio multiplicar o paracircmetro ξ por alguma norma ou
meacutedia aritmeacutetica dos elementos da matriz de coeficientes como realizado no
preacute-condicionador ILUT(τρ) porque o erro independe dos valores dos elementos
151
da matriz de coeficientes Este preacute-condicionador usa apenas um uacutenico
paracircmetro ξ Esta caracteriacutestica facilita o ajuste dos paracircmetros do solucionador
como seraacute visto nas proacuteximas seccedilotildees e no proacuteximo capiacutetulo
47 Meacutetodo Convencional Para Ajuste dos Paracircmetros dos Solucionadores
O ajuste dos paracircmetros de um solucionador iterativo eacute considerado fundamental
para garantir sua robustez e eficiecircncia computacional principalmente em
anaacutelises mais complexas como aquelas que solucionam vaacuterios fluxos de carga
com diferentes pontos de operaccedilatildeo Nesses casos a escolha de valores
apropriados para os paracircmetros se torna ainda mais relevante
A ideacuteia fundamental eacute escolher os valores dos paracircmetros que permitam
preencher o menor nuacutemero de elementos sem prejudicar a qualidade do preacute-
condicionador isto eacute sem tornaacute-lo muito diferente de A Poreacutem a escolha de
valores apropriados para os paracircmetros eacute uma tarefa difiacutecil jaacute que existe uma
interdependecircncia com as toleracircncias relativa e absoluta do GMRES e com o tipo
de problema que estaacute sendo solucionado
Pouco tem sido pesquisado em relaccedilatildeo a este tema apenas em (de Leon amp
Semlyen 2002) apresenta-se uma foacutermula que permite calcular para cada
sistema eleacutetrico o valor do paracircmetro limitante τ no preacute-condicionador ILU(τ)
dado por (322) onde τ eacute igual agrave metade do nuacutemero de equaccedilotildees totais Neq do
sistema linear Na praacutetica estaacute foacutermula natildeo garante robustez nem o melhor
desempenho do solucionador
eq
12 N
τ =sdot
(425)
No entanto o procedimento convencional define primeiro valores arbitraacuterios para
as duas toleracircncias absoluta e relativa do GMRES Nas simulaccedilotildees realizadas
nos capiacutetulos anteriores se usou toleracircncias iguais (10-5) e menores que a
toleracircncia usada no teste de convergecircncia do algoritmo Newton-Raphson pois
toleracircncias maiores costumam impedir a convergecircncia do Newton-Raphson
152
Uma vez definidas as toleracircncias a escolha dos paracircmetros do preacute-
condicionador eacute realizada com base em tentativa e erro
Este meacutetodo natildeo considera a possibilidade de encontrar melhores desempenhos
para outras toleracircncias do GMRES que natildeo necessariamente devem ser
consideradas iguais Durante o procedimento de tentativa e erro o meacutetodo pode
encontrar um miacutenimo nuacutemero de operaccedilotildees local (MFLOPSL) associado com τL
como ilustrado na Figura 47 que natildeo necessariamente eacute o menor possiacutevel
(MFLOPSG) Observa-se que para obter o miacutenimo nuacutemero de operaccedilotildees global
(MFLOPSG) o procedimento de tentativa e erro deveria comeccedilar com um valor
de τ proacuteximo de τG
Figura 47 ndash Procedimento de tentativa e erro para busca de valores de um paracircmetro do preacute-condicionador
Quando o preacute-condicionador possui um segundo paracircmetro o procedimento de
tentativa e erro eacute repetido para este segundo paracircmetro fixando-se o primeiro
paracircmetro
48 Meacutetodo Proposto Para Ajuste dos Paracircmetros dos Solucio nadores
O meacutetodo proposto consiste em realizar sucessivas simulaccedilotildees de fluxo de
carga variando simultaneamente todos os paracircmetros do solucionador e
registrando o nuacutemero de operaccedilotildees de ponto flutuante para cada caso gerado O
objetivo eacute encontrar regiotildees de valores para os paracircmetros onde o solucionador
153
apresente alto desempenho permitindo estabelecer e recomendar faixas para os
valores dos paracircmetros onde o solucionador garante convergecircncia com a maior
eficiecircncia possiacutevel O meacutetodo tambeacutem permite identificar as faixas de valores
onde o solucionador natildeo converge
O meacutetodo eacute ilustrado para ajustar os paracircmetros de duas configuraccedilotildees de
solucionador iterativo sendo estas o solucionador proposto neste trabalho
identificado como GMRES+ILU(ξ)+MD e o solucionador GMRES+ILUT(τρ)+MD
apresentado no capiacutetulo 2 Na Tabela 43 especificam-se os paracircmetros
associados a cada solucionador
Tabela 43 ndash Paracircmetros usados nos solucionadores
Solucionadores Meacutetodo Iterativo Preacute-condicionador
GMRES+ILU(ξ)+MD atol rtol
ξ
GMRES+ILUT(τρ)+MD τ ρ
481 Passos Fundamentais
Esta seccedilatildeo apresenta de maneira sucinta os passos envolvidos no meacutetodo para
ajuste dos paracircmetros dos solucionadores onde uma descriccedilatildeo geral eacute
mostrada na Figura 48 O primeiro passo refere-se agrave definiccedilatildeo do espaccedilo de
busca onde satildeo procurados os valores para os paracircmetros que garantem alto
desempenho do solucionador O segundo refere-se aos experimentos numeacutericos
realizados para avaliar o desempenho do solucionador considerando-se todas as
combinaccedilotildees possiacuteveis dos valores de seus paracircmetros definidos no espaccedilo de
busca O passo seguinte tem como objetivo calcular as faixas de valores
recomendaacuteveis para as toleracircncias absoluta e relativa do GMRES Finalmente o
quarto passo calcula as faixas de valores recomendaacuteveis para os paracircmetros do
preacute-condicionador
154
Figura 48 ndash Passos fundamentais para delimitaccedilatildeo dos paracircmetros do solucionador
Nas proacuteximas seccedilotildees os passos mais relevantes no contexto deste trabalho satildeo
discutidos mais detalhadamente
482 Estabelecimento do Espaccedilo de Busca
Para definir o espaccedilo de busca primeiramente deve-se estabelecer o domiacutenio de
cada paracircmetro isto eacute um valor miacutenimo e maacuteximo para cada toleracircncia do
GMRES e para cada paracircmetro do preacute-condicionador como mostrado na Tabela
44 e na Figura 49 Depois devem ser definidos valores intermediaacuterios para cada
paracircmetro sendo que o nuacutemero de valores totais eacute definido em funccedilatildeo do grau
de precisatildeo que se deseja conseguir nos paracircmetros
Finalmente o espaccedilo de busca eacute definido por todas as combinaccedilotildees possiacuteveis
entre as toleracircncias absoluta e relativa do GMRES como apresentado na Figura
49(a) e por todas as combinaccedilotildees possiacuteveis realizadas entre os paracircmetros do
preacute-condicionador como mostrado na Figura 49(b-c)
Para os valores especificados na Tabela 44 existem (m x n) combinaccedilotildees
possiacuteveis entre a toleracircncia absoluta e relativa (ver Figura 49(a)) e (q x p)
combinaccedilotildees possiacuteveis entre os paracircmetros τ e ρ do preacute-condicionador ILUT(τρ)
(ver Figura 49(c)) No caso do preacute-condicionador ILU(ξ) natildeo existem
combinaccedilotildees jaacute que este preacute-condicionador possui somente um uacutenico
paracircmetro Poreacutem existem k valores possiacuteveis para ξ (ver Figura 49(b))
Estabelecer Espaccedilo de Busca
Experimentos numeacutericos
Delimitar paracircmetros do preacute-condicionador
Delimitar toleracircncias do GMRES
155
Tabela 44 ndash Domiacutenios dos paracircmetros usados nos solucionadores
Paracircmetros Maacuteximo Miacutenimo Nuacutemero total de valores
atol atol1 atoln n
rtol rtol1 rtolm m
ξ ξ1 ξk k
τ τ1 τq q
ρ ρ1 ρp P
a) Espaccedilo de busca das toleracircncias do GMRES
b) Espaccedilo de busca dos paracircmetros do preacute-condicionador ILUT(ξ)
c) Espaccedilo de busca dos paracircmetros do preacute-
condicionador ILUT(τρ)
Figura 49 ndash Espaccedilo de busca dos paracircmetros do solucionador
483 Experimentos Numeacutericos
No segundo passo para cada combinaccedilatildeo das toleracircncias absoluta e relativa
(atolrtol) do espaccedilo de busca da Figura 49(a) satildeo simulados tantos Fluxos de
Carga quanto combinaccedilotildees dos paracircmetros do preacute-condicionador existam
registrando-se o nuacutemero de operaccedilotildees de ponto flutuante (MFLOPS) para cada
156
combinaccedilatildeo dos paracircmetros do preacute-condicionador Portanto para cada
combinaccedilatildeo (atolrtol) eacute gerado um graacutefico de eficiecircncia computacional (em
MFLOPS) em funccedilatildeo dos paracircmetros do preacute-condicionador como mostrado na
Figura 410(a) para o preacute-condicionador ILUT(τρ) e na Figura 410(b) para o
preacute-condicionador ILU(ξ)
a) Graacutefico de eficiecircncia para o preacute-condicionador ILUT(τρ)
b) Graacutefico de eficiecircncia para o preacute-condicionador ILU(ξ)
Figura 410 ndash Graacuteficos de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
Para cada graacutefico gerado eacute registrado o nuacutemero de operaccedilotildees de ponto flutuante
miacutenimo (MFLOPSmiacuten) e este valor eacute associado agrave sua correspondente combinaccedilatildeo
(atolrtol) Apoacutes terem sido realizados todos os experimentos e registrados todos
os MFLOPSmiacuten associados a todas as combinaccedilotildees (atolrtol) eacute gerado o graacutefico
de alta eficiecircncia Este graacutefico apresenta em escala de cores todos MFLOPSmiacuten
em funccedilatildeo de suas correspondentes combinaccedilotildees (atolrtol) como mostrado na
Figura 411 sendo que a cor azul estaacute associada com os menores MFLOPSmiacuten a
157
cor vermelha com os maiores MFLOPSmiacuten e em negrito os casos natildeo
convergentes
Observa-se que entre todos os valores registrados para MFLOPSmiacuten existe uma
regiatildeo que conteacutem os casos com os menores MFLOPSmiacuten Este valor chamado
de MFLOPSoacuteti eacute o nuacutemero miacutenimo de operaccedilotildees possiacutevel (global) e estaacute
associado com a regiatildeo quadrada em azul escuro segmentada pelas linhas
brancas Os pontos brancos indicam as posiccedilotildees de todas as combinaccedilotildees que
possuem nuacutemero de operaccedilotildees igual a MFLOPSoacuteti
Figura 411 ndash Graacuteficos de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
484 Delimitaccedilatildeo das Toleracircncias do GMRES
No terceiro passo a partir do graacutefico de alta eficiecircncia apresentado na sua forma
bidimensional na Figura 412 eacute segmentada a regiatildeo dos MFLOPSoacuteti Neste
caso esta regiatildeo eacute o quadrado azul do centro do graacutefico onde cada ponto
branco estaacute associado a uma combinaccedilatildeo (atolrtol) que apresenta o menor
nuacutemero de operaccedilotildees possiacutevel em todo o espaccedilo de busca (MFLOPSoacuteti) Este
graacutefico permite encontrar as faixas de valores (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do meacutetodo GMRES associadas ao melhor
desempenho possiacutevel
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
135
137
total do coacutedigo do solucionador em linguagem FORTRAN e desempenho similar
a outros solucionadores diretos O MA28 permuta tanto linhas como colunas na
matriz de coeficientes A utilizando duas matrizes P e Q Este solucionador usa
principalmente as estrateacutegias de Markowitz e miacutenimo grau visando manter as
propriedades esparsas e o controle da perda da exatidatildeo devido aos erros de
arredondamento (Duff amp Reid 1979) Ambas as estrateacutegias satildeo executadas de
forma dinacircmica durante o processo de fatoraccedilatildeo (PmiddotAmiddotQ = LmiddotU)
No proacuteximo capiacutetulo satildeo usados dois programas computacionais ndash ANAREDE e
ORGANON (Chaves 2008 Jardim amp Stott 2005 CEPEL 2007) para validar os
resultados dos experimentos numeacutericos e realizar comparaccedilotildees principalmente
em termos de robustez e eficiecircncia computacional O ORGANON eacute um sistema
utilizado para avaliaccedilatildeo da seguranccedila de redes eleacutetricas de potecircncia que
emprega computaccedilatildeo de alto desempenho utilizando teacutecnicas numeacutericas
avanccediladas algoritmos especializados arquitetura construtiva flexiacutevel e
processamento distribuiacutedo (Chaves 2008) No ORGANON o problema de fluxo
de carga eacute solucionado de duas formas usando-se os modelos estaacuteticos da rede
eleacutetrica e o algoritmo de Newton-Raphson ou usando-se modelos dinacircmicos da
rede eleacutetrica e o meacutetodo de dinacircmica sinteacutetica (Jardim amp Stott 2005) Em
(Chaves 2008) satildeo feitas diversas e diferentes aplicaccedilotildees com este programa
em estudos de fluxo de potecircncia atraveacutes do meacutetodo convencional de Newton-
Raphson completo ou com o meacutetodo de Fluxo de Potecircncia de Dinacircmica Sinteacutetica
(FPDS) Este uacuteltimo obteacutem a soluccedilatildeo para o problema de fluxo de potecircncia (caso
essa exista) mesmo para casos em que os meacutetodos convencionais falhem e
ainda apenas soluccedilotildees estaacuteveis
Jaacute o programa de anaacutelise de redes (ANAREDE ndash versatildeo 090403) eacute um conjunto
de aplicaccedilotildees computacionais algoritmos e meacutetodos eficientes adequados agrave
realizaccedilatildeo de estudos nas aacutereas de operaccedilatildeo e de planejamento de sistemas
eleacutetricos de potecircncia No ANAREDE a soluccedilatildeo das equaccedilotildees da rede eleacutetrica eacute
realizada pelo algoritmo Newton-Raphson e o reordenamento da matriz
Jacobiana para preservar a esparsidade eacute efetuado utilizando a teacutecnica MD
(CEPEL 2007)
136
137
422 Solucionadores Iterativos Aplicados em Problemas de Sistemas de Energia Eleacutetrica
Na Tabela 42 apresenta-se uma siacutentese do estado da arte dos solucionadores
iterativos quando aplicados ao problema de fluxo de carga A maior parte das
informaccedilotildees associadas com os meacutetodos iterativos e estrateacutegias de preacute-
condicionamento de cada um destes solucionadores jaacute foi apresentada nas
seccedilotildees 241 242 e 34 dos capiacutetulos anteriores Algumas informaccedilotildees
associadas com outras estrateacutegias e teacutecnicas numeacutericas consideradas em
alguns destes solucionadores e que ainda natildeo foram mencionadas satildeo
apresentadas nas uacuteltimas duas colunas da Tabela 42 sendo estas
Em (Flueck e Chiang 1998) combina-se a teacutecnica de reordenamento RCM com
o meacutetodo GMRES e o preacute-condicionador fixo FastD Todas as simulaccedilotildees foram
realizadas usando RCM e um sistema de 8027 barras sendo o solucionador
proposto 50 mais raacutepido que o tradicional solucionador direto de fatoraccedilatildeo LU
Em (Dag e Semlyen 2003) o solucionador proposto usa teacutecnicas de
escalonamento na matriz Brsquo do meacutetodo desacoplado raacutepido obtendo-se bons
resultados em termos de robustez Poreacutem em (de Leon 2003) a proposta de
Dag eacute fortemente criticada pelo uso dos meacutetodos desacoplados junto aos
meacutetodos iterativos
Em (Pessanha et al 2009) avaliam-se os efeitos do reordenamento RCM e da
teacutecnica de maacuteximo produto transversal com escalonamento na qualidade do preacute-
condicionador ILUT(τρ) quase-fixo Os resultados mostram que este tipo de
preprocessamento da matriz Jacobiana melhora significativamente a qualidade
do preacute-condicionador consequentemente a robustez do solucionador
Nas uacuteltimas linhas da Tabela 42 apresentam-se as caracteriacutesticas baacutesicas do
solucionador proposto nesta tese destacando-se o preacute-condicionador ILU(ξ) com
regra de preenchimento baseada no erro Nas proacuteximas seccedilotildees todos os
componentes do solucionador proposto satildeo tratados com maiores detalhes
137
137
Tabela 42 ndash Caracteriacutesticas dos solucionadores iterativos usados em aplicaccedilotildees de fluxo de carga
Autor Ano Meacutetodo
Iterativo
Estrateacutegias Usadas
Preacute-condicionador Regra de Eliminaccedilatildeo Reordenamento Escalonamento
Galiana 1994 GConjugado Cholesky Incomp M=Lrsquo∙LrsquoT(0) Sem novos elementos natildeo-nulos mdash mdash
Mori 1996 Tchebychev Cholesky Incompleto Sem novos elementos natildeo-nulos mdash mdash
Semlyen 1996 GMRES(m) mdash mdash mdash mdash
Borges 1996(97) BiCGStab M = L∙U da primeira Iteraccedilatildeo mdash mdash mdash
Pai 1997 GMRES ILU(k) Niacutevel de novos elementos natildeo-nulos mdash mdash
Flueck 1998 GMRES(m) FastD M = Brsquo mdash RCM mdash
Alves 1999 GConjugado Cholesky completo mdash MD MST mdash
De Leoacuten 2002 BiCGStab GMRES QMR CGS BiCG + ILU() Com paracircmetro limitante
limitante
mdash mdash
Dag 2003 GConjugado Aproximaccedilatildeo da Inversa Polinocircmio de Chebyshev mdash D1∙Brsquo∙D2
Chen 2006 GMRES(m) Aprox da Inversa Adaptativa mdash mdash mdash
Mori 2007 BiCGStab ILU(k) Niacutevel de novos elementos natildeo-nulos mdash mdash
Pessanha 2009 GMRES ILUT( ρ) quase-fixo
Duplo paracircmetro limitante e ρ RCM mdash
Khaitan 2010 GMRES M = L∙U Multifrontal quase-fixo mdash RCM mdash
Solucionador Proposto GMRES ILU(ξ) Baseada no Erro MD mdash
138
137
43 Solucionador Iterativo Para Fluxo de Carga
O solucionador desenvolvido eacute composto basicamente pelo meacutetodo iterativo de
subespaccedilos de Krylov GMRES (vide Capiacutetulo 2) e pela estrateacutegia de preacute-
condicionamento de fatoraccedilatildeo incompleta ILU(ξ) com suporte da teacutecnica de
reordenamento Miacutenimo Grau (MD) A estrateacutegia de reinicializaccedilatildeo GMRES(m)
(apresentada em 26) usada para limitar o tamanho dos subespaccedilos de Krylov a
um valor maacuteximo ―m natildeo faz parte do solucionador uma vez que a estrateacutegia
de preacute-condicionamento forccedila a convergecircncia do GMRES em poucas iteraccedilotildees
lineares (uma ou duas iteraccedilotildees) Portanto jaacute que poucas iteraccedilotildees estatildeo
associadas a subespaccedilos pequenos entatildeo natildeo eacute necessaacuterio estabelecer um
valor maacuteximo ―m
Nesta tese adota-se a teacutecnica de reordenamento MD porque a mesma acarreta
a reduccedilatildeo significativa do nuacutemero de novos elementos natildeo-nulos gerados
reduzindo o esforccedilo computacional realizado para construir e usar o preacute-
condicionador Alem disso este tipo de reordenamento aumenta a taxa de
convergecircncia do meacutetodo iterativo GMRES O solucionador eacute denominado de
GMRES+ILU(ξ)+MD e foi implementado em um programa computacional de
fluxo de carga desenvolvido em linguagem Fortran da forma apresentada no
fluxograma da Figura 41 Seus componentes estatildeo destacados na cor vermelha
numerados por algarismos romanos na mesma ordem em que satildeo aplicados
Observa-se que antes de iniciadas as iteraccedilotildees Newton-Raphson eacute calculada a
sequumlecircncia de reordenamento usando-se a teacutecnica MD matematicamente
representada pela matriz de permutaccedilotildees P Na praacutetica eacute gerado um vetor com
a sequumlecircncia de reordenamento que permitiraacute montar a matriz Jacobiana jaacute
reordenada em cada iteraccedilatildeo k do algoritmo Newton-Raphson Esse vetor
tambeacutem eacute usado para reordenar os resiacuteduos de potecircncia ativa e reativa
armazenados no vetor bk Cada vez que o teste de convergecircncia do algoritmo
Newton-Raphson natildeo for satisfeito uma nova matriz Jacobiana reordenada eacute
montada A partir das informaccedilotildees da matriz Jacobiana reordenada a estrateacutegia
de preacute-condicionamento ILU(ξ) constroacutei um preacute-condicionador Mk que em
seguida seraacute usado para obter explicitamente o novo sistema linear preacute-
condicionado (41) a ser solucionado pelo meacutetodo iterativo GMRES Finalmente
139
137
as incoacutegnitas satildeo atualizadas em (42) O procedimento eacute repetido ateacute que o
teste de convergecircncia do algoritmo Newton-Raphson seja satisfeito
1 T 1k k kM P J P x M P b (41)
T
k 1 k
v vP x
(42)
Figura 41 ndash Fluxograma do Solucionador Iterativo para o problema de fluxo de carga
O programa de fluxo de carga modela as barras de acordo como seu tipo (PQ
PV e de referecircncia) as linhas de transmissatildeo transformadores e
140
137
transformadores defasadores satildeo representados pelos seus circuitos ᴨ
equivalentes Os tapes variaacuteveis sob carga podem ainda ter a atuaccedilatildeo contiacutenua
ou discreta As cargas das barras satildeo normalmente modeladas como potecircncias
ativa e reativa constantes ou podem ser expressas como uma funccedilatildeo da
magnitude da tensatildeo da barra Natildeo satildeo modelados elos de corrente contiacutenua
No algoritmo de fluxo de carga consideram-se o controle de variaccedilatildeo automaacutetica
de tape e os limites de geraccedilatildeo de potecircncia reativa
44 Regra de Preenchimento Baseada no Caacutelculo do Erro Associado ao Elemento Descartado
Uma forma simples de estimar o erro total R originado pelos elementos
descartados devido agraves regras de preenchimento da fatoraccedilatildeo incompleta eacute
usando-se (310) (Mori et al 1996 Saad 2003) Nesta equaccedilatildeo o produto dos
fatores triangulares incompletos eacute igual ao preacute-condicionador M e o produto dos
fatores triangulares completos eacute igual agrave matriz de coeficientes A como mostrado
em (311) Desta forma o erro R permite vislumbrar quatildeo diferente se tornou
o preacute-condicionador em relaccedilatildeo aos fatores triangulares completos apoacutes o
descarte de seus elementos
Um preacute-condicionador sem regra de preenchimento efetua completamente o
caacutelculo dos fatores triangulares Neste caso o preacute-condicionador M se iguala agrave
matriz de coeficientes (M = L∙U = A) o que resulta na convergecircncia do meacutetodo
GMRES em uma uacutenica iteraccedilatildeo com erro R nulo Poreacutem o nuacutemero de
operaccedilotildees de ponto flutuante ainda eacute consideraacutevel Para se obter esta reduccedilatildeo eacute
necessaacuterio usar uma regra de preenchimento que descarte o maior nuacutemero de
elementos nos fatores triangulares e sem que isso provoque o aumento do erro
R consequumlentemente afetando o desempenho do GMRES
R A M (43)
R L U L U (44)
Como exemplo na Figura 36 satildeo apresentados dois graacuteficos que ilustram como
os erros produzidos pelo descarte dos fatores triangulares natildeo-nulos podem se
alastrar ateacute em posiccedilotildees de elementos jaacute preenchidos O experimento foi
141
137
apresentado na seccedilatildeo 332 do capiacutetulo anterior para o sistema brasileiro de
3513 barras usando-se o preacute-condicionador ILU(0) para o caacutelculo dos fatores
incompletos No graacutefico da Figura 36(a) mostra-se que 8797 dos elementos
do preacute-condicionador M (83078) satildeo distintos dos encontrados na matriz
Jacobiana O graacutefico do erro em 42(b) permite se ter uma ideacuteia da dimensatildeo
destas diferenccedilas Dos 38738 elementos com erros entre 0 e 001 (pontos
azuis) 11360 tecircm erro igual a zero (elementos idecircnticos) e 27378 tecircm erros
menores que 001 Os erros nesta faixa de valores normalmente natildeo prejudicam
a convergecircncia do GMRES
As outras faixas de valores associadas aos pontos de cores verde amarelo e
vermelho normalmente prejudicam a convergecircncia do GMRES Esses erros
devem ser evitados e satildeo gerados quando alguns elementos importantes satildeo
descartados durante a fatoraccedilatildeo ILU(0) O maior erro provocado entre os
elementos de M e da Jacobiana eacute de 401931 e o erro total para este preacute-
condicionador eacute de 10632middot105 (norma de Frobenius) Para evitar que os erros
se propaguem enquanto eacute realizada a fatoraccedilatildeo eacute necessaacuterio calcular o erro
associado a cada elemento dos fatores triangulares antes de seu preenchimento
ou descarte Este erro deve tambeacutem considerar os erros propagados nos
caacutelculos futuros onde o elemento seja requerido Se este valor for zero ou
proacuteximo de zero entatildeo o elemento pode ser descartado caso contraacuterio deve ser
preenchido
a) Produto dos fatores incompletos (LrsquoUrsquo) do preacute-condicionador ILU(0)
b) Matriz R para o preacute-condicionador ILU(0)
Figura 42 ndash Erros produzidos pela regra de preenchimento com o preacute-condicionador ILU(0) para a matriz Jacobiana do sistema brasileiro de 3513 barras
142
Sejam L e U os fatores triangulares completos Lrsquo e Ursquo os fatores triangulares
incompletos apoacutes o descarte de um uacutenico elemento Lik o elemento descartado
em Lrsquo e Uki o elemento descartado em Ursquo (Lik = 0 ou Uki = 0) Usando a equaccedilatildeo
(311) (Mori et al 1996 Saad 2003 Benzi et al 1999b Benzi 2002) eacute possiacutevel
calcular o erro associado ao elemento Lik (45) e o erro associado ao elemento
Uki (46) Como mencionado anteriormente esses erros permitem ter uma ideacuteia
de quatildeo diferente se torna o preacute-condicionador M dos fatores triangulares
completos apoacutes os elementos Lik e Uki serem descartados Como os erros estatildeo
associados a um uacutenico elemento descartado as equaccedilotildees (45) e (46) podem
ser reescritas como em (47) e (48) respectivamente
R = L U - L Usdot sdot (45)
R = L U - L Usdot sdot (46)
)ik(LR = (L -L) Usdot (47)
)ik(UR = L (U-U)sdot (48)
Verifica-se que tanto a matriz diferenccedila (L-Lrsquo) como tambeacutem (U-Ursquo) possuem
apenas um elemento natildeo nulo Lik (descartado em Lrsquo) e Uki (descartado em Ursquo)
respectivamente como apresentado em (49) e (410)
ik
0
0 0
0 0 0
0 0 0 0
L L =
0 0 0 0 0
0 0 L 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
( - )
⋮ ⋱
⋯
⋯
⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱
⋯ ⋯ ⋯
(49)
143
ki
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 U 0 0
0 0 0 0 0
(U - U) =
0 0 0 0
0 0 0
0 0
0
⋯ ⋯ ⋯
⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯
⋯
⋯
⋱ ⋮
(410)
Pela substituiccedilatildeo de (49) e (410) nos produtos (L-Lrsquo)middotU como Lmiddot(U-Ursquo) resulta
em (411) e (412)
ik kk ik kk+1 ik ki ik kn
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
L - L) U =
0 0 0 0 0 0
0 0 L U L U L U L U
0 0 0 0 0 0
0 0 0 0 0 0
(
sdot
sdot sdot sdot sdot
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(411)
ki
k+1k ki
ik ki
nk ki
0 0 0 0 0
0 0 0 0 0
0 0 U 0 0
L (U - U) = 0 0 L U 0 0
0 0 L U 0 0
0 0 L U 0 0
sdot sdot
sdot
sdot
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
(412)
Conforme mencionado no capiacutetulo anterior uma das dificuldades para propor
uma regra de preenchimento estaacute em se reduzir o nuacutemero de operaccedilotildees
associadas com sua execuccedilatildeo dentro do algoritmo de preacute-condicionamento
144
Neste trabalho propotildee-se usar a norma-1 em (47) para o caacutelculo do erro
associado a um elemento de L e a norma-infin em (48) para o caacutelculo do erro
associado a um dado elemento de U como apresentado em (413) e (414) As
referidas normas aproveitam a estrutura das matrizes (411) e (412) evitando-se
a realizaccedilatildeo de operaccedilotildees adicionais sendo requeridas ao inveacutes disto apenas
comparaccedilotildees entre elementos Portanto substituindo (411) em (413) e (412)
em (414) e calculando-se as normas satildeo obtidas as equaccedilotildees (415) e (416)
que devem ser usadas na regra de preenchimento
)1ik(LR = (L -L) Usdot (413)
ki(U )R = L (U-U) infinsdot (414)
ik ik km(L )R = L max U m = [kn]sdot (415)
ki ki mk(U )R U max 1 L m=[k+1n]= sdot (416)
Na Figura 43 satildeo destacados em vermelho todos os elementos dos fatores
triangulares que satildeo requeridos para calcular o erro produzido quando o
elemento Lik (no quadrado) eacute descartado Jaacute na Figura 44 satildeo destacados em
azul todos os elementos necessaacuterios para calcular o erro produzido quando o
elemento Uki (encerrado no quadrado) eacute descartado Observa-se que para que
esta regra possa ser implementada tanto no fator triangular U como em L o
algoritmo de fatoraccedilatildeo deve ser capaz de calcular os elementos Ukk Ukk+1
Ukn (em vermelho) antes de decidir se o elemento Lik deve ser preenchido ou
descartado Semelhantemente deve ser capaz de calcular os elementos Lk+1k
Lnk (em azul) antes de decidir se o elemento Uki deve ser preenchido ou
descartado
145
Figura 43 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Lik
Figura 44 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Uki
45 Adequaccedilatildeo da Regra Baseada no Erro
Nesta seccedilatildeo a regra de preenchimento baseada no erro eacute adequada para ser
usada no preacute-condicionador ILUT(τρ) analisado no capiacutetulo anterior O preacute-
condicionador resultante seraacute chamado de preacute-condicionador de duplo
paracircmetro limitante ILUT(ξτ) Neste preacute-condicionador natildeo eacute mais necessaacuterio
usar o paracircmetro ρ
Conforme visto no Capiacutetulo 3 o algoritmo de fatoraccedilatildeo usado neste preacute-
condicionador eacute o IKJ e deriva da eliminaccedilatildeo de Gauss (Saad 2003) Este tipo
de algoritmo permite calcular os elementos Ukk Ukk+1 Ukn antes de decidir se
o elemento Lik deve ser preenchido ou descartado Poreacutem o algoritmo IKJ natildeo
permite calcular os elementos Lk+1k Lnk antes de decidir se o elemento Uki
deve ser preenchido ou descartado porque no mesmo os elementos de L e U
146
satildeo calculados por linhas uma de cada vez Portanto a regra baseada no erro
pode ser aplicada apenas nos elementos do fator L enquanto que uma variante
da regra convencional usada no ILUT(τρ) eacute usada para os elementos de U
O caacutelculo da norma-2 usada na regra de preenchimento convencional dada pela
raiz quadrada da soma dos quadrados dos elementos da linha pode exigir
consideraacutevel esforccedilo computacional dependendo da dimensatildeo da matriz de
coeficientes Portanto ao inveacutes de se usar esta norma para descartar os
elementos em U recomenda-se realizar a meacutedia aritmeacutetica dos elementos da i-
eacutesima linha da matriz de coeficientes original Este procedimento reduz o nuacutemero
de operaccedilotildees de ponto flutuante sem comprometer a qualidade do preacute-
condicionador No entanto a eficiecircncia de ambas as heuriacutesticas eacute inferior agrave da
regra baseada no erro para preenchimento dos elementos proposta no presente
trabalho O resultado eacute um preacute-condicionador que aplica dois criteacuterios para
definir sua regra de preenchimento da seguinte forma
De acordo com a relaccedilatildeo dada por (417) um elemento Lik eacute descartado se o
erro resultante for menor que a toleracircncia ξ usada para todas as linhas de L
Caso contraacuterio calcula-se Lik usando-se o elemento aik da matriz resultante do
processo de eliminaccedilatildeo de Gauss ateacute a correspondente etapa Jaacute para um
elemento Uik este eacute descartado se for menor que uma certa toleracircncia relativa
τi obtida multiplicando-se a toleracircncia absoluta τ pela meacutedia aritmeacutetica dos
elementos da i-eacutesima linha da matriz de coeficientes original O caacutelculo de w eacute
efetuado de acordo com o algoritmo de fatoraccedilatildeo IKJ apresentado no capiacutetulo
anterior
ik
ikik
(L )
ik (L )k=(1i-1)
kk
0 R= aL
RU
lt ξ ge ξ
(417)
ik
k i
k k ik=(i+1n)
0 w =U
w w
lt ge
ττ
(418)
A adaptaccedilatildeo da regra baseada no erro no preacute-condicionador ILUT(τρ) falha
devido ao fato do algoritmo de fatoraccedilatildeo IKJ natildeo permitir a aplicaccedilatildeo da regra
147
em ambos os fatores triangulares L e U dificultando a exploraccedilatildeo das vantagens
do uso desta regra A seguir mostra-se uma proposta para superar estes
problemas utilizando-se outro algoritmo de fatoraccedilatildeo que permite aplicar a regra
em ambos os fatores triangulares
46 Preacute-condicionador ILU( ξ) Baseado no Caacutelculo do Erro
Nesta seccedilatildeo propotildee-se uma eficiente e robusta estrateacutegia de preacute-
condicionamento da fatoraccedilatildeo incompleta ILU(ξ) derivada de uma versatildeo do
algoritmo de eliminaccedilatildeo de Gauss conhecido como Doolittle A maior vantagem
deste algoritmo eacute que permite usar de forma efetiva a regra de preenchimento
baseada no erro em ambos os fatores triangulares L e U
Os fatores L e U satildeo apresentados em (419) e (420) Os elementos da diagonal
de L satildeo iguais a um e a primeira linha de U eacute igual agrave primeira linha da matriz de
coeficientes A As equaccedilotildees usadas pelo algoritmo de Doolittle para calcular os
elementos dos fatores triangulares satildeo apresentadas em (422) e podem ser
obtidas ao se igualar cada elemento do produto dos fatores triangulares LmiddotU de
(419) e (420) aos elementos da matriz de coeficientes A apresentada em (421)
Estas equaccedilotildees podem ser implementadas computacionalmente de diferentes
formas todas baseadas na eliminaccedilatildeo de Gauss Teoricamente os diferentes
tipos de eliminaccedilatildeo de Gauss realizam o mesmo nuacutemero de operaccedilotildees de ponto
flutuante No entanto no contexto da fatoraccedilatildeo incompleta estas variantes
resultam em importantes diferenccedilas praacuteticas quando o interesse eacute utilizar a regra
de preenchimento baseada no erro
k-11
k1 kk 1
i1 ik 1 ik
n1 nk 1 nk ni
1 0 0 0 0
L 1 0 0 0
L L 1 0 0L
L L L 1 0
L L L L 1
minus
minus
minus
=
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(419)
148
11 1k 1 1k 1i 1n
k-1k-1 k-1k k-1i k-1n
kk ki kn
ii in
nn
U U U U U
0 U U U U
0 0 U U UU
0 0 0 U U
0 0 0 0 U
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(420)
11 1k 1 1k 1i 1n
k-11 k-1k-1 k-1k k-1i k-1n
k1 kk-1 kk ki kn
i1 ik-1 ik ii in
n1 nk-1 nk ni nn
a a a a a
a a a a a
a a a a aA
a a a a a
a a a a a
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(421)
k-1
ki ki kj jij=1
k-1
ik ij jkj=1
ikkk
U =a - [L U ] i=kn
a - [L U ]
L = i=k+1nU
sum
sum (422)
As equaccedilotildees de Doolittle podem gerar algoritmos de eliminaccedilatildeo de Gauss que
calculam os elementos dos fatores triangulares por linhas de forma similar agrave
fatoraccedilatildeo IKJ ou por colunas (Bodewig 1956 Wilkinson 1965 Dahlquist amp
Bjoumlrk 1974 Hoffman 2001) Em ambos algoritmos natildeo seria possiacutevel usar a
regra de preenchimento baseada no erro A partir de (422) propotildee-se usar o
algoritmo de eliminaccedilatildeo de Gauss apresentado na Figura 45 que permite
calcular os elementos dos fatores triangulares simultaneamente por linhas em U
e por colunas em L como mostrado na Figura 46
No passo k da eliminaccedilatildeo de Gauss os elementos da k-eacutesima linha de U e a k-
eacutesima coluna de L (identificados por linhas tracejadas) satildeo calculados utilizando
elementos jaacute computados anteriormente nas linhas e colunas de U e L Por
exemplo para se calcular o elemento Uki satildeo usados os elementos destacados
em azul enquanto que para calcular o elemento Lik satildeo usados os elementos
149
destacados em vermelho Observa-se que este algoritmo permite calcular
elementos de L em linhas posteriores agrave linha k Esta caracteriacutestica possibilita o
uso em U da regra de preenchimento baseada no erro
1 Para i = 1n Faccedila
2 min = Ji in
3 Para k = in Faccedila
4 Para j = 1i-1 Faccedila
5 mk = mk - LijmiddotUjk
6 Fim ndash Faccedila
7 Fim ndash Faccedila
8 Registrar Umax = maxmin
9 ni+1n = J i+1ni
10 Para k = i+1n Faccedila
11 Para j = 1i-1 Faccedila
12 nk = nk ndash LkjmiddotUji
13 Fim ndash Faccedila
14 Fim ndash Faccedila
15 n = nUii
16 Registrar Lmax = maxni+1n
17 Aplicar a regra de preenchimento baseada no erro em m e n
18 Ui in = m in
19 L i+1ni = n i+1n
20 Fim ndash Faccedila
Figura 45 ndash Algoritmo do preacute-condicionador ILU(ξ)
Figura 46 ndash Elementos necessaacuterios para calcular os elementos Lik e Uki durante a fatoraccedilatildeo triangular
150
No algoritmo da Figura 45 observa-se que no passo k os elementos da linha de
U satildeo armazenados no vetor m enquanto que os elementos da coluna de L satildeo
armazenados no vetor n (passos 5 e 12 respectivamente) Uma vez calculados
ambos os vetores procura-se o maior elemento de m sendo armazenado em
Umax e o maior elemento de n armazenado em Lmax (passos 8 e 16
respectivamente) Ambos os valores maacuteximos (em valores absolutos) satildeo
usados pela regra de preenchimento no passo 17 para descartar em m e n os
elementos associados com os menores erros e preencher a linha de U e a
coluna de L da seguinte forma
De acordo com as relaccedilotildees dadas por (423) e (424) tanto um elemento Lki
como tambeacutem um elemento Uik satildeo descartados se seus erros associados
foram menores que uma dada toleracircncia ξ usada para todas as colunas de L e
linhas de U Caso contraacuterio Lki eacute preenchido usando-se o valor armazenado
em nk e Uik eacute preenchido usando-se o valor armazenado em mk
ik
ikik
(U )
(U )kk=(in)
0 R =U
m R
lt ξ ge ξ
(423)
ik
ikki
(L )
(L )ki=(1+1n)
0 R=L
n R
lt ξ ge ξ
(424)
Como observado na Figura 46 o algoritmo da Figura 45 permite encontrar os
elementos Ukk Ukk+1 Ukn necessaacuterios para se calcular o erro associado ao
elemento Lki e os elementos Lk+1k Lnk que por sua vez satildeo necessaacuterios para
se calcular o erro associado ao elemento Uik Nota-se que os elementos
necessaacuterios para calcular o erro (passo k) satildeo calculados neste mesmo passo
portanto natildeo eacute necessaacuterio realizar grandes buscas de elementos nas matrizes L
e U Igualmente tambeacutem natildeo eacute necessaacuterio armazenar valores Umax Lmax ou
erros do passo k porque natildeo seratildeo mais necessaacuterios nos proacuteximos passos
Observe-se que natildeo eacute necessaacuterio multiplicar o paracircmetro ξ por alguma norma ou
meacutedia aritmeacutetica dos elementos da matriz de coeficientes como realizado no
preacute-condicionador ILUT(τρ) porque o erro independe dos valores dos elementos
151
da matriz de coeficientes Este preacute-condicionador usa apenas um uacutenico
paracircmetro ξ Esta caracteriacutestica facilita o ajuste dos paracircmetros do solucionador
como seraacute visto nas proacuteximas seccedilotildees e no proacuteximo capiacutetulo
47 Meacutetodo Convencional Para Ajuste dos Paracircmetros dos Solucionadores
O ajuste dos paracircmetros de um solucionador iterativo eacute considerado fundamental
para garantir sua robustez e eficiecircncia computacional principalmente em
anaacutelises mais complexas como aquelas que solucionam vaacuterios fluxos de carga
com diferentes pontos de operaccedilatildeo Nesses casos a escolha de valores
apropriados para os paracircmetros se torna ainda mais relevante
A ideacuteia fundamental eacute escolher os valores dos paracircmetros que permitam
preencher o menor nuacutemero de elementos sem prejudicar a qualidade do preacute-
condicionador isto eacute sem tornaacute-lo muito diferente de A Poreacutem a escolha de
valores apropriados para os paracircmetros eacute uma tarefa difiacutecil jaacute que existe uma
interdependecircncia com as toleracircncias relativa e absoluta do GMRES e com o tipo
de problema que estaacute sendo solucionado
Pouco tem sido pesquisado em relaccedilatildeo a este tema apenas em (de Leon amp
Semlyen 2002) apresenta-se uma foacutermula que permite calcular para cada
sistema eleacutetrico o valor do paracircmetro limitante τ no preacute-condicionador ILU(τ)
dado por (322) onde τ eacute igual agrave metade do nuacutemero de equaccedilotildees totais Neq do
sistema linear Na praacutetica estaacute foacutermula natildeo garante robustez nem o melhor
desempenho do solucionador
eq
12 N
τ =sdot
(425)
No entanto o procedimento convencional define primeiro valores arbitraacuterios para
as duas toleracircncias absoluta e relativa do GMRES Nas simulaccedilotildees realizadas
nos capiacutetulos anteriores se usou toleracircncias iguais (10-5) e menores que a
toleracircncia usada no teste de convergecircncia do algoritmo Newton-Raphson pois
toleracircncias maiores costumam impedir a convergecircncia do Newton-Raphson
152
Uma vez definidas as toleracircncias a escolha dos paracircmetros do preacute-
condicionador eacute realizada com base em tentativa e erro
Este meacutetodo natildeo considera a possibilidade de encontrar melhores desempenhos
para outras toleracircncias do GMRES que natildeo necessariamente devem ser
consideradas iguais Durante o procedimento de tentativa e erro o meacutetodo pode
encontrar um miacutenimo nuacutemero de operaccedilotildees local (MFLOPSL) associado com τL
como ilustrado na Figura 47 que natildeo necessariamente eacute o menor possiacutevel
(MFLOPSG) Observa-se que para obter o miacutenimo nuacutemero de operaccedilotildees global
(MFLOPSG) o procedimento de tentativa e erro deveria comeccedilar com um valor
de τ proacuteximo de τG
Figura 47 ndash Procedimento de tentativa e erro para busca de valores de um paracircmetro do preacute-condicionador
Quando o preacute-condicionador possui um segundo paracircmetro o procedimento de
tentativa e erro eacute repetido para este segundo paracircmetro fixando-se o primeiro
paracircmetro
48 Meacutetodo Proposto Para Ajuste dos Paracircmetros dos Solucio nadores
O meacutetodo proposto consiste em realizar sucessivas simulaccedilotildees de fluxo de
carga variando simultaneamente todos os paracircmetros do solucionador e
registrando o nuacutemero de operaccedilotildees de ponto flutuante para cada caso gerado O
objetivo eacute encontrar regiotildees de valores para os paracircmetros onde o solucionador
153
apresente alto desempenho permitindo estabelecer e recomendar faixas para os
valores dos paracircmetros onde o solucionador garante convergecircncia com a maior
eficiecircncia possiacutevel O meacutetodo tambeacutem permite identificar as faixas de valores
onde o solucionador natildeo converge
O meacutetodo eacute ilustrado para ajustar os paracircmetros de duas configuraccedilotildees de
solucionador iterativo sendo estas o solucionador proposto neste trabalho
identificado como GMRES+ILU(ξ)+MD e o solucionador GMRES+ILUT(τρ)+MD
apresentado no capiacutetulo 2 Na Tabela 43 especificam-se os paracircmetros
associados a cada solucionador
Tabela 43 ndash Paracircmetros usados nos solucionadores
Solucionadores Meacutetodo Iterativo Preacute-condicionador
GMRES+ILU(ξ)+MD atol rtol
ξ
GMRES+ILUT(τρ)+MD τ ρ
481 Passos Fundamentais
Esta seccedilatildeo apresenta de maneira sucinta os passos envolvidos no meacutetodo para
ajuste dos paracircmetros dos solucionadores onde uma descriccedilatildeo geral eacute
mostrada na Figura 48 O primeiro passo refere-se agrave definiccedilatildeo do espaccedilo de
busca onde satildeo procurados os valores para os paracircmetros que garantem alto
desempenho do solucionador O segundo refere-se aos experimentos numeacutericos
realizados para avaliar o desempenho do solucionador considerando-se todas as
combinaccedilotildees possiacuteveis dos valores de seus paracircmetros definidos no espaccedilo de
busca O passo seguinte tem como objetivo calcular as faixas de valores
recomendaacuteveis para as toleracircncias absoluta e relativa do GMRES Finalmente o
quarto passo calcula as faixas de valores recomendaacuteveis para os paracircmetros do
preacute-condicionador
154
Figura 48 ndash Passos fundamentais para delimitaccedilatildeo dos paracircmetros do solucionador
Nas proacuteximas seccedilotildees os passos mais relevantes no contexto deste trabalho satildeo
discutidos mais detalhadamente
482 Estabelecimento do Espaccedilo de Busca
Para definir o espaccedilo de busca primeiramente deve-se estabelecer o domiacutenio de
cada paracircmetro isto eacute um valor miacutenimo e maacuteximo para cada toleracircncia do
GMRES e para cada paracircmetro do preacute-condicionador como mostrado na Tabela
44 e na Figura 49 Depois devem ser definidos valores intermediaacuterios para cada
paracircmetro sendo que o nuacutemero de valores totais eacute definido em funccedilatildeo do grau
de precisatildeo que se deseja conseguir nos paracircmetros
Finalmente o espaccedilo de busca eacute definido por todas as combinaccedilotildees possiacuteveis
entre as toleracircncias absoluta e relativa do GMRES como apresentado na Figura
49(a) e por todas as combinaccedilotildees possiacuteveis realizadas entre os paracircmetros do
preacute-condicionador como mostrado na Figura 49(b-c)
Para os valores especificados na Tabela 44 existem (m x n) combinaccedilotildees
possiacuteveis entre a toleracircncia absoluta e relativa (ver Figura 49(a)) e (q x p)
combinaccedilotildees possiacuteveis entre os paracircmetros τ e ρ do preacute-condicionador ILUT(τρ)
(ver Figura 49(c)) No caso do preacute-condicionador ILU(ξ) natildeo existem
combinaccedilotildees jaacute que este preacute-condicionador possui somente um uacutenico
paracircmetro Poreacutem existem k valores possiacuteveis para ξ (ver Figura 49(b))
Estabelecer Espaccedilo de Busca
Experimentos numeacutericos
Delimitar paracircmetros do preacute-condicionador
Delimitar toleracircncias do GMRES
155
Tabela 44 ndash Domiacutenios dos paracircmetros usados nos solucionadores
Paracircmetros Maacuteximo Miacutenimo Nuacutemero total de valores
atol atol1 atoln n
rtol rtol1 rtolm m
ξ ξ1 ξk k
τ τ1 τq q
ρ ρ1 ρp P
a) Espaccedilo de busca das toleracircncias do GMRES
b) Espaccedilo de busca dos paracircmetros do preacute-condicionador ILUT(ξ)
c) Espaccedilo de busca dos paracircmetros do preacute-
condicionador ILUT(τρ)
Figura 49 ndash Espaccedilo de busca dos paracircmetros do solucionador
483 Experimentos Numeacutericos
No segundo passo para cada combinaccedilatildeo das toleracircncias absoluta e relativa
(atolrtol) do espaccedilo de busca da Figura 49(a) satildeo simulados tantos Fluxos de
Carga quanto combinaccedilotildees dos paracircmetros do preacute-condicionador existam
registrando-se o nuacutemero de operaccedilotildees de ponto flutuante (MFLOPS) para cada
156
combinaccedilatildeo dos paracircmetros do preacute-condicionador Portanto para cada
combinaccedilatildeo (atolrtol) eacute gerado um graacutefico de eficiecircncia computacional (em
MFLOPS) em funccedilatildeo dos paracircmetros do preacute-condicionador como mostrado na
Figura 410(a) para o preacute-condicionador ILUT(τρ) e na Figura 410(b) para o
preacute-condicionador ILU(ξ)
a) Graacutefico de eficiecircncia para o preacute-condicionador ILUT(τρ)
b) Graacutefico de eficiecircncia para o preacute-condicionador ILU(ξ)
Figura 410 ndash Graacuteficos de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
Para cada graacutefico gerado eacute registrado o nuacutemero de operaccedilotildees de ponto flutuante
miacutenimo (MFLOPSmiacuten) e este valor eacute associado agrave sua correspondente combinaccedilatildeo
(atolrtol) Apoacutes terem sido realizados todos os experimentos e registrados todos
os MFLOPSmiacuten associados a todas as combinaccedilotildees (atolrtol) eacute gerado o graacutefico
de alta eficiecircncia Este graacutefico apresenta em escala de cores todos MFLOPSmiacuten
em funccedilatildeo de suas correspondentes combinaccedilotildees (atolrtol) como mostrado na
Figura 411 sendo que a cor azul estaacute associada com os menores MFLOPSmiacuten a
157
cor vermelha com os maiores MFLOPSmiacuten e em negrito os casos natildeo
convergentes
Observa-se que entre todos os valores registrados para MFLOPSmiacuten existe uma
regiatildeo que conteacutem os casos com os menores MFLOPSmiacuten Este valor chamado
de MFLOPSoacuteti eacute o nuacutemero miacutenimo de operaccedilotildees possiacutevel (global) e estaacute
associado com a regiatildeo quadrada em azul escuro segmentada pelas linhas
brancas Os pontos brancos indicam as posiccedilotildees de todas as combinaccedilotildees que
possuem nuacutemero de operaccedilotildees igual a MFLOPSoacuteti
Figura 411 ndash Graacuteficos de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
484 Delimitaccedilatildeo das Toleracircncias do GMRES
No terceiro passo a partir do graacutefico de alta eficiecircncia apresentado na sua forma
bidimensional na Figura 412 eacute segmentada a regiatildeo dos MFLOPSoacuteti Neste
caso esta regiatildeo eacute o quadrado azul do centro do graacutefico onde cada ponto
branco estaacute associado a uma combinaccedilatildeo (atolrtol) que apresenta o menor
nuacutemero de operaccedilotildees possiacutevel em todo o espaccedilo de busca (MFLOPSoacuteti) Este
graacutefico permite encontrar as faixas de valores (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do meacutetodo GMRES associadas ao melhor
desempenho possiacutevel
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
136
137
422 Solucionadores Iterativos Aplicados em Problemas de Sistemas de Energia Eleacutetrica
Na Tabela 42 apresenta-se uma siacutentese do estado da arte dos solucionadores
iterativos quando aplicados ao problema de fluxo de carga A maior parte das
informaccedilotildees associadas com os meacutetodos iterativos e estrateacutegias de preacute-
condicionamento de cada um destes solucionadores jaacute foi apresentada nas
seccedilotildees 241 242 e 34 dos capiacutetulos anteriores Algumas informaccedilotildees
associadas com outras estrateacutegias e teacutecnicas numeacutericas consideradas em
alguns destes solucionadores e que ainda natildeo foram mencionadas satildeo
apresentadas nas uacuteltimas duas colunas da Tabela 42 sendo estas
Em (Flueck e Chiang 1998) combina-se a teacutecnica de reordenamento RCM com
o meacutetodo GMRES e o preacute-condicionador fixo FastD Todas as simulaccedilotildees foram
realizadas usando RCM e um sistema de 8027 barras sendo o solucionador
proposto 50 mais raacutepido que o tradicional solucionador direto de fatoraccedilatildeo LU
Em (Dag e Semlyen 2003) o solucionador proposto usa teacutecnicas de
escalonamento na matriz Brsquo do meacutetodo desacoplado raacutepido obtendo-se bons
resultados em termos de robustez Poreacutem em (de Leon 2003) a proposta de
Dag eacute fortemente criticada pelo uso dos meacutetodos desacoplados junto aos
meacutetodos iterativos
Em (Pessanha et al 2009) avaliam-se os efeitos do reordenamento RCM e da
teacutecnica de maacuteximo produto transversal com escalonamento na qualidade do preacute-
condicionador ILUT(τρ) quase-fixo Os resultados mostram que este tipo de
preprocessamento da matriz Jacobiana melhora significativamente a qualidade
do preacute-condicionador consequentemente a robustez do solucionador
Nas uacuteltimas linhas da Tabela 42 apresentam-se as caracteriacutesticas baacutesicas do
solucionador proposto nesta tese destacando-se o preacute-condicionador ILU(ξ) com
regra de preenchimento baseada no erro Nas proacuteximas seccedilotildees todos os
componentes do solucionador proposto satildeo tratados com maiores detalhes
137
137
Tabela 42 ndash Caracteriacutesticas dos solucionadores iterativos usados em aplicaccedilotildees de fluxo de carga
Autor Ano Meacutetodo
Iterativo
Estrateacutegias Usadas
Preacute-condicionador Regra de Eliminaccedilatildeo Reordenamento Escalonamento
Galiana 1994 GConjugado Cholesky Incomp M=Lrsquo∙LrsquoT(0) Sem novos elementos natildeo-nulos mdash mdash
Mori 1996 Tchebychev Cholesky Incompleto Sem novos elementos natildeo-nulos mdash mdash
Semlyen 1996 GMRES(m) mdash mdash mdash mdash
Borges 1996(97) BiCGStab M = L∙U da primeira Iteraccedilatildeo mdash mdash mdash
Pai 1997 GMRES ILU(k) Niacutevel de novos elementos natildeo-nulos mdash mdash
Flueck 1998 GMRES(m) FastD M = Brsquo mdash RCM mdash
Alves 1999 GConjugado Cholesky completo mdash MD MST mdash
De Leoacuten 2002 BiCGStab GMRES QMR CGS BiCG + ILU() Com paracircmetro limitante
limitante
mdash mdash
Dag 2003 GConjugado Aproximaccedilatildeo da Inversa Polinocircmio de Chebyshev mdash D1∙Brsquo∙D2
Chen 2006 GMRES(m) Aprox da Inversa Adaptativa mdash mdash mdash
Mori 2007 BiCGStab ILU(k) Niacutevel de novos elementos natildeo-nulos mdash mdash
Pessanha 2009 GMRES ILUT( ρ) quase-fixo
Duplo paracircmetro limitante e ρ RCM mdash
Khaitan 2010 GMRES M = L∙U Multifrontal quase-fixo mdash RCM mdash
Solucionador Proposto GMRES ILU(ξ) Baseada no Erro MD mdash
138
137
43 Solucionador Iterativo Para Fluxo de Carga
O solucionador desenvolvido eacute composto basicamente pelo meacutetodo iterativo de
subespaccedilos de Krylov GMRES (vide Capiacutetulo 2) e pela estrateacutegia de preacute-
condicionamento de fatoraccedilatildeo incompleta ILU(ξ) com suporte da teacutecnica de
reordenamento Miacutenimo Grau (MD) A estrateacutegia de reinicializaccedilatildeo GMRES(m)
(apresentada em 26) usada para limitar o tamanho dos subespaccedilos de Krylov a
um valor maacuteximo ―m natildeo faz parte do solucionador uma vez que a estrateacutegia
de preacute-condicionamento forccedila a convergecircncia do GMRES em poucas iteraccedilotildees
lineares (uma ou duas iteraccedilotildees) Portanto jaacute que poucas iteraccedilotildees estatildeo
associadas a subespaccedilos pequenos entatildeo natildeo eacute necessaacuterio estabelecer um
valor maacuteximo ―m
Nesta tese adota-se a teacutecnica de reordenamento MD porque a mesma acarreta
a reduccedilatildeo significativa do nuacutemero de novos elementos natildeo-nulos gerados
reduzindo o esforccedilo computacional realizado para construir e usar o preacute-
condicionador Alem disso este tipo de reordenamento aumenta a taxa de
convergecircncia do meacutetodo iterativo GMRES O solucionador eacute denominado de
GMRES+ILU(ξ)+MD e foi implementado em um programa computacional de
fluxo de carga desenvolvido em linguagem Fortran da forma apresentada no
fluxograma da Figura 41 Seus componentes estatildeo destacados na cor vermelha
numerados por algarismos romanos na mesma ordem em que satildeo aplicados
Observa-se que antes de iniciadas as iteraccedilotildees Newton-Raphson eacute calculada a
sequumlecircncia de reordenamento usando-se a teacutecnica MD matematicamente
representada pela matriz de permutaccedilotildees P Na praacutetica eacute gerado um vetor com
a sequumlecircncia de reordenamento que permitiraacute montar a matriz Jacobiana jaacute
reordenada em cada iteraccedilatildeo k do algoritmo Newton-Raphson Esse vetor
tambeacutem eacute usado para reordenar os resiacuteduos de potecircncia ativa e reativa
armazenados no vetor bk Cada vez que o teste de convergecircncia do algoritmo
Newton-Raphson natildeo for satisfeito uma nova matriz Jacobiana reordenada eacute
montada A partir das informaccedilotildees da matriz Jacobiana reordenada a estrateacutegia
de preacute-condicionamento ILU(ξ) constroacutei um preacute-condicionador Mk que em
seguida seraacute usado para obter explicitamente o novo sistema linear preacute-
condicionado (41) a ser solucionado pelo meacutetodo iterativo GMRES Finalmente
139
137
as incoacutegnitas satildeo atualizadas em (42) O procedimento eacute repetido ateacute que o
teste de convergecircncia do algoritmo Newton-Raphson seja satisfeito
1 T 1k k kM P J P x M P b (41)
T
k 1 k
v vP x
(42)
Figura 41 ndash Fluxograma do Solucionador Iterativo para o problema de fluxo de carga
O programa de fluxo de carga modela as barras de acordo como seu tipo (PQ
PV e de referecircncia) as linhas de transmissatildeo transformadores e
140
137
transformadores defasadores satildeo representados pelos seus circuitos ᴨ
equivalentes Os tapes variaacuteveis sob carga podem ainda ter a atuaccedilatildeo contiacutenua
ou discreta As cargas das barras satildeo normalmente modeladas como potecircncias
ativa e reativa constantes ou podem ser expressas como uma funccedilatildeo da
magnitude da tensatildeo da barra Natildeo satildeo modelados elos de corrente contiacutenua
No algoritmo de fluxo de carga consideram-se o controle de variaccedilatildeo automaacutetica
de tape e os limites de geraccedilatildeo de potecircncia reativa
44 Regra de Preenchimento Baseada no Caacutelculo do Erro Associado ao Elemento Descartado
Uma forma simples de estimar o erro total R originado pelos elementos
descartados devido agraves regras de preenchimento da fatoraccedilatildeo incompleta eacute
usando-se (310) (Mori et al 1996 Saad 2003) Nesta equaccedilatildeo o produto dos
fatores triangulares incompletos eacute igual ao preacute-condicionador M e o produto dos
fatores triangulares completos eacute igual agrave matriz de coeficientes A como mostrado
em (311) Desta forma o erro R permite vislumbrar quatildeo diferente se tornou
o preacute-condicionador em relaccedilatildeo aos fatores triangulares completos apoacutes o
descarte de seus elementos
Um preacute-condicionador sem regra de preenchimento efetua completamente o
caacutelculo dos fatores triangulares Neste caso o preacute-condicionador M se iguala agrave
matriz de coeficientes (M = L∙U = A) o que resulta na convergecircncia do meacutetodo
GMRES em uma uacutenica iteraccedilatildeo com erro R nulo Poreacutem o nuacutemero de
operaccedilotildees de ponto flutuante ainda eacute consideraacutevel Para se obter esta reduccedilatildeo eacute
necessaacuterio usar uma regra de preenchimento que descarte o maior nuacutemero de
elementos nos fatores triangulares e sem que isso provoque o aumento do erro
R consequumlentemente afetando o desempenho do GMRES
R A M (43)
R L U L U (44)
Como exemplo na Figura 36 satildeo apresentados dois graacuteficos que ilustram como
os erros produzidos pelo descarte dos fatores triangulares natildeo-nulos podem se
alastrar ateacute em posiccedilotildees de elementos jaacute preenchidos O experimento foi
141
137
apresentado na seccedilatildeo 332 do capiacutetulo anterior para o sistema brasileiro de
3513 barras usando-se o preacute-condicionador ILU(0) para o caacutelculo dos fatores
incompletos No graacutefico da Figura 36(a) mostra-se que 8797 dos elementos
do preacute-condicionador M (83078) satildeo distintos dos encontrados na matriz
Jacobiana O graacutefico do erro em 42(b) permite se ter uma ideacuteia da dimensatildeo
destas diferenccedilas Dos 38738 elementos com erros entre 0 e 001 (pontos
azuis) 11360 tecircm erro igual a zero (elementos idecircnticos) e 27378 tecircm erros
menores que 001 Os erros nesta faixa de valores normalmente natildeo prejudicam
a convergecircncia do GMRES
As outras faixas de valores associadas aos pontos de cores verde amarelo e
vermelho normalmente prejudicam a convergecircncia do GMRES Esses erros
devem ser evitados e satildeo gerados quando alguns elementos importantes satildeo
descartados durante a fatoraccedilatildeo ILU(0) O maior erro provocado entre os
elementos de M e da Jacobiana eacute de 401931 e o erro total para este preacute-
condicionador eacute de 10632middot105 (norma de Frobenius) Para evitar que os erros
se propaguem enquanto eacute realizada a fatoraccedilatildeo eacute necessaacuterio calcular o erro
associado a cada elemento dos fatores triangulares antes de seu preenchimento
ou descarte Este erro deve tambeacutem considerar os erros propagados nos
caacutelculos futuros onde o elemento seja requerido Se este valor for zero ou
proacuteximo de zero entatildeo o elemento pode ser descartado caso contraacuterio deve ser
preenchido
a) Produto dos fatores incompletos (LrsquoUrsquo) do preacute-condicionador ILU(0)
b) Matriz R para o preacute-condicionador ILU(0)
Figura 42 ndash Erros produzidos pela regra de preenchimento com o preacute-condicionador ILU(0) para a matriz Jacobiana do sistema brasileiro de 3513 barras
142
Sejam L e U os fatores triangulares completos Lrsquo e Ursquo os fatores triangulares
incompletos apoacutes o descarte de um uacutenico elemento Lik o elemento descartado
em Lrsquo e Uki o elemento descartado em Ursquo (Lik = 0 ou Uki = 0) Usando a equaccedilatildeo
(311) (Mori et al 1996 Saad 2003 Benzi et al 1999b Benzi 2002) eacute possiacutevel
calcular o erro associado ao elemento Lik (45) e o erro associado ao elemento
Uki (46) Como mencionado anteriormente esses erros permitem ter uma ideacuteia
de quatildeo diferente se torna o preacute-condicionador M dos fatores triangulares
completos apoacutes os elementos Lik e Uki serem descartados Como os erros estatildeo
associados a um uacutenico elemento descartado as equaccedilotildees (45) e (46) podem
ser reescritas como em (47) e (48) respectivamente
R = L U - L Usdot sdot (45)
R = L U - L Usdot sdot (46)
)ik(LR = (L -L) Usdot (47)
)ik(UR = L (U-U)sdot (48)
Verifica-se que tanto a matriz diferenccedila (L-Lrsquo) como tambeacutem (U-Ursquo) possuem
apenas um elemento natildeo nulo Lik (descartado em Lrsquo) e Uki (descartado em Ursquo)
respectivamente como apresentado em (49) e (410)
ik
0
0 0
0 0 0
0 0 0 0
L L =
0 0 0 0 0
0 0 L 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
( - )
⋮ ⋱
⋯
⋯
⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱
⋯ ⋯ ⋯
(49)
143
ki
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 U 0 0
0 0 0 0 0
(U - U) =
0 0 0 0
0 0 0
0 0
0
⋯ ⋯ ⋯
⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯
⋯
⋯
⋱ ⋮
(410)
Pela substituiccedilatildeo de (49) e (410) nos produtos (L-Lrsquo)middotU como Lmiddot(U-Ursquo) resulta
em (411) e (412)
ik kk ik kk+1 ik ki ik kn
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
L - L) U =
0 0 0 0 0 0
0 0 L U L U L U L U
0 0 0 0 0 0
0 0 0 0 0 0
(
sdot
sdot sdot sdot sdot
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(411)
ki
k+1k ki
ik ki
nk ki
0 0 0 0 0
0 0 0 0 0
0 0 U 0 0
L (U - U) = 0 0 L U 0 0
0 0 L U 0 0
0 0 L U 0 0
sdot sdot
sdot
sdot
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
(412)
Conforme mencionado no capiacutetulo anterior uma das dificuldades para propor
uma regra de preenchimento estaacute em se reduzir o nuacutemero de operaccedilotildees
associadas com sua execuccedilatildeo dentro do algoritmo de preacute-condicionamento
144
Neste trabalho propotildee-se usar a norma-1 em (47) para o caacutelculo do erro
associado a um elemento de L e a norma-infin em (48) para o caacutelculo do erro
associado a um dado elemento de U como apresentado em (413) e (414) As
referidas normas aproveitam a estrutura das matrizes (411) e (412) evitando-se
a realizaccedilatildeo de operaccedilotildees adicionais sendo requeridas ao inveacutes disto apenas
comparaccedilotildees entre elementos Portanto substituindo (411) em (413) e (412)
em (414) e calculando-se as normas satildeo obtidas as equaccedilotildees (415) e (416)
que devem ser usadas na regra de preenchimento
)1ik(LR = (L -L) Usdot (413)
ki(U )R = L (U-U) infinsdot (414)
ik ik km(L )R = L max U m = [kn]sdot (415)
ki ki mk(U )R U max 1 L m=[k+1n]= sdot (416)
Na Figura 43 satildeo destacados em vermelho todos os elementos dos fatores
triangulares que satildeo requeridos para calcular o erro produzido quando o
elemento Lik (no quadrado) eacute descartado Jaacute na Figura 44 satildeo destacados em
azul todos os elementos necessaacuterios para calcular o erro produzido quando o
elemento Uki (encerrado no quadrado) eacute descartado Observa-se que para que
esta regra possa ser implementada tanto no fator triangular U como em L o
algoritmo de fatoraccedilatildeo deve ser capaz de calcular os elementos Ukk Ukk+1
Ukn (em vermelho) antes de decidir se o elemento Lik deve ser preenchido ou
descartado Semelhantemente deve ser capaz de calcular os elementos Lk+1k
Lnk (em azul) antes de decidir se o elemento Uki deve ser preenchido ou
descartado
145
Figura 43 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Lik
Figura 44 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Uki
45 Adequaccedilatildeo da Regra Baseada no Erro
Nesta seccedilatildeo a regra de preenchimento baseada no erro eacute adequada para ser
usada no preacute-condicionador ILUT(τρ) analisado no capiacutetulo anterior O preacute-
condicionador resultante seraacute chamado de preacute-condicionador de duplo
paracircmetro limitante ILUT(ξτ) Neste preacute-condicionador natildeo eacute mais necessaacuterio
usar o paracircmetro ρ
Conforme visto no Capiacutetulo 3 o algoritmo de fatoraccedilatildeo usado neste preacute-
condicionador eacute o IKJ e deriva da eliminaccedilatildeo de Gauss (Saad 2003) Este tipo
de algoritmo permite calcular os elementos Ukk Ukk+1 Ukn antes de decidir se
o elemento Lik deve ser preenchido ou descartado Poreacutem o algoritmo IKJ natildeo
permite calcular os elementos Lk+1k Lnk antes de decidir se o elemento Uki
deve ser preenchido ou descartado porque no mesmo os elementos de L e U
146
satildeo calculados por linhas uma de cada vez Portanto a regra baseada no erro
pode ser aplicada apenas nos elementos do fator L enquanto que uma variante
da regra convencional usada no ILUT(τρ) eacute usada para os elementos de U
O caacutelculo da norma-2 usada na regra de preenchimento convencional dada pela
raiz quadrada da soma dos quadrados dos elementos da linha pode exigir
consideraacutevel esforccedilo computacional dependendo da dimensatildeo da matriz de
coeficientes Portanto ao inveacutes de se usar esta norma para descartar os
elementos em U recomenda-se realizar a meacutedia aritmeacutetica dos elementos da i-
eacutesima linha da matriz de coeficientes original Este procedimento reduz o nuacutemero
de operaccedilotildees de ponto flutuante sem comprometer a qualidade do preacute-
condicionador No entanto a eficiecircncia de ambas as heuriacutesticas eacute inferior agrave da
regra baseada no erro para preenchimento dos elementos proposta no presente
trabalho O resultado eacute um preacute-condicionador que aplica dois criteacuterios para
definir sua regra de preenchimento da seguinte forma
De acordo com a relaccedilatildeo dada por (417) um elemento Lik eacute descartado se o
erro resultante for menor que a toleracircncia ξ usada para todas as linhas de L
Caso contraacuterio calcula-se Lik usando-se o elemento aik da matriz resultante do
processo de eliminaccedilatildeo de Gauss ateacute a correspondente etapa Jaacute para um
elemento Uik este eacute descartado se for menor que uma certa toleracircncia relativa
τi obtida multiplicando-se a toleracircncia absoluta τ pela meacutedia aritmeacutetica dos
elementos da i-eacutesima linha da matriz de coeficientes original O caacutelculo de w eacute
efetuado de acordo com o algoritmo de fatoraccedilatildeo IKJ apresentado no capiacutetulo
anterior
ik
ikik
(L )
ik (L )k=(1i-1)
kk
0 R= aL
RU
lt ξ ge ξ
(417)
ik
k i
k k ik=(i+1n)
0 w =U
w w
lt ge
ττ
(418)
A adaptaccedilatildeo da regra baseada no erro no preacute-condicionador ILUT(τρ) falha
devido ao fato do algoritmo de fatoraccedilatildeo IKJ natildeo permitir a aplicaccedilatildeo da regra
147
em ambos os fatores triangulares L e U dificultando a exploraccedilatildeo das vantagens
do uso desta regra A seguir mostra-se uma proposta para superar estes
problemas utilizando-se outro algoritmo de fatoraccedilatildeo que permite aplicar a regra
em ambos os fatores triangulares
46 Preacute-condicionador ILU( ξ) Baseado no Caacutelculo do Erro
Nesta seccedilatildeo propotildee-se uma eficiente e robusta estrateacutegia de preacute-
condicionamento da fatoraccedilatildeo incompleta ILU(ξ) derivada de uma versatildeo do
algoritmo de eliminaccedilatildeo de Gauss conhecido como Doolittle A maior vantagem
deste algoritmo eacute que permite usar de forma efetiva a regra de preenchimento
baseada no erro em ambos os fatores triangulares L e U
Os fatores L e U satildeo apresentados em (419) e (420) Os elementos da diagonal
de L satildeo iguais a um e a primeira linha de U eacute igual agrave primeira linha da matriz de
coeficientes A As equaccedilotildees usadas pelo algoritmo de Doolittle para calcular os
elementos dos fatores triangulares satildeo apresentadas em (422) e podem ser
obtidas ao se igualar cada elemento do produto dos fatores triangulares LmiddotU de
(419) e (420) aos elementos da matriz de coeficientes A apresentada em (421)
Estas equaccedilotildees podem ser implementadas computacionalmente de diferentes
formas todas baseadas na eliminaccedilatildeo de Gauss Teoricamente os diferentes
tipos de eliminaccedilatildeo de Gauss realizam o mesmo nuacutemero de operaccedilotildees de ponto
flutuante No entanto no contexto da fatoraccedilatildeo incompleta estas variantes
resultam em importantes diferenccedilas praacuteticas quando o interesse eacute utilizar a regra
de preenchimento baseada no erro
k-11
k1 kk 1
i1 ik 1 ik
n1 nk 1 nk ni
1 0 0 0 0
L 1 0 0 0
L L 1 0 0L
L L L 1 0
L L L L 1
minus
minus
minus
=
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(419)
148
11 1k 1 1k 1i 1n
k-1k-1 k-1k k-1i k-1n
kk ki kn
ii in
nn
U U U U U
0 U U U U
0 0 U U UU
0 0 0 U U
0 0 0 0 U
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(420)
11 1k 1 1k 1i 1n
k-11 k-1k-1 k-1k k-1i k-1n
k1 kk-1 kk ki kn
i1 ik-1 ik ii in
n1 nk-1 nk ni nn
a a a a a
a a a a a
a a a a aA
a a a a a
a a a a a
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(421)
k-1
ki ki kj jij=1
k-1
ik ij jkj=1
ikkk
U =a - [L U ] i=kn
a - [L U ]
L = i=k+1nU
sum
sum (422)
As equaccedilotildees de Doolittle podem gerar algoritmos de eliminaccedilatildeo de Gauss que
calculam os elementos dos fatores triangulares por linhas de forma similar agrave
fatoraccedilatildeo IKJ ou por colunas (Bodewig 1956 Wilkinson 1965 Dahlquist amp
Bjoumlrk 1974 Hoffman 2001) Em ambos algoritmos natildeo seria possiacutevel usar a
regra de preenchimento baseada no erro A partir de (422) propotildee-se usar o
algoritmo de eliminaccedilatildeo de Gauss apresentado na Figura 45 que permite
calcular os elementos dos fatores triangulares simultaneamente por linhas em U
e por colunas em L como mostrado na Figura 46
No passo k da eliminaccedilatildeo de Gauss os elementos da k-eacutesima linha de U e a k-
eacutesima coluna de L (identificados por linhas tracejadas) satildeo calculados utilizando
elementos jaacute computados anteriormente nas linhas e colunas de U e L Por
exemplo para se calcular o elemento Uki satildeo usados os elementos destacados
em azul enquanto que para calcular o elemento Lik satildeo usados os elementos
149
destacados em vermelho Observa-se que este algoritmo permite calcular
elementos de L em linhas posteriores agrave linha k Esta caracteriacutestica possibilita o
uso em U da regra de preenchimento baseada no erro
1 Para i = 1n Faccedila
2 min = Ji in
3 Para k = in Faccedila
4 Para j = 1i-1 Faccedila
5 mk = mk - LijmiddotUjk
6 Fim ndash Faccedila
7 Fim ndash Faccedila
8 Registrar Umax = maxmin
9 ni+1n = J i+1ni
10 Para k = i+1n Faccedila
11 Para j = 1i-1 Faccedila
12 nk = nk ndash LkjmiddotUji
13 Fim ndash Faccedila
14 Fim ndash Faccedila
15 n = nUii
16 Registrar Lmax = maxni+1n
17 Aplicar a regra de preenchimento baseada no erro em m e n
18 Ui in = m in
19 L i+1ni = n i+1n
20 Fim ndash Faccedila
Figura 45 ndash Algoritmo do preacute-condicionador ILU(ξ)
Figura 46 ndash Elementos necessaacuterios para calcular os elementos Lik e Uki durante a fatoraccedilatildeo triangular
150
No algoritmo da Figura 45 observa-se que no passo k os elementos da linha de
U satildeo armazenados no vetor m enquanto que os elementos da coluna de L satildeo
armazenados no vetor n (passos 5 e 12 respectivamente) Uma vez calculados
ambos os vetores procura-se o maior elemento de m sendo armazenado em
Umax e o maior elemento de n armazenado em Lmax (passos 8 e 16
respectivamente) Ambos os valores maacuteximos (em valores absolutos) satildeo
usados pela regra de preenchimento no passo 17 para descartar em m e n os
elementos associados com os menores erros e preencher a linha de U e a
coluna de L da seguinte forma
De acordo com as relaccedilotildees dadas por (423) e (424) tanto um elemento Lki
como tambeacutem um elemento Uik satildeo descartados se seus erros associados
foram menores que uma dada toleracircncia ξ usada para todas as colunas de L e
linhas de U Caso contraacuterio Lki eacute preenchido usando-se o valor armazenado
em nk e Uik eacute preenchido usando-se o valor armazenado em mk
ik
ikik
(U )
(U )kk=(in)
0 R =U
m R
lt ξ ge ξ
(423)
ik
ikki
(L )
(L )ki=(1+1n)
0 R=L
n R
lt ξ ge ξ
(424)
Como observado na Figura 46 o algoritmo da Figura 45 permite encontrar os
elementos Ukk Ukk+1 Ukn necessaacuterios para se calcular o erro associado ao
elemento Lki e os elementos Lk+1k Lnk que por sua vez satildeo necessaacuterios para
se calcular o erro associado ao elemento Uik Nota-se que os elementos
necessaacuterios para calcular o erro (passo k) satildeo calculados neste mesmo passo
portanto natildeo eacute necessaacuterio realizar grandes buscas de elementos nas matrizes L
e U Igualmente tambeacutem natildeo eacute necessaacuterio armazenar valores Umax Lmax ou
erros do passo k porque natildeo seratildeo mais necessaacuterios nos proacuteximos passos
Observe-se que natildeo eacute necessaacuterio multiplicar o paracircmetro ξ por alguma norma ou
meacutedia aritmeacutetica dos elementos da matriz de coeficientes como realizado no
preacute-condicionador ILUT(τρ) porque o erro independe dos valores dos elementos
151
da matriz de coeficientes Este preacute-condicionador usa apenas um uacutenico
paracircmetro ξ Esta caracteriacutestica facilita o ajuste dos paracircmetros do solucionador
como seraacute visto nas proacuteximas seccedilotildees e no proacuteximo capiacutetulo
47 Meacutetodo Convencional Para Ajuste dos Paracircmetros dos Solucionadores
O ajuste dos paracircmetros de um solucionador iterativo eacute considerado fundamental
para garantir sua robustez e eficiecircncia computacional principalmente em
anaacutelises mais complexas como aquelas que solucionam vaacuterios fluxos de carga
com diferentes pontos de operaccedilatildeo Nesses casos a escolha de valores
apropriados para os paracircmetros se torna ainda mais relevante
A ideacuteia fundamental eacute escolher os valores dos paracircmetros que permitam
preencher o menor nuacutemero de elementos sem prejudicar a qualidade do preacute-
condicionador isto eacute sem tornaacute-lo muito diferente de A Poreacutem a escolha de
valores apropriados para os paracircmetros eacute uma tarefa difiacutecil jaacute que existe uma
interdependecircncia com as toleracircncias relativa e absoluta do GMRES e com o tipo
de problema que estaacute sendo solucionado
Pouco tem sido pesquisado em relaccedilatildeo a este tema apenas em (de Leon amp
Semlyen 2002) apresenta-se uma foacutermula que permite calcular para cada
sistema eleacutetrico o valor do paracircmetro limitante τ no preacute-condicionador ILU(τ)
dado por (322) onde τ eacute igual agrave metade do nuacutemero de equaccedilotildees totais Neq do
sistema linear Na praacutetica estaacute foacutermula natildeo garante robustez nem o melhor
desempenho do solucionador
eq
12 N
τ =sdot
(425)
No entanto o procedimento convencional define primeiro valores arbitraacuterios para
as duas toleracircncias absoluta e relativa do GMRES Nas simulaccedilotildees realizadas
nos capiacutetulos anteriores se usou toleracircncias iguais (10-5) e menores que a
toleracircncia usada no teste de convergecircncia do algoritmo Newton-Raphson pois
toleracircncias maiores costumam impedir a convergecircncia do Newton-Raphson
152
Uma vez definidas as toleracircncias a escolha dos paracircmetros do preacute-
condicionador eacute realizada com base em tentativa e erro
Este meacutetodo natildeo considera a possibilidade de encontrar melhores desempenhos
para outras toleracircncias do GMRES que natildeo necessariamente devem ser
consideradas iguais Durante o procedimento de tentativa e erro o meacutetodo pode
encontrar um miacutenimo nuacutemero de operaccedilotildees local (MFLOPSL) associado com τL
como ilustrado na Figura 47 que natildeo necessariamente eacute o menor possiacutevel
(MFLOPSG) Observa-se que para obter o miacutenimo nuacutemero de operaccedilotildees global
(MFLOPSG) o procedimento de tentativa e erro deveria comeccedilar com um valor
de τ proacuteximo de τG
Figura 47 ndash Procedimento de tentativa e erro para busca de valores de um paracircmetro do preacute-condicionador
Quando o preacute-condicionador possui um segundo paracircmetro o procedimento de
tentativa e erro eacute repetido para este segundo paracircmetro fixando-se o primeiro
paracircmetro
48 Meacutetodo Proposto Para Ajuste dos Paracircmetros dos Solucio nadores
O meacutetodo proposto consiste em realizar sucessivas simulaccedilotildees de fluxo de
carga variando simultaneamente todos os paracircmetros do solucionador e
registrando o nuacutemero de operaccedilotildees de ponto flutuante para cada caso gerado O
objetivo eacute encontrar regiotildees de valores para os paracircmetros onde o solucionador
153
apresente alto desempenho permitindo estabelecer e recomendar faixas para os
valores dos paracircmetros onde o solucionador garante convergecircncia com a maior
eficiecircncia possiacutevel O meacutetodo tambeacutem permite identificar as faixas de valores
onde o solucionador natildeo converge
O meacutetodo eacute ilustrado para ajustar os paracircmetros de duas configuraccedilotildees de
solucionador iterativo sendo estas o solucionador proposto neste trabalho
identificado como GMRES+ILU(ξ)+MD e o solucionador GMRES+ILUT(τρ)+MD
apresentado no capiacutetulo 2 Na Tabela 43 especificam-se os paracircmetros
associados a cada solucionador
Tabela 43 ndash Paracircmetros usados nos solucionadores
Solucionadores Meacutetodo Iterativo Preacute-condicionador
GMRES+ILU(ξ)+MD atol rtol
ξ
GMRES+ILUT(τρ)+MD τ ρ
481 Passos Fundamentais
Esta seccedilatildeo apresenta de maneira sucinta os passos envolvidos no meacutetodo para
ajuste dos paracircmetros dos solucionadores onde uma descriccedilatildeo geral eacute
mostrada na Figura 48 O primeiro passo refere-se agrave definiccedilatildeo do espaccedilo de
busca onde satildeo procurados os valores para os paracircmetros que garantem alto
desempenho do solucionador O segundo refere-se aos experimentos numeacutericos
realizados para avaliar o desempenho do solucionador considerando-se todas as
combinaccedilotildees possiacuteveis dos valores de seus paracircmetros definidos no espaccedilo de
busca O passo seguinte tem como objetivo calcular as faixas de valores
recomendaacuteveis para as toleracircncias absoluta e relativa do GMRES Finalmente o
quarto passo calcula as faixas de valores recomendaacuteveis para os paracircmetros do
preacute-condicionador
154
Figura 48 ndash Passos fundamentais para delimitaccedilatildeo dos paracircmetros do solucionador
Nas proacuteximas seccedilotildees os passos mais relevantes no contexto deste trabalho satildeo
discutidos mais detalhadamente
482 Estabelecimento do Espaccedilo de Busca
Para definir o espaccedilo de busca primeiramente deve-se estabelecer o domiacutenio de
cada paracircmetro isto eacute um valor miacutenimo e maacuteximo para cada toleracircncia do
GMRES e para cada paracircmetro do preacute-condicionador como mostrado na Tabela
44 e na Figura 49 Depois devem ser definidos valores intermediaacuterios para cada
paracircmetro sendo que o nuacutemero de valores totais eacute definido em funccedilatildeo do grau
de precisatildeo que se deseja conseguir nos paracircmetros
Finalmente o espaccedilo de busca eacute definido por todas as combinaccedilotildees possiacuteveis
entre as toleracircncias absoluta e relativa do GMRES como apresentado na Figura
49(a) e por todas as combinaccedilotildees possiacuteveis realizadas entre os paracircmetros do
preacute-condicionador como mostrado na Figura 49(b-c)
Para os valores especificados na Tabela 44 existem (m x n) combinaccedilotildees
possiacuteveis entre a toleracircncia absoluta e relativa (ver Figura 49(a)) e (q x p)
combinaccedilotildees possiacuteveis entre os paracircmetros τ e ρ do preacute-condicionador ILUT(τρ)
(ver Figura 49(c)) No caso do preacute-condicionador ILU(ξ) natildeo existem
combinaccedilotildees jaacute que este preacute-condicionador possui somente um uacutenico
paracircmetro Poreacutem existem k valores possiacuteveis para ξ (ver Figura 49(b))
Estabelecer Espaccedilo de Busca
Experimentos numeacutericos
Delimitar paracircmetros do preacute-condicionador
Delimitar toleracircncias do GMRES
155
Tabela 44 ndash Domiacutenios dos paracircmetros usados nos solucionadores
Paracircmetros Maacuteximo Miacutenimo Nuacutemero total de valores
atol atol1 atoln n
rtol rtol1 rtolm m
ξ ξ1 ξk k
τ τ1 τq q
ρ ρ1 ρp P
a) Espaccedilo de busca das toleracircncias do GMRES
b) Espaccedilo de busca dos paracircmetros do preacute-condicionador ILUT(ξ)
c) Espaccedilo de busca dos paracircmetros do preacute-
condicionador ILUT(τρ)
Figura 49 ndash Espaccedilo de busca dos paracircmetros do solucionador
483 Experimentos Numeacutericos
No segundo passo para cada combinaccedilatildeo das toleracircncias absoluta e relativa
(atolrtol) do espaccedilo de busca da Figura 49(a) satildeo simulados tantos Fluxos de
Carga quanto combinaccedilotildees dos paracircmetros do preacute-condicionador existam
registrando-se o nuacutemero de operaccedilotildees de ponto flutuante (MFLOPS) para cada
156
combinaccedilatildeo dos paracircmetros do preacute-condicionador Portanto para cada
combinaccedilatildeo (atolrtol) eacute gerado um graacutefico de eficiecircncia computacional (em
MFLOPS) em funccedilatildeo dos paracircmetros do preacute-condicionador como mostrado na
Figura 410(a) para o preacute-condicionador ILUT(τρ) e na Figura 410(b) para o
preacute-condicionador ILU(ξ)
a) Graacutefico de eficiecircncia para o preacute-condicionador ILUT(τρ)
b) Graacutefico de eficiecircncia para o preacute-condicionador ILU(ξ)
Figura 410 ndash Graacuteficos de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
Para cada graacutefico gerado eacute registrado o nuacutemero de operaccedilotildees de ponto flutuante
miacutenimo (MFLOPSmiacuten) e este valor eacute associado agrave sua correspondente combinaccedilatildeo
(atolrtol) Apoacutes terem sido realizados todos os experimentos e registrados todos
os MFLOPSmiacuten associados a todas as combinaccedilotildees (atolrtol) eacute gerado o graacutefico
de alta eficiecircncia Este graacutefico apresenta em escala de cores todos MFLOPSmiacuten
em funccedilatildeo de suas correspondentes combinaccedilotildees (atolrtol) como mostrado na
Figura 411 sendo que a cor azul estaacute associada com os menores MFLOPSmiacuten a
157
cor vermelha com os maiores MFLOPSmiacuten e em negrito os casos natildeo
convergentes
Observa-se que entre todos os valores registrados para MFLOPSmiacuten existe uma
regiatildeo que conteacutem os casos com os menores MFLOPSmiacuten Este valor chamado
de MFLOPSoacuteti eacute o nuacutemero miacutenimo de operaccedilotildees possiacutevel (global) e estaacute
associado com a regiatildeo quadrada em azul escuro segmentada pelas linhas
brancas Os pontos brancos indicam as posiccedilotildees de todas as combinaccedilotildees que
possuem nuacutemero de operaccedilotildees igual a MFLOPSoacuteti
Figura 411 ndash Graacuteficos de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
484 Delimitaccedilatildeo das Toleracircncias do GMRES
No terceiro passo a partir do graacutefico de alta eficiecircncia apresentado na sua forma
bidimensional na Figura 412 eacute segmentada a regiatildeo dos MFLOPSoacuteti Neste
caso esta regiatildeo eacute o quadrado azul do centro do graacutefico onde cada ponto
branco estaacute associado a uma combinaccedilatildeo (atolrtol) que apresenta o menor
nuacutemero de operaccedilotildees possiacutevel em todo o espaccedilo de busca (MFLOPSoacuteti) Este
graacutefico permite encontrar as faixas de valores (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do meacutetodo GMRES associadas ao melhor
desempenho possiacutevel
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
137
137
Tabela 42 ndash Caracteriacutesticas dos solucionadores iterativos usados em aplicaccedilotildees de fluxo de carga
Autor Ano Meacutetodo
Iterativo
Estrateacutegias Usadas
Preacute-condicionador Regra de Eliminaccedilatildeo Reordenamento Escalonamento
Galiana 1994 GConjugado Cholesky Incomp M=Lrsquo∙LrsquoT(0) Sem novos elementos natildeo-nulos mdash mdash
Mori 1996 Tchebychev Cholesky Incompleto Sem novos elementos natildeo-nulos mdash mdash
Semlyen 1996 GMRES(m) mdash mdash mdash mdash
Borges 1996(97) BiCGStab M = L∙U da primeira Iteraccedilatildeo mdash mdash mdash
Pai 1997 GMRES ILU(k) Niacutevel de novos elementos natildeo-nulos mdash mdash
Flueck 1998 GMRES(m) FastD M = Brsquo mdash RCM mdash
Alves 1999 GConjugado Cholesky completo mdash MD MST mdash
De Leoacuten 2002 BiCGStab GMRES QMR CGS BiCG + ILU() Com paracircmetro limitante
limitante
mdash mdash
Dag 2003 GConjugado Aproximaccedilatildeo da Inversa Polinocircmio de Chebyshev mdash D1∙Brsquo∙D2
Chen 2006 GMRES(m) Aprox da Inversa Adaptativa mdash mdash mdash
Mori 2007 BiCGStab ILU(k) Niacutevel de novos elementos natildeo-nulos mdash mdash
Pessanha 2009 GMRES ILUT( ρ) quase-fixo
Duplo paracircmetro limitante e ρ RCM mdash
Khaitan 2010 GMRES M = L∙U Multifrontal quase-fixo mdash RCM mdash
Solucionador Proposto GMRES ILU(ξ) Baseada no Erro MD mdash
138
137
43 Solucionador Iterativo Para Fluxo de Carga
O solucionador desenvolvido eacute composto basicamente pelo meacutetodo iterativo de
subespaccedilos de Krylov GMRES (vide Capiacutetulo 2) e pela estrateacutegia de preacute-
condicionamento de fatoraccedilatildeo incompleta ILU(ξ) com suporte da teacutecnica de
reordenamento Miacutenimo Grau (MD) A estrateacutegia de reinicializaccedilatildeo GMRES(m)
(apresentada em 26) usada para limitar o tamanho dos subespaccedilos de Krylov a
um valor maacuteximo ―m natildeo faz parte do solucionador uma vez que a estrateacutegia
de preacute-condicionamento forccedila a convergecircncia do GMRES em poucas iteraccedilotildees
lineares (uma ou duas iteraccedilotildees) Portanto jaacute que poucas iteraccedilotildees estatildeo
associadas a subespaccedilos pequenos entatildeo natildeo eacute necessaacuterio estabelecer um
valor maacuteximo ―m
Nesta tese adota-se a teacutecnica de reordenamento MD porque a mesma acarreta
a reduccedilatildeo significativa do nuacutemero de novos elementos natildeo-nulos gerados
reduzindo o esforccedilo computacional realizado para construir e usar o preacute-
condicionador Alem disso este tipo de reordenamento aumenta a taxa de
convergecircncia do meacutetodo iterativo GMRES O solucionador eacute denominado de
GMRES+ILU(ξ)+MD e foi implementado em um programa computacional de
fluxo de carga desenvolvido em linguagem Fortran da forma apresentada no
fluxograma da Figura 41 Seus componentes estatildeo destacados na cor vermelha
numerados por algarismos romanos na mesma ordem em que satildeo aplicados
Observa-se que antes de iniciadas as iteraccedilotildees Newton-Raphson eacute calculada a
sequumlecircncia de reordenamento usando-se a teacutecnica MD matematicamente
representada pela matriz de permutaccedilotildees P Na praacutetica eacute gerado um vetor com
a sequumlecircncia de reordenamento que permitiraacute montar a matriz Jacobiana jaacute
reordenada em cada iteraccedilatildeo k do algoritmo Newton-Raphson Esse vetor
tambeacutem eacute usado para reordenar os resiacuteduos de potecircncia ativa e reativa
armazenados no vetor bk Cada vez que o teste de convergecircncia do algoritmo
Newton-Raphson natildeo for satisfeito uma nova matriz Jacobiana reordenada eacute
montada A partir das informaccedilotildees da matriz Jacobiana reordenada a estrateacutegia
de preacute-condicionamento ILU(ξ) constroacutei um preacute-condicionador Mk que em
seguida seraacute usado para obter explicitamente o novo sistema linear preacute-
condicionado (41) a ser solucionado pelo meacutetodo iterativo GMRES Finalmente
139
137
as incoacutegnitas satildeo atualizadas em (42) O procedimento eacute repetido ateacute que o
teste de convergecircncia do algoritmo Newton-Raphson seja satisfeito
1 T 1k k kM P J P x M P b (41)
T
k 1 k
v vP x
(42)
Figura 41 ndash Fluxograma do Solucionador Iterativo para o problema de fluxo de carga
O programa de fluxo de carga modela as barras de acordo como seu tipo (PQ
PV e de referecircncia) as linhas de transmissatildeo transformadores e
140
137
transformadores defasadores satildeo representados pelos seus circuitos ᴨ
equivalentes Os tapes variaacuteveis sob carga podem ainda ter a atuaccedilatildeo contiacutenua
ou discreta As cargas das barras satildeo normalmente modeladas como potecircncias
ativa e reativa constantes ou podem ser expressas como uma funccedilatildeo da
magnitude da tensatildeo da barra Natildeo satildeo modelados elos de corrente contiacutenua
No algoritmo de fluxo de carga consideram-se o controle de variaccedilatildeo automaacutetica
de tape e os limites de geraccedilatildeo de potecircncia reativa
44 Regra de Preenchimento Baseada no Caacutelculo do Erro Associado ao Elemento Descartado
Uma forma simples de estimar o erro total R originado pelos elementos
descartados devido agraves regras de preenchimento da fatoraccedilatildeo incompleta eacute
usando-se (310) (Mori et al 1996 Saad 2003) Nesta equaccedilatildeo o produto dos
fatores triangulares incompletos eacute igual ao preacute-condicionador M e o produto dos
fatores triangulares completos eacute igual agrave matriz de coeficientes A como mostrado
em (311) Desta forma o erro R permite vislumbrar quatildeo diferente se tornou
o preacute-condicionador em relaccedilatildeo aos fatores triangulares completos apoacutes o
descarte de seus elementos
Um preacute-condicionador sem regra de preenchimento efetua completamente o
caacutelculo dos fatores triangulares Neste caso o preacute-condicionador M se iguala agrave
matriz de coeficientes (M = L∙U = A) o que resulta na convergecircncia do meacutetodo
GMRES em uma uacutenica iteraccedilatildeo com erro R nulo Poreacutem o nuacutemero de
operaccedilotildees de ponto flutuante ainda eacute consideraacutevel Para se obter esta reduccedilatildeo eacute
necessaacuterio usar uma regra de preenchimento que descarte o maior nuacutemero de
elementos nos fatores triangulares e sem que isso provoque o aumento do erro
R consequumlentemente afetando o desempenho do GMRES
R A M (43)
R L U L U (44)
Como exemplo na Figura 36 satildeo apresentados dois graacuteficos que ilustram como
os erros produzidos pelo descarte dos fatores triangulares natildeo-nulos podem se
alastrar ateacute em posiccedilotildees de elementos jaacute preenchidos O experimento foi
141
137
apresentado na seccedilatildeo 332 do capiacutetulo anterior para o sistema brasileiro de
3513 barras usando-se o preacute-condicionador ILU(0) para o caacutelculo dos fatores
incompletos No graacutefico da Figura 36(a) mostra-se que 8797 dos elementos
do preacute-condicionador M (83078) satildeo distintos dos encontrados na matriz
Jacobiana O graacutefico do erro em 42(b) permite se ter uma ideacuteia da dimensatildeo
destas diferenccedilas Dos 38738 elementos com erros entre 0 e 001 (pontos
azuis) 11360 tecircm erro igual a zero (elementos idecircnticos) e 27378 tecircm erros
menores que 001 Os erros nesta faixa de valores normalmente natildeo prejudicam
a convergecircncia do GMRES
As outras faixas de valores associadas aos pontos de cores verde amarelo e
vermelho normalmente prejudicam a convergecircncia do GMRES Esses erros
devem ser evitados e satildeo gerados quando alguns elementos importantes satildeo
descartados durante a fatoraccedilatildeo ILU(0) O maior erro provocado entre os
elementos de M e da Jacobiana eacute de 401931 e o erro total para este preacute-
condicionador eacute de 10632middot105 (norma de Frobenius) Para evitar que os erros
se propaguem enquanto eacute realizada a fatoraccedilatildeo eacute necessaacuterio calcular o erro
associado a cada elemento dos fatores triangulares antes de seu preenchimento
ou descarte Este erro deve tambeacutem considerar os erros propagados nos
caacutelculos futuros onde o elemento seja requerido Se este valor for zero ou
proacuteximo de zero entatildeo o elemento pode ser descartado caso contraacuterio deve ser
preenchido
a) Produto dos fatores incompletos (LrsquoUrsquo) do preacute-condicionador ILU(0)
b) Matriz R para o preacute-condicionador ILU(0)
Figura 42 ndash Erros produzidos pela regra de preenchimento com o preacute-condicionador ILU(0) para a matriz Jacobiana do sistema brasileiro de 3513 barras
142
Sejam L e U os fatores triangulares completos Lrsquo e Ursquo os fatores triangulares
incompletos apoacutes o descarte de um uacutenico elemento Lik o elemento descartado
em Lrsquo e Uki o elemento descartado em Ursquo (Lik = 0 ou Uki = 0) Usando a equaccedilatildeo
(311) (Mori et al 1996 Saad 2003 Benzi et al 1999b Benzi 2002) eacute possiacutevel
calcular o erro associado ao elemento Lik (45) e o erro associado ao elemento
Uki (46) Como mencionado anteriormente esses erros permitem ter uma ideacuteia
de quatildeo diferente se torna o preacute-condicionador M dos fatores triangulares
completos apoacutes os elementos Lik e Uki serem descartados Como os erros estatildeo
associados a um uacutenico elemento descartado as equaccedilotildees (45) e (46) podem
ser reescritas como em (47) e (48) respectivamente
R = L U - L Usdot sdot (45)
R = L U - L Usdot sdot (46)
)ik(LR = (L -L) Usdot (47)
)ik(UR = L (U-U)sdot (48)
Verifica-se que tanto a matriz diferenccedila (L-Lrsquo) como tambeacutem (U-Ursquo) possuem
apenas um elemento natildeo nulo Lik (descartado em Lrsquo) e Uki (descartado em Ursquo)
respectivamente como apresentado em (49) e (410)
ik
0
0 0
0 0 0
0 0 0 0
L L =
0 0 0 0 0
0 0 L 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
( - )
⋮ ⋱
⋯
⋯
⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱
⋯ ⋯ ⋯
(49)
143
ki
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 U 0 0
0 0 0 0 0
(U - U) =
0 0 0 0
0 0 0
0 0
0
⋯ ⋯ ⋯
⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯
⋯
⋯
⋱ ⋮
(410)
Pela substituiccedilatildeo de (49) e (410) nos produtos (L-Lrsquo)middotU como Lmiddot(U-Ursquo) resulta
em (411) e (412)
ik kk ik kk+1 ik ki ik kn
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
L - L) U =
0 0 0 0 0 0
0 0 L U L U L U L U
0 0 0 0 0 0
0 0 0 0 0 0
(
sdot
sdot sdot sdot sdot
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(411)
ki
k+1k ki
ik ki
nk ki
0 0 0 0 0
0 0 0 0 0
0 0 U 0 0
L (U - U) = 0 0 L U 0 0
0 0 L U 0 0
0 0 L U 0 0
sdot sdot
sdot
sdot
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
(412)
Conforme mencionado no capiacutetulo anterior uma das dificuldades para propor
uma regra de preenchimento estaacute em se reduzir o nuacutemero de operaccedilotildees
associadas com sua execuccedilatildeo dentro do algoritmo de preacute-condicionamento
144
Neste trabalho propotildee-se usar a norma-1 em (47) para o caacutelculo do erro
associado a um elemento de L e a norma-infin em (48) para o caacutelculo do erro
associado a um dado elemento de U como apresentado em (413) e (414) As
referidas normas aproveitam a estrutura das matrizes (411) e (412) evitando-se
a realizaccedilatildeo de operaccedilotildees adicionais sendo requeridas ao inveacutes disto apenas
comparaccedilotildees entre elementos Portanto substituindo (411) em (413) e (412)
em (414) e calculando-se as normas satildeo obtidas as equaccedilotildees (415) e (416)
que devem ser usadas na regra de preenchimento
)1ik(LR = (L -L) Usdot (413)
ki(U )R = L (U-U) infinsdot (414)
ik ik km(L )R = L max U m = [kn]sdot (415)
ki ki mk(U )R U max 1 L m=[k+1n]= sdot (416)
Na Figura 43 satildeo destacados em vermelho todos os elementos dos fatores
triangulares que satildeo requeridos para calcular o erro produzido quando o
elemento Lik (no quadrado) eacute descartado Jaacute na Figura 44 satildeo destacados em
azul todos os elementos necessaacuterios para calcular o erro produzido quando o
elemento Uki (encerrado no quadrado) eacute descartado Observa-se que para que
esta regra possa ser implementada tanto no fator triangular U como em L o
algoritmo de fatoraccedilatildeo deve ser capaz de calcular os elementos Ukk Ukk+1
Ukn (em vermelho) antes de decidir se o elemento Lik deve ser preenchido ou
descartado Semelhantemente deve ser capaz de calcular os elementos Lk+1k
Lnk (em azul) antes de decidir se o elemento Uki deve ser preenchido ou
descartado
145
Figura 43 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Lik
Figura 44 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Uki
45 Adequaccedilatildeo da Regra Baseada no Erro
Nesta seccedilatildeo a regra de preenchimento baseada no erro eacute adequada para ser
usada no preacute-condicionador ILUT(τρ) analisado no capiacutetulo anterior O preacute-
condicionador resultante seraacute chamado de preacute-condicionador de duplo
paracircmetro limitante ILUT(ξτ) Neste preacute-condicionador natildeo eacute mais necessaacuterio
usar o paracircmetro ρ
Conforme visto no Capiacutetulo 3 o algoritmo de fatoraccedilatildeo usado neste preacute-
condicionador eacute o IKJ e deriva da eliminaccedilatildeo de Gauss (Saad 2003) Este tipo
de algoritmo permite calcular os elementos Ukk Ukk+1 Ukn antes de decidir se
o elemento Lik deve ser preenchido ou descartado Poreacutem o algoritmo IKJ natildeo
permite calcular os elementos Lk+1k Lnk antes de decidir se o elemento Uki
deve ser preenchido ou descartado porque no mesmo os elementos de L e U
146
satildeo calculados por linhas uma de cada vez Portanto a regra baseada no erro
pode ser aplicada apenas nos elementos do fator L enquanto que uma variante
da regra convencional usada no ILUT(τρ) eacute usada para os elementos de U
O caacutelculo da norma-2 usada na regra de preenchimento convencional dada pela
raiz quadrada da soma dos quadrados dos elementos da linha pode exigir
consideraacutevel esforccedilo computacional dependendo da dimensatildeo da matriz de
coeficientes Portanto ao inveacutes de se usar esta norma para descartar os
elementos em U recomenda-se realizar a meacutedia aritmeacutetica dos elementos da i-
eacutesima linha da matriz de coeficientes original Este procedimento reduz o nuacutemero
de operaccedilotildees de ponto flutuante sem comprometer a qualidade do preacute-
condicionador No entanto a eficiecircncia de ambas as heuriacutesticas eacute inferior agrave da
regra baseada no erro para preenchimento dos elementos proposta no presente
trabalho O resultado eacute um preacute-condicionador que aplica dois criteacuterios para
definir sua regra de preenchimento da seguinte forma
De acordo com a relaccedilatildeo dada por (417) um elemento Lik eacute descartado se o
erro resultante for menor que a toleracircncia ξ usada para todas as linhas de L
Caso contraacuterio calcula-se Lik usando-se o elemento aik da matriz resultante do
processo de eliminaccedilatildeo de Gauss ateacute a correspondente etapa Jaacute para um
elemento Uik este eacute descartado se for menor que uma certa toleracircncia relativa
τi obtida multiplicando-se a toleracircncia absoluta τ pela meacutedia aritmeacutetica dos
elementos da i-eacutesima linha da matriz de coeficientes original O caacutelculo de w eacute
efetuado de acordo com o algoritmo de fatoraccedilatildeo IKJ apresentado no capiacutetulo
anterior
ik
ikik
(L )
ik (L )k=(1i-1)
kk
0 R= aL
RU
lt ξ ge ξ
(417)
ik
k i
k k ik=(i+1n)
0 w =U
w w
lt ge
ττ
(418)
A adaptaccedilatildeo da regra baseada no erro no preacute-condicionador ILUT(τρ) falha
devido ao fato do algoritmo de fatoraccedilatildeo IKJ natildeo permitir a aplicaccedilatildeo da regra
147
em ambos os fatores triangulares L e U dificultando a exploraccedilatildeo das vantagens
do uso desta regra A seguir mostra-se uma proposta para superar estes
problemas utilizando-se outro algoritmo de fatoraccedilatildeo que permite aplicar a regra
em ambos os fatores triangulares
46 Preacute-condicionador ILU( ξ) Baseado no Caacutelculo do Erro
Nesta seccedilatildeo propotildee-se uma eficiente e robusta estrateacutegia de preacute-
condicionamento da fatoraccedilatildeo incompleta ILU(ξ) derivada de uma versatildeo do
algoritmo de eliminaccedilatildeo de Gauss conhecido como Doolittle A maior vantagem
deste algoritmo eacute que permite usar de forma efetiva a regra de preenchimento
baseada no erro em ambos os fatores triangulares L e U
Os fatores L e U satildeo apresentados em (419) e (420) Os elementos da diagonal
de L satildeo iguais a um e a primeira linha de U eacute igual agrave primeira linha da matriz de
coeficientes A As equaccedilotildees usadas pelo algoritmo de Doolittle para calcular os
elementos dos fatores triangulares satildeo apresentadas em (422) e podem ser
obtidas ao se igualar cada elemento do produto dos fatores triangulares LmiddotU de
(419) e (420) aos elementos da matriz de coeficientes A apresentada em (421)
Estas equaccedilotildees podem ser implementadas computacionalmente de diferentes
formas todas baseadas na eliminaccedilatildeo de Gauss Teoricamente os diferentes
tipos de eliminaccedilatildeo de Gauss realizam o mesmo nuacutemero de operaccedilotildees de ponto
flutuante No entanto no contexto da fatoraccedilatildeo incompleta estas variantes
resultam em importantes diferenccedilas praacuteticas quando o interesse eacute utilizar a regra
de preenchimento baseada no erro
k-11
k1 kk 1
i1 ik 1 ik
n1 nk 1 nk ni
1 0 0 0 0
L 1 0 0 0
L L 1 0 0L
L L L 1 0
L L L L 1
minus
minus
minus
=
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(419)
148
11 1k 1 1k 1i 1n
k-1k-1 k-1k k-1i k-1n
kk ki kn
ii in
nn
U U U U U
0 U U U U
0 0 U U UU
0 0 0 U U
0 0 0 0 U
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(420)
11 1k 1 1k 1i 1n
k-11 k-1k-1 k-1k k-1i k-1n
k1 kk-1 kk ki kn
i1 ik-1 ik ii in
n1 nk-1 nk ni nn
a a a a a
a a a a a
a a a a aA
a a a a a
a a a a a
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(421)
k-1
ki ki kj jij=1
k-1
ik ij jkj=1
ikkk
U =a - [L U ] i=kn
a - [L U ]
L = i=k+1nU
sum
sum (422)
As equaccedilotildees de Doolittle podem gerar algoritmos de eliminaccedilatildeo de Gauss que
calculam os elementos dos fatores triangulares por linhas de forma similar agrave
fatoraccedilatildeo IKJ ou por colunas (Bodewig 1956 Wilkinson 1965 Dahlquist amp
Bjoumlrk 1974 Hoffman 2001) Em ambos algoritmos natildeo seria possiacutevel usar a
regra de preenchimento baseada no erro A partir de (422) propotildee-se usar o
algoritmo de eliminaccedilatildeo de Gauss apresentado na Figura 45 que permite
calcular os elementos dos fatores triangulares simultaneamente por linhas em U
e por colunas em L como mostrado na Figura 46
No passo k da eliminaccedilatildeo de Gauss os elementos da k-eacutesima linha de U e a k-
eacutesima coluna de L (identificados por linhas tracejadas) satildeo calculados utilizando
elementos jaacute computados anteriormente nas linhas e colunas de U e L Por
exemplo para se calcular o elemento Uki satildeo usados os elementos destacados
em azul enquanto que para calcular o elemento Lik satildeo usados os elementos
149
destacados em vermelho Observa-se que este algoritmo permite calcular
elementos de L em linhas posteriores agrave linha k Esta caracteriacutestica possibilita o
uso em U da regra de preenchimento baseada no erro
1 Para i = 1n Faccedila
2 min = Ji in
3 Para k = in Faccedila
4 Para j = 1i-1 Faccedila
5 mk = mk - LijmiddotUjk
6 Fim ndash Faccedila
7 Fim ndash Faccedila
8 Registrar Umax = maxmin
9 ni+1n = J i+1ni
10 Para k = i+1n Faccedila
11 Para j = 1i-1 Faccedila
12 nk = nk ndash LkjmiddotUji
13 Fim ndash Faccedila
14 Fim ndash Faccedila
15 n = nUii
16 Registrar Lmax = maxni+1n
17 Aplicar a regra de preenchimento baseada no erro em m e n
18 Ui in = m in
19 L i+1ni = n i+1n
20 Fim ndash Faccedila
Figura 45 ndash Algoritmo do preacute-condicionador ILU(ξ)
Figura 46 ndash Elementos necessaacuterios para calcular os elementos Lik e Uki durante a fatoraccedilatildeo triangular
150
No algoritmo da Figura 45 observa-se que no passo k os elementos da linha de
U satildeo armazenados no vetor m enquanto que os elementos da coluna de L satildeo
armazenados no vetor n (passos 5 e 12 respectivamente) Uma vez calculados
ambos os vetores procura-se o maior elemento de m sendo armazenado em
Umax e o maior elemento de n armazenado em Lmax (passos 8 e 16
respectivamente) Ambos os valores maacuteximos (em valores absolutos) satildeo
usados pela regra de preenchimento no passo 17 para descartar em m e n os
elementos associados com os menores erros e preencher a linha de U e a
coluna de L da seguinte forma
De acordo com as relaccedilotildees dadas por (423) e (424) tanto um elemento Lki
como tambeacutem um elemento Uik satildeo descartados se seus erros associados
foram menores que uma dada toleracircncia ξ usada para todas as colunas de L e
linhas de U Caso contraacuterio Lki eacute preenchido usando-se o valor armazenado
em nk e Uik eacute preenchido usando-se o valor armazenado em mk
ik
ikik
(U )
(U )kk=(in)
0 R =U
m R
lt ξ ge ξ
(423)
ik
ikki
(L )
(L )ki=(1+1n)
0 R=L
n R
lt ξ ge ξ
(424)
Como observado na Figura 46 o algoritmo da Figura 45 permite encontrar os
elementos Ukk Ukk+1 Ukn necessaacuterios para se calcular o erro associado ao
elemento Lki e os elementos Lk+1k Lnk que por sua vez satildeo necessaacuterios para
se calcular o erro associado ao elemento Uik Nota-se que os elementos
necessaacuterios para calcular o erro (passo k) satildeo calculados neste mesmo passo
portanto natildeo eacute necessaacuterio realizar grandes buscas de elementos nas matrizes L
e U Igualmente tambeacutem natildeo eacute necessaacuterio armazenar valores Umax Lmax ou
erros do passo k porque natildeo seratildeo mais necessaacuterios nos proacuteximos passos
Observe-se que natildeo eacute necessaacuterio multiplicar o paracircmetro ξ por alguma norma ou
meacutedia aritmeacutetica dos elementos da matriz de coeficientes como realizado no
preacute-condicionador ILUT(τρ) porque o erro independe dos valores dos elementos
151
da matriz de coeficientes Este preacute-condicionador usa apenas um uacutenico
paracircmetro ξ Esta caracteriacutestica facilita o ajuste dos paracircmetros do solucionador
como seraacute visto nas proacuteximas seccedilotildees e no proacuteximo capiacutetulo
47 Meacutetodo Convencional Para Ajuste dos Paracircmetros dos Solucionadores
O ajuste dos paracircmetros de um solucionador iterativo eacute considerado fundamental
para garantir sua robustez e eficiecircncia computacional principalmente em
anaacutelises mais complexas como aquelas que solucionam vaacuterios fluxos de carga
com diferentes pontos de operaccedilatildeo Nesses casos a escolha de valores
apropriados para os paracircmetros se torna ainda mais relevante
A ideacuteia fundamental eacute escolher os valores dos paracircmetros que permitam
preencher o menor nuacutemero de elementos sem prejudicar a qualidade do preacute-
condicionador isto eacute sem tornaacute-lo muito diferente de A Poreacutem a escolha de
valores apropriados para os paracircmetros eacute uma tarefa difiacutecil jaacute que existe uma
interdependecircncia com as toleracircncias relativa e absoluta do GMRES e com o tipo
de problema que estaacute sendo solucionado
Pouco tem sido pesquisado em relaccedilatildeo a este tema apenas em (de Leon amp
Semlyen 2002) apresenta-se uma foacutermula que permite calcular para cada
sistema eleacutetrico o valor do paracircmetro limitante τ no preacute-condicionador ILU(τ)
dado por (322) onde τ eacute igual agrave metade do nuacutemero de equaccedilotildees totais Neq do
sistema linear Na praacutetica estaacute foacutermula natildeo garante robustez nem o melhor
desempenho do solucionador
eq
12 N
τ =sdot
(425)
No entanto o procedimento convencional define primeiro valores arbitraacuterios para
as duas toleracircncias absoluta e relativa do GMRES Nas simulaccedilotildees realizadas
nos capiacutetulos anteriores se usou toleracircncias iguais (10-5) e menores que a
toleracircncia usada no teste de convergecircncia do algoritmo Newton-Raphson pois
toleracircncias maiores costumam impedir a convergecircncia do Newton-Raphson
152
Uma vez definidas as toleracircncias a escolha dos paracircmetros do preacute-
condicionador eacute realizada com base em tentativa e erro
Este meacutetodo natildeo considera a possibilidade de encontrar melhores desempenhos
para outras toleracircncias do GMRES que natildeo necessariamente devem ser
consideradas iguais Durante o procedimento de tentativa e erro o meacutetodo pode
encontrar um miacutenimo nuacutemero de operaccedilotildees local (MFLOPSL) associado com τL
como ilustrado na Figura 47 que natildeo necessariamente eacute o menor possiacutevel
(MFLOPSG) Observa-se que para obter o miacutenimo nuacutemero de operaccedilotildees global
(MFLOPSG) o procedimento de tentativa e erro deveria comeccedilar com um valor
de τ proacuteximo de τG
Figura 47 ndash Procedimento de tentativa e erro para busca de valores de um paracircmetro do preacute-condicionador
Quando o preacute-condicionador possui um segundo paracircmetro o procedimento de
tentativa e erro eacute repetido para este segundo paracircmetro fixando-se o primeiro
paracircmetro
48 Meacutetodo Proposto Para Ajuste dos Paracircmetros dos Solucio nadores
O meacutetodo proposto consiste em realizar sucessivas simulaccedilotildees de fluxo de
carga variando simultaneamente todos os paracircmetros do solucionador e
registrando o nuacutemero de operaccedilotildees de ponto flutuante para cada caso gerado O
objetivo eacute encontrar regiotildees de valores para os paracircmetros onde o solucionador
153
apresente alto desempenho permitindo estabelecer e recomendar faixas para os
valores dos paracircmetros onde o solucionador garante convergecircncia com a maior
eficiecircncia possiacutevel O meacutetodo tambeacutem permite identificar as faixas de valores
onde o solucionador natildeo converge
O meacutetodo eacute ilustrado para ajustar os paracircmetros de duas configuraccedilotildees de
solucionador iterativo sendo estas o solucionador proposto neste trabalho
identificado como GMRES+ILU(ξ)+MD e o solucionador GMRES+ILUT(τρ)+MD
apresentado no capiacutetulo 2 Na Tabela 43 especificam-se os paracircmetros
associados a cada solucionador
Tabela 43 ndash Paracircmetros usados nos solucionadores
Solucionadores Meacutetodo Iterativo Preacute-condicionador
GMRES+ILU(ξ)+MD atol rtol
ξ
GMRES+ILUT(τρ)+MD τ ρ
481 Passos Fundamentais
Esta seccedilatildeo apresenta de maneira sucinta os passos envolvidos no meacutetodo para
ajuste dos paracircmetros dos solucionadores onde uma descriccedilatildeo geral eacute
mostrada na Figura 48 O primeiro passo refere-se agrave definiccedilatildeo do espaccedilo de
busca onde satildeo procurados os valores para os paracircmetros que garantem alto
desempenho do solucionador O segundo refere-se aos experimentos numeacutericos
realizados para avaliar o desempenho do solucionador considerando-se todas as
combinaccedilotildees possiacuteveis dos valores de seus paracircmetros definidos no espaccedilo de
busca O passo seguinte tem como objetivo calcular as faixas de valores
recomendaacuteveis para as toleracircncias absoluta e relativa do GMRES Finalmente o
quarto passo calcula as faixas de valores recomendaacuteveis para os paracircmetros do
preacute-condicionador
154
Figura 48 ndash Passos fundamentais para delimitaccedilatildeo dos paracircmetros do solucionador
Nas proacuteximas seccedilotildees os passos mais relevantes no contexto deste trabalho satildeo
discutidos mais detalhadamente
482 Estabelecimento do Espaccedilo de Busca
Para definir o espaccedilo de busca primeiramente deve-se estabelecer o domiacutenio de
cada paracircmetro isto eacute um valor miacutenimo e maacuteximo para cada toleracircncia do
GMRES e para cada paracircmetro do preacute-condicionador como mostrado na Tabela
44 e na Figura 49 Depois devem ser definidos valores intermediaacuterios para cada
paracircmetro sendo que o nuacutemero de valores totais eacute definido em funccedilatildeo do grau
de precisatildeo que se deseja conseguir nos paracircmetros
Finalmente o espaccedilo de busca eacute definido por todas as combinaccedilotildees possiacuteveis
entre as toleracircncias absoluta e relativa do GMRES como apresentado na Figura
49(a) e por todas as combinaccedilotildees possiacuteveis realizadas entre os paracircmetros do
preacute-condicionador como mostrado na Figura 49(b-c)
Para os valores especificados na Tabela 44 existem (m x n) combinaccedilotildees
possiacuteveis entre a toleracircncia absoluta e relativa (ver Figura 49(a)) e (q x p)
combinaccedilotildees possiacuteveis entre os paracircmetros τ e ρ do preacute-condicionador ILUT(τρ)
(ver Figura 49(c)) No caso do preacute-condicionador ILU(ξ) natildeo existem
combinaccedilotildees jaacute que este preacute-condicionador possui somente um uacutenico
paracircmetro Poreacutem existem k valores possiacuteveis para ξ (ver Figura 49(b))
Estabelecer Espaccedilo de Busca
Experimentos numeacutericos
Delimitar paracircmetros do preacute-condicionador
Delimitar toleracircncias do GMRES
155
Tabela 44 ndash Domiacutenios dos paracircmetros usados nos solucionadores
Paracircmetros Maacuteximo Miacutenimo Nuacutemero total de valores
atol atol1 atoln n
rtol rtol1 rtolm m
ξ ξ1 ξk k
τ τ1 τq q
ρ ρ1 ρp P
a) Espaccedilo de busca das toleracircncias do GMRES
b) Espaccedilo de busca dos paracircmetros do preacute-condicionador ILUT(ξ)
c) Espaccedilo de busca dos paracircmetros do preacute-
condicionador ILUT(τρ)
Figura 49 ndash Espaccedilo de busca dos paracircmetros do solucionador
483 Experimentos Numeacutericos
No segundo passo para cada combinaccedilatildeo das toleracircncias absoluta e relativa
(atolrtol) do espaccedilo de busca da Figura 49(a) satildeo simulados tantos Fluxos de
Carga quanto combinaccedilotildees dos paracircmetros do preacute-condicionador existam
registrando-se o nuacutemero de operaccedilotildees de ponto flutuante (MFLOPS) para cada
156
combinaccedilatildeo dos paracircmetros do preacute-condicionador Portanto para cada
combinaccedilatildeo (atolrtol) eacute gerado um graacutefico de eficiecircncia computacional (em
MFLOPS) em funccedilatildeo dos paracircmetros do preacute-condicionador como mostrado na
Figura 410(a) para o preacute-condicionador ILUT(τρ) e na Figura 410(b) para o
preacute-condicionador ILU(ξ)
a) Graacutefico de eficiecircncia para o preacute-condicionador ILUT(τρ)
b) Graacutefico de eficiecircncia para o preacute-condicionador ILU(ξ)
Figura 410 ndash Graacuteficos de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
Para cada graacutefico gerado eacute registrado o nuacutemero de operaccedilotildees de ponto flutuante
miacutenimo (MFLOPSmiacuten) e este valor eacute associado agrave sua correspondente combinaccedilatildeo
(atolrtol) Apoacutes terem sido realizados todos os experimentos e registrados todos
os MFLOPSmiacuten associados a todas as combinaccedilotildees (atolrtol) eacute gerado o graacutefico
de alta eficiecircncia Este graacutefico apresenta em escala de cores todos MFLOPSmiacuten
em funccedilatildeo de suas correspondentes combinaccedilotildees (atolrtol) como mostrado na
Figura 411 sendo que a cor azul estaacute associada com os menores MFLOPSmiacuten a
157
cor vermelha com os maiores MFLOPSmiacuten e em negrito os casos natildeo
convergentes
Observa-se que entre todos os valores registrados para MFLOPSmiacuten existe uma
regiatildeo que conteacutem os casos com os menores MFLOPSmiacuten Este valor chamado
de MFLOPSoacuteti eacute o nuacutemero miacutenimo de operaccedilotildees possiacutevel (global) e estaacute
associado com a regiatildeo quadrada em azul escuro segmentada pelas linhas
brancas Os pontos brancos indicam as posiccedilotildees de todas as combinaccedilotildees que
possuem nuacutemero de operaccedilotildees igual a MFLOPSoacuteti
Figura 411 ndash Graacuteficos de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
484 Delimitaccedilatildeo das Toleracircncias do GMRES
No terceiro passo a partir do graacutefico de alta eficiecircncia apresentado na sua forma
bidimensional na Figura 412 eacute segmentada a regiatildeo dos MFLOPSoacuteti Neste
caso esta regiatildeo eacute o quadrado azul do centro do graacutefico onde cada ponto
branco estaacute associado a uma combinaccedilatildeo (atolrtol) que apresenta o menor
nuacutemero de operaccedilotildees possiacutevel em todo o espaccedilo de busca (MFLOPSoacuteti) Este
graacutefico permite encontrar as faixas de valores (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do meacutetodo GMRES associadas ao melhor
desempenho possiacutevel
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
138
137
43 Solucionador Iterativo Para Fluxo de Carga
O solucionador desenvolvido eacute composto basicamente pelo meacutetodo iterativo de
subespaccedilos de Krylov GMRES (vide Capiacutetulo 2) e pela estrateacutegia de preacute-
condicionamento de fatoraccedilatildeo incompleta ILU(ξ) com suporte da teacutecnica de
reordenamento Miacutenimo Grau (MD) A estrateacutegia de reinicializaccedilatildeo GMRES(m)
(apresentada em 26) usada para limitar o tamanho dos subespaccedilos de Krylov a
um valor maacuteximo ―m natildeo faz parte do solucionador uma vez que a estrateacutegia
de preacute-condicionamento forccedila a convergecircncia do GMRES em poucas iteraccedilotildees
lineares (uma ou duas iteraccedilotildees) Portanto jaacute que poucas iteraccedilotildees estatildeo
associadas a subespaccedilos pequenos entatildeo natildeo eacute necessaacuterio estabelecer um
valor maacuteximo ―m
Nesta tese adota-se a teacutecnica de reordenamento MD porque a mesma acarreta
a reduccedilatildeo significativa do nuacutemero de novos elementos natildeo-nulos gerados
reduzindo o esforccedilo computacional realizado para construir e usar o preacute-
condicionador Alem disso este tipo de reordenamento aumenta a taxa de
convergecircncia do meacutetodo iterativo GMRES O solucionador eacute denominado de
GMRES+ILU(ξ)+MD e foi implementado em um programa computacional de
fluxo de carga desenvolvido em linguagem Fortran da forma apresentada no
fluxograma da Figura 41 Seus componentes estatildeo destacados na cor vermelha
numerados por algarismos romanos na mesma ordem em que satildeo aplicados
Observa-se que antes de iniciadas as iteraccedilotildees Newton-Raphson eacute calculada a
sequumlecircncia de reordenamento usando-se a teacutecnica MD matematicamente
representada pela matriz de permutaccedilotildees P Na praacutetica eacute gerado um vetor com
a sequumlecircncia de reordenamento que permitiraacute montar a matriz Jacobiana jaacute
reordenada em cada iteraccedilatildeo k do algoritmo Newton-Raphson Esse vetor
tambeacutem eacute usado para reordenar os resiacuteduos de potecircncia ativa e reativa
armazenados no vetor bk Cada vez que o teste de convergecircncia do algoritmo
Newton-Raphson natildeo for satisfeito uma nova matriz Jacobiana reordenada eacute
montada A partir das informaccedilotildees da matriz Jacobiana reordenada a estrateacutegia
de preacute-condicionamento ILU(ξ) constroacutei um preacute-condicionador Mk que em
seguida seraacute usado para obter explicitamente o novo sistema linear preacute-
condicionado (41) a ser solucionado pelo meacutetodo iterativo GMRES Finalmente
139
137
as incoacutegnitas satildeo atualizadas em (42) O procedimento eacute repetido ateacute que o
teste de convergecircncia do algoritmo Newton-Raphson seja satisfeito
1 T 1k k kM P J P x M P b (41)
T
k 1 k
v vP x
(42)
Figura 41 ndash Fluxograma do Solucionador Iterativo para o problema de fluxo de carga
O programa de fluxo de carga modela as barras de acordo como seu tipo (PQ
PV e de referecircncia) as linhas de transmissatildeo transformadores e
140
137
transformadores defasadores satildeo representados pelos seus circuitos ᴨ
equivalentes Os tapes variaacuteveis sob carga podem ainda ter a atuaccedilatildeo contiacutenua
ou discreta As cargas das barras satildeo normalmente modeladas como potecircncias
ativa e reativa constantes ou podem ser expressas como uma funccedilatildeo da
magnitude da tensatildeo da barra Natildeo satildeo modelados elos de corrente contiacutenua
No algoritmo de fluxo de carga consideram-se o controle de variaccedilatildeo automaacutetica
de tape e os limites de geraccedilatildeo de potecircncia reativa
44 Regra de Preenchimento Baseada no Caacutelculo do Erro Associado ao Elemento Descartado
Uma forma simples de estimar o erro total R originado pelos elementos
descartados devido agraves regras de preenchimento da fatoraccedilatildeo incompleta eacute
usando-se (310) (Mori et al 1996 Saad 2003) Nesta equaccedilatildeo o produto dos
fatores triangulares incompletos eacute igual ao preacute-condicionador M e o produto dos
fatores triangulares completos eacute igual agrave matriz de coeficientes A como mostrado
em (311) Desta forma o erro R permite vislumbrar quatildeo diferente se tornou
o preacute-condicionador em relaccedilatildeo aos fatores triangulares completos apoacutes o
descarte de seus elementos
Um preacute-condicionador sem regra de preenchimento efetua completamente o
caacutelculo dos fatores triangulares Neste caso o preacute-condicionador M se iguala agrave
matriz de coeficientes (M = L∙U = A) o que resulta na convergecircncia do meacutetodo
GMRES em uma uacutenica iteraccedilatildeo com erro R nulo Poreacutem o nuacutemero de
operaccedilotildees de ponto flutuante ainda eacute consideraacutevel Para se obter esta reduccedilatildeo eacute
necessaacuterio usar uma regra de preenchimento que descarte o maior nuacutemero de
elementos nos fatores triangulares e sem que isso provoque o aumento do erro
R consequumlentemente afetando o desempenho do GMRES
R A M (43)
R L U L U (44)
Como exemplo na Figura 36 satildeo apresentados dois graacuteficos que ilustram como
os erros produzidos pelo descarte dos fatores triangulares natildeo-nulos podem se
alastrar ateacute em posiccedilotildees de elementos jaacute preenchidos O experimento foi
141
137
apresentado na seccedilatildeo 332 do capiacutetulo anterior para o sistema brasileiro de
3513 barras usando-se o preacute-condicionador ILU(0) para o caacutelculo dos fatores
incompletos No graacutefico da Figura 36(a) mostra-se que 8797 dos elementos
do preacute-condicionador M (83078) satildeo distintos dos encontrados na matriz
Jacobiana O graacutefico do erro em 42(b) permite se ter uma ideacuteia da dimensatildeo
destas diferenccedilas Dos 38738 elementos com erros entre 0 e 001 (pontos
azuis) 11360 tecircm erro igual a zero (elementos idecircnticos) e 27378 tecircm erros
menores que 001 Os erros nesta faixa de valores normalmente natildeo prejudicam
a convergecircncia do GMRES
As outras faixas de valores associadas aos pontos de cores verde amarelo e
vermelho normalmente prejudicam a convergecircncia do GMRES Esses erros
devem ser evitados e satildeo gerados quando alguns elementos importantes satildeo
descartados durante a fatoraccedilatildeo ILU(0) O maior erro provocado entre os
elementos de M e da Jacobiana eacute de 401931 e o erro total para este preacute-
condicionador eacute de 10632middot105 (norma de Frobenius) Para evitar que os erros
se propaguem enquanto eacute realizada a fatoraccedilatildeo eacute necessaacuterio calcular o erro
associado a cada elemento dos fatores triangulares antes de seu preenchimento
ou descarte Este erro deve tambeacutem considerar os erros propagados nos
caacutelculos futuros onde o elemento seja requerido Se este valor for zero ou
proacuteximo de zero entatildeo o elemento pode ser descartado caso contraacuterio deve ser
preenchido
a) Produto dos fatores incompletos (LrsquoUrsquo) do preacute-condicionador ILU(0)
b) Matriz R para o preacute-condicionador ILU(0)
Figura 42 ndash Erros produzidos pela regra de preenchimento com o preacute-condicionador ILU(0) para a matriz Jacobiana do sistema brasileiro de 3513 barras
142
Sejam L e U os fatores triangulares completos Lrsquo e Ursquo os fatores triangulares
incompletos apoacutes o descarte de um uacutenico elemento Lik o elemento descartado
em Lrsquo e Uki o elemento descartado em Ursquo (Lik = 0 ou Uki = 0) Usando a equaccedilatildeo
(311) (Mori et al 1996 Saad 2003 Benzi et al 1999b Benzi 2002) eacute possiacutevel
calcular o erro associado ao elemento Lik (45) e o erro associado ao elemento
Uki (46) Como mencionado anteriormente esses erros permitem ter uma ideacuteia
de quatildeo diferente se torna o preacute-condicionador M dos fatores triangulares
completos apoacutes os elementos Lik e Uki serem descartados Como os erros estatildeo
associados a um uacutenico elemento descartado as equaccedilotildees (45) e (46) podem
ser reescritas como em (47) e (48) respectivamente
R = L U - L Usdot sdot (45)
R = L U - L Usdot sdot (46)
)ik(LR = (L -L) Usdot (47)
)ik(UR = L (U-U)sdot (48)
Verifica-se que tanto a matriz diferenccedila (L-Lrsquo) como tambeacutem (U-Ursquo) possuem
apenas um elemento natildeo nulo Lik (descartado em Lrsquo) e Uki (descartado em Ursquo)
respectivamente como apresentado em (49) e (410)
ik
0
0 0
0 0 0
0 0 0 0
L L =
0 0 0 0 0
0 0 L 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
( - )
⋮ ⋱
⋯
⋯
⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱
⋯ ⋯ ⋯
(49)
143
ki
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 U 0 0
0 0 0 0 0
(U - U) =
0 0 0 0
0 0 0
0 0
0
⋯ ⋯ ⋯
⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯
⋯
⋯
⋱ ⋮
(410)
Pela substituiccedilatildeo de (49) e (410) nos produtos (L-Lrsquo)middotU como Lmiddot(U-Ursquo) resulta
em (411) e (412)
ik kk ik kk+1 ik ki ik kn
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
L - L) U =
0 0 0 0 0 0
0 0 L U L U L U L U
0 0 0 0 0 0
0 0 0 0 0 0
(
sdot
sdot sdot sdot sdot
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(411)
ki
k+1k ki
ik ki
nk ki
0 0 0 0 0
0 0 0 0 0
0 0 U 0 0
L (U - U) = 0 0 L U 0 0
0 0 L U 0 0
0 0 L U 0 0
sdot sdot
sdot
sdot
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
(412)
Conforme mencionado no capiacutetulo anterior uma das dificuldades para propor
uma regra de preenchimento estaacute em se reduzir o nuacutemero de operaccedilotildees
associadas com sua execuccedilatildeo dentro do algoritmo de preacute-condicionamento
144
Neste trabalho propotildee-se usar a norma-1 em (47) para o caacutelculo do erro
associado a um elemento de L e a norma-infin em (48) para o caacutelculo do erro
associado a um dado elemento de U como apresentado em (413) e (414) As
referidas normas aproveitam a estrutura das matrizes (411) e (412) evitando-se
a realizaccedilatildeo de operaccedilotildees adicionais sendo requeridas ao inveacutes disto apenas
comparaccedilotildees entre elementos Portanto substituindo (411) em (413) e (412)
em (414) e calculando-se as normas satildeo obtidas as equaccedilotildees (415) e (416)
que devem ser usadas na regra de preenchimento
)1ik(LR = (L -L) Usdot (413)
ki(U )R = L (U-U) infinsdot (414)
ik ik km(L )R = L max U m = [kn]sdot (415)
ki ki mk(U )R U max 1 L m=[k+1n]= sdot (416)
Na Figura 43 satildeo destacados em vermelho todos os elementos dos fatores
triangulares que satildeo requeridos para calcular o erro produzido quando o
elemento Lik (no quadrado) eacute descartado Jaacute na Figura 44 satildeo destacados em
azul todos os elementos necessaacuterios para calcular o erro produzido quando o
elemento Uki (encerrado no quadrado) eacute descartado Observa-se que para que
esta regra possa ser implementada tanto no fator triangular U como em L o
algoritmo de fatoraccedilatildeo deve ser capaz de calcular os elementos Ukk Ukk+1
Ukn (em vermelho) antes de decidir se o elemento Lik deve ser preenchido ou
descartado Semelhantemente deve ser capaz de calcular os elementos Lk+1k
Lnk (em azul) antes de decidir se o elemento Uki deve ser preenchido ou
descartado
145
Figura 43 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Lik
Figura 44 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Uki
45 Adequaccedilatildeo da Regra Baseada no Erro
Nesta seccedilatildeo a regra de preenchimento baseada no erro eacute adequada para ser
usada no preacute-condicionador ILUT(τρ) analisado no capiacutetulo anterior O preacute-
condicionador resultante seraacute chamado de preacute-condicionador de duplo
paracircmetro limitante ILUT(ξτ) Neste preacute-condicionador natildeo eacute mais necessaacuterio
usar o paracircmetro ρ
Conforme visto no Capiacutetulo 3 o algoritmo de fatoraccedilatildeo usado neste preacute-
condicionador eacute o IKJ e deriva da eliminaccedilatildeo de Gauss (Saad 2003) Este tipo
de algoritmo permite calcular os elementos Ukk Ukk+1 Ukn antes de decidir se
o elemento Lik deve ser preenchido ou descartado Poreacutem o algoritmo IKJ natildeo
permite calcular os elementos Lk+1k Lnk antes de decidir se o elemento Uki
deve ser preenchido ou descartado porque no mesmo os elementos de L e U
146
satildeo calculados por linhas uma de cada vez Portanto a regra baseada no erro
pode ser aplicada apenas nos elementos do fator L enquanto que uma variante
da regra convencional usada no ILUT(τρ) eacute usada para os elementos de U
O caacutelculo da norma-2 usada na regra de preenchimento convencional dada pela
raiz quadrada da soma dos quadrados dos elementos da linha pode exigir
consideraacutevel esforccedilo computacional dependendo da dimensatildeo da matriz de
coeficientes Portanto ao inveacutes de se usar esta norma para descartar os
elementos em U recomenda-se realizar a meacutedia aritmeacutetica dos elementos da i-
eacutesima linha da matriz de coeficientes original Este procedimento reduz o nuacutemero
de operaccedilotildees de ponto flutuante sem comprometer a qualidade do preacute-
condicionador No entanto a eficiecircncia de ambas as heuriacutesticas eacute inferior agrave da
regra baseada no erro para preenchimento dos elementos proposta no presente
trabalho O resultado eacute um preacute-condicionador que aplica dois criteacuterios para
definir sua regra de preenchimento da seguinte forma
De acordo com a relaccedilatildeo dada por (417) um elemento Lik eacute descartado se o
erro resultante for menor que a toleracircncia ξ usada para todas as linhas de L
Caso contraacuterio calcula-se Lik usando-se o elemento aik da matriz resultante do
processo de eliminaccedilatildeo de Gauss ateacute a correspondente etapa Jaacute para um
elemento Uik este eacute descartado se for menor que uma certa toleracircncia relativa
τi obtida multiplicando-se a toleracircncia absoluta τ pela meacutedia aritmeacutetica dos
elementos da i-eacutesima linha da matriz de coeficientes original O caacutelculo de w eacute
efetuado de acordo com o algoritmo de fatoraccedilatildeo IKJ apresentado no capiacutetulo
anterior
ik
ikik
(L )
ik (L )k=(1i-1)
kk
0 R= aL
RU
lt ξ ge ξ
(417)
ik
k i
k k ik=(i+1n)
0 w =U
w w
lt ge
ττ
(418)
A adaptaccedilatildeo da regra baseada no erro no preacute-condicionador ILUT(τρ) falha
devido ao fato do algoritmo de fatoraccedilatildeo IKJ natildeo permitir a aplicaccedilatildeo da regra
147
em ambos os fatores triangulares L e U dificultando a exploraccedilatildeo das vantagens
do uso desta regra A seguir mostra-se uma proposta para superar estes
problemas utilizando-se outro algoritmo de fatoraccedilatildeo que permite aplicar a regra
em ambos os fatores triangulares
46 Preacute-condicionador ILU( ξ) Baseado no Caacutelculo do Erro
Nesta seccedilatildeo propotildee-se uma eficiente e robusta estrateacutegia de preacute-
condicionamento da fatoraccedilatildeo incompleta ILU(ξ) derivada de uma versatildeo do
algoritmo de eliminaccedilatildeo de Gauss conhecido como Doolittle A maior vantagem
deste algoritmo eacute que permite usar de forma efetiva a regra de preenchimento
baseada no erro em ambos os fatores triangulares L e U
Os fatores L e U satildeo apresentados em (419) e (420) Os elementos da diagonal
de L satildeo iguais a um e a primeira linha de U eacute igual agrave primeira linha da matriz de
coeficientes A As equaccedilotildees usadas pelo algoritmo de Doolittle para calcular os
elementos dos fatores triangulares satildeo apresentadas em (422) e podem ser
obtidas ao se igualar cada elemento do produto dos fatores triangulares LmiddotU de
(419) e (420) aos elementos da matriz de coeficientes A apresentada em (421)
Estas equaccedilotildees podem ser implementadas computacionalmente de diferentes
formas todas baseadas na eliminaccedilatildeo de Gauss Teoricamente os diferentes
tipos de eliminaccedilatildeo de Gauss realizam o mesmo nuacutemero de operaccedilotildees de ponto
flutuante No entanto no contexto da fatoraccedilatildeo incompleta estas variantes
resultam em importantes diferenccedilas praacuteticas quando o interesse eacute utilizar a regra
de preenchimento baseada no erro
k-11
k1 kk 1
i1 ik 1 ik
n1 nk 1 nk ni
1 0 0 0 0
L 1 0 0 0
L L 1 0 0L
L L L 1 0
L L L L 1
minus
minus
minus
=
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(419)
148
11 1k 1 1k 1i 1n
k-1k-1 k-1k k-1i k-1n
kk ki kn
ii in
nn
U U U U U
0 U U U U
0 0 U U UU
0 0 0 U U
0 0 0 0 U
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(420)
11 1k 1 1k 1i 1n
k-11 k-1k-1 k-1k k-1i k-1n
k1 kk-1 kk ki kn
i1 ik-1 ik ii in
n1 nk-1 nk ni nn
a a a a a
a a a a a
a a a a aA
a a a a a
a a a a a
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(421)
k-1
ki ki kj jij=1
k-1
ik ij jkj=1
ikkk
U =a - [L U ] i=kn
a - [L U ]
L = i=k+1nU
sum
sum (422)
As equaccedilotildees de Doolittle podem gerar algoritmos de eliminaccedilatildeo de Gauss que
calculam os elementos dos fatores triangulares por linhas de forma similar agrave
fatoraccedilatildeo IKJ ou por colunas (Bodewig 1956 Wilkinson 1965 Dahlquist amp
Bjoumlrk 1974 Hoffman 2001) Em ambos algoritmos natildeo seria possiacutevel usar a
regra de preenchimento baseada no erro A partir de (422) propotildee-se usar o
algoritmo de eliminaccedilatildeo de Gauss apresentado na Figura 45 que permite
calcular os elementos dos fatores triangulares simultaneamente por linhas em U
e por colunas em L como mostrado na Figura 46
No passo k da eliminaccedilatildeo de Gauss os elementos da k-eacutesima linha de U e a k-
eacutesima coluna de L (identificados por linhas tracejadas) satildeo calculados utilizando
elementos jaacute computados anteriormente nas linhas e colunas de U e L Por
exemplo para se calcular o elemento Uki satildeo usados os elementos destacados
em azul enquanto que para calcular o elemento Lik satildeo usados os elementos
149
destacados em vermelho Observa-se que este algoritmo permite calcular
elementos de L em linhas posteriores agrave linha k Esta caracteriacutestica possibilita o
uso em U da regra de preenchimento baseada no erro
1 Para i = 1n Faccedila
2 min = Ji in
3 Para k = in Faccedila
4 Para j = 1i-1 Faccedila
5 mk = mk - LijmiddotUjk
6 Fim ndash Faccedila
7 Fim ndash Faccedila
8 Registrar Umax = maxmin
9 ni+1n = J i+1ni
10 Para k = i+1n Faccedila
11 Para j = 1i-1 Faccedila
12 nk = nk ndash LkjmiddotUji
13 Fim ndash Faccedila
14 Fim ndash Faccedila
15 n = nUii
16 Registrar Lmax = maxni+1n
17 Aplicar a regra de preenchimento baseada no erro em m e n
18 Ui in = m in
19 L i+1ni = n i+1n
20 Fim ndash Faccedila
Figura 45 ndash Algoritmo do preacute-condicionador ILU(ξ)
Figura 46 ndash Elementos necessaacuterios para calcular os elementos Lik e Uki durante a fatoraccedilatildeo triangular
150
No algoritmo da Figura 45 observa-se que no passo k os elementos da linha de
U satildeo armazenados no vetor m enquanto que os elementos da coluna de L satildeo
armazenados no vetor n (passos 5 e 12 respectivamente) Uma vez calculados
ambos os vetores procura-se o maior elemento de m sendo armazenado em
Umax e o maior elemento de n armazenado em Lmax (passos 8 e 16
respectivamente) Ambos os valores maacuteximos (em valores absolutos) satildeo
usados pela regra de preenchimento no passo 17 para descartar em m e n os
elementos associados com os menores erros e preencher a linha de U e a
coluna de L da seguinte forma
De acordo com as relaccedilotildees dadas por (423) e (424) tanto um elemento Lki
como tambeacutem um elemento Uik satildeo descartados se seus erros associados
foram menores que uma dada toleracircncia ξ usada para todas as colunas de L e
linhas de U Caso contraacuterio Lki eacute preenchido usando-se o valor armazenado
em nk e Uik eacute preenchido usando-se o valor armazenado em mk
ik
ikik
(U )
(U )kk=(in)
0 R =U
m R
lt ξ ge ξ
(423)
ik
ikki
(L )
(L )ki=(1+1n)
0 R=L
n R
lt ξ ge ξ
(424)
Como observado na Figura 46 o algoritmo da Figura 45 permite encontrar os
elementos Ukk Ukk+1 Ukn necessaacuterios para se calcular o erro associado ao
elemento Lki e os elementos Lk+1k Lnk que por sua vez satildeo necessaacuterios para
se calcular o erro associado ao elemento Uik Nota-se que os elementos
necessaacuterios para calcular o erro (passo k) satildeo calculados neste mesmo passo
portanto natildeo eacute necessaacuterio realizar grandes buscas de elementos nas matrizes L
e U Igualmente tambeacutem natildeo eacute necessaacuterio armazenar valores Umax Lmax ou
erros do passo k porque natildeo seratildeo mais necessaacuterios nos proacuteximos passos
Observe-se que natildeo eacute necessaacuterio multiplicar o paracircmetro ξ por alguma norma ou
meacutedia aritmeacutetica dos elementos da matriz de coeficientes como realizado no
preacute-condicionador ILUT(τρ) porque o erro independe dos valores dos elementos
151
da matriz de coeficientes Este preacute-condicionador usa apenas um uacutenico
paracircmetro ξ Esta caracteriacutestica facilita o ajuste dos paracircmetros do solucionador
como seraacute visto nas proacuteximas seccedilotildees e no proacuteximo capiacutetulo
47 Meacutetodo Convencional Para Ajuste dos Paracircmetros dos Solucionadores
O ajuste dos paracircmetros de um solucionador iterativo eacute considerado fundamental
para garantir sua robustez e eficiecircncia computacional principalmente em
anaacutelises mais complexas como aquelas que solucionam vaacuterios fluxos de carga
com diferentes pontos de operaccedilatildeo Nesses casos a escolha de valores
apropriados para os paracircmetros se torna ainda mais relevante
A ideacuteia fundamental eacute escolher os valores dos paracircmetros que permitam
preencher o menor nuacutemero de elementos sem prejudicar a qualidade do preacute-
condicionador isto eacute sem tornaacute-lo muito diferente de A Poreacutem a escolha de
valores apropriados para os paracircmetros eacute uma tarefa difiacutecil jaacute que existe uma
interdependecircncia com as toleracircncias relativa e absoluta do GMRES e com o tipo
de problema que estaacute sendo solucionado
Pouco tem sido pesquisado em relaccedilatildeo a este tema apenas em (de Leon amp
Semlyen 2002) apresenta-se uma foacutermula que permite calcular para cada
sistema eleacutetrico o valor do paracircmetro limitante τ no preacute-condicionador ILU(τ)
dado por (322) onde τ eacute igual agrave metade do nuacutemero de equaccedilotildees totais Neq do
sistema linear Na praacutetica estaacute foacutermula natildeo garante robustez nem o melhor
desempenho do solucionador
eq
12 N
τ =sdot
(425)
No entanto o procedimento convencional define primeiro valores arbitraacuterios para
as duas toleracircncias absoluta e relativa do GMRES Nas simulaccedilotildees realizadas
nos capiacutetulos anteriores se usou toleracircncias iguais (10-5) e menores que a
toleracircncia usada no teste de convergecircncia do algoritmo Newton-Raphson pois
toleracircncias maiores costumam impedir a convergecircncia do Newton-Raphson
152
Uma vez definidas as toleracircncias a escolha dos paracircmetros do preacute-
condicionador eacute realizada com base em tentativa e erro
Este meacutetodo natildeo considera a possibilidade de encontrar melhores desempenhos
para outras toleracircncias do GMRES que natildeo necessariamente devem ser
consideradas iguais Durante o procedimento de tentativa e erro o meacutetodo pode
encontrar um miacutenimo nuacutemero de operaccedilotildees local (MFLOPSL) associado com τL
como ilustrado na Figura 47 que natildeo necessariamente eacute o menor possiacutevel
(MFLOPSG) Observa-se que para obter o miacutenimo nuacutemero de operaccedilotildees global
(MFLOPSG) o procedimento de tentativa e erro deveria comeccedilar com um valor
de τ proacuteximo de τG
Figura 47 ndash Procedimento de tentativa e erro para busca de valores de um paracircmetro do preacute-condicionador
Quando o preacute-condicionador possui um segundo paracircmetro o procedimento de
tentativa e erro eacute repetido para este segundo paracircmetro fixando-se o primeiro
paracircmetro
48 Meacutetodo Proposto Para Ajuste dos Paracircmetros dos Solucio nadores
O meacutetodo proposto consiste em realizar sucessivas simulaccedilotildees de fluxo de
carga variando simultaneamente todos os paracircmetros do solucionador e
registrando o nuacutemero de operaccedilotildees de ponto flutuante para cada caso gerado O
objetivo eacute encontrar regiotildees de valores para os paracircmetros onde o solucionador
153
apresente alto desempenho permitindo estabelecer e recomendar faixas para os
valores dos paracircmetros onde o solucionador garante convergecircncia com a maior
eficiecircncia possiacutevel O meacutetodo tambeacutem permite identificar as faixas de valores
onde o solucionador natildeo converge
O meacutetodo eacute ilustrado para ajustar os paracircmetros de duas configuraccedilotildees de
solucionador iterativo sendo estas o solucionador proposto neste trabalho
identificado como GMRES+ILU(ξ)+MD e o solucionador GMRES+ILUT(τρ)+MD
apresentado no capiacutetulo 2 Na Tabela 43 especificam-se os paracircmetros
associados a cada solucionador
Tabela 43 ndash Paracircmetros usados nos solucionadores
Solucionadores Meacutetodo Iterativo Preacute-condicionador
GMRES+ILU(ξ)+MD atol rtol
ξ
GMRES+ILUT(τρ)+MD τ ρ
481 Passos Fundamentais
Esta seccedilatildeo apresenta de maneira sucinta os passos envolvidos no meacutetodo para
ajuste dos paracircmetros dos solucionadores onde uma descriccedilatildeo geral eacute
mostrada na Figura 48 O primeiro passo refere-se agrave definiccedilatildeo do espaccedilo de
busca onde satildeo procurados os valores para os paracircmetros que garantem alto
desempenho do solucionador O segundo refere-se aos experimentos numeacutericos
realizados para avaliar o desempenho do solucionador considerando-se todas as
combinaccedilotildees possiacuteveis dos valores de seus paracircmetros definidos no espaccedilo de
busca O passo seguinte tem como objetivo calcular as faixas de valores
recomendaacuteveis para as toleracircncias absoluta e relativa do GMRES Finalmente o
quarto passo calcula as faixas de valores recomendaacuteveis para os paracircmetros do
preacute-condicionador
154
Figura 48 ndash Passos fundamentais para delimitaccedilatildeo dos paracircmetros do solucionador
Nas proacuteximas seccedilotildees os passos mais relevantes no contexto deste trabalho satildeo
discutidos mais detalhadamente
482 Estabelecimento do Espaccedilo de Busca
Para definir o espaccedilo de busca primeiramente deve-se estabelecer o domiacutenio de
cada paracircmetro isto eacute um valor miacutenimo e maacuteximo para cada toleracircncia do
GMRES e para cada paracircmetro do preacute-condicionador como mostrado na Tabela
44 e na Figura 49 Depois devem ser definidos valores intermediaacuterios para cada
paracircmetro sendo que o nuacutemero de valores totais eacute definido em funccedilatildeo do grau
de precisatildeo que se deseja conseguir nos paracircmetros
Finalmente o espaccedilo de busca eacute definido por todas as combinaccedilotildees possiacuteveis
entre as toleracircncias absoluta e relativa do GMRES como apresentado na Figura
49(a) e por todas as combinaccedilotildees possiacuteveis realizadas entre os paracircmetros do
preacute-condicionador como mostrado na Figura 49(b-c)
Para os valores especificados na Tabela 44 existem (m x n) combinaccedilotildees
possiacuteveis entre a toleracircncia absoluta e relativa (ver Figura 49(a)) e (q x p)
combinaccedilotildees possiacuteveis entre os paracircmetros τ e ρ do preacute-condicionador ILUT(τρ)
(ver Figura 49(c)) No caso do preacute-condicionador ILU(ξ) natildeo existem
combinaccedilotildees jaacute que este preacute-condicionador possui somente um uacutenico
paracircmetro Poreacutem existem k valores possiacuteveis para ξ (ver Figura 49(b))
Estabelecer Espaccedilo de Busca
Experimentos numeacutericos
Delimitar paracircmetros do preacute-condicionador
Delimitar toleracircncias do GMRES
155
Tabela 44 ndash Domiacutenios dos paracircmetros usados nos solucionadores
Paracircmetros Maacuteximo Miacutenimo Nuacutemero total de valores
atol atol1 atoln n
rtol rtol1 rtolm m
ξ ξ1 ξk k
τ τ1 τq q
ρ ρ1 ρp P
a) Espaccedilo de busca das toleracircncias do GMRES
b) Espaccedilo de busca dos paracircmetros do preacute-condicionador ILUT(ξ)
c) Espaccedilo de busca dos paracircmetros do preacute-
condicionador ILUT(τρ)
Figura 49 ndash Espaccedilo de busca dos paracircmetros do solucionador
483 Experimentos Numeacutericos
No segundo passo para cada combinaccedilatildeo das toleracircncias absoluta e relativa
(atolrtol) do espaccedilo de busca da Figura 49(a) satildeo simulados tantos Fluxos de
Carga quanto combinaccedilotildees dos paracircmetros do preacute-condicionador existam
registrando-se o nuacutemero de operaccedilotildees de ponto flutuante (MFLOPS) para cada
156
combinaccedilatildeo dos paracircmetros do preacute-condicionador Portanto para cada
combinaccedilatildeo (atolrtol) eacute gerado um graacutefico de eficiecircncia computacional (em
MFLOPS) em funccedilatildeo dos paracircmetros do preacute-condicionador como mostrado na
Figura 410(a) para o preacute-condicionador ILUT(τρ) e na Figura 410(b) para o
preacute-condicionador ILU(ξ)
a) Graacutefico de eficiecircncia para o preacute-condicionador ILUT(τρ)
b) Graacutefico de eficiecircncia para o preacute-condicionador ILU(ξ)
Figura 410 ndash Graacuteficos de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
Para cada graacutefico gerado eacute registrado o nuacutemero de operaccedilotildees de ponto flutuante
miacutenimo (MFLOPSmiacuten) e este valor eacute associado agrave sua correspondente combinaccedilatildeo
(atolrtol) Apoacutes terem sido realizados todos os experimentos e registrados todos
os MFLOPSmiacuten associados a todas as combinaccedilotildees (atolrtol) eacute gerado o graacutefico
de alta eficiecircncia Este graacutefico apresenta em escala de cores todos MFLOPSmiacuten
em funccedilatildeo de suas correspondentes combinaccedilotildees (atolrtol) como mostrado na
Figura 411 sendo que a cor azul estaacute associada com os menores MFLOPSmiacuten a
157
cor vermelha com os maiores MFLOPSmiacuten e em negrito os casos natildeo
convergentes
Observa-se que entre todos os valores registrados para MFLOPSmiacuten existe uma
regiatildeo que conteacutem os casos com os menores MFLOPSmiacuten Este valor chamado
de MFLOPSoacuteti eacute o nuacutemero miacutenimo de operaccedilotildees possiacutevel (global) e estaacute
associado com a regiatildeo quadrada em azul escuro segmentada pelas linhas
brancas Os pontos brancos indicam as posiccedilotildees de todas as combinaccedilotildees que
possuem nuacutemero de operaccedilotildees igual a MFLOPSoacuteti
Figura 411 ndash Graacuteficos de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
484 Delimitaccedilatildeo das Toleracircncias do GMRES
No terceiro passo a partir do graacutefico de alta eficiecircncia apresentado na sua forma
bidimensional na Figura 412 eacute segmentada a regiatildeo dos MFLOPSoacuteti Neste
caso esta regiatildeo eacute o quadrado azul do centro do graacutefico onde cada ponto
branco estaacute associado a uma combinaccedilatildeo (atolrtol) que apresenta o menor
nuacutemero de operaccedilotildees possiacutevel em todo o espaccedilo de busca (MFLOPSoacuteti) Este
graacutefico permite encontrar as faixas de valores (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do meacutetodo GMRES associadas ao melhor
desempenho possiacutevel
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
139
137
as incoacutegnitas satildeo atualizadas em (42) O procedimento eacute repetido ateacute que o
teste de convergecircncia do algoritmo Newton-Raphson seja satisfeito
1 T 1k k kM P J P x M P b (41)
T
k 1 k
v vP x
(42)
Figura 41 ndash Fluxograma do Solucionador Iterativo para o problema de fluxo de carga
O programa de fluxo de carga modela as barras de acordo como seu tipo (PQ
PV e de referecircncia) as linhas de transmissatildeo transformadores e
140
137
transformadores defasadores satildeo representados pelos seus circuitos ᴨ
equivalentes Os tapes variaacuteveis sob carga podem ainda ter a atuaccedilatildeo contiacutenua
ou discreta As cargas das barras satildeo normalmente modeladas como potecircncias
ativa e reativa constantes ou podem ser expressas como uma funccedilatildeo da
magnitude da tensatildeo da barra Natildeo satildeo modelados elos de corrente contiacutenua
No algoritmo de fluxo de carga consideram-se o controle de variaccedilatildeo automaacutetica
de tape e os limites de geraccedilatildeo de potecircncia reativa
44 Regra de Preenchimento Baseada no Caacutelculo do Erro Associado ao Elemento Descartado
Uma forma simples de estimar o erro total R originado pelos elementos
descartados devido agraves regras de preenchimento da fatoraccedilatildeo incompleta eacute
usando-se (310) (Mori et al 1996 Saad 2003) Nesta equaccedilatildeo o produto dos
fatores triangulares incompletos eacute igual ao preacute-condicionador M e o produto dos
fatores triangulares completos eacute igual agrave matriz de coeficientes A como mostrado
em (311) Desta forma o erro R permite vislumbrar quatildeo diferente se tornou
o preacute-condicionador em relaccedilatildeo aos fatores triangulares completos apoacutes o
descarte de seus elementos
Um preacute-condicionador sem regra de preenchimento efetua completamente o
caacutelculo dos fatores triangulares Neste caso o preacute-condicionador M se iguala agrave
matriz de coeficientes (M = L∙U = A) o que resulta na convergecircncia do meacutetodo
GMRES em uma uacutenica iteraccedilatildeo com erro R nulo Poreacutem o nuacutemero de
operaccedilotildees de ponto flutuante ainda eacute consideraacutevel Para se obter esta reduccedilatildeo eacute
necessaacuterio usar uma regra de preenchimento que descarte o maior nuacutemero de
elementos nos fatores triangulares e sem que isso provoque o aumento do erro
R consequumlentemente afetando o desempenho do GMRES
R A M (43)
R L U L U (44)
Como exemplo na Figura 36 satildeo apresentados dois graacuteficos que ilustram como
os erros produzidos pelo descarte dos fatores triangulares natildeo-nulos podem se
alastrar ateacute em posiccedilotildees de elementos jaacute preenchidos O experimento foi
141
137
apresentado na seccedilatildeo 332 do capiacutetulo anterior para o sistema brasileiro de
3513 barras usando-se o preacute-condicionador ILU(0) para o caacutelculo dos fatores
incompletos No graacutefico da Figura 36(a) mostra-se que 8797 dos elementos
do preacute-condicionador M (83078) satildeo distintos dos encontrados na matriz
Jacobiana O graacutefico do erro em 42(b) permite se ter uma ideacuteia da dimensatildeo
destas diferenccedilas Dos 38738 elementos com erros entre 0 e 001 (pontos
azuis) 11360 tecircm erro igual a zero (elementos idecircnticos) e 27378 tecircm erros
menores que 001 Os erros nesta faixa de valores normalmente natildeo prejudicam
a convergecircncia do GMRES
As outras faixas de valores associadas aos pontos de cores verde amarelo e
vermelho normalmente prejudicam a convergecircncia do GMRES Esses erros
devem ser evitados e satildeo gerados quando alguns elementos importantes satildeo
descartados durante a fatoraccedilatildeo ILU(0) O maior erro provocado entre os
elementos de M e da Jacobiana eacute de 401931 e o erro total para este preacute-
condicionador eacute de 10632middot105 (norma de Frobenius) Para evitar que os erros
se propaguem enquanto eacute realizada a fatoraccedilatildeo eacute necessaacuterio calcular o erro
associado a cada elemento dos fatores triangulares antes de seu preenchimento
ou descarte Este erro deve tambeacutem considerar os erros propagados nos
caacutelculos futuros onde o elemento seja requerido Se este valor for zero ou
proacuteximo de zero entatildeo o elemento pode ser descartado caso contraacuterio deve ser
preenchido
a) Produto dos fatores incompletos (LrsquoUrsquo) do preacute-condicionador ILU(0)
b) Matriz R para o preacute-condicionador ILU(0)
Figura 42 ndash Erros produzidos pela regra de preenchimento com o preacute-condicionador ILU(0) para a matriz Jacobiana do sistema brasileiro de 3513 barras
142
Sejam L e U os fatores triangulares completos Lrsquo e Ursquo os fatores triangulares
incompletos apoacutes o descarte de um uacutenico elemento Lik o elemento descartado
em Lrsquo e Uki o elemento descartado em Ursquo (Lik = 0 ou Uki = 0) Usando a equaccedilatildeo
(311) (Mori et al 1996 Saad 2003 Benzi et al 1999b Benzi 2002) eacute possiacutevel
calcular o erro associado ao elemento Lik (45) e o erro associado ao elemento
Uki (46) Como mencionado anteriormente esses erros permitem ter uma ideacuteia
de quatildeo diferente se torna o preacute-condicionador M dos fatores triangulares
completos apoacutes os elementos Lik e Uki serem descartados Como os erros estatildeo
associados a um uacutenico elemento descartado as equaccedilotildees (45) e (46) podem
ser reescritas como em (47) e (48) respectivamente
R = L U - L Usdot sdot (45)
R = L U - L Usdot sdot (46)
)ik(LR = (L -L) Usdot (47)
)ik(UR = L (U-U)sdot (48)
Verifica-se que tanto a matriz diferenccedila (L-Lrsquo) como tambeacutem (U-Ursquo) possuem
apenas um elemento natildeo nulo Lik (descartado em Lrsquo) e Uki (descartado em Ursquo)
respectivamente como apresentado em (49) e (410)
ik
0
0 0
0 0 0
0 0 0 0
L L =
0 0 0 0 0
0 0 L 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
( - )
⋮ ⋱
⋯
⋯
⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱
⋯ ⋯ ⋯
(49)
143
ki
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 U 0 0
0 0 0 0 0
(U - U) =
0 0 0 0
0 0 0
0 0
0
⋯ ⋯ ⋯
⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯
⋯
⋯
⋱ ⋮
(410)
Pela substituiccedilatildeo de (49) e (410) nos produtos (L-Lrsquo)middotU como Lmiddot(U-Ursquo) resulta
em (411) e (412)
ik kk ik kk+1 ik ki ik kn
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
L - L) U =
0 0 0 0 0 0
0 0 L U L U L U L U
0 0 0 0 0 0
0 0 0 0 0 0
(
sdot
sdot sdot sdot sdot
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(411)
ki
k+1k ki
ik ki
nk ki
0 0 0 0 0
0 0 0 0 0
0 0 U 0 0
L (U - U) = 0 0 L U 0 0
0 0 L U 0 0
0 0 L U 0 0
sdot sdot
sdot
sdot
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
(412)
Conforme mencionado no capiacutetulo anterior uma das dificuldades para propor
uma regra de preenchimento estaacute em se reduzir o nuacutemero de operaccedilotildees
associadas com sua execuccedilatildeo dentro do algoritmo de preacute-condicionamento
144
Neste trabalho propotildee-se usar a norma-1 em (47) para o caacutelculo do erro
associado a um elemento de L e a norma-infin em (48) para o caacutelculo do erro
associado a um dado elemento de U como apresentado em (413) e (414) As
referidas normas aproveitam a estrutura das matrizes (411) e (412) evitando-se
a realizaccedilatildeo de operaccedilotildees adicionais sendo requeridas ao inveacutes disto apenas
comparaccedilotildees entre elementos Portanto substituindo (411) em (413) e (412)
em (414) e calculando-se as normas satildeo obtidas as equaccedilotildees (415) e (416)
que devem ser usadas na regra de preenchimento
)1ik(LR = (L -L) Usdot (413)
ki(U )R = L (U-U) infinsdot (414)
ik ik km(L )R = L max U m = [kn]sdot (415)
ki ki mk(U )R U max 1 L m=[k+1n]= sdot (416)
Na Figura 43 satildeo destacados em vermelho todos os elementos dos fatores
triangulares que satildeo requeridos para calcular o erro produzido quando o
elemento Lik (no quadrado) eacute descartado Jaacute na Figura 44 satildeo destacados em
azul todos os elementos necessaacuterios para calcular o erro produzido quando o
elemento Uki (encerrado no quadrado) eacute descartado Observa-se que para que
esta regra possa ser implementada tanto no fator triangular U como em L o
algoritmo de fatoraccedilatildeo deve ser capaz de calcular os elementos Ukk Ukk+1
Ukn (em vermelho) antes de decidir se o elemento Lik deve ser preenchido ou
descartado Semelhantemente deve ser capaz de calcular os elementos Lk+1k
Lnk (em azul) antes de decidir se o elemento Uki deve ser preenchido ou
descartado
145
Figura 43 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Lik
Figura 44 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Uki
45 Adequaccedilatildeo da Regra Baseada no Erro
Nesta seccedilatildeo a regra de preenchimento baseada no erro eacute adequada para ser
usada no preacute-condicionador ILUT(τρ) analisado no capiacutetulo anterior O preacute-
condicionador resultante seraacute chamado de preacute-condicionador de duplo
paracircmetro limitante ILUT(ξτ) Neste preacute-condicionador natildeo eacute mais necessaacuterio
usar o paracircmetro ρ
Conforme visto no Capiacutetulo 3 o algoritmo de fatoraccedilatildeo usado neste preacute-
condicionador eacute o IKJ e deriva da eliminaccedilatildeo de Gauss (Saad 2003) Este tipo
de algoritmo permite calcular os elementos Ukk Ukk+1 Ukn antes de decidir se
o elemento Lik deve ser preenchido ou descartado Poreacutem o algoritmo IKJ natildeo
permite calcular os elementos Lk+1k Lnk antes de decidir se o elemento Uki
deve ser preenchido ou descartado porque no mesmo os elementos de L e U
146
satildeo calculados por linhas uma de cada vez Portanto a regra baseada no erro
pode ser aplicada apenas nos elementos do fator L enquanto que uma variante
da regra convencional usada no ILUT(τρ) eacute usada para os elementos de U
O caacutelculo da norma-2 usada na regra de preenchimento convencional dada pela
raiz quadrada da soma dos quadrados dos elementos da linha pode exigir
consideraacutevel esforccedilo computacional dependendo da dimensatildeo da matriz de
coeficientes Portanto ao inveacutes de se usar esta norma para descartar os
elementos em U recomenda-se realizar a meacutedia aritmeacutetica dos elementos da i-
eacutesima linha da matriz de coeficientes original Este procedimento reduz o nuacutemero
de operaccedilotildees de ponto flutuante sem comprometer a qualidade do preacute-
condicionador No entanto a eficiecircncia de ambas as heuriacutesticas eacute inferior agrave da
regra baseada no erro para preenchimento dos elementos proposta no presente
trabalho O resultado eacute um preacute-condicionador que aplica dois criteacuterios para
definir sua regra de preenchimento da seguinte forma
De acordo com a relaccedilatildeo dada por (417) um elemento Lik eacute descartado se o
erro resultante for menor que a toleracircncia ξ usada para todas as linhas de L
Caso contraacuterio calcula-se Lik usando-se o elemento aik da matriz resultante do
processo de eliminaccedilatildeo de Gauss ateacute a correspondente etapa Jaacute para um
elemento Uik este eacute descartado se for menor que uma certa toleracircncia relativa
τi obtida multiplicando-se a toleracircncia absoluta τ pela meacutedia aritmeacutetica dos
elementos da i-eacutesima linha da matriz de coeficientes original O caacutelculo de w eacute
efetuado de acordo com o algoritmo de fatoraccedilatildeo IKJ apresentado no capiacutetulo
anterior
ik
ikik
(L )
ik (L )k=(1i-1)
kk
0 R= aL
RU
lt ξ ge ξ
(417)
ik
k i
k k ik=(i+1n)
0 w =U
w w
lt ge
ττ
(418)
A adaptaccedilatildeo da regra baseada no erro no preacute-condicionador ILUT(τρ) falha
devido ao fato do algoritmo de fatoraccedilatildeo IKJ natildeo permitir a aplicaccedilatildeo da regra
147
em ambos os fatores triangulares L e U dificultando a exploraccedilatildeo das vantagens
do uso desta regra A seguir mostra-se uma proposta para superar estes
problemas utilizando-se outro algoritmo de fatoraccedilatildeo que permite aplicar a regra
em ambos os fatores triangulares
46 Preacute-condicionador ILU( ξ) Baseado no Caacutelculo do Erro
Nesta seccedilatildeo propotildee-se uma eficiente e robusta estrateacutegia de preacute-
condicionamento da fatoraccedilatildeo incompleta ILU(ξ) derivada de uma versatildeo do
algoritmo de eliminaccedilatildeo de Gauss conhecido como Doolittle A maior vantagem
deste algoritmo eacute que permite usar de forma efetiva a regra de preenchimento
baseada no erro em ambos os fatores triangulares L e U
Os fatores L e U satildeo apresentados em (419) e (420) Os elementos da diagonal
de L satildeo iguais a um e a primeira linha de U eacute igual agrave primeira linha da matriz de
coeficientes A As equaccedilotildees usadas pelo algoritmo de Doolittle para calcular os
elementos dos fatores triangulares satildeo apresentadas em (422) e podem ser
obtidas ao se igualar cada elemento do produto dos fatores triangulares LmiddotU de
(419) e (420) aos elementos da matriz de coeficientes A apresentada em (421)
Estas equaccedilotildees podem ser implementadas computacionalmente de diferentes
formas todas baseadas na eliminaccedilatildeo de Gauss Teoricamente os diferentes
tipos de eliminaccedilatildeo de Gauss realizam o mesmo nuacutemero de operaccedilotildees de ponto
flutuante No entanto no contexto da fatoraccedilatildeo incompleta estas variantes
resultam em importantes diferenccedilas praacuteticas quando o interesse eacute utilizar a regra
de preenchimento baseada no erro
k-11
k1 kk 1
i1 ik 1 ik
n1 nk 1 nk ni
1 0 0 0 0
L 1 0 0 0
L L 1 0 0L
L L L 1 0
L L L L 1
minus
minus
minus
=
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(419)
148
11 1k 1 1k 1i 1n
k-1k-1 k-1k k-1i k-1n
kk ki kn
ii in
nn
U U U U U
0 U U U U
0 0 U U UU
0 0 0 U U
0 0 0 0 U
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(420)
11 1k 1 1k 1i 1n
k-11 k-1k-1 k-1k k-1i k-1n
k1 kk-1 kk ki kn
i1 ik-1 ik ii in
n1 nk-1 nk ni nn
a a a a a
a a a a a
a a a a aA
a a a a a
a a a a a
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(421)
k-1
ki ki kj jij=1
k-1
ik ij jkj=1
ikkk
U =a - [L U ] i=kn
a - [L U ]
L = i=k+1nU
sum
sum (422)
As equaccedilotildees de Doolittle podem gerar algoritmos de eliminaccedilatildeo de Gauss que
calculam os elementos dos fatores triangulares por linhas de forma similar agrave
fatoraccedilatildeo IKJ ou por colunas (Bodewig 1956 Wilkinson 1965 Dahlquist amp
Bjoumlrk 1974 Hoffman 2001) Em ambos algoritmos natildeo seria possiacutevel usar a
regra de preenchimento baseada no erro A partir de (422) propotildee-se usar o
algoritmo de eliminaccedilatildeo de Gauss apresentado na Figura 45 que permite
calcular os elementos dos fatores triangulares simultaneamente por linhas em U
e por colunas em L como mostrado na Figura 46
No passo k da eliminaccedilatildeo de Gauss os elementos da k-eacutesima linha de U e a k-
eacutesima coluna de L (identificados por linhas tracejadas) satildeo calculados utilizando
elementos jaacute computados anteriormente nas linhas e colunas de U e L Por
exemplo para se calcular o elemento Uki satildeo usados os elementos destacados
em azul enquanto que para calcular o elemento Lik satildeo usados os elementos
149
destacados em vermelho Observa-se que este algoritmo permite calcular
elementos de L em linhas posteriores agrave linha k Esta caracteriacutestica possibilita o
uso em U da regra de preenchimento baseada no erro
1 Para i = 1n Faccedila
2 min = Ji in
3 Para k = in Faccedila
4 Para j = 1i-1 Faccedila
5 mk = mk - LijmiddotUjk
6 Fim ndash Faccedila
7 Fim ndash Faccedila
8 Registrar Umax = maxmin
9 ni+1n = J i+1ni
10 Para k = i+1n Faccedila
11 Para j = 1i-1 Faccedila
12 nk = nk ndash LkjmiddotUji
13 Fim ndash Faccedila
14 Fim ndash Faccedila
15 n = nUii
16 Registrar Lmax = maxni+1n
17 Aplicar a regra de preenchimento baseada no erro em m e n
18 Ui in = m in
19 L i+1ni = n i+1n
20 Fim ndash Faccedila
Figura 45 ndash Algoritmo do preacute-condicionador ILU(ξ)
Figura 46 ndash Elementos necessaacuterios para calcular os elementos Lik e Uki durante a fatoraccedilatildeo triangular
150
No algoritmo da Figura 45 observa-se que no passo k os elementos da linha de
U satildeo armazenados no vetor m enquanto que os elementos da coluna de L satildeo
armazenados no vetor n (passos 5 e 12 respectivamente) Uma vez calculados
ambos os vetores procura-se o maior elemento de m sendo armazenado em
Umax e o maior elemento de n armazenado em Lmax (passos 8 e 16
respectivamente) Ambos os valores maacuteximos (em valores absolutos) satildeo
usados pela regra de preenchimento no passo 17 para descartar em m e n os
elementos associados com os menores erros e preencher a linha de U e a
coluna de L da seguinte forma
De acordo com as relaccedilotildees dadas por (423) e (424) tanto um elemento Lki
como tambeacutem um elemento Uik satildeo descartados se seus erros associados
foram menores que uma dada toleracircncia ξ usada para todas as colunas de L e
linhas de U Caso contraacuterio Lki eacute preenchido usando-se o valor armazenado
em nk e Uik eacute preenchido usando-se o valor armazenado em mk
ik
ikik
(U )
(U )kk=(in)
0 R =U
m R
lt ξ ge ξ
(423)
ik
ikki
(L )
(L )ki=(1+1n)
0 R=L
n R
lt ξ ge ξ
(424)
Como observado na Figura 46 o algoritmo da Figura 45 permite encontrar os
elementos Ukk Ukk+1 Ukn necessaacuterios para se calcular o erro associado ao
elemento Lki e os elementos Lk+1k Lnk que por sua vez satildeo necessaacuterios para
se calcular o erro associado ao elemento Uik Nota-se que os elementos
necessaacuterios para calcular o erro (passo k) satildeo calculados neste mesmo passo
portanto natildeo eacute necessaacuterio realizar grandes buscas de elementos nas matrizes L
e U Igualmente tambeacutem natildeo eacute necessaacuterio armazenar valores Umax Lmax ou
erros do passo k porque natildeo seratildeo mais necessaacuterios nos proacuteximos passos
Observe-se que natildeo eacute necessaacuterio multiplicar o paracircmetro ξ por alguma norma ou
meacutedia aritmeacutetica dos elementos da matriz de coeficientes como realizado no
preacute-condicionador ILUT(τρ) porque o erro independe dos valores dos elementos
151
da matriz de coeficientes Este preacute-condicionador usa apenas um uacutenico
paracircmetro ξ Esta caracteriacutestica facilita o ajuste dos paracircmetros do solucionador
como seraacute visto nas proacuteximas seccedilotildees e no proacuteximo capiacutetulo
47 Meacutetodo Convencional Para Ajuste dos Paracircmetros dos Solucionadores
O ajuste dos paracircmetros de um solucionador iterativo eacute considerado fundamental
para garantir sua robustez e eficiecircncia computacional principalmente em
anaacutelises mais complexas como aquelas que solucionam vaacuterios fluxos de carga
com diferentes pontos de operaccedilatildeo Nesses casos a escolha de valores
apropriados para os paracircmetros se torna ainda mais relevante
A ideacuteia fundamental eacute escolher os valores dos paracircmetros que permitam
preencher o menor nuacutemero de elementos sem prejudicar a qualidade do preacute-
condicionador isto eacute sem tornaacute-lo muito diferente de A Poreacutem a escolha de
valores apropriados para os paracircmetros eacute uma tarefa difiacutecil jaacute que existe uma
interdependecircncia com as toleracircncias relativa e absoluta do GMRES e com o tipo
de problema que estaacute sendo solucionado
Pouco tem sido pesquisado em relaccedilatildeo a este tema apenas em (de Leon amp
Semlyen 2002) apresenta-se uma foacutermula que permite calcular para cada
sistema eleacutetrico o valor do paracircmetro limitante τ no preacute-condicionador ILU(τ)
dado por (322) onde τ eacute igual agrave metade do nuacutemero de equaccedilotildees totais Neq do
sistema linear Na praacutetica estaacute foacutermula natildeo garante robustez nem o melhor
desempenho do solucionador
eq
12 N
τ =sdot
(425)
No entanto o procedimento convencional define primeiro valores arbitraacuterios para
as duas toleracircncias absoluta e relativa do GMRES Nas simulaccedilotildees realizadas
nos capiacutetulos anteriores se usou toleracircncias iguais (10-5) e menores que a
toleracircncia usada no teste de convergecircncia do algoritmo Newton-Raphson pois
toleracircncias maiores costumam impedir a convergecircncia do Newton-Raphson
152
Uma vez definidas as toleracircncias a escolha dos paracircmetros do preacute-
condicionador eacute realizada com base em tentativa e erro
Este meacutetodo natildeo considera a possibilidade de encontrar melhores desempenhos
para outras toleracircncias do GMRES que natildeo necessariamente devem ser
consideradas iguais Durante o procedimento de tentativa e erro o meacutetodo pode
encontrar um miacutenimo nuacutemero de operaccedilotildees local (MFLOPSL) associado com τL
como ilustrado na Figura 47 que natildeo necessariamente eacute o menor possiacutevel
(MFLOPSG) Observa-se que para obter o miacutenimo nuacutemero de operaccedilotildees global
(MFLOPSG) o procedimento de tentativa e erro deveria comeccedilar com um valor
de τ proacuteximo de τG
Figura 47 ndash Procedimento de tentativa e erro para busca de valores de um paracircmetro do preacute-condicionador
Quando o preacute-condicionador possui um segundo paracircmetro o procedimento de
tentativa e erro eacute repetido para este segundo paracircmetro fixando-se o primeiro
paracircmetro
48 Meacutetodo Proposto Para Ajuste dos Paracircmetros dos Solucio nadores
O meacutetodo proposto consiste em realizar sucessivas simulaccedilotildees de fluxo de
carga variando simultaneamente todos os paracircmetros do solucionador e
registrando o nuacutemero de operaccedilotildees de ponto flutuante para cada caso gerado O
objetivo eacute encontrar regiotildees de valores para os paracircmetros onde o solucionador
153
apresente alto desempenho permitindo estabelecer e recomendar faixas para os
valores dos paracircmetros onde o solucionador garante convergecircncia com a maior
eficiecircncia possiacutevel O meacutetodo tambeacutem permite identificar as faixas de valores
onde o solucionador natildeo converge
O meacutetodo eacute ilustrado para ajustar os paracircmetros de duas configuraccedilotildees de
solucionador iterativo sendo estas o solucionador proposto neste trabalho
identificado como GMRES+ILU(ξ)+MD e o solucionador GMRES+ILUT(τρ)+MD
apresentado no capiacutetulo 2 Na Tabela 43 especificam-se os paracircmetros
associados a cada solucionador
Tabela 43 ndash Paracircmetros usados nos solucionadores
Solucionadores Meacutetodo Iterativo Preacute-condicionador
GMRES+ILU(ξ)+MD atol rtol
ξ
GMRES+ILUT(τρ)+MD τ ρ
481 Passos Fundamentais
Esta seccedilatildeo apresenta de maneira sucinta os passos envolvidos no meacutetodo para
ajuste dos paracircmetros dos solucionadores onde uma descriccedilatildeo geral eacute
mostrada na Figura 48 O primeiro passo refere-se agrave definiccedilatildeo do espaccedilo de
busca onde satildeo procurados os valores para os paracircmetros que garantem alto
desempenho do solucionador O segundo refere-se aos experimentos numeacutericos
realizados para avaliar o desempenho do solucionador considerando-se todas as
combinaccedilotildees possiacuteveis dos valores de seus paracircmetros definidos no espaccedilo de
busca O passo seguinte tem como objetivo calcular as faixas de valores
recomendaacuteveis para as toleracircncias absoluta e relativa do GMRES Finalmente o
quarto passo calcula as faixas de valores recomendaacuteveis para os paracircmetros do
preacute-condicionador
154
Figura 48 ndash Passos fundamentais para delimitaccedilatildeo dos paracircmetros do solucionador
Nas proacuteximas seccedilotildees os passos mais relevantes no contexto deste trabalho satildeo
discutidos mais detalhadamente
482 Estabelecimento do Espaccedilo de Busca
Para definir o espaccedilo de busca primeiramente deve-se estabelecer o domiacutenio de
cada paracircmetro isto eacute um valor miacutenimo e maacuteximo para cada toleracircncia do
GMRES e para cada paracircmetro do preacute-condicionador como mostrado na Tabela
44 e na Figura 49 Depois devem ser definidos valores intermediaacuterios para cada
paracircmetro sendo que o nuacutemero de valores totais eacute definido em funccedilatildeo do grau
de precisatildeo que se deseja conseguir nos paracircmetros
Finalmente o espaccedilo de busca eacute definido por todas as combinaccedilotildees possiacuteveis
entre as toleracircncias absoluta e relativa do GMRES como apresentado na Figura
49(a) e por todas as combinaccedilotildees possiacuteveis realizadas entre os paracircmetros do
preacute-condicionador como mostrado na Figura 49(b-c)
Para os valores especificados na Tabela 44 existem (m x n) combinaccedilotildees
possiacuteveis entre a toleracircncia absoluta e relativa (ver Figura 49(a)) e (q x p)
combinaccedilotildees possiacuteveis entre os paracircmetros τ e ρ do preacute-condicionador ILUT(τρ)
(ver Figura 49(c)) No caso do preacute-condicionador ILU(ξ) natildeo existem
combinaccedilotildees jaacute que este preacute-condicionador possui somente um uacutenico
paracircmetro Poreacutem existem k valores possiacuteveis para ξ (ver Figura 49(b))
Estabelecer Espaccedilo de Busca
Experimentos numeacutericos
Delimitar paracircmetros do preacute-condicionador
Delimitar toleracircncias do GMRES
155
Tabela 44 ndash Domiacutenios dos paracircmetros usados nos solucionadores
Paracircmetros Maacuteximo Miacutenimo Nuacutemero total de valores
atol atol1 atoln n
rtol rtol1 rtolm m
ξ ξ1 ξk k
τ τ1 τq q
ρ ρ1 ρp P
a) Espaccedilo de busca das toleracircncias do GMRES
b) Espaccedilo de busca dos paracircmetros do preacute-condicionador ILUT(ξ)
c) Espaccedilo de busca dos paracircmetros do preacute-
condicionador ILUT(τρ)
Figura 49 ndash Espaccedilo de busca dos paracircmetros do solucionador
483 Experimentos Numeacutericos
No segundo passo para cada combinaccedilatildeo das toleracircncias absoluta e relativa
(atolrtol) do espaccedilo de busca da Figura 49(a) satildeo simulados tantos Fluxos de
Carga quanto combinaccedilotildees dos paracircmetros do preacute-condicionador existam
registrando-se o nuacutemero de operaccedilotildees de ponto flutuante (MFLOPS) para cada
156
combinaccedilatildeo dos paracircmetros do preacute-condicionador Portanto para cada
combinaccedilatildeo (atolrtol) eacute gerado um graacutefico de eficiecircncia computacional (em
MFLOPS) em funccedilatildeo dos paracircmetros do preacute-condicionador como mostrado na
Figura 410(a) para o preacute-condicionador ILUT(τρ) e na Figura 410(b) para o
preacute-condicionador ILU(ξ)
a) Graacutefico de eficiecircncia para o preacute-condicionador ILUT(τρ)
b) Graacutefico de eficiecircncia para o preacute-condicionador ILU(ξ)
Figura 410 ndash Graacuteficos de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
Para cada graacutefico gerado eacute registrado o nuacutemero de operaccedilotildees de ponto flutuante
miacutenimo (MFLOPSmiacuten) e este valor eacute associado agrave sua correspondente combinaccedilatildeo
(atolrtol) Apoacutes terem sido realizados todos os experimentos e registrados todos
os MFLOPSmiacuten associados a todas as combinaccedilotildees (atolrtol) eacute gerado o graacutefico
de alta eficiecircncia Este graacutefico apresenta em escala de cores todos MFLOPSmiacuten
em funccedilatildeo de suas correspondentes combinaccedilotildees (atolrtol) como mostrado na
Figura 411 sendo que a cor azul estaacute associada com os menores MFLOPSmiacuten a
157
cor vermelha com os maiores MFLOPSmiacuten e em negrito os casos natildeo
convergentes
Observa-se que entre todos os valores registrados para MFLOPSmiacuten existe uma
regiatildeo que conteacutem os casos com os menores MFLOPSmiacuten Este valor chamado
de MFLOPSoacuteti eacute o nuacutemero miacutenimo de operaccedilotildees possiacutevel (global) e estaacute
associado com a regiatildeo quadrada em azul escuro segmentada pelas linhas
brancas Os pontos brancos indicam as posiccedilotildees de todas as combinaccedilotildees que
possuem nuacutemero de operaccedilotildees igual a MFLOPSoacuteti
Figura 411 ndash Graacuteficos de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
484 Delimitaccedilatildeo das Toleracircncias do GMRES
No terceiro passo a partir do graacutefico de alta eficiecircncia apresentado na sua forma
bidimensional na Figura 412 eacute segmentada a regiatildeo dos MFLOPSoacuteti Neste
caso esta regiatildeo eacute o quadrado azul do centro do graacutefico onde cada ponto
branco estaacute associado a uma combinaccedilatildeo (atolrtol) que apresenta o menor
nuacutemero de operaccedilotildees possiacutevel em todo o espaccedilo de busca (MFLOPSoacuteti) Este
graacutefico permite encontrar as faixas de valores (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do meacutetodo GMRES associadas ao melhor
desempenho possiacutevel
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
140
137
transformadores defasadores satildeo representados pelos seus circuitos ᴨ
equivalentes Os tapes variaacuteveis sob carga podem ainda ter a atuaccedilatildeo contiacutenua
ou discreta As cargas das barras satildeo normalmente modeladas como potecircncias
ativa e reativa constantes ou podem ser expressas como uma funccedilatildeo da
magnitude da tensatildeo da barra Natildeo satildeo modelados elos de corrente contiacutenua
No algoritmo de fluxo de carga consideram-se o controle de variaccedilatildeo automaacutetica
de tape e os limites de geraccedilatildeo de potecircncia reativa
44 Regra de Preenchimento Baseada no Caacutelculo do Erro Associado ao Elemento Descartado
Uma forma simples de estimar o erro total R originado pelos elementos
descartados devido agraves regras de preenchimento da fatoraccedilatildeo incompleta eacute
usando-se (310) (Mori et al 1996 Saad 2003) Nesta equaccedilatildeo o produto dos
fatores triangulares incompletos eacute igual ao preacute-condicionador M e o produto dos
fatores triangulares completos eacute igual agrave matriz de coeficientes A como mostrado
em (311) Desta forma o erro R permite vislumbrar quatildeo diferente se tornou
o preacute-condicionador em relaccedilatildeo aos fatores triangulares completos apoacutes o
descarte de seus elementos
Um preacute-condicionador sem regra de preenchimento efetua completamente o
caacutelculo dos fatores triangulares Neste caso o preacute-condicionador M se iguala agrave
matriz de coeficientes (M = L∙U = A) o que resulta na convergecircncia do meacutetodo
GMRES em uma uacutenica iteraccedilatildeo com erro R nulo Poreacutem o nuacutemero de
operaccedilotildees de ponto flutuante ainda eacute consideraacutevel Para se obter esta reduccedilatildeo eacute
necessaacuterio usar uma regra de preenchimento que descarte o maior nuacutemero de
elementos nos fatores triangulares e sem que isso provoque o aumento do erro
R consequumlentemente afetando o desempenho do GMRES
R A M (43)
R L U L U (44)
Como exemplo na Figura 36 satildeo apresentados dois graacuteficos que ilustram como
os erros produzidos pelo descarte dos fatores triangulares natildeo-nulos podem se
alastrar ateacute em posiccedilotildees de elementos jaacute preenchidos O experimento foi
141
137
apresentado na seccedilatildeo 332 do capiacutetulo anterior para o sistema brasileiro de
3513 barras usando-se o preacute-condicionador ILU(0) para o caacutelculo dos fatores
incompletos No graacutefico da Figura 36(a) mostra-se que 8797 dos elementos
do preacute-condicionador M (83078) satildeo distintos dos encontrados na matriz
Jacobiana O graacutefico do erro em 42(b) permite se ter uma ideacuteia da dimensatildeo
destas diferenccedilas Dos 38738 elementos com erros entre 0 e 001 (pontos
azuis) 11360 tecircm erro igual a zero (elementos idecircnticos) e 27378 tecircm erros
menores que 001 Os erros nesta faixa de valores normalmente natildeo prejudicam
a convergecircncia do GMRES
As outras faixas de valores associadas aos pontos de cores verde amarelo e
vermelho normalmente prejudicam a convergecircncia do GMRES Esses erros
devem ser evitados e satildeo gerados quando alguns elementos importantes satildeo
descartados durante a fatoraccedilatildeo ILU(0) O maior erro provocado entre os
elementos de M e da Jacobiana eacute de 401931 e o erro total para este preacute-
condicionador eacute de 10632middot105 (norma de Frobenius) Para evitar que os erros
se propaguem enquanto eacute realizada a fatoraccedilatildeo eacute necessaacuterio calcular o erro
associado a cada elemento dos fatores triangulares antes de seu preenchimento
ou descarte Este erro deve tambeacutem considerar os erros propagados nos
caacutelculos futuros onde o elemento seja requerido Se este valor for zero ou
proacuteximo de zero entatildeo o elemento pode ser descartado caso contraacuterio deve ser
preenchido
a) Produto dos fatores incompletos (LrsquoUrsquo) do preacute-condicionador ILU(0)
b) Matriz R para o preacute-condicionador ILU(0)
Figura 42 ndash Erros produzidos pela regra de preenchimento com o preacute-condicionador ILU(0) para a matriz Jacobiana do sistema brasileiro de 3513 barras
142
Sejam L e U os fatores triangulares completos Lrsquo e Ursquo os fatores triangulares
incompletos apoacutes o descarte de um uacutenico elemento Lik o elemento descartado
em Lrsquo e Uki o elemento descartado em Ursquo (Lik = 0 ou Uki = 0) Usando a equaccedilatildeo
(311) (Mori et al 1996 Saad 2003 Benzi et al 1999b Benzi 2002) eacute possiacutevel
calcular o erro associado ao elemento Lik (45) e o erro associado ao elemento
Uki (46) Como mencionado anteriormente esses erros permitem ter uma ideacuteia
de quatildeo diferente se torna o preacute-condicionador M dos fatores triangulares
completos apoacutes os elementos Lik e Uki serem descartados Como os erros estatildeo
associados a um uacutenico elemento descartado as equaccedilotildees (45) e (46) podem
ser reescritas como em (47) e (48) respectivamente
R = L U - L Usdot sdot (45)
R = L U - L Usdot sdot (46)
)ik(LR = (L -L) Usdot (47)
)ik(UR = L (U-U)sdot (48)
Verifica-se que tanto a matriz diferenccedila (L-Lrsquo) como tambeacutem (U-Ursquo) possuem
apenas um elemento natildeo nulo Lik (descartado em Lrsquo) e Uki (descartado em Ursquo)
respectivamente como apresentado em (49) e (410)
ik
0
0 0
0 0 0
0 0 0 0
L L =
0 0 0 0 0
0 0 L 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
( - )
⋮ ⋱
⋯
⋯
⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱
⋯ ⋯ ⋯
(49)
143
ki
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 U 0 0
0 0 0 0 0
(U - U) =
0 0 0 0
0 0 0
0 0
0
⋯ ⋯ ⋯
⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯
⋯
⋯
⋱ ⋮
(410)
Pela substituiccedilatildeo de (49) e (410) nos produtos (L-Lrsquo)middotU como Lmiddot(U-Ursquo) resulta
em (411) e (412)
ik kk ik kk+1 ik ki ik kn
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
L - L) U =
0 0 0 0 0 0
0 0 L U L U L U L U
0 0 0 0 0 0
0 0 0 0 0 0
(
sdot
sdot sdot sdot sdot
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(411)
ki
k+1k ki
ik ki
nk ki
0 0 0 0 0
0 0 0 0 0
0 0 U 0 0
L (U - U) = 0 0 L U 0 0
0 0 L U 0 0
0 0 L U 0 0
sdot sdot
sdot
sdot
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
(412)
Conforme mencionado no capiacutetulo anterior uma das dificuldades para propor
uma regra de preenchimento estaacute em se reduzir o nuacutemero de operaccedilotildees
associadas com sua execuccedilatildeo dentro do algoritmo de preacute-condicionamento
144
Neste trabalho propotildee-se usar a norma-1 em (47) para o caacutelculo do erro
associado a um elemento de L e a norma-infin em (48) para o caacutelculo do erro
associado a um dado elemento de U como apresentado em (413) e (414) As
referidas normas aproveitam a estrutura das matrizes (411) e (412) evitando-se
a realizaccedilatildeo de operaccedilotildees adicionais sendo requeridas ao inveacutes disto apenas
comparaccedilotildees entre elementos Portanto substituindo (411) em (413) e (412)
em (414) e calculando-se as normas satildeo obtidas as equaccedilotildees (415) e (416)
que devem ser usadas na regra de preenchimento
)1ik(LR = (L -L) Usdot (413)
ki(U )R = L (U-U) infinsdot (414)
ik ik km(L )R = L max U m = [kn]sdot (415)
ki ki mk(U )R U max 1 L m=[k+1n]= sdot (416)
Na Figura 43 satildeo destacados em vermelho todos os elementos dos fatores
triangulares que satildeo requeridos para calcular o erro produzido quando o
elemento Lik (no quadrado) eacute descartado Jaacute na Figura 44 satildeo destacados em
azul todos os elementos necessaacuterios para calcular o erro produzido quando o
elemento Uki (encerrado no quadrado) eacute descartado Observa-se que para que
esta regra possa ser implementada tanto no fator triangular U como em L o
algoritmo de fatoraccedilatildeo deve ser capaz de calcular os elementos Ukk Ukk+1
Ukn (em vermelho) antes de decidir se o elemento Lik deve ser preenchido ou
descartado Semelhantemente deve ser capaz de calcular os elementos Lk+1k
Lnk (em azul) antes de decidir se o elemento Uki deve ser preenchido ou
descartado
145
Figura 43 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Lik
Figura 44 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Uki
45 Adequaccedilatildeo da Regra Baseada no Erro
Nesta seccedilatildeo a regra de preenchimento baseada no erro eacute adequada para ser
usada no preacute-condicionador ILUT(τρ) analisado no capiacutetulo anterior O preacute-
condicionador resultante seraacute chamado de preacute-condicionador de duplo
paracircmetro limitante ILUT(ξτ) Neste preacute-condicionador natildeo eacute mais necessaacuterio
usar o paracircmetro ρ
Conforme visto no Capiacutetulo 3 o algoritmo de fatoraccedilatildeo usado neste preacute-
condicionador eacute o IKJ e deriva da eliminaccedilatildeo de Gauss (Saad 2003) Este tipo
de algoritmo permite calcular os elementos Ukk Ukk+1 Ukn antes de decidir se
o elemento Lik deve ser preenchido ou descartado Poreacutem o algoritmo IKJ natildeo
permite calcular os elementos Lk+1k Lnk antes de decidir se o elemento Uki
deve ser preenchido ou descartado porque no mesmo os elementos de L e U
146
satildeo calculados por linhas uma de cada vez Portanto a regra baseada no erro
pode ser aplicada apenas nos elementos do fator L enquanto que uma variante
da regra convencional usada no ILUT(τρ) eacute usada para os elementos de U
O caacutelculo da norma-2 usada na regra de preenchimento convencional dada pela
raiz quadrada da soma dos quadrados dos elementos da linha pode exigir
consideraacutevel esforccedilo computacional dependendo da dimensatildeo da matriz de
coeficientes Portanto ao inveacutes de se usar esta norma para descartar os
elementos em U recomenda-se realizar a meacutedia aritmeacutetica dos elementos da i-
eacutesima linha da matriz de coeficientes original Este procedimento reduz o nuacutemero
de operaccedilotildees de ponto flutuante sem comprometer a qualidade do preacute-
condicionador No entanto a eficiecircncia de ambas as heuriacutesticas eacute inferior agrave da
regra baseada no erro para preenchimento dos elementos proposta no presente
trabalho O resultado eacute um preacute-condicionador que aplica dois criteacuterios para
definir sua regra de preenchimento da seguinte forma
De acordo com a relaccedilatildeo dada por (417) um elemento Lik eacute descartado se o
erro resultante for menor que a toleracircncia ξ usada para todas as linhas de L
Caso contraacuterio calcula-se Lik usando-se o elemento aik da matriz resultante do
processo de eliminaccedilatildeo de Gauss ateacute a correspondente etapa Jaacute para um
elemento Uik este eacute descartado se for menor que uma certa toleracircncia relativa
τi obtida multiplicando-se a toleracircncia absoluta τ pela meacutedia aritmeacutetica dos
elementos da i-eacutesima linha da matriz de coeficientes original O caacutelculo de w eacute
efetuado de acordo com o algoritmo de fatoraccedilatildeo IKJ apresentado no capiacutetulo
anterior
ik
ikik
(L )
ik (L )k=(1i-1)
kk
0 R= aL
RU
lt ξ ge ξ
(417)
ik
k i
k k ik=(i+1n)
0 w =U
w w
lt ge
ττ
(418)
A adaptaccedilatildeo da regra baseada no erro no preacute-condicionador ILUT(τρ) falha
devido ao fato do algoritmo de fatoraccedilatildeo IKJ natildeo permitir a aplicaccedilatildeo da regra
147
em ambos os fatores triangulares L e U dificultando a exploraccedilatildeo das vantagens
do uso desta regra A seguir mostra-se uma proposta para superar estes
problemas utilizando-se outro algoritmo de fatoraccedilatildeo que permite aplicar a regra
em ambos os fatores triangulares
46 Preacute-condicionador ILU( ξ) Baseado no Caacutelculo do Erro
Nesta seccedilatildeo propotildee-se uma eficiente e robusta estrateacutegia de preacute-
condicionamento da fatoraccedilatildeo incompleta ILU(ξ) derivada de uma versatildeo do
algoritmo de eliminaccedilatildeo de Gauss conhecido como Doolittle A maior vantagem
deste algoritmo eacute que permite usar de forma efetiva a regra de preenchimento
baseada no erro em ambos os fatores triangulares L e U
Os fatores L e U satildeo apresentados em (419) e (420) Os elementos da diagonal
de L satildeo iguais a um e a primeira linha de U eacute igual agrave primeira linha da matriz de
coeficientes A As equaccedilotildees usadas pelo algoritmo de Doolittle para calcular os
elementos dos fatores triangulares satildeo apresentadas em (422) e podem ser
obtidas ao se igualar cada elemento do produto dos fatores triangulares LmiddotU de
(419) e (420) aos elementos da matriz de coeficientes A apresentada em (421)
Estas equaccedilotildees podem ser implementadas computacionalmente de diferentes
formas todas baseadas na eliminaccedilatildeo de Gauss Teoricamente os diferentes
tipos de eliminaccedilatildeo de Gauss realizam o mesmo nuacutemero de operaccedilotildees de ponto
flutuante No entanto no contexto da fatoraccedilatildeo incompleta estas variantes
resultam em importantes diferenccedilas praacuteticas quando o interesse eacute utilizar a regra
de preenchimento baseada no erro
k-11
k1 kk 1
i1 ik 1 ik
n1 nk 1 nk ni
1 0 0 0 0
L 1 0 0 0
L L 1 0 0L
L L L 1 0
L L L L 1
minus
minus
minus
=
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(419)
148
11 1k 1 1k 1i 1n
k-1k-1 k-1k k-1i k-1n
kk ki kn
ii in
nn
U U U U U
0 U U U U
0 0 U U UU
0 0 0 U U
0 0 0 0 U
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(420)
11 1k 1 1k 1i 1n
k-11 k-1k-1 k-1k k-1i k-1n
k1 kk-1 kk ki kn
i1 ik-1 ik ii in
n1 nk-1 nk ni nn
a a a a a
a a a a a
a a a a aA
a a a a a
a a a a a
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(421)
k-1
ki ki kj jij=1
k-1
ik ij jkj=1
ikkk
U =a - [L U ] i=kn
a - [L U ]
L = i=k+1nU
sum
sum (422)
As equaccedilotildees de Doolittle podem gerar algoritmos de eliminaccedilatildeo de Gauss que
calculam os elementos dos fatores triangulares por linhas de forma similar agrave
fatoraccedilatildeo IKJ ou por colunas (Bodewig 1956 Wilkinson 1965 Dahlquist amp
Bjoumlrk 1974 Hoffman 2001) Em ambos algoritmos natildeo seria possiacutevel usar a
regra de preenchimento baseada no erro A partir de (422) propotildee-se usar o
algoritmo de eliminaccedilatildeo de Gauss apresentado na Figura 45 que permite
calcular os elementos dos fatores triangulares simultaneamente por linhas em U
e por colunas em L como mostrado na Figura 46
No passo k da eliminaccedilatildeo de Gauss os elementos da k-eacutesima linha de U e a k-
eacutesima coluna de L (identificados por linhas tracejadas) satildeo calculados utilizando
elementos jaacute computados anteriormente nas linhas e colunas de U e L Por
exemplo para se calcular o elemento Uki satildeo usados os elementos destacados
em azul enquanto que para calcular o elemento Lik satildeo usados os elementos
149
destacados em vermelho Observa-se que este algoritmo permite calcular
elementos de L em linhas posteriores agrave linha k Esta caracteriacutestica possibilita o
uso em U da regra de preenchimento baseada no erro
1 Para i = 1n Faccedila
2 min = Ji in
3 Para k = in Faccedila
4 Para j = 1i-1 Faccedila
5 mk = mk - LijmiddotUjk
6 Fim ndash Faccedila
7 Fim ndash Faccedila
8 Registrar Umax = maxmin
9 ni+1n = J i+1ni
10 Para k = i+1n Faccedila
11 Para j = 1i-1 Faccedila
12 nk = nk ndash LkjmiddotUji
13 Fim ndash Faccedila
14 Fim ndash Faccedila
15 n = nUii
16 Registrar Lmax = maxni+1n
17 Aplicar a regra de preenchimento baseada no erro em m e n
18 Ui in = m in
19 L i+1ni = n i+1n
20 Fim ndash Faccedila
Figura 45 ndash Algoritmo do preacute-condicionador ILU(ξ)
Figura 46 ndash Elementos necessaacuterios para calcular os elementos Lik e Uki durante a fatoraccedilatildeo triangular
150
No algoritmo da Figura 45 observa-se que no passo k os elementos da linha de
U satildeo armazenados no vetor m enquanto que os elementos da coluna de L satildeo
armazenados no vetor n (passos 5 e 12 respectivamente) Uma vez calculados
ambos os vetores procura-se o maior elemento de m sendo armazenado em
Umax e o maior elemento de n armazenado em Lmax (passos 8 e 16
respectivamente) Ambos os valores maacuteximos (em valores absolutos) satildeo
usados pela regra de preenchimento no passo 17 para descartar em m e n os
elementos associados com os menores erros e preencher a linha de U e a
coluna de L da seguinte forma
De acordo com as relaccedilotildees dadas por (423) e (424) tanto um elemento Lki
como tambeacutem um elemento Uik satildeo descartados se seus erros associados
foram menores que uma dada toleracircncia ξ usada para todas as colunas de L e
linhas de U Caso contraacuterio Lki eacute preenchido usando-se o valor armazenado
em nk e Uik eacute preenchido usando-se o valor armazenado em mk
ik
ikik
(U )
(U )kk=(in)
0 R =U
m R
lt ξ ge ξ
(423)
ik
ikki
(L )
(L )ki=(1+1n)
0 R=L
n R
lt ξ ge ξ
(424)
Como observado na Figura 46 o algoritmo da Figura 45 permite encontrar os
elementos Ukk Ukk+1 Ukn necessaacuterios para se calcular o erro associado ao
elemento Lki e os elementos Lk+1k Lnk que por sua vez satildeo necessaacuterios para
se calcular o erro associado ao elemento Uik Nota-se que os elementos
necessaacuterios para calcular o erro (passo k) satildeo calculados neste mesmo passo
portanto natildeo eacute necessaacuterio realizar grandes buscas de elementos nas matrizes L
e U Igualmente tambeacutem natildeo eacute necessaacuterio armazenar valores Umax Lmax ou
erros do passo k porque natildeo seratildeo mais necessaacuterios nos proacuteximos passos
Observe-se que natildeo eacute necessaacuterio multiplicar o paracircmetro ξ por alguma norma ou
meacutedia aritmeacutetica dos elementos da matriz de coeficientes como realizado no
preacute-condicionador ILUT(τρ) porque o erro independe dos valores dos elementos
151
da matriz de coeficientes Este preacute-condicionador usa apenas um uacutenico
paracircmetro ξ Esta caracteriacutestica facilita o ajuste dos paracircmetros do solucionador
como seraacute visto nas proacuteximas seccedilotildees e no proacuteximo capiacutetulo
47 Meacutetodo Convencional Para Ajuste dos Paracircmetros dos Solucionadores
O ajuste dos paracircmetros de um solucionador iterativo eacute considerado fundamental
para garantir sua robustez e eficiecircncia computacional principalmente em
anaacutelises mais complexas como aquelas que solucionam vaacuterios fluxos de carga
com diferentes pontos de operaccedilatildeo Nesses casos a escolha de valores
apropriados para os paracircmetros se torna ainda mais relevante
A ideacuteia fundamental eacute escolher os valores dos paracircmetros que permitam
preencher o menor nuacutemero de elementos sem prejudicar a qualidade do preacute-
condicionador isto eacute sem tornaacute-lo muito diferente de A Poreacutem a escolha de
valores apropriados para os paracircmetros eacute uma tarefa difiacutecil jaacute que existe uma
interdependecircncia com as toleracircncias relativa e absoluta do GMRES e com o tipo
de problema que estaacute sendo solucionado
Pouco tem sido pesquisado em relaccedilatildeo a este tema apenas em (de Leon amp
Semlyen 2002) apresenta-se uma foacutermula que permite calcular para cada
sistema eleacutetrico o valor do paracircmetro limitante τ no preacute-condicionador ILU(τ)
dado por (322) onde τ eacute igual agrave metade do nuacutemero de equaccedilotildees totais Neq do
sistema linear Na praacutetica estaacute foacutermula natildeo garante robustez nem o melhor
desempenho do solucionador
eq
12 N
τ =sdot
(425)
No entanto o procedimento convencional define primeiro valores arbitraacuterios para
as duas toleracircncias absoluta e relativa do GMRES Nas simulaccedilotildees realizadas
nos capiacutetulos anteriores se usou toleracircncias iguais (10-5) e menores que a
toleracircncia usada no teste de convergecircncia do algoritmo Newton-Raphson pois
toleracircncias maiores costumam impedir a convergecircncia do Newton-Raphson
152
Uma vez definidas as toleracircncias a escolha dos paracircmetros do preacute-
condicionador eacute realizada com base em tentativa e erro
Este meacutetodo natildeo considera a possibilidade de encontrar melhores desempenhos
para outras toleracircncias do GMRES que natildeo necessariamente devem ser
consideradas iguais Durante o procedimento de tentativa e erro o meacutetodo pode
encontrar um miacutenimo nuacutemero de operaccedilotildees local (MFLOPSL) associado com τL
como ilustrado na Figura 47 que natildeo necessariamente eacute o menor possiacutevel
(MFLOPSG) Observa-se que para obter o miacutenimo nuacutemero de operaccedilotildees global
(MFLOPSG) o procedimento de tentativa e erro deveria comeccedilar com um valor
de τ proacuteximo de τG
Figura 47 ndash Procedimento de tentativa e erro para busca de valores de um paracircmetro do preacute-condicionador
Quando o preacute-condicionador possui um segundo paracircmetro o procedimento de
tentativa e erro eacute repetido para este segundo paracircmetro fixando-se o primeiro
paracircmetro
48 Meacutetodo Proposto Para Ajuste dos Paracircmetros dos Solucio nadores
O meacutetodo proposto consiste em realizar sucessivas simulaccedilotildees de fluxo de
carga variando simultaneamente todos os paracircmetros do solucionador e
registrando o nuacutemero de operaccedilotildees de ponto flutuante para cada caso gerado O
objetivo eacute encontrar regiotildees de valores para os paracircmetros onde o solucionador
153
apresente alto desempenho permitindo estabelecer e recomendar faixas para os
valores dos paracircmetros onde o solucionador garante convergecircncia com a maior
eficiecircncia possiacutevel O meacutetodo tambeacutem permite identificar as faixas de valores
onde o solucionador natildeo converge
O meacutetodo eacute ilustrado para ajustar os paracircmetros de duas configuraccedilotildees de
solucionador iterativo sendo estas o solucionador proposto neste trabalho
identificado como GMRES+ILU(ξ)+MD e o solucionador GMRES+ILUT(τρ)+MD
apresentado no capiacutetulo 2 Na Tabela 43 especificam-se os paracircmetros
associados a cada solucionador
Tabela 43 ndash Paracircmetros usados nos solucionadores
Solucionadores Meacutetodo Iterativo Preacute-condicionador
GMRES+ILU(ξ)+MD atol rtol
ξ
GMRES+ILUT(τρ)+MD τ ρ
481 Passos Fundamentais
Esta seccedilatildeo apresenta de maneira sucinta os passos envolvidos no meacutetodo para
ajuste dos paracircmetros dos solucionadores onde uma descriccedilatildeo geral eacute
mostrada na Figura 48 O primeiro passo refere-se agrave definiccedilatildeo do espaccedilo de
busca onde satildeo procurados os valores para os paracircmetros que garantem alto
desempenho do solucionador O segundo refere-se aos experimentos numeacutericos
realizados para avaliar o desempenho do solucionador considerando-se todas as
combinaccedilotildees possiacuteveis dos valores de seus paracircmetros definidos no espaccedilo de
busca O passo seguinte tem como objetivo calcular as faixas de valores
recomendaacuteveis para as toleracircncias absoluta e relativa do GMRES Finalmente o
quarto passo calcula as faixas de valores recomendaacuteveis para os paracircmetros do
preacute-condicionador
154
Figura 48 ndash Passos fundamentais para delimitaccedilatildeo dos paracircmetros do solucionador
Nas proacuteximas seccedilotildees os passos mais relevantes no contexto deste trabalho satildeo
discutidos mais detalhadamente
482 Estabelecimento do Espaccedilo de Busca
Para definir o espaccedilo de busca primeiramente deve-se estabelecer o domiacutenio de
cada paracircmetro isto eacute um valor miacutenimo e maacuteximo para cada toleracircncia do
GMRES e para cada paracircmetro do preacute-condicionador como mostrado na Tabela
44 e na Figura 49 Depois devem ser definidos valores intermediaacuterios para cada
paracircmetro sendo que o nuacutemero de valores totais eacute definido em funccedilatildeo do grau
de precisatildeo que se deseja conseguir nos paracircmetros
Finalmente o espaccedilo de busca eacute definido por todas as combinaccedilotildees possiacuteveis
entre as toleracircncias absoluta e relativa do GMRES como apresentado na Figura
49(a) e por todas as combinaccedilotildees possiacuteveis realizadas entre os paracircmetros do
preacute-condicionador como mostrado na Figura 49(b-c)
Para os valores especificados na Tabela 44 existem (m x n) combinaccedilotildees
possiacuteveis entre a toleracircncia absoluta e relativa (ver Figura 49(a)) e (q x p)
combinaccedilotildees possiacuteveis entre os paracircmetros τ e ρ do preacute-condicionador ILUT(τρ)
(ver Figura 49(c)) No caso do preacute-condicionador ILU(ξ) natildeo existem
combinaccedilotildees jaacute que este preacute-condicionador possui somente um uacutenico
paracircmetro Poreacutem existem k valores possiacuteveis para ξ (ver Figura 49(b))
Estabelecer Espaccedilo de Busca
Experimentos numeacutericos
Delimitar paracircmetros do preacute-condicionador
Delimitar toleracircncias do GMRES
155
Tabela 44 ndash Domiacutenios dos paracircmetros usados nos solucionadores
Paracircmetros Maacuteximo Miacutenimo Nuacutemero total de valores
atol atol1 atoln n
rtol rtol1 rtolm m
ξ ξ1 ξk k
τ τ1 τq q
ρ ρ1 ρp P
a) Espaccedilo de busca das toleracircncias do GMRES
b) Espaccedilo de busca dos paracircmetros do preacute-condicionador ILUT(ξ)
c) Espaccedilo de busca dos paracircmetros do preacute-
condicionador ILUT(τρ)
Figura 49 ndash Espaccedilo de busca dos paracircmetros do solucionador
483 Experimentos Numeacutericos
No segundo passo para cada combinaccedilatildeo das toleracircncias absoluta e relativa
(atolrtol) do espaccedilo de busca da Figura 49(a) satildeo simulados tantos Fluxos de
Carga quanto combinaccedilotildees dos paracircmetros do preacute-condicionador existam
registrando-se o nuacutemero de operaccedilotildees de ponto flutuante (MFLOPS) para cada
156
combinaccedilatildeo dos paracircmetros do preacute-condicionador Portanto para cada
combinaccedilatildeo (atolrtol) eacute gerado um graacutefico de eficiecircncia computacional (em
MFLOPS) em funccedilatildeo dos paracircmetros do preacute-condicionador como mostrado na
Figura 410(a) para o preacute-condicionador ILUT(τρ) e na Figura 410(b) para o
preacute-condicionador ILU(ξ)
a) Graacutefico de eficiecircncia para o preacute-condicionador ILUT(τρ)
b) Graacutefico de eficiecircncia para o preacute-condicionador ILU(ξ)
Figura 410 ndash Graacuteficos de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
Para cada graacutefico gerado eacute registrado o nuacutemero de operaccedilotildees de ponto flutuante
miacutenimo (MFLOPSmiacuten) e este valor eacute associado agrave sua correspondente combinaccedilatildeo
(atolrtol) Apoacutes terem sido realizados todos os experimentos e registrados todos
os MFLOPSmiacuten associados a todas as combinaccedilotildees (atolrtol) eacute gerado o graacutefico
de alta eficiecircncia Este graacutefico apresenta em escala de cores todos MFLOPSmiacuten
em funccedilatildeo de suas correspondentes combinaccedilotildees (atolrtol) como mostrado na
Figura 411 sendo que a cor azul estaacute associada com os menores MFLOPSmiacuten a
157
cor vermelha com os maiores MFLOPSmiacuten e em negrito os casos natildeo
convergentes
Observa-se que entre todos os valores registrados para MFLOPSmiacuten existe uma
regiatildeo que conteacutem os casos com os menores MFLOPSmiacuten Este valor chamado
de MFLOPSoacuteti eacute o nuacutemero miacutenimo de operaccedilotildees possiacutevel (global) e estaacute
associado com a regiatildeo quadrada em azul escuro segmentada pelas linhas
brancas Os pontos brancos indicam as posiccedilotildees de todas as combinaccedilotildees que
possuem nuacutemero de operaccedilotildees igual a MFLOPSoacuteti
Figura 411 ndash Graacuteficos de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
484 Delimitaccedilatildeo das Toleracircncias do GMRES
No terceiro passo a partir do graacutefico de alta eficiecircncia apresentado na sua forma
bidimensional na Figura 412 eacute segmentada a regiatildeo dos MFLOPSoacuteti Neste
caso esta regiatildeo eacute o quadrado azul do centro do graacutefico onde cada ponto
branco estaacute associado a uma combinaccedilatildeo (atolrtol) que apresenta o menor
nuacutemero de operaccedilotildees possiacutevel em todo o espaccedilo de busca (MFLOPSoacuteti) Este
graacutefico permite encontrar as faixas de valores (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do meacutetodo GMRES associadas ao melhor
desempenho possiacutevel
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
141
137
apresentado na seccedilatildeo 332 do capiacutetulo anterior para o sistema brasileiro de
3513 barras usando-se o preacute-condicionador ILU(0) para o caacutelculo dos fatores
incompletos No graacutefico da Figura 36(a) mostra-se que 8797 dos elementos
do preacute-condicionador M (83078) satildeo distintos dos encontrados na matriz
Jacobiana O graacutefico do erro em 42(b) permite se ter uma ideacuteia da dimensatildeo
destas diferenccedilas Dos 38738 elementos com erros entre 0 e 001 (pontos
azuis) 11360 tecircm erro igual a zero (elementos idecircnticos) e 27378 tecircm erros
menores que 001 Os erros nesta faixa de valores normalmente natildeo prejudicam
a convergecircncia do GMRES
As outras faixas de valores associadas aos pontos de cores verde amarelo e
vermelho normalmente prejudicam a convergecircncia do GMRES Esses erros
devem ser evitados e satildeo gerados quando alguns elementos importantes satildeo
descartados durante a fatoraccedilatildeo ILU(0) O maior erro provocado entre os
elementos de M e da Jacobiana eacute de 401931 e o erro total para este preacute-
condicionador eacute de 10632middot105 (norma de Frobenius) Para evitar que os erros
se propaguem enquanto eacute realizada a fatoraccedilatildeo eacute necessaacuterio calcular o erro
associado a cada elemento dos fatores triangulares antes de seu preenchimento
ou descarte Este erro deve tambeacutem considerar os erros propagados nos
caacutelculos futuros onde o elemento seja requerido Se este valor for zero ou
proacuteximo de zero entatildeo o elemento pode ser descartado caso contraacuterio deve ser
preenchido
a) Produto dos fatores incompletos (LrsquoUrsquo) do preacute-condicionador ILU(0)
b) Matriz R para o preacute-condicionador ILU(0)
Figura 42 ndash Erros produzidos pela regra de preenchimento com o preacute-condicionador ILU(0) para a matriz Jacobiana do sistema brasileiro de 3513 barras
142
Sejam L e U os fatores triangulares completos Lrsquo e Ursquo os fatores triangulares
incompletos apoacutes o descarte de um uacutenico elemento Lik o elemento descartado
em Lrsquo e Uki o elemento descartado em Ursquo (Lik = 0 ou Uki = 0) Usando a equaccedilatildeo
(311) (Mori et al 1996 Saad 2003 Benzi et al 1999b Benzi 2002) eacute possiacutevel
calcular o erro associado ao elemento Lik (45) e o erro associado ao elemento
Uki (46) Como mencionado anteriormente esses erros permitem ter uma ideacuteia
de quatildeo diferente se torna o preacute-condicionador M dos fatores triangulares
completos apoacutes os elementos Lik e Uki serem descartados Como os erros estatildeo
associados a um uacutenico elemento descartado as equaccedilotildees (45) e (46) podem
ser reescritas como em (47) e (48) respectivamente
R = L U - L Usdot sdot (45)
R = L U - L Usdot sdot (46)
)ik(LR = (L -L) Usdot (47)
)ik(UR = L (U-U)sdot (48)
Verifica-se que tanto a matriz diferenccedila (L-Lrsquo) como tambeacutem (U-Ursquo) possuem
apenas um elemento natildeo nulo Lik (descartado em Lrsquo) e Uki (descartado em Ursquo)
respectivamente como apresentado em (49) e (410)
ik
0
0 0
0 0 0
0 0 0 0
L L =
0 0 0 0 0
0 0 L 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
( - )
⋮ ⋱
⋯
⋯
⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱
⋯ ⋯ ⋯
(49)
143
ki
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 U 0 0
0 0 0 0 0
(U - U) =
0 0 0 0
0 0 0
0 0
0
⋯ ⋯ ⋯
⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯
⋯
⋯
⋱ ⋮
(410)
Pela substituiccedilatildeo de (49) e (410) nos produtos (L-Lrsquo)middotU como Lmiddot(U-Ursquo) resulta
em (411) e (412)
ik kk ik kk+1 ik ki ik kn
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
L - L) U =
0 0 0 0 0 0
0 0 L U L U L U L U
0 0 0 0 0 0
0 0 0 0 0 0
(
sdot
sdot sdot sdot sdot
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(411)
ki
k+1k ki
ik ki
nk ki
0 0 0 0 0
0 0 0 0 0
0 0 U 0 0
L (U - U) = 0 0 L U 0 0
0 0 L U 0 0
0 0 L U 0 0
sdot sdot
sdot
sdot
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
(412)
Conforme mencionado no capiacutetulo anterior uma das dificuldades para propor
uma regra de preenchimento estaacute em se reduzir o nuacutemero de operaccedilotildees
associadas com sua execuccedilatildeo dentro do algoritmo de preacute-condicionamento
144
Neste trabalho propotildee-se usar a norma-1 em (47) para o caacutelculo do erro
associado a um elemento de L e a norma-infin em (48) para o caacutelculo do erro
associado a um dado elemento de U como apresentado em (413) e (414) As
referidas normas aproveitam a estrutura das matrizes (411) e (412) evitando-se
a realizaccedilatildeo de operaccedilotildees adicionais sendo requeridas ao inveacutes disto apenas
comparaccedilotildees entre elementos Portanto substituindo (411) em (413) e (412)
em (414) e calculando-se as normas satildeo obtidas as equaccedilotildees (415) e (416)
que devem ser usadas na regra de preenchimento
)1ik(LR = (L -L) Usdot (413)
ki(U )R = L (U-U) infinsdot (414)
ik ik km(L )R = L max U m = [kn]sdot (415)
ki ki mk(U )R U max 1 L m=[k+1n]= sdot (416)
Na Figura 43 satildeo destacados em vermelho todos os elementos dos fatores
triangulares que satildeo requeridos para calcular o erro produzido quando o
elemento Lik (no quadrado) eacute descartado Jaacute na Figura 44 satildeo destacados em
azul todos os elementos necessaacuterios para calcular o erro produzido quando o
elemento Uki (encerrado no quadrado) eacute descartado Observa-se que para que
esta regra possa ser implementada tanto no fator triangular U como em L o
algoritmo de fatoraccedilatildeo deve ser capaz de calcular os elementos Ukk Ukk+1
Ukn (em vermelho) antes de decidir se o elemento Lik deve ser preenchido ou
descartado Semelhantemente deve ser capaz de calcular os elementos Lk+1k
Lnk (em azul) antes de decidir se o elemento Uki deve ser preenchido ou
descartado
145
Figura 43 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Lik
Figura 44 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Uki
45 Adequaccedilatildeo da Regra Baseada no Erro
Nesta seccedilatildeo a regra de preenchimento baseada no erro eacute adequada para ser
usada no preacute-condicionador ILUT(τρ) analisado no capiacutetulo anterior O preacute-
condicionador resultante seraacute chamado de preacute-condicionador de duplo
paracircmetro limitante ILUT(ξτ) Neste preacute-condicionador natildeo eacute mais necessaacuterio
usar o paracircmetro ρ
Conforme visto no Capiacutetulo 3 o algoritmo de fatoraccedilatildeo usado neste preacute-
condicionador eacute o IKJ e deriva da eliminaccedilatildeo de Gauss (Saad 2003) Este tipo
de algoritmo permite calcular os elementos Ukk Ukk+1 Ukn antes de decidir se
o elemento Lik deve ser preenchido ou descartado Poreacutem o algoritmo IKJ natildeo
permite calcular os elementos Lk+1k Lnk antes de decidir se o elemento Uki
deve ser preenchido ou descartado porque no mesmo os elementos de L e U
146
satildeo calculados por linhas uma de cada vez Portanto a regra baseada no erro
pode ser aplicada apenas nos elementos do fator L enquanto que uma variante
da regra convencional usada no ILUT(τρ) eacute usada para os elementos de U
O caacutelculo da norma-2 usada na regra de preenchimento convencional dada pela
raiz quadrada da soma dos quadrados dos elementos da linha pode exigir
consideraacutevel esforccedilo computacional dependendo da dimensatildeo da matriz de
coeficientes Portanto ao inveacutes de se usar esta norma para descartar os
elementos em U recomenda-se realizar a meacutedia aritmeacutetica dos elementos da i-
eacutesima linha da matriz de coeficientes original Este procedimento reduz o nuacutemero
de operaccedilotildees de ponto flutuante sem comprometer a qualidade do preacute-
condicionador No entanto a eficiecircncia de ambas as heuriacutesticas eacute inferior agrave da
regra baseada no erro para preenchimento dos elementos proposta no presente
trabalho O resultado eacute um preacute-condicionador que aplica dois criteacuterios para
definir sua regra de preenchimento da seguinte forma
De acordo com a relaccedilatildeo dada por (417) um elemento Lik eacute descartado se o
erro resultante for menor que a toleracircncia ξ usada para todas as linhas de L
Caso contraacuterio calcula-se Lik usando-se o elemento aik da matriz resultante do
processo de eliminaccedilatildeo de Gauss ateacute a correspondente etapa Jaacute para um
elemento Uik este eacute descartado se for menor que uma certa toleracircncia relativa
τi obtida multiplicando-se a toleracircncia absoluta τ pela meacutedia aritmeacutetica dos
elementos da i-eacutesima linha da matriz de coeficientes original O caacutelculo de w eacute
efetuado de acordo com o algoritmo de fatoraccedilatildeo IKJ apresentado no capiacutetulo
anterior
ik
ikik
(L )
ik (L )k=(1i-1)
kk
0 R= aL
RU
lt ξ ge ξ
(417)
ik
k i
k k ik=(i+1n)
0 w =U
w w
lt ge
ττ
(418)
A adaptaccedilatildeo da regra baseada no erro no preacute-condicionador ILUT(τρ) falha
devido ao fato do algoritmo de fatoraccedilatildeo IKJ natildeo permitir a aplicaccedilatildeo da regra
147
em ambos os fatores triangulares L e U dificultando a exploraccedilatildeo das vantagens
do uso desta regra A seguir mostra-se uma proposta para superar estes
problemas utilizando-se outro algoritmo de fatoraccedilatildeo que permite aplicar a regra
em ambos os fatores triangulares
46 Preacute-condicionador ILU( ξ) Baseado no Caacutelculo do Erro
Nesta seccedilatildeo propotildee-se uma eficiente e robusta estrateacutegia de preacute-
condicionamento da fatoraccedilatildeo incompleta ILU(ξ) derivada de uma versatildeo do
algoritmo de eliminaccedilatildeo de Gauss conhecido como Doolittle A maior vantagem
deste algoritmo eacute que permite usar de forma efetiva a regra de preenchimento
baseada no erro em ambos os fatores triangulares L e U
Os fatores L e U satildeo apresentados em (419) e (420) Os elementos da diagonal
de L satildeo iguais a um e a primeira linha de U eacute igual agrave primeira linha da matriz de
coeficientes A As equaccedilotildees usadas pelo algoritmo de Doolittle para calcular os
elementos dos fatores triangulares satildeo apresentadas em (422) e podem ser
obtidas ao se igualar cada elemento do produto dos fatores triangulares LmiddotU de
(419) e (420) aos elementos da matriz de coeficientes A apresentada em (421)
Estas equaccedilotildees podem ser implementadas computacionalmente de diferentes
formas todas baseadas na eliminaccedilatildeo de Gauss Teoricamente os diferentes
tipos de eliminaccedilatildeo de Gauss realizam o mesmo nuacutemero de operaccedilotildees de ponto
flutuante No entanto no contexto da fatoraccedilatildeo incompleta estas variantes
resultam em importantes diferenccedilas praacuteticas quando o interesse eacute utilizar a regra
de preenchimento baseada no erro
k-11
k1 kk 1
i1 ik 1 ik
n1 nk 1 nk ni
1 0 0 0 0
L 1 0 0 0
L L 1 0 0L
L L L 1 0
L L L L 1
minus
minus
minus
=
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(419)
148
11 1k 1 1k 1i 1n
k-1k-1 k-1k k-1i k-1n
kk ki kn
ii in
nn
U U U U U
0 U U U U
0 0 U U UU
0 0 0 U U
0 0 0 0 U
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(420)
11 1k 1 1k 1i 1n
k-11 k-1k-1 k-1k k-1i k-1n
k1 kk-1 kk ki kn
i1 ik-1 ik ii in
n1 nk-1 nk ni nn
a a a a a
a a a a a
a a a a aA
a a a a a
a a a a a
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(421)
k-1
ki ki kj jij=1
k-1
ik ij jkj=1
ikkk
U =a - [L U ] i=kn
a - [L U ]
L = i=k+1nU
sum
sum (422)
As equaccedilotildees de Doolittle podem gerar algoritmos de eliminaccedilatildeo de Gauss que
calculam os elementos dos fatores triangulares por linhas de forma similar agrave
fatoraccedilatildeo IKJ ou por colunas (Bodewig 1956 Wilkinson 1965 Dahlquist amp
Bjoumlrk 1974 Hoffman 2001) Em ambos algoritmos natildeo seria possiacutevel usar a
regra de preenchimento baseada no erro A partir de (422) propotildee-se usar o
algoritmo de eliminaccedilatildeo de Gauss apresentado na Figura 45 que permite
calcular os elementos dos fatores triangulares simultaneamente por linhas em U
e por colunas em L como mostrado na Figura 46
No passo k da eliminaccedilatildeo de Gauss os elementos da k-eacutesima linha de U e a k-
eacutesima coluna de L (identificados por linhas tracejadas) satildeo calculados utilizando
elementos jaacute computados anteriormente nas linhas e colunas de U e L Por
exemplo para se calcular o elemento Uki satildeo usados os elementos destacados
em azul enquanto que para calcular o elemento Lik satildeo usados os elementos
149
destacados em vermelho Observa-se que este algoritmo permite calcular
elementos de L em linhas posteriores agrave linha k Esta caracteriacutestica possibilita o
uso em U da regra de preenchimento baseada no erro
1 Para i = 1n Faccedila
2 min = Ji in
3 Para k = in Faccedila
4 Para j = 1i-1 Faccedila
5 mk = mk - LijmiddotUjk
6 Fim ndash Faccedila
7 Fim ndash Faccedila
8 Registrar Umax = maxmin
9 ni+1n = J i+1ni
10 Para k = i+1n Faccedila
11 Para j = 1i-1 Faccedila
12 nk = nk ndash LkjmiddotUji
13 Fim ndash Faccedila
14 Fim ndash Faccedila
15 n = nUii
16 Registrar Lmax = maxni+1n
17 Aplicar a regra de preenchimento baseada no erro em m e n
18 Ui in = m in
19 L i+1ni = n i+1n
20 Fim ndash Faccedila
Figura 45 ndash Algoritmo do preacute-condicionador ILU(ξ)
Figura 46 ndash Elementos necessaacuterios para calcular os elementos Lik e Uki durante a fatoraccedilatildeo triangular
150
No algoritmo da Figura 45 observa-se que no passo k os elementos da linha de
U satildeo armazenados no vetor m enquanto que os elementos da coluna de L satildeo
armazenados no vetor n (passos 5 e 12 respectivamente) Uma vez calculados
ambos os vetores procura-se o maior elemento de m sendo armazenado em
Umax e o maior elemento de n armazenado em Lmax (passos 8 e 16
respectivamente) Ambos os valores maacuteximos (em valores absolutos) satildeo
usados pela regra de preenchimento no passo 17 para descartar em m e n os
elementos associados com os menores erros e preencher a linha de U e a
coluna de L da seguinte forma
De acordo com as relaccedilotildees dadas por (423) e (424) tanto um elemento Lki
como tambeacutem um elemento Uik satildeo descartados se seus erros associados
foram menores que uma dada toleracircncia ξ usada para todas as colunas de L e
linhas de U Caso contraacuterio Lki eacute preenchido usando-se o valor armazenado
em nk e Uik eacute preenchido usando-se o valor armazenado em mk
ik
ikik
(U )
(U )kk=(in)
0 R =U
m R
lt ξ ge ξ
(423)
ik
ikki
(L )
(L )ki=(1+1n)
0 R=L
n R
lt ξ ge ξ
(424)
Como observado na Figura 46 o algoritmo da Figura 45 permite encontrar os
elementos Ukk Ukk+1 Ukn necessaacuterios para se calcular o erro associado ao
elemento Lki e os elementos Lk+1k Lnk que por sua vez satildeo necessaacuterios para
se calcular o erro associado ao elemento Uik Nota-se que os elementos
necessaacuterios para calcular o erro (passo k) satildeo calculados neste mesmo passo
portanto natildeo eacute necessaacuterio realizar grandes buscas de elementos nas matrizes L
e U Igualmente tambeacutem natildeo eacute necessaacuterio armazenar valores Umax Lmax ou
erros do passo k porque natildeo seratildeo mais necessaacuterios nos proacuteximos passos
Observe-se que natildeo eacute necessaacuterio multiplicar o paracircmetro ξ por alguma norma ou
meacutedia aritmeacutetica dos elementos da matriz de coeficientes como realizado no
preacute-condicionador ILUT(τρ) porque o erro independe dos valores dos elementos
151
da matriz de coeficientes Este preacute-condicionador usa apenas um uacutenico
paracircmetro ξ Esta caracteriacutestica facilita o ajuste dos paracircmetros do solucionador
como seraacute visto nas proacuteximas seccedilotildees e no proacuteximo capiacutetulo
47 Meacutetodo Convencional Para Ajuste dos Paracircmetros dos Solucionadores
O ajuste dos paracircmetros de um solucionador iterativo eacute considerado fundamental
para garantir sua robustez e eficiecircncia computacional principalmente em
anaacutelises mais complexas como aquelas que solucionam vaacuterios fluxos de carga
com diferentes pontos de operaccedilatildeo Nesses casos a escolha de valores
apropriados para os paracircmetros se torna ainda mais relevante
A ideacuteia fundamental eacute escolher os valores dos paracircmetros que permitam
preencher o menor nuacutemero de elementos sem prejudicar a qualidade do preacute-
condicionador isto eacute sem tornaacute-lo muito diferente de A Poreacutem a escolha de
valores apropriados para os paracircmetros eacute uma tarefa difiacutecil jaacute que existe uma
interdependecircncia com as toleracircncias relativa e absoluta do GMRES e com o tipo
de problema que estaacute sendo solucionado
Pouco tem sido pesquisado em relaccedilatildeo a este tema apenas em (de Leon amp
Semlyen 2002) apresenta-se uma foacutermula que permite calcular para cada
sistema eleacutetrico o valor do paracircmetro limitante τ no preacute-condicionador ILU(τ)
dado por (322) onde τ eacute igual agrave metade do nuacutemero de equaccedilotildees totais Neq do
sistema linear Na praacutetica estaacute foacutermula natildeo garante robustez nem o melhor
desempenho do solucionador
eq
12 N
τ =sdot
(425)
No entanto o procedimento convencional define primeiro valores arbitraacuterios para
as duas toleracircncias absoluta e relativa do GMRES Nas simulaccedilotildees realizadas
nos capiacutetulos anteriores se usou toleracircncias iguais (10-5) e menores que a
toleracircncia usada no teste de convergecircncia do algoritmo Newton-Raphson pois
toleracircncias maiores costumam impedir a convergecircncia do Newton-Raphson
152
Uma vez definidas as toleracircncias a escolha dos paracircmetros do preacute-
condicionador eacute realizada com base em tentativa e erro
Este meacutetodo natildeo considera a possibilidade de encontrar melhores desempenhos
para outras toleracircncias do GMRES que natildeo necessariamente devem ser
consideradas iguais Durante o procedimento de tentativa e erro o meacutetodo pode
encontrar um miacutenimo nuacutemero de operaccedilotildees local (MFLOPSL) associado com τL
como ilustrado na Figura 47 que natildeo necessariamente eacute o menor possiacutevel
(MFLOPSG) Observa-se que para obter o miacutenimo nuacutemero de operaccedilotildees global
(MFLOPSG) o procedimento de tentativa e erro deveria comeccedilar com um valor
de τ proacuteximo de τG
Figura 47 ndash Procedimento de tentativa e erro para busca de valores de um paracircmetro do preacute-condicionador
Quando o preacute-condicionador possui um segundo paracircmetro o procedimento de
tentativa e erro eacute repetido para este segundo paracircmetro fixando-se o primeiro
paracircmetro
48 Meacutetodo Proposto Para Ajuste dos Paracircmetros dos Solucio nadores
O meacutetodo proposto consiste em realizar sucessivas simulaccedilotildees de fluxo de
carga variando simultaneamente todos os paracircmetros do solucionador e
registrando o nuacutemero de operaccedilotildees de ponto flutuante para cada caso gerado O
objetivo eacute encontrar regiotildees de valores para os paracircmetros onde o solucionador
153
apresente alto desempenho permitindo estabelecer e recomendar faixas para os
valores dos paracircmetros onde o solucionador garante convergecircncia com a maior
eficiecircncia possiacutevel O meacutetodo tambeacutem permite identificar as faixas de valores
onde o solucionador natildeo converge
O meacutetodo eacute ilustrado para ajustar os paracircmetros de duas configuraccedilotildees de
solucionador iterativo sendo estas o solucionador proposto neste trabalho
identificado como GMRES+ILU(ξ)+MD e o solucionador GMRES+ILUT(τρ)+MD
apresentado no capiacutetulo 2 Na Tabela 43 especificam-se os paracircmetros
associados a cada solucionador
Tabela 43 ndash Paracircmetros usados nos solucionadores
Solucionadores Meacutetodo Iterativo Preacute-condicionador
GMRES+ILU(ξ)+MD atol rtol
ξ
GMRES+ILUT(τρ)+MD τ ρ
481 Passos Fundamentais
Esta seccedilatildeo apresenta de maneira sucinta os passos envolvidos no meacutetodo para
ajuste dos paracircmetros dos solucionadores onde uma descriccedilatildeo geral eacute
mostrada na Figura 48 O primeiro passo refere-se agrave definiccedilatildeo do espaccedilo de
busca onde satildeo procurados os valores para os paracircmetros que garantem alto
desempenho do solucionador O segundo refere-se aos experimentos numeacutericos
realizados para avaliar o desempenho do solucionador considerando-se todas as
combinaccedilotildees possiacuteveis dos valores de seus paracircmetros definidos no espaccedilo de
busca O passo seguinte tem como objetivo calcular as faixas de valores
recomendaacuteveis para as toleracircncias absoluta e relativa do GMRES Finalmente o
quarto passo calcula as faixas de valores recomendaacuteveis para os paracircmetros do
preacute-condicionador
154
Figura 48 ndash Passos fundamentais para delimitaccedilatildeo dos paracircmetros do solucionador
Nas proacuteximas seccedilotildees os passos mais relevantes no contexto deste trabalho satildeo
discutidos mais detalhadamente
482 Estabelecimento do Espaccedilo de Busca
Para definir o espaccedilo de busca primeiramente deve-se estabelecer o domiacutenio de
cada paracircmetro isto eacute um valor miacutenimo e maacuteximo para cada toleracircncia do
GMRES e para cada paracircmetro do preacute-condicionador como mostrado na Tabela
44 e na Figura 49 Depois devem ser definidos valores intermediaacuterios para cada
paracircmetro sendo que o nuacutemero de valores totais eacute definido em funccedilatildeo do grau
de precisatildeo que se deseja conseguir nos paracircmetros
Finalmente o espaccedilo de busca eacute definido por todas as combinaccedilotildees possiacuteveis
entre as toleracircncias absoluta e relativa do GMRES como apresentado na Figura
49(a) e por todas as combinaccedilotildees possiacuteveis realizadas entre os paracircmetros do
preacute-condicionador como mostrado na Figura 49(b-c)
Para os valores especificados na Tabela 44 existem (m x n) combinaccedilotildees
possiacuteveis entre a toleracircncia absoluta e relativa (ver Figura 49(a)) e (q x p)
combinaccedilotildees possiacuteveis entre os paracircmetros τ e ρ do preacute-condicionador ILUT(τρ)
(ver Figura 49(c)) No caso do preacute-condicionador ILU(ξ) natildeo existem
combinaccedilotildees jaacute que este preacute-condicionador possui somente um uacutenico
paracircmetro Poreacutem existem k valores possiacuteveis para ξ (ver Figura 49(b))
Estabelecer Espaccedilo de Busca
Experimentos numeacutericos
Delimitar paracircmetros do preacute-condicionador
Delimitar toleracircncias do GMRES
155
Tabela 44 ndash Domiacutenios dos paracircmetros usados nos solucionadores
Paracircmetros Maacuteximo Miacutenimo Nuacutemero total de valores
atol atol1 atoln n
rtol rtol1 rtolm m
ξ ξ1 ξk k
τ τ1 τq q
ρ ρ1 ρp P
a) Espaccedilo de busca das toleracircncias do GMRES
b) Espaccedilo de busca dos paracircmetros do preacute-condicionador ILUT(ξ)
c) Espaccedilo de busca dos paracircmetros do preacute-
condicionador ILUT(τρ)
Figura 49 ndash Espaccedilo de busca dos paracircmetros do solucionador
483 Experimentos Numeacutericos
No segundo passo para cada combinaccedilatildeo das toleracircncias absoluta e relativa
(atolrtol) do espaccedilo de busca da Figura 49(a) satildeo simulados tantos Fluxos de
Carga quanto combinaccedilotildees dos paracircmetros do preacute-condicionador existam
registrando-se o nuacutemero de operaccedilotildees de ponto flutuante (MFLOPS) para cada
156
combinaccedilatildeo dos paracircmetros do preacute-condicionador Portanto para cada
combinaccedilatildeo (atolrtol) eacute gerado um graacutefico de eficiecircncia computacional (em
MFLOPS) em funccedilatildeo dos paracircmetros do preacute-condicionador como mostrado na
Figura 410(a) para o preacute-condicionador ILUT(τρ) e na Figura 410(b) para o
preacute-condicionador ILU(ξ)
a) Graacutefico de eficiecircncia para o preacute-condicionador ILUT(τρ)
b) Graacutefico de eficiecircncia para o preacute-condicionador ILU(ξ)
Figura 410 ndash Graacuteficos de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
Para cada graacutefico gerado eacute registrado o nuacutemero de operaccedilotildees de ponto flutuante
miacutenimo (MFLOPSmiacuten) e este valor eacute associado agrave sua correspondente combinaccedilatildeo
(atolrtol) Apoacutes terem sido realizados todos os experimentos e registrados todos
os MFLOPSmiacuten associados a todas as combinaccedilotildees (atolrtol) eacute gerado o graacutefico
de alta eficiecircncia Este graacutefico apresenta em escala de cores todos MFLOPSmiacuten
em funccedilatildeo de suas correspondentes combinaccedilotildees (atolrtol) como mostrado na
Figura 411 sendo que a cor azul estaacute associada com os menores MFLOPSmiacuten a
157
cor vermelha com os maiores MFLOPSmiacuten e em negrito os casos natildeo
convergentes
Observa-se que entre todos os valores registrados para MFLOPSmiacuten existe uma
regiatildeo que conteacutem os casos com os menores MFLOPSmiacuten Este valor chamado
de MFLOPSoacuteti eacute o nuacutemero miacutenimo de operaccedilotildees possiacutevel (global) e estaacute
associado com a regiatildeo quadrada em azul escuro segmentada pelas linhas
brancas Os pontos brancos indicam as posiccedilotildees de todas as combinaccedilotildees que
possuem nuacutemero de operaccedilotildees igual a MFLOPSoacuteti
Figura 411 ndash Graacuteficos de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
484 Delimitaccedilatildeo das Toleracircncias do GMRES
No terceiro passo a partir do graacutefico de alta eficiecircncia apresentado na sua forma
bidimensional na Figura 412 eacute segmentada a regiatildeo dos MFLOPSoacuteti Neste
caso esta regiatildeo eacute o quadrado azul do centro do graacutefico onde cada ponto
branco estaacute associado a uma combinaccedilatildeo (atolrtol) que apresenta o menor
nuacutemero de operaccedilotildees possiacutevel em todo o espaccedilo de busca (MFLOPSoacuteti) Este
graacutefico permite encontrar as faixas de valores (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do meacutetodo GMRES associadas ao melhor
desempenho possiacutevel
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
142
Sejam L e U os fatores triangulares completos Lrsquo e Ursquo os fatores triangulares
incompletos apoacutes o descarte de um uacutenico elemento Lik o elemento descartado
em Lrsquo e Uki o elemento descartado em Ursquo (Lik = 0 ou Uki = 0) Usando a equaccedilatildeo
(311) (Mori et al 1996 Saad 2003 Benzi et al 1999b Benzi 2002) eacute possiacutevel
calcular o erro associado ao elemento Lik (45) e o erro associado ao elemento
Uki (46) Como mencionado anteriormente esses erros permitem ter uma ideacuteia
de quatildeo diferente se torna o preacute-condicionador M dos fatores triangulares
completos apoacutes os elementos Lik e Uki serem descartados Como os erros estatildeo
associados a um uacutenico elemento descartado as equaccedilotildees (45) e (46) podem
ser reescritas como em (47) e (48) respectivamente
R = L U - L Usdot sdot (45)
R = L U - L Usdot sdot (46)
)ik(LR = (L -L) Usdot (47)
)ik(UR = L (U-U)sdot (48)
Verifica-se que tanto a matriz diferenccedila (L-Lrsquo) como tambeacutem (U-Ursquo) possuem
apenas um elemento natildeo nulo Lik (descartado em Lrsquo) e Uki (descartado em Ursquo)
respectivamente como apresentado em (49) e (410)
ik
0
0 0
0 0 0
0 0 0 0
L L =
0 0 0 0 0
0 0 L 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
( - )
⋮ ⋱
⋯
⋯
⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱
⋯ ⋯ ⋯
(49)
143
ki
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 U 0 0
0 0 0 0 0
(U - U) =
0 0 0 0
0 0 0
0 0
0
⋯ ⋯ ⋯
⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯
⋯
⋯
⋱ ⋮
(410)
Pela substituiccedilatildeo de (49) e (410) nos produtos (L-Lrsquo)middotU como Lmiddot(U-Ursquo) resulta
em (411) e (412)
ik kk ik kk+1 ik ki ik kn
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
L - L) U =
0 0 0 0 0 0
0 0 L U L U L U L U
0 0 0 0 0 0
0 0 0 0 0 0
(
sdot
sdot sdot sdot sdot
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(411)
ki
k+1k ki
ik ki
nk ki
0 0 0 0 0
0 0 0 0 0
0 0 U 0 0
L (U - U) = 0 0 L U 0 0
0 0 L U 0 0
0 0 L U 0 0
sdot sdot
sdot
sdot
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
(412)
Conforme mencionado no capiacutetulo anterior uma das dificuldades para propor
uma regra de preenchimento estaacute em se reduzir o nuacutemero de operaccedilotildees
associadas com sua execuccedilatildeo dentro do algoritmo de preacute-condicionamento
144
Neste trabalho propotildee-se usar a norma-1 em (47) para o caacutelculo do erro
associado a um elemento de L e a norma-infin em (48) para o caacutelculo do erro
associado a um dado elemento de U como apresentado em (413) e (414) As
referidas normas aproveitam a estrutura das matrizes (411) e (412) evitando-se
a realizaccedilatildeo de operaccedilotildees adicionais sendo requeridas ao inveacutes disto apenas
comparaccedilotildees entre elementos Portanto substituindo (411) em (413) e (412)
em (414) e calculando-se as normas satildeo obtidas as equaccedilotildees (415) e (416)
que devem ser usadas na regra de preenchimento
)1ik(LR = (L -L) Usdot (413)
ki(U )R = L (U-U) infinsdot (414)
ik ik km(L )R = L max U m = [kn]sdot (415)
ki ki mk(U )R U max 1 L m=[k+1n]= sdot (416)
Na Figura 43 satildeo destacados em vermelho todos os elementos dos fatores
triangulares que satildeo requeridos para calcular o erro produzido quando o
elemento Lik (no quadrado) eacute descartado Jaacute na Figura 44 satildeo destacados em
azul todos os elementos necessaacuterios para calcular o erro produzido quando o
elemento Uki (encerrado no quadrado) eacute descartado Observa-se que para que
esta regra possa ser implementada tanto no fator triangular U como em L o
algoritmo de fatoraccedilatildeo deve ser capaz de calcular os elementos Ukk Ukk+1
Ukn (em vermelho) antes de decidir se o elemento Lik deve ser preenchido ou
descartado Semelhantemente deve ser capaz de calcular os elementos Lk+1k
Lnk (em azul) antes de decidir se o elemento Uki deve ser preenchido ou
descartado
145
Figura 43 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Lik
Figura 44 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Uki
45 Adequaccedilatildeo da Regra Baseada no Erro
Nesta seccedilatildeo a regra de preenchimento baseada no erro eacute adequada para ser
usada no preacute-condicionador ILUT(τρ) analisado no capiacutetulo anterior O preacute-
condicionador resultante seraacute chamado de preacute-condicionador de duplo
paracircmetro limitante ILUT(ξτ) Neste preacute-condicionador natildeo eacute mais necessaacuterio
usar o paracircmetro ρ
Conforme visto no Capiacutetulo 3 o algoritmo de fatoraccedilatildeo usado neste preacute-
condicionador eacute o IKJ e deriva da eliminaccedilatildeo de Gauss (Saad 2003) Este tipo
de algoritmo permite calcular os elementos Ukk Ukk+1 Ukn antes de decidir se
o elemento Lik deve ser preenchido ou descartado Poreacutem o algoritmo IKJ natildeo
permite calcular os elementos Lk+1k Lnk antes de decidir se o elemento Uki
deve ser preenchido ou descartado porque no mesmo os elementos de L e U
146
satildeo calculados por linhas uma de cada vez Portanto a regra baseada no erro
pode ser aplicada apenas nos elementos do fator L enquanto que uma variante
da regra convencional usada no ILUT(τρ) eacute usada para os elementos de U
O caacutelculo da norma-2 usada na regra de preenchimento convencional dada pela
raiz quadrada da soma dos quadrados dos elementos da linha pode exigir
consideraacutevel esforccedilo computacional dependendo da dimensatildeo da matriz de
coeficientes Portanto ao inveacutes de se usar esta norma para descartar os
elementos em U recomenda-se realizar a meacutedia aritmeacutetica dos elementos da i-
eacutesima linha da matriz de coeficientes original Este procedimento reduz o nuacutemero
de operaccedilotildees de ponto flutuante sem comprometer a qualidade do preacute-
condicionador No entanto a eficiecircncia de ambas as heuriacutesticas eacute inferior agrave da
regra baseada no erro para preenchimento dos elementos proposta no presente
trabalho O resultado eacute um preacute-condicionador que aplica dois criteacuterios para
definir sua regra de preenchimento da seguinte forma
De acordo com a relaccedilatildeo dada por (417) um elemento Lik eacute descartado se o
erro resultante for menor que a toleracircncia ξ usada para todas as linhas de L
Caso contraacuterio calcula-se Lik usando-se o elemento aik da matriz resultante do
processo de eliminaccedilatildeo de Gauss ateacute a correspondente etapa Jaacute para um
elemento Uik este eacute descartado se for menor que uma certa toleracircncia relativa
τi obtida multiplicando-se a toleracircncia absoluta τ pela meacutedia aritmeacutetica dos
elementos da i-eacutesima linha da matriz de coeficientes original O caacutelculo de w eacute
efetuado de acordo com o algoritmo de fatoraccedilatildeo IKJ apresentado no capiacutetulo
anterior
ik
ikik
(L )
ik (L )k=(1i-1)
kk
0 R= aL
RU
lt ξ ge ξ
(417)
ik
k i
k k ik=(i+1n)
0 w =U
w w
lt ge
ττ
(418)
A adaptaccedilatildeo da regra baseada no erro no preacute-condicionador ILUT(τρ) falha
devido ao fato do algoritmo de fatoraccedilatildeo IKJ natildeo permitir a aplicaccedilatildeo da regra
147
em ambos os fatores triangulares L e U dificultando a exploraccedilatildeo das vantagens
do uso desta regra A seguir mostra-se uma proposta para superar estes
problemas utilizando-se outro algoritmo de fatoraccedilatildeo que permite aplicar a regra
em ambos os fatores triangulares
46 Preacute-condicionador ILU( ξ) Baseado no Caacutelculo do Erro
Nesta seccedilatildeo propotildee-se uma eficiente e robusta estrateacutegia de preacute-
condicionamento da fatoraccedilatildeo incompleta ILU(ξ) derivada de uma versatildeo do
algoritmo de eliminaccedilatildeo de Gauss conhecido como Doolittle A maior vantagem
deste algoritmo eacute que permite usar de forma efetiva a regra de preenchimento
baseada no erro em ambos os fatores triangulares L e U
Os fatores L e U satildeo apresentados em (419) e (420) Os elementos da diagonal
de L satildeo iguais a um e a primeira linha de U eacute igual agrave primeira linha da matriz de
coeficientes A As equaccedilotildees usadas pelo algoritmo de Doolittle para calcular os
elementos dos fatores triangulares satildeo apresentadas em (422) e podem ser
obtidas ao se igualar cada elemento do produto dos fatores triangulares LmiddotU de
(419) e (420) aos elementos da matriz de coeficientes A apresentada em (421)
Estas equaccedilotildees podem ser implementadas computacionalmente de diferentes
formas todas baseadas na eliminaccedilatildeo de Gauss Teoricamente os diferentes
tipos de eliminaccedilatildeo de Gauss realizam o mesmo nuacutemero de operaccedilotildees de ponto
flutuante No entanto no contexto da fatoraccedilatildeo incompleta estas variantes
resultam em importantes diferenccedilas praacuteticas quando o interesse eacute utilizar a regra
de preenchimento baseada no erro
k-11
k1 kk 1
i1 ik 1 ik
n1 nk 1 nk ni
1 0 0 0 0
L 1 0 0 0
L L 1 0 0L
L L L 1 0
L L L L 1
minus
minus
minus
=
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(419)
148
11 1k 1 1k 1i 1n
k-1k-1 k-1k k-1i k-1n
kk ki kn
ii in
nn
U U U U U
0 U U U U
0 0 U U UU
0 0 0 U U
0 0 0 0 U
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(420)
11 1k 1 1k 1i 1n
k-11 k-1k-1 k-1k k-1i k-1n
k1 kk-1 kk ki kn
i1 ik-1 ik ii in
n1 nk-1 nk ni nn
a a a a a
a a a a a
a a a a aA
a a a a a
a a a a a
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(421)
k-1
ki ki kj jij=1
k-1
ik ij jkj=1
ikkk
U =a - [L U ] i=kn
a - [L U ]
L = i=k+1nU
sum
sum (422)
As equaccedilotildees de Doolittle podem gerar algoritmos de eliminaccedilatildeo de Gauss que
calculam os elementos dos fatores triangulares por linhas de forma similar agrave
fatoraccedilatildeo IKJ ou por colunas (Bodewig 1956 Wilkinson 1965 Dahlquist amp
Bjoumlrk 1974 Hoffman 2001) Em ambos algoritmos natildeo seria possiacutevel usar a
regra de preenchimento baseada no erro A partir de (422) propotildee-se usar o
algoritmo de eliminaccedilatildeo de Gauss apresentado na Figura 45 que permite
calcular os elementos dos fatores triangulares simultaneamente por linhas em U
e por colunas em L como mostrado na Figura 46
No passo k da eliminaccedilatildeo de Gauss os elementos da k-eacutesima linha de U e a k-
eacutesima coluna de L (identificados por linhas tracejadas) satildeo calculados utilizando
elementos jaacute computados anteriormente nas linhas e colunas de U e L Por
exemplo para se calcular o elemento Uki satildeo usados os elementos destacados
em azul enquanto que para calcular o elemento Lik satildeo usados os elementos
149
destacados em vermelho Observa-se que este algoritmo permite calcular
elementos de L em linhas posteriores agrave linha k Esta caracteriacutestica possibilita o
uso em U da regra de preenchimento baseada no erro
1 Para i = 1n Faccedila
2 min = Ji in
3 Para k = in Faccedila
4 Para j = 1i-1 Faccedila
5 mk = mk - LijmiddotUjk
6 Fim ndash Faccedila
7 Fim ndash Faccedila
8 Registrar Umax = maxmin
9 ni+1n = J i+1ni
10 Para k = i+1n Faccedila
11 Para j = 1i-1 Faccedila
12 nk = nk ndash LkjmiddotUji
13 Fim ndash Faccedila
14 Fim ndash Faccedila
15 n = nUii
16 Registrar Lmax = maxni+1n
17 Aplicar a regra de preenchimento baseada no erro em m e n
18 Ui in = m in
19 L i+1ni = n i+1n
20 Fim ndash Faccedila
Figura 45 ndash Algoritmo do preacute-condicionador ILU(ξ)
Figura 46 ndash Elementos necessaacuterios para calcular os elementos Lik e Uki durante a fatoraccedilatildeo triangular
150
No algoritmo da Figura 45 observa-se que no passo k os elementos da linha de
U satildeo armazenados no vetor m enquanto que os elementos da coluna de L satildeo
armazenados no vetor n (passos 5 e 12 respectivamente) Uma vez calculados
ambos os vetores procura-se o maior elemento de m sendo armazenado em
Umax e o maior elemento de n armazenado em Lmax (passos 8 e 16
respectivamente) Ambos os valores maacuteximos (em valores absolutos) satildeo
usados pela regra de preenchimento no passo 17 para descartar em m e n os
elementos associados com os menores erros e preencher a linha de U e a
coluna de L da seguinte forma
De acordo com as relaccedilotildees dadas por (423) e (424) tanto um elemento Lki
como tambeacutem um elemento Uik satildeo descartados se seus erros associados
foram menores que uma dada toleracircncia ξ usada para todas as colunas de L e
linhas de U Caso contraacuterio Lki eacute preenchido usando-se o valor armazenado
em nk e Uik eacute preenchido usando-se o valor armazenado em mk
ik
ikik
(U )
(U )kk=(in)
0 R =U
m R
lt ξ ge ξ
(423)
ik
ikki
(L )
(L )ki=(1+1n)
0 R=L
n R
lt ξ ge ξ
(424)
Como observado na Figura 46 o algoritmo da Figura 45 permite encontrar os
elementos Ukk Ukk+1 Ukn necessaacuterios para se calcular o erro associado ao
elemento Lki e os elementos Lk+1k Lnk que por sua vez satildeo necessaacuterios para
se calcular o erro associado ao elemento Uik Nota-se que os elementos
necessaacuterios para calcular o erro (passo k) satildeo calculados neste mesmo passo
portanto natildeo eacute necessaacuterio realizar grandes buscas de elementos nas matrizes L
e U Igualmente tambeacutem natildeo eacute necessaacuterio armazenar valores Umax Lmax ou
erros do passo k porque natildeo seratildeo mais necessaacuterios nos proacuteximos passos
Observe-se que natildeo eacute necessaacuterio multiplicar o paracircmetro ξ por alguma norma ou
meacutedia aritmeacutetica dos elementos da matriz de coeficientes como realizado no
preacute-condicionador ILUT(τρ) porque o erro independe dos valores dos elementos
151
da matriz de coeficientes Este preacute-condicionador usa apenas um uacutenico
paracircmetro ξ Esta caracteriacutestica facilita o ajuste dos paracircmetros do solucionador
como seraacute visto nas proacuteximas seccedilotildees e no proacuteximo capiacutetulo
47 Meacutetodo Convencional Para Ajuste dos Paracircmetros dos Solucionadores
O ajuste dos paracircmetros de um solucionador iterativo eacute considerado fundamental
para garantir sua robustez e eficiecircncia computacional principalmente em
anaacutelises mais complexas como aquelas que solucionam vaacuterios fluxos de carga
com diferentes pontos de operaccedilatildeo Nesses casos a escolha de valores
apropriados para os paracircmetros se torna ainda mais relevante
A ideacuteia fundamental eacute escolher os valores dos paracircmetros que permitam
preencher o menor nuacutemero de elementos sem prejudicar a qualidade do preacute-
condicionador isto eacute sem tornaacute-lo muito diferente de A Poreacutem a escolha de
valores apropriados para os paracircmetros eacute uma tarefa difiacutecil jaacute que existe uma
interdependecircncia com as toleracircncias relativa e absoluta do GMRES e com o tipo
de problema que estaacute sendo solucionado
Pouco tem sido pesquisado em relaccedilatildeo a este tema apenas em (de Leon amp
Semlyen 2002) apresenta-se uma foacutermula que permite calcular para cada
sistema eleacutetrico o valor do paracircmetro limitante τ no preacute-condicionador ILU(τ)
dado por (322) onde τ eacute igual agrave metade do nuacutemero de equaccedilotildees totais Neq do
sistema linear Na praacutetica estaacute foacutermula natildeo garante robustez nem o melhor
desempenho do solucionador
eq
12 N
τ =sdot
(425)
No entanto o procedimento convencional define primeiro valores arbitraacuterios para
as duas toleracircncias absoluta e relativa do GMRES Nas simulaccedilotildees realizadas
nos capiacutetulos anteriores se usou toleracircncias iguais (10-5) e menores que a
toleracircncia usada no teste de convergecircncia do algoritmo Newton-Raphson pois
toleracircncias maiores costumam impedir a convergecircncia do Newton-Raphson
152
Uma vez definidas as toleracircncias a escolha dos paracircmetros do preacute-
condicionador eacute realizada com base em tentativa e erro
Este meacutetodo natildeo considera a possibilidade de encontrar melhores desempenhos
para outras toleracircncias do GMRES que natildeo necessariamente devem ser
consideradas iguais Durante o procedimento de tentativa e erro o meacutetodo pode
encontrar um miacutenimo nuacutemero de operaccedilotildees local (MFLOPSL) associado com τL
como ilustrado na Figura 47 que natildeo necessariamente eacute o menor possiacutevel
(MFLOPSG) Observa-se que para obter o miacutenimo nuacutemero de operaccedilotildees global
(MFLOPSG) o procedimento de tentativa e erro deveria comeccedilar com um valor
de τ proacuteximo de τG
Figura 47 ndash Procedimento de tentativa e erro para busca de valores de um paracircmetro do preacute-condicionador
Quando o preacute-condicionador possui um segundo paracircmetro o procedimento de
tentativa e erro eacute repetido para este segundo paracircmetro fixando-se o primeiro
paracircmetro
48 Meacutetodo Proposto Para Ajuste dos Paracircmetros dos Solucio nadores
O meacutetodo proposto consiste em realizar sucessivas simulaccedilotildees de fluxo de
carga variando simultaneamente todos os paracircmetros do solucionador e
registrando o nuacutemero de operaccedilotildees de ponto flutuante para cada caso gerado O
objetivo eacute encontrar regiotildees de valores para os paracircmetros onde o solucionador
153
apresente alto desempenho permitindo estabelecer e recomendar faixas para os
valores dos paracircmetros onde o solucionador garante convergecircncia com a maior
eficiecircncia possiacutevel O meacutetodo tambeacutem permite identificar as faixas de valores
onde o solucionador natildeo converge
O meacutetodo eacute ilustrado para ajustar os paracircmetros de duas configuraccedilotildees de
solucionador iterativo sendo estas o solucionador proposto neste trabalho
identificado como GMRES+ILU(ξ)+MD e o solucionador GMRES+ILUT(τρ)+MD
apresentado no capiacutetulo 2 Na Tabela 43 especificam-se os paracircmetros
associados a cada solucionador
Tabela 43 ndash Paracircmetros usados nos solucionadores
Solucionadores Meacutetodo Iterativo Preacute-condicionador
GMRES+ILU(ξ)+MD atol rtol
ξ
GMRES+ILUT(τρ)+MD τ ρ
481 Passos Fundamentais
Esta seccedilatildeo apresenta de maneira sucinta os passos envolvidos no meacutetodo para
ajuste dos paracircmetros dos solucionadores onde uma descriccedilatildeo geral eacute
mostrada na Figura 48 O primeiro passo refere-se agrave definiccedilatildeo do espaccedilo de
busca onde satildeo procurados os valores para os paracircmetros que garantem alto
desempenho do solucionador O segundo refere-se aos experimentos numeacutericos
realizados para avaliar o desempenho do solucionador considerando-se todas as
combinaccedilotildees possiacuteveis dos valores de seus paracircmetros definidos no espaccedilo de
busca O passo seguinte tem como objetivo calcular as faixas de valores
recomendaacuteveis para as toleracircncias absoluta e relativa do GMRES Finalmente o
quarto passo calcula as faixas de valores recomendaacuteveis para os paracircmetros do
preacute-condicionador
154
Figura 48 ndash Passos fundamentais para delimitaccedilatildeo dos paracircmetros do solucionador
Nas proacuteximas seccedilotildees os passos mais relevantes no contexto deste trabalho satildeo
discutidos mais detalhadamente
482 Estabelecimento do Espaccedilo de Busca
Para definir o espaccedilo de busca primeiramente deve-se estabelecer o domiacutenio de
cada paracircmetro isto eacute um valor miacutenimo e maacuteximo para cada toleracircncia do
GMRES e para cada paracircmetro do preacute-condicionador como mostrado na Tabela
44 e na Figura 49 Depois devem ser definidos valores intermediaacuterios para cada
paracircmetro sendo que o nuacutemero de valores totais eacute definido em funccedilatildeo do grau
de precisatildeo que se deseja conseguir nos paracircmetros
Finalmente o espaccedilo de busca eacute definido por todas as combinaccedilotildees possiacuteveis
entre as toleracircncias absoluta e relativa do GMRES como apresentado na Figura
49(a) e por todas as combinaccedilotildees possiacuteveis realizadas entre os paracircmetros do
preacute-condicionador como mostrado na Figura 49(b-c)
Para os valores especificados na Tabela 44 existem (m x n) combinaccedilotildees
possiacuteveis entre a toleracircncia absoluta e relativa (ver Figura 49(a)) e (q x p)
combinaccedilotildees possiacuteveis entre os paracircmetros τ e ρ do preacute-condicionador ILUT(τρ)
(ver Figura 49(c)) No caso do preacute-condicionador ILU(ξ) natildeo existem
combinaccedilotildees jaacute que este preacute-condicionador possui somente um uacutenico
paracircmetro Poreacutem existem k valores possiacuteveis para ξ (ver Figura 49(b))
Estabelecer Espaccedilo de Busca
Experimentos numeacutericos
Delimitar paracircmetros do preacute-condicionador
Delimitar toleracircncias do GMRES
155
Tabela 44 ndash Domiacutenios dos paracircmetros usados nos solucionadores
Paracircmetros Maacuteximo Miacutenimo Nuacutemero total de valores
atol atol1 atoln n
rtol rtol1 rtolm m
ξ ξ1 ξk k
τ τ1 τq q
ρ ρ1 ρp P
a) Espaccedilo de busca das toleracircncias do GMRES
b) Espaccedilo de busca dos paracircmetros do preacute-condicionador ILUT(ξ)
c) Espaccedilo de busca dos paracircmetros do preacute-
condicionador ILUT(τρ)
Figura 49 ndash Espaccedilo de busca dos paracircmetros do solucionador
483 Experimentos Numeacutericos
No segundo passo para cada combinaccedilatildeo das toleracircncias absoluta e relativa
(atolrtol) do espaccedilo de busca da Figura 49(a) satildeo simulados tantos Fluxos de
Carga quanto combinaccedilotildees dos paracircmetros do preacute-condicionador existam
registrando-se o nuacutemero de operaccedilotildees de ponto flutuante (MFLOPS) para cada
156
combinaccedilatildeo dos paracircmetros do preacute-condicionador Portanto para cada
combinaccedilatildeo (atolrtol) eacute gerado um graacutefico de eficiecircncia computacional (em
MFLOPS) em funccedilatildeo dos paracircmetros do preacute-condicionador como mostrado na
Figura 410(a) para o preacute-condicionador ILUT(τρ) e na Figura 410(b) para o
preacute-condicionador ILU(ξ)
a) Graacutefico de eficiecircncia para o preacute-condicionador ILUT(τρ)
b) Graacutefico de eficiecircncia para o preacute-condicionador ILU(ξ)
Figura 410 ndash Graacuteficos de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
Para cada graacutefico gerado eacute registrado o nuacutemero de operaccedilotildees de ponto flutuante
miacutenimo (MFLOPSmiacuten) e este valor eacute associado agrave sua correspondente combinaccedilatildeo
(atolrtol) Apoacutes terem sido realizados todos os experimentos e registrados todos
os MFLOPSmiacuten associados a todas as combinaccedilotildees (atolrtol) eacute gerado o graacutefico
de alta eficiecircncia Este graacutefico apresenta em escala de cores todos MFLOPSmiacuten
em funccedilatildeo de suas correspondentes combinaccedilotildees (atolrtol) como mostrado na
Figura 411 sendo que a cor azul estaacute associada com os menores MFLOPSmiacuten a
157
cor vermelha com os maiores MFLOPSmiacuten e em negrito os casos natildeo
convergentes
Observa-se que entre todos os valores registrados para MFLOPSmiacuten existe uma
regiatildeo que conteacutem os casos com os menores MFLOPSmiacuten Este valor chamado
de MFLOPSoacuteti eacute o nuacutemero miacutenimo de operaccedilotildees possiacutevel (global) e estaacute
associado com a regiatildeo quadrada em azul escuro segmentada pelas linhas
brancas Os pontos brancos indicam as posiccedilotildees de todas as combinaccedilotildees que
possuem nuacutemero de operaccedilotildees igual a MFLOPSoacuteti
Figura 411 ndash Graacuteficos de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
484 Delimitaccedilatildeo das Toleracircncias do GMRES
No terceiro passo a partir do graacutefico de alta eficiecircncia apresentado na sua forma
bidimensional na Figura 412 eacute segmentada a regiatildeo dos MFLOPSoacuteti Neste
caso esta regiatildeo eacute o quadrado azul do centro do graacutefico onde cada ponto
branco estaacute associado a uma combinaccedilatildeo (atolrtol) que apresenta o menor
nuacutemero de operaccedilotildees possiacutevel em todo o espaccedilo de busca (MFLOPSoacuteti) Este
graacutefico permite encontrar as faixas de valores (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do meacutetodo GMRES associadas ao melhor
desempenho possiacutevel
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
143
ki
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 U 0 0
0 0 0 0 0
(U - U) =
0 0 0 0
0 0 0
0 0
0
⋯ ⋯ ⋯
⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯
⋯
⋯
⋱ ⋮
(410)
Pela substituiccedilatildeo de (49) e (410) nos produtos (L-Lrsquo)middotU como Lmiddot(U-Ursquo) resulta
em (411) e (412)
ik kk ik kk+1 ik ki ik kn
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
L - L) U =
0 0 0 0 0 0
0 0 L U L U L U L U
0 0 0 0 0 0
0 0 0 0 0 0
(
sdot
sdot sdot sdot sdot
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(411)
ki
k+1k ki
ik ki
nk ki
0 0 0 0 0
0 0 0 0 0
0 0 U 0 0
L (U - U) = 0 0 L U 0 0
0 0 L U 0 0
0 0 L U 0 0
sdot sdot
sdot
sdot
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
(412)
Conforme mencionado no capiacutetulo anterior uma das dificuldades para propor
uma regra de preenchimento estaacute em se reduzir o nuacutemero de operaccedilotildees
associadas com sua execuccedilatildeo dentro do algoritmo de preacute-condicionamento
144
Neste trabalho propotildee-se usar a norma-1 em (47) para o caacutelculo do erro
associado a um elemento de L e a norma-infin em (48) para o caacutelculo do erro
associado a um dado elemento de U como apresentado em (413) e (414) As
referidas normas aproveitam a estrutura das matrizes (411) e (412) evitando-se
a realizaccedilatildeo de operaccedilotildees adicionais sendo requeridas ao inveacutes disto apenas
comparaccedilotildees entre elementos Portanto substituindo (411) em (413) e (412)
em (414) e calculando-se as normas satildeo obtidas as equaccedilotildees (415) e (416)
que devem ser usadas na regra de preenchimento
)1ik(LR = (L -L) Usdot (413)
ki(U )R = L (U-U) infinsdot (414)
ik ik km(L )R = L max U m = [kn]sdot (415)
ki ki mk(U )R U max 1 L m=[k+1n]= sdot (416)
Na Figura 43 satildeo destacados em vermelho todos os elementos dos fatores
triangulares que satildeo requeridos para calcular o erro produzido quando o
elemento Lik (no quadrado) eacute descartado Jaacute na Figura 44 satildeo destacados em
azul todos os elementos necessaacuterios para calcular o erro produzido quando o
elemento Uki (encerrado no quadrado) eacute descartado Observa-se que para que
esta regra possa ser implementada tanto no fator triangular U como em L o
algoritmo de fatoraccedilatildeo deve ser capaz de calcular os elementos Ukk Ukk+1
Ukn (em vermelho) antes de decidir se o elemento Lik deve ser preenchido ou
descartado Semelhantemente deve ser capaz de calcular os elementos Lk+1k
Lnk (em azul) antes de decidir se o elemento Uki deve ser preenchido ou
descartado
145
Figura 43 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Lik
Figura 44 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Uki
45 Adequaccedilatildeo da Regra Baseada no Erro
Nesta seccedilatildeo a regra de preenchimento baseada no erro eacute adequada para ser
usada no preacute-condicionador ILUT(τρ) analisado no capiacutetulo anterior O preacute-
condicionador resultante seraacute chamado de preacute-condicionador de duplo
paracircmetro limitante ILUT(ξτ) Neste preacute-condicionador natildeo eacute mais necessaacuterio
usar o paracircmetro ρ
Conforme visto no Capiacutetulo 3 o algoritmo de fatoraccedilatildeo usado neste preacute-
condicionador eacute o IKJ e deriva da eliminaccedilatildeo de Gauss (Saad 2003) Este tipo
de algoritmo permite calcular os elementos Ukk Ukk+1 Ukn antes de decidir se
o elemento Lik deve ser preenchido ou descartado Poreacutem o algoritmo IKJ natildeo
permite calcular os elementos Lk+1k Lnk antes de decidir se o elemento Uki
deve ser preenchido ou descartado porque no mesmo os elementos de L e U
146
satildeo calculados por linhas uma de cada vez Portanto a regra baseada no erro
pode ser aplicada apenas nos elementos do fator L enquanto que uma variante
da regra convencional usada no ILUT(τρ) eacute usada para os elementos de U
O caacutelculo da norma-2 usada na regra de preenchimento convencional dada pela
raiz quadrada da soma dos quadrados dos elementos da linha pode exigir
consideraacutevel esforccedilo computacional dependendo da dimensatildeo da matriz de
coeficientes Portanto ao inveacutes de se usar esta norma para descartar os
elementos em U recomenda-se realizar a meacutedia aritmeacutetica dos elementos da i-
eacutesima linha da matriz de coeficientes original Este procedimento reduz o nuacutemero
de operaccedilotildees de ponto flutuante sem comprometer a qualidade do preacute-
condicionador No entanto a eficiecircncia de ambas as heuriacutesticas eacute inferior agrave da
regra baseada no erro para preenchimento dos elementos proposta no presente
trabalho O resultado eacute um preacute-condicionador que aplica dois criteacuterios para
definir sua regra de preenchimento da seguinte forma
De acordo com a relaccedilatildeo dada por (417) um elemento Lik eacute descartado se o
erro resultante for menor que a toleracircncia ξ usada para todas as linhas de L
Caso contraacuterio calcula-se Lik usando-se o elemento aik da matriz resultante do
processo de eliminaccedilatildeo de Gauss ateacute a correspondente etapa Jaacute para um
elemento Uik este eacute descartado se for menor que uma certa toleracircncia relativa
τi obtida multiplicando-se a toleracircncia absoluta τ pela meacutedia aritmeacutetica dos
elementos da i-eacutesima linha da matriz de coeficientes original O caacutelculo de w eacute
efetuado de acordo com o algoritmo de fatoraccedilatildeo IKJ apresentado no capiacutetulo
anterior
ik
ikik
(L )
ik (L )k=(1i-1)
kk
0 R= aL
RU
lt ξ ge ξ
(417)
ik
k i
k k ik=(i+1n)
0 w =U
w w
lt ge
ττ
(418)
A adaptaccedilatildeo da regra baseada no erro no preacute-condicionador ILUT(τρ) falha
devido ao fato do algoritmo de fatoraccedilatildeo IKJ natildeo permitir a aplicaccedilatildeo da regra
147
em ambos os fatores triangulares L e U dificultando a exploraccedilatildeo das vantagens
do uso desta regra A seguir mostra-se uma proposta para superar estes
problemas utilizando-se outro algoritmo de fatoraccedilatildeo que permite aplicar a regra
em ambos os fatores triangulares
46 Preacute-condicionador ILU( ξ) Baseado no Caacutelculo do Erro
Nesta seccedilatildeo propotildee-se uma eficiente e robusta estrateacutegia de preacute-
condicionamento da fatoraccedilatildeo incompleta ILU(ξ) derivada de uma versatildeo do
algoritmo de eliminaccedilatildeo de Gauss conhecido como Doolittle A maior vantagem
deste algoritmo eacute que permite usar de forma efetiva a regra de preenchimento
baseada no erro em ambos os fatores triangulares L e U
Os fatores L e U satildeo apresentados em (419) e (420) Os elementos da diagonal
de L satildeo iguais a um e a primeira linha de U eacute igual agrave primeira linha da matriz de
coeficientes A As equaccedilotildees usadas pelo algoritmo de Doolittle para calcular os
elementos dos fatores triangulares satildeo apresentadas em (422) e podem ser
obtidas ao se igualar cada elemento do produto dos fatores triangulares LmiddotU de
(419) e (420) aos elementos da matriz de coeficientes A apresentada em (421)
Estas equaccedilotildees podem ser implementadas computacionalmente de diferentes
formas todas baseadas na eliminaccedilatildeo de Gauss Teoricamente os diferentes
tipos de eliminaccedilatildeo de Gauss realizam o mesmo nuacutemero de operaccedilotildees de ponto
flutuante No entanto no contexto da fatoraccedilatildeo incompleta estas variantes
resultam em importantes diferenccedilas praacuteticas quando o interesse eacute utilizar a regra
de preenchimento baseada no erro
k-11
k1 kk 1
i1 ik 1 ik
n1 nk 1 nk ni
1 0 0 0 0
L 1 0 0 0
L L 1 0 0L
L L L 1 0
L L L L 1
minus
minus
minus
=
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(419)
148
11 1k 1 1k 1i 1n
k-1k-1 k-1k k-1i k-1n
kk ki kn
ii in
nn
U U U U U
0 U U U U
0 0 U U UU
0 0 0 U U
0 0 0 0 U
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(420)
11 1k 1 1k 1i 1n
k-11 k-1k-1 k-1k k-1i k-1n
k1 kk-1 kk ki kn
i1 ik-1 ik ii in
n1 nk-1 nk ni nn
a a a a a
a a a a a
a a a a aA
a a a a a
a a a a a
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(421)
k-1
ki ki kj jij=1
k-1
ik ij jkj=1
ikkk
U =a - [L U ] i=kn
a - [L U ]
L = i=k+1nU
sum
sum (422)
As equaccedilotildees de Doolittle podem gerar algoritmos de eliminaccedilatildeo de Gauss que
calculam os elementos dos fatores triangulares por linhas de forma similar agrave
fatoraccedilatildeo IKJ ou por colunas (Bodewig 1956 Wilkinson 1965 Dahlquist amp
Bjoumlrk 1974 Hoffman 2001) Em ambos algoritmos natildeo seria possiacutevel usar a
regra de preenchimento baseada no erro A partir de (422) propotildee-se usar o
algoritmo de eliminaccedilatildeo de Gauss apresentado na Figura 45 que permite
calcular os elementos dos fatores triangulares simultaneamente por linhas em U
e por colunas em L como mostrado na Figura 46
No passo k da eliminaccedilatildeo de Gauss os elementos da k-eacutesima linha de U e a k-
eacutesima coluna de L (identificados por linhas tracejadas) satildeo calculados utilizando
elementos jaacute computados anteriormente nas linhas e colunas de U e L Por
exemplo para se calcular o elemento Uki satildeo usados os elementos destacados
em azul enquanto que para calcular o elemento Lik satildeo usados os elementos
149
destacados em vermelho Observa-se que este algoritmo permite calcular
elementos de L em linhas posteriores agrave linha k Esta caracteriacutestica possibilita o
uso em U da regra de preenchimento baseada no erro
1 Para i = 1n Faccedila
2 min = Ji in
3 Para k = in Faccedila
4 Para j = 1i-1 Faccedila
5 mk = mk - LijmiddotUjk
6 Fim ndash Faccedila
7 Fim ndash Faccedila
8 Registrar Umax = maxmin
9 ni+1n = J i+1ni
10 Para k = i+1n Faccedila
11 Para j = 1i-1 Faccedila
12 nk = nk ndash LkjmiddotUji
13 Fim ndash Faccedila
14 Fim ndash Faccedila
15 n = nUii
16 Registrar Lmax = maxni+1n
17 Aplicar a regra de preenchimento baseada no erro em m e n
18 Ui in = m in
19 L i+1ni = n i+1n
20 Fim ndash Faccedila
Figura 45 ndash Algoritmo do preacute-condicionador ILU(ξ)
Figura 46 ndash Elementos necessaacuterios para calcular os elementos Lik e Uki durante a fatoraccedilatildeo triangular
150
No algoritmo da Figura 45 observa-se que no passo k os elementos da linha de
U satildeo armazenados no vetor m enquanto que os elementos da coluna de L satildeo
armazenados no vetor n (passos 5 e 12 respectivamente) Uma vez calculados
ambos os vetores procura-se o maior elemento de m sendo armazenado em
Umax e o maior elemento de n armazenado em Lmax (passos 8 e 16
respectivamente) Ambos os valores maacuteximos (em valores absolutos) satildeo
usados pela regra de preenchimento no passo 17 para descartar em m e n os
elementos associados com os menores erros e preencher a linha de U e a
coluna de L da seguinte forma
De acordo com as relaccedilotildees dadas por (423) e (424) tanto um elemento Lki
como tambeacutem um elemento Uik satildeo descartados se seus erros associados
foram menores que uma dada toleracircncia ξ usada para todas as colunas de L e
linhas de U Caso contraacuterio Lki eacute preenchido usando-se o valor armazenado
em nk e Uik eacute preenchido usando-se o valor armazenado em mk
ik
ikik
(U )
(U )kk=(in)
0 R =U
m R
lt ξ ge ξ
(423)
ik
ikki
(L )
(L )ki=(1+1n)
0 R=L
n R
lt ξ ge ξ
(424)
Como observado na Figura 46 o algoritmo da Figura 45 permite encontrar os
elementos Ukk Ukk+1 Ukn necessaacuterios para se calcular o erro associado ao
elemento Lki e os elementos Lk+1k Lnk que por sua vez satildeo necessaacuterios para
se calcular o erro associado ao elemento Uik Nota-se que os elementos
necessaacuterios para calcular o erro (passo k) satildeo calculados neste mesmo passo
portanto natildeo eacute necessaacuterio realizar grandes buscas de elementos nas matrizes L
e U Igualmente tambeacutem natildeo eacute necessaacuterio armazenar valores Umax Lmax ou
erros do passo k porque natildeo seratildeo mais necessaacuterios nos proacuteximos passos
Observe-se que natildeo eacute necessaacuterio multiplicar o paracircmetro ξ por alguma norma ou
meacutedia aritmeacutetica dos elementos da matriz de coeficientes como realizado no
preacute-condicionador ILUT(τρ) porque o erro independe dos valores dos elementos
151
da matriz de coeficientes Este preacute-condicionador usa apenas um uacutenico
paracircmetro ξ Esta caracteriacutestica facilita o ajuste dos paracircmetros do solucionador
como seraacute visto nas proacuteximas seccedilotildees e no proacuteximo capiacutetulo
47 Meacutetodo Convencional Para Ajuste dos Paracircmetros dos Solucionadores
O ajuste dos paracircmetros de um solucionador iterativo eacute considerado fundamental
para garantir sua robustez e eficiecircncia computacional principalmente em
anaacutelises mais complexas como aquelas que solucionam vaacuterios fluxos de carga
com diferentes pontos de operaccedilatildeo Nesses casos a escolha de valores
apropriados para os paracircmetros se torna ainda mais relevante
A ideacuteia fundamental eacute escolher os valores dos paracircmetros que permitam
preencher o menor nuacutemero de elementos sem prejudicar a qualidade do preacute-
condicionador isto eacute sem tornaacute-lo muito diferente de A Poreacutem a escolha de
valores apropriados para os paracircmetros eacute uma tarefa difiacutecil jaacute que existe uma
interdependecircncia com as toleracircncias relativa e absoluta do GMRES e com o tipo
de problema que estaacute sendo solucionado
Pouco tem sido pesquisado em relaccedilatildeo a este tema apenas em (de Leon amp
Semlyen 2002) apresenta-se uma foacutermula que permite calcular para cada
sistema eleacutetrico o valor do paracircmetro limitante τ no preacute-condicionador ILU(τ)
dado por (322) onde τ eacute igual agrave metade do nuacutemero de equaccedilotildees totais Neq do
sistema linear Na praacutetica estaacute foacutermula natildeo garante robustez nem o melhor
desempenho do solucionador
eq
12 N
τ =sdot
(425)
No entanto o procedimento convencional define primeiro valores arbitraacuterios para
as duas toleracircncias absoluta e relativa do GMRES Nas simulaccedilotildees realizadas
nos capiacutetulos anteriores se usou toleracircncias iguais (10-5) e menores que a
toleracircncia usada no teste de convergecircncia do algoritmo Newton-Raphson pois
toleracircncias maiores costumam impedir a convergecircncia do Newton-Raphson
152
Uma vez definidas as toleracircncias a escolha dos paracircmetros do preacute-
condicionador eacute realizada com base em tentativa e erro
Este meacutetodo natildeo considera a possibilidade de encontrar melhores desempenhos
para outras toleracircncias do GMRES que natildeo necessariamente devem ser
consideradas iguais Durante o procedimento de tentativa e erro o meacutetodo pode
encontrar um miacutenimo nuacutemero de operaccedilotildees local (MFLOPSL) associado com τL
como ilustrado na Figura 47 que natildeo necessariamente eacute o menor possiacutevel
(MFLOPSG) Observa-se que para obter o miacutenimo nuacutemero de operaccedilotildees global
(MFLOPSG) o procedimento de tentativa e erro deveria comeccedilar com um valor
de τ proacuteximo de τG
Figura 47 ndash Procedimento de tentativa e erro para busca de valores de um paracircmetro do preacute-condicionador
Quando o preacute-condicionador possui um segundo paracircmetro o procedimento de
tentativa e erro eacute repetido para este segundo paracircmetro fixando-se o primeiro
paracircmetro
48 Meacutetodo Proposto Para Ajuste dos Paracircmetros dos Solucio nadores
O meacutetodo proposto consiste em realizar sucessivas simulaccedilotildees de fluxo de
carga variando simultaneamente todos os paracircmetros do solucionador e
registrando o nuacutemero de operaccedilotildees de ponto flutuante para cada caso gerado O
objetivo eacute encontrar regiotildees de valores para os paracircmetros onde o solucionador
153
apresente alto desempenho permitindo estabelecer e recomendar faixas para os
valores dos paracircmetros onde o solucionador garante convergecircncia com a maior
eficiecircncia possiacutevel O meacutetodo tambeacutem permite identificar as faixas de valores
onde o solucionador natildeo converge
O meacutetodo eacute ilustrado para ajustar os paracircmetros de duas configuraccedilotildees de
solucionador iterativo sendo estas o solucionador proposto neste trabalho
identificado como GMRES+ILU(ξ)+MD e o solucionador GMRES+ILUT(τρ)+MD
apresentado no capiacutetulo 2 Na Tabela 43 especificam-se os paracircmetros
associados a cada solucionador
Tabela 43 ndash Paracircmetros usados nos solucionadores
Solucionadores Meacutetodo Iterativo Preacute-condicionador
GMRES+ILU(ξ)+MD atol rtol
ξ
GMRES+ILUT(τρ)+MD τ ρ
481 Passos Fundamentais
Esta seccedilatildeo apresenta de maneira sucinta os passos envolvidos no meacutetodo para
ajuste dos paracircmetros dos solucionadores onde uma descriccedilatildeo geral eacute
mostrada na Figura 48 O primeiro passo refere-se agrave definiccedilatildeo do espaccedilo de
busca onde satildeo procurados os valores para os paracircmetros que garantem alto
desempenho do solucionador O segundo refere-se aos experimentos numeacutericos
realizados para avaliar o desempenho do solucionador considerando-se todas as
combinaccedilotildees possiacuteveis dos valores de seus paracircmetros definidos no espaccedilo de
busca O passo seguinte tem como objetivo calcular as faixas de valores
recomendaacuteveis para as toleracircncias absoluta e relativa do GMRES Finalmente o
quarto passo calcula as faixas de valores recomendaacuteveis para os paracircmetros do
preacute-condicionador
154
Figura 48 ndash Passos fundamentais para delimitaccedilatildeo dos paracircmetros do solucionador
Nas proacuteximas seccedilotildees os passos mais relevantes no contexto deste trabalho satildeo
discutidos mais detalhadamente
482 Estabelecimento do Espaccedilo de Busca
Para definir o espaccedilo de busca primeiramente deve-se estabelecer o domiacutenio de
cada paracircmetro isto eacute um valor miacutenimo e maacuteximo para cada toleracircncia do
GMRES e para cada paracircmetro do preacute-condicionador como mostrado na Tabela
44 e na Figura 49 Depois devem ser definidos valores intermediaacuterios para cada
paracircmetro sendo que o nuacutemero de valores totais eacute definido em funccedilatildeo do grau
de precisatildeo que se deseja conseguir nos paracircmetros
Finalmente o espaccedilo de busca eacute definido por todas as combinaccedilotildees possiacuteveis
entre as toleracircncias absoluta e relativa do GMRES como apresentado na Figura
49(a) e por todas as combinaccedilotildees possiacuteveis realizadas entre os paracircmetros do
preacute-condicionador como mostrado na Figura 49(b-c)
Para os valores especificados na Tabela 44 existem (m x n) combinaccedilotildees
possiacuteveis entre a toleracircncia absoluta e relativa (ver Figura 49(a)) e (q x p)
combinaccedilotildees possiacuteveis entre os paracircmetros τ e ρ do preacute-condicionador ILUT(τρ)
(ver Figura 49(c)) No caso do preacute-condicionador ILU(ξ) natildeo existem
combinaccedilotildees jaacute que este preacute-condicionador possui somente um uacutenico
paracircmetro Poreacutem existem k valores possiacuteveis para ξ (ver Figura 49(b))
Estabelecer Espaccedilo de Busca
Experimentos numeacutericos
Delimitar paracircmetros do preacute-condicionador
Delimitar toleracircncias do GMRES
155
Tabela 44 ndash Domiacutenios dos paracircmetros usados nos solucionadores
Paracircmetros Maacuteximo Miacutenimo Nuacutemero total de valores
atol atol1 atoln n
rtol rtol1 rtolm m
ξ ξ1 ξk k
τ τ1 τq q
ρ ρ1 ρp P
a) Espaccedilo de busca das toleracircncias do GMRES
b) Espaccedilo de busca dos paracircmetros do preacute-condicionador ILUT(ξ)
c) Espaccedilo de busca dos paracircmetros do preacute-
condicionador ILUT(τρ)
Figura 49 ndash Espaccedilo de busca dos paracircmetros do solucionador
483 Experimentos Numeacutericos
No segundo passo para cada combinaccedilatildeo das toleracircncias absoluta e relativa
(atolrtol) do espaccedilo de busca da Figura 49(a) satildeo simulados tantos Fluxos de
Carga quanto combinaccedilotildees dos paracircmetros do preacute-condicionador existam
registrando-se o nuacutemero de operaccedilotildees de ponto flutuante (MFLOPS) para cada
156
combinaccedilatildeo dos paracircmetros do preacute-condicionador Portanto para cada
combinaccedilatildeo (atolrtol) eacute gerado um graacutefico de eficiecircncia computacional (em
MFLOPS) em funccedilatildeo dos paracircmetros do preacute-condicionador como mostrado na
Figura 410(a) para o preacute-condicionador ILUT(τρ) e na Figura 410(b) para o
preacute-condicionador ILU(ξ)
a) Graacutefico de eficiecircncia para o preacute-condicionador ILUT(τρ)
b) Graacutefico de eficiecircncia para o preacute-condicionador ILU(ξ)
Figura 410 ndash Graacuteficos de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
Para cada graacutefico gerado eacute registrado o nuacutemero de operaccedilotildees de ponto flutuante
miacutenimo (MFLOPSmiacuten) e este valor eacute associado agrave sua correspondente combinaccedilatildeo
(atolrtol) Apoacutes terem sido realizados todos os experimentos e registrados todos
os MFLOPSmiacuten associados a todas as combinaccedilotildees (atolrtol) eacute gerado o graacutefico
de alta eficiecircncia Este graacutefico apresenta em escala de cores todos MFLOPSmiacuten
em funccedilatildeo de suas correspondentes combinaccedilotildees (atolrtol) como mostrado na
Figura 411 sendo que a cor azul estaacute associada com os menores MFLOPSmiacuten a
157
cor vermelha com os maiores MFLOPSmiacuten e em negrito os casos natildeo
convergentes
Observa-se que entre todos os valores registrados para MFLOPSmiacuten existe uma
regiatildeo que conteacutem os casos com os menores MFLOPSmiacuten Este valor chamado
de MFLOPSoacuteti eacute o nuacutemero miacutenimo de operaccedilotildees possiacutevel (global) e estaacute
associado com a regiatildeo quadrada em azul escuro segmentada pelas linhas
brancas Os pontos brancos indicam as posiccedilotildees de todas as combinaccedilotildees que
possuem nuacutemero de operaccedilotildees igual a MFLOPSoacuteti
Figura 411 ndash Graacuteficos de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
484 Delimitaccedilatildeo das Toleracircncias do GMRES
No terceiro passo a partir do graacutefico de alta eficiecircncia apresentado na sua forma
bidimensional na Figura 412 eacute segmentada a regiatildeo dos MFLOPSoacuteti Neste
caso esta regiatildeo eacute o quadrado azul do centro do graacutefico onde cada ponto
branco estaacute associado a uma combinaccedilatildeo (atolrtol) que apresenta o menor
nuacutemero de operaccedilotildees possiacutevel em todo o espaccedilo de busca (MFLOPSoacuteti) Este
graacutefico permite encontrar as faixas de valores (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do meacutetodo GMRES associadas ao melhor
desempenho possiacutevel
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
144
Neste trabalho propotildee-se usar a norma-1 em (47) para o caacutelculo do erro
associado a um elemento de L e a norma-infin em (48) para o caacutelculo do erro
associado a um dado elemento de U como apresentado em (413) e (414) As
referidas normas aproveitam a estrutura das matrizes (411) e (412) evitando-se
a realizaccedilatildeo de operaccedilotildees adicionais sendo requeridas ao inveacutes disto apenas
comparaccedilotildees entre elementos Portanto substituindo (411) em (413) e (412)
em (414) e calculando-se as normas satildeo obtidas as equaccedilotildees (415) e (416)
que devem ser usadas na regra de preenchimento
)1ik(LR = (L -L) Usdot (413)
ki(U )R = L (U-U) infinsdot (414)
ik ik km(L )R = L max U m = [kn]sdot (415)
ki ki mk(U )R U max 1 L m=[k+1n]= sdot (416)
Na Figura 43 satildeo destacados em vermelho todos os elementos dos fatores
triangulares que satildeo requeridos para calcular o erro produzido quando o
elemento Lik (no quadrado) eacute descartado Jaacute na Figura 44 satildeo destacados em
azul todos os elementos necessaacuterios para calcular o erro produzido quando o
elemento Uki (encerrado no quadrado) eacute descartado Observa-se que para que
esta regra possa ser implementada tanto no fator triangular U como em L o
algoritmo de fatoraccedilatildeo deve ser capaz de calcular os elementos Ukk Ukk+1
Ukn (em vermelho) antes de decidir se o elemento Lik deve ser preenchido ou
descartado Semelhantemente deve ser capaz de calcular os elementos Lk+1k
Lnk (em azul) antes de decidir se o elemento Uki deve ser preenchido ou
descartado
145
Figura 43 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Lik
Figura 44 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Uki
45 Adequaccedilatildeo da Regra Baseada no Erro
Nesta seccedilatildeo a regra de preenchimento baseada no erro eacute adequada para ser
usada no preacute-condicionador ILUT(τρ) analisado no capiacutetulo anterior O preacute-
condicionador resultante seraacute chamado de preacute-condicionador de duplo
paracircmetro limitante ILUT(ξτ) Neste preacute-condicionador natildeo eacute mais necessaacuterio
usar o paracircmetro ρ
Conforme visto no Capiacutetulo 3 o algoritmo de fatoraccedilatildeo usado neste preacute-
condicionador eacute o IKJ e deriva da eliminaccedilatildeo de Gauss (Saad 2003) Este tipo
de algoritmo permite calcular os elementos Ukk Ukk+1 Ukn antes de decidir se
o elemento Lik deve ser preenchido ou descartado Poreacutem o algoritmo IKJ natildeo
permite calcular os elementos Lk+1k Lnk antes de decidir se o elemento Uki
deve ser preenchido ou descartado porque no mesmo os elementos de L e U
146
satildeo calculados por linhas uma de cada vez Portanto a regra baseada no erro
pode ser aplicada apenas nos elementos do fator L enquanto que uma variante
da regra convencional usada no ILUT(τρ) eacute usada para os elementos de U
O caacutelculo da norma-2 usada na regra de preenchimento convencional dada pela
raiz quadrada da soma dos quadrados dos elementos da linha pode exigir
consideraacutevel esforccedilo computacional dependendo da dimensatildeo da matriz de
coeficientes Portanto ao inveacutes de se usar esta norma para descartar os
elementos em U recomenda-se realizar a meacutedia aritmeacutetica dos elementos da i-
eacutesima linha da matriz de coeficientes original Este procedimento reduz o nuacutemero
de operaccedilotildees de ponto flutuante sem comprometer a qualidade do preacute-
condicionador No entanto a eficiecircncia de ambas as heuriacutesticas eacute inferior agrave da
regra baseada no erro para preenchimento dos elementos proposta no presente
trabalho O resultado eacute um preacute-condicionador que aplica dois criteacuterios para
definir sua regra de preenchimento da seguinte forma
De acordo com a relaccedilatildeo dada por (417) um elemento Lik eacute descartado se o
erro resultante for menor que a toleracircncia ξ usada para todas as linhas de L
Caso contraacuterio calcula-se Lik usando-se o elemento aik da matriz resultante do
processo de eliminaccedilatildeo de Gauss ateacute a correspondente etapa Jaacute para um
elemento Uik este eacute descartado se for menor que uma certa toleracircncia relativa
τi obtida multiplicando-se a toleracircncia absoluta τ pela meacutedia aritmeacutetica dos
elementos da i-eacutesima linha da matriz de coeficientes original O caacutelculo de w eacute
efetuado de acordo com o algoritmo de fatoraccedilatildeo IKJ apresentado no capiacutetulo
anterior
ik
ikik
(L )
ik (L )k=(1i-1)
kk
0 R= aL
RU
lt ξ ge ξ
(417)
ik
k i
k k ik=(i+1n)
0 w =U
w w
lt ge
ττ
(418)
A adaptaccedilatildeo da regra baseada no erro no preacute-condicionador ILUT(τρ) falha
devido ao fato do algoritmo de fatoraccedilatildeo IKJ natildeo permitir a aplicaccedilatildeo da regra
147
em ambos os fatores triangulares L e U dificultando a exploraccedilatildeo das vantagens
do uso desta regra A seguir mostra-se uma proposta para superar estes
problemas utilizando-se outro algoritmo de fatoraccedilatildeo que permite aplicar a regra
em ambos os fatores triangulares
46 Preacute-condicionador ILU( ξ) Baseado no Caacutelculo do Erro
Nesta seccedilatildeo propotildee-se uma eficiente e robusta estrateacutegia de preacute-
condicionamento da fatoraccedilatildeo incompleta ILU(ξ) derivada de uma versatildeo do
algoritmo de eliminaccedilatildeo de Gauss conhecido como Doolittle A maior vantagem
deste algoritmo eacute que permite usar de forma efetiva a regra de preenchimento
baseada no erro em ambos os fatores triangulares L e U
Os fatores L e U satildeo apresentados em (419) e (420) Os elementos da diagonal
de L satildeo iguais a um e a primeira linha de U eacute igual agrave primeira linha da matriz de
coeficientes A As equaccedilotildees usadas pelo algoritmo de Doolittle para calcular os
elementos dos fatores triangulares satildeo apresentadas em (422) e podem ser
obtidas ao se igualar cada elemento do produto dos fatores triangulares LmiddotU de
(419) e (420) aos elementos da matriz de coeficientes A apresentada em (421)
Estas equaccedilotildees podem ser implementadas computacionalmente de diferentes
formas todas baseadas na eliminaccedilatildeo de Gauss Teoricamente os diferentes
tipos de eliminaccedilatildeo de Gauss realizam o mesmo nuacutemero de operaccedilotildees de ponto
flutuante No entanto no contexto da fatoraccedilatildeo incompleta estas variantes
resultam em importantes diferenccedilas praacuteticas quando o interesse eacute utilizar a regra
de preenchimento baseada no erro
k-11
k1 kk 1
i1 ik 1 ik
n1 nk 1 nk ni
1 0 0 0 0
L 1 0 0 0
L L 1 0 0L
L L L 1 0
L L L L 1
minus
minus
minus
=
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(419)
148
11 1k 1 1k 1i 1n
k-1k-1 k-1k k-1i k-1n
kk ki kn
ii in
nn
U U U U U
0 U U U U
0 0 U U UU
0 0 0 U U
0 0 0 0 U
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(420)
11 1k 1 1k 1i 1n
k-11 k-1k-1 k-1k k-1i k-1n
k1 kk-1 kk ki kn
i1 ik-1 ik ii in
n1 nk-1 nk ni nn
a a a a a
a a a a a
a a a a aA
a a a a a
a a a a a
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(421)
k-1
ki ki kj jij=1
k-1
ik ij jkj=1
ikkk
U =a - [L U ] i=kn
a - [L U ]
L = i=k+1nU
sum
sum (422)
As equaccedilotildees de Doolittle podem gerar algoritmos de eliminaccedilatildeo de Gauss que
calculam os elementos dos fatores triangulares por linhas de forma similar agrave
fatoraccedilatildeo IKJ ou por colunas (Bodewig 1956 Wilkinson 1965 Dahlquist amp
Bjoumlrk 1974 Hoffman 2001) Em ambos algoritmos natildeo seria possiacutevel usar a
regra de preenchimento baseada no erro A partir de (422) propotildee-se usar o
algoritmo de eliminaccedilatildeo de Gauss apresentado na Figura 45 que permite
calcular os elementos dos fatores triangulares simultaneamente por linhas em U
e por colunas em L como mostrado na Figura 46
No passo k da eliminaccedilatildeo de Gauss os elementos da k-eacutesima linha de U e a k-
eacutesima coluna de L (identificados por linhas tracejadas) satildeo calculados utilizando
elementos jaacute computados anteriormente nas linhas e colunas de U e L Por
exemplo para se calcular o elemento Uki satildeo usados os elementos destacados
em azul enquanto que para calcular o elemento Lik satildeo usados os elementos
149
destacados em vermelho Observa-se que este algoritmo permite calcular
elementos de L em linhas posteriores agrave linha k Esta caracteriacutestica possibilita o
uso em U da regra de preenchimento baseada no erro
1 Para i = 1n Faccedila
2 min = Ji in
3 Para k = in Faccedila
4 Para j = 1i-1 Faccedila
5 mk = mk - LijmiddotUjk
6 Fim ndash Faccedila
7 Fim ndash Faccedila
8 Registrar Umax = maxmin
9 ni+1n = J i+1ni
10 Para k = i+1n Faccedila
11 Para j = 1i-1 Faccedila
12 nk = nk ndash LkjmiddotUji
13 Fim ndash Faccedila
14 Fim ndash Faccedila
15 n = nUii
16 Registrar Lmax = maxni+1n
17 Aplicar a regra de preenchimento baseada no erro em m e n
18 Ui in = m in
19 L i+1ni = n i+1n
20 Fim ndash Faccedila
Figura 45 ndash Algoritmo do preacute-condicionador ILU(ξ)
Figura 46 ndash Elementos necessaacuterios para calcular os elementos Lik e Uki durante a fatoraccedilatildeo triangular
150
No algoritmo da Figura 45 observa-se que no passo k os elementos da linha de
U satildeo armazenados no vetor m enquanto que os elementos da coluna de L satildeo
armazenados no vetor n (passos 5 e 12 respectivamente) Uma vez calculados
ambos os vetores procura-se o maior elemento de m sendo armazenado em
Umax e o maior elemento de n armazenado em Lmax (passos 8 e 16
respectivamente) Ambos os valores maacuteximos (em valores absolutos) satildeo
usados pela regra de preenchimento no passo 17 para descartar em m e n os
elementos associados com os menores erros e preencher a linha de U e a
coluna de L da seguinte forma
De acordo com as relaccedilotildees dadas por (423) e (424) tanto um elemento Lki
como tambeacutem um elemento Uik satildeo descartados se seus erros associados
foram menores que uma dada toleracircncia ξ usada para todas as colunas de L e
linhas de U Caso contraacuterio Lki eacute preenchido usando-se o valor armazenado
em nk e Uik eacute preenchido usando-se o valor armazenado em mk
ik
ikik
(U )
(U )kk=(in)
0 R =U
m R
lt ξ ge ξ
(423)
ik
ikki
(L )
(L )ki=(1+1n)
0 R=L
n R
lt ξ ge ξ
(424)
Como observado na Figura 46 o algoritmo da Figura 45 permite encontrar os
elementos Ukk Ukk+1 Ukn necessaacuterios para se calcular o erro associado ao
elemento Lki e os elementos Lk+1k Lnk que por sua vez satildeo necessaacuterios para
se calcular o erro associado ao elemento Uik Nota-se que os elementos
necessaacuterios para calcular o erro (passo k) satildeo calculados neste mesmo passo
portanto natildeo eacute necessaacuterio realizar grandes buscas de elementos nas matrizes L
e U Igualmente tambeacutem natildeo eacute necessaacuterio armazenar valores Umax Lmax ou
erros do passo k porque natildeo seratildeo mais necessaacuterios nos proacuteximos passos
Observe-se que natildeo eacute necessaacuterio multiplicar o paracircmetro ξ por alguma norma ou
meacutedia aritmeacutetica dos elementos da matriz de coeficientes como realizado no
preacute-condicionador ILUT(τρ) porque o erro independe dos valores dos elementos
151
da matriz de coeficientes Este preacute-condicionador usa apenas um uacutenico
paracircmetro ξ Esta caracteriacutestica facilita o ajuste dos paracircmetros do solucionador
como seraacute visto nas proacuteximas seccedilotildees e no proacuteximo capiacutetulo
47 Meacutetodo Convencional Para Ajuste dos Paracircmetros dos Solucionadores
O ajuste dos paracircmetros de um solucionador iterativo eacute considerado fundamental
para garantir sua robustez e eficiecircncia computacional principalmente em
anaacutelises mais complexas como aquelas que solucionam vaacuterios fluxos de carga
com diferentes pontos de operaccedilatildeo Nesses casos a escolha de valores
apropriados para os paracircmetros se torna ainda mais relevante
A ideacuteia fundamental eacute escolher os valores dos paracircmetros que permitam
preencher o menor nuacutemero de elementos sem prejudicar a qualidade do preacute-
condicionador isto eacute sem tornaacute-lo muito diferente de A Poreacutem a escolha de
valores apropriados para os paracircmetros eacute uma tarefa difiacutecil jaacute que existe uma
interdependecircncia com as toleracircncias relativa e absoluta do GMRES e com o tipo
de problema que estaacute sendo solucionado
Pouco tem sido pesquisado em relaccedilatildeo a este tema apenas em (de Leon amp
Semlyen 2002) apresenta-se uma foacutermula que permite calcular para cada
sistema eleacutetrico o valor do paracircmetro limitante τ no preacute-condicionador ILU(τ)
dado por (322) onde τ eacute igual agrave metade do nuacutemero de equaccedilotildees totais Neq do
sistema linear Na praacutetica estaacute foacutermula natildeo garante robustez nem o melhor
desempenho do solucionador
eq
12 N
τ =sdot
(425)
No entanto o procedimento convencional define primeiro valores arbitraacuterios para
as duas toleracircncias absoluta e relativa do GMRES Nas simulaccedilotildees realizadas
nos capiacutetulos anteriores se usou toleracircncias iguais (10-5) e menores que a
toleracircncia usada no teste de convergecircncia do algoritmo Newton-Raphson pois
toleracircncias maiores costumam impedir a convergecircncia do Newton-Raphson
152
Uma vez definidas as toleracircncias a escolha dos paracircmetros do preacute-
condicionador eacute realizada com base em tentativa e erro
Este meacutetodo natildeo considera a possibilidade de encontrar melhores desempenhos
para outras toleracircncias do GMRES que natildeo necessariamente devem ser
consideradas iguais Durante o procedimento de tentativa e erro o meacutetodo pode
encontrar um miacutenimo nuacutemero de operaccedilotildees local (MFLOPSL) associado com τL
como ilustrado na Figura 47 que natildeo necessariamente eacute o menor possiacutevel
(MFLOPSG) Observa-se que para obter o miacutenimo nuacutemero de operaccedilotildees global
(MFLOPSG) o procedimento de tentativa e erro deveria comeccedilar com um valor
de τ proacuteximo de τG
Figura 47 ndash Procedimento de tentativa e erro para busca de valores de um paracircmetro do preacute-condicionador
Quando o preacute-condicionador possui um segundo paracircmetro o procedimento de
tentativa e erro eacute repetido para este segundo paracircmetro fixando-se o primeiro
paracircmetro
48 Meacutetodo Proposto Para Ajuste dos Paracircmetros dos Solucio nadores
O meacutetodo proposto consiste em realizar sucessivas simulaccedilotildees de fluxo de
carga variando simultaneamente todos os paracircmetros do solucionador e
registrando o nuacutemero de operaccedilotildees de ponto flutuante para cada caso gerado O
objetivo eacute encontrar regiotildees de valores para os paracircmetros onde o solucionador
153
apresente alto desempenho permitindo estabelecer e recomendar faixas para os
valores dos paracircmetros onde o solucionador garante convergecircncia com a maior
eficiecircncia possiacutevel O meacutetodo tambeacutem permite identificar as faixas de valores
onde o solucionador natildeo converge
O meacutetodo eacute ilustrado para ajustar os paracircmetros de duas configuraccedilotildees de
solucionador iterativo sendo estas o solucionador proposto neste trabalho
identificado como GMRES+ILU(ξ)+MD e o solucionador GMRES+ILUT(τρ)+MD
apresentado no capiacutetulo 2 Na Tabela 43 especificam-se os paracircmetros
associados a cada solucionador
Tabela 43 ndash Paracircmetros usados nos solucionadores
Solucionadores Meacutetodo Iterativo Preacute-condicionador
GMRES+ILU(ξ)+MD atol rtol
ξ
GMRES+ILUT(τρ)+MD τ ρ
481 Passos Fundamentais
Esta seccedilatildeo apresenta de maneira sucinta os passos envolvidos no meacutetodo para
ajuste dos paracircmetros dos solucionadores onde uma descriccedilatildeo geral eacute
mostrada na Figura 48 O primeiro passo refere-se agrave definiccedilatildeo do espaccedilo de
busca onde satildeo procurados os valores para os paracircmetros que garantem alto
desempenho do solucionador O segundo refere-se aos experimentos numeacutericos
realizados para avaliar o desempenho do solucionador considerando-se todas as
combinaccedilotildees possiacuteveis dos valores de seus paracircmetros definidos no espaccedilo de
busca O passo seguinte tem como objetivo calcular as faixas de valores
recomendaacuteveis para as toleracircncias absoluta e relativa do GMRES Finalmente o
quarto passo calcula as faixas de valores recomendaacuteveis para os paracircmetros do
preacute-condicionador
154
Figura 48 ndash Passos fundamentais para delimitaccedilatildeo dos paracircmetros do solucionador
Nas proacuteximas seccedilotildees os passos mais relevantes no contexto deste trabalho satildeo
discutidos mais detalhadamente
482 Estabelecimento do Espaccedilo de Busca
Para definir o espaccedilo de busca primeiramente deve-se estabelecer o domiacutenio de
cada paracircmetro isto eacute um valor miacutenimo e maacuteximo para cada toleracircncia do
GMRES e para cada paracircmetro do preacute-condicionador como mostrado na Tabela
44 e na Figura 49 Depois devem ser definidos valores intermediaacuterios para cada
paracircmetro sendo que o nuacutemero de valores totais eacute definido em funccedilatildeo do grau
de precisatildeo que se deseja conseguir nos paracircmetros
Finalmente o espaccedilo de busca eacute definido por todas as combinaccedilotildees possiacuteveis
entre as toleracircncias absoluta e relativa do GMRES como apresentado na Figura
49(a) e por todas as combinaccedilotildees possiacuteveis realizadas entre os paracircmetros do
preacute-condicionador como mostrado na Figura 49(b-c)
Para os valores especificados na Tabela 44 existem (m x n) combinaccedilotildees
possiacuteveis entre a toleracircncia absoluta e relativa (ver Figura 49(a)) e (q x p)
combinaccedilotildees possiacuteveis entre os paracircmetros τ e ρ do preacute-condicionador ILUT(τρ)
(ver Figura 49(c)) No caso do preacute-condicionador ILU(ξ) natildeo existem
combinaccedilotildees jaacute que este preacute-condicionador possui somente um uacutenico
paracircmetro Poreacutem existem k valores possiacuteveis para ξ (ver Figura 49(b))
Estabelecer Espaccedilo de Busca
Experimentos numeacutericos
Delimitar paracircmetros do preacute-condicionador
Delimitar toleracircncias do GMRES
155
Tabela 44 ndash Domiacutenios dos paracircmetros usados nos solucionadores
Paracircmetros Maacuteximo Miacutenimo Nuacutemero total de valores
atol atol1 atoln n
rtol rtol1 rtolm m
ξ ξ1 ξk k
τ τ1 τq q
ρ ρ1 ρp P
a) Espaccedilo de busca das toleracircncias do GMRES
b) Espaccedilo de busca dos paracircmetros do preacute-condicionador ILUT(ξ)
c) Espaccedilo de busca dos paracircmetros do preacute-
condicionador ILUT(τρ)
Figura 49 ndash Espaccedilo de busca dos paracircmetros do solucionador
483 Experimentos Numeacutericos
No segundo passo para cada combinaccedilatildeo das toleracircncias absoluta e relativa
(atolrtol) do espaccedilo de busca da Figura 49(a) satildeo simulados tantos Fluxos de
Carga quanto combinaccedilotildees dos paracircmetros do preacute-condicionador existam
registrando-se o nuacutemero de operaccedilotildees de ponto flutuante (MFLOPS) para cada
156
combinaccedilatildeo dos paracircmetros do preacute-condicionador Portanto para cada
combinaccedilatildeo (atolrtol) eacute gerado um graacutefico de eficiecircncia computacional (em
MFLOPS) em funccedilatildeo dos paracircmetros do preacute-condicionador como mostrado na
Figura 410(a) para o preacute-condicionador ILUT(τρ) e na Figura 410(b) para o
preacute-condicionador ILU(ξ)
a) Graacutefico de eficiecircncia para o preacute-condicionador ILUT(τρ)
b) Graacutefico de eficiecircncia para o preacute-condicionador ILU(ξ)
Figura 410 ndash Graacuteficos de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
Para cada graacutefico gerado eacute registrado o nuacutemero de operaccedilotildees de ponto flutuante
miacutenimo (MFLOPSmiacuten) e este valor eacute associado agrave sua correspondente combinaccedilatildeo
(atolrtol) Apoacutes terem sido realizados todos os experimentos e registrados todos
os MFLOPSmiacuten associados a todas as combinaccedilotildees (atolrtol) eacute gerado o graacutefico
de alta eficiecircncia Este graacutefico apresenta em escala de cores todos MFLOPSmiacuten
em funccedilatildeo de suas correspondentes combinaccedilotildees (atolrtol) como mostrado na
Figura 411 sendo que a cor azul estaacute associada com os menores MFLOPSmiacuten a
157
cor vermelha com os maiores MFLOPSmiacuten e em negrito os casos natildeo
convergentes
Observa-se que entre todos os valores registrados para MFLOPSmiacuten existe uma
regiatildeo que conteacutem os casos com os menores MFLOPSmiacuten Este valor chamado
de MFLOPSoacuteti eacute o nuacutemero miacutenimo de operaccedilotildees possiacutevel (global) e estaacute
associado com a regiatildeo quadrada em azul escuro segmentada pelas linhas
brancas Os pontos brancos indicam as posiccedilotildees de todas as combinaccedilotildees que
possuem nuacutemero de operaccedilotildees igual a MFLOPSoacuteti
Figura 411 ndash Graacuteficos de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
484 Delimitaccedilatildeo das Toleracircncias do GMRES
No terceiro passo a partir do graacutefico de alta eficiecircncia apresentado na sua forma
bidimensional na Figura 412 eacute segmentada a regiatildeo dos MFLOPSoacuteti Neste
caso esta regiatildeo eacute o quadrado azul do centro do graacutefico onde cada ponto
branco estaacute associado a uma combinaccedilatildeo (atolrtol) que apresenta o menor
nuacutemero de operaccedilotildees possiacutevel em todo o espaccedilo de busca (MFLOPSoacuteti) Este
graacutefico permite encontrar as faixas de valores (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do meacutetodo GMRES associadas ao melhor
desempenho possiacutevel
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
145
Figura 43 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Lik
Figura 44 ndash Elementos necessaacuterios para calcular o erro associado ao elemento Uki
45 Adequaccedilatildeo da Regra Baseada no Erro
Nesta seccedilatildeo a regra de preenchimento baseada no erro eacute adequada para ser
usada no preacute-condicionador ILUT(τρ) analisado no capiacutetulo anterior O preacute-
condicionador resultante seraacute chamado de preacute-condicionador de duplo
paracircmetro limitante ILUT(ξτ) Neste preacute-condicionador natildeo eacute mais necessaacuterio
usar o paracircmetro ρ
Conforme visto no Capiacutetulo 3 o algoritmo de fatoraccedilatildeo usado neste preacute-
condicionador eacute o IKJ e deriva da eliminaccedilatildeo de Gauss (Saad 2003) Este tipo
de algoritmo permite calcular os elementos Ukk Ukk+1 Ukn antes de decidir se
o elemento Lik deve ser preenchido ou descartado Poreacutem o algoritmo IKJ natildeo
permite calcular os elementos Lk+1k Lnk antes de decidir se o elemento Uki
deve ser preenchido ou descartado porque no mesmo os elementos de L e U
146
satildeo calculados por linhas uma de cada vez Portanto a regra baseada no erro
pode ser aplicada apenas nos elementos do fator L enquanto que uma variante
da regra convencional usada no ILUT(τρ) eacute usada para os elementos de U
O caacutelculo da norma-2 usada na regra de preenchimento convencional dada pela
raiz quadrada da soma dos quadrados dos elementos da linha pode exigir
consideraacutevel esforccedilo computacional dependendo da dimensatildeo da matriz de
coeficientes Portanto ao inveacutes de se usar esta norma para descartar os
elementos em U recomenda-se realizar a meacutedia aritmeacutetica dos elementos da i-
eacutesima linha da matriz de coeficientes original Este procedimento reduz o nuacutemero
de operaccedilotildees de ponto flutuante sem comprometer a qualidade do preacute-
condicionador No entanto a eficiecircncia de ambas as heuriacutesticas eacute inferior agrave da
regra baseada no erro para preenchimento dos elementos proposta no presente
trabalho O resultado eacute um preacute-condicionador que aplica dois criteacuterios para
definir sua regra de preenchimento da seguinte forma
De acordo com a relaccedilatildeo dada por (417) um elemento Lik eacute descartado se o
erro resultante for menor que a toleracircncia ξ usada para todas as linhas de L
Caso contraacuterio calcula-se Lik usando-se o elemento aik da matriz resultante do
processo de eliminaccedilatildeo de Gauss ateacute a correspondente etapa Jaacute para um
elemento Uik este eacute descartado se for menor que uma certa toleracircncia relativa
τi obtida multiplicando-se a toleracircncia absoluta τ pela meacutedia aritmeacutetica dos
elementos da i-eacutesima linha da matriz de coeficientes original O caacutelculo de w eacute
efetuado de acordo com o algoritmo de fatoraccedilatildeo IKJ apresentado no capiacutetulo
anterior
ik
ikik
(L )
ik (L )k=(1i-1)
kk
0 R= aL
RU
lt ξ ge ξ
(417)
ik
k i
k k ik=(i+1n)
0 w =U
w w
lt ge
ττ
(418)
A adaptaccedilatildeo da regra baseada no erro no preacute-condicionador ILUT(τρ) falha
devido ao fato do algoritmo de fatoraccedilatildeo IKJ natildeo permitir a aplicaccedilatildeo da regra
147
em ambos os fatores triangulares L e U dificultando a exploraccedilatildeo das vantagens
do uso desta regra A seguir mostra-se uma proposta para superar estes
problemas utilizando-se outro algoritmo de fatoraccedilatildeo que permite aplicar a regra
em ambos os fatores triangulares
46 Preacute-condicionador ILU( ξ) Baseado no Caacutelculo do Erro
Nesta seccedilatildeo propotildee-se uma eficiente e robusta estrateacutegia de preacute-
condicionamento da fatoraccedilatildeo incompleta ILU(ξ) derivada de uma versatildeo do
algoritmo de eliminaccedilatildeo de Gauss conhecido como Doolittle A maior vantagem
deste algoritmo eacute que permite usar de forma efetiva a regra de preenchimento
baseada no erro em ambos os fatores triangulares L e U
Os fatores L e U satildeo apresentados em (419) e (420) Os elementos da diagonal
de L satildeo iguais a um e a primeira linha de U eacute igual agrave primeira linha da matriz de
coeficientes A As equaccedilotildees usadas pelo algoritmo de Doolittle para calcular os
elementos dos fatores triangulares satildeo apresentadas em (422) e podem ser
obtidas ao se igualar cada elemento do produto dos fatores triangulares LmiddotU de
(419) e (420) aos elementos da matriz de coeficientes A apresentada em (421)
Estas equaccedilotildees podem ser implementadas computacionalmente de diferentes
formas todas baseadas na eliminaccedilatildeo de Gauss Teoricamente os diferentes
tipos de eliminaccedilatildeo de Gauss realizam o mesmo nuacutemero de operaccedilotildees de ponto
flutuante No entanto no contexto da fatoraccedilatildeo incompleta estas variantes
resultam em importantes diferenccedilas praacuteticas quando o interesse eacute utilizar a regra
de preenchimento baseada no erro
k-11
k1 kk 1
i1 ik 1 ik
n1 nk 1 nk ni
1 0 0 0 0
L 1 0 0 0
L L 1 0 0L
L L L 1 0
L L L L 1
minus
minus
minus
=
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(419)
148
11 1k 1 1k 1i 1n
k-1k-1 k-1k k-1i k-1n
kk ki kn
ii in
nn
U U U U U
0 U U U U
0 0 U U UU
0 0 0 U U
0 0 0 0 U
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(420)
11 1k 1 1k 1i 1n
k-11 k-1k-1 k-1k k-1i k-1n
k1 kk-1 kk ki kn
i1 ik-1 ik ii in
n1 nk-1 nk ni nn
a a a a a
a a a a a
a a a a aA
a a a a a
a a a a a
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(421)
k-1
ki ki kj jij=1
k-1
ik ij jkj=1
ikkk
U =a - [L U ] i=kn
a - [L U ]
L = i=k+1nU
sum
sum (422)
As equaccedilotildees de Doolittle podem gerar algoritmos de eliminaccedilatildeo de Gauss que
calculam os elementos dos fatores triangulares por linhas de forma similar agrave
fatoraccedilatildeo IKJ ou por colunas (Bodewig 1956 Wilkinson 1965 Dahlquist amp
Bjoumlrk 1974 Hoffman 2001) Em ambos algoritmos natildeo seria possiacutevel usar a
regra de preenchimento baseada no erro A partir de (422) propotildee-se usar o
algoritmo de eliminaccedilatildeo de Gauss apresentado na Figura 45 que permite
calcular os elementos dos fatores triangulares simultaneamente por linhas em U
e por colunas em L como mostrado na Figura 46
No passo k da eliminaccedilatildeo de Gauss os elementos da k-eacutesima linha de U e a k-
eacutesima coluna de L (identificados por linhas tracejadas) satildeo calculados utilizando
elementos jaacute computados anteriormente nas linhas e colunas de U e L Por
exemplo para se calcular o elemento Uki satildeo usados os elementos destacados
em azul enquanto que para calcular o elemento Lik satildeo usados os elementos
149
destacados em vermelho Observa-se que este algoritmo permite calcular
elementos de L em linhas posteriores agrave linha k Esta caracteriacutestica possibilita o
uso em U da regra de preenchimento baseada no erro
1 Para i = 1n Faccedila
2 min = Ji in
3 Para k = in Faccedila
4 Para j = 1i-1 Faccedila
5 mk = mk - LijmiddotUjk
6 Fim ndash Faccedila
7 Fim ndash Faccedila
8 Registrar Umax = maxmin
9 ni+1n = J i+1ni
10 Para k = i+1n Faccedila
11 Para j = 1i-1 Faccedila
12 nk = nk ndash LkjmiddotUji
13 Fim ndash Faccedila
14 Fim ndash Faccedila
15 n = nUii
16 Registrar Lmax = maxni+1n
17 Aplicar a regra de preenchimento baseada no erro em m e n
18 Ui in = m in
19 L i+1ni = n i+1n
20 Fim ndash Faccedila
Figura 45 ndash Algoritmo do preacute-condicionador ILU(ξ)
Figura 46 ndash Elementos necessaacuterios para calcular os elementos Lik e Uki durante a fatoraccedilatildeo triangular
150
No algoritmo da Figura 45 observa-se que no passo k os elementos da linha de
U satildeo armazenados no vetor m enquanto que os elementos da coluna de L satildeo
armazenados no vetor n (passos 5 e 12 respectivamente) Uma vez calculados
ambos os vetores procura-se o maior elemento de m sendo armazenado em
Umax e o maior elemento de n armazenado em Lmax (passos 8 e 16
respectivamente) Ambos os valores maacuteximos (em valores absolutos) satildeo
usados pela regra de preenchimento no passo 17 para descartar em m e n os
elementos associados com os menores erros e preencher a linha de U e a
coluna de L da seguinte forma
De acordo com as relaccedilotildees dadas por (423) e (424) tanto um elemento Lki
como tambeacutem um elemento Uik satildeo descartados se seus erros associados
foram menores que uma dada toleracircncia ξ usada para todas as colunas de L e
linhas de U Caso contraacuterio Lki eacute preenchido usando-se o valor armazenado
em nk e Uik eacute preenchido usando-se o valor armazenado em mk
ik
ikik
(U )
(U )kk=(in)
0 R =U
m R
lt ξ ge ξ
(423)
ik
ikki
(L )
(L )ki=(1+1n)
0 R=L
n R
lt ξ ge ξ
(424)
Como observado na Figura 46 o algoritmo da Figura 45 permite encontrar os
elementos Ukk Ukk+1 Ukn necessaacuterios para se calcular o erro associado ao
elemento Lki e os elementos Lk+1k Lnk que por sua vez satildeo necessaacuterios para
se calcular o erro associado ao elemento Uik Nota-se que os elementos
necessaacuterios para calcular o erro (passo k) satildeo calculados neste mesmo passo
portanto natildeo eacute necessaacuterio realizar grandes buscas de elementos nas matrizes L
e U Igualmente tambeacutem natildeo eacute necessaacuterio armazenar valores Umax Lmax ou
erros do passo k porque natildeo seratildeo mais necessaacuterios nos proacuteximos passos
Observe-se que natildeo eacute necessaacuterio multiplicar o paracircmetro ξ por alguma norma ou
meacutedia aritmeacutetica dos elementos da matriz de coeficientes como realizado no
preacute-condicionador ILUT(τρ) porque o erro independe dos valores dos elementos
151
da matriz de coeficientes Este preacute-condicionador usa apenas um uacutenico
paracircmetro ξ Esta caracteriacutestica facilita o ajuste dos paracircmetros do solucionador
como seraacute visto nas proacuteximas seccedilotildees e no proacuteximo capiacutetulo
47 Meacutetodo Convencional Para Ajuste dos Paracircmetros dos Solucionadores
O ajuste dos paracircmetros de um solucionador iterativo eacute considerado fundamental
para garantir sua robustez e eficiecircncia computacional principalmente em
anaacutelises mais complexas como aquelas que solucionam vaacuterios fluxos de carga
com diferentes pontos de operaccedilatildeo Nesses casos a escolha de valores
apropriados para os paracircmetros se torna ainda mais relevante
A ideacuteia fundamental eacute escolher os valores dos paracircmetros que permitam
preencher o menor nuacutemero de elementos sem prejudicar a qualidade do preacute-
condicionador isto eacute sem tornaacute-lo muito diferente de A Poreacutem a escolha de
valores apropriados para os paracircmetros eacute uma tarefa difiacutecil jaacute que existe uma
interdependecircncia com as toleracircncias relativa e absoluta do GMRES e com o tipo
de problema que estaacute sendo solucionado
Pouco tem sido pesquisado em relaccedilatildeo a este tema apenas em (de Leon amp
Semlyen 2002) apresenta-se uma foacutermula que permite calcular para cada
sistema eleacutetrico o valor do paracircmetro limitante τ no preacute-condicionador ILU(τ)
dado por (322) onde τ eacute igual agrave metade do nuacutemero de equaccedilotildees totais Neq do
sistema linear Na praacutetica estaacute foacutermula natildeo garante robustez nem o melhor
desempenho do solucionador
eq
12 N
τ =sdot
(425)
No entanto o procedimento convencional define primeiro valores arbitraacuterios para
as duas toleracircncias absoluta e relativa do GMRES Nas simulaccedilotildees realizadas
nos capiacutetulos anteriores se usou toleracircncias iguais (10-5) e menores que a
toleracircncia usada no teste de convergecircncia do algoritmo Newton-Raphson pois
toleracircncias maiores costumam impedir a convergecircncia do Newton-Raphson
152
Uma vez definidas as toleracircncias a escolha dos paracircmetros do preacute-
condicionador eacute realizada com base em tentativa e erro
Este meacutetodo natildeo considera a possibilidade de encontrar melhores desempenhos
para outras toleracircncias do GMRES que natildeo necessariamente devem ser
consideradas iguais Durante o procedimento de tentativa e erro o meacutetodo pode
encontrar um miacutenimo nuacutemero de operaccedilotildees local (MFLOPSL) associado com τL
como ilustrado na Figura 47 que natildeo necessariamente eacute o menor possiacutevel
(MFLOPSG) Observa-se que para obter o miacutenimo nuacutemero de operaccedilotildees global
(MFLOPSG) o procedimento de tentativa e erro deveria comeccedilar com um valor
de τ proacuteximo de τG
Figura 47 ndash Procedimento de tentativa e erro para busca de valores de um paracircmetro do preacute-condicionador
Quando o preacute-condicionador possui um segundo paracircmetro o procedimento de
tentativa e erro eacute repetido para este segundo paracircmetro fixando-se o primeiro
paracircmetro
48 Meacutetodo Proposto Para Ajuste dos Paracircmetros dos Solucio nadores
O meacutetodo proposto consiste em realizar sucessivas simulaccedilotildees de fluxo de
carga variando simultaneamente todos os paracircmetros do solucionador e
registrando o nuacutemero de operaccedilotildees de ponto flutuante para cada caso gerado O
objetivo eacute encontrar regiotildees de valores para os paracircmetros onde o solucionador
153
apresente alto desempenho permitindo estabelecer e recomendar faixas para os
valores dos paracircmetros onde o solucionador garante convergecircncia com a maior
eficiecircncia possiacutevel O meacutetodo tambeacutem permite identificar as faixas de valores
onde o solucionador natildeo converge
O meacutetodo eacute ilustrado para ajustar os paracircmetros de duas configuraccedilotildees de
solucionador iterativo sendo estas o solucionador proposto neste trabalho
identificado como GMRES+ILU(ξ)+MD e o solucionador GMRES+ILUT(τρ)+MD
apresentado no capiacutetulo 2 Na Tabela 43 especificam-se os paracircmetros
associados a cada solucionador
Tabela 43 ndash Paracircmetros usados nos solucionadores
Solucionadores Meacutetodo Iterativo Preacute-condicionador
GMRES+ILU(ξ)+MD atol rtol
ξ
GMRES+ILUT(τρ)+MD τ ρ
481 Passos Fundamentais
Esta seccedilatildeo apresenta de maneira sucinta os passos envolvidos no meacutetodo para
ajuste dos paracircmetros dos solucionadores onde uma descriccedilatildeo geral eacute
mostrada na Figura 48 O primeiro passo refere-se agrave definiccedilatildeo do espaccedilo de
busca onde satildeo procurados os valores para os paracircmetros que garantem alto
desempenho do solucionador O segundo refere-se aos experimentos numeacutericos
realizados para avaliar o desempenho do solucionador considerando-se todas as
combinaccedilotildees possiacuteveis dos valores de seus paracircmetros definidos no espaccedilo de
busca O passo seguinte tem como objetivo calcular as faixas de valores
recomendaacuteveis para as toleracircncias absoluta e relativa do GMRES Finalmente o
quarto passo calcula as faixas de valores recomendaacuteveis para os paracircmetros do
preacute-condicionador
154
Figura 48 ndash Passos fundamentais para delimitaccedilatildeo dos paracircmetros do solucionador
Nas proacuteximas seccedilotildees os passos mais relevantes no contexto deste trabalho satildeo
discutidos mais detalhadamente
482 Estabelecimento do Espaccedilo de Busca
Para definir o espaccedilo de busca primeiramente deve-se estabelecer o domiacutenio de
cada paracircmetro isto eacute um valor miacutenimo e maacuteximo para cada toleracircncia do
GMRES e para cada paracircmetro do preacute-condicionador como mostrado na Tabela
44 e na Figura 49 Depois devem ser definidos valores intermediaacuterios para cada
paracircmetro sendo que o nuacutemero de valores totais eacute definido em funccedilatildeo do grau
de precisatildeo que se deseja conseguir nos paracircmetros
Finalmente o espaccedilo de busca eacute definido por todas as combinaccedilotildees possiacuteveis
entre as toleracircncias absoluta e relativa do GMRES como apresentado na Figura
49(a) e por todas as combinaccedilotildees possiacuteveis realizadas entre os paracircmetros do
preacute-condicionador como mostrado na Figura 49(b-c)
Para os valores especificados na Tabela 44 existem (m x n) combinaccedilotildees
possiacuteveis entre a toleracircncia absoluta e relativa (ver Figura 49(a)) e (q x p)
combinaccedilotildees possiacuteveis entre os paracircmetros τ e ρ do preacute-condicionador ILUT(τρ)
(ver Figura 49(c)) No caso do preacute-condicionador ILU(ξ) natildeo existem
combinaccedilotildees jaacute que este preacute-condicionador possui somente um uacutenico
paracircmetro Poreacutem existem k valores possiacuteveis para ξ (ver Figura 49(b))
Estabelecer Espaccedilo de Busca
Experimentos numeacutericos
Delimitar paracircmetros do preacute-condicionador
Delimitar toleracircncias do GMRES
155
Tabela 44 ndash Domiacutenios dos paracircmetros usados nos solucionadores
Paracircmetros Maacuteximo Miacutenimo Nuacutemero total de valores
atol atol1 atoln n
rtol rtol1 rtolm m
ξ ξ1 ξk k
τ τ1 τq q
ρ ρ1 ρp P
a) Espaccedilo de busca das toleracircncias do GMRES
b) Espaccedilo de busca dos paracircmetros do preacute-condicionador ILUT(ξ)
c) Espaccedilo de busca dos paracircmetros do preacute-
condicionador ILUT(τρ)
Figura 49 ndash Espaccedilo de busca dos paracircmetros do solucionador
483 Experimentos Numeacutericos
No segundo passo para cada combinaccedilatildeo das toleracircncias absoluta e relativa
(atolrtol) do espaccedilo de busca da Figura 49(a) satildeo simulados tantos Fluxos de
Carga quanto combinaccedilotildees dos paracircmetros do preacute-condicionador existam
registrando-se o nuacutemero de operaccedilotildees de ponto flutuante (MFLOPS) para cada
156
combinaccedilatildeo dos paracircmetros do preacute-condicionador Portanto para cada
combinaccedilatildeo (atolrtol) eacute gerado um graacutefico de eficiecircncia computacional (em
MFLOPS) em funccedilatildeo dos paracircmetros do preacute-condicionador como mostrado na
Figura 410(a) para o preacute-condicionador ILUT(τρ) e na Figura 410(b) para o
preacute-condicionador ILU(ξ)
a) Graacutefico de eficiecircncia para o preacute-condicionador ILUT(τρ)
b) Graacutefico de eficiecircncia para o preacute-condicionador ILU(ξ)
Figura 410 ndash Graacuteficos de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
Para cada graacutefico gerado eacute registrado o nuacutemero de operaccedilotildees de ponto flutuante
miacutenimo (MFLOPSmiacuten) e este valor eacute associado agrave sua correspondente combinaccedilatildeo
(atolrtol) Apoacutes terem sido realizados todos os experimentos e registrados todos
os MFLOPSmiacuten associados a todas as combinaccedilotildees (atolrtol) eacute gerado o graacutefico
de alta eficiecircncia Este graacutefico apresenta em escala de cores todos MFLOPSmiacuten
em funccedilatildeo de suas correspondentes combinaccedilotildees (atolrtol) como mostrado na
Figura 411 sendo que a cor azul estaacute associada com os menores MFLOPSmiacuten a
157
cor vermelha com os maiores MFLOPSmiacuten e em negrito os casos natildeo
convergentes
Observa-se que entre todos os valores registrados para MFLOPSmiacuten existe uma
regiatildeo que conteacutem os casos com os menores MFLOPSmiacuten Este valor chamado
de MFLOPSoacuteti eacute o nuacutemero miacutenimo de operaccedilotildees possiacutevel (global) e estaacute
associado com a regiatildeo quadrada em azul escuro segmentada pelas linhas
brancas Os pontos brancos indicam as posiccedilotildees de todas as combinaccedilotildees que
possuem nuacutemero de operaccedilotildees igual a MFLOPSoacuteti
Figura 411 ndash Graacuteficos de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
484 Delimitaccedilatildeo das Toleracircncias do GMRES
No terceiro passo a partir do graacutefico de alta eficiecircncia apresentado na sua forma
bidimensional na Figura 412 eacute segmentada a regiatildeo dos MFLOPSoacuteti Neste
caso esta regiatildeo eacute o quadrado azul do centro do graacutefico onde cada ponto
branco estaacute associado a uma combinaccedilatildeo (atolrtol) que apresenta o menor
nuacutemero de operaccedilotildees possiacutevel em todo o espaccedilo de busca (MFLOPSoacuteti) Este
graacutefico permite encontrar as faixas de valores (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do meacutetodo GMRES associadas ao melhor
desempenho possiacutevel
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
146
satildeo calculados por linhas uma de cada vez Portanto a regra baseada no erro
pode ser aplicada apenas nos elementos do fator L enquanto que uma variante
da regra convencional usada no ILUT(τρ) eacute usada para os elementos de U
O caacutelculo da norma-2 usada na regra de preenchimento convencional dada pela
raiz quadrada da soma dos quadrados dos elementos da linha pode exigir
consideraacutevel esforccedilo computacional dependendo da dimensatildeo da matriz de
coeficientes Portanto ao inveacutes de se usar esta norma para descartar os
elementos em U recomenda-se realizar a meacutedia aritmeacutetica dos elementos da i-
eacutesima linha da matriz de coeficientes original Este procedimento reduz o nuacutemero
de operaccedilotildees de ponto flutuante sem comprometer a qualidade do preacute-
condicionador No entanto a eficiecircncia de ambas as heuriacutesticas eacute inferior agrave da
regra baseada no erro para preenchimento dos elementos proposta no presente
trabalho O resultado eacute um preacute-condicionador que aplica dois criteacuterios para
definir sua regra de preenchimento da seguinte forma
De acordo com a relaccedilatildeo dada por (417) um elemento Lik eacute descartado se o
erro resultante for menor que a toleracircncia ξ usada para todas as linhas de L
Caso contraacuterio calcula-se Lik usando-se o elemento aik da matriz resultante do
processo de eliminaccedilatildeo de Gauss ateacute a correspondente etapa Jaacute para um
elemento Uik este eacute descartado se for menor que uma certa toleracircncia relativa
τi obtida multiplicando-se a toleracircncia absoluta τ pela meacutedia aritmeacutetica dos
elementos da i-eacutesima linha da matriz de coeficientes original O caacutelculo de w eacute
efetuado de acordo com o algoritmo de fatoraccedilatildeo IKJ apresentado no capiacutetulo
anterior
ik
ikik
(L )
ik (L )k=(1i-1)
kk
0 R= aL
RU
lt ξ ge ξ
(417)
ik
k i
k k ik=(i+1n)
0 w =U
w w
lt ge
ττ
(418)
A adaptaccedilatildeo da regra baseada no erro no preacute-condicionador ILUT(τρ) falha
devido ao fato do algoritmo de fatoraccedilatildeo IKJ natildeo permitir a aplicaccedilatildeo da regra
147
em ambos os fatores triangulares L e U dificultando a exploraccedilatildeo das vantagens
do uso desta regra A seguir mostra-se uma proposta para superar estes
problemas utilizando-se outro algoritmo de fatoraccedilatildeo que permite aplicar a regra
em ambos os fatores triangulares
46 Preacute-condicionador ILU( ξ) Baseado no Caacutelculo do Erro
Nesta seccedilatildeo propotildee-se uma eficiente e robusta estrateacutegia de preacute-
condicionamento da fatoraccedilatildeo incompleta ILU(ξ) derivada de uma versatildeo do
algoritmo de eliminaccedilatildeo de Gauss conhecido como Doolittle A maior vantagem
deste algoritmo eacute que permite usar de forma efetiva a regra de preenchimento
baseada no erro em ambos os fatores triangulares L e U
Os fatores L e U satildeo apresentados em (419) e (420) Os elementos da diagonal
de L satildeo iguais a um e a primeira linha de U eacute igual agrave primeira linha da matriz de
coeficientes A As equaccedilotildees usadas pelo algoritmo de Doolittle para calcular os
elementos dos fatores triangulares satildeo apresentadas em (422) e podem ser
obtidas ao se igualar cada elemento do produto dos fatores triangulares LmiddotU de
(419) e (420) aos elementos da matriz de coeficientes A apresentada em (421)
Estas equaccedilotildees podem ser implementadas computacionalmente de diferentes
formas todas baseadas na eliminaccedilatildeo de Gauss Teoricamente os diferentes
tipos de eliminaccedilatildeo de Gauss realizam o mesmo nuacutemero de operaccedilotildees de ponto
flutuante No entanto no contexto da fatoraccedilatildeo incompleta estas variantes
resultam em importantes diferenccedilas praacuteticas quando o interesse eacute utilizar a regra
de preenchimento baseada no erro
k-11
k1 kk 1
i1 ik 1 ik
n1 nk 1 nk ni
1 0 0 0 0
L 1 0 0 0
L L 1 0 0L
L L L 1 0
L L L L 1
minus
minus
minus
=
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(419)
148
11 1k 1 1k 1i 1n
k-1k-1 k-1k k-1i k-1n
kk ki kn
ii in
nn
U U U U U
0 U U U U
0 0 U U UU
0 0 0 U U
0 0 0 0 U
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(420)
11 1k 1 1k 1i 1n
k-11 k-1k-1 k-1k k-1i k-1n
k1 kk-1 kk ki kn
i1 ik-1 ik ii in
n1 nk-1 nk ni nn
a a a a a
a a a a a
a a a a aA
a a a a a
a a a a a
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(421)
k-1
ki ki kj jij=1
k-1
ik ij jkj=1
ikkk
U =a - [L U ] i=kn
a - [L U ]
L = i=k+1nU
sum
sum (422)
As equaccedilotildees de Doolittle podem gerar algoritmos de eliminaccedilatildeo de Gauss que
calculam os elementos dos fatores triangulares por linhas de forma similar agrave
fatoraccedilatildeo IKJ ou por colunas (Bodewig 1956 Wilkinson 1965 Dahlquist amp
Bjoumlrk 1974 Hoffman 2001) Em ambos algoritmos natildeo seria possiacutevel usar a
regra de preenchimento baseada no erro A partir de (422) propotildee-se usar o
algoritmo de eliminaccedilatildeo de Gauss apresentado na Figura 45 que permite
calcular os elementos dos fatores triangulares simultaneamente por linhas em U
e por colunas em L como mostrado na Figura 46
No passo k da eliminaccedilatildeo de Gauss os elementos da k-eacutesima linha de U e a k-
eacutesima coluna de L (identificados por linhas tracejadas) satildeo calculados utilizando
elementos jaacute computados anteriormente nas linhas e colunas de U e L Por
exemplo para se calcular o elemento Uki satildeo usados os elementos destacados
em azul enquanto que para calcular o elemento Lik satildeo usados os elementos
149
destacados em vermelho Observa-se que este algoritmo permite calcular
elementos de L em linhas posteriores agrave linha k Esta caracteriacutestica possibilita o
uso em U da regra de preenchimento baseada no erro
1 Para i = 1n Faccedila
2 min = Ji in
3 Para k = in Faccedila
4 Para j = 1i-1 Faccedila
5 mk = mk - LijmiddotUjk
6 Fim ndash Faccedila
7 Fim ndash Faccedila
8 Registrar Umax = maxmin
9 ni+1n = J i+1ni
10 Para k = i+1n Faccedila
11 Para j = 1i-1 Faccedila
12 nk = nk ndash LkjmiddotUji
13 Fim ndash Faccedila
14 Fim ndash Faccedila
15 n = nUii
16 Registrar Lmax = maxni+1n
17 Aplicar a regra de preenchimento baseada no erro em m e n
18 Ui in = m in
19 L i+1ni = n i+1n
20 Fim ndash Faccedila
Figura 45 ndash Algoritmo do preacute-condicionador ILU(ξ)
Figura 46 ndash Elementos necessaacuterios para calcular os elementos Lik e Uki durante a fatoraccedilatildeo triangular
150
No algoritmo da Figura 45 observa-se que no passo k os elementos da linha de
U satildeo armazenados no vetor m enquanto que os elementos da coluna de L satildeo
armazenados no vetor n (passos 5 e 12 respectivamente) Uma vez calculados
ambos os vetores procura-se o maior elemento de m sendo armazenado em
Umax e o maior elemento de n armazenado em Lmax (passos 8 e 16
respectivamente) Ambos os valores maacuteximos (em valores absolutos) satildeo
usados pela regra de preenchimento no passo 17 para descartar em m e n os
elementos associados com os menores erros e preencher a linha de U e a
coluna de L da seguinte forma
De acordo com as relaccedilotildees dadas por (423) e (424) tanto um elemento Lki
como tambeacutem um elemento Uik satildeo descartados se seus erros associados
foram menores que uma dada toleracircncia ξ usada para todas as colunas de L e
linhas de U Caso contraacuterio Lki eacute preenchido usando-se o valor armazenado
em nk e Uik eacute preenchido usando-se o valor armazenado em mk
ik
ikik
(U )
(U )kk=(in)
0 R =U
m R
lt ξ ge ξ
(423)
ik
ikki
(L )
(L )ki=(1+1n)
0 R=L
n R
lt ξ ge ξ
(424)
Como observado na Figura 46 o algoritmo da Figura 45 permite encontrar os
elementos Ukk Ukk+1 Ukn necessaacuterios para se calcular o erro associado ao
elemento Lki e os elementos Lk+1k Lnk que por sua vez satildeo necessaacuterios para
se calcular o erro associado ao elemento Uik Nota-se que os elementos
necessaacuterios para calcular o erro (passo k) satildeo calculados neste mesmo passo
portanto natildeo eacute necessaacuterio realizar grandes buscas de elementos nas matrizes L
e U Igualmente tambeacutem natildeo eacute necessaacuterio armazenar valores Umax Lmax ou
erros do passo k porque natildeo seratildeo mais necessaacuterios nos proacuteximos passos
Observe-se que natildeo eacute necessaacuterio multiplicar o paracircmetro ξ por alguma norma ou
meacutedia aritmeacutetica dos elementos da matriz de coeficientes como realizado no
preacute-condicionador ILUT(τρ) porque o erro independe dos valores dos elementos
151
da matriz de coeficientes Este preacute-condicionador usa apenas um uacutenico
paracircmetro ξ Esta caracteriacutestica facilita o ajuste dos paracircmetros do solucionador
como seraacute visto nas proacuteximas seccedilotildees e no proacuteximo capiacutetulo
47 Meacutetodo Convencional Para Ajuste dos Paracircmetros dos Solucionadores
O ajuste dos paracircmetros de um solucionador iterativo eacute considerado fundamental
para garantir sua robustez e eficiecircncia computacional principalmente em
anaacutelises mais complexas como aquelas que solucionam vaacuterios fluxos de carga
com diferentes pontos de operaccedilatildeo Nesses casos a escolha de valores
apropriados para os paracircmetros se torna ainda mais relevante
A ideacuteia fundamental eacute escolher os valores dos paracircmetros que permitam
preencher o menor nuacutemero de elementos sem prejudicar a qualidade do preacute-
condicionador isto eacute sem tornaacute-lo muito diferente de A Poreacutem a escolha de
valores apropriados para os paracircmetros eacute uma tarefa difiacutecil jaacute que existe uma
interdependecircncia com as toleracircncias relativa e absoluta do GMRES e com o tipo
de problema que estaacute sendo solucionado
Pouco tem sido pesquisado em relaccedilatildeo a este tema apenas em (de Leon amp
Semlyen 2002) apresenta-se uma foacutermula que permite calcular para cada
sistema eleacutetrico o valor do paracircmetro limitante τ no preacute-condicionador ILU(τ)
dado por (322) onde τ eacute igual agrave metade do nuacutemero de equaccedilotildees totais Neq do
sistema linear Na praacutetica estaacute foacutermula natildeo garante robustez nem o melhor
desempenho do solucionador
eq
12 N
τ =sdot
(425)
No entanto o procedimento convencional define primeiro valores arbitraacuterios para
as duas toleracircncias absoluta e relativa do GMRES Nas simulaccedilotildees realizadas
nos capiacutetulos anteriores se usou toleracircncias iguais (10-5) e menores que a
toleracircncia usada no teste de convergecircncia do algoritmo Newton-Raphson pois
toleracircncias maiores costumam impedir a convergecircncia do Newton-Raphson
152
Uma vez definidas as toleracircncias a escolha dos paracircmetros do preacute-
condicionador eacute realizada com base em tentativa e erro
Este meacutetodo natildeo considera a possibilidade de encontrar melhores desempenhos
para outras toleracircncias do GMRES que natildeo necessariamente devem ser
consideradas iguais Durante o procedimento de tentativa e erro o meacutetodo pode
encontrar um miacutenimo nuacutemero de operaccedilotildees local (MFLOPSL) associado com τL
como ilustrado na Figura 47 que natildeo necessariamente eacute o menor possiacutevel
(MFLOPSG) Observa-se que para obter o miacutenimo nuacutemero de operaccedilotildees global
(MFLOPSG) o procedimento de tentativa e erro deveria comeccedilar com um valor
de τ proacuteximo de τG
Figura 47 ndash Procedimento de tentativa e erro para busca de valores de um paracircmetro do preacute-condicionador
Quando o preacute-condicionador possui um segundo paracircmetro o procedimento de
tentativa e erro eacute repetido para este segundo paracircmetro fixando-se o primeiro
paracircmetro
48 Meacutetodo Proposto Para Ajuste dos Paracircmetros dos Solucio nadores
O meacutetodo proposto consiste em realizar sucessivas simulaccedilotildees de fluxo de
carga variando simultaneamente todos os paracircmetros do solucionador e
registrando o nuacutemero de operaccedilotildees de ponto flutuante para cada caso gerado O
objetivo eacute encontrar regiotildees de valores para os paracircmetros onde o solucionador
153
apresente alto desempenho permitindo estabelecer e recomendar faixas para os
valores dos paracircmetros onde o solucionador garante convergecircncia com a maior
eficiecircncia possiacutevel O meacutetodo tambeacutem permite identificar as faixas de valores
onde o solucionador natildeo converge
O meacutetodo eacute ilustrado para ajustar os paracircmetros de duas configuraccedilotildees de
solucionador iterativo sendo estas o solucionador proposto neste trabalho
identificado como GMRES+ILU(ξ)+MD e o solucionador GMRES+ILUT(τρ)+MD
apresentado no capiacutetulo 2 Na Tabela 43 especificam-se os paracircmetros
associados a cada solucionador
Tabela 43 ndash Paracircmetros usados nos solucionadores
Solucionadores Meacutetodo Iterativo Preacute-condicionador
GMRES+ILU(ξ)+MD atol rtol
ξ
GMRES+ILUT(τρ)+MD τ ρ
481 Passos Fundamentais
Esta seccedilatildeo apresenta de maneira sucinta os passos envolvidos no meacutetodo para
ajuste dos paracircmetros dos solucionadores onde uma descriccedilatildeo geral eacute
mostrada na Figura 48 O primeiro passo refere-se agrave definiccedilatildeo do espaccedilo de
busca onde satildeo procurados os valores para os paracircmetros que garantem alto
desempenho do solucionador O segundo refere-se aos experimentos numeacutericos
realizados para avaliar o desempenho do solucionador considerando-se todas as
combinaccedilotildees possiacuteveis dos valores de seus paracircmetros definidos no espaccedilo de
busca O passo seguinte tem como objetivo calcular as faixas de valores
recomendaacuteveis para as toleracircncias absoluta e relativa do GMRES Finalmente o
quarto passo calcula as faixas de valores recomendaacuteveis para os paracircmetros do
preacute-condicionador
154
Figura 48 ndash Passos fundamentais para delimitaccedilatildeo dos paracircmetros do solucionador
Nas proacuteximas seccedilotildees os passos mais relevantes no contexto deste trabalho satildeo
discutidos mais detalhadamente
482 Estabelecimento do Espaccedilo de Busca
Para definir o espaccedilo de busca primeiramente deve-se estabelecer o domiacutenio de
cada paracircmetro isto eacute um valor miacutenimo e maacuteximo para cada toleracircncia do
GMRES e para cada paracircmetro do preacute-condicionador como mostrado na Tabela
44 e na Figura 49 Depois devem ser definidos valores intermediaacuterios para cada
paracircmetro sendo que o nuacutemero de valores totais eacute definido em funccedilatildeo do grau
de precisatildeo que se deseja conseguir nos paracircmetros
Finalmente o espaccedilo de busca eacute definido por todas as combinaccedilotildees possiacuteveis
entre as toleracircncias absoluta e relativa do GMRES como apresentado na Figura
49(a) e por todas as combinaccedilotildees possiacuteveis realizadas entre os paracircmetros do
preacute-condicionador como mostrado na Figura 49(b-c)
Para os valores especificados na Tabela 44 existem (m x n) combinaccedilotildees
possiacuteveis entre a toleracircncia absoluta e relativa (ver Figura 49(a)) e (q x p)
combinaccedilotildees possiacuteveis entre os paracircmetros τ e ρ do preacute-condicionador ILUT(τρ)
(ver Figura 49(c)) No caso do preacute-condicionador ILU(ξ) natildeo existem
combinaccedilotildees jaacute que este preacute-condicionador possui somente um uacutenico
paracircmetro Poreacutem existem k valores possiacuteveis para ξ (ver Figura 49(b))
Estabelecer Espaccedilo de Busca
Experimentos numeacutericos
Delimitar paracircmetros do preacute-condicionador
Delimitar toleracircncias do GMRES
155
Tabela 44 ndash Domiacutenios dos paracircmetros usados nos solucionadores
Paracircmetros Maacuteximo Miacutenimo Nuacutemero total de valores
atol atol1 atoln n
rtol rtol1 rtolm m
ξ ξ1 ξk k
τ τ1 τq q
ρ ρ1 ρp P
a) Espaccedilo de busca das toleracircncias do GMRES
b) Espaccedilo de busca dos paracircmetros do preacute-condicionador ILUT(ξ)
c) Espaccedilo de busca dos paracircmetros do preacute-
condicionador ILUT(τρ)
Figura 49 ndash Espaccedilo de busca dos paracircmetros do solucionador
483 Experimentos Numeacutericos
No segundo passo para cada combinaccedilatildeo das toleracircncias absoluta e relativa
(atolrtol) do espaccedilo de busca da Figura 49(a) satildeo simulados tantos Fluxos de
Carga quanto combinaccedilotildees dos paracircmetros do preacute-condicionador existam
registrando-se o nuacutemero de operaccedilotildees de ponto flutuante (MFLOPS) para cada
156
combinaccedilatildeo dos paracircmetros do preacute-condicionador Portanto para cada
combinaccedilatildeo (atolrtol) eacute gerado um graacutefico de eficiecircncia computacional (em
MFLOPS) em funccedilatildeo dos paracircmetros do preacute-condicionador como mostrado na
Figura 410(a) para o preacute-condicionador ILUT(τρ) e na Figura 410(b) para o
preacute-condicionador ILU(ξ)
a) Graacutefico de eficiecircncia para o preacute-condicionador ILUT(τρ)
b) Graacutefico de eficiecircncia para o preacute-condicionador ILU(ξ)
Figura 410 ndash Graacuteficos de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
Para cada graacutefico gerado eacute registrado o nuacutemero de operaccedilotildees de ponto flutuante
miacutenimo (MFLOPSmiacuten) e este valor eacute associado agrave sua correspondente combinaccedilatildeo
(atolrtol) Apoacutes terem sido realizados todos os experimentos e registrados todos
os MFLOPSmiacuten associados a todas as combinaccedilotildees (atolrtol) eacute gerado o graacutefico
de alta eficiecircncia Este graacutefico apresenta em escala de cores todos MFLOPSmiacuten
em funccedilatildeo de suas correspondentes combinaccedilotildees (atolrtol) como mostrado na
Figura 411 sendo que a cor azul estaacute associada com os menores MFLOPSmiacuten a
157
cor vermelha com os maiores MFLOPSmiacuten e em negrito os casos natildeo
convergentes
Observa-se que entre todos os valores registrados para MFLOPSmiacuten existe uma
regiatildeo que conteacutem os casos com os menores MFLOPSmiacuten Este valor chamado
de MFLOPSoacuteti eacute o nuacutemero miacutenimo de operaccedilotildees possiacutevel (global) e estaacute
associado com a regiatildeo quadrada em azul escuro segmentada pelas linhas
brancas Os pontos brancos indicam as posiccedilotildees de todas as combinaccedilotildees que
possuem nuacutemero de operaccedilotildees igual a MFLOPSoacuteti
Figura 411 ndash Graacuteficos de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
484 Delimitaccedilatildeo das Toleracircncias do GMRES
No terceiro passo a partir do graacutefico de alta eficiecircncia apresentado na sua forma
bidimensional na Figura 412 eacute segmentada a regiatildeo dos MFLOPSoacuteti Neste
caso esta regiatildeo eacute o quadrado azul do centro do graacutefico onde cada ponto
branco estaacute associado a uma combinaccedilatildeo (atolrtol) que apresenta o menor
nuacutemero de operaccedilotildees possiacutevel em todo o espaccedilo de busca (MFLOPSoacuteti) Este
graacutefico permite encontrar as faixas de valores (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do meacutetodo GMRES associadas ao melhor
desempenho possiacutevel
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
147
em ambos os fatores triangulares L e U dificultando a exploraccedilatildeo das vantagens
do uso desta regra A seguir mostra-se uma proposta para superar estes
problemas utilizando-se outro algoritmo de fatoraccedilatildeo que permite aplicar a regra
em ambos os fatores triangulares
46 Preacute-condicionador ILU( ξ) Baseado no Caacutelculo do Erro
Nesta seccedilatildeo propotildee-se uma eficiente e robusta estrateacutegia de preacute-
condicionamento da fatoraccedilatildeo incompleta ILU(ξ) derivada de uma versatildeo do
algoritmo de eliminaccedilatildeo de Gauss conhecido como Doolittle A maior vantagem
deste algoritmo eacute que permite usar de forma efetiva a regra de preenchimento
baseada no erro em ambos os fatores triangulares L e U
Os fatores L e U satildeo apresentados em (419) e (420) Os elementos da diagonal
de L satildeo iguais a um e a primeira linha de U eacute igual agrave primeira linha da matriz de
coeficientes A As equaccedilotildees usadas pelo algoritmo de Doolittle para calcular os
elementos dos fatores triangulares satildeo apresentadas em (422) e podem ser
obtidas ao se igualar cada elemento do produto dos fatores triangulares LmiddotU de
(419) e (420) aos elementos da matriz de coeficientes A apresentada em (421)
Estas equaccedilotildees podem ser implementadas computacionalmente de diferentes
formas todas baseadas na eliminaccedilatildeo de Gauss Teoricamente os diferentes
tipos de eliminaccedilatildeo de Gauss realizam o mesmo nuacutemero de operaccedilotildees de ponto
flutuante No entanto no contexto da fatoraccedilatildeo incompleta estas variantes
resultam em importantes diferenccedilas praacuteticas quando o interesse eacute utilizar a regra
de preenchimento baseada no erro
k-11
k1 kk 1
i1 ik 1 ik
n1 nk 1 nk ni
1 0 0 0 0
L 1 0 0 0
L L 1 0 0L
L L L 1 0
L L L L 1
minus
minus
minus
=
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(419)
148
11 1k 1 1k 1i 1n
k-1k-1 k-1k k-1i k-1n
kk ki kn
ii in
nn
U U U U U
0 U U U U
0 0 U U UU
0 0 0 U U
0 0 0 0 U
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(420)
11 1k 1 1k 1i 1n
k-11 k-1k-1 k-1k k-1i k-1n
k1 kk-1 kk ki kn
i1 ik-1 ik ii in
n1 nk-1 nk ni nn
a a a a a
a a a a a
a a a a aA
a a a a a
a a a a a
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(421)
k-1
ki ki kj jij=1
k-1
ik ij jkj=1
ikkk
U =a - [L U ] i=kn
a - [L U ]
L = i=k+1nU
sum
sum (422)
As equaccedilotildees de Doolittle podem gerar algoritmos de eliminaccedilatildeo de Gauss que
calculam os elementos dos fatores triangulares por linhas de forma similar agrave
fatoraccedilatildeo IKJ ou por colunas (Bodewig 1956 Wilkinson 1965 Dahlquist amp
Bjoumlrk 1974 Hoffman 2001) Em ambos algoritmos natildeo seria possiacutevel usar a
regra de preenchimento baseada no erro A partir de (422) propotildee-se usar o
algoritmo de eliminaccedilatildeo de Gauss apresentado na Figura 45 que permite
calcular os elementos dos fatores triangulares simultaneamente por linhas em U
e por colunas em L como mostrado na Figura 46
No passo k da eliminaccedilatildeo de Gauss os elementos da k-eacutesima linha de U e a k-
eacutesima coluna de L (identificados por linhas tracejadas) satildeo calculados utilizando
elementos jaacute computados anteriormente nas linhas e colunas de U e L Por
exemplo para se calcular o elemento Uki satildeo usados os elementos destacados
em azul enquanto que para calcular o elemento Lik satildeo usados os elementos
149
destacados em vermelho Observa-se que este algoritmo permite calcular
elementos de L em linhas posteriores agrave linha k Esta caracteriacutestica possibilita o
uso em U da regra de preenchimento baseada no erro
1 Para i = 1n Faccedila
2 min = Ji in
3 Para k = in Faccedila
4 Para j = 1i-1 Faccedila
5 mk = mk - LijmiddotUjk
6 Fim ndash Faccedila
7 Fim ndash Faccedila
8 Registrar Umax = maxmin
9 ni+1n = J i+1ni
10 Para k = i+1n Faccedila
11 Para j = 1i-1 Faccedila
12 nk = nk ndash LkjmiddotUji
13 Fim ndash Faccedila
14 Fim ndash Faccedila
15 n = nUii
16 Registrar Lmax = maxni+1n
17 Aplicar a regra de preenchimento baseada no erro em m e n
18 Ui in = m in
19 L i+1ni = n i+1n
20 Fim ndash Faccedila
Figura 45 ndash Algoritmo do preacute-condicionador ILU(ξ)
Figura 46 ndash Elementos necessaacuterios para calcular os elementos Lik e Uki durante a fatoraccedilatildeo triangular
150
No algoritmo da Figura 45 observa-se que no passo k os elementos da linha de
U satildeo armazenados no vetor m enquanto que os elementos da coluna de L satildeo
armazenados no vetor n (passos 5 e 12 respectivamente) Uma vez calculados
ambos os vetores procura-se o maior elemento de m sendo armazenado em
Umax e o maior elemento de n armazenado em Lmax (passos 8 e 16
respectivamente) Ambos os valores maacuteximos (em valores absolutos) satildeo
usados pela regra de preenchimento no passo 17 para descartar em m e n os
elementos associados com os menores erros e preencher a linha de U e a
coluna de L da seguinte forma
De acordo com as relaccedilotildees dadas por (423) e (424) tanto um elemento Lki
como tambeacutem um elemento Uik satildeo descartados se seus erros associados
foram menores que uma dada toleracircncia ξ usada para todas as colunas de L e
linhas de U Caso contraacuterio Lki eacute preenchido usando-se o valor armazenado
em nk e Uik eacute preenchido usando-se o valor armazenado em mk
ik
ikik
(U )
(U )kk=(in)
0 R =U
m R
lt ξ ge ξ
(423)
ik
ikki
(L )
(L )ki=(1+1n)
0 R=L
n R
lt ξ ge ξ
(424)
Como observado na Figura 46 o algoritmo da Figura 45 permite encontrar os
elementos Ukk Ukk+1 Ukn necessaacuterios para se calcular o erro associado ao
elemento Lki e os elementos Lk+1k Lnk que por sua vez satildeo necessaacuterios para
se calcular o erro associado ao elemento Uik Nota-se que os elementos
necessaacuterios para calcular o erro (passo k) satildeo calculados neste mesmo passo
portanto natildeo eacute necessaacuterio realizar grandes buscas de elementos nas matrizes L
e U Igualmente tambeacutem natildeo eacute necessaacuterio armazenar valores Umax Lmax ou
erros do passo k porque natildeo seratildeo mais necessaacuterios nos proacuteximos passos
Observe-se que natildeo eacute necessaacuterio multiplicar o paracircmetro ξ por alguma norma ou
meacutedia aritmeacutetica dos elementos da matriz de coeficientes como realizado no
preacute-condicionador ILUT(τρ) porque o erro independe dos valores dos elementos
151
da matriz de coeficientes Este preacute-condicionador usa apenas um uacutenico
paracircmetro ξ Esta caracteriacutestica facilita o ajuste dos paracircmetros do solucionador
como seraacute visto nas proacuteximas seccedilotildees e no proacuteximo capiacutetulo
47 Meacutetodo Convencional Para Ajuste dos Paracircmetros dos Solucionadores
O ajuste dos paracircmetros de um solucionador iterativo eacute considerado fundamental
para garantir sua robustez e eficiecircncia computacional principalmente em
anaacutelises mais complexas como aquelas que solucionam vaacuterios fluxos de carga
com diferentes pontos de operaccedilatildeo Nesses casos a escolha de valores
apropriados para os paracircmetros se torna ainda mais relevante
A ideacuteia fundamental eacute escolher os valores dos paracircmetros que permitam
preencher o menor nuacutemero de elementos sem prejudicar a qualidade do preacute-
condicionador isto eacute sem tornaacute-lo muito diferente de A Poreacutem a escolha de
valores apropriados para os paracircmetros eacute uma tarefa difiacutecil jaacute que existe uma
interdependecircncia com as toleracircncias relativa e absoluta do GMRES e com o tipo
de problema que estaacute sendo solucionado
Pouco tem sido pesquisado em relaccedilatildeo a este tema apenas em (de Leon amp
Semlyen 2002) apresenta-se uma foacutermula que permite calcular para cada
sistema eleacutetrico o valor do paracircmetro limitante τ no preacute-condicionador ILU(τ)
dado por (322) onde τ eacute igual agrave metade do nuacutemero de equaccedilotildees totais Neq do
sistema linear Na praacutetica estaacute foacutermula natildeo garante robustez nem o melhor
desempenho do solucionador
eq
12 N
τ =sdot
(425)
No entanto o procedimento convencional define primeiro valores arbitraacuterios para
as duas toleracircncias absoluta e relativa do GMRES Nas simulaccedilotildees realizadas
nos capiacutetulos anteriores se usou toleracircncias iguais (10-5) e menores que a
toleracircncia usada no teste de convergecircncia do algoritmo Newton-Raphson pois
toleracircncias maiores costumam impedir a convergecircncia do Newton-Raphson
152
Uma vez definidas as toleracircncias a escolha dos paracircmetros do preacute-
condicionador eacute realizada com base em tentativa e erro
Este meacutetodo natildeo considera a possibilidade de encontrar melhores desempenhos
para outras toleracircncias do GMRES que natildeo necessariamente devem ser
consideradas iguais Durante o procedimento de tentativa e erro o meacutetodo pode
encontrar um miacutenimo nuacutemero de operaccedilotildees local (MFLOPSL) associado com τL
como ilustrado na Figura 47 que natildeo necessariamente eacute o menor possiacutevel
(MFLOPSG) Observa-se que para obter o miacutenimo nuacutemero de operaccedilotildees global
(MFLOPSG) o procedimento de tentativa e erro deveria comeccedilar com um valor
de τ proacuteximo de τG
Figura 47 ndash Procedimento de tentativa e erro para busca de valores de um paracircmetro do preacute-condicionador
Quando o preacute-condicionador possui um segundo paracircmetro o procedimento de
tentativa e erro eacute repetido para este segundo paracircmetro fixando-se o primeiro
paracircmetro
48 Meacutetodo Proposto Para Ajuste dos Paracircmetros dos Solucio nadores
O meacutetodo proposto consiste em realizar sucessivas simulaccedilotildees de fluxo de
carga variando simultaneamente todos os paracircmetros do solucionador e
registrando o nuacutemero de operaccedilotildees de ponto flutuante para cada caso gerado O
objetivo eacute encontrar regiotildees de valores para os paracircmetros onde o solucionador
153
apresente alto desempenho permitindo estabelecer e recomendar faixas para os
valores dos paracircmetros onde o solucionador garante convergecircncia com a maior
eficiecircncia possiacutevel O meacutetodo tambeacutem permite identificar as faixas de valores
onde o solucionador natildeo converge
O meacutetodo eacute ilustrado para ajustar os paracircmetros de duas configuraccedilotildees de
solucionador iterativo sendo estas o solucionador proposto neste trabalho
identificado como GMRES+ILU(ξ)+MD e o solucionador GMRES+ILUT(τρ)+MD
apresentado no capiacutetulo 2 Na Tabela 43 especificam-se os paracircmetros
associados a cada solucionador
Tabela 43 ndash Paracircmetros usados nos solucionadores
Solucionadores Meacutetodo Iterativo Preacute-condicionador
GMRES+ILU(ξ)+MD atol rtol
ξ
GMRES+ILUT(τρ)+MD τ ρ
481 Passos Fundamentais
Esta seccedilatildeo apresenta de maneira sucinta os passos envolvidos no meacutetodo para
ajuste dos paracircmetros dos solucionadores onde uma descriccedilatildeo geral eacute
mostrada na Figura 48 O primeiro passo refere-se agrave definiccedilatildeo do espaccedilo de
busca onde satildeo procurados os valores para os paracircmetros que garantem alto
desempenho do solucionador O segundo refere-se aos experimentos numeacutericos
realizados para avaliar o desempenho do solucionador considerando-se todas as
combinaccedilotildees possiacuteveis dos valores de seus paracircmetros definidos no espaccedilo de
busca O passo seguinte tem como objetivo calcular as faixas de valores
recomendaacuteveis para as toleracircncias absoluta e relativa do GMRES Finalmente o
quarto passo calcula as faixas de valores recomendaacuteveis para os paracircmetros do
preacute-condicionador
154
Figura 48 ndash Passos fundamentais para delimitaccedilatildeo dos paracircmetros do solucionador
Nas proacuteximas seccedilotildees os passos mais relevantes no contexto deste trabalho satildeo
discutidos mais detalhadamente
482 Estabelecimento do Espaccedilo de Busca
Para definir o espaccedilo de busca primeiramente deve-se estabelecer o domiacutenio de
cada paracircmetro isto eacute um valor miacutenimo e maacuteximo para cada toleracircncia do
GMRES e para cada paracircmetro do preacute-condicionador como mostrado na Tabela
44 e na Figura 49 Depois devem ser definidos valores intermediaacuterios para cada
paracircmetro sendo que o nuacutemero de valores totais eacute definido em funccedilatildeo do grau
de precisatildeo que se deseja conseguir nos paracircmetros
Finalmente o espaccedilo de busca eacute definido por todas as combinaccedilotildees possiacuteveis
entre as toleracircncias absoluta e relativa do GMRES como apresentado na Figura
49(a) e por todas as combinaccedilotildees possiacuteveis realizadas entre os paracircmetros do
preacute-condicionador como mostrado na Figura 49(b-c)
Para os valores especificados na Tabela 44 existem (m x n) combinaccedilotildees
possiacuteveis entre a toleracircncia absoluta e relativa (ver Figura 49(a)) e (q x p)
combinaccedilotildees possiacuteveis entre os paracircmetros τ e ρ do preacute-condicionador ILUT(τρ)
(ver Figura 49(c)) No caso do preacute-condicionador ILU(ξ) natildeo existem
combinaccedilotildees jaacute que este preacute-condicionador possui somente um uacutenico
paracircmetro Poreacutem existem k valores possiacuteveis para ξ (ver Figura 49(b))
Estabelecer Espaccedilo de Busca
Experimentos numeacutericos
Delimitar paracircmetros do preacute-condicionador
Delimitar toleracircncias do GMRES
155
Tabela 44 ndash Domiacutenios dos paracircmetros usados nos solucionadores
Paracircmetros Maacuteximo Miacutenimo Nuacutemero total de valores
atol atol1 atoln n
rtol rtol1 rtolm m
ξ ξ1 ξk k
τ τ1 τq q
ρ ρ1 ρp P
a) Espaccedilo de busca das toleracircncias do GMRES
b) Espaccedilo de busca dos paracircmetros do preacute-condicionador ILUT(ξ)
c) Espaccedilo de busca dos paracircmetros do preacute-
condicionador ILUT(τρ)
Figura 49 ndash Espaccedilo de busca dos paracircmetros do solucionador
483 Experimentos Numeacutericos
No segundo passo para cada combinaccedilatildeo das toleracircncias absoluta e relativa
(atolrtol) do espaccedilo de busca da Figura 49(a) satildeo simulados tantos Fluxos de
Carga quanto combinaccedilotildees dos paracircmetros do preacute-condicionador existam
registrando-se o nuacutemero de operaccedilotildees de ponto flutuante (MFLOPS) para cada
156
combinaccedilatildeo dos paracircmetros do preacute-condicionador Portanto para cada
combinaccedilatildeo (atolrtol) eacute gerado um graacutefico de eficiecircncia computacional (em
MFLOPS) em funccedilatildeo dos paracircmetros do preacute-condicionador como mostrado na
Figura 410(a) para o preacute-condicionador ILUT(τρ) e na Figura 410(b) para o
preacute-condicionador ILU(ξ)
a) Graacutefico de eficiecircncia para o preacute-condicionador ILUT(τρ)
b) Graacutefico de eficiecircncia para o preacute-condicionador ILU(ξ)
Figura 410 ndash Graacuteficos de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
Para cada graacutefico gerado eacute registrado o nuacutemero de operaccedilotildees de ponto flutuante
miacutenimo (MFLOPSmiacuten) e este valor eacute associado agrave sua correspondente combinaccedilatildeo
(atolrtol) Apoacutes terem sido realizados todos os experimentos e registrados todos
os MFLOPSmiacuten associados a todas as combinaccedilotildees (atolrtol) eacute gerado o graacutefico
de alta eficiecircncia Este graacutefico apresenta em escala de cores todos MFLOPSmiacuten
em funccedilatildeo de suas correspondentes combinaccedilotildees (atolrtol) como mostrado na
Figura 411 sendo que a cor azul estaacute associada com os menores MFLOPSmiacuten a
157
cor vermelha com os maiores MFLOPSmiacuten e em negrito os casos natildeo
convergentes
Observa-se que entre todos os valores registrados para MFLOPSmiacuten existe uma
regiatildeo que conteacutem os casos com os menores MFLOPSmiacuten Este valor chamado
de MFLOPSoacuteti eacute o nuacutemero miacutenimo de operaccedilotildees possiacutevel (global) e estaacute
associado com a regiatildeo quadrada em azul escuro segmentada pelas linhas
brancas Os pontos brancos indicam as posiccedilotildees de todas as combinaccedilotildees que
possuem nuacutemero de operaccedilotildees igual a MFLOPSoacuteti
Figura 411 ndash Graacuteficos de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
484 Delimitaccedilatildeo das Toleracircncias do GMRES
No terceiro passo a partir do graacutefico de alta eficiecircncia apresentado na sua forma
bidimensional na Figura 412 eacute segmentada a regiatildeo dos MFLOPSoacuteti Neste
caso esta regiatildeo eacute o quadrado azul do centro do graacutefico onde cada ponto
branco estaacute associado a uma combinaccedilatildeo (atolrtol) que apresenta o menor
nuacutemero de operaccedilotildees possiacutevel em todo o espaccedilo de busca (MFLOPSoacuteti) Este
graacutefico permite encontrar as faixas de valores (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do meacutetodo GMRES associadas ao melhor
desempenho possiacutevel
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
148
11 1k 1 1k 1i 1n
k-1k-1 k-1k k-1i k-1n
kk ki kn
ii in
nn
U U U U U
0 U U U U
0 0 U U UU
0 0 0 U U
0 0 0 0 U
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(420)
11 1k 1 1k 1i 1n
k-11 k-1k-1 k-1k k-1i k-1n
k1 kk-1 kk ki kn
i1 ik-1 ik ii in
n1 nk-1 nk ni nn
a a a a a
a a a a a
a a a a aA
a a a a a
a a a a a
minus =
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
⋮ ⋱ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮
⋯ ⋯ ⋯
(421)
k-1
ki ki kj jij=1
k-1
ik ij jkj=1
ikkk
U =a - [L U ] i=kn
a - [L U ]
L = i=k+1nU
sum
sum (422)
As equaccedilotildees de Doolittle podem gerar algoritmos de eliminaccedilatildeo de Gauss que
calculam os elementos dos fatores triangulares por linhas de forma similar agrave
fatoraccedilatildeo IKJ ou por colunas (Bodewig 1956 Wilkinson 1965 Dahlquist amp
Bjoumlrk 1974 Hoffman 2001) Em ambos algoritmos natildeo seria possiacutevel usar a
regra de preenchimento baseada no erro A partir de (422) propotildee-se usar o
algoritmo de eliminaccedilatildeo de Gauss apresentado na Figura 45 que permite
calcular os elementos dos fatores triangulares simultaneamente por linhas em U
e por colunas em L como mostrado na Figura 46
No passo k da eliminaccedilatildeo de Gauss os elementos da k-eacutesima linha de U e a k-
eacutesima coluna de L (identificados por linhas tracejadas) satildeo calculados utilizando
elementos jaacute computados anteriormente nas linhas e colunas de U e L Por
exemplo para se calcular o elemento Uki satildeo usados os elementos destacados
em azul enquanto que para calcular o elemento Lik satildeo usados os elementos
149
destacados em vermelho Observa-se que este algoritmo permite calcular
elementos de L em linhas posteriores agrave linha k Esta caracteriacutestica possibilita o
uso em U da regra de preenchimento baseada no erro
1 Para i = 1n Faccedila
2 min = Ji in
3 Para k = in Faccedila
4 Para j = 1i-1 Faccedila
5 mk = mk - LijmiddotUjk
6 Fim ndash Faccedila
7 Fim ndash Faccedila
8 Registrar Umax = maxmin
9 ni+1n = J i+1ni
10 Para k = i+1n Faccedila
11 Para j = 1i-1 Faccedila
12 nk = nk ndash LkjmiddotUji
13 Fim ndash Faccedila
14 Fim ndash Faccedila
15 n = nUii
16 Registrar Lmax = maxni+1n
17 Aplicar a regra de preenchimento baseada no erro em m e n
18 Ui in = m in
19 L i+1ni = n i+1n
20 Fim ndash Faccedila
Figura 45 ndash Algoritmo do preacute-condicionador ILU(ξ)
Figura 46 ndash Elementos necessaacuterios para calcular os elementos Lik e Uki durante a fatoraccedilatildeo triangular
150
No algoritmo da Figura 45 observa-se que no passo k os elementos da linha de
U satildeo armazenados no vetor m enquanto que os elementos da coluna de L satildeo
armazenados no vetor n (passos 5 e 12 respectivamente) Uma vez calculados
ambos os vetores procura-se o maior elemento de m sendo armazenado em
Umax e o maior elemento de n armazenado em Lmax (passos 8 e 16
respectivamente) Ambos os valores maacuteximos (em valores absolutos) satildeo
usados pela regra de preenchimento no passo 17 para descartar em m e n os
elementos associados com os menores erros e preencher a linha de U e a
coluna de L da seguinte forma
De acordo com as relaccedilotildees dadas por (423) e (424) tanto um elemento Lki
como tambeacutem um elemento Uik satildeo descartados se seus erros associados
foram menores que uma dada toleracircncia ξ usada para todas as colunas de L e
linhas de U Caso contraacuterio Lki eacute preenchido usando-se o valor armazenado
em nk e Uik eacute preenchido usando-se o valor armazenado em mk
ik
ikik
(U )
(U )kk=(in)
0 R =U
m R
lt ξ ge ξ
(423)
ik
ikki
(L )
(L )ki=(1+1n)
0 R=L
n R
lt ξ ge ξ
(424)
Como observado na Figura 46 o algoritmo da Figura 45 permite encontrar os
elementos Ukk Ukk+1 Ukn necessaacuterios para se calcular o erro associado ao
elemento Lki e os elementos Lk+1k Lnk que por sua vez satildeo necessaacuterios para
se calcular o erro associado ao elemento Uik Nota-se que os elementos
necessaacuterios para calcular o erro (passo k) satildeo calculados neste mesmo passo
portanto natildeo eacute necessaacuterio realizar grandes buscas de elementos nas matrizes L
e U Igualmente tambeacutem natildeo eacute necessaacuterio armazenar valores Umax Lmax ou
erros do passo k porque natildeo seratildeo mais necessaacuterios nos proacuteximos passos
Observe-se que natildeo eacute necessaacuterio multiplicar o paracircmetro ξ por alguma norma ou
meacutedia aritmeacutetica dos elementos da matriz de coeficientes como realizado no
preacute-condicionador ILUT(τρ) porque o erro independe dos valores dos elementos
151
da matriz de coeficientes Este preacute-condicionador usa apenas um uacutenico
paracircmetro ξ Esta caracteriacutestica facilita o ajuste dos paracircmetros do solucionador
como seraacute visto nas proacuteximas seccedilotildees e no proacuteximo capiacutetulo
47 Meacutetodo Convencional Para Ajuste dos Paracircmetros dos Solucionadores
O ajuste dos paracircmetros de um solucionador iterativo eacute considerado fundamental
para garantir sua robustez e eficiecircncia computacional principalmente em
anaacutelises mais complexas como aquelas que solucionam vaacuterios fluxos de carga
com diferentes pontos de operaccedilatildeo Nesses casos a escolha de valores
apropriados para os paracircmetros se torna ainda mais relevante
A ideacuteia fundamental eacute escolher os valores dos paracircmetros que permitam
preencher o menor nuacutemero de elementos sem prejudicar a qualidade do preacute-
condicionador isto eacute sem tornaacute-lo muito diferente de A Poreacutem a escolha de
valores apropriados para os paracircmetros eacute uma tarefa difiacutecil jaacute que existe uma
interdependecircncia com as toleracircncias relativa e absoluta do GMRES e com o tipo
de problema que estaacute sendo solucionado
Pouco tem sido pesquisado em relaccedilatildeo a este tema apenas em (de Leon amp
Semlyen 2002) apresenta-se uma foacutermula que permite calcular para cada
sistema eleacutetrico o valor do paracircmetro limitante τ no preacute-condicionador ILU(τ)
dado por (322) onde τ eacute igual agrave metade do nuacutemero de equaccedilotildees totais Neq do
sistema linear Na praacutetica estaacute foacutermula natildeo garante robustez nem o melhor
desempenho do solucionador
eq
12 N
τ =sdot
(425)
No entanto o procedimento convencional define primeiro valores arbitraacuterios para
as duas toleracircncias absoluta e relativa do GMRES Nas simulaccedilotildees realizadas
nos capiacutetulos anteriores se usou toleracircncias iguais (10-5) e menores que a
toleracircncia usada no teste de convergecircncia do algoritmo Newton-Raphson pois
toleracircncias maiores costumam impedir a convergecircncia do Newton-Raphson
152
Uma vez definidas as toleracircncias a escolha dos paracircmetros do preacute-
condicionador eacute realizada com base em tentativa e erro
Este meacutetodo natildeo considera a possibilidade de encontrar melhores desempenhos
para outras toleracircncias do GMRES que natildeo necessariamente devem ser
consideradas iguais Durante o procedimento de tentativa e erro o meacutetodo pode
encontrar um miacutenimo nuacutemero de operaccedilotildees local (MFLOPSL) associado com τL
como ilustrado na Figura 47 que natildeo necessariamente eacute o menor possiacutevel
(MFLOPSG) Observa-se que para obter o miacutenimo nuacutemero de operaccedilotildees global
(MFLOPSG) o procedimento de tentativa e erro deveria comeccedilar com um valor
de τ proacuteximo de τG
Figura 47 ndash Procedimento de tentativa e erro para busca de valores de um paracircmetro do preacute-condicionador
Quando o preacute-condicionador possui um segundo paracircmetro o procedimento de
tentativa e erro eacute repetido para este segundo paracircmetro fixando-se o primeiro
paracircmetro
48 Meacutetodo Proposto Para Ajuste dos Paracircmetros dos Solucio nadores
O meacutetodo proposto consiste em realizar sucessivas simulaccedilotildees de fluxo de
carga variando simultaneamente todos os paracircmetros do solucionador e
registrando o nuacutemero de operaccedilotildees de ponto flutuante para cada caso gerado O
objetivo eacute encontrar regiotildees de valores para os paracircmetros onde o solucionador
153
apresente alto desempenho permitindo estabelecer e recomendar faixas para os
valores dos paracircmetros onde o solucionador garante convergecircncia com a maior
eficiecircncia possiacutevel O meacutetodo tambeacutem permite identificar as faixas de valores
onde o solucionador natildeo converge
O meacutetodo eacute ilustrado para ajustar os paracircmetros de duas configuraccedilotildees de
solucionador iterativo sendo estas o solucionador proposto neste trabalho
identificado como GMRES+ILU(ξ)+MD e o solucionador GMRES+ILUT(τρ)+MD
apresentado no capiacutetulo 2 Na Tabela 43 especificam-se os paracircmetros
associados a cada solucionador
Tabela 43 ndash Paracircmetros usados nos solucionadores
Solucionadores Meacutetodo Iterativo Preacute-condicionador
GMRES+ILU(ξ)+MD atol rtol
ξ
GMRES+ILUT(τρ)+MD τ ρ
481 Passos Fundamentais
Esta seccedilatildeo apresenta de maneira sucinta os passos envolvidos no meacutetodo para
ajuste dos paracircmetros dos solucionadores onde uma descriccedilatildeo geral eacute
mostrada na Figura 48 O primeiro passo refere-se agrave definiccedilatildeo do espaccedilo de
busca onde satildeo procurados os valores para os paracircmetros que garantem alto
desempenho do solucionador O segundo refere-se aos experimentos numeacutericos
realizados para avaliar o desempenho do solucionador considerando-se todas as
combinaccedilotildees possiacuteveis dos valores de seus paracircmetros definidos no espaccedilo de
busca O passo seguinte tem como objetivo calcular as faixas de valores
recomendaacuteveis para as toleracircncias absoluta e relativa do GMRES Finalmente o
quarto passo calcula as faixas de valores recomendaacuteveis para os paracircmetros do
preacute-condicionador
154
Figura 48 ndash Passos fundamentais para delimitaccedilatildeo dos paracircmetros do solucionador
Nas proacuteximas seccedilotildees os passos mais relevantes no contexto deste trabalho satildeo
discutidos mais detalhadamente
482 Estabelecimento do Espaccedilo de Busca
Para definir o espaccedilo de busca primeiramente deve-se estabelecer o domiacutenio de
cada paracircmetro isto eacute um valor miacutenimo e maacuteximo para cada toleracircncia do
GMRES e para cada paracircmetro do preacute-condicionador como mostrado na Tabela
44 e na Figura 49 Depois devem ser definidos valores intermediaacuterios para cada
paracircmetro sendo que o nuacutemero de valores totais eacute definido em funccedilatildeo do grau
de precisatildeo que se deseja conseguir nos paracircmetros
Finalmente o espaccedilo de busca eacute definido por todas as combinaccedilotildees possiacuteveis
entre as toleracircncias absoluta e relativa do GMRES como apresentado na Figura
49(a) e por todas as combinaccedilotildees possiacuteveis realizadas entre os paracircmetros do
preacute-condicionador como mostrado na Figura 49(b-c)
Para os valores especificados na Tabela 44 existem (m x n) combinaccedilotildees
possiacuteveis entre a toleracircncia absoluta e relativa (ver Figura 49(a)) e (q x p)
combinaccedilotildees possiacuteveis entre os paracircmetros τ e ρ do preacute-condicionador ILUT(τρ)
(ver Figura 49(c)) No caso do preacute-condicionador ILU(ξ) natildeo existem
combinaccedilotildees jaacute que este preacute-condicionador possui somente um uacutenico
paracircmetro Poreacutem existem k valores possiacuteveis para ξ (ver Figura 49(b))
Estabelecer Espaccedilo de Busca
Experimentos numeacutericos
Delimitar paracircmetros do preacute-condicionador
Delimitar toleracircncias do GMRES
155
Tabela 44 ndash Domiacutenios dos paracircmetros usados nos solucionadores
Paracircmetros Maacuteximo Miacutenimo Nuacutemero total de valores
atol atol1 atoln n
rtol rtol1 rtolm m
ξ ξ1 ξk k
τ τ1 τq q
ρ ρ1 ρp P
a) Espaccedilo de busca das toleracircncias do GMRES
b) Espaccedilo de busca dos paracircmetros do preacute-condicionador ILUT(ξ)
c) Espaccedilo de busca dos paracircmetros do preacute-
condicionador ILUT(τρ)
Figura 49 ndash Espaccedilo de busca dos paracircmetros do solucionador
483 Experimentos Numeacutericos
No segundo passo para cada combinaccedilatildeo das toleracircncias absoluta e relativa
(atolrtol) do espaccedilo de busca da Figura 49(a) satildeo simulados tantos Fluxos de
Carga quanto combinaccedilotildees dos paracircmetros do preacute-condicionador existam
registrando-se o nuacutemero de operaccedilotildees de ponto flutuante (MFLOPS) para cada
156
combinaccedilatildeo dos paracircmetros do preacute-condicionador Portanto para cada
combinaccedilatildeo (atolrtol) eacute gerado um graacutefico de eficiecircncia computacional (em
MFLOPS) em funccedilatildeo dos paracircmetros do preacute-condicionador como mostrado na
Figura 410(a) para o preacute-condicionador ILUT(τρ) e na Figura 410(b) para o
preacute-condicionador ILU(ξ)
a) Graacutefico de eficiecircncia para o preacute-condicionador ILUT(τρ)
b) Graacutefico de eficiecircncia para o preacute-condicionador ILU(ξ)
Figura 410 ndash Graacuteficos de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
Para cada graacutefico gerado eacute registrado o nuacutemero de operaccedilotildees de ponto flutuante
miacutenimo (MFLOPSmiacuten) e este valor eacute associado agrave sua correspondente combinaccedilatildeo
(atolrtol) Apoacutes terem sido realizados todos os experimentos e registrados todos
os MFLOPSmiacuten associados a todas as combinaccedilotildees (atolrtol) eacute gerado o graacutefico
de alta eficiecircncia Este graacutefico apresenta em escala de cores todos MFLOPSmiacuten
em funccedilatildeo de suas correspondentes combinaccedilotildees (atolrtol) como mostrado na
Figura 411 sendo que a cor azul estaacute associada com os menores MFLOPSmiacuten a
157
cor vermelha com os maiores MFLOPSmiacuten e em negrito os casos natildeo
convergentes
Observa-se que entre todos os valores registrados para MFLOPSmiacuten existe uma
regiatildeo que conteacutem os casos com os menores MFLOPSmiacuten Este valor chamado
de MFLOPSoacuteti eacute o nuacutemero miacutenimo de operaccedilotildees possiacutevel (global) e estaacute
associado com a regiatildeo quadrada em azul escuro segmentada pelas linhas
brancas Os pontos brancos indicam as posiccedilotildees de todas as combinaccedilotildees que
possuem nuacutemero de operaccedilotildees igual a MFLOPSoacuteti
Figura 411 ndash Graacuteficos de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
484 Delimitaccedilatildeo das Toleracircncias do GMRES
No terceiro passo a partir do graacutefico de alta eficiecircncia apresentado na sua forma
bidimensional na Figura 412 eacute segmentada a regiatildeo dos MFLOPSoacuteti Neste
caso esta regiatildeo eacute o quadrado azul do centro do graacutefico onde cada ponto
branco estaacute associado a uma combinaccedilatildeo (atolrtol) que apresenta o menor
nuacutemero de operaccedilotildees possiacutevel em todo o espaccedilo de busca (MFLOPSoacuteti) Este
graacutefico permite encontrar as faixas de valores (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do meacutetodo GMRES associadas ao melhor
desempenho possiacutevel
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
149
destacados em vermelho Observa-se que este algoritmo permite calcular
elementos de L em linhas posteriores agrave linha k Esta caracteriacutestica possibilita o
uso em U da regra de preenchimento baseada no erro
1 Para i = 1n Faccedila
2 min = Ji in
3 Para k = in Faccedila
4 Para j = 1i-1 Faccedila
5 mk = mk - LijmiddotUjk
6 Fim ndash Faccedila
7 Fim ndash Faccedila
8 Registrar Umax = maxmin
9 ni+1n = J i+1ni
10 Para k = i+1n Faccedila
11 Para j = 1i-1 Faccedila
12 nk = nk ndash LkjmiddotUji
13 Fim ndash Faccedila
14 Fim ndash Faccedila
15 n = nUii
16 Registrar Lmax = maxni+1n
17 Aplicar a regra de preenchimento baseada no erro em m e n
18 Ui in = m in
19 L i+1ni = n i+1n
20 Fim ndash Faccedila
Figura 45 ndash Algoritmo do preacute-condicionador ILU(ξ)
Figura 46 ndash Elementos necessaacuterios para calcular os elementos Lik e Uki durante a fatoraccedilatildeo triangular
150
No algoritmo da Figura 45 observa-se que no passo k os elementos da linha de
U satildeo armazenados no vetor m enquanto que os elementos da coluna de L satildeo
armazenados no vetor n (passos 5 e 12 respectivamente) Uma vez calculados
ambos os vetores procura-se o maior elemento de m sendo armazenado em
Umax e o maior elemento de n armazenado em Lmax (passos 8 e 16
respectivamente) Ambos os valores maacuteximos (em valores absolutos) satildeo
usados pela regra de preenchimento no passo 17 para descartar em m e n os
elementos associados com os menores erros e preencher a linha de U e a
coluna de L da seguinte forma
De acordo com as relaccedilotildees dadas por (423) e (424) tanto um elemento Lki
como tambeacutem um elemento Uik satildeo descartados se seus erros associados
foram menores que uma dada toleracircncia ξ usada para todas as colunas de L e
linhas de U Caso contraacuterio Lki eacute preenchido usando-se o valor armazenado
em nk e Uik eacute preenchido usando-se o valor armazenado em mk
ik
ikik
(U )
(U )kk=(in)
0 R =U
m R
lt ξ ge ξ
(423)
ik
ikki
(L )
(L )ki=(1+1n)
0 R=L
n R
lt ξ ge ξ
(424)
Como observado na Figura 46 o algoritmo da Figura 45 permite encontrar os
elementos Ukk Ukk+1 Ukn necessaacuterios para se calcular o erro associado ao
elemento Lki e os elementos Lk+1k Lnk que por sua vez satildeo necessaacuterios para
se calcular o erro associado ao elemento Uik Nota-se que os elementos
necessaacuterios para calcular o erro (passo k) satildeo calculados neste mesmo passo
portanto natildeo eacute necessaacuterio realizar grandes buscas de elementos nas matrizes L
e U Igualmente tambeacutem natildeo eacute necessaacuterio armazenar valores Umax Lmax ou
erros do passo k porque natildeo seratildeo mais necessaacuterios nos proacuteximos passos
Observe-se que natildeo eacute necessaacuterio multiplicar o paracircmetro ξ por alguma norma ou
meacutedia aritmeacutetica dos elementos da matriz de coeficientes como realizado no
preacute-condicionador ILUT(τρ) porque o erro independe dos valores dos elementos
151
da matriz de coeficientes Este preacute-condicionador usa apenas um uacutenico
paracircmetro ξ Esta caracteriacutestica facilita o ajuste dos paracircmetros do solucionador
como seraacute visto nas proacuteximas seccedilotildees e no proacuteximo capiacutetulo
47 Meacutetodo Convencional Para Ajuste dos Paracircmetros dos Solucionadores
O ajuste dos paracircmetros de um solucionador iterativo eacute considerado fundamental
para garantir sua robustez e eficiecircncia computacional principalmente em
anaacutelises mais complexas como aquelas que solucionam vaacuterios fluxos de carga
com diferentes pontos de operaccedilatildeo Nesses casos a escolha de valores
apropriados para os paracircmetros se torna ainda mais relevante
A ideacuteia fundamental eacute escolher os valores dos paracircmetros que permitam
preencher o menor nuacutemero de elementos sem prejudicar a qualidade do preacute-
condicionador isto eacute sem tornaacute-lo muito diferente de A Poreacutem a escolha de
valores apropriados para os paracircmetros eacute uma tarefa difiacutecil jaacute que existe uma
interdependecircncia com as toleracircncias relativa e absoluta do GMRES e com o tipo
de problema que estaacute sendo solucionado
Pouco tem sido pesquisado em relaccedilatildeo a este tema apenas em (de Leon amp
Semlyen 2002) apresenta-se uma foacutermula que permite calcular para cada
sistema eleacutetrico o valor do paracircmetro limitante τ no preacute-condicionador ILU(τ)
dado por (322) onde τ eacute igual agrave metade do nuacutemero de equaccedilotildees totais Neq do
sistema linear Na praacutetica estaacute foacutermula natildeo garante robustez nem o melhor
desempenho do solucionador
eq
12 N
τ =sdot
(425)
No entanto o procedimento convencional define primeiro valores arbitraacuterios para
as duas toleracircncias absoluta e relativa do GMRES Nas simulaccedilotildees realizadas
nos capiacutetulos anteriores se usou toleracircncias iguais (10-5) e menores que a
toleracircncia usada no teste de convergecircncia do algoritmo Newton-Raphson pois
toleracircncias maiores costumam impedir a convergecircncia do Newton-Raphson
152
Uma vez definidas as toleracircncias a escolha dos paracircmetros do preacute-
condicionador eacute realizada com base em tentativa e erro
Este meacutetodo natildeo considera a possibilidade de encontrar melhores desempenhos
para outras toleracircncias do GMRES que natildeo necessariamente devem ser
consideradas iguais Durante o procedimento de tentativa e erro o meacutetodo pode
encontrar um miacutenimo nuacutemero de operaccedilotildees local (MFLOPSL) associado com τL
como ilustrado na Figura 47 que natildeo necessariamente eacute o menor possiacutevel
(MFLOPSG) Observa-se que para obter o miacutenimo nuacutemero de operaccedilotildees global
(MFLOPSG) o procedimento de tentativa e erro deveria comeccedilar com um valor
de τ proacuteximo de τG
Figura 47 ndash Procedimento de tentativa e erro para busca de valores de um paracircmetro do preacute-condicionador
Quando o preacute-condicionador possui um segundo paracircmetro o procedimento de
tentativa e erro eacute repetido para este segundo paracircmetro fixando-se o primeiro
paracircmetro
48 Meacutetodo Proposto Para Ajuste dos Paracircmetros dos Solucio nadores
O meacutetodo proposto consiste em realizar sucessivas simulaccedilotildees de fluxo de
carga variando simultaneamente todos os paracircmetros do solucionador e
registrando o nuacutemero de operaccedilotildees de ponto flutuante para cada caso gerado O
objetivo eacute encontrar regiotildees de valores para os paracircmetros onde o solucionador
153
apresente alto desempenho permitindo estabelecer e recomendar faixas para os
valores dos paracircmetros onde o solucionador garante convergecircncia com a maior
eficiecircncia possiacutevel O meacutetodo tambeacutem permite identificar as faixas de valores
onde o solucionador natildeo converge
O meacutetodo eacute ilustrado para ajustar os paracircmetros de duas configuraccedilotildees de
solucionador iterativo sendo estas o solucionador proposto neste trabalho
identificado como GMRES+ILU(ξ)+MD e o solucionador GMRES+ILUT(τρ)+MD
apresentado no capiacutetulo 2 Na Tabela 43 especificam-se os paracircmetros
associados a cada solucionador
Tabela 43 ndash Paracircmetros usados nos solucionadores
Solucionadores Meacutetodo Iterativo Preacute-condicionador
GMRES+ILU(ξ)+MD atol rtol
ξ
GMRES+ILUT(τρ)+MD τ ρ
481 Passos Fundamentais
Esta seccedilatildeo apresenta de maneira sucinta os passos envolvidos no meacutetodo para
ajuste dos paracircmetros dos solucionadores onde uma descriccedilatildeo geral eacute
mostrada na Figura 48 O primeiro passo refere-se agrave definiccedilatildeo do espaccedilo de
busca onde satildeo procurados os valores para os paracircmetros que garantem alto
desempenho do solucionador O segundo refere-se aos experimentos numeacutericos
realizados para avaliar o desempenho do solucionador considerando-se todas as
combinaccedilotildees possiacuteveis dos valores de seus paracircmetros definidos no espaccedilo de
busca O passo seguinte tem como objetivo calcular as faixas de valores
recomendaacuteveis para as toleracircncias absoluta e relativa do GMRES Finalmente o
quarto passo calcula as faixas de valores recomendaacuteveis para os paracircmetros do
preacute-condicionador
154
Figura 48 ndash Passos fundamentais para delimitaccedilatildeo dos paracircmetros do solucionador
Nas proacuteximas seccedilotildees os passos mais relevantes no contexto deste trabalho satildeo
discutidos mais detalhadamente
482 Estabelecimento do Espaccedilo de Busca
Para definir o espaccedilo de busca primeiramente deve-se estabelecer o domiacutenio de
cada paracircmetro isto eacute um valor miacutenimo e maacuteximo para cada toleracircncia do
GMRES e para cada paracircmetro do preacute-condicionador como mostrado na Tabela
44 e na Figura 49 Depois devem ser definidos valores intermediaacuterios para cada
paracircmetro sendo que o nuacutemero de valores totais eacute definido em funccedilatildeo do grau
de precisatildeo que se deseja conseguir nos paracircmetros
Finalmente o espaccedilo de busca eacute definido por todas as combinaccedilotildees possiacuteveis
entre as toleracircncias absoluta e relativa do GMRES como apresentado na Figura
49(a) e por todas as combinaccedilotildees possiacuteveis realizadas entre os paracircmetros do
preacute-condicionador como mostrado na Figura 49(b-c)
Para os valores especificados na Tabela 44 existem (m x n) combinaccedilotildees
possiacuteveis entre a toleracircncia absoluta e relativa (ver Figura 49(a)) e (q x p)
combinaccedilotildees possiacuteveis entre os paracircmetros τ e ρ do preacute-condicionador ILUT(τρ)
(ver Figura 49(c)) No caso do preacute-condicionador ILU(ξ) natildeo existem
combinaccedilotildees jaacute que este preacute-condicionador possui somente um uacutenico
paracircmetro Poreacutem existem k valores possiacuteveis para ξ (ver Figura 49(b))
Estabelecer Espaccedilo de Busca
Experimentos numeacutericos
Delimitar paracircmetros do preacute-condicionador
Delimitar toleracircncias do GMRES
155
Tabela 44 ndash Domiacutenios dos paracircmetros usados nos solucionadores
Paracircmetros Maacuteximo Miacutenimo Nuacutemero total de valores
atol atol1 atoln n
rtol rtol1 rtolm m
ξ ξ1 ξk k
τ τ1 τq q
ρ ρ1 ρp P
a) Espaccedilo de busca das toleracircncias do GMRES
b) Espaccedilo de busca dos paracircmetros do preacute-condicionador ILUT(ξ)
c) Espaccedilo de busca dos paracircmetros do preacute-
condicionador ILUT(τρ)
Figura 49 ndash Espaccedilo de busca dos paracircmetros do solucionador
483 Experimentos Numeacutericos
No segundo passo para cada combinaccedilatildeo das toleracircncias absoluta e relativa
(atolrtol) do espaccedilo de busca da Figura 49(a) satildeo simulados tantos Fluxos de
Carga quanto combinaccedilotildees dos paracircmetros do preacute-condicionador existam
registrando-se o nuacutemero de operaccedilotildees de ponto flutuante (MFLOPS) para cada
156
combinaccedilatildeo dos paracircmetros do preacute-condicionador Portanto para cada
combinaccedilatildeo (atolrtol) eacute gerado um graacutefico de eficiecircncia computacional (em
MFLOPS) em funccedilatildeo dos paracircmetros do preacute-condicionador como mostrado na
Figura 410(a) para o preacute-condicionador ILUT(τρ) e na Figura 410(b) para o
preacute-condicionador ILU(ξ)
a) Graacutefico de eficiecircncia para o preacute-condicionador ILUT(τρ)
b) Graacutefico de eficiecircncia para o preacute-condicionador ILU(ξ)
Figura 410 ndash Graacuteficos de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
Para cada graacutefico gerado eacute registrado o nuacutemero de operaccedilotildees de ponto flutuante
miacutenimo (MFLOPSmiacuten) e este valor eacute associado agrave sua correspondente combinaccedilatildeo
(atolrtol) Apoacutes terem sido realizados todos os experimentos e registrados todos
os MFLOPSmiacuten associados a todas as combinaccedilotildees (atolrtol) eacute gerado o graacutefico
de alta eficiecircncia Este graacutefico apresenta em escala de cores todos MFLOPSmiacuten
em funccedilatildeo de suas correspondentes combinaccedilotildees (atolrtol) como mostrado na
Figura 411 sendo que a cor azul estaacute associada com os menores MFLOPSmiacuten a
157
cor vermelha com os maiores MFLOPSmiacuten e em negrito os casos natildeo
convergentes
Observa-se que entre todos os valores registrados para MFLOPSmiacuten existe uma
regiatildeo que conteacutem os casos com os menores MFLOPSmiacuten Este valor chamado
de MFLOPSoacuteti eacute o nuacutemero miacutenimo de operaccedilotildees possiacutevel (global) e estaacute
associado com a regiatildeo quadrada em azul escuro segmentada pelas linhas
brancas Os pontos brancos indicam as posiccedilotildees de todas as combinaccedilotildees que
possuem nuacutemero de operaccedilotildees igual a MFLOPSoacuteti
Figura 411 ndash Graacuteficos de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
484 Delimitaccedilatildeo das Toleracircncias do GMRES
No terceiro passo a partir do graacutefico de alta eficiecircncia apresentado na sua forma
bidimensional na Figura 412 eacute segmentada a regiatildeo dos MFLOPSoacuteti Neste
caso esta regiatildeo eacute o quadrado azul do centro do graacutefico onde cada ponto
branco estaacute associado a uma combinaccedilatildeo (atolrtol) que apresenta o menor
nuacutemero de operaccedilotildees possiacutevel em todo o espaccedilo de busca (MFLOPSoacuteti) Este
graacutefico permite encontrar as faixas de valores (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do meacutetodo GMRES associadas ao melhor
desempenho possiacutevel
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
150
No algoritmo da Figura 45 observa-se que no passo k os elementos da linha de
U satildeo armazenados no vetor m enquanto que os elementos da coluna de L satildeo
armazenados no vetor n (passos 5 e 12 respectivamente) Uma vez calculados
ambos os vetores procura-se o maior elemento de m sendo armazenado em
Umax e o maior elemento de n armazenado em Lmax (passos 8 e 16
respectivamente) Ambos os valores maacuteximos (em valores absolutos) satildeo
usados pela regra de preenchimento no passo 17 para descartar em m e n os
elementos associados com os menores erros e preencher a linha de U e a
coluna de L da seguinte forma
De acordo com as relaccedilotildees dadas por (423) e (424) tanto um elemento Lki
como tambeacutem um elemento Uik satildeo descartados se seus erros associados
foram menores que uma dada toleracircncia ξ usada para todas as colunas de L e
linhas de U Caso contraacuterio Lki eacute preenchido usando-se o valor armazenado
em nk e Uik eacute preenchido usando-se o valor armazenado em mk
ik
ikik
(U )
(U )kk=(in)
0 R =U
m R
lt ξ ge ξ
(423)
ik
ikki
(L )
(L )ki=(1+1n)
0 R=L
n R
lt ξ ge ξ
(424)
Como observado na Figura 46 o algoritmo da Figura 45 permite encontrar os
elementos Ukk Ukk+1 Ukn necessaacuterios para se calcular o erro associado ao
elemento Lki e os elementos Lk+1k Lnk que por sua vez satildeo necessaacuterios para
se calcular o erro associado ao elemento Uik Nota-se que os elementos
necessaacuterios para calcular o erro (passo k) satildeo calculados neste mesmo passo
portanto natildeo eacute necessaacuterio realizar grandes buscas de elementos nas matrizes L
e U Igualmente tambeacutem natildeo eacute necessaacuterio armazenar valores Umax Lmax ou
erros do passo k porque natildeo seratildeo mais necessaacuterios nos proacuteximos passos
Observe-se que natildeo eacute necessaacuterio multiplicar o paracircmetro ξ por alguma norma ou
meacutedia aritmeacutetica dos elementos da matriz de coeficientes como realizado no
preacute-condicionador ILUT(τρ) porque o erro independe dos valores dos elementos
151
da matriz de coeficientes Este preacute-condicionador usa apenas um uacutenico
paracircmetro ξ Esta caracteriacutestica facilita o ajuste dos paracircmetros do solucionador
como seraacute visto nas proacuteximas seccedilotildees e no proacuteximo capiacutetulo
47 Meacutetodo Convencional Para Ajuste dos Paracircmetros dos Solucionadores
O ajuste dos paracircmetros de um solucionador iterativo eacute considerado fundamental
para garantir sua robustez e eficiecircncia computacional principalmente em
anaacutelises mais complexas como aquelas que solucionam vaacuterios fluxos de carga
com diferentes pontos de operaccedilatildeo Nesses casos a escolha de valores
apropriados para os paracircmetros se torna ainda mais relevante
A ideacuteia fundamental eacute escolher os valores dos paracircmetros que permitam
preencher o menor nuacutemero de elementos sem prejudicar a qualidade do preacute-
condicionador isto eacute sem tornaacute-lo muito diferente de A Poreacutem a escolha de
valores apropriados para os paracircmetros eacute uma tarefa difiacutecil jaacute que existe uma
interdependecircncia com as toleracircncias relativa e absoluta do GMRES e com o tipo
de problema que estaacute sendo solucionado
Pouco tem sido pesquisado em relaccedilatildeo a este tema apenas em (de Leon amp
Semlyen 2002) apresenta-se uma foacutermula que permite calcular para cada
sistema eleacutetrico o valor do paracircmetro limitante τ no preacute-condicionador ILU(τ)
dado por (322) onde τ eacute igual agrave metade do nuacutemero de equaccedilotildees totais Neq do
sistema linear Na praacutetica estaacute foacutermula natildeo garante robustez nem o melhor
desempenho do solucionador
eq
12 N
τ =sdot
(425)
No entanto o procedimento convencional define primeiro valores arbitraacuterios para
as duas toleracircncias absoluta e relativa do GMRES Nas simulaccedilotildees realizadas
nos capiacutetulos anteriores se usou toleracircncias iguais (10-5) e menores que a
toleracircncia usada no teste de convergecircncia do algoritmo Newton-Raphson pois
toleracircncias maiores costumam impedir a convergecircncia do Newton-Raphson
152
Uma vez definidas as toleracircncias a escolha dos paracircmetros do preacute-
condicionador eacute realizada com base em tentativa e erro
Este meacutetodo natildeo considera a possibilidade de encontrar melhores desempenhos
para outras toleracircncias do GMRES que natildeo necessariamente devem ser
consideradas iguais Durante o procedimento de tentativa e erro o meacutetodo pode
encontrar um miacutenimo nuacutemero de operaccedilotildees local (MFLOPSL) associado com τL
como ilustrado na Figura 47 que natildeo necessariamente eacute o menor possiacutevel
(MFLOPSG) Observa-se que para obter o miacutenimo nuacutemero de operaccedilotildees global
(MFLOPSG) o procedimento de tentativa e erro deveria comeccedilar com um valor
de τ proacuteximo de τG
Figura 47 ndash Procedimento de tentativa e erro para busca de valores de um paracircmetro do preacute-condicionador
Quando o preacute-condicionador possui um segundo paracircmetro o procedimento de
tentativa e erro eacute repetido para este segundo paracircmetro fixando-se o primeiro
paracircmetro
48 Meacutetodo Proposto Para Ajuste dos Paracircmetros dos Solucio nadores
O meacutetodo proposto consiste em realizar sucessivas simulaccedilotildees de fluxo de
carga variando simultaneamente todos os paracircmetros do solucionador e
registrando o nuacutemero de operaccedilotildees de ponto flutuante para cada caso gerado O
objetivo eacute encontrar regiotildees de valores para os paracircmetros onde o solucionador
153
apresente alto desempenho permitindo estabelecer e recomendar faixas para os
valores dos paracircmetros onde o solucionador garante convergecircncia com a maior
eficiecircncia possiacutevel O meacutetodo tambeacutem permite identificar as faixas de valores
onde o solucionador natildeo converge
O meacutetodo eacute ilustrado para ajustar os paracircmetros de duas configuraccedilotildees de
solucionador iterativo sendo estas o solucionador proposto neste trabalho
identificado como GMRES+ILU(ξ)+MD e o solucionador GMRES+ILUT(τρ)+MD
apresentado no capiacutetulo 2 Na Tabela 43 especificam-se os paracircmetros
associados a cada solucionador
Tabela 43 ndash Paracircmetros usados nos solucionadores
Solucionadores Meacutetodo Iterativo Preacute-condicionador
GMRES+ILU(ξ)+MD atol rtol
ξ
GMRES+ILUT(τρ)+MD τ ρ
481 Passos Fundamentais
Esta seccedilatildeo apresenta de maneira sucinta os passos envolvidos no meacutetodo para
ajuste dos paracircmetros dos solucionadores onde uma descriccedilatildeo geral eacute
mostrada na Figura 48 O primeiro passo refere-se agrave definiccedilatildeo do espaccedilo de
busca onde satildeo procurados os valores para os paracircmetros que garantem alto
desempenho do solucionador O segundo refere-se aos experimentos numeacutericos
realizados para avaliar o desempenho do solucionador considerando-se todas as
combinaccedilotildees possiacuteveis dos valores de seus paracircmetros definidos no espaccedilo de
busca O passo seguinte tem como objetivo calcular as faixas de valores
recomendaacuteveis para as toleracircncias absoluta e relativa do GMRES Finalmente o
quarto passo calcula as faixas de valores recomendaacuteveis para os paracircmetros do
preacute-condicionador
154
Figura 48 ndash Passos fundamentais para delimitaccedilatildeo dos paracircmetros do solucionador
Nas proacuteximas seccedilotildees os passos mais relevantes no contexto deste trabalho satildeo
discutidos mais detalhadamente
482 Estabelecimento do Espaccedilo de Busca
Para definir o espaccedilo de busca primeiramente deve-se estabelecer o domiacutenio de
cada paracircmetro isto eacute um valor miacutenimo e maacuteximo para cada toleracircncia do
GMRES e para cada paracircmetro do preacute-condicionador como mostrado na Tabela
44 e na Figura 49 Depois devem ser definidos valores intermediaacuterios para cada
paracircmetro sendo que o nuacutemero de valores totais eacute definido em funccedilatildeo do grau
de precisatildeo que se deseja conseguir nos paracircmetros
Finalmente o espaccedilo de busca eacute definido por todas as combinaccedilotildees possiacuteveis
entre as toleracircncias absoluta e relativa do GMRES como apresentado na Figura
49(a) e por todas as combinaccedilotildees possiacuteveis realizadas entre os paracircmetros do
preacute-condicionador como mostrado na Figura 49(b-c)
Para os valores especificados na Tabela 44 existem (m x n) combinaccedilotildees
possiacuteveis entre a toleracircncia absoluta e relativa (ver Figura 49(a)) e (q x p)
combinaccedilotildees possiacuteveis entre os paracircmetros τ e ρ do preacute-condicionador ILUT(τρ)
(ver Figura 49(c)) No caso do preacute-condicionador ILU(ξ) natildeo existem
combinaccedilotildees jaacute que este preacute-condicionador possui somente um uacutenico
paracircmetro Poreacutem existem k valores possiacuteveis para ξ (ver Figura 49(b))
Estabelecer Espaccedilo de Busca
Experimentos numeacutericos
Delimitar paracircmetros do preacute-condicionador
Delimitar toleracircncias do GMRES
155
Tabela 44 ndash Domiacutenios dos paracircmetros usados nos solucionadores
Paracircmetros Maacuteximo Miacutenimo Nuacutemero total de valores
atol atol1 atoln n
rtol rtol1 rtolm m
ξ ξ1 ξk k
τ τ1 τq q
ρ ρ1 ρp P
a) Espaccedilo de busca das toleracircncias do GMRES
b) Espaccedilo de busca dos paracircmetros do preacute-condicionador ILUT(ξ)
c) Espaccedilo de busca dos paracircmetros do preacute-
condicionador ILUT(τρ)
Figura 49 ndash Espaccedilo de busca dos paracircmetros do solucionador
483 Experimentos Numeacutericos
No segundo passo para cada combinaccedilatildeo das toleracircncias absoluta e relativa
(atolrtol) do espaccedilo de busca da Figura 49(a) satildeo simulados tantos Fluxos de
Carga quanto combinaccedilotildees dos paracircmetros do preacute-condicionador existam
registrando-se o nuacutemero de operaccedilotildees de ponto flutuante (MFLOPS) para cada
156
combinaccedilatildeo dos paracircmetros do preacute-condicionador Portanto para cada
combinaccedilatildeo (atolrtol) eacute gerado um graacutefico de eficiecircncia computacional (em
MFLOPS) em funccedilatildeo dos paracircmetros do preacute-condicionador como mostrado na
Figura 410(a) para o preacute-condicionador ILUT(τρ) e na Figura 410(b) para o
preacute-condicionador ILU(ξ)
a) Graacutefico de eficiecircncia para o preacute-condicionador ILUT(τρ)
b) Graacutefico de eficiecircncia para o preacute-condicionador ILU(ξ)
Figura 410 ndash Graacuteficos de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
Para cada graacutefico gerado eacute registrado o nuacutemero de operaccedilotildees de ponto flutuante
miacutenimo (MFLOPSmiacuten) e este valor eacute associado agrave sua correspondente combinaccedilatildeo
(atolrtol) Apoacutes terem sido realizados todos os experimentos e registrados todos
os MFLOPSmiacuten associados a todas as combinaccedilotildees (atolrtol) eacute gerado o graacutefico
de alta eficiecircncia Este graacutefico apresenta em escala de cores todos MFLOPSmiacuten
em funccedilatildeo de suas correspondentes combinaccedilotildees (atolrtol) como mostrado na
Figura 411 sendo que a cor azul estaacute associada com os menores MFLOPSmiacuten a
157
cor vermelha com os maiores MFLOPSmiacuten e em negrito os casos natildeo
convergentes
Observa-se que entre todos os valores registrados para MFLOPSmiacuten existe uma
regiatildeo que conteacutem os casos com os menores MFLOPSmiacuten Este valor chamado
de MFLOPSoacuteti eacute o nuacutemero miacutenimo de operaccedilotildees possiacutevel (global) e estaacute
associado com a regiatildeo quadrada em azul escuro segmentada pelas linhas
brancas Os pontos brancos indicam as posiccedilotildees de todas as combinaccedilotildees que
possuem nuacutemero de operaccedilotildees igual a MFLOPSoacuteti
Figura 411 ndash Graacuteficos de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
484 Delimitaccedilatildeo das Toleracircncias do GMRES
No terceiro passo a partir do graacutefico de alta eficiecircncia apresentado na sua forma
bidimensional na Figura 412 eacute segmentada a regiatildeo dos MFLOPSoacuteti Neste
caso esta regiatildeo eacute o quadrado azul do centro do graacutefico onde cada ponto
branco estaacute associado a uma combinaccedilatildeo (atolrtol) que apresenta o menor
nuacutemero de operaccedilotildees possiacutevel em todo o espaccedilo de busca (MFLOPSoacuteti) Este
graacutefico permite encontrar as faixas de valores (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do meacutetodo GMRES associadas ao melhor
desempenho possiacutevel
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
151
da matriz de coeficientes Este preacute-condicionador usa apenas um uacutenico
paracircmetro ξ Esta caracteriacutestica facilita o ajuste dos paracircmetros do solucionador
como seraacute visto nas proacuteximas seccedilotildees e no proacuteximo capiacutetulo
47 Meacutetodo Convencional Para Ajuste dos Paracircmetros dos Solucionadores
O ajuste dos paracircmetros de um solucionador iterativo eacute considerado fundamental
para garantir sua robustez e eficiecircncia computacional principalmente em
anaacutelises mais complexas como aquelas que solucionam vaacuterios fluxos de carga
com diferentes pontos de operaccedilatildeo Nesses casos a escolha de valores
apropriados para os paracircmetros se torna ainda mais relevante
A ideacuteia fundamental eacute escolher os valores dos paracircmetros que permitam
preencher o menor nuacutemero de elementos sem prejudicar a qualidade do preacute-
condicionador isto eacute sem tornaacute-lo muito diferente de A Poreacutem a escolha de
valores apropriados para os paracircmetros eacute uma tarefa difiacutecil jaacute que existe uma
interdependecircncia com as toleracircncias relativa e absoluta do GMRES e com o tipo
de problema que estaacute sendo solucionado
Pouco tem sido pesquisado em relaccedilatildeo a este tema apenas em (de Leon amp
Semlyen 2002) apresenta-se uma foacutermula que permite calcular para cada
sistema eleacutetrico o valor do paracircmetro limitante τ no preacute-condicionador ILU(τ)
dado por (322) onde τ eacute igual agrave metade do nuacutemero de equaccedilotildees totais Neq do
sistema linear Na praacutetica estaacute foacutermula natildeo garante robustez nem o melhor
desempenho do solucionador
eq
12 N
τ =sdot
(425)
No entanto o procedimento convencional define primeiro valores arbitraacuterios para
as duas toleracircncias absoluta e relativa do GMRES Nas simulaccedilotildees realizadas
nos capiacutetulos anteriores se usou toleracircncias iguais (10-5) e menores que a
toleracircncia usada no teste de convergecircncia do algoritmo Newton-Raphson pois
toleracircncias maiores costumam impedir a convergecircncia do Newton-Raphson
152
Uma vez definidas as toleracircncias a escolha dos paracircmetros do preacute-
condicionador eacute realizada com base em tentativa e erro
Este meacutetodo natildeo considera a possibilidade de encontrar melhores desempenhos
para outras toleracircncias do GMRES que natildeo necessariamente devem ser
consideradas iguais Durante o procedimento de tentativa e erro o meacutetodo pode
encontrar um miacutenimo nuacutemero de operaccedilotildees local (MFLOPSL) associado com τL
como ilustrado na Figura 47 que natildeo necessariamente eacute o menor possiacutevel
(MFLOPSG) Observa-se que para obter o miacutenimo nuacutemero de operaccedilotildees global
(MFLOPSG) o procedimento de tentativa e erro deveria comeccedilar com um valor
de τ proacuteximo de τG
Figura 47 ndash Procedimento de tentativa e erro para busca de valores de um paracircmetro do preacute-condicionador
Quando o preacute-condicionador possui um segundo paracircmetro o procedimento de
tentativa e erro eacute repetido para este segundo paracircmetro fixando-se o primeiro
paracircmetro
48 Meacutetodo Proposto Para Ajuste dos Paracircmetros dos Solucio nadores
O meacutetodo proposto consiste em realizar sucessivas simulaccedilotildees de fluxo de
carga variando simultaneamente todos os paracircmetros do solucionador e
registrando o nuacutemero de operaccedilotildees de ponto flutuante para cada caso gerado O
objetivo eacute encontrar regiotildees de valores para os paracircmetros onde o solucionador
153
apresente alto desempenho permitindo estabelecer e recomendar faixas para os
valores dos paracircmetros onde o solucionador garante convergecircncia com a maior
eficiecircncia possiacutevel O meacutetodo tambeacutem permite identificar as faixas de valores
onde o solucionador natildeo converge
O meacutetodo eacute ilustrado para ajustar os paracircmetros de duas configuraccedilotildees de
solucionador iterativo sendo estas o solucionador proposto neste trabalho
identificado como GMRES+ILU(ξ)+MD e o solucionador GMRES+ILUT(τρ)+MD
apresentado no capiacutetulo 2 Na Tabela 43 especificam-se os paracircmetros
associados a cada solucionador
Tabela 43 ndash Paracircmetros usados nos solucionadores
Solucionadores Meacutetodo Iterativo Preacute-condicionador
GMRES+ILU(ξ)+MD atol rtol
ξ
GMRES+ILUT(τρ)+MD τ ρ
481 Passos Fundamentais
Esta seccedilatildeo apresenta de maneira sucinta os passos envolvidos no meacutetodo para
ajuste dos paracircmetros dos solucionadores onde uma descriccedilatildeo geral eacute
mostrada na Figura 48 O primeiro passo refere-se agrave definiccedilatildeo do espaccedilo de
busca onde satildeo procurados os valores para os paracircmetros que garantem alto
desempenho do solucionador O segundo refere-se aos experimentos numeacutericos
realizados para avaliar o desempenho do solucionador considerando-se todas as
combinaccedilotildees possiacuteveis dos valores de seus paracircmetros definidos no espaccedilo de
busca O passo seguinte tem como objetivo calcular as faixas de valores
recomendaacuteveis para as toleracircncias absoluta e relativa do GMRES Finalmente o
quarto passo calcula as faixas de valores recomendaacuteveis para os paracircmetros do
preacute-condicionador
154
Figura 48 ndash Passos fundamentais para delimitaccedilatildeo dos paracircmetros do solucionador
Nas proacuteximas seccedilotildees os passos mais relevantes no contexto deste trabalho satildeo
discutidos mais detalhadamente
482 Estabelecimento do Espaccedilo de Busca
Para definir o espaccedilo de busca primeiramente deve-se estabelecer o domiacutenio de
cada paracircmetro isto eacute um valor miacutenimo e maacuteximo para cada toleracircncia do
GMRES e para cada paracircmetro do preacute-condicionador como mostrado na Tabela
44 e na Figura 49 Depois devem ser definidos valores intermediaacuterios para cada
paracircmetro sendo que o nuacutemero de valores totais eacute definido em funccedilatildeo do grau
de precisatildeo que se deseja conseguir nos paracircmetros
Finalmente o espaccedilo de busca eacute definido por todas as combinaccedilotildees possiacuteveis
entre as toleracircncias absoluta e relativa do GMRES como apresentado na Figura
49(a) e por todas as combinaccedilotildees possiacuteveis realizadas entre os paracircmetros do
preacute-condicionador como mostrado na Figura 49(b-c)
Para os valores especificados na Tabela 44 existem (m x n) combinaccedilotildees
possiacuteveis entre a toleracircncia absoluta e relativa (ver Figura 49(a)) e (q x p)
combinaccedilotildees possiacuteveis entre os paracircmetros τ e ρ do preacute-condicionador ILUT(τρ)
(ver Figura 49(c)) No caso do preacute-condicionador ILU(ξ) natildeo existem
combinaccedilotildees jaacute que este preacute-condicionador possui somente um uacutenico
paracircmetro Poreacutem existem k valores possiacuteveis para ξ (ver Figura 49(b))
Estabelecer Espaccedilo de Busca
Experimentos numeacutericos
Delimitar paracircmetros do preacute-condicionador
Delimitar toleracircncias do GMRES
155
Tabela 44 ndash Domiacutenios dos paracircmetros usados nos solucionadores
Paracircmetros Maacuteximo Miacutenimo Nuacutemero total de valores
atol atol1 atoln n
rtol rtol1 rtolm m
ξ ξ1 ξk k
τ τ1 τq q
ρ ρ1 ρp P
a) Espaccedilo de busca das toleracircncias do GMRES
b) Espaccedilo de busca dos paracircmetros do preacute-condicionador ILUT(ξ)
c) Espaccedilo de busca dos paracircmetros do preacute-
condicionador ILUT(τρ)
Figura 49 ndash Espaccedilo de busca dos paracircmetros do solucionador
483 Experimentos Numeacutericos
No segundo passo para cada combinaccedilatildeo das toleracircncias absoluta e relativa
(atolrtol) do espaccedilo de busca da Figura 49(a) satildeo simulados tantos Fluxos de
Carga quanto combinaccedilotildees dos paracircmetros do preacute-condicionador existam
registrando-se o nuacutemero de operaccedilotildees de ponto flutuante (MFLOPS) para cada
156
combinaccedilatildeo dos paracircmetros do preacute-condicionador Portanto para cada
combinaccedilatildeo (atolrtol) eacute gerado um graacutefico de eficiecircncia computacional (em
MFLOPS) em funccedilatildeo dos paracircmetros do preacute-condicionador como mostrado na
Figura 410(a) para o preacute-condicionador ILUT(τρ) e na Figura 410(b) para o
preacute-condicionador ILU(ξ)
a) Graacutefico de eficiecircncia para o preacute-condicionador ILUT(τρ)
b) Graacutefico de eficiecircncia para o preacute-condicionador ILU(ξ)
Figura 410 ndash Graacuteficos de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
Para cada graacutefico gerado eacute registrado o nuacutemero de operaccedilotildees de ponto flutuante
miacutenimo (MFLOPSmiacuten) e este valor eacute associado agrave sua correspondente combinaccedilatildeo
(atolrtol) Apoacutes terem sido realizados todos os experimentos e registrados todos
os MFLOPSmiacuten associados a todas as combinaccedilotildees (atolrtol) eacute gerado o graacutefico
de alta eficiecircncia Este graacutefico apresenta em escala de cores todos MFLOPSmiacuten
em funccedilatildeo de suas correspondentes combinaccedilotildees (atolrtol) como mostrado na
Figura 411 sendo que a cor azul estaacute associada com os menores MFLOPSmiacuten a
157
cor vermelha com os maiores MFLOPSmiacuten e em negrito os casos natildeo
convergentes
Observa-se que entre todos os valores registrados para MFLOPSmiacuten existe uma
regiatildeo que conteacutem os casos com os menores MFLOPSmiacuten Este valor chamado
de MFLOPSoacuteti eacute o nuacutemero miacutenimo de operaccedilotildees possiacutevel (global) e estaacute
associado com a regiatildeo quadrada em azul escuro segmentada pelas linhas
brancas Os pontos brancos indicam as posiccedilotildees de todas as combinaccedilotildees que
possuem nuacutemero de operaccedilotildees igual a MFLOPSoacuteti
Figura 411 ndash Graacuteficos de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
484 Delimitaccedilatildeo das Toleracircncias do GMRES
No terceiro passo a partir do graacutefico de alta eficiecircncia apresentado na sua forma
bidimensional na Figura 412 eacute segmentada a regiatildeo dos MFLOPSoacuteti Neste
caso esta regiatildeo eacute o quadrado azul do centro do graacutefico onde cada ponto
branco estaacute associado a uma combinaccedilatildeo (atolrtol) que apresenta o menor
nuacutemero de operaccedilotildees possiacutevel em todo o espaccedilo de busca (MFLOPSoacuteti) Este
graacutefico permite encontrar as faixas de valores (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do meacutetodo GMRES associadas ao melhor
desempenho possiacutevel
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
152
Uma vez definidas as toleracircncias a escolha dos paracircmetros do preacute-
condicionador eacute realizada com base em tentativa e erro
Este meacutetodo natildeo considera a possibilidade de encontrar melhores desempenhos
para outras toleracircncias do GMRES que natildeo necessariamente devem ser
consideradas iguais Durante o procedimento de tentativa e erro o meacutetodo pode
encontrar um miacutenimo nuacutemero de operaccedilotildees local (MFLOPSL) associado com τL
como ilustrado na Figura 47 que natildeo necessariamente eacute o menor possiacutevel
(MFLOPSG) Observa-se que para obter o miacutenimo nuacutemero de operaccedilotildees global
(MFLOPSG) o procedimento de tentativa e erro deveria comeccedilar com um valor
de τ proacuteximo de τG
Figura 47 ndash Procedimento de tentativa e erro para busca de valores de um paracircmetro do preacute-condicionador
Quando o preacute-condicionador possui um segundo paracircmetro o procedimento de
tentativa e erro eacute repetido para este segundo paracircmetro fixando-se o primeiro
paracircmetro
48 Meacutetodo Proposto Para Ajuste dos Paracircmetros dos Solucio nadores
O meacutetodo proposto consiste em realizar sucessivas simulaccedilotildees de fluxo de
carga variando simultaneamente todos os paracircmetros do solucionador e
registrando o nuacutemero de operaccedilotildees de ponto flutuante para cada caso gerado O
objetivo eacute encontrar regiotildees de valores para os paracircmetros onde o solucionador
153
apresente alto desempenho permitindo estabelecer e recomendar faixas para os
valores dos paracircmetros onde o solucionador garante convergecircncia com a maior
eficiecircncia possiacutevel O meacutetodo tambeacutem permite identificar as faixas de valores
onde o solucionador natildeo converge
O meacutetodo eacute ilustrado para ajustar os paracircmetros de duas configuraccedilotildees de
solucionador iterativo sendo estas o solucionador proposto neste trabalho
identificado como GMRES+ILU(ξ)+MD e o solucionador GMRES+ILUT(τρ)+MD
apresentado no capiacutetulo 2 Na Tabela 43 especificam-se os paracircmetros
associados a cada solucionador
Tabela 43 ndash Paracircmetros usados nos solucionadores
Solucionadores Meacutetodo Iterativo Preacute-condicionador
GMRES+ILU(ξ)+MD atol rtol
ξ
GMRES+ILUT(τρ)+MD τ ρ
481 Passos Fundamentais
Esta seccedilatildeo apresenta de maneira sucinta os passos envolvidos no meacutetodo para
ajuste dos paracircmetros dos solucionadores onde uma descriccedilatildeo geral eacute
mostrada na Figura 48 O primeiro passo refere-se agrave definiccedilatildeo do espaccedilo de
busca onde satildeo procurados os valores para os paracircmetros que garantem alto
desempenho do solucionador O segundo refere-se aos experimentos numeacutericos
realizados para avaliar o desempenho do solucionador considerando-se todas as
combinaccedilotildees possiacuteveis dos valores de seus paracircmetros definidos no espaccedilo de
busca O passo seguinte tem como objetivo calcular as faixas de valores
recomendaacuteveis para as toleracircncias absoluta e relativa do GMRES Finalmente o
quarto passo calcula as faixas de valores recomendaacuteveis para os paracircmetros do
preacute-condicionador
154
Figura 48 ndash Passos fundamentais para delimitaccedilatildeo dos paracircmetros do solucionador
Nas proacuteximas seccedilotildees os passos mais relevantes no contexto deste trabalho satildeo
discutidos mais detalhadamente
482 Estabelecimento do Espaccedilo de Busca
Para definir o espaccedilo de busca primeiramente deve-se estabelecer o domiacutenio de
cada paracircmetro isto eacute um valor miacutenimo e maacuteximo para cada toleracircncia do
GMRES e para cada paracircmetro do preacute-condicionador como mostrado na Tabela
44 e na Figura 49 Depois devem ser definidos valores intermediaacuterios para cada
paracircmetro sendo que o nuacutemero de valores totais eacute definido em funccedilatildeo do grau
de precisatildeo que se deseja conseguir nos paracircmetros
Finalmente o espaccedilo de busca eacute definido por todas as combinaccedilotildees possiacuteveis
entre as toleracircncias absoluta e relativa do GMRES como apresentado na Figura
49(a) e por todas as combinaccedilotildees possiacuteveis realizadas entre os paracircmetros do
preacute-condicionador como mostrado na Figura 49(b-c)
Para os valores especificados na Tabela 44 existem (m x n) combinaccedilotildees
possiacuteveis entre a toleracircncia absoluta e relativa (ver Figura 49(a)) e (q x p)
combinaccedilotildees possiacuteveis entre os paracircmetros τ e ρ do preacute-condicionador ILUT(τρ)
(ver Figura 49(c)) No caso do preacute-condicionador ILU(ξ) natildeo existem
combinaccedilotildees jaacute que este preacute-condicionador possui somente um uacutenico
paracircmetro Poreacutem existem k valores possiacuteveis para ξ (ver Figura 49(b))
Estabelecer Espaccedilo de Busca
Experimentos numeacutericos
Delimitar paracircmetros do preacute-condicionador
Delimitar toleracircncias do GMRES
155
Tabela 44 ndash Domiacutenios dos paracircmetros usados nos solucionadores
Paracircmetros Maacuteximo Miacutenimo Nuacutemero total de valores
atol atol1 atoln n
rtol rtol1 rtolm m
ξ ξ1 ξk k
τ τ1 τq q
ρ ρ1 ρp P
a) Espaccedilo de busca das toleracircncias do GMRES
b) Espaccedilo de busca dos paracircmetros do preacute-condicionador ILUT(ξ)
c) Espaccedilo de busca dos paracircmetros do preacute-
condicionador ILUT(τρ)
Figura 49 ndash Espaccedilo de busca dos paracircmetros do solucionador
483 Experimentos Numeacutericos
No segundo passo para cada combinaccedilatildeo das toleracircncias absoluta e relativa
(atolrtol) do espaccedilo de busca da Figura 49(a) satildeo simulados tantos Fluxos de
Carga quanto combinaccedilotildees dos paracircmetros do preacute-condicionador existam
registrando-se o nuacutemero de operaccedilotildees de ponto flutuante (MFLOPS) para cada
156
combinaccedilatildeo dos paracircmetros do preacute-condicionador Portanto para cada
combinaccedilatildeo (atolrtol) eacute gerado um graacutefico de eficiecircncia computacional (em
MFLOPS) em funccedilatildeo dos paracircmetros do preacute-condicionador como mostrado na
Figura 410(a) para o preacute-condicionador ILUT(τρ) e na Figura 410(b) para o
preacute-condicionador ILU(ξ)
a) Graacutefico de eficiecircncia para o preacute-condicionador ILUT(τρ)
b) Graacutefico de eficiecircncia para o preacute-condicionador ILU(ξ)
Figura 410 ndash Graacuteficos de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
Para cada graacutefico gerado eacute registrado o nuacutemero de operaccedilotildees de ponto flutuante
miacutenimo (MFLOPSmiacuten) e este valor eacute associado agrave sua correspondente combinaccedilatildeo
(atolrtol) Apoacutes terem sido realizados todos os experimentos e registrados todos
os MFLOPSmiacuten associados a todas as combinaccedilotildees (atolrtol) eacute gerado o graacutefico
de alta eficiecircncia Este graacutefico apresenta em escala de cores todos MFLOPSmiacuten
em funccedilatildeo de suas correspondentes combinaccedilotildees (atolrtol) como mostrado na
Figura 411 sendo que a cor azul estaacute associada com os menores MFLOPSmiacuten a
157
cor vermelha com os maiores MFLOPSmiacuten e em negrito os casos natildeo
convergentes
Observa-se que entre todos os valores registrados para MFLOPSmiacuten existe uma
regiatildeo que conteacutem os casos com os menores MFLOPSmiacuten Este valor chamado
de MFLOPSoacuteti eacute o nuacutemero miacutenimo de operaccedilotildees possiacutevel (global) e estaacute
associado com a regiatildeo quadrada em azul escuro segmentada pelas linhas
brancas Os pontos brancos indicam as posiccedilotildees de todas as combinaccedilotildees que
possuem nuacutemero de operaccedilotildees igual a MFLOPSoacuteti
Figura 411 ndash Graacuteficos de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
484 Delimitaccedilatildeo das Toleracircncias do GMRES
No terceiro passo a partir do graacutefico de alta eficiecircncia apresentado na sua forma
bidimensional na Figura 412 eacute segmentada a regiatildeo dos MFLOPSoacuteti Neste
caso esta regiatildeo eacute o quadrado azul do centro do graacutefico onde cada ponto
branco estaacute associado a uma combinaccedilatildeo (atolrtol) que apresenta o menor
nuacutemero de operaccedilotildees possiacutevel em todo o espaccedilo de busca (MFLOPSoacuteti) Este
graacutefico permite encontrar as faixas de valores (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do meacutetodo GMRES associadas ao melhor
desempenho possiacutevel
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
153
apresente alto desempenho permitindo estabelecer e recomendar faixas para os
valores dos paracircmetros onde o solucionador garante convergecircncia com a maior
eficiecircncia possiacutevel O meacutetodo tambeacutem permite identificar as faixas de valores
onde o solucionador natildeo converge
O meacutetodo eacute ilustrado para ajustar os paracircmetros de duas configuraccedilotildees de
solucionador iterativo sendo estas o solucionador proposto neste trabalho
identificado como GMRES+ILU(ξ)+MD e o solucionador GMRES+ILUT(τρ)+MD
apresentado no capiacutetulo 2 Na Tabela 43 especificam-se os paracircmetros
associados a cada solucionador
Tabela 43 ndash Paracircmetros usados nos solucionadores
Solucionadores Meacutetodo Iterativo Preacute-condicionador
GMRES+ILU(ξ)+MD atol rtol
ξ
GMRES+ILUT(τρ)+MD τ ρ
481 Passos Fundamentais
Esta seccedilatildeo apresenta de maneira sucinta os passos envolvidos no meacutetodo para
ajuste dos paracircmetros dos solucionadores onde uma descriccedilatildeo geral eacute
mostrada na Figura 48 O primeiro passo refere-se agrave definiccedilatildeo do espaccedilo de
busca onde satildeo procurados os valores para os paracircmetros que garantem alto
desempenho do solucionador O segundo refere-se aos experimentos numeacutericos
realizados para avaliar o desempenho do solucionador considerando-se todas as
combinaccedilotildees possiacuteveis dos valores de seus paracircmetros definidos no espaccedilo de
busca O passo seguinte tem como objetivo calcular as faixas de valores
recomendaacuteveis para as toleracircncias absoluta e relativa do GMRES Finalmente o
quarto passo calcula as faixas de valores recomendaacuteveis para os paracircmetros do
preacute-condicionador
154
Figura 48 ndash Passos fundamentais para delimitaccedilatildeo dos paracircmetros do solucionador
Nas proacuteximas seccedilotildees os passos mais relevantes no contexto deste trabalho satildeo
discutidos mais detalhadamente
482 Estabelecimento do Espaccedilo de Busca
Para definir o espaccedilo de busca primeiramente deve-se estabelecer o domiacutenio de
cada paracircmetro isto eacute um valor miacutenimo e maacuteximo para cada toleracircncia do
GMRES e para cada paracircmetro do preacute-condicionador como mostrado na Tabela
44 e na Figura 49 Depois devem ser definidos valores intermediaacuterios para cada
paracircmetro sendo que o nuacutemero de valores totais eacute definido em funccedilatildeo do grau
de precisatildeo que se deseja conseguir nos paracircmetros
Finalmente o espaccedilo de busca eacute definido por todas as combinaccedilotildees possiacuteveis
entre as toleracircncias absoluta e relativa do GMRES como apresentado na Figura
49(a) e por todas as combinaccedilotildees possiacuteveis realizadas entre os paracircmetros do
preacute-condicionador como mostrado na Figura 49(b-c)
Para os valores especificados na Tabela 44 existem (m x n) combinaccedilotildees
possiacuteveis entre a toleracircncia absoluta e relativa (ver Figura 49(a)) e (q x p)
combinaccedilotildees possiacuteveis entre os paracircmetros τ e ρ do preacute-condicionador ILUT(τρ)
(ver Figura 49(c)) No caso do preacute-condicionador ILU(ξ) natildeo existem
combinaccedilotildees jaacute que este preacute-condicionador possui somente um uacutenico
paracircmetro Poreacutem existem k valores possiacuteveis para ξ (ver Figura 49(b))
Estabelecer Espaccedilo de Busca
Experimentos numeacutericos
Delimitar paracircmetros do preacute-condicionador
Delimitar toleracircncias do GMRES
155
Tabela 44 ndash Domiacutenios dos paracircmetros usados nos solucionadores
Paracircmetros Maacuteximo Miacutenimo Nuacutemero total de valores
atol atol1 atoln n
rtol rtol1 rtolm m
ξ ξ1 ξk k
τ τ1 τq q
ρ ρ1 ρp P
a) Espaccedilo de busca das toleracircncias do GMRES
b) Espaccedilo de busca dos paracircmetros do preacute-condicionador ILUT(ξ)
c) Espaccedilo de busca dos paracircmetros do preacute-
condicionador ILUT(τρ)
Figura 49 ndash Espaccedilo de busca dos paracircmetros do solucionador
483 Experimentos Numeacutericos
No segundo passo para cada combinaccedilatildeo das toleracircncias absoluta e relativa
(atolrtol) do espaccedilo de busca da Figura 49(a) satildeo simulados tantos Fluxos de
Carga quanto combinaccedilotildees dos paracircmetros do preacute-condicionador existam
registrando-se o nuacutemero de operaccedilotildees de ponto flutuante (MFLOPS) para cada
156
combinaccedilatildeo dos paracircmetros do preacute-condicionador Portanto para cada
combinaccedilatildeo (atolrtol) eacute gerado um graacutefico de eficiecircncia computacional (em
MFLOPS) em funccedilatildeo dos paracircmetros do preacute-condicionador como mostrado na
Figura 410(a) para o preacute-condicionador ILUT(τρ) e na Figura 410(b) para o
preacute-condicionador ILU(ξ)
a) Graacutefico de eficiecircncia para o preacute-condicionador ILUT(τρ)
b) Graacutefico de eficiecircncia para o preacute-condicionador ILU(ξ)
Figura 410 ndash Graacuteficos de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
Para cada graacutefico gerado eacute registrado o nuacutemero de operaccedilotildees de ponto flutuante
miacutenimo (MFLOPSmiacuten) e este valor eacute associado agrave sua correspondente combinaccedilatildeo
(atolrtol) Apoacutes terem sido realizados todos os experimentos e registrados todos
os MFLOPSmiacuten associados a todas as combinaccedilotildees (atolrtol) eacute gerado o graacutefico
de alta eficiecircncia Este graacutefico apresenta em escala de cores todos MFLOPSmiacuten
em funccedilatildeo de suas correspondentes combinaccedilotildees (atolrtol) como mostrado na
Figura 411 sendo que a cor azul estaacute associada com os menores MFLOPSmiacuten a
157
cor vermelha com os maiores MFLOPSmiacuten e em negrito os casos natildeo
convergentes
Observa-se que entre todos os valores registrados para MFLOPSmiacuten existe uma
regiatildeo que conteacutem os casos com os menores MFLOPSmiacuten Este valor chamado
de MFLOPSoacuteti eacute o nuacutemero miacutenimo de operaccedilotildees possiacutevel (global) e estaacute
associado com a regiatildeo quadrada em azul escuro segmentada pelas linhas
brancas Os pontos brancos indicam as posiccedilotildees de todas as combinaccedilotildees que
possuem nuacutemero de operaccedilotildees igual a MFLOPSoacuteti
Figura 411 ndash Graacuteficos de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
484 Delimitaccedilatildeo das Toleracircncias do GMRES
No terceiro passo a partir do graacutefico de alta eficiecircncia apresentado na sua forma
bidimensional na Figura 412 eacute segmentada a regiatildeo dos MFLOPSoacuteti Neste
caso esta regiatildeo eacute o quadrado azul do centro do graacutefico onde cada ponto
branco estaacute associado a uma combinaccedilatildeo (atolrtol) que apresenta o menor
nuacutemero de operaccedilotildees possiacutevel em todo o espaccedilo de busca (MFLOPSoacuteti) Este
graacutefico permite encontrar as faixas de valores (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do meacutetodo GMRES associadas ao melhor
desempenho possiacutevel
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
154
Figura 48 ndash Passos fundamentais para delimitaccedilatildeo dos paracircmetros do solucionador
Nas proacuteximas seccedilotildees os passos mais relevantes no contexto deste trabalho satildeo
discutidos mais detalhadamente
482 Estabelecimento do Espaccedilo de Busca
Para definir o espaccedilo de busca primeiramente deve-se estabelecer o domiacutenio de
cada paracircmetro isto eacute um valor miacutenimo e maacuteximo para cada toleracircncia do
GMRES e para cada paracircmetro do preacute-condicionador como mostrado na Tabela
44 e na Figura 49 Depois devem ser definidos valores intermediaacuterios para cada
paracircmetro sendo que o nuacutemero de valores totais eacute definido em funccedilatildeo do grau
de precisatildeo que se deseja conseguir nos paracircmetros
Finalmente o espaccedilo de busca eacute definido por todas as combinaccedilotildees possiacuteveis
entre as toleracircncias absoluta e relativa do GMRES como apresentado na Figura
49(a) e por todas as combinaccedilotildees possiacuteveis realizadas entre os paracircmetros do
preacute-condicionador como mostrado na Figura 49(b-c)
Para os valores especificados na Tabela 44 existem (m x n) combinaccedilotildees
possiacuteveis entre a toleracircncia absoluta e relativa (ver Figura 49(a)) e (q x p)
combinaccedilotildees possiacuteveis entre os paracircmetros τ e ρ do preacute-condicionador ILUT(τρ)
(ver Figura 49(c)) No caso do preacute-condicionador ILU(ξ) natildeo existem
combinaccedilotildees jaacute que este preacute-condicionador possui somente um uacutenico
paracircmetro Poreacutem existem k valores possiacuteveis para ξ (ver Figura 49(b))
Estabelecer Espaccedilo de Busca
Experimentos numeacutericos
Delimitar paracircmetros do preacute-condicionador
Delimitar toleracircncias do GMRES
155
Tabela 44 ndash Domiacutenios dos paracircmetros usados nos solucionadores
Paracircmetros Maacuteximo Miacutenimo Nuacutemero total de valores
atol atol1 atoln n
rtol rtol1 rtolm m
ξ ξ1 ξk k
τ τ1 τq q
ρ ρ1 ρp P
a) Espaccedilo de busca das toleracircncias do GMRES
b) Espaccedilo de busca dos paracircmetros do preacute-condicionador ILUT(ξ)
c) Espaccedilo de busca dos paracircmetros do preacute-
condicionador ILUT(τρ)
Figura 49 ndash Espaccedilo de busca dos paracircmetros do solucionador
483 Experimentos Numeacutericos
No segundo passo para cada combinaccedilatildeo das toleracircncias absoluta e relativa
(atolrtol) do espaccedilo de busca da Figura 49(a) satildeo simulados tantos Fluxos de
Carga quanto combinaccedilotildees dos paracircmetros do preacute-condicionador existam
registrando-se o nuacutemero de operaccedilotildees de ponto flutuante (MFLOPS) para cada
156
combinaccedilatildeo dos paracircmetros do preacute-condicionador Portanto para cada
combinaccedilatildeo (atolrtol) eacute gerado um graacutefico de eficiecircncia computacional (em
MFLOPS) em funccedilatildeo dos paracircmetros do preacute-condicionador como mostrado na
Figura 410(a) para o preacute-condicionador ILUT(τρ) e na Figura 410(b) para o
preacute-condicionador ILU(ξ)
a) Graacutefico de eficiecircncia para o preacute-condicionador ILUT(τρ)
b) Graacutefico de eficiecircncia para o preacute-condicionador ILU(ξ)
Figura 410 ndash Graacuteficos de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
Para cada graacutefico gerado eacute registrado o nuacutemero de operaccedilotildees de ponto flutuante
miacutenimo (MFLOPSmiacuten) e este valor eacute associado agrave sua correspondente combinaccedilatildeo
(atolrtol) Apoacutes terem sido realizados todos os experimentos e registrados todos
os MFLOPSmiacuten associados a todas as combinaccedilotildees (atolrtol) eacute gerado o graacutefico
de alta eficiecircncia Este graacutefico apresenta em escala de cores todos MFLOPSmiacuten
em funccedilatildeo de suas correspondentes combinaccedilotildees (atolrtol) como mostrado na
Figura 411 sendo que a cor azul estaacute associada com os menores MFLOPSmiacuten a
157
cor vermelha com os maiores MFLOPSmiacuten e em negrito os casos natildeo
convergentes
Observa-se que entre todos os valores registrados para MFLOPSmiacuten existe uma
regiatildeo que conteacutem os casos com os menores MFLOPSmiacuten Este valor chamado
de MFLOPSoacuteti eacute o nuacutemero miacutenimo de operaccedilotildees possiacutevel (global) e estaacute
associado com a regiatildeo quadrada em azul escuro segmentada pelas linhas
brancas Os pontos brancos indicam as posiccedilotildees de todas as combinaccedilotildees que
possuem nuacutemero de operaccedilotildees igual a MFLOPSoacuteti
Figura 411 ndash Graacuteficos de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
484 Delimitaccedilatildeo das Toleracircncias do GMRES
No terceiro passo a partir do graacutefico de alta eficiecircncia apresentado na sua forma
bidimensional na Figura 412 eacute segmentada a regiatildeo dos MFLOPSoacuteti Neste
caso esta regiatildeo eacute o quadrado azul do centro do graacutefico onde cada ponto
branco estaacute associado a uma combinaccedilatildeo (atolrtol) que apresenta o menor
nuacutemero de operaccedilotildees possiacutevel em todo o espaccedilo de busca (MFLOPSoacuteti) Este
graacutefico permite encontrar as faixas de valores (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do meacutetodo GMRES associadas ao melhor
desempenho possiacutevel
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
155
Tabela 44 ndash Domiacutenios dos paracircmetros usados nos solucionadores
Paracircmetros Maacuteximo Miacutenimo Nuacutemero total de valores
atol atol1 atoln n
rtol rtol1 rtolm m
ξ ξ1 ξk k
τ τ1 τq q
ρ ρ1 ρp P
a) Espaccedilo de busca das toleracircncias do GMRES
b) Espaccedilo de busca dos paracircmetros do preacute-condicionador ILUT(ξ)
c) Espaccedilo de busca dos paracircmetros do preacute-
condicionador ILUT(τρ)
Figura 49 ndash Espaccedilo de busca dos paracircmetros do solucionador
483 Experimentos Numeacutericos
No segundo passo para cada combinaccedilatildeo das toleracircncias absoluta e relativa
(atolrtol) do espaccedilo de busca da Figura 49(a) satildeo simulados tantos Fluxos de
Carga quanto combinaccedilotildees dos paracircmetros do preacute-condicionador existam
registrando-se o nuacutemero de operaccedilotildees de ponto flutuante (MFLOPS) para cada
156
combinaccedilatildeo dos paracircmetros do preacute-condicionador Portanto para cada
combinaccedilatildeo (atolrtol) eacute gerado um graacutefico de eficiecircncia computacional (em
MFLOPS) em funccedilatildeo dos paracircmetros do preacute-condicionador como mostrado na
Figura 410(a) para o preacute-condicionador ILUT(τρ) e na Figura 410(b) para o
preacute-condicionador ILU(ξ)
a) Graacutefico de eficiecircncia para o preacute-condicionador ILUT(τρ)
b) Graacutefico de eficiecircncia para o preacute-condicionador ILU(ξ)
Figura 410 ndash Graacuteficos de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
Para cada graacutefico gerado eacute registrado o nuacutemero de operaccedilotildees de ponto flutuante
miacutenimo (MFLOPSmiacuten) e este valor eacute associado agrave sua correspondente combinaccedilatildeo
(atolrtol) Apoacutes terem sido realizados todos os experimentos e registrados todos
os MFLOPSmiacuten associados a todas as combinaccedilotildees (atolrtol) eacute gerado o graacutefico
de alta eficiecircncia Este graacutefico apresenta em escala de cores todos MFLOPSmiacuten
em funccedilatildeo de suas correspondentes combinaccedilotildees (atolrtol) como mostrado na
Figura 411 sendo que a cor azul estaacute associada com os menores MFLOPSmiacuten a
157
cor vermelha com os maiores MFLOPSmiacuten e em negrito os casos natildeo
convergentes
Observa-se que entre todos os valores registrados para MFLOPSmiacuten existe uma
regiatildeo que conteacutem os casos com os menores MFLOPSmiacuten Este valor chamado
de MFLOPSoacuteti eacute o nuacutemero miacutenimo de operaccedilotildees possiacutevel (global) e estaacute
associado com a regiatildeo quadrada em azul escuro segmentada pelas linhas
brancas Os pontos brancos indicam as posiccedilotildees de todas as combinaccedilotildees que
possuem nuacutemero de operaccedilotildees igual a MFLOPSoacuteti
Figura 411 ndash Graacuteficos de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
484 Delimitaccedilatildeo das Toleracircncias do GMRES
No terceiro passo a partir do graacutefico de alta eficiecircncia apresentado na sua forma
bidimensional na Figura 412 eacute segmentada a regiatildeo dos MFLOPSoacuteti Neste
caso esta regiatildeo eacute o quadrado azul do centro do graacutefico onde cada ponto
branco estaacute associado a uma combinaccedilatildeo (atolrtol) que apresenta o menor
nuacutemero de operaccedilotildees possiacutevel em todo o espaccedilo de busca (MFLOPSoacuteti) Este
graacutefico permite encontrar as faixas de valores (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do meacutetodo GMRES associadas ao melhor
desempenho possiacutevel
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
156
combinaccedilatildeo dos paracircmetros do preacute-condicionador Portanto para cada
combinaccedilatildeo (atolrtol) eacute gerado um graacutefico de eficiecircncia computacional (em
MFLOPS) em funccedilatildeo dos paracircmetros do preacute-condicionador como mostrado na
Figura 410(a) para o preacute-condicionador ILUT(τρ) e na Figura 410(b) para o
preacute-condicionador ILU(ξ)
a) Graacutefico de eficiecircncia para o preacute-condicionador ILUT(τρ)
b) Graacutefico de eficiecircncia para o preacute-condicionador ILU(ξ)
Figura 410 ndash Graacuteficos de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
Para cada graacutefico gerado eacute registrado o nuacutemero de operaccedilotildees de ponto flutuante
miacutenimo (MFLOPSmiacuten) e este valor eacute associado agrave sua correspondente combinaccedilatildeo
(atolrtol) Apoacutes terem sido realizados todos os experimentos e registrados todos
os MFLOPSmiacuten associados a todas as combinaccedilotildees (atolrtol) eacute gerado o graacutefico
de alta eficiecircncia Este graacutefico apresenta em escala de cores todos MFLOPSmiacuten
em funccedilatildeo de suas correspondentes combinaccedilotildees (atolrtol) como mostrado na
Figura 411 sendo que a cor azul estaacute associada com os menores MFLOPSmiacuten a
157
cor vermelha com os maiores MFLOPSmiacuten e em negrito os casos natildeo
convergentes
Observa-se que entre todos os valores registrados para MFLOPSmiacuten existe uma
regiatildeo que conteacutem os casos com os menores MFLOPSmiacuten Este valor chamado
de MFLOPSoacuteti eacute o nuacutemero miacutenimo de operaccedilotildees possiacutevel (global) e estaacute
associado com a regiatildeo quadrada em azul escuro segmentada pelas linhas
brancas Os pontos brancos indicam as posiccedilotildees de todas as combinaccedilotildees que
possuem nuacutemero de operaccedilotildees igual a MFLOPSoacuteti
Figura 411 ndash Graacuteficos de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
484 Delimitaccedilatildeo das Toleracircncias do GMRES
No terceiro passo a partir do graacutefico de alta eficiecircncia apresentado na sua forma
bidimensional na Figura 412 eacute segmentada a regiatildeo dos MFLOPSoacuteti Neste
caso esta regiatildeo eacute o quadrado azul do centro do graacutefico onde cada ponto
branco estaacute associado a uma combinaccedilatildeo (atolrtol) que apresenta o menor
nuacutemero de operaccedilotildees possiacutevel em todo o espaccedilo de busca (MFLOPSoacuteti) Este
graacutefico permite encontrar as faixas de valores (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do meacutetodo GMRES associadas ao melhor
desempenho possiacutevel
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
157
cor vermelha com os maiores MFLOPSmiacuten e em negrito os casos natildeo
convergentes
Observa-se que entre todos os valores registrados para MFLOPSmiacuten existe uma
regiatildeo que conteacutem os casos com os menores MFLOPSmiacuten Este valor chamado
de MFLOPSoacuteti eacute o nuacutemero miacutenimo de operaccedilotildees possiacutevel (global) e estaacute
associado com a regiatildeo quadrada em azul escuro segmentada pelas linhas
brancas Os pontos brancos indicam as posiccedilotildees de todas as combinaccedilotildees que
possuem nuacutemero de operaccedilotildees igual a MFLOPSoacuteti
Figura 411 ndash Graacuteficos de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
484 Delimitaccedilatildeo das Toleracircncias do GMRES
No terceiro passo a partir do graacutefico de alta eficiecircncia apresentado na sua forma
bidimensional na Figura 412 eacute segmentada a regiatildeo dos MFLOPSoacuteti Neste
caso esta regiatildeo eacute o quadrado azul do centro do graacutefico onde cada ponto
branco estaacute associado a uma combinaccedilatildeo (atolrtol) que apresenta o menor
nuacutemero de operaccedilotildees possiacutevel em todo o espaccedilo de busca (MFLOPSoacuteti) Este
graacutefico permite encontrar as faixas de valores (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do meacutetodo GMRES associadas ao melhor
desempenho possiacutevel
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
158
Figura 412 ndash Regiotildees de alta eficiecircncia em funccedilatildeo das toleracircncias do GMRES
485 Delimitaccedilatildeo dos Paracircmetros do Preacute-condicionador
No quarto e uacuteltimo passo a partir das faixas (atolmiacutenatolmaacutex) e (rtolmiacutenrtolmaacutex)
recomendaacuteveis para as toleracircncias do GMRES eacute escolhido um valor para cada
toleracircncia isto eacute atol = atoloacuteti e rtol = rtoloacuteti (Figura 413) Jaacute que todas as
toleracircncias dessas faixas tecircm o mesmo MFLOPSoacuteti pode-se escolher qualquer
um
Figura 413 ndash Escolha dos valores (atoloacutetirtoloacuteti) para as toleracircncias absoluta e relativa do GMRES
Uma vez escolhidos os valores da toleracircncia absoluta e relativa utiliza-se o
graacutefico de eficiecircncia calculado em funccedilatildeo dos paracircmetros do preacute-condicionador
(jaacute obtido no passo dois ver Figura 410) associado aos valores (atoloacutetirtoloacuteti)
escolhidos neste passo A partir deste graacutefico na sua forma bidimensional
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
159
(Figura 414) satildeo geradas as regiotildees de desempenho do solucionador em
funccedilatildeo dos paracircmetros do preacute-condicionador especificamente para os valores
das toleracircncias do GMRES escolhidas no inicio do presente passo (atoloacutetirtoloacuteti)
As regiotildees de desempenho satildeo diferenciadas pela escala de cores sendo que a
cor azul estaacute associada com os melhores desempenhos (menores MFLOPS) a
cor vermelha com os piores desempenhos (maiores MFLOPS) e em negrito os
casos natildeo convergentes
As regiotildees de desempenho do solucionador permitem obter as faixas de valores
recomendaacuteveis para os paracircmetros do preacute-condicionador associadas ao melhor
desempenho possiacutevel MFLOPSoacuteti sendo estas (ξmiacutenξmaacutex) para o preacute-
condicionador ILU(ξ) e (τmiacutenτmaacutex) e (ρmiacutenρmaacutex) para o preacute-condicionador ILUT(τρ)
Recomenda-se aplicar este meacutetodo em diferentes configuraccedilotildees do sistema
interligado nacional brasileiro com diferentes niacuteveis de carga O meacutetodo deve
gerar para cada sistema eleacutetrico faixas de valores para todos os paracircmetros do
solucionador A interseccedilatildeo dessas faixas poderaacute ser considerada confiaacutevel para
ser usada sempre no solucionador garantindo robustez e alto desempenho
computacional A eficaacutecia do meacutetodo pode ser avaliada com experimentos de
fluxo de carga e Anaacutelise de Contingecircncias No proacuteximo capiacutetulo o meacutetodo
proposto eacute aplicado para a geraccedilatildeo de valores recomendaacuteveis dos paracircmetros
do solucionador iterativo no problema de fluxo de carga
a) Graacutefico de eficiecircncia para os preacute-
condicionadores ILUT(τρ) e ILUT(ξτ)
b) Graacutefico de eficiecircncia para o preacute-
condicionador ILU(ξ)
Figura 414 ndash Regiotildees de eficiecircncia em funccedilatildeo dos paracircmetros do preacute-condicionador
top related