caracterização de perdas comerciais em sistemas de energia ... · bffa binary firefly algorithm...

144
CAIO CÉSAR OBA RAMOS Caracterização de Perdas Comerciais em Sistemas de Energia Através de Técnicas Inteligentes São Paulo 2014

Upload: others

Post on 30-Oct-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAIO CÉSAR OBA RAMOS

Caracterização de Perdas Comerciais em Sistemas deEnergia Através de Técnicas Inteligentes

São Paulo2014

Page 2: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAIO CÉSAR OBA RAMOS

Caracterização de Perdas Comerciais em Sistemas deEnergia Através de Técnicas Inteligentes

Tese apresentada à Escola Politécnica daUniversidade de São Paulo para obtençãodo título de Doutor em Ciências

São Paulo2014

Page 3: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAIO CÉSAR OBA RAMOS

Caracterização de Perdas Comerciais em Sistemas deEnergia Através de Técnicas Inteligentes

Tese apresentada à Escola Politécnica daUniversidade de São Paulo para obtençãodo título de Doutor em Ciências

Área de Concentração: Engenharia Elé-trica / Sistemas de Potência

Orientador: Prof. Dr. André Nunes deSouza

São Paulo2014

Page 4: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

Dedicatória

Dedico este trabalho com todo carinho a meus pais que me incentivaram e que mederam total apoio para a concretização desta conquista.

i

Page 5: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

Agradecimentos

Ao Prof. Dr. André Nunes de Souza, pela orientação e pelo constante estímulotransmitido durante todo os anos de pesquisa, desde 2003. Sua amizade foi um fatorfundamental que contribuiu bastante para a minha produtividade científica.

Ao Prof. Dr. João Paulo Papa, pela colaboração para o desenvolvimento destetrabalho e pela sua grande amizade desde os tempos de colégio.

Ao Grupo de Pesquisa RECOGNA (Biometric & Pattern Recognition ResearchGroup) da UNESP, campus de Bauru, pela assistência dada para a execução dosexperimentos.

Ao Prof. Dr. Luiz Lebensztajn, pelo apoio, incentivo e suporte para a continuidadedeste trabalho.

Aos meus amigos e colegas de trabalho do LSISPOTI, em especial, o Danilo Gas-taldello, o Tiago Forti da Silva e o Haroldo Amaral, sem esquecer aos demais, pelaajuda, pela companhia e pela amizade em todos os momentos bons e difíceis paracumprir com todos os cronogramas.

Ao Ricardo Torrezan, um grande amigo, cuja amizade começou durante o curso demestrado na UNESP, que contribuiu com significativas sugestões.

A CAPES, pelo incentivo e apoio financeiro dado para a execução deste trabalho.A minha família, em especial aos meus pais, Eunice Oba e Alcides de Amorim

Ramos, pela compreensão, incentivo, apoio e paciência que tiveram comigo durante odesenvolvimento deste trabalho.

E a todos que colaboraram direta ou indiretamente, na execução deste trabalho.

ii

Page 6: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

Resumo

A detecção de furtos e fraudes nos sistemas de energia provocados por consumi-dores irregulares é o principal alvo em análises de perdas não-técnicas ou comerci-ais pelas empresas de energia. Embora a identificação automática de perdas não-técnicas tenha sido amplamente estudada, a tarefa de selecionar as característicasmais representativas em um grande conjunto de dados a fim de aumentar a taxa deacerto da identificação, bem como para caracterizar possíveis consumidores irregula-res como um problema de otimização, não tem sido muito explorada neste contexto.Neste trabalho, visa-se o desenvolvimento de algoritmos híbridos baseados em téc-nicas evolutivas a fim de realizar a seleção de características no âmbito da caracte-rização de perdas não-técnicas, comparando as suas taxas de acerto e verificandoas características selecionadas. Vários classificadores são comparados, com desta-que para a técnica Floresta de Caminhos Ótimos por sua robustez, sendo ela a téc-nica escolhida para o cálculo da função objetivo das técnicas evolutivas, analisandoo desempenho das mesmas. Os resultados demonstraram que a seleção de carac-terísticas mais representativas podem melhorar a taxa de acerto da classificação depossíveis perdas não-técnicas quando comparada à classificação sem o processo deseleção de características em conjuntos de dados compostos por perfis de consumi-dores industriais e comerciais. Isto significa que existem características que não sãopertinentes e podem diminuir a taxa de acerto durante a classificação dos consumido-res. Através da metodologia proposta com o processo de seleção de características, épossível caracterizar e identificar os perfis de consumidores com mais precisão, afimde minimizar os custos com tais perdas, contribuindo para a recuperação de receitadas companhias de energia elétrica.

Palavras-chave: Técnicas Inteligentes. Algoritmos Evolutivos. Identificação. Seleçãode Características. Floresta de Caminhos Ótimos. Perdas Não-Técnicas.

iii

Page 7: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

Abstract

The detection of thefts and frauds in power systems caused by irregular consu-mers is the most actively pursued analysis in non-technical losses by electric powercompanies. Although non-technical losses automatic identification has been massi-vely studied, the task of selecting the most representative features in a large dataset,in order to boost the identification accuracy, as well as characterizing possible irregularconsumers as a problem of optimization, has not been widely explored in this con-text. This work aims at developing hybrid algorithms based on evolutionary algorithmsin order to perform feature selection in the context of non-technical losses characte-rization. Although several classifiers have been compared, we have highlighted theOptimum-Path Forest (OPF) technique mainly because of its robustness. Thus, theOPF classifier was chosen to compute the objective function of evolutionary techni-ques, analyzing their performances. This procedure with feature selection is comparedwith the procedure without feature selection in datasets composed by industrial andcommercial consumers profiles. The results demonstrated that selecting the most re-presentative features can improve the classification accuracy of possible non-technicallosses. This means that there are irrelevant features and they can reduce the classi-fication accuracy of consumers. Considering the methodology proposed with featureselection procedure, it is possible to characterize and identify consumer profiles moreaccurately, in order to minimize costs with such losses, contributing to the recovery ofrevenue from electric power companies.

Keywords: Intelligent Techniques. Evolutionary Algorithms. Identification. FeatureSelection. Optimum-Path Forest. Non-Technical Losses.

iv

Page 8: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

Sumário

Lista de Abreviaturas, Siglas e Símbolos ix

Lista de Figuras xi

Lista de Tabelas xii

1 Introdução 11.1 Motivação e Justificativa . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.3 Contribuições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.4 Organização do Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2 Perdas Não-Técnicas ou Perdas Comerciais 52.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52.2 Perdas Não-Técnicas no Cenário Brasileiro e Mundial . . . . . . . . . . 72.3 Fraudes e Furtos de Energia . . . . . . . . . . . . . . . . . . . . . . . . 102.4 Inadimplência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.4.1 Nova Modalidade: Tarifa Branca . . . . . . . . . . . . . . . . . . 132.5 Procedimentos de Combate Contra as Perdas Comerciais . . . . . . . . 14

2.5.1 Projetos de Pesquisa e Desenvolvimento Regulados pela ANEEL 152.5.2 Smart Grid e sua Relação com Perdas Não-Técnicas . . . . . . 162.5.3 Sistema de Pagamento Pré-Pago . . . . . . . . . . . . . . . . . 17

2.6 Considerações Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

3 Estado da Arte: Perdas Não-Técnicas 193.1 Alguns Projetos Importantes de P&D Regulados pela ANEEL . . . . . . 193.2 Teses e Dissertações . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243.3 Artigos Publicados em Periódicos e Conferências . . . . . . . . . . . . . 263.4 Considerações Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

4 IA Para Reconhecimento de Padrões 314.1 Redes Neurais Artificiais . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

4.1.1 Mapas de Auto-Organização . . . . . . . . . . . . . . . . . . . . 32

v

Page 9: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

SUMÁRIO vi

4.1.2 Redes Neurais Perceptron Multicamadas . . . . . . . . . . . . . 344.2 Máquinas de Vetores de Suporte . . . . . . . . . . . . . . . . . . . . . . 39

4.2.1 Classificadores por Hiperplano . . . . . . . . . . . . . . . . . . . 394.2.2 Nuclearização e Hiperplanos de Margem Suave . . . . . . . . . 434.2.3 Considerações Adicionais . . . . . . . . . . . . . . . . . . . . . . 45

4.3 k -Vizinhos Mais Próximos . . . . . . . . . . . . . . . . . . . . . . . . . . 464.4 Floresta de Caminhos Ótimos . . . . . . . . . . . . . . . . . . . . . . . . 47

4.4.1 Classificador por OPF . . . . . . . . . . . . . . . . . . . . . . . . 484.4.2 Fundamentação Teórica . . . . . . . . . . . . . . . . . . . . . . . 484.4.3 Treinamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504.4.4 Classificação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4.5 Redes Bayesianas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 524.6 Considerações Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

5 Técnicas Evolutivas Para Otimização 545.1 Particle Swarm Optimization - PSO . . . . . . . . . . . . . . . . . . . . . 54

5.1.1 Teoria Básica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 545.1.2 PSO para Seleção de Características . . . . . . . . . . . . . . . 56

5.2 Gravitational Search Algorithm - GSA . . . . . . . . . . . . . . . . . . . 575.2.1 Teoria Básica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 575.2.2 GSA para Seleção de Características . . . . . . . . . . . . . . . 60

5.3 Harmony Search - HS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 625.3.1 Teoria Básica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 625.3.2 HS para Seleção de Características . . . . . . . . . . . . . . . . 655.3.3 Self-adaptive Global best Harmony Search . . . . . . . . . . . . 67

5.4 Cuckoo Search - CS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 675.4.1 Teoria Básica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 675.4.2 CS para Seleção de Características . . . . . . . . . . . . . . . . 68

5.5 Bat Algorithm - BA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 705.5.1 Teoria Básica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 705.5.2 BA para Seleção de Características . . . . . . . . . . . . . . . . 73

5.6 Firefly Algorithm - FFA . . . . . . . . . . . . . . . . . . . . . . . . . . . . 735.6.1 Teoria Básica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 735.6.2 FFA para Seleção de Características . . . . . . . . . . . . . . . . 75

5.7 Charged System Search - CSS . . . . . . . . . . . . . . . . . . . . . . . 765.7.1 Teoria Básica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

5.8 Considerações Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

Page 10: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

SUMÁRIO vii

6 Base de Dados e Procedimentos Metodológicos 796.1 Conjunto de Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

6.1.1 Observações Adicionais . . . . . . . . . . . . . . . . . . . . . . . 806.2 Procedimentos Metodológicos . . . . . . . . . . . . . . . . . . . . . . . 836.3 Considerações Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

7 Resultados Experimentais 867.1 Experimento 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

7.1.1 Procedimentos Experimentais . . . . . . . . . . . . . . . . . . . 867.1.2 Avaliação dos Métodos . . . . . . . . . . . . . . . . . . . . . . . 877.1.3 Avaliação da Robustez . . . . . . . . . . . . . . . . . . . . . . . 887.1.4 Comparação das Técnicas para Seleção de Características . . . 887.1.5 Observações Adicionais . . . . . . . . . . . . . . . . . . . . . . . 90

7.2 Experimento 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 907.2.1 Procedimentos Experimentais . . . . . . . . . . . . . . . . . . . 907.2.2 Experimentos e Resultados . . . . . . . . . . . . . . . . . . . . . 917.2.3 Observações Adicionais . . . . . . . . . . . . . . . . . . . . . . . 96

7.3 Experimento 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 977.3.1 Treinamento de ANN-MLP Através do CSS . . . . . . . . . . . . 977.3.2 Configuração dos Parâmetros . . . . . . . . . . . . . . . . . . . 977.3.3 Resultados Experimentais . . . . . . . . . . . . . . . . . . . . . . 987.3.4 Observações Adicionais . . . . . . . . . . . . . . . . . . . . . . . 99

7.4 Experimento 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 997.4.1 Software WEKA . . . . . . . . . . . . . . . . . . . . . . . . . . . 997.4.2 Procedimentos Experimentais . . . . . . . . . . . . . . . . . . . 1007.4.3 Avaliação dos Resultados e Discussões . . . . . . . . . . . . . . 1007.4.4 Observações Adicionais . . . . . . . . . . . . . . . . . . . . . . . 104

7.5 Considerações Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

8 Estudo de Viabilidade Econômica 1058.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1058.2 Aspectos Sociais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1068.3 Aspectos Econômicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

8.3.1 Experimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1078.4 Considerações Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

9 Conclusões 1139.1 Conclusões Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1139.2 Trabalhos Publicados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

Page 11: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

SUMÁRIO viii

Referências Bibliográficas 120

Page 12: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

Lista de Abreviaturas, Siglas e Símbolos

ABRADEE Associação Brasileira de Distribuidores de Energia ElétricaACO Ant Colony Optimization (Otimização de Colônia de Formigas)ANEEL Agência Nacional de Energia ElétricaANN Artificial Neural Networks (Redes Neurais Artificiais)ANN-MLP Redes Neurais Artificiais com Perceptrons MulticamadasBA Bat Algorithm (Algoritmo do Morcego)BBA Binary Bat Algorithm (Algoritmo do Morcego Binário)Bc Base de Dados de Consumidores ComerciaisBCS Binary Cuckoo Search (Busca por Cuco Binário)BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário)Bi Base de Dados de Consumidores IndustriaisBGSA Binary GSA (Algoritmo de Busca Gravitacional Binário)CS Cuckoo Search (Busca por Cuco)CSS Charged System Search (Busca por Partícula Carregada)DC Demanda ContratadaDF Demanda FaturadaDmax Demanda MáximaDmedia Demanda MédiaELM Extreme Learning Machines (Aprendizado Extrema de Máquinas)EPE Empresa de Pesquisa EnergéticaER Energia ReativaFANN Fast Artificial Neural Network Library (Biblioteca para ANN)FC Fator de CargaFFA Firefly Algorithm (Algoritmo do Vaga-lume)FIFO First-In-First-OutFP Fator de PotênciaGA Genetic Algorithm (Algoritmo Genético)GSA Gravitational Search Algorithm (Algoritmo de Busca Gravitacional)GWh Gigawatts-hora

ix

Page 13: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

LISTA DE ABREVIATURAS, SIGLAS E SÍMBOLOS x

HM Harmony Memory (Memória Harmônica)HMCR Harmony Memory Considering Rate

(Taxa de Consideração da Memória Harmônica)HS Harmony Search (Busca Harmônica)IA Inteligência Artificialk-NN k-Nearest Neighbor (k-Vizinhos Mais Próximos)KTT Karush-Kuhn-TuckerkW QuilowattsLibSVM Biblioteca para SVM com Função NúcleoLibLINEAR Biblioteca para SVM sem Função NúcleoLibOPF Biblioteca para Floresta de Caminhos ÓtimosMME Ministério de Minas e EnergiaMSE Mean Squared Error (Erro Quadrático Médio)MST Minimum Spanning Tree (Árvore Geradora Mínima)NN Nearest Neighbor (Vizinhos Mais Próximos)NTL Non-Technical Losses (Perdas Não-Técnicas)OPF Optimum-Path Forest (Floresta de Caminhos Ótimos)Pinst Potência InstaladaPAR Pitch Adjusting Rate (Taxa de Ajuste de Passo)PNT Perdas Não-TécnicasPSO Particle Swarm Optimization

(Otimização por Enxames de Partículas)RB Redes BayesianasSOM Self-Organizing Maps (Mapas de Auto-Organização)SVM Support Vector Machines (Máquinas de Vetores de Suporte)SVM-noKernel Máquinas de Vetores de Suporte sem Função NúcleoSVM-RBF Máquinas de Vetores de Suporte com Função Base RadialTNB Tenaga Nasional BerhadTP Transformador de PotênciaUC Unidade Consumidora

Page 14: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

Lista de Figuras

2.1 Percentual de perdas em relação à energia injetada no sistema brasileiro. 102.2 Ciclo com relação à inadimplência. . . . . . . . . . . . . . . . . . . . . . 13

4.1 Arquitetura bidimensional típica de uma rede de Kohonen. . . . . . . . . 344.2 Modelo simplificado do perceptron. . . . . . . . . . . . . . . . . . . . . . 364.3 Representação básica de uma rede feedforward (multicamadas). . . . . 374.4 Exemplo de hiperplano ótimo. . . . . . . . . . . . . . . . . . . . . . . . . 414.5 Mapeamento dos dados para um espaço de maior dimensionalidade. . 444.6 Processo de classificação do k-NN. . . . . . . . . . . . . . . . . . . . . 474.7 Treinamento e classificação baseado em OPF. . . . . . . . . . . . . . . 514.8 Exemplo de Rede Bayesiana. . . . . . . . . . . . . . . . . . . . . . . . . 53

5.1 Interpretação geométrica de PSO. . . . . . . . . . . . . . . . . . . . . . 555.2 Representação da força resultante. . . . . . . . . . . . . . . . . . . . . . 585.3 Analogia entre a improvisação musica e a otimização. . . . . . . . . . . 635.4 Escolha aleatório de um ninho hospereiro. . . . . . . . . . . . . . . . . . 685.5 Comportamento dos morcegos. . . . . . . . . . . . . . . . . . . . . . . . 715.6 Comportamento dos vaga-lumes. . . . . . . . . . . . . . . . . . . . . . . 745.7 Movimento de uma partícula carregada. . . . . . . . . . . . . . . . . . . 77

6.1 Curva de demanda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 816.2 Triângulo de potências . . . . . . . . . . . . . . . . . . . . . . . . . . . . 826.3 Metodologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 846.4 Modelo da arquitetura inteligente . . . . . . . . . . . . . . . . . . . . . . 84

7.1 Curva de taxa de acerto do OPF sobre Z3 para o conjunto de dados Bc. 947.2 Curva de taxa de acerto do OPF sobre Z3 para o conjunto de dados Bi. 957.3 Resultados de busca de grade para o conjunto de dados Bc. . . . . . . 967.4 Resultados de busca de grade para o conjunto de dados Bi. . . . . . . 967.5 Fluxograma dos experimentos com o WEKA . . . . . . . . . . . . . . . 101

xi

Page 15: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

Lista de Tabelas

2.1 Índice de Perdas Não-Técnicas em Diversos Países . . . . . . . . . . . 82.2 Índice de Perdas Não-Técnicas por Região (Fonte: ANEEL-2011) . . . 92.3 Índice de Perdas Não-Técnicas por Distribuidora (Fonte: ANEEL-2011) 9

7.1 Taxa de Acerto e Tempo de Treinamento para as Bases Bc e Bi . . . . 887.2 Taxas de Acerto para as Bases Bc e Bi . . . . . . . . . . . . . . . . . . 897.3 Características Selecionadas para as Bases Bc e Bi . . . . . . . . . . . 897.4 Parâmetros usados para cada abordagem de otimização . . . . . . . . 927.5 Taxas de Acerto Média - Bc . . . . . . . . . . . . . . . . . . . . . . . . . 937.6 Taxas de Acerto Média - Bi . . . . . . . . . . . . . . . . . . . . . . . . . 937.7 Tempo, Limiar, Características e Taxa de Acerto - Bc . . . . . . . . . . . 947.8 Tempo, Limiar, Características e Taxa de Acerto - Bi . . . . . . . . . . . 957.9 Configuração dos Parâmetros dos Algoritmos Meta-heurísticos . . . . . 987.10 Média do MSE para os Conjuntos de Dados Bc e Bi . . . . . . . . . . . 987.11 Média da Taxa de Acerto para os Conjuntos de Dados Bc e Bi . . . . . 997.12 Tempo Médio de Execução do Treinamento para Bc e Bi . . . . . . . . . 997.13 Resultados com Todas as Características . . . . . . . . . . . . . . . . . 1007.14 Resultados da Busca Exaustiva . . . . . . . . . . . . . . . . . . . . . . . 1017.15 Resultados do Ranqueamento . . . . . . . . . . . . . . . . . . . . . . . 1017.16 Resultados com as Características Selecionadas pela Busca Exaustiva 1027.17 Resultados com as 3 Características Melhores Ranqueadas . . . . . . 1027.18 Matriz de Confusão do k-NN em Bc - Todas as Características . . . . . 1037.19 Matriz de Confusão do k-NN em Bi - Todas as Características . . . . . 1037.20 Matriz de Confusão do k-NN em Bc - 3 Características . . . . . . . . . . 1037.21 Matriz de Confusão do k-NN em Bi - 3 Características . . . . . . . . . . 104

8.1 Taxa de Acerto por Classe em Bc e Bi - Sem Seleção de Características 1088.2 Características Selecionadas para as Bases Bc e Bi . . . . . . . . . . . 1088.3 Taxa de Acerto por Classe em Bc e Bi - Com Seleção de Características 1088.4 Cenário Energético Brasileiro em 2011 . . . . . . . . . . . . . . . . . . . 1098.5 Projeção do Consumo/Prejuízos - Sem Seleção de Características . . . 1108.6 Projeção do Consumo/Prejuízos - Com Seleção de Características . . . 110

xii

Page 16: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

LISTA DE TABELAS xiii

8.7 Projeção de Consumo de Energia Elétrica entre 2011-2021 . . . . . . . 111

Page 17: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

Capítulo 1

Introdução

1.1 Motivação e Justificativa

Nos últimos 20 anos, o sistema elétrico brasileiro vem passando por várias mudan-ças, consolidando-se o período de privatização das empresas geradoras, transmis-soras e distribuidoras de energia elétrica, a qual introduziu um ambiente competitivono cenário nacional. Os investimentos realizados pelas concessionárias têm comoprincipal objetivo uma melhora significativa de seu desempenho financeiro e técnico,buscando produtividade, eficiência e rentabilidade. A fim de se obter uma melhorgestão com relação às perdas de energia, uma das formas de maximizar a energiadisponível para comercialização é a concessionária de energia combater as perdascomerciais, principalmente as fraudes de energia.

As Perdas Não-Técnicas (PNT), em inglês Non-Technical Losses (NTL), tambémconhecidas como Perdas Comerciais, são aquelas associadas à comercialização daenergia fornecida ao usuário e se referem à energia entregue e não faturada, gerandouma perda no faturamento. Também são definidas como a diferença entre as per-das totais e as perdas técnicas, e estão principalmente relacionadas com as ligaçõesclandestinas no sistema de distribuição.

As aplicações de técnicas de Inteligência Artificial (IA), como Redes Neurais Artifi-ciais (Artificial Neural Networks - ANN) [1], Lógica Nebulosa [2], Algoritmos Genéticos(Genetic Algorithm - GA) [3] e Máquinas de Vetores de Suporte (Support Vector Ma-chines - SVM) [4, 5], para a solução de problemas possibilitam o desenvolvimento deferramentas computacionais inteligentes utilizadas para a estimação e identificaçãode perdas não-técnicas (perdas comerciais) em diversas concessionárias de energia,analisando conjuntos de dados de um determinado cliente e suas transações, sendopossível verificar se existe ocorrência de alguma operação suspeita de irregularidade.

O processamento de informação em grandes conjuntos de dados tem sido um de-safio para a comunidade de aprendizado de máquina. Apesar de SVMs terem sidopropostas para superar o problema das amostras sobrepostas de uma maneira muitoeficaz, a carga computacional para o treinamento pode ser proibitiva em aplicações

1

Page 18: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 1. INTRODUÇÃO 2

que necessitam de retreinamento constantemente. Como alternativa, um esforço con-siderável tem sido dedicado a desenvolver técnicas de seleção de características, afim de acelerar o processo de classificação e também para aumentar a sua taxa deacerto (precisão).

Apesar da grande atenção e do uso maciço de técnicas de aprendizado de má-quina para identificação de perdas não-técnicas nos sistemas de distribuição de ener-gia [6–8], o problema de selecionar as características mais representativas não temsido muito abordado no contexto de perdas comerciais. Sabe-se que apenas Nizar etal. [9] propuseram um estudo mais aprofundado para selecionar um subconjunto deamostras a fim de tornar a classificação mais precisa. Nesse sentido, acredita-se tam-bém que identificar as características que melhor descrevem possíveis consumidorescom irregularidades é tão importante quanto reconhecê-los.

Dado que uma busca exaustiva de características ótimas em um alto espaço di-mensional é impraticável, vários autores têm abordado a seleção de característicascomo um problema de otimização, em que soluções ótimas são frequentemente ob-servadas. Técnicas evolutivas têm objetivado deixar clara a importância da concepçãode algoritmos baseados na dinâmica social e do comportamento coletivo, sendo degrande interesse no contexto da seleção de características. A facilidade de implemen-tação e a convergência rápida em algumas aplicações têm atraído muita atenção paraestas abordagens, que cobrem uma vasta gama de fenômenos naturais para modelarproblemas de otimização, como um bando de pássaros voando em conjunto em buscade comida na Otimização por Enxames de Partículas (Particle Swarm Optimization -PSO) [10], a evolução natural em GA [3], improvisação musical em Busca Harmô-nica (Harmony Search - HS) [11], e caminhos ótimos em Otimização de Colônia deFormigas (Ant Colony Optimization - ACO) [12], entre outros.

1.2 Objetivos

O trabalho desenvolvido nesta tese de doutorado apresenta o contexto de perdasnão-técnicas ou perdas comerciais no Brasil, bem como a importância das diferentesmaneiras de combatê-las, de modo a incentivar o desenvolvimento de procedimen-tos que possam auxiliar o aspecto financeiro das concessionárias de energia elétricaatravés da recuperação de receita.

Embora avanços nesta área possam ser constatados nos últimos 10 anos, prin-cipalmente com as técnicas de medição de energia elétrica, torna-se cada vez maisnecessária a pesquisa de métodos alternativos, levando-se em consideração diver-sos aspectos, que explorem arquiteturas de processamento inerentemente paralelas,adaptativas e flexíveis, como os modelos das técnicas computacionais inteligentes.

Este trabalho é voltado ao desenvolvimento de técnicas computacionais, por meiode IA, e possui como linha mestra estabelecer uma metodologia para classificar e

Page 19: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 1. INTRODUÇÃO 3

selecionar características dos padrões de comportamento de potenciais clientes comirregularidades na medição de energia elétrica em sistemas de distribuição, através deinformações advindas de um banco de dados disponibilizado por empresas de energiae pela agência reguladora (Agência Nacional de Energia Elétrica - ANEEL) e, destamaneira, esclarecer a importância de selecionar boas características no contexto daidentificação de perdas não-técnicas. Logo, este problema é focado analisando diver-sas técnicas evolutivas baseadas na seleção de características, utilizando principal-mente a técnica Floresta de Caminhos Ótimos (Optimum-Path Forest - OPF) [13, 14]para classificar os perfis de consumidores.

1.3 Contribuições

As contribuições deste trabalho para incentivar a tarefa de identificação de perdasnão-técnicas são motivadas pelo aumento das taxas de acerto para o reconhecimentode padrões e a caracterização do perfil de consumidores com irregularidades, ou seja,descobrir quais são as características que realmente precisam ser consideradas a fimde identificar possíveis perdas comerciais nos sistemas de distribuição de energia,auxiliando no trabalho de recuperação de receita das concessionárias de energia elé-trica. Enfatiza-se nesta tese, o desenvolvimento de algoritmos híbridos baseados emtécnicas evolutivas a fim de realizar a seleção de características no âmbito da carac-terização de perdas não-técnicas, comparando as suas taxas de acerto e verificandoas características selecionadas. Todos os algoritmos são fornecidos para mostrar astécnicas abordadas neste trabalho.

1.4 Organização do Trabalho

Este trabalho está organizado da seguinte forma:

• O Capítulo 2 demonstra os conceitos de perdas em sistemas de energia;

• O Capítulo 3 resume os principais estudos (estado da arte) nacionais e interna-cionais relacionados ao contexto de perdas comerciais;

• O Capítulo 4 aborda as técnicas de inteligência artificial para classificação depadrões;

• O Capítulo 5 descreve as técnicas evolutivas para otimização (seleção de carac-terísticas) desenvolvidas;

• O Capítulo 6 apresenta as bases de dados utilizadas e os procedimentos meto-dológicos para execução do trabalho;

• O Capítulo 7 discute os resultados experimentais;

Page 20: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 1. INTRODUÇÃO 4

• O Capítulo 8 faz um levantamento sobre a viabilidade econômica no contexto emquestão e, finalmente,

• O Capítulo 9 expõe as conclusões obtidas neste trabalho.

Page 21: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

Capítulo 2

Perdas Não-Técnicas ou Perdas Comerciais

2.1 Introdução

As privatizações no setor de energia elétrica, a partir de 1995, determinando ofim do monopólio estatal, introduziram um ambiente competitivo no cenário nacional,forçando as empresas transmissoras e distribuidoras de energia elétrica a procurarmeios para reduzir as perdas de receita. Segundo o Ministério de Minas e Energia e aEmpresa de Pesquisa Energética (MME/EPE) [15], as perdas de energia no SistemaElétrico Nacional (SEN) reduziram da ordem de 18,1% em 2010 para 17,5% no finalde 2011. Logo, busca-se maximizar a energia disponível para comercialização parauma melhor gestão com relação a estas perdas, alcançando, assim, produtividade,eficiência e rentabilidade [16].

A energia elétrica é um bem derivado da exploração dos recursos da natureza,portanto, o seu uso racional deve ser incentivado, sob pena de transmitir para as gera-ções futuras problemas sociais maiores do que a sua capacidade de solução. Quandose fala em racionalização do uso de um recurso energético, existe como consequênciadireta o adiamento de investimentos e, principalmente, a redução de impactos ambi-entais associados aos novos empreendimentos.

Nesse sentido, é obrigação das empresas do setor elétrico em conjunto com a so-ciedade manter o controle das perdas de energia e racionalizar o uso da energia elé-trica, principalmente durante os períodos de seca, quando os reservatórios das usinashidrelétricas estão baixos devido a falta de chuvas. Durante a estiagem, a geração deenergia elétrica é prejudicada, levando ao aumento do valor da tarifa de energia, poisé preciso aumentar a sua produção através da inserção de usinas térmicas no sistemaelétrico, que possuem um custo maior para gerar energia elétrica.

As empresas têm por direito uma gestão ativa, exemplo disso são seus investimen-tos que possuem como principal objetivo uma melhora significativa do seu desempe-nho econômico-financeiro e técnico-operacional [17]. As perdas de energia elétricasão constituídas pela diferença entre a energia gerada e/ou comprada por uma em-presa de energia elétrica e a energia efetivamente faturada por ela (Equação (2.1)).

5

Page 22: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 2. PERDAS NÃO-TÉCNICAS OU PERDAS COMERCIAIS 6

Tais perdas podem ser divididas em perdas técnicas e perdas comerciais, conforme édetalhado a seguir.

Perdas Totais = Energia Gerada ou Comprada - Energia Faturada. (2.1)

Perdas Técnicas

As perdas técnicas são as energias perdidas no transporte, na transformação enos equipamentos de medição, portanto inerentes ao processo, isto é, um custo ope-racional esperado pela concessionária. Essas perdas localizam-se tanto nos sistemasde geração, de transmissão, como também de distribuição de energia e ocorrem noscomponentes agregados ao sistema, tais como: condutores, equipamentos, conexões,transformadores, capacitores, reguladores de tensão, para-raios, e outros [18].

As perdas técnicas podem ser definidas e determinadas por meio de simulações,medições e avaliações do sistema elétrico. Algumas metodologias abordam o tema,definindo mecanismos para a sua mensuração e controle. A redução de tais perdasdepende, fundamentalmente, da tecnologia em utilização, da qualidade dos serviçosde manutenção, da ampliação do sistema elétrico em concordância com a evoluçãodo mercado consumidor e do modo de operação dos sistemas, onde alguns pontoschave de controle são: os níveis de carregamento dos condutores e transformadores,as demandas de energia reativa, os perfis da tensão, entre outros [16]. Este trabalhonão foca o contexto de perdas técnicas, mas é possível obter maiores detalhes sobreelas, bem como os métodos de seus cálculos, em [19,20].

Perdas Não-Técnicas ou Perdas Comerciais

As perdas comerciais, o foco desta pesquisa, são aquelas associadas à comerci-alização da energia fornecida ao usuário. Existe uma parcela de energia que é pro-duzida, transportada e fornecida; no entanto, não é faturada, propiciando uma perdadireta no faturamento [21]. Em geral, elas podem ser estimadas pela Equação (2.2),sendo classificadas em administrativas e de intervenção ilícita.

Perdas Comerciais = Perdas Totais - Perdas Técnicas. (2.2)

As perdas comerciais de natureza administrativa possuem como causas:

• Sistema de medição incompleto, obsoleto ou sem calibração;

• Cadastro de consumidores ineficiente;

• Erro na leitura registrada pelo medidor ou no processo de informação dessaleitura; e

• Erro no processo de faturamento.

Page 23: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 2. PERDAS NÃO-TÉCNICAS OU PERDAS COMERCIAIS 7

As intervenções ilícitas correspondem ao montante de energia não faturado, e es-tão relacionadas às intervenções que não são autorizadas pela concessionária, sendorealizadas por usuários ilícitos, com a finalidade de alterar o registro de energia elétricaou o seu desvio [22].

As ligações clandestinas de energia elétrica são motivos de preocupação cons-tante, tanto para as concessionárias de energia elétrica, como para as agências regu-ladoras. Neste contexto, os diversos tipos de fraudes podem afetar o poder público,que não recolhe os tributos e taxas de iluminação pública, e os consumidores em ge-ral, que pagam pelo prejuízo rateado e deixam de receber benefícios sociais de obrasque seriam realizadas pelo poder público. Outro enfoque também muito importante éque a minimização das perdas provocadas por estas fraudes representa o aumentode investimentos na qualidade do produto, na manutenção do patrimônio da conces-são e, principalmente, na possibilidade de expansão do sistema elétrico com menorcusto [21].

A necessidade de se combater as perdas comerciais se destaca pelo fato de quequanto maior elas são, menor é o faturamento e o lucro para a concessionária deenergia e menor é o investimento de expansão para atender a demanda, pois as con-cessionárias de energia precisam cumprir todas as metas estabelecidas pela ANEEL.

2.2 Perdas Não-Técnicas no Cenário Brasileiro e Mundial

O problema das perdas comerciais não é apenas brasileiro, ou de países emer-gentes, e sim mundial, mesmo que em menores proporções. Alguns especialistas noassunto costumam correlacionar as perdas comerciais com o desenvolvimento de umpaís, incluindo aspectos de educação, distribuição de renda, violência, entre outros.

Em países desenvolvidos, onde os índices de perdas comerciais são menores,predominam os programas de conscientização e de denúncia para se combater essasperdas, ao contrário do que acontece em países menos desenvolvidos, onde a práticade se conscientizar e denunciar é de difícil implementação. Na Tabela 2.1 são apre-sentados os índices das perdas não-técnicas de distribuidoras de energia em diversospaíses durante o ano de 2007 [23].

Estima-se que concessionárias de todo o mundo percam US$ 20 bilhões todo anopor causa das perdas comerciais. Na Índia, onde o índice de perdas não-técnicasentre as companhias de energia é por volta de 20% a 40%, perde-se por volta deUS$ 4,5 bilhões todo ano, sendo que 10% da energia recuperada pode conservar 83mil gigawatts-hora (GWh) de energia anualmente [23, 24]. Nos Estados Unidos, asperdas comerciais anuais são estimadas em US$ 6 bilhões e, no Canadá, em US$100 milhões em apenas uma distribuidora [25].

No Brasil, segundo a ANEEL [26], o prejuízo com perdas não-técnicas (consumoirregular) de energia elétrica atingiu o patamar de R$ 8,1 bilhões ao ano, conside-

Page 24: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 2. PERDAS NÃO-TÉCNICAS OU PERDAS COMERCIAIS 8

Tabela 2.1: Índice de Perdas Não-Técnicas de Distribuidoras de Energia em Diversos PaísesPaís Perdas Não-TécnicasÍndia 20,0% a 40,0%

Filipinas 3,5%Jamaica 13,2%China 10,0%Rússia 10,0%Turquia 6,0% a 64,0%

Tailândia 0,3%África do Sul 10,0%Venezuela 12,7%

Reino Unido 0,2% a 1,0%Austrália 0,2%

Estados Unidos 4%Nova Zelândia 0,3% a 1,0%

rando as 61 das 63 distribuidoras que passaram pelo 2o ciclo de revisões tarifáriasno período de 2007 a 2010. Em energia, o valor corresponde a mais de 27 mil GWhe equivale a aproximadamente 8% do consumo do mercado cativo elétrico brasileiro.O mercado cativo é formado pelos consumidores que só podem comprar energia daconcessionária de distribuição responsável pela rede à qual estão conectados. Essemontante seria suficiente, por exemplo, para abastecer anualmente os 774 municípiosatendidos pela Companhia Energética de Minas Gerais (CEMIG) e as 217 cidadescom fornecimento da Companhia Energética do Maranhão (CEMAR).

Lembrando que se enquadram em perdas não-técnicas os erros de medição, asdeficiências no processo de faturamento, a falta de medidor em unidades consumido-ras, as fraudes e os furtos de energia entre outros fatores. A fraude é um ato cometidopor consumidor que viola o sistema de medição para obter um registro de consumomenor que seu gasto real, enquanto o furto é praticado por quem não é consumidor ese liga clandestinamente à rede para consumir energia.

Na Tabela 2.2 [26] são apresentados os índices de perdas não-técnicas; nota-seque a região com maior índice de consumo irregular é o Norte, com 20% da ener-gia distribuída, seguida pela região Sudeste, com 10%, e do Nordeste, com 9%. NoCentro-Oeste, o percentual é de 5%, e no Sul, de 3%. Nota-se que as maiores perdasno cenário brasileiro atual ocorrem na região Norte, onde a implementação de proce-dimentos contra as perdas técnicas e comerciais não são fáceis de executar, devidoao difícil acesso e a grande extensão territorial que a concessionária de energia atua.As menores perdas ocorrem na região Sul, um panorama oposto do que acontece naregião Norte.

Nas regiões Sudeste e Nordeste, algumas empresas sofrem mais com os desviose furtos de energia motivados pelo grande número de favelas presentes em estados

Page 25: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 2. PERDAS NÃO-TÉCNICAS OU PERDAS COMERCIAIS 9

Tabela 2.2: Índice de Perdas Não-Técnicas por Região (Fonte: ANEEL-2011)Posição Região Perdas Não-Técnicas (%)

1o Norte 20%2o Sudeste 10%3o Nordeste 9%4o Centro-Oeste 5%5o Sul 3%

como o Rio de Janeiro, São Paulo, Bahia e Pernambuco. Já nas regiões Centro-Oestee Sul são mais visadas as fraudes na unidade de medição do próprio consumidor. Agrande quantidade de ligações clandestinas existentes no Brasil e os números comrelação à quantidade de perdas comerciais dão uma ideia da magnitude do problemae do seu grau de dificuldade para equacionamento [22].

De acordo com o que é mostrado na Tabela 2.3 [26], onde é apresentada a listacom as 15 distribuidoras com registros das maiores perdas não-técnicas, a CentraisElétricas do Pará (CELPA) lidera o ranking de perdas não-técnicas, com 24,4% daenergia distribuída. Em segundo lugar, vem a LIGHT, no Rio de Janeiro, onde essetipo de perda chega a 24,2% da energia distribuída. A terceira posição é ocupada pelaCERON (RO), com 22%. Os índices abaixo de 10% consideram o percentual regu-latório permitido pela ANEEL para fins tarifários. Segundo [23], em 2007 os índicesestavam entre 0,5% e 25,0%.

Tabela 2.3: Índice de Perdas Não-Técnicas por Distribuidora (Fonte: ANEEL-2011)Posição Distribuidora Perdas Não-Técnicas (%)

1o CELPA 24,4%2o LIGHT 24,2%3o CERON 22,0%4o CEMAR 17,8%5o AMPLA 17,1%6o CEAL 17,0%7o AMAZONAS ENERGIA 16,8%8o ELETROACRE 15,9%9o CEPISA 15,8%

10o ENERGISA PARAÍBA 11,2%11o ELETROPAULO 10,8%12o CEEE 10,5%13o BANDEIRANTE 10,1%14o ESCELSA 10,0%15o BOA VISTA 10,0%

Distribuidoras de pequeno porte registram o menor índice de consumo irregular.Em algumas delas, como a Força e Luz Coronel Vivida Ltda (FORCEL), no Paraná,

Page 26: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 2. PERDAS NÃO-TÉCNICAS OU PERDAS COMERCIAIS 10

a Empresa Força e Luz de Urussanga Ltda, em Santa Catarina, e a Hidrelétrica Pa-nambi S/A (HIDROPAN) no Rio Grande do Sul, não há perda não-técnica de energiaconsiderável [26].

As perdas não-técnicas impactam a tarifa, pois esse prejuízo acaba sendo rate-ado entre os consumidores legalmente cadastrados na distribuidora, no momento docálculo tarifário. Numa área de concessão como a da Light Serviços de EletricidadeS/A, por exemplo, a redução tarifária poderia ser de 18% se não houvesse consumoirregular [26].

Segundo a Associação Brasileira de Distribuidores de Energia Elétrica (ABRA-DEE), o percentual de perdas não-técnicas para 2012 em relação a energia injetadano sistema brasileiro foi de 5,91% (Figura 2.1), levando ao estado do Amazonas comoo recordista em ligações clandestinas.

Figura 2.1: Percentual de perdas em relação à energia injetada no sistema brasileiro. Extraídode [27].

2.3 Fraudes e Furtos de Energia

A fraude e o furto de energia podem ser definidos como atos conscientes e demá-fé de uma pessoa contra a distribuidora para eliminar ou reduzir o faturamento daenergia. Normalmente, o furto acontece quando uma unidade consumidora se ligadiretamente à rede da distribuidora, sem o consentimento da concessionária, ou seja,são realizadas ligações irregulares ou clandestinas, popularmente conhecidas como“gatos” e, geralmente, concentradas principalmente em áreas invadidas ou em favelas.

A fraude acontece quando o medidor de energia é adulterado, ou quando é feito

Page 27: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 2. PERDAS NÃO-TÉCNICAS OU PERDAS COMERCIAIS 11

um desvio no ramal de entrada antes do medidor. Logo, o consumidor que tem umaumento de carga sem o conhecimento da concessionária pode cometer fraude paraevitar o aumento na conta de energia, em muitos casos de modo sofisticado, atravésde circuitos clandestinos.

Outra fraude muito comum ocorre quando a energia da unidade consumidora re-gular é cortada pela concessionária, devido, por exemplo, à falta de pagamento, e oconsumidor faz a religação direta à rede por conta própria. Assim, pode-se percebera correlação entre as fraudes e os furtos de energia. Segundo a ANEEL, essas irre-gularidades fazem parte de um segmento das perdas comerciais caracterizado comoperdas por ação do consumidor. A seguir estão relacionados os tipos de irregularida-des mais encontrados nos processos analisados pela ANEEL [28]:

• Ligação direta à rede secundária;

• Desvio no ramal de entrada (antes do medidor);

• Elemento móvel do medidor bloqueado por meio de perfuração da tampa devidro ou base e introdução de objetos ou material estranho;

• Ponteiros do medidor deslocados;

• Ligações do medidor invertidas;

• Terminal de prova aberto;

• Bobina de potencial interrompida;

• Engrenagem do medidor substituída;

• Dentes da engrenagem desgastados;

• Elemento móvel empenado;

• Ponteiro da demanda retrocedido;

• Chave de aferição aberta;

• Lâmina da chave de aferição isolada;

• Condutores de ligação entre a chave de aferição e medidor isolados;

• Condutores de ligação entre a chave de aferição e medidor seccionados;

• Curto circuito nos secundários dos transformadores de corrente;

• Alimentação do motor de temporização de demanda interrompida;

Page 28: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 2. PERDAS NÃO-TÉCNICAS OU PERDAS COMERCIAIS 12

• Sequência de fases invertida (reativo); e

• Curto-circuito na entrada ou saída do medidor.

Além de prejuízos financeiros, o furto e fraude de energia oferecem riscos e danosà sociedade. As ligações clandestinas costumam sobrecarregar os transformadores,que são dimensionados para atender uma determinada carga. A sobrecarga podeocasionar acidentes na rede elétrica, como explosões e incêndios que, além de riscosfísicos à população, causam interrupções no fornecimento de várias unidades consu-midoras e, consequentemente, interferem negativamente na qualidade da energia [26].

O meio ambiente também pode ser prejudicado devido ao uso ineficiente de ener-gia, isto é, ao consumo desnecessário diante do aumento das perdas comerciais, tra-zendo maior necessidade de geração de energia, o que implica uma maior quantidadede hidrelétricas e termoelétricas. Logo, a redução dessas perdas adiaria a construçãode novas usinas, reduzindo os impactos ambientais e as emissões de gases do efeitoestufa.

A Resolução no. 414/2010 [29], com os direitos e deveres do consumidor de ener-gia elétrica, disciplina os procedimentos a serem adotados pela distribuidora para ca-racterização de irregularidades de consumo de energia e a recuperação da receita. Ofurto e fraude de energia elétrica são considerados como crime. O responsável ficasujeito a penalidades que vão desde o pagamento de multas até a detenção por atéquatro anos.

2.4 Inadimplência

Estimou-se que, em 2002, a inadimplência no Brasil tenha sido de R$ 3,15 bilhõesde reais e, segundo dados da ANEEL, em 2005, o total de perdas era por volta de3,7 bilhões de reais, sendo 1,2 bilhões de reais procedentes de perdas comerciais,deixando de arrecadar tributos, o que aumentam ainda mais os custos oriundos dasperdas de energia [18]. Existe uma complementaridade entre perdas de energia einadimplência, pois os dois fenômenos estão muito ligados e a redução de um podelevar ao incremento do outro, por isso é importante estar atento com relação a estesproblemas [18].

Logo, a inadimplência é uma grande preocupação das concessionárias de energia,que pode ser definida como a diferença entre o valor total faturado e o valor totalrecebido no mês pelas distribuidoras de energia, ou seja, relação do montante dascontas não-pagas do mês com o total de contas faturadas.

A inadimplência vem crescendo nas últimas décadas do Brasil, pois o aumento dastarifas de energia, a elevação do desemprego e a queda na renda contribuem com oatraso das faturas de energia elétrica pelos consumidores. Segundo a ABRADEE, ovolume de atrasos superior a 10 dias para o pagamento das faturas cresceu 295%

Page 29: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 2. PERDAS NÃO-TÉCNICAS OU PERDAS COMERCIAIS 13

desde 1991 até 2004 [18]. A ANEEL divulgou em 2007 um aumento das tarifas deenergia de 327% entre abril de 1995 e abril de 2007, fato que estimula ainda mais aprática da inadimplência [18].

Em 2004, a ABRADEE publicou que a maior ocorrência das inadimplências acon-tece por parte de consumidores residenciais, comercias e industriais de pequenoporte, seguidos por consumidores comerciais e industriais de médio e grande portee pelo Poder Público [18]. A inadimplência pode ser início de um ciclo (Figura 2.2)em que o consumidor que não consegue pagar sua conta tem o seu fornecimento deenergia suspenso, podendo vir a furtar energia, ou a fim de reduzir o custo de suaconta para facilitar o pagamento.

Figura 2.2: Ciclo com relação à inadimplência.

Atualmente, acredita-se que a inadimplência e os problemas de perdas de energiano setor de distribuição de energia estão associados não apenas com a renda dapopulação, mas também com a desigualdade social, localização do domicílio, o tipode urbanização, questões sociais e até culturais.

2.4.1 Nova Modalidade: Tarifa Branca

Em 2011, a ANEEL aprovou uma alteração da estrutura tarifária aplicada ao setorde distribuição de energia através da aplicação de tarifas diferenciadas por horário deconsumo, oferecendo tarifas mais baratas nos períodos em que o sistema é menosutilizado pelos consumidores [30].

A proposta da tarifa branca é estimular o consumo em horários nos quais a tarifa émais barata, diminuindo o valor da fatura no fim do mês e a necessidade de expansãoda rede da distribuidora para atendimento do horário de pico. Assim, busca-se tambémuma redução da inadimplência e o adiamento de grandes investimentos do sistemaelétrico.

A modalidade tarifária branca oferecerá três diferentes níveis para a tarifa de ener-gia, de acordo com os horários de consumo. De segunda a sexta-feira, uma tarifa maisbaixa será empregada na maioria das horas do dia, outra mais alta no horário em queo consumo de energia atinge o pico máximo, que acontece no início da noite, e uma

Page 30: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 2. PERDAS NÃO-TÉCNICAS OU PERDAS COMERCIAIS 14

tarifa intermediária para ser cobrada entre esses dois horários. Nos finais de semanae feriados, a tarifa mais baixa será empregada para todas as horas do dia.

Os consumidores residenciais e comerciais poderão aderir a um novo modelo decobrança de energia elétrica a partir de 2014, e caso o consumidor reduza a zeroo consumo no horário de pico, a economia poderá chegar a 45%. Os interessadosdeverão fazer o pedido às distribuidoras de energia elétrica, sendo que para a novatarifa, será necessário trocar os antigos relógios de captação por outros mais moder-nos, e, segundo a ANEEL, o valor do novo equipamento poderá ser repassado aoconsumidor nas próximas faturas [30]. Porém, a tarifa branca será opcional, e casoo consumidor não pretenda modificar seus hábitos de consumo, a tarifa convencionalcontinuará disponível.

Outra mudança, válida a partir de janeiro de 2014, é a criação das bandeiras tari-fárias verde, amarela e vermelha, que funcionarão como um semáforo de trânsito e serefletirão em diferença de tarifa para o consumidor. A bandeira verde significa custosbaixos para gerar a energia. A bandeira amarela indicará um sinal de atenção, pois oscustos de geração estão aumentando. Por sua vez, a bandeira vermelha indicará quea situação anterior está se agravando e a oferta de energia para atender a demandados consumidores ocorre com maiores custos de geração como, por exemplo, o acio-namento de grande quantidade de termelétricas para gerar energia, que é uma fontemais cara do que as usinas hidrelétricas. O público alvo será todos os consumidoresdo Sistema Interligado Nacional (SIN) de alta e baixa tensão [30].

2.5 Procedimentos de Combate Contra as Perdas Comerciais

O problema da detecção de perdas comerciais em sistemas de distribuição temsido determinante. Roubo e adulteração de medidores de energia, com a finalidade demodificar a medição do consumo de energia, são as principais causas que conduzemas perdas não-técnicas em concessionárias de energia. É uma tarefa difícil de calcularou medir a quantidade de perdas e, na maior parte dos casos, é quase impossívelsaber onde eles ocorrem.

Com o objetivo de reduzir os valores das perdas comerciais, as empresas de ener-gia elétrica atuam, geralmente em:

• Programas de inspeção: consiste na verificação da integridade do sistema demedição, detectando falhas nos equipamentos, fraudes e desvios de energia,erros de ligação e outros problemas que possam comprometer a medição deenergia elétrica;

• Substituição de medidores: consiste na avaliação de lotes de medidores atravésde amostragem no campo, testes em laboratório e análise dos medidores retira-dos em campo. Além disso, a substituição de medidores com vida útil vencida

Page 31: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 2. PERDAS NÃO-TÉCNICAS OU PERDAS COMERCIAIS 15

ou com possíveis falhas técnicas;

• Regularização de focos possíveis de ligações clandestinas, tais como favelas,através de um programa de caráter regulatório, reduzindo consequentemente asperdas comerciais;

• Implementação de políticas comerciais: consiste em atendimentos para a co-munidade sobre explicações, negociações e treinamentos sobre o consumo deenergia elétrica; e

• Ações de eficiência energética com foco na diminuição das contas elétricas euso efetivo da energia, servindo de incentivo aos consumidores para que nãocometam as fraudes.

Uma das formas mais tradicionais de combate às perdas comerciais é a realizaçãode inspeções periódicas nos consumidores, o que não é muito vantajoso, pois elascostumam ter um custo muito alto para a concessionária de energia. Entretanto, aseleção de quais consumidores que devem ser inspecionados é uma tarefa árduapara os especialistas no assunto. As distribuidoras geralmente empregam e investembastante em um conjunto de metodologias heurísticas para identificar os clientes debaixa tensão suspeitos de estarem cometendo algum tipo de irregularidade, atravésdo uso da inteligência artificial. Todavia, a taxa média de acertos dessas metodologiasainda é bastante inferior ao desejado, ou seja, a maioria dos processos adotados nãoé eficaz o bastante.

2.5.1 Projetos de Pesquisa e Desenvolvimento Regulados pela ANEEL

A ANEEL, com a criação da Lei no 9.991 de 24 de julho de 2000, estabeleceque as concessionárias de energia elétrica devem aplicar um mínimo percentual desua receita operacional líquida (no mínimo 0,75% para as distribuidoras e 1% para asgeradoras e transmissoras) em projetos de Pesquisa e Desenvolvimento Técnológicodo Setor de Energia Elétrica (P&D) visando a busca de inovações para fazer frente aosdesafios tecnológicos e de mercado das empresas de energia elétrica. A pesquisaempresarial no setor de energia elétrica deve ter metas e resultados previstos bemdefinidos, porque é diferente da pesquisa acadêmica pura, que se caracteriza pelaliberdade de investigação [31].

Um dos temas de interesse para investimentos em projetos de P&D é “Medição,Faturamento e Combate a Perdas Comerciais”, justamente o principal contexto destatese. De acordo com a Revista Pesquisa e Desenvolvimento da ANEEL de 2011 [32],63 projetos entre 2008 e 2010 foram cadastrados neste tema, com investimentos emmais de R$ 78 milhões de reais, o que é uma quantia bastante considerável.

Apesar de existirem inúmeros projetos de P&D, nem todos são divulgados commaiores detalhes, porém alguns deles são detalhados através de projetos publicados

Page 32: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 2. PERDAS NÃO-TÉCNICAS OU PERDAS COMERCIAIS 16

pela Revista Pesquisa e Desenvolvimento da ANEEL, onde são apresentados o de-senvolvimento de diversos artifícios para o combate a perdas comerciais de muitasconcessionárias em conjunto com instituições de pesquisa.

Muitos trabalhos relacionados ao contexto de perdas não-técnicas são derivadosdesses projetos de pesquisa e desenvolvimento desenvolvidos pelas concessionáriasde energia para atingir metas elaboradas pela ANEEL. Alguns dos projetos divulgadosque se destacaram são apresentados no Capítulo 3.

2.5.2 Smart Grid e sua Relação com Perdas Não-Técnicas

O problema das perdas não-técnicas poderá ser minimizado num futuro próximocom a implantação da medição inteligente (smart metering). Mais informações elé-tricas, que possibilitam conhecer melhor o comportamento dos consumidores, alémdo consumo em tempo real, são coletadas através de sensores nos medidores deenergia e transmitidas para as concessionárias com determinada periodicidade, o queé um avanço para a medição, mas sem inserir o conceito de aprendizado ou o dereconhecimento de padrões de fraude, para uma tomada de decisões de forma autô-noma. Assim sendo, o medidor inteligente (smart meter ) não impede a fraude, apenasfornece as informações mais rapidamente [33].

Cabe à inteligência computacional determinar quais indícios tem maior probabili-dade de representar uma fraude, ou irregularidade, e qual o seu grau de importân-cia, mantendo um critério de priorização, seguida de uma inspeção de campo. Logo,(smart meters) são extremamente úteis na melhora do desempenho das redes deenergia e na estratégia de redução de perdas comerciais [25].

Paralelamente aos smart meters, tem-se o conceito de Rede Elétrica Inteligente(REI) ou Smart Grid, que possibilita a integração dos equipamentos da rede elétricae de redes de comunicação de dados em um sistema gerenciado e automatizado quepode abranger toda a área de uma concessionária, de modo que uma rede possapermitir [28,33]:

• Serviços inteligentes integrados com os consumidores;

• Utilização de medidores inteligentes e aplicação de tarifas diferenciadas por ho-rário/sazonalidade;

• Melhorias na qualidade de energia e redução de perdas técnicas e comerciais;

• Gerenciamento, monitoração e otimização do sistema elétrico em tempo real;

• Vigilância e segurança;

• Integração de serviços públicos; e

• Internet banda larga.

Page 33: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 2. PERDAS NÃO-TÉCNICAS OU PERDAS COMERCIAIS 17

O conceito do Smart Grid está ganhando volume a partir do crescimento da de-manda de leitura automática de medidores. Além do objetivo de reduzir as fraudes, osfurtos de energia e medições com falhas, várias concessionárias de energia elétricatem se preocupado em caracterizar melhor o perfil dos consumidores com irregulari-dades, bem como identificar corretamente as ligações clandestinas realizadas [33].

A minimização das perdas pode contribuir para aumentar os investimentos em pro-gramas de qualidade de energia, assim como pode permitir uma redução do seu preçopara o consumidor. Mas, para que tudo isso aconteça, é necessário substituir os me-didores de energia analógicos para medidores de energia digitais, o que pode levarmuitos anos para se materializar.

O Smart Grid é o futuro das redes de energia. No Brasil, existem alguns projetos-piloto em São Paulo, Rio de Janeiro, Minas Gerais, Amazonas, Pernambuco, Cearáe no Paraná; logo, busca-se acompanhar esta tendência motivado pelos benefíciosquanto à melhoria nos serviços prestados, como a resolução de problemas mais rapi-damente através da mobilização de técnicos para a realização de reparos nas redesde energia, aumento da confiabilidade do sistema e da qualidade no fornecimento deenergia. Além disso, almeja-se a redução das perdas comerciais, do desperdício deenergia e da inadimplência.

2.5.3 Sistema de Pagamento Pré-Pago

A implantação do Smart Grid, a partir da implementação dos smart meters, tornao sistema mais flexível para optar por um plano de pagamento de energia elétrica,fazendo surgir uma nova modalidade através do sistema pré-pago, semelhante com opré-pagamento nos sistemas de telecomunicações, além do convencional plano pós-pago, onde se paga o que se consome, que já tem regulamentação consolidada. Aocontrário, o sistema de pré-pagamento não possui uma regulamentação ainda, porémestá em andamento, já que este tipo de sistema não é oficial no Brasil [30].

A ANEEL, com a implementação desse novo sistema, pretende estabelecer o pla-nejamento dos consumidores em relação ao consumo de energia elétrica. Contudoa sua adesão é opcional, tanto por parte das concessionárias quanto por parte dosusuários.

Com a adesão do serviço pré-pago, as distribuidoras estão em busca:

• Do fim das ligações clandestinas;

• Da redução da inadimplência;

• Da economia de mão de obra na medição;

• Da queda nos gastos com o envio de faturas; e

Page 34: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 2. PERDAS NÃO-TÉCNICAS OU PERDAS COMERCIAIS 18

• Do controle efetivo do programa de gratuidade de energia para a população ca-rente, permitindo a ampliação do “Programa Luz Para Todos”.

Para o consumidor, essa modalidade permite uma maior flexibilidade de comprado serviço e um melhor gerenciamento do consumo de energia elétrica através dapossibilidade de monitoramento do consumo em tempo real. Além disso, podem-seter outros benefícios e facilidades, como por exemplo a não obrigatoriedade do paga-mento da assinatura mensal básica, já que se paga antecipadamente. Esse princípiopode ser aplicado na locação de um imóvel, ou de casas de veraneio, onde os crédi-tos podem ser comprados pelos proprietários ou pelos locatários temporários somentedurante período de sua utilização, evitando ser responsável pelo pagamento ou pelainadimplência, já que o serviço será imediatamente interrompido ao final do últimocrédito adquirido [30].

O sistema de medição e controle, através dos smart meters, deve informar quandoos créditos estiverem próximos a se esgotar por meio de avisos sonoros e luminosos,permitindo com que o usuário recarregue os créditos afim de evitar a interrupção dofornecimento de energia elétrica.

Este sistema já é utilizado em diversos países, como Reino Unido, Argentina, Áfricado Sul e Colômbia. No Brasil, existem projetos-piloto em São Paulo, Rio de Janeiro eem algumas regiões do Amazonas. Porém, são necessários altos investimentos paraa implantação do sistema de pré-pagamento e cuidados com a regulamentação destetipo de serviço, de maneira que ninguém saia prejudicado.

2.6 Considerações Finais

Neste capítulo foram apresentados alguns conceitos importantes para o compreen-são da importância do tema da tese. São definidos os conceitos de perdas comerciaisou perdas não-técnicas, bem como dos métodos de combate a essas perdas, o pro-blema da inadimplência e o uso da tarifa branca. Em [28], também é possível obtermaiores detalhes com relação a este tema, pois complementa muitas informaçõesabordadas nesta tese. No capítulo a seguir é abordado o estado da arte no contextodas perdas não-técnicas, onde são apresentados os principais trabalhos encontradosna literatura.

Page 35: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

Capítulo 3

Estado da Arte: Perdas Não-Técnicas

Neste capítulo são apresentados estudos no contexto de perdas não-técnicas,sendo que muitos deles usam sistemas inteligentes e métodos estatísticos para clas-sificar, identificar e caracterizar os consumidores com instalações elétricas irregulares.Muitos trabalhos abordam profundamente o tema, explicitando a importância do pro-blema com relação às perdas comerciais.

3.1 Alguns Projetos Importantes de P&D Regulados pela ANEEL

Nesta seção são apresentados alguns dos projetos de P&D regulados pela ANEELque foram destaque em edições publicadas da Revista “Pesquisa e Desenvolvimento”da ANEEL no contexto de combate contra as perdas comerciais.

Em 2000, a Companhia de Eletricidade do Estado do Rio de Janeiro (CERJ), emconjunto com o Centro de Pesquisas de Energia Elétrica (CEPEL), desenvolveu umprojeto visando investigar a utilização de técnicas computacionais, conhecidas comointeligência artificial, com a finalidade de se desenvolver um programa de computadorpara melhorar o índice de acertos nas inspeções realizadas para a averiguação defraudes em consumidores. Para este projeto foi desenvolvido um sistema computacio-nal para auxiliar os especialistas na seleção das unidade consumidoras (UCs) a sereminspecionadas. Foi investigado o aumento de eficiência utilizando-se uma análise re-alizada com redes neurais artificiais treinadas com padrões de fraudes existentes naconcessionária. O sistema desenvolvido fornece ferramentas que auxiliam na exe-cução das seguintes tarefas: análise do consumo, gerenciamento das inspeções, eacompanhamento dos fraudadores [34].

No ciclo 2001/2002, a Espírito Santo Centrais Elétricas S.A. (ESCELSA), em con-junto com o Instituto de Tecnologia para o Desenvolvimento (LACTEC), desenvolveuum aparelho eletrônico para detecção de desvio de energia com a finalidade de reduziras perdas comerciais da ESCELSA entre os consumidores de baixa tensão atendidospela distribuidora. O detector é composto por duas partes: um módulo transmissor,instalado nos cabos dos postes; e um módulo receptor colocado no medidor do cli-ente. A identificação do desvio é feita por meio da comparação entre os valores de

19

Page 36: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 3. ESTADO DA ARTE: PERDAS NÃO-TÉCNICAS 20

corrente medidos pelos dois módulos. Sensores de alta exatidão medem a corrente,sendo que a comunicação entre os módulos segue o padrão tecnológico PLC (PowerLine Communication), em que se usa a própria rede como meio de transmissão de da-dos. Quando a diferença entre os valores ultrapassa 10%, o módulo receptor registraa informação, gravando data e hora da ocorrência. Os dados podem ser transporta-dos para um microcomputador por um leitor óptico portátil. A operação remota tornapossível a leitura sem a necessidade de abrir a caixa onde fica o medidor, o que evitadesligamentos no sistema [34].

No ciclo 2002/2003, outra concessionária a se preocupar com as perdas comer-ciais, foi a Companhia de Eletricidade do Estado da Bahia (COELBA) em conjuntocom a Universidade Estadual de Feira de Santana (UEFS). Juntas, elas desenvol-veram um aparelho eletrônico que permite a visualização de desvio embutido semo desligamento da unidade consumidora. O aparelho pode detectar o desvio comequipamentos elétricos desligados, possuindo sensibilidade elevada e baixa incidên-cia de alarmes falsos. A tecnologia empregada é baseada em propagação de ondasdo campo magnético, induzido ou não, gerada por ondas acústicas em eletroduto, eem propagação de calor com detecção infravermelho, que permitem a visualização dodesvio em vários casos [34].

A Ampla Energia e Serviços S.A (AMPLA), no ciclo 2003/2004, em conjunto como LACTEC, desenvolveu o lacre eletrônico motivado pelo alto índice de perdas comer-ciais. A integridade do dispositivo é analisada em campo, o que permite identificarcom rapidez se ele foi rompido, adulterado ou trocado. É possível também verificarse houve adulteração no medidor de energia elétrica, além de dificultar o acesso aoaparelho. A gravação de dados é feita por um tag de identificação por radiofrequên-cia. O lacre tem um componente que o danifica quando violado, impossibilitando aleitura dos dados. Um sistema computacional instalado em uma central de controleorganiza e avalia a identificação dos lacres e a compara com informações disponíveisno sistema da concessionária para seus pontos de instalação. A operação impedeque uns sejam trocados por outros sem prévia autorização da empresa e identifica, deimediato, os pontos onde houve fraude. Dessa maneira, o produto pode auxiliar emdois problemas: o alto número de inspeções e o furto de lacres convencionais, quepode ser rastreado [34].

Também nesse mesmo ciclo, a AMPLA, em conjunto com a Universidade FederalFluminense (UFF), desenvolveu um inibidor de furtos. O produto é colocado junto aotransformador e age como um gerador de ruídos, que distorce a tensão e “polui” aenergia a ser consumida. Próximo ao medidor de cada cliente, é instalado um filtroque elimina a distorção e torna a energia novamente adequada para o uso. A tensãomodificada impossibilita o consumo para quem furta. Sem a filtragem, geladeiras eoutros eletrodomésticos não funcionam e a insistência na ligação pode queimá-los

Page 37: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 3. ESTADO DA ARTE: PERDAS NÃO-TÉCNICAS 21

[34].Novamente, a AMPLA, em conjunto com a UFF, devido à facilidade de acesso aos

medidores atuais, possibilitando fraudes e práticas de vandalismo, desenvolveu ummedidor trifásico blindado que pode ser instalado nos ramais aéreos da rede e ter aleitura dos dados feita via radiofrequência. A localização, a blindagem e a tecnologiautilizada dificultam a atuação de fraudadores. Instalado próximo ao poste, o medidorprocessa os dados eletronicamente e transmite sinais que podem ser lidos de 20 a 30metros de distância em área livre. Na casa do cliente é colocado um visor, separadodo corpo de medição, que mostra a quantidade de energia consumida. A diferençaentre os valores medidos indica a ocorrência de fraude. O sistema traz uma série deinovações. Uma delas é que o cliente não tem mais acesso ao mecanismo de registrodo seu consumo de energia. Também não é possível apagar os valores no visor enem alterá-los, mesmo em caso de violação. Se o visor sofrer qualquer dano, a leituranão é comprometida, pois os dados continuam armazenados. Outra novidade é orevestimento do medidor, feito com uma resina que o torna mais resistente a impactose a condições climáticas adversas como chuva, ventos fortes ou altas temperaturas[34].

No ciclo 2002/2003, técnicos da Empresa Energética de Mato Grosso do Sul S/A(ENERSUL) e da Universidade Federal do Mato Grosso do Sul (UFMS) criaram umaferramenta que usa técnicas de inteligência artificial para identificar fraudes e errosde medição do consumo. O Sistema de Identificação de Fraudes e Erros de Medição(SIFEM) parte de um banco de dados e do histórico de consumo dos clientes que,a partir do processo de Knowledge Discovery in Database (KDD), consegue identifi-car comportamentos discrepantes que indicam a possibilidade de fraude. Com téc-nicas de inteligência artificial conhecidas como Conjuntos Incertos, Redes NeuraisAuto-organizáveis e Árvores de Decisão, foi possível, após a extração de amostras deunidades consumidoras, obter uma lista de clientes “suspeitos”, passíveis de fiscali-zação pela distribuidora. A utilização experimental do SIFEM apontou para taxas deacerto de 34%, consideradas significativas pela empresa. O sistema é paramétrico eos resultados são obtidos com um balanceamento entre a taxa de acerto e a quanti-dade de clientes inspecionados. Com sua implementação, torna-se possível fiscalizarmenos clientes e alcançar maior percentual de acerto. Os pesquisadores consideramque o SIFEM pode ser usado com sucesso no combate ao furto de energia pelasdistribuidoras e, como detecta anormalidades no consumo, gera ainda como subpro-duto a identificação de clientes em vias de desligamento ou unidades consumidorasdesocupadas [35].

No ciclo 2005/2006, uma maleta desenvolvida pela AMPLA, em conjunto com aUniversidade Católica de Petrópolis, se constitui em uma solução simples e eficazcontra perdas técnicas de energia causadas por medidores em pane ou por fraudes

Page 38: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 3. ESTADO DA ARTE: PERDAS NÃO-TÉCNICAS 22

cometidas por consumidores. Em vez de usar lâmpadas como carga e o relógio dofuncionário da distribuidora como cronômetro, método bem menos confiável, a Maletade Inspeção em uso pela AMPLA garante mais precisão ao trabalho. Portátil, fácil demanusear e com baixo custo, o equipamento é capaz de fazer leituras de energia ativae reativa em inspeções de medidores de baixa tensão instalados em residências e empequenos comércios e indústrias. Outra vantagem do equipamento é a inclusão deuma placa de Global Position System (GPS). Essa característica evita fraudes durantea inspeção, pois a localização exata do aparelho, bem como a hora da fiscalização,são captados pelo GPS e incluídos nos resultados do trabalho. O sucesso do projetolevou a empresa a programar a fabricação de um lote piloto para equipar o time deinspeção da companhia [35].

Para os ciclos 2005/2006 e 2007/2008, um programa que utiliza sistema de redeneural artificial (inteligência artificial) para identificar perdas comerciais e, dessa forma,ajudar a orientar e planejar ações de inspeção in loco, é o resultado do projeto de-senvolvido pela Companhia Energética de Pernambuco (CELPE) e pesquisadores daUniversidade Federal Fluminense (UFF) e Universidade Federal do Rio de Janeiro(UFRJ). Inicialmente, foram formados grupos de consumidores com característicassemelhantes de carga, ligados a um determinado transformador. Em seguida, foi rea-lizada uma Pesquisa Social de Posses e Hábitos de Consumo (PSPH), utilizada paracalcular as curvas de carga estimadas para cada agrupamento e para alimentar o pro-grama com informações. Dessa forma, a diferença entre os valores estimados pelaferramenta para cada transformador e aquele efetivamente medido resulta na perdacomercial calculada pelo sistema. De posse dessas informações, instaura-se um pro-cedimento de três etapas: tratamento de eventuais erros de cadastro, correção dessesdesvios e instalação de medidores comparativos na rede de baixa tensão onde a curvade carga corrigida for muito diferente da estimada, ou apresentar oscilações em rela-ção à curva projetada. Essas discrepâncias ocorrerão, entre outros motivos, por contade erros no processo de faturamento, furto de energia ou ligações clandestinas ouirregulares. Os pesquisadores chegaram à conclusão que o método proposto servepara indicar os transformadores que precisam ser inspecionados, o que reduz o custoelevado de verificar todos ou de se instalar medidores comparativos ao longo de todoo sistema [32].

Para tornar mais eficiente o combate às perdas comerciais de energia, pesqui-sadores da Companhia Energética do Maranhão (CEMAR) e do LACTEC, nos ciclos2006/2007 e 2007/2008, construíram um transformador de distribuição com mediçãode energia integrada. O equipamento tem o objetivo de reduzir as fraudes, por meioda medição remota do consumo mensal, diretamente no transformador. Isso possi-bilita o registro de ocorrências em tempo real e a avaliação das curvas diárias decarregamento, tensão de operação e de consumo no transformador. No protótipo de-

Page 39: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 3. ESTADO DA ARTE: PERDAS NÃO-TÉCNICAS 23

senvolvido, o medidor digital e os circuitos eletrônicos ficam instalados em uma caixametálica acoplada ao transformador, no alto do poste. Isso dificultada a realizaçãode fraudes na rede. A leitura mensal do consumo total do posto de transformaçãoé realizada remotamente, pela comunicação de curta distância, empregando-se umsmartphone, largamente utilizado pela concessionária para o registro da leitura men-sal de unidades consumidoras. Desse modo, toda a carga alimentada pelo transfor-mador de distribuição, incluindo eventuais fraudes, pode ser monitorada em temporeal pelo novo equipamento. A transmissão remota dos dados acumulados no postode transformação é feita por meio da tecnologia bluetooth e, alternativamente, pelacomunicação serial por rádio, com alcance superior a 15 metros. Os pesquisadoresinstalaram o protótipo do transformador com medição integrada no município de SãoJosé do Ribamar, região metropolitana de São Luiz, capital do Maranhão. Desde ainstalação, a leitura tem sido feita remotamente e os dados são armazenados em umcomputador portátil, que tem um aplicativo para avaliar o registro de interrupções, fa-lhas de comunicação, temperatura interna da caixa metálica, desequilíbrio de fases,tensão secundária, consumo total e médio diário do posto de transformação, entreoutros. Futuramente, os dados podem ser usados em redes integradas tipo SmartGrid [32].

Para combater o furto de energia, a Companhia Energética do Ceará (COELCE),nos ciclos 2006/2007 e 2007/2008, desenvolveu um equipamento que gera ruídos (in-terferências) na corrente e, dessa forma, impede que a energia furtada seja usadasem antes passar pelo sistema de medição do consumidor. O equipamento é um ge-rador de ruído que, quando instalado no transformador de distribuição, torna a energiaimprópria para uso até passar por um processo de filtragem que utiliza um removedorde ruídos instalado no equipamento de medição do consumidor. Após a filtragem, aenergia se torna novamente adequada ao uso. O instrumento é um aprimoramento deprojeto anteriormente realizado pelas concessionárias AMPLA e CEMAR. Na versãoanterior, o inibidor de furtos acabava por queimar equipamentos elétricos conectadosà rede sem filtragem. Além disso, uma vez acionado, o inibidor tinha que ser subs-tituído. Com o aperfeiçoamento, esses problemas foram sanados e, além disso, oequipamento ficou menor, o que facilita sua instalação nos postes. De acordo comos pesquisadores, os testes realizados em campo demonstraram a alta eficiência doequipamento em diferentes cenários. A redução das perdas, obtida com o piloto insta-lado em área urbana e na área rural irrigante, demonstraram que o inibidor de furto seconstitui em uma alternativa eficaz para o combate às perdas comerciais em circuitosde baixa tensão [32].

Page 40: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 3. ESTADO DA ARTE: PERDAS NÃO-TÉCNICAS 24

3.2 Teses e Dissertações

Diversas dissertações de mestrado e teses de doutorado abordam o contexto deidentificação de perdas não técnicas, que é um tema bastante discutido nas últimasdécadas.

Na dissertação de Faria [36], em 2012, implementou-se computacionalmente umsistema inteligente híbrido intercomunicativo específico que combina técnicas da áreade sistemas inteligentes, tais como redes neurais e lógica nebulosa para detectar asperdas comerciais. O sistema é baseado em três pilares: extração automática deconhecimento a partir da base de dados da concessionária, incorporação na meto-dologia o conhecimento e experiência de especialistas e, por último, consultas nabase de dados por características específicas de cada cliente. A metodologia utilizasimultaneamente inúmeros dados reais de entrada de natureza diversa, bem comocombina várias técnicas a fim de verificar o risco percentual de cada cliente em pos-suir alguma anomalia que implique em perda comercial. Além dos dados cadastraise do histórico de consumo mensal dos clientes comumente utilizados pelos trabalhosorientados à detecção de perdas comerciais, a metodologia proposta utilizou tambémdados adicionais tais como a lista de nomes e de atividades suspeitas. A utilização dedados adicionais possibilitou uma melhoria na detecção de unidades consumidorascom anomalias, grande parte das quais seriam possivelmente consideradas normaispelos trabalhos da literatura avaliada.

Em 2008, Penin [28] estudou o problema das perdas não-técnicas ou perdas co-merciais utilizando-se de uma abordagem multidisciplinar, que analisa a experiênciatanto de concessionárias no Brasil como no exterior. O trabalho discute as melhorespráticas para mitigação das mesmas e propõe melhorias nos processos de combate ede prevenção, e também nos procedimentos legais para recuperação de receitas, apoi-ados sobre uma cuidadosa contextualização regulatória, chamando a atenção para adiversidade sócio-econômica nacional, onde é comparado com diversos exemplos in-ternacionais. Nele se identifica os aspectos mais relevantes a serem considerados naregulação sobre o tema, discutindo procedimentos e metodologias para o equaciona-mento do montante de recursos a serem aplicados pelas companhias distribuidoraspara a adequada redução dessas perdas de energia. O autor observa que grandeparte das PNT tem origem em questões de cunho social e que o Estado pode e deveestabelecer políticas para resolver tais questões, possibilitando a universalização doacesso e subsidiando o fornecimento de energia elétrica.

O trabalho de Araújo [18] teve como objetivo aprofundar a discussão sobre as per-das e inadimplência na distribuição de energia no Brasil a partir do seu dimensiona-mento e da identificação das principais variáveis físicas, econômicas e sociais queexplicam a diferença de intensidade da ocorrência do fenômeno nas distribuidoras de

Page 41: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 3. ESTADO DA ARTE: PERDAS NÃO-TÉCNICAS 25

energia no país. Foram também empregadas análises estatísticas que possibilitassema construção de modelos explicativos para o fato. É analisado, ainda, o tratamentoda questão das perdas, do ponto de vista tarifário, técnico e comercial, conferido pelaagência reguladora do setor (ANEEL), bem como são realizados comentários sobre asações implementadas pelas empresas distribuidoras de energia no equacionamentoda problema.

Vieiralves [17] analisou a situação das perdas comerciais na região Norte, dandoênfase ao “Caso Manaus”, procurando identificar as suas causas e efeitos, tanto paraa sociedade em geral como para os empresários do setor. Mais especificamente, seabordará o estudo de caso da empresa Manaus Energia S/A, por ser a maior dossistemas isolados e por apresentar índices de perdas muito acima do admissível e damédia das concessionárias do Setor Elétrico Nacional.

Eller [22], em sua tese de doutorado, propõe um método para auxiliar no geren-ciamento de perdas comerciais de energia elétrica através da mineração de dados,destacando-se o uso das redes neurais para descobrir comportamentos suspeitos deconsumidores de energia, indicando a possibilidade de fraude ou não.

O trabalho realizado por Ortega [37] desenvolveu uma metodologia que identifica,com maior precisão, o perfil do cliente irregular (comprovada fraude no medidor, furtopor ligação clandestina ou irregularidade técnica). O sistema inteligente resultante,denominado SIIPERCOM, baseia-se em redes neurais para o agrupamento dos cli-entes com comportamentos semelhantes e para a classificação dos clientes de cadagrupo em “normais” ou “irregulares”.

Paula [38] propôs a caracterização de consumidores por suas curvas de carga,aplicando redes neurais na análise dos dados. As curvas de carga foram estabele-cidas com base nas medições de consumidores de baixa e média tensão utilizandoequipamentos de medição digitais instalados por uma concessionária. O conjunto demedições foi submetido a uma avaliação em busca de inconsistências na massa dedados através de uma etapa de limpeza e pré-processamento. Em seguida, foi rea-lizado um processo de redução da massa de dados, onde cada consumidor passa aser representado por uma única curva representativa composta pela média das curvasmedidas para este consumidor. Para realizar devidamente a comparação de padrõespara o agrupamento, as curvas dos consumidores devem ser mapeadas para umamesma escala. Esta normalização pode ser obtida utilizando o valor da demanda mé-dia como valor de base. O conjunto de dados foi, então, dividido em grupos menoresde acordo com a finalidade da utilização da energia elétrica, o nível da tensão, o dia dasemana e a grandeza medida (potência ativa e reativa). Em seguida, são utilizadas re-des neurais auto-organizadas para a formação das curvas típicas de carga para cadaclasse de consumidor. A definição do número ideal de agrupamentos se deu atravésde funções de avaliação, buscando um número ótimo de grupos. O resultado desta

Page 42: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 3. ESTADO DA ARTE: PERDAS NÃO-TÉCNICAS 26

análise foi a formação de curvas típicas representativas para permitir uma avaliaçãode carga do mercado consumidor de baixa e média tensão da distribuidora.

Na dissertação de Calili [16], o objetivo foi classificar um grupo de consumido-res como normal (adimplente), inadimplente e fraudulento. Para tanto, foi feita ini-cialmente um agrupamento utilizando uma Rede Neural, mais especificamente umaRede de Kohonen, também chamado de Mapas Auto-Organizáveis (Self-OrganizingMaps - SOM) [39], para o banco de dados de cadastro disponibilizado pela distribui-dora. Para se ter a classificação de um grupo quanto à incidência de consumidoresnormais, inadimplentes e fraudulentos utilizou-se um processo de análise nebulosa, oqual identifica os agrupamentos com os consumidores de cada um dos segmentos.É feita uma análise de desempenho do modelo proposto com dados reais fornecidospela empresa, cujos os resultados apontaram para uma robustez do método.

3.3 Artigos Publicados em Periódicos e Conferências

Nesta seção são apresentadas algumas importantes contribuições por meio deartigos publicados em periódicos e conferências.

Recentemente, muitos trabalhos publicados abordam o tema perdas não-técnicas,porém não estão diretamente relacionados com o uso de técnicas inteligentes para aindentificação e caracterização de consumidores irregulares como aborda esta tesede doutorado, mas realça a importância de se combater o problema. Muitos dessesestudos são realizados em países menos desenvolvidos, como Brasil, Índia, Taiwan,Paquistão, entre outros, onde os índices de perdas não-técnicas são elevados, sendopossível perceber o crescimento dos investimentos em Smart Grid para minimizaressas perdas [40–48].

Entre os atuais trabalhos publicados que utilizam técnicas computacionais comalgoritmos inteligentes, tem-se o estudo de Shih-Che Huang et al. [49] que propuserama detecção de perdas não-técnicas através do uso de estimação de estado e análisede variância dos dados coletados dos consumidores.

Em [50], Ribeiro et al. propuseram uma metodologia que consiste em um modeloestatístico, onde são utilizados os dados históricos de concessionárias que são pro-cessados através de um algoritmo de otimização baseado em árvores de decisão paradar suporte para a tomada de decisão com relação aos investimentos feitos na redede energia e, também, para reduzir as perdas não-técnicas, o que gerou um softwareexperimental utilizado pela LIGHT.

Para selecionar os consumidores a serem inspecionados e, assim, reduzir as per-das comerciais, Costa et al. [51] utilizaram algoritmos genéticos na formulação doprocesso de estratificação, que foi considerado como um problema de otimização res-trito não-linear, para encontrar soluções práticas para o problema, baseando-se noprocedimento de divisão de consumidores de energia em subgrupos homogêneos.

Page 43: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 3. ESTADO DA ARTE: PERDAS NÃO-TÉCNICAS 27

Ramos et al. [8] propuseram a identificação automática de perdas não-técnicas uti-lizando uma nova técnica baseada em Floresta de Caminhos Ótimos (Optimum-PathForest - OPF), através de conjuntos de dados com perfis de consumidores comer-ciais e industriais disponibilizados por uma concessionária de energia brasileira. Osresultados com o OPF superaram tanto em precisão quanto em eficiência quandocomparados com as mais tradicionais técnicas de inteligência artificial, como SVM eANN, ou seja, o OPF demonstrou ser mais robusto no contexto de detecção de perdasnão-técnicas.

O trabalho proposto por Verdú et al. [52] apresenta a capacidade de técnicas com-putacionais modernas como ferramentas na classificação de consumidores de energiaelétrica e a extração de padrões de comportamento destes através de seus históricosde consumo, representados pelas curvas de carga. A classificação é feita através douso de redes neurais, utilizando métodos de análise dos dados das curvas de carga.As curvas de carga diárias são obtidas através de medições reais utilizando medidoreseletrônicos e o mapa auto-organizável de Kohonen (SOM) é utilizado como ferramentade classificação. Segundo Verdú et al. [52], existem inúmeras técnicas e ferramentasde estudo de comportamento. Seu objetivo principal é agrupar consumidores comcurvas de carga semelhantes.

Masselli et al. [53] apresentam um modelo baseado no hibridismo entre redes neu-rais artificiais e algoritmos genéticos, capaz de identificar na curva de carga adquirida,em um ponto qualquer do sistema de distribuição, as porções de consumo relativas acada um dos principais setores consumidores presentes naquele ponto. Seus resul-tados iniciais indicaram um melhor desempenho da rede neural convencional, porém,à medida que se aumentou a complexidade dos padrões de treinamento, o sistemahíbrido passou a apresentar resultados cada vez melhores.

Monedero et al. [7] também usaram técnicas de mineração de dados, propondo autilização de redes neurais, juntamente com uma análise estatística de fraudes no con-sumo elétrico. Em um trabalho um pouco mais recente [54], Monedero et al. tambémpropuseram para a detecção de frudes uma análise através da utilização do coefici-ente de Pearson em conjunto com o uso de redes bayesianas e árvores de decisões.

A metodologia proposta por Cabral et al. [55] apresenta um sistema de identificaçãode possíveis fraudes em consumidores de alta tensão. Foram utilizados os dados demedição de uma empresa brasileira, contendo aproximadamente 2000 consumidores.Estes dados são submetidos a uma rede SOM, que identifica grupos de registros comcaracterísticas semelhantes (agrupamentos). Os dados de cada consumidor foramseparados por medições semanais e, através da técnica SOM, foram classificados em2 grupos: o primeiro, com as curvas de carga típicas dos consumidores, e o segundo,com curvas atípicas, apresentando um consumo médio baixo. Este consumo baixofoi obtido pela redução proposital em 30% do consumo em um determinado período

Page 44: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 3. ESTADO DA ARTE: PERDAS NÃO-TÉCNICAS 28

do dia. Então, os consumidores do agrupamento 1 foram classificados como normais,enquanto os consumidores do agrupamento 2 foram classificados como suspeitos.

O artigo de Nagi et al. [6] apresenta um trabalho com uma nova abordagem paraanálise de perdas não-técnicas por concessionárias de energia usando SVM. A princi-pal motivação deste estudo é a de auxiliar a concessionária Tenaga Nasional Berhad(TNB) na Malásia para reduzir as perdas não-técnicas no setor da distribuição de ele-tricidade devido ao roubo de energia. O modelo proposto pré-seleciona consumidoressuspeitos para serem inspecionados no local de fraude baseado nas irregularidades eno comportamento anormal de consumo. Esta abordagem proporciona um método deextração de dados e envolve características históricas de consumo a partir dos dadosdos consumidores. A abordagem SVM utiliza as informações do perfil de carga dosconsumidores para expor o comportamento anormal, que é conhecido por ser alta-mente correlacionada com as perdas não-técnicas. O resultado de agrupamento dasclasses que são utilizadas para direcionar os suspeitos de fraude, durante a inspeçãono local, é baseado no comportamento suspeito devido às significativas irregularida-des no consumo. Os resultados de simulações provam que o método proposto émais eficaz em comparação com as atuais medidas tomadas por TNB, a fim de redu-zir as perdas não-técnicas. Em outro trabalho muito semelhante, também publicadopor Nagi et al. [56], uma abordagem híbrida entre GA [3] e SVM foi também aplicadapara a detecção perdas não-técnicas. O GA proporciona uma maior convergência eum globalização otimizada dos hiper-parâmetros do SVM utilizando uma combinaçãoaleatória e de genomas pré-povoados.

Nizar et al. [57] apresentam um estudo para a escolha do melhor método para a ge-ração de curvas de carga. Neste método, são utilizadas técnicas de agrupamento e mi-neração de dados. Após a coleta de dados de consumidores divididos em categorias,como residencial, comercial e industrial, estes dados são separados em agrupamen-tos, cada um contendo um subconjunto de dados com características semelhantes.Em seguida, os dados do subconjunto são usados para classificar os consumidoresde acordo com o comportamento, sendo, então, criados perfis de consumo típicos. Es-tes perfis típicos são comparados com os perfis de consumo a serem averiguados. Sealguma destas novas curvas apresentar desvio com relação à curva típica, esta é sele-cionada para investigação. Se for confirmado que esta variação se deve à ocorrênciade perdas comerciais, a nova curva é atualizada e utilizada futuramente para fins deprevisão. Nizar et al. também usam a mineração de dados aplicadas em técnicas deanálise de perdas não-técnicas [58,59]. O método é baseado em diversos algoritmospopulares de classificação e envolve a extração dos padrões de comportamento doconsumo de consumidores a partir de dados históricos e da organização dos dadosem médias anuais, mensais, semanais e diárias. As diversas técnicas de classificaçãosão utilizadas e comparadas. A intenção é garantir a obtenção de melhores resulta-

Page 45: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 3. ESTADO DA ARTE: PERDAS NÃO-TÉCNICAS 29

dos no desenvolvimento de perfis de carga representante para serem utilizados comoreferência para as análises de perdas não-técnicas direcionadas a detectar quaisqueratividades significativas que possam contribuir para estas perdas.

Em [60] e em [61], Nizar et al. também apresentam uma nova abordagem paraanálise de perdas não-técnicas de concessionárias usando as técnicas computacio-nais modernas com aprendizagem de máquina extrema (Extreme Learning Machine -ELM). Segundo Nizar et al., as perdas não-técnicas são significativas em diversos paí-ses. A abordagem ELM apresentada utiliza a informação de um perfil de carga de umconsumidor para expor comportamento anormal que é conhecido por ser altamentecorrelacionada com as atividades de perdas não-técnicas. Esta abordagem propor-ciona um método de extração de dados para esta finalidade, e que envolve extrairpadrões de comportamento dos clientes a partir de dados históricos de consumo. Osresultados do agrupamento das classes são utilizados para revelar qualquer comporta-mento significativo devido a irregularidades no consumo. Nestes artigos, os algoritmosELM e o ELM de sequenciamento online (OS-ELM) são utilizados para alcançar umamelhor classificação para aumentar o desempenho e a precisão dos resultados. Umacomparação desta abordagem de classificação com a técnica de máquinas de vetoresde suporte é também realizada, e os resultados com ELM para a precisão na análisede perdas comerciais demonstraram serem superiores.

3.4 Considerações Finais

Vale ressaltar que é difícil comparar os métodos desenvolvidos por outros autorescom o método proposto neste trabalho com relação a identificação das perdas não-técnicas, visto que a maioria deles trabalha diretamente com um histórico de curvasde carga ou, indiretamente, com características extraídas dessas curvas. Ao contrário,neste trabalho, no qual as curvas de carga não foram disponibilizadas pela concessi-onária que forneceu o conjunto de dados, possui-se apenas alguns dados técnicos jáextraídos das curvas de carga mensal de cada perfil de consumidor. Lembrando quenem sempre as características usadas neste trabalho são iguais às característicasusadas por outros autores.

Outro ponto de vista é com relação ao estudo de caracterização dos perfis deconsumidores, já que os diversos estudos existentes na literatura abordam apenas adetecção de perdas não-técnicas, sendo o principal foco deste trabalho o estudo de se-leção de características afim de encontrar o perfil mais adequado diante de potenciaisconsumidores com irregularidades. Em [9], é um dos poucos trabalhos encontradosno estado da arte que aprofunda o estudo de seleção de características no contextode perdas comerciais.

Portanto, se os conjuntos de dados fizessem parte de um repositório público eos diversos autores usassem esse tal conjunto de dados, seria realizada uma com-

Page 46: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 3. ESTADO DA ARTE: PERDAS NÃO-TÉCNICAS 30

paração mais justa entre todos os métodos e todas as técnicas de inteligência artifi-cial abordadas. Entretanto, estudos relacionados com a minimização de perdas não-técnicas sempre são válidos, pois novas ferramentas são desenvolvidas com certafrequência e avaliar esses novos artifícios podem resultar em progressos de combatea essas perdas.

No capítulo a seguir, serão abordadas as técnicas de inteligência artificial para o re-conhecimento de padrões utilizadas nos experimentos realizados no desenvolvimentoda tese.

Page 47: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

Capítulo 4

Técnicas de Inteligência ArtificialPara Reconhecimento de Padrões

Neste capítulo são exploradas as técnicas de Inteligência Artificial para a classifi-cação de padrões. Entre as técnicas abordadas nas próximas seções estão as RedesNeurais (Perceptron Multicamadas e Mapas de Auto-Organização), Máquinas de Ve-tores de Suporte, k-Vizinhos Mais Próximos, Floresta de Caminhos Ótimos e RedesBayesianas.

4.1 Redes Neurais Artificiais

Redes Neurais Artificiais são técnicas computacionais que apresentam um modelomatemático inspirado na estrutura neural de organismos inteligentes e que adquiremconhecimento através da experiência. Uma ANN é caracterizada pelo padrão de cone-xão (modelo conexionista) entre os neurônios (topologia), pelo método de determina-ção dos pesos e conexões (treinamento ou aprendizagem) e pela função de ativaçãoresponsável pela saída da rede. Esses processos comportam-se de maneira similaraos grupos de neurônios do cérebro humano que recebem e transmitem informaçõesatravés dos dendritos e axônios, respectivamente [62]. Quando são apresentadosà rede um conjunto de entradas e suas respectivas saídas, as quais estão represen-tando o comportamento de um processo específico, a mesma, através do treinamento,é capaz de se auto-ajustar com o objetivo de mapear o relacionamento funcional entreas entradas e saídas. Por conseguinte, após a execução desse algoritmo de treina-mento, a rede deve ser capaz de generalizar o comportamento do processo quandooutras entradas, diferentes daquelas utilizadas no treinamento, são apresentadas. Talcaracterística é particularmente útil quando o relacionamento entre as entradas e saí-das do processo analisado é não-linear, ou então, quando o relacionamento não éclaramente definido de forma que a sua modelagem, por técnicas de identificaçãoconvencionais, torna-se muito difícil.

As redes neurais representam o desenvolvimento de sistemas computacionais ca-pazes de reconhecer e classificar padrões, resolver problemas complexos, realizar

31

Page 48: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 4. IA PARA RECONHECIMENTO DE PADRÕES 32

processos indutivos e dedutivos, entre outros.Em geral, a utilização de redes neurais, comparando-se com outras técnicas, pos-

sui as seguintes vantagens [63]:

• Os relacionamentos funcionais entre os padrões de entrada e saída podem sercapturados por uma rede neural, sendo que tais relacionamentos não precisamser conhecidos ou descritos explicitamente;

• Nenhuma hipótese precisa ser feita sobre as distribuições estatísticas dos pa-drões de entrada; e

• As redes neurais são tolerantes à falhas no sentido que, mesmo quando algunselementos ou conexões do processamento apresentam-se degradados, a per-formance da rede pode ser pouco afetada.

As arquiteturas de redes neurais artificiais utilizadas para modelar os sistemas neu-rais biológicos podem ser divididas em três categorias distintas. A primeira categoriade redes neurais, “feedforward”, transforma conjuntos de sinais de entrada em conjun-tos de sinais de saída, sendo que os parâmetros dessa transformação são ajustadosde forma supervisionada, de acordo com os resultados desejados. Na segunda ca-tegoria de redes neurais, “feedback ”, as informações de entrada definem o estadoinicial de atividade do sistema de realimentação. Depois de algumas transições deestado, atinge-se um estado que é considerado o resultado final da computação. Naterceira categoria, as células vizinhas da rede neural interagem mutuamente, a fimde transformarem-se adaptativamente em detectores especializados de diferentes pa-drões. Nessa última categoria, o aprendizado da rede neural é realizado de forma nãosupervisionada, através de mapas de auto-organização [39].

4.1.1 Mapas de Auto-Organização

No modelo de redes neurais baseado em mapas de auto-organização, propostopor Kohonen [39, 64, 65], a segregação espacial de diferentes respostas e suas orga-nizações em sub-conjuntos relacionados topologicamente resultam em um alto graude eficiência nas operações típicas de uma rede neural.

O modelo SOM implementa uma projeção não-linear de um espaço multidimensio-nal X em um espaço bidimensional M , denominado mapa de auto-organização. Essaprojeção, de modo análogo à maioria das projeções encontradas no cérebro, imple-mentam mapeamentos topológicos, ou seja, elementos vizinhos em X são geralmentemapeados em elementos vizinhos em M .

O mapeamento topológico constitui uma importante característica do modelo deredes neurais proposta por Kohonen, pois permite encontrar características e ou-tras abstrações do espaço multidimensional através de identificação de agrupamentos(“clusters”) no mapa bidimensional.

Page 49: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 4. IA PARA RECONHECIMENTO DE PADRÕES 33

O mapeamento do espaço multidimensional no bidimensional é realizado por umafunção f : X → M , onde X ⊂ Rn e M ⊂ R2, que associa cada elemento x ∈ X a umpar (i, j) ∈ M . Os elementos mij do mapa M , assim como os dados de entrada, sãovetores de tamanho n, que mantém os pesos das ligações sinápticas da rede neural.

Apresentado um estímulo específico x ∈ X à rede neural, o “nó vencedor” do mapaM para esse estímulo é determinado verificando-se qual dos elementos do mapapossui a menor distância ao estímulo, ou seja, o nó vencedor tem as coordenadas(i, j) ∈M , tal que:

||mij − x|| = min{||mkl − x||,∀i, j, k, l = 0 . . . D}, (4.1)

onde D é o tamanho de M .Portanto, um estímulo x ∈ X apresentado à camada de entrada da rede neural

é mapeado no elemento (i, j) da camada de saída da rede neural, ou seja do mapade auto-organização M , para o qual a distância entre esse estímulo e o vetor dospesos das ligações sinápticas mij da rede neural seja mínima, comparando-se comos demais vetores de pesos das ligações sinápticas mkl.

Nesse modelo de rede neural, os neurônios da camada de saída interagem lateral-mente com seus vizinhos. Essas interações se dão na fase de aprendizado, quandoos pesos da célula “vencedora” e dos seus vizinhos são ajustados, de tal modo quea célula vencedora tenha pesos idênticos aos valores do estímulo sendo apresentadoà rede num determinado instante do treinamento, e as células vizinhas tenham pesossemelhantes aos da célula vencedora, sendo que o grau de semelhança é ponderadode acordo com a distância entre a célula vizinha e a célula vencedora. A interação dacélula vencedora (i, j) com uma célula vizinha (k, l), num determinado instante t dotreinamento, é definida por uma função hkl(t) da distância entre elas. Normalmente, afunção hkl(t) é uma Gaussiana.

O aprendizado nesse modelo é dito não supervisionado porque o mapeamentodo espaço multidimensional para o bidimensional é feito a despeito dos resultadosesperados na saída do processamento, ao contrário dos outros modelos, onde osvalores esperados e os valores obtidos pela rede, para um dado estímulo de entrada,influenciam no reajuste dos pesos das ligações sinápticas.

No modelo de redes neurais baseadas em mapas de auto-organização, os pesosdas ligações sinápticas são ajustadas da seguinte forma:

mkl(t+ 1) = mkl(t) + (x−mkl(t))hkl(t), (4.2)

onde hkl(t) = α(t)exp[− ||rkl−rij ||

2

δ(t)2

], (i, j) são as coordenadas do nó vencedor para o

estímulo x, ||rkl − rij|| é a distância espacial entre o nó vencedor e o nó (k, l), e δ(t) éuma função do tempo de treinamento t, que determina a variância da Gaussiana hkl.

Page 50: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 4. IA PARA RECONHECIMENTO DE PADRÕES 34

O tamanho da vizinhança Nij(t) decresce de acordo com o número de iteraçõesT da fase de treinamento. No início do treinamento, isto é, quando t = 0, Nij(t) incluitoda a rede, e no final, quando t = T , Nij(t) contém somente o nó vencedor (i, j). Aseguinte função linear pode ser adotada para determinar os ajustes nas extensões davizinhança: Nij(t) = D

[1− t

T

], para t = 0, . . . , T . De forma análoga, as funções δ(t) e

α(t), podem ser reajustadas em cada iteração através das funções lineares δ(t) = 2− tT

e α(t) = 1− tT

, para t = 1, . . . , T , respectivamente.Após a fase de treinamento, os nós da rede são rotulados de acordo com a classe

de estímulos para os quais eles apresentam respostas mais intensas. Se essa fasefor supervisionada, então deve-se apresentar para a rede conjuntos de estímulospara os quais se conhece a classificação. Para cada classe de estímulos conhecidosverificam-se quais são os nós vencedores no mapa de auto-organização. Esses nóssão rotulados com o rótulo associado àquela classe de estímulos. Se essa fase nãofor supervisionada, é necessário realizar uma análise de agrupamentos no mapa deauto-organização. Um modelo da arquitetura bidimensional típica da rede de Kohonené apresentado na Figura 4.1.

Figura 4.1: Arquitetura bidimensional típica de uma rede de Kohonen. Figura adaptada de [1].

4.1.2 Redes Neurais Perceptron Multicamadas

Perceptron

Durante as décadas de 50 e 60, uma grande revolução ocorreu no campo de pes-quisa relacionado à teoria de reconhecimento de padrões com o aparecimento daschamadas máquinas que aprendem, os perceptrons [1]. Em sua metodologia maisbásica, o perceptron aprende uma função de decisão linear que dicotomiza dois con-

Page 51: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 4. IA PARA RECONHECIMENTO DE PADRÕES 35

juntos de treinamento, os quais são linearmente separáveis, em um número finito depassos iterativos. A resposta desse dispositivo básico baseia-se na soma ponderadade sua entrada, ou seja,

d(x) = φ(ξ); (4.3)

ξ =n∑i=1

wixi + wn+1, (4.4)

que é uma função de decisão linear em relação aos elementos do vetor de caracterís-ticas. Os coeficientes wj, j = 1 . . . n+1, são os chamados pesos das conexões, sendoanálogos às sinapses no sistema neural humano. Tem-se ainda que φ é a chamadafunção de ativação e ξ é o somatório da rede [1].

Dentre as várias escolhas para φ, tem-se:

• Função limiar (threshold):

φ(ξ) =

1 se ξ ≥ 1,

0 caso contrário(4.5)

• Função sigmoidal:

φ(ξ) =1

1 + e−ξ(4.6)

• Função identidade:φ(ξ) = ξ (4.7)

O algoritmo de treinamento do perceptron utiliza uma função de ativação por limi-arização muito semelhante à Equação (4.5), descrita por

φ(ξ) =

1 se ξ ≥ 1,

−1 caso contrário.(4.8)

Geometricamente, a equação

ξ =n∑i=1

wixi + wn+1 = 0 (4.9)

ouξ = w1x1 + w2x2 + . . .+ wnxn + wn+1 = 0, (4.10)

define um hiperplano no espaço n-dimensional de padrões. Os n primeiros coefici-entes estabelecem a orientação do hiperplano, enquanto o último coeficiente, wn+1,também chamado de bias, é proporcional à distância perpendicular à origem do hiper-plano.

Page 52: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 4. IA PARA RECONHECIMENTO DE PADRÕES 36

Caso as duas classes apresentadas ao algoritmo de perceptron sejam linearmenteseparáveis em <n, o mesmo converge em um número finito de passos. Entretanto,caso ambas classes não obedeçam a tal critério, o algoritmo executará indefinida-mente, não convergindo para a solução ótima. O modelo simplificado do perceptron éapresentado na Figura 4.2.

Figura 4.2: Modelo simplificado do perceptron. Figura adaptada de [1].

Perceptron Multicamadas

Para o tratamento de problemas que possuem várias classes, independentementede as mesmas serem separáveis ou não, o algoritmo de perceptron visto anterior-mente é ineficiente, visto que o mesmo funciona adequadamente quando a tarefade classificação consiste em duas classes linearmente separáveis. Conectando vá-rios perceptrons, pode-se projetar uma estrutura chamada Perceptron Multicamadas(PMC), também conhecida como MLP, do inglês Multilayer Perceptron [1], a qual con-siste de várias camadas de elementos computacionais idênticos (neurônios) dispostosde tal maneira que a saída de cada um deles alimente a entrada de cada neurônioda camada seguinte. O número de neurônios da primeira camada, denominada A,corresponde a NA; sendo, frequentemente denotado NA = n, ou seja, o número deelementos da primeira camada é igual à dimensionalidade do vetor de características.O número de neurônios da camada de saída, chamada Q, corresponde a NQ = G,sendo G igual ao número de classes do problema de classificação. A rede neural re-conhece um vetor de padrões x como pertencente à classe ωm caso a m-ésima saídada rede possuir o maior valor dentre as m− 1 saídas restantes.

No caso da arquitetura citada anteriormente, a entrada de cada elemento em qual-quer camada corresponde à soma ponderada das saídas da camada anterior. Deno-tando K a camada anterior a J , tem-se que a entrada de cada neurônio na camada J ,denotada por Ij é dada por

Ij =

NK∑k=1

wjkOk, (4.11)

Page 53: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 4. IA PARA RECONHECIMENTO DE PADRÕES 37

sendo queOk = φ(Ik), (4.12)

onde j = 1, 2, . . . , NJ , sendo NJ e NK o número de elementos da camada J e K,respectivamente, e wjk denota o peso que modifica as saídas Ok dos elementos dacamada K.

Algumas convenções geralmente adotadas para tais estruturas de redes neuraissão:

• a função de ativação utilizada na camada de entrada é a função identidade, dadapela Equação (4.7);

• camadas não adjacentes não são conectadas diretamente e, por conseguinte,

• todos os neurônios das camadas escondidas possuem a mesma função de ati-vação φ.

Sendo assim, este modelo de rede neural é chamado de feedforward, devido aofato de tanto a camada de entrada quanto as intermediárias, ou escondidas, seremsubmetidas somente à camada mais alta, ou seja, a camada K é subalterna à ca-mada K + 1, assim por diante. Uma representação de um modelo básico do modelofeedforward pode se vista na Figura 4.3.

Figura 4.3: Representação básica de uma rede feedforward (multicamadas). Figura adaptadade [1].

Treinamento por Retropropagação (Backpropagation)

O principal objetivo deste algoritmo é o de desenvolver uma regra de treinamentocom o intuito de minimizar o erro quadrático total entre as saídas desejadas rq e as

Page 54: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 4. IA PARA RECONHECIMENTO DE PADRÕES 38

saídas reais φq dos nós em uma camada de saída Q, ou seja, minimizar a equaçãoabaixo:

EQ =1

NQ

NQ∑q=1

(rq −Oq)2, (4.13)

onde NQ é o número de nós da camada de saída Q.Durante o treinamento com o algoritmo de retropropagação, primeiramente, um

padrão é apresentado à camada de entrada da rede. A saída obtida pela última ca-mada é comparada com a saída desejada. Caso a mesma não esteja correta, o erroé calculado por meio da Equação (4.13) e propagado a partir da camada de saída atéa camada de entrada, sendo que os pesos das conexões são modificados através daregra delta generalizada conforme o erro é retropropagado.

Desta forma, a regra delta generalizada ∆wqp permite o ajuste dos pesos em cadauma das camadas de maneira a tentar minimizar a função de erro mostrada acima, ouseja, calcular o gradiente negativo de EQ, dado pela equação

∆wqp = −α∂EQwqp

, (4.14)

em que P precede a camada Q e α é um incremento positivo de correção.Pode-se resumir e generalizar o procedimento de treinamento da seguinte maneira:

para quaisquer duas camadas K e J , em que K precede imediatamente J , a Equa-ção (4.14), através de algumas manipulações algébricas, pode ser re-escrita como

∆wjk = αδjOk. (4.15)

Caso J seja uma camada de saída, δj é dado por:

δj = (rj −Oj)O′j. (4.16)

Se J for uma camada interna e P for a próxima camada, então δj é dado por

δj = O′j

NP∑p=1

δpwjp, (4.17)

onde j = 1, 2, . . . , NJ .Desta forma, todo o processo de treinamento começa com um conjunto arbitrário

de pesos da rede. Em seguida, a aplicação da regra delta generalizada em qualquerpasso iterativo envolve duas etapas. Na primeira fase, um vetor de treinamento éapresentado à rede e propagado através das camadas da rede para o cálculo de Oj

para cada nó. As saídas Oq dos nós da camada de saída são então comparadascom as respostas desejadas rq para que os termos de erro δq sejam gerados. A

Page 55: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 4. IA PARA RECONHECIMENTO DE PADRÕES 39

segunda fase envolve uma passagem para trás na rede, retropropagação, durante aqual o sinal de erro apropriado é passado por cada nó e as mudanças correspondentesnos pesos são realizadas. Uma vez que o sistema tenha sido treinado, o mesmopassa a classificar os padrões utilizando os parâmetros estabelecidos durante a fasede treinamento descrita acima.

4.2 Máquinas de Vetores de Suporte

As Máquinas de Vetores de Suporte, são normalmente consideradas a primeiraaplicação prática da teoria do aprendizado estatístico [4, 5]. Trata-se de uma áreade pesquisa que oferece muitas opções para se trabalhar, sendo grande parte delasmais conceituais que meramente técnicas. Nos últimos anos seu escopo tem crescidosignificativamente tanto em termos de novos algoritmos quanto de um entendimentoteórico mais aprofundado. Parte destes novos algoritmos se deve aos chamados mé-todos de nuclearização, uma proposta para solução de problemas de aprendizado demáquina cuja arquitetura tem se demonstrado capaz de lidar com questões relativasàs bases desta teoria. Além disso, aplicações bem sucedidas de SVMs demonstramque esta técnica não só possui uma fundamentação mais sólida do que as Redes Neu-rais Artificiais como também são capazes de substituí-las com desempenho melhor ousemelhante [5].

As SVM propõem resolver o problema de classificação de padrões assumindo serpossível separar as classes em um espaço de mais alta dimensão. Suponha uma si-tuação na qual os dados não são linearmente separáveis. Tais amostras podem serseparadas em grupos usando curvas ou círculos como superfícies de decisão, po-rém encontrar tais limiares é uma tarefa custosa. A principal ideia de uma SVM épré-processar os dados de tal forma que o problema de encontrar uma função discri-minante não-linear seja transformado em um problema de encontrar um hiperplano,ou seja, mapear os dados que estão em uma dimensão qualquer para outra maior,tornando os mesmos linearmente separáveis, embora isso não seja garantido. Isto éfeito definindo um mapeamento que transforma o vetor de entrada em outro (usual-mente maior) vetor. Espera-se que, escolhendo um mapeamento adequado, o novoconjunto de treinamento seja linearmente separável.

4.2.1 Classificadores por Hiperplano

De acordo com as questões destacadas para o controle da efetividade dos algorit-mos de aprendizado, se faz necessário que a capacidade da classe de funções possaser calculada. Nos primórdios de seu estudo, Vapnik [4] considerou uma classe dehiperplanos em um espaço H com produto interno,

〈w,x〉+ b = 0, (4.18)

Page 56: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 4. IA PARA RECONHECIMENTO DE PADRÕES 40

onde w ∈ H, b ∈ R, correspondendo com funções de decisão do tipo

f(x) = sgn(〈w,x〉+ b), (4.19)

Baseado em dois argumentos, ele então propôs o algoritmo de aprendizado denomi-nado Retrato Generalizado (do inglês “Generalized Portrait”) para problemas separá-veis por hiperplanos:

1. Dentre todos os hiperplanos que separam os dados, existe apenas um hiper-plano ótimo distinguido pela margem de máxima separação entre qualquer pontode treinamento e este hiperplano. Esta é a solução de

maximizew∈H,b∈R

min{||x− xi|||x ∈ H, 〈w,x〉+ b = 0}, (4.20)

onde i = 1, ...,m.

2. A capacidade da classe de hiperplanos de separação decresce com o cresci-mento da margem.

Para construir tal hiperplano ótimo, é necessário resolver

minimizew∈H,b∈R

τ(w) =1

2||w||2 (4.21)

sujeito àyi(〈w,xi〉+ b) ≥ 1 para todo i = 1, ...,m, (4.22)

com a restrição da Equação (4.22) garantindo que f(xi) será +1 para yi = +1 e −1

para yi = −1 e também fixando a escala de w.A razão por detrás da minimização de w (Equação (4.21)) pode ser interpretada

da seguinte maneira: se ||w|| = 1, então o termo da esquerda na Equação (4.22) seriaigual à distância de xi ao hiperplano. Em geral, é preciso dividir yi(〈w,xi〉+ b) por ||w||para transformá-lo nesta distância. Sendo assim, se a Equação (4.22) for satisfeitapara todos i = 1, ...,m com um w de tamanho mínimo, a margem será maximizadacomo um todo. Um resumo destes argumentos é dado na Figura 4.4.

A função τ na Equação (4.21) é chamada de função objetivo, enquanto a Equação(4.22) representa as restrições de desigualdade. Em conjunto, elas dão origem ao quese conhece como problema de otimização restrita, que por sua vez é resolvido atravésda introdução do Lagrangiano

L(w, b, α) =1

2||w||2 −

m∑i=1

αi(yi(〈xi,w〉+ b)− 1) (4.23)

onde αi ≥ 0 são os multiplicadores de Lagrange e L tem que ser minimizada comrelação às variáveis primais w e b e maximizada com relação às variáveis duais αi.

Page 57: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 4. IA PARA RECONHECIMENTO DE PADRÕES 41

Figura 4.4: Um problema de classificação binário extraído de [5] cujo propósito é separaras bolas dos diamantes. O hiperplano ótimo (Equação (4.21)) é mostrado com uma linhasólida. No problema sendo separado há apenas um vetor ponderado w e um limiar b tal queyi(〈w,xi〉 + b) > 0 (i = 1, ...,m). Ao reescalar w e b com o objetivo de que o(s) ponto(s)mais próximos ao hiperplano satisfaçam |〈w,xi〉+ b| = 1 se obtém a forma canônica (w, b) dohiperplano.

Em outras palavras, um ponto de sela deve ser encontrado. Como se pode notar, asrestrições do problema original foram incorporadas no segundo termo no Lagrangiano.

Observando melhor para o que o problema de otimização restrita mostra, é possí-vel observar que se a restrição da Equação (4.22) no segundo termo do Lagrangianofor violada com

∑mi=1 αi(yi(〈xi,w〉 + b) − 1 < 0, L pode ser incrementado através do

decrescimento do αi correspondente. Ao mesmo tempo, w e b terão que mudar (re-duzindo a margem) de tal forma que L decresça. Dado que o problema é separável,num dado momento as restrições serão finalmente satisfeitas. De forma análoga,pode-se entender que para todas as restrições não atendidas precisamente comoigualdades, seu αi correspondente deve ser 0: este é o valor de αi que maximiza L.Desta última observação extrai-se as chamadas condições de complementaridade deKarush-Kuhn-Tucker (KKT) presente na teoria da otimização.

Considerando que num ponto de sela as derivadas de L com relação às variáveisprimais deve desaparecer,

∂bL(w, b, α) = 0 e

∂wL(w, b, α) = 0 (4.24)

leva àm∑i=1

αiyi = 0 (4.25)

Page 58: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 4. IA PARA RECONHECIMENTO DE PADRÕES 42

e

w =m∑i=1

αiyixi. (4.26)

Consequentemente, o vetor-solução nada mais é que uma expansão (Equação(4.26)) de um subconjunto dos padrões de treinamento, especificamente aqueles comαi diferente de zero, que são os chamados vetores de suporte (Support Vectors - SVs).

Ao substituir as Equações (4.25) e (4.26) no Lagrangiano (Equação (4.23)),eliminam-se as variáveis primais w e b resultando no chamado problema de otimi-zação dual, que é o tipo de problema que as SVMs normalmente resolvem na prática:

maximizeα∈Rm

W (α) =m∑i=1

αi −1

2

m∑i,j=1

αiαjyiyj〈xi,xj〉 (4.27)

sujeito àαi ≥ 0 para todo i = 1, ...,m

em∑i=1

αiyi = 0.

Ainda baseado na Equação (4.26), a função-hiperplano de decisão (Equação (4.19))pode ser escrita como

f(x) = sgn

(m∑i=1

yiαi〈x,xi〉+ b

). (4.28)

Falta, ainda, estabelecer como b pode ser calculado. De acordo com as condiçõesKKT, todos os pontos com

αi[yi(〈xi,w〉+ b)− 1] = 0 para todo i = 1, ...,m (4.29)

são SVs situados na margem e, sendo assim, αi > 0. Em tais casos, é possíveldemonstrar que

〈xi,w〉+ b = yi. (4.30)

Dessa forma, o limiar pode ser obtido, por exemplo, por

b = yi − 〈xi,w〉. (4.31)

Alternativamente, b também pode ser calculado a partir dos valores das variáveis duaisαi e αj correspondentes.

Page 59: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 4. IA PARA RECONHECIMENTO DE PADRÕES 43

4.2.2 Nuclearização e Hiperplanos de Margem Suave

Esta seção está relacionada ao mapeamento das entradas para um espaço demaior dimensionalidade e ao acréscimo de artifícios de tolerância para que as SVMspossam lidar com problemas não-separáveis.

Para expressar as fórmulas a partir dos padrões de entrada X , emprega-se o pro-duto interno dos vetores x,x′ em termos do núcleo u estimado pelos elementos deentrada x, x′:

u(x, x′) = 〈x,x′〉. (4.32)

Esta substituição, também conhecida como truque do núcleo (do inglês “kerneltrick ”), é utilizada para um mapeamento não-linear, objetivando tornar os dados line-armente separáveis. O truque do núcleo pode ser aplicado desde que todos os vetoresde característica ocorram apenas em produto internos, o que pode ser observado nasEquações (4.27) e (4.28). O vetor ponderado (Equação (4.26)), torna-se então umaexpansão no espaço de características e, sendo assim, não mais corresponderá aoseu respectivo vetor no espaço de entradas. A partir da Equação (4.28), a função dedecisão se tornará

f(x) = sgn

(m∑i=1

yiαi〈Φ(x),Φ(xi)〉+ b

)

= sgn

(m∑i=1

yiαiu(x, xi) + b

), (4.33)

e o problema de otimização (Equação (4.27)) assumirá a forma

maximizeα∈Rm

W (α) =m∑i=1

αi −1

2

m∑i,j=1

αiαjyiyju(xi, xj), (4.34)

sujeito a αi ≥ 0 para todo i = 1, ...,m, e∑m

i=1 αiyi = 0. A Figura 4.5 captura a ideia demapear os dados do espaço de entradas para o espaço de características.

Mesmo com as vantagens da nuclearização do problema, na prática, o hiperplanode separação ainda assim pode não existir. Isto pode acontecer, por exemplo, em umconjunto de dados com muito ruído onde haja sobreposição das classes. Para permitirque os exemplos que violam a Equação (4.22) possam ser considerados, as variáveisde afrouxamento ρi são introduzidas [5,66], onde

ρi ≥ 0 para todo i = 1, ...,m, (4.35)

Page 60: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 4. IA PARA RECONHECIMENTO DE PADRÕES 44

Espaço de entradas Espaço de características

Figura 4.5: A ideia de se aplicar o truque do núcleo nas SVMs: mapear os dados de treina-mento em um espaço de características de maior dimensão através de Φ, e então construirum hiperplano de máxima margem de separação. Apesar da fronteira de decisão ser linearno espaço de características, no espaço de entradas original ela ganha formas não-lineares.Figura extraída de [5].

fazendo com que as restrições assumam a forma

yi(〈w,xi〉+ b) ≥ 1− ρi para todo i = 1, ...,m. (4.36)

Desta maneira, um classificador de boa generalização pode ser obtido pelo controletanto da capacidade (através de ||w||) quando da soma das variáveis de afrouxamento∑

i ρi. É possível demonstrar que este somatório provê um limite superior no númerode erros de treinamento [5].

Neste contexto, uma possível elaboração de tal classificador de margem suave éobtida pela minimização da função-objetivo:

τ(w, ρ) =1

2||w||2 + C

m∑i=1

ρi, (4.37)

sujeita às restrições da Equações (4.35) e (4.36), onde a constante C > 0 determina oequilíbrio entre a maximização da margem e a minimização dos erros de treinamento.Quanto maior for C, menor será a margem, menor o número de erros de treinamentoe menor também a capacidade de generalização da máquina de aprendizado.

Incorporando o núcleo e reescrevendo o problema em termos dos multiplicadoresde Lagrange, novamente leva a maximização da Equação (4.34), sujeita às restrições0 ≤ αi ≤ C para todo i = 1, ...,m e

∑mi=1 αiyi = 0. A única diferença deste caso para

o caso separável está no limite superior C dos multiplicadores de Lagrange αi. Sendoassim, a influência dos padrões individuais (que podem ser valores discrepantes) setorna limitada. A solução na Equação (4.33) não muda e o limiar b pode ser calculadopelo fato de que para todos os SVs xi com αi < C, a variável de afrouxamento ρ é

Page 61: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 4. IA PARA RECONHECIMENTO DE PADRÕES 45

zero e, assim sendo

m∑j=1

αjyju(xi, xj) + b = yi. (4.38)

Analisando geometricamente, escolher b significa deslocar o hiperplano, ao passo quea Equação (4.38) determina ser necessário situá-lo de tal forma que todo SV comvariável de afrouxamento igual à zero esteja nas linhas ±1 (conforme Figura 4.4).

A função de núcleo apresentada como produto interno na Equação (4.32) é nor-malmente chamada de função de Núcleo Linear e, dadas algumas restrições [5], podeser substituída por outras funções. Outra função de mapeamento bastante conhecidaé a Gaussiana chamada Função de Base Radial (do inglês “Radial Basis Function” -RBF),

u(x, x′) = exp(−||x− x

′||2

2σ2

), (4.39)

onde σ > 0 é um parâmetro da função de núcleo. Em função da variável de ajuste C,este tipo de SVM é comumente chamado de C-SVC, e representa a classificação porSVMs em sua forma original [67].

4.2.3 Considerações Adicionais

Como foi possível observar ao longo desta seção, as SVMs são fundamentalmentemáquinas de classificação binárias. No entanto, a maioria dos problemas reais a se-rem otimizados requerem a classificação de mais de duas classes. Uma questão queemerge desta constatação é sobre como lidar com a propriedade multiclasses ine-rente a muitos problemas em um classificador binário por definição. Três estratégiassão comumente adotadas para emprego de SVMs em problemas de c classes:

Uma Contra o Resto: Na abordagem uma-contra-o-resto, c SVMs são treinadas, ondecada uma delas separa uma determinada classe de todas as demais.

Classificação aos Pares: Na abordagem de classificação aos pares, c(c − 1)/2 má-quinas são treinadas. Cada uma destas SVMs separa um par de classes. Osclassificadores são então arranjadas como nós de uma árvore, onde cada nórepresenta uma SVM. Tanto a busca de cima para baixo quanto de baixo paracima pode ser adotada, sendo esta última análoga ao processo de eliminaçãode equipes em um campeonato esportivo.

Espaço de diferenças: Para transformar problemas multiclasses em binários, umanovo espaço de representações chamado espaço de diferenças foi propostoem [68]. Através da modelagem de dissimilaridades, um problema com c clas-ses é transformado em um problema com os conjuntos diferenças intraclasse e

Page 62: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 4. IA PARA RECONHECIMENTO DE PADRÕES 46

diferenças interclasses. Quanto mais parecida do conjunto intraclasse for a di-ferença entre um exemplo conhecido e um desconhecido, mais provável os doisserem da mesma classe. Por outro lado, quanto mais parecida do conjunto in-terclasse for a diferença entre um exemplo conhecido e um desconhecido, maisprovável deles serem de classes distintas.

Uma biblioteca de código aberto bastante conhecida que implementa SVMs nasmais variadas formas é a chamada LibSVM [69]. Trata-se de um repositório de códigoaberto cujo objetivo é ajudar as pessoas a usarem facilmente SVMs. Além de prover 4diferentes tipos de função de núcleo, ela oferece SVMs não só para classificação, mastambém para aprendizado não supervisionado e regressão. Através de uma interfacepor linhas de comando, é possível manipular os conjuntos de treinamento e teste,treinar SVMs de diferentes maneiras, buscar por parâmetros ótimos das funções denúcleo e executar as classificações.

4.3 k -Vizinhos Mais Próximos

O classificador k-Vizinhos Mais Próximos (k-NN, do inglês k-Nearest Neighbors),que é um método bastante utilizado em aplicações que envolvem tarefas de classifi-cação, pois é de fácil entendimento e implementação. O k-NN é um classificador ondeo aprendizado é baseado na analogia com relação às distâncias entre vizinhos [70].

A regra de classificação do k-NN [71] é um método de classificação supervisio-nado e não-paramétrico, onde um padrão é dito pertencer a uma classe de acordocom a quantidade de vizinhos que pertençam a essa classe, conforme um critério dedistância, normalmente usa-se a distância Euclidiana.

A técnica k-NN faz parte do chamado lazy learning, pois não há um treinamentoexplícito, considerando que cada padrão de treinamento é adicionado nos vetoresde treinamento, diferente do SVM e da ANN-MLP com backpropagation que estão,respectivamente, no contexto de aprendizado estatístico e conexionista. Logo, umade suas principais vantagens do k-NN é o pequeno tempo de treinamento, pois seresume apenas a adicionar padrões nos vetores. O conjunto de treinamento é formadopor vetores n-dimensionais e cada elemento deste conjunto representa um ponto noespaço n-dimensional.

O k-NN é um método de classificação que não possui processamento na fase detreinamento. Para cada padrão de teste é calculada a distância entre ele e todos ospadrões de treinamento. Verifica-se a quais classes pertencem os k padrões maispróximos e a classificação é feita, associando-se o padrão de teste à classe que forpredominante [70]. O Algoritmo 1 implementa esta ideia.

A Figura 4.6 ilustra esse processo de classificação. Para classificar um padrão, pri-meiro tomam-se os k-vizinhos mais próximos dele e, dentro desse conjunto, encontra-

Page 63: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 4. IA PARA RECONHECIMENTO DE PADRÕES 47

se a classe mais representativa. Na Figura 4.6, o padrão Desconhecido 1 será classi-ficado como classe B e o padrão Desconhecido 2 será classificado como classe A.

Algoritmo 1 – CLASSIFICADOR k-NN

AUXILIARES: Variáveis p, q e k.

1. Para cada padrão de treinamento p de entrada q, faça2. Calcular distância entre p e q.3. Selecionar os k padrões mais próximos.4. Determinar a classe do novo padrão q, associando com a classe de maior ocorrência5. entre os k padrões, sendo que em caso de distâncias iguais entre padrões de classes6. diferentes, determine a nova classe aleatoriamente.

Figura 4.6: Processo de classificação do k-NN. Figura adaptada de [70].

Deve-se ter cuidado na escolha do parâmetro k para ser um número ímpar, poisum número par poderia causar conflito, quando um padrão tivesse o mesmo númerode vizinhos de cada classe, por exemplo. A classificação k-NN é bem simples, porémtem a desvantagem de ter que armazenar todos os dados na memória, ou seja, gerarclassificadores complexos, por causa do armazenamento, além da necessidade de serealizar muitos cálculos de distância.

O k-NN é um classificador que possui apenas um parâmetro livre (o número dek-vizinhos) que é controlado pelo usuário com o objetivo de obter uma melhor clas-sificação. Este processo de classificação pode ser computacionalmente exaustivo seconsiderado um conjunto com muitos dados. Para determinadas aplicações, no en-tanto, o processo é bem aceitável.

4.4 Floresta de Caminhos Ótimos

É apresentada nesta seção uma técnica de classificação supervisionada de pa-drões baseada em grafos, chamada Floresta de Caminhos Ótimos [13]. Abordagens

Page 64: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 4. IA PARA RECONHECIMENTO DE PADRÕES 48

baseadas em OPF tratam as amostras como sendo os nós de um grafo, sendo osarcos definidos por uma relação de adjacência e ponderados por alguma métrica dedistância aplicada em seus vetores de atributos, e diferem dos métodos tradicionaispor não utilizarem a ideia de geometria do espaço de atributos conseguindo, assim,melhores resultados em bases com outliers (amostras de uma determinada classe queestão presentes em uma região de outra classe no espaço de atributos) e sobrepo-sição de classes. Duas abordagens supervisionadas já foram propostas atualmente,as quais diferem tanto na relação de adjacência e na função de valor de caminho uti-lizadas, quanto na maneira de encontrar os protótipos. A primeira delas utiliza comorelação de adjacência o grafo completo e busca como protótipos as amostras quepertencem à intersecção entre as classes no conjunto de treinamento [13, 14]. Aoutra metodologia desenvolvida utiliza um grafo k-NN (k-Nearest Neighbor, ou seja,k-vizinhos mais próximos) e encontra os protótipos como sendo os máximos regionaisou amostras de cada classe na junção entre as densidades [72, 73]. Será abordadaaqui a primeira técnica desenvolvida, ou seja, aquela que faz uso do grafo completo,pois é a mais utilizada. É apresentado, também, um algoritmo de treinamento paraesta versão de OPF.

4.4.1 Classificador por OPF

A técnica de classificação supervisionada baseada em florestas de caminhos óti-mos apresentada neste capítulo modela as amostras como sendo os nós de um grafocompleto. Os elementos mais representativos de cada classe do conjunto de treina-mento, isto é, os protótipos, são escolhidos como sendo os elementos pertencentesàs regiões de fronteira entre as classes. Os protótipos participam de um processo decompetição disputando as outras amostras oferecendo-lhes caminhos de menor custoe seus respectivos rótulos. Ao final deste processo, é obtido um conjunto de treina-mento particionado em árvores de caminhos ótimos, sendo que a união das mesmasremete a uma floresta de caminhos ótimos. Esta abordagem apresenta vários benefí-cios com relação a outros métodos de classificação de padrões supervisionados: (i) élivre de parâmetros, (ii) possui tratamento nativo de problemas multiclasses e (iii) nãofaz alusão sobre forma e/ou separabilidade das classes.

4.4.2 Fundamentação Teórica

Seja Z uma base de dados λ-rotulada e Z1 e Z2 os conjuntos de treinamento eteste, respectivamente, com |Z1| e |Z2| amostras, tal que Z = Z1 ∪ Z2. Seja λ(s) umafunção que associa o rótulo correto i, i = 1, 2, . . . , c da classe i a qualquer amostra s ∈Z1 ∪ Z2. Seja S ∈ Z1 um conjunto de protótipos de todas as classes (isto é, amostrasque melhor representam as classes). Seja ~o um algoritmo que extrai n atributos dequalquer amostra s ∈ Z1 ∪ Z2, e retorna um vetor de atributos ~o(s) ∈ <m. A distânciad(s, t) entre duas amostras, s e t, é dada pela distância entre seus vetores de atributos

Page 65: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 4. IA PARA RECONHECIMENTO DE PADRÕES 49

~o(s) e ~o(t). O problema consiste em usar S, (~v, d) e Z1 para projetar um classificadorótimo, o qual pode predizer o rótulo correto λ(s) de qualquer amostra s ∈ Z2. Assimsendo, é proposto um classificador que cria uma partição discreta ótima, a qual éuma floresta de caminhos ótimos computada em <m pelo algoritmo da transformadaimagem floresta [74].

Seja (Z1, A) um grafo completo cujos nós são as amostras em Z1, onde qualquerpar de amostras define um arco em A (isto é, A = Z1 × Z1) (Figura 4.7a). Noteque os arcos não precisam ser armazenados e o grafo não precisa ser explicitamenterepresentado.

Tem-se, também, que um caminho em um grafo é uma sequência de amostrasπsk = 〈s1, s2, . . . , sk〉, onde (si, si+1) ∈ A para 1 ≤ i ≤ k−1. Um caminho é dito ser trivialse πs = 〈s〉. Associa-se a cada caminho πs um valor dado por uma função de valor decaminho f , denotada f(πs). É dito que um caminho πs é ótimo se f(πs) ≤ f(τs) paraqualquer caminho τs, onde πs e τs terminam na mesma amostra s, independente desua origem. Também denota-se πs · 〈s, t〉 a concatenação do caminho πs com términoem s e o arco (s, t). O algoritmo da OPF pode ser utilizado com qualquer função devalor de caminho suave [74]. Uma função de valor de caminho f é suave quando,para qualquer amostra t, existe um caminho ótimo πt o qual é trivial ou possui a formaπs · 〈s, t〉, onde

• f(πs) ≤ f(πt);

• πs é ótimo, e

• para qualquer caminho ótimo τs, f(τs · 〈s, t〉) = f(πt).

Na versão OPF com grafo completo a função de custo abordada foi a fmax, a qual édefinida como:

fmax(〈s〉) =

{0 se s ∈ S,+∞ caso contrário

fmax(πs · 〈s, t〉) = max{fmax(πs), d(s, t)}, (4.40)

onde fmax(πs) computa a distância máxima entre amostras adjacentes em πs, quandoπs não é um caminho trivial.

O algoritmo baseado em OPF associa um caminho ótimo P ∗(s) de S a toda amostras ∈ Z1, formando uma floresta de caminhos ótimos P (uma função sem ciclos, a qualassocia a todo s ∈ Z1 seu predecessor P (s) em P ∗(s), ou uma marca nil quandos ∈ S, como mostrado na Figura 4.7d). Seja R(s) ∈ S a raiz de P ∗(s) a qual pode seralcançada por P (s). O algoritmo computa, para cada s ∈ Z1, o custo V (s) de P ∗(s), orótulo L(s) = λ(R(s)) e o seu predecessor P (s), como segue (Algoritmo 2).

Page 66: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 4. IA PARA RECONHECIMENTO DE PADRÕES 50

Algoritmo 2 – CLASSIFICADOR SUPERVISIONADO BASEADO EM FLORESTA DE CAMI-NHOS ÓTIMOS USANDO GRAFO COMPLETO

ENTRADA: Um conjunto de treinamento Z1 λ-rotulado, protótipos S ⊂ Z1 e o par (v, d)

para vetor de atributos e cálculo das distâncias.SAÍDA: Floresta de caminhos ótimos P , mapa de valores de custo de caminhos V e

mapa de rótulos LAUXILIARES: Fila de prioridades Q, e variável cst.

1. Para todo s ∈ Z1, faça P (s)← nil e V (s)← +∞.2. Para todo s ∈ S, faça3. V (s)← 0, P (s)← nil, L(s) = λ(s)

4. Insira s em Q.5. Enquanto Q é não vazia, faça6. Remova de Q uma amostra s tal que V (s) é mínimo.7. Para cada t ∈ Z1 tal que s 6= t e V (t) > V (s), faça8. Calcule cst← max{V (s), d(s, t)}.9. Se cst < V (t), então10. Se V (t) 6= +∞, então remova t de Q.11. P (t)← s, L(t)← L(s) e V (t)← cst.12. Insira t em Q.

As Linhas 1–4 inicializam os mapas e inserem protótipos em Q. O laço principalcalcula um caminho ótimo de S para cada amostra s ∈ Z1 em uma ordem não de-crescente de custos (Linhas 5–12). A cada iteração um caminho de custo de ótimoV (s) é obtido em P (Linha 6). Empates são resolvidos em Q utilizando a política FIFO(first-in-first-out), ou seja, quando dois caminhos atingem uma determinada amostras com o mesmo custo mínimo, s é associado ao primeiro caminho que o atingiu. Orestante das linhas avalia se o caminho que atinge uma amostra adjacente t atravésde s é mais barato que o caminho que termina em t. Caso positivo, atualiza Q, P (t),L(t) e V (t). No final do algoritmo, V armazena o valor do custo do caminho ótimo deS a cada amostra s ∈ Z1 de acordo com fmax.

4.4.3 Treinamento

A fase de treinamento do classificador baseado em floresta de caminhos ótimosusando o grafo completo consiste, basicamente, em encontrar o conjunto S de protó-tipos, ou seja, os elementos mais representativos de cada classe e iniciar o processode competição entre eles no conjunto de treinamento. Várias heurísticas poderiamser adotadas como, por exemplo, uma escolha aleatória de protótipos. Entretanto, talescolha pode prejudicar o desempenho do classificador, tornando-o instável e com umalto grau de sensibilidade com relação aos protótipos escolhidos. Deseja-se, assim,

Page 67: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 4. IA PARA RECONHECIMENTO DE PADRÕES 51

estimar protótipos nas regiões de sobreposição de amostras e nas fronteiras entre asclasses, visto que são regiões muito susceptíveis a erros de classificação.

Computando uma Árvore de Espalhamento Mínima (Minimum Spanning Tree -MST ) no grafo completo (Z1, A), é obtido um grafo conexo acíclico cujos nós são to-das as amostras em Z1, e os arcos são não direcionados e ponderados (Figura 4.7b).Seus pesos são dados pela distância d entre os vetores de atributos de amostras adja-centes. Esta árvore de espalhamento é ótima no sentido em que a soma dos pesos deseus arcos é mínima se comparada a outras árvores de espalhamento no grafo com-pleto. Os protótipos a serem escolhidos são os elementos conectados na MST comdiferentes rótulos em Z1, isto é, elementos mais próximos de classes diferentes (Fi-gura 4.7c). Removendo-se os arcos entre classes diferentes, tais amostras adjacentestornam-se protótipos em S e o Algoritmo 2 pode computar uma floresta de caminhosótimos em Z1 (Figura 4.7d). Note que uma dada classe pode ser representada pormúltiplos protótipos (isto é, árvores de caminhos ótimos) e deve existir pelo menos umprotótipo por classe.

0.2

0.4

0.8

0.5

1.0

0.9 0.5

0.3

0.7

0.6

1.0

0.7

0.7

0.8

0.8

0.2

0.4

0.5

0.3

0.5

0.2

0.4

0.5

0.3

0.5

(a) (b) (c)

(0.0,1)

(0.4,1)

(0.5,1)

(0.0,2)

(0.3,2)

(0.5,2)

(0.0,1)

(0.4,1)

(0.0,2)

(0.3,2)

(0.5,2)

0.5

0.4

0.80.9

0.6

(0.5,1) 0.3(?,?)

(0.0,1)

(0.4,1)

(0.5,1)

(0.0,2)

(0.3,2)

(0.5,2)

0.9

(0.4,2)

(d) (e) (f)

Figura 4.7: (a) Grafo completo ponderado nas arestas para um determinado conjunto de trei-namento. (b) MST do grafo completo. (c) Protótipos escolhidos como sendo os elementosadjacentes de classes diferentes na MST (nós circulados). (d) Floresta de caminhos ótimosresultante para a função de valor de caminho fmax e dois protótipos. Os identificadores (x, y)acima dos nós são, respectivamente, o custo e o rótulo dos mesmos. A seta indica o nó prede-cessor no caminho ótimo. (e) Uma amostra de teste (triângulo) da classe 2 e suas conexões(linhas pontilhadas) com os nós do conjunto de treinamento. (f) O caminho ótimo do protótipomais fortemente conexo, seu rótulo 2 e o custo de classificação 0.4 são associados a amostrade teste. Note que, mesmo a mostra de teste estando mais próxima de um nó da classe 1, elafoi classificada como sendo da classe 2. Figura extraída de [13].

Page 68: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 4. IA PARA RECONHECIMENTO DE PADRÕES 52

4.4.4 Classificação

Para qualquer amostra t ∈ Z2, considera-se todos os arcos conectando t comamostras s ∈ Z1, tornando t como se fosse parte do grafo original (ver Figura 4.7e,onde a amostra t é representada pelo triângulo no grafo). Considerando todos ospossíveis caminhos entre S e t, deseja-se encontrar o caminho ótimo P ∗(t) de S até tcom a classe λ(R(t)) de seu protótipo R(t) ∈ S mais fortemente conexo. Este caminhopode ser identificado incrementalmente, avaliando o valor do custo ótimo V (t) comosegue:

V (t) = min{max{V (s), d(s, t)}}. ∀s ∈ Z1. (4.41)

Seja s∗ ∈ Z1 o nó que satisfaz a equação acima (isto é, o predecessor P (t) no caminhoótimo P ∗(t)). Dado que L(s∗) = λ(R(t)), a classificação simplesmente associa L(s∗)

como a classe de t (Figura 4.7f). Um erro ocorre quando L(s∗) 6= λ(t).

4.5 Redes Bayesianas

As redes Bayesianas são estruturas gráficas para representar relações probabi-lísticas englobando um grande número de variáveis e a interferência estatística entreelas. A representação das variáveis e das suas relações são feitas utilizando a teoriados grafos, onde os nós são as variáveis e os arcos são as relações entre elas [75].

Conforme [76], uma rede Bayesiana é composta dos seguintes itens:

• Um conjunto de variáveis e um conjunto de grafos ligando as variáveis;

• Cada variável tem estados finitos e mutuamente exclusivos;

• As variáveis e os grafos de ligação formam um gráfico direcionado;

• Cada variável A com pais, B1, B2, . . . , Bn possui uma tabela de probabilidadescondicionais, P (A|B1, B2, . . . , B3) associada.

A estrutura e os parâmetros de uma rede Bayesiana podem ser determinados ma-nualmente, com apoio de especialistas, ou aprendidos a partir de bases de dadosutilizando algoritmos de aprendizado de estrutura e de treinamento. Um exemplo defácil compreensão está mostrado na Figura 4.8, onde uma determinada doença geraum determinado sintoma e tem como indicadores de risco a idade, a profissão e oclima em que vive o paciente [77].

O nó “Sintoma” tem o nó “Doença” como pai e três ancestrais “Idade”, “Profissão”e “Clima”. Isso representa que a probabilidade de o “Sintoma” se manifestar é direta-mente dependente da “Doença” ocorrer, que é o seu nó pai. Já a probabilidade dessaocorrer é proporcional a três fatores (nós pais) que são a “Profissão”, o “Clima” e a“Idade”. Como esses três não possuem nós pais, pode-se afirmar que o “Clima” é in-dependente da “Idade”, que é independente da “Profissão”, o que é bastante intuitivo.

Page 69: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 4. IA PARA RECONHECIMENTO DE PADRÕES 53

Figura 4.8: Exemplo de Rede Bayesiana.

Pode-se inferir ainda que o “Sintoma” é indiretamente dependente dos nós ancestrais“Idade”, “Clima” e “Profissão” através de sua ligação com o nó “Doença”. A Equação(4.42) representa a probabilidade dessa Rede Bayesiana utilizada como exemplo:

P (i, p, c, d, s) = P (i) ∗ P (p) ∗ P (c) ∗ P (d) ∗ P (d|i, p, c) ∗ P (s|d), (4.42)

onde i = Idade, p = Profissão, c = Clima, d = Doença e s = Sintoma.

4.6 Considerações Finais

Neste capítulo foram apresentadas as técnicas de inteligência artificial para reco-nhecimento de padrões utilizadas para classificar os perfis de consumidores do con-junto de dados. No capítulo a seguir, são abordados os algoritmos evolutivos para aseleção de características utilizados nos experimentos realizados no desenvolvimentoda tese.

Page 70: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

Capítulo 5

Técnicas Evolutivas para Otimização

Técnicas evolutivas tem sido vistas como uma maneira elegante de modelar o pro-blema de seleção de características, em que um subconjunto de características quemaximiza a taxa de reconhecimento de alguma técnica de aprendizado de máquinapode ser encontrado. Neste trabalho, diversas técnicas evolutivas são abordadas paraeste problema, entre elas: Particle Swarm Optimization, Harmony Search, Gravita-tional Search Algorithm, Cuckoo Search, Bat Algorithm, Firefly Agorithm e ChargedSystem Search. Nas próximas seções são discutidas essas técnicas no contexto deseleção de características.

5.1 Particle Swarm Optimization - PSO

5.1.1 Teoria Básica

Recentemente, várias aplicações tem utilizado técnicas evolucionárias como mé-todos heurísticos para encontrar soluções ótimas ou pseudo-ótimas. Uma atençãoparticular tem sido dada à técnica denominada Otimização por Enxame de Partículas,devido à sua simplicidade e eficácia. Basicamente, PSO é um algoritmo modelado eminteligência coletiva que encontra uma solução em um espaço de busca com base nadinâmica do comportamento social [10]. Cada possível solução do problema é mo-delada como uma partícula do enxame que imita seu vizinho baseando-se em umafunção objetivo.

Outras definições consideram PSO como um algoritmo de pesquisa baseado emprocessos estocásticos e populacionais, onde a aprendizagem do comportamento so-cial permite a cada solução possível (partícula) “voar” dentro desse espaço (enxame)a procura de outras partículas que possuam melhores características e, assim, maxi-mizando a função objetivo.

Cada partícula tem uma memória para armazenar sua melhor solução local (máxi-mos locais) e a melhor solução global (máximos globais). Levando-se em conta essasinformações, cada partícula tem a capacidade de imitar as outras que proporcionam aela melhores posições no enxame. Este processo simula a interação social entre umbando de aves a procura de comida, por exemplo. Esse mecanismo sócio-recognitivo

54

Page 71: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 5. TÉCNICAS EVOLUTIVAS PARA OTIMIZAÇÃO 55

pode ser resumido em três grandes princípios [10]: (i) avaliação, (ii) comparação e(iii) imitação. Cada partícula pode avaliar outras dentro de sua vizinhança através dealguma função objetivo, pode compará-la com seu próprio valor e, finalmente, podedecidir se é uma boa escolha imitá-la.

O enxame é modelado como sendo um espaço multidimensional <m, em que cadapartícula pi = (xi, vi) ∈ <m tem duas características principais: (i) sua posição xi e(ii) velocidade vi. As melhores soluções (posição no enxame) local xi e global g sãotambém conhecidas (Figura 5.1).

Figura 5.1: Interpretação geométrica do PSO. Figura adaptada de [10].

Após a definição do tamanho do enxame, ou seja, do número de partículas, cadauma delas é inicializada com valores aleatórios de velocidade e posição. Cada indi-víduo é então avaliado com relação a alguma função objetivo e seu máximo local éatualizado. No final, o valor máximo global é atualizado com a partícula que alcançoua melhor posição no enxame. Este processo é repetido até que algum critério de con-vergência seja atingido. A posição atualizada e equações da velocidade da partículapi da forma mais simples que governam PSO são, respectivamente, dadas por

vi = wvi + c1r1(xi − xi) + c2r2(g − xi) (5.1)

exi = xi + vi, (5.2)

onde w é a força de inércia que controla o poder de interação entre as partículas, er1, r2 ∈ [0, 1] são variáveis aleatórias que dão a ideia de estocasticidade ao métodoPSO. As constantes c1 e c2 são também utilizadas para guiar as partículas e definidascomo parâmetros de entrada para o algoritmo.

Page 72: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 5. TÉCNICAS EVOLUTIVAS PARA OTIMIZAÇÃO 56

5.1.2 PSO para Seleção de Características

Firpi e Goodman [78] aplicaram Binary Particle Swarm Optimization (BPSO) parafins de seleção de características, já que a ideia é bastante simples: modelar cadasolução possível como uma partícula do enxame. Toda a dinâmica de enxame éorientada pela taxa de reconhecimento de um classificador como a função objetivo.Portanto, o subconjunto de características que maximiza a taxa de reconhecimentoserá o escolhido pelo BPSO. Basicamente, pode-se usar um conjunto de treinamentoe de avaliação, a fim de conduzir qualquer algoritmo evolutivo baseado em seleçãode características: em primeiro lugar, o classificador é treinado sobre o conjunto detreinamento, e depois é avaliado sobre o conjunto de avaliação, classificando suasamostras. Assim, a taxa de acerto sobre este conjunto é usada como a função objetivopara orientar o algoritmo de otimização. O Algoritmo 3 implementa esta ideia.

Algoritmo 3 – SELEÇÃO DE CARACTERÍSTICA ATRAVÉS DE PSO

ENTRADA: Conjuntos de treinamento Z1 e de avaliação Z2 λ-rotulados, valor do peso deinércia w, tamanho do enxame n, número de características (dimensão) m,número de interações T , valores c1 e c2.

SAÍDA: Subconjunto de características H∗ que fornece a máxima taxa de acerto so-bre Z2.

AUXILIARES: Vetor função objetivo f com tamanho n, vetor de melhor posição global ~g comtamanho n, e variáveis i, j, r1, r2, c1, c2, k, acc, maxfit, globalfit, maxindexe γ.

1. Para cada partícula pi (∀i = 1, . . . , n), faça2. Para cada dimensão j (∀j = 1, . . . ,m), faça3. xi,j ← aleatório{0, 1}.4. vi,j ← 0.5. fi ← −∞.6. globalfit← −∞.7. Para cada iteração t (t = 1, . . . , T ), faça8. Para cada partícula pi (∀i = 1, . . . , n), faça9. Crie Z ′1 e Z ′2 de Z1 e Z2, respectivamente,10. tal que ambos contenham apenas características em pi em11. em xi,j 6= 0, ∀j = 1, . . . ,m.12. Treine o classificador sobre Z ′1 , avalie-o sobre Z ′2 e13. armazene a taxa de acerto em acc.14. Se (acc > fi), então15. fi ← acc.16. Para cada dimensão j (∀j = 1, . . . ,m), faça17. xi,j ← xi,j .18. [maxfit,maxindex]← max(f)

Page 73: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 5. TÉCNICAS EVOLUTIVAS PARA OTIMIZAÇÃO 57

19. Se (maxfit > globalfit), então20. globalfit← maxfit.21. Para cada dimensão j (∀j = 1, . . . ,m), faça22. gj ← xmaxindex,j .23. Para cada partícula pi (∀i = 1, . . . , n), faça24. Para cada dimensão j (∀j = 1, . . . ,m), faça25. r1 ← valor aleatório uniforme.26. r2 ← valor aleatório uniforme.27. k ← c2 ∗ r2 ∗ (gj − xi,j).28. vi,j ← w ∗ vi,j + c1 ∗ r1 ∗ (xi,j − xi,j) + k.29. γ ← valor aleatório uniforme.30. Se (γ < 1

1+e−vi,j ), então31. xi,j ← 1.32. Senão xi,j ← 0.33. Para cada dimensão j (∀j = 1, . . . ,m), faça34. H∗j ← gj .35. Retorne H∗.

O primeiro laço nas Linhas 1 − 6 inicializa o enxame com valores binários paraa posição de cada partícula (Linhas 2 − 3), que corresponde se uma característicaserá selecionada ou não para compor o novo conjunto de dados. As Linhas 8 − 17

constituem os novos conjuntos de treinamento e de avaliação com as característicasselecionadas e avaliam cada partícula, a fim de atualizar sua função objetivo (Linhas14 − 17). As Linhas 18 − 22 encontra a melhor solução do enxame e, finalmente, asLinhas 23 − 32 atualiza a posição de cada partícula de acordo com a Equação (5.1)(Linha 28). Como se trabalha com um espaço de busca binária, a posição da novapartícula só pode assumir valores binários. Assim, a estrutura condicional na Linha 30

foi idêntico ao proposto por Kennedy e Eberhart [79], que apresentaram uma versãobinária de PSO, ou seja, BPSO (Binary PSO). O vetor saída com as característicasselecionadas é constituído nas Linha 33− 34 e retornado na Linha 35.

5.2 Gravitational Search Algorithm - GSA

5.2.1 Teoria Básica

A gravidade é uma das quatro interações fundamentais da natureza, juntamentecom a força forte, o eletromagnetismo e a força nuclear fraca. A ideia que diz respeitoàs regras de gravidade é o fato de que um objeto com massa maior atrai outro. Umadas teorias mais aceitas é a lei da gravitação universal de Newton, que diz que “todasas partículas no universo atraem outras com uma força que é diretamente proporcionalao produto das suas massas e inversamente proporcional ao quadrado da distância

Page 74: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 5. TÉCNICAS EVOLUTIVAS PARA OTIMIZAÇÃO 58

entre elas” [80], ou seja:

F = GM1M2

R2, (5.3)

onde M1 e M2 correspondem às massas de duas partículas, R é a distância entre elas,G é uma constante gravitacional e F é a magnitude da força gravitacional (Figura 5.2).A “constante gravitacional” G é dependente do tempo, e diminui com a idade do uni-verso:

G(t) = G(t0)t0t

β

, β < 1, (5.4)

em que G(t) é o valor da constante gravitacional no tempo t e G(t0) é o valor daconstante gravitacional no momento da “criação do universo” que está sendo conside-rado [81].

Figura 5.2: Aceleração de uma massa na direção da força resultante de outras massas. Ex-traído de [82].

A segunda lei de Newton diz que quando uma força F é aplicada a uma massa, asua aceleração a depende somente dessa força e da sua massa M :

a =F

M. (5.5)

Com base nas afirmações acima, Rashedi et al. [82] propuseram o Algoritmo deBusca Gravitacional (Gravitational Search Algorithm - GSA), que pode ser definidocomo segue. Seja X = {x1, x2, . . . , xn} um universo com n massas, de modo quexi ∈ <m. Pode-se definir, em um momento específico t, a força que age sobre amassa i a partir da massa j na dimensão d da seguinte forma:

F dij(t) = G(t)

Mi(t)Mj(t)

Rij(t) + ε(xdj (t)− xdi (t)), (5.6)

Page 75: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 5. TÉCNICAS EVOLUTIVAS PARA OTIMIZAÇÃO 59

onde Rij(t) é a distância euclidiana entre as massas i e j, e ε é uma pequena cons-tante.

A fim de dar um comportamento estocástico para o GSA, Rashedi et al. [82] as-sumem a força total que age sobre o agente i em uma dimensão d como uma somaaleatória ponderada das forças exercidas de outros agentes:

F di (t) =

m∑j=1,j 6=i

γjFdij(t), (5.7)

onde γj denota um número gerado aleatoriamente entre 0 e 1. A aceleração da massai em tempo t e dimensão d é dada por:

adi (t) =F di (t)

Mi(t), (5.8)

em que a massa Mi é calculada do seguinte modo:

Mi(t) =qi(t)∑mj=1 qj(t)

, (5.9)

comqi(t) =

Ci(t)− w(t)

b(t)− w(t). (5.10)

Os termos w(t) e b(t) significam, respectivamente, as massas com melhor e pior valorde função objetivo. O termo Ci(t) denota o vetor de características da massa i, ouseja, o conjunto de variáveis a serem otimizadas, as quais estão representadas pelamassa i.

Finalmente, para evitar soluções ótimas locais, somente as k melhores massas, ouseja, aquelas com maiores valores de função objetivo, vão atrair as outras. Seja Kum conjunto dessas massas. O valor de k é definido como k0 no início do algoritmo ediminui com o tempo. Assim, a Equação (5.7) é reescrita como

F di (t) =

∑j∈K,j 6=i

γjFdij(t). (5.11)

A velocidade e a posição de atualização das massas são dadas por:

vdi (t+ 1) = γjvdi (t) + adi (t) (5.12)

xdi (t+ 1) = xdi (t) + vdi (t+ 1). (5.13)

Entretanto, a Equação (5.13) não pode ser aplicada em problemas de otimizaçãoque requerem espaços binários. Portanto, Rashedi et al. [83] propuseram o GSAbinário, que possui uma equação diferente para atualizar a posição de cada massa:

Page 76: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 5. TÉCNICAS EVOLUTIVAS PARA OTIMIZAÇÃO 60

xdi (t+ 1) =

{1− xdi (t) se γi < S(vdi (t+ 1))

xdi (t) caso contrário,(5.14)

tal queS(vdi (t)) =

∣∣tanh(vdi (t))∣∣ . (5.15)

A fim de alcançar uma boa taxa de convergência, Rashedi et al. [83] propuseramlimitar a velocidade para

∣∣vdi ∣∣ < vmax = 6. Segundo eles, esse valor foi obtido atravésde algumas experiências.

5.2.2 GSA para Seleção de Características

O algoritmo para a seleção de característica desenvolvido neste trabalho funcionade forma semelhante: a ideia principal é a utilização de uma taxa de acerto de umclassificador sobre um conjunto de avaliação como a função objetivo para orientar oGSA em busca das melhores soluções [84]. O Algoritmo 4 implementa esta ideia.

Algoritmo 4 – ALGORITMO GSA BASEADO EM SELEÇÃO DE CARACTERÍSTICAS

ENTRADA: Conjuntos de treinamento Z1 e de avaliação Z2 rotulados, constante gravita-cional inicial G0, número de massas m, dimensão n, número de interações Te k e valores ε.

SAÍDA: Subconjunto de características H∗ que fornece a máxima taxa de acerto so-bre Z2.

AUXILIARES: Vetor função objetivo f com tamanho m, vetores auxiliares q, F , M ′ e x′ detamanhos m, vetor massa M de tamanho m, matrizes F e a de tamanhosm× n, conjuntos Z ′1 e Z ′2 e variáveis G, bindex, windex, i, j, z, R e p.

1. Para cada partícula de massa pi (∀i = 1, . . . ,m), faça2. Para cada dimensão j (∀j = 1, . . . , n), faça3. xi,j ← aleatório{0, 1}.4. vi,j ← 0.5. fi ← −∞.6. G← G0.7. Para cada iteração t (t = 1, . . . , T ), faça8. G← G ∗ (1− t

T ).

9. Para cada partícula de massa pi (∀i = 1, . . . ,m), faça10. Crie Z ′1 e Z ′2 de Z1 e Z2, respectivamente,11. tal que ambos contenham apenas características em pi em12. que xi,j 6= 0, ∀j = 1, . . . ,m.13. Treine um classificador sobre Z ′1, avalie-o sobre Z ′2 e14. armazene a taxa de acerto em fi.15. bindex← b(p).16. windex← w(p).

Page 77: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 5. TÉCNICAS EVOLUTIVAS PARA OTIMIZAÇÃO 61

17. tmp← 0.18. Para cada partícula de massa pi (∀i = 1, . . . ,m), faça19. qi← fi−fwindex

fbindex−fwindex.

20. tmp← tmp+ qi.21. Para cada partícula de massa pi (∀i = 1, . . . ,m), faça22. Mi ← qi

tmp .

23. Ordene massas em ordem decrescente de sua função objetivo, e24. armazene-as em M ′.25. x′ ←M ′.26. Para cada partícula de massa pi (∀i = 1, . . . ,m), faça27. Para cada dimensão j (∀j = 1, . . . , n), faça28. Fi ← 0.29. Para z de 1 até k, faça30. Fij ← G ∗ Mi∗Mz

R+ε ∗ (xij − x′zj).31. Fi ← γi ∗ Fij .32. aij ← Fi

Mi.

33. k ← k − 1.34. Para cada partícula de massa pi (∀i = 1, . . . ,m), faça35. Para cada dimensão j (∀j = 1, . . . , n), faça36. vij ← γj ∗ vij + aij .37. Se (|vij | > 6), então38. Se (vij < 0), então vij ← −6.39. Senão vij ← 6.40. Se (γ∗j < |tanh(vij)|), então41. xij ← 1− xij .42. tmp← −∞.43. Para cada partícula de massa pi (∀i = 1, . . . ,m), faça44. Se fi > tmp, então45. tmp← fi, z ← i.46. Para cada dimensão j (∀j = 1, . . . , n), faça47. H∗j ← xzj .48. Retorne H∗.

O primeiro laço nas Linhas de 1 − 5 inicializa o universo das massas com valoresbinários para a posição de cada partícula (Linhas 2 − 3), que corresponde se umacaracterística será selecionada ou não para compor o novo conjunto de dados. Va-lores de velocidade e função objetivo também são inicializados com valores 0 e −∞,respectivamente. Linhas 9 − 14 constituem os novos conjuntos de treinamento e deavaliação com as características selecionadas e avaliam cada partícula de massa afim de atualizar o valor da função objetivo (Linhas 13− 14). Linhas 15 e 16 encontramos índices das massas que fornecem os melhores e piores valores da função objetivo,

Page 78: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 5. TÉCNICAS EVOLUTIVAS PARA OTIMIZAÇÃO 62

respectivamente. O laço interno nas Linhas 18− 20 calcula qi de acordo com a Equa-ção (5.10). A massa de cada partícula é calculada nas Linhas 21− 22, como descritona Equação (5.9).

As Linhas 23−24 ordenam o universo das massas de acordo com a ordem decres-cente de seus valores da função objetivo e o armazena na variável M ′. Uma cópia éarmazenada em x′ (Linha 25). O laço nas Linhas 26− 32 calcula a aceleração de cadamassa de acordo com a Equação (5.8) (Linha 32). O laço interno de Linhas 29 − 31

calcula as Equações (5.6) e (5.11) para a melhor massa k, como descrito anterior-mente. O valor de k decresce no tempo (idade do universo) na Linha 33. Observe queoptou-se pela redução de k para 1 unidade, pois pode ser considerado uma opção“natural”.

O laço nas Linhas 34−41 atualiza a velocidade e a posição de cada massa. A Linha36 atualiza a velocidade de acordo com a Equação (5.12) e as Linhas 40−41 atualizama posição de cada partícula de massa, como descrito pelo algoritmo GSA binário naEquação (5.14). A condição nas Linhas 37 − 39 limita a velocidade da massa para∣∣vdi ∣∣ < vmax = 6. Finalmente, nas Linhas 42− 45 encontra-se a partícula de massa queproporciona a máxima taxa de acerto e seu valor de índice é armazenado na variávelz na Linha 45. O vetor de saída com as características selecionadas é composto nasLinhas 46− 47 e retornado pelo algoritmo na Linha 48.

5.3 Harmony Search - HS

5.3.1 Teoria Básica

A Busca Harmônica é um algoritmo evolutivo inspirado na música, considerando oprocesso de improvisação de artistas relacionados a área musical [85,86]. O HS é umconceito simples, com poucos parâmetros e rápido em sua execução. A ideia principalé utilizar o mesmo processo adotado pelos músicos para criar novas canções como intuito de obter uma solução ótima em algum processo de otimização (Figura 5.3).Basicamente, qualquer solução possível é modelada como uma harmonia e cada pa-râmetro a ser otimizado pode ser visto como uma nota musical. A melhor harmonia(solução) é escolhida como aquela que maximiza alguns critérios de otimização. Oalgoritmo é composto por algumas etapas, como descrito abaixo:

• Etapa 1: Inicializar o problema de otimização e os parâmetros do algoritmo;

• Etapa 2: Inicializar a Memória Harmônica (HM);

• Etapa 3 :Improvisar uma nova harmonia de HM;

• Etapa 4: Atualizar a HM se a nova harmonia é melhor do que a pior harmonia naHM, incluindo a nova harmonia na HM e removendo a pior harmonia da HM; e

Page 79: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 5. TÉCNICAS EVOLUTIVAS PARA OTIMIZAÇÃO 63

Figura 5.3: Analogia entre a improvisação de músicos e o processo de otimização. Extraídode [86].

• Etapa 5: Se o critério de parada não não for satisfatório, retornar para o Etapa 3.

A seguir, cada etapa mencionada é discutida.

O Problema de Otimização e os Parâmetros do Algoritmo

Para descrever como o HS funciona, um problema de otimização é especificado naEtapa 1, como segue:

max f(x) sujeito a xj ∈ Xj, ∀j = 1, 2, . . . , N, (5.16)

onde f(x) é a função objetivo, xj e Xj significam, respectivamente, variável de decisãoj e o seu conjunto de valores possíveis, e N o número de variáveis de decisão. Noteque Xj ∈ {0, 1} no caso de seleção de características, e este estende a todas asvariáveis j = {1, 2, . . . , N}. Neste caso, pode-se generalizar Xj para X.

Os parâmetros de HS necessários para resolver o problema de otimização (Equa-ção (5.16)) também são especificados nesta etapa. São eles: o tamanho da memóriaharmônica (Harmony Memory Size - HMS), taxa de consideração da memória harmô-nica (Harmony Memory Considering Rate - HMCR), taxa de ajuste de passo (PitchAdjusting Rate - PAR), e critério de parada. PAR e HMCR são parâmetros usadospara melhorar o vetor solução, ou seja, eles podem ajudar o algoritmo a encontrarmelhores soluções locais e globais (Etapa 3).

Memória Harmônica (Harmony Memory - HM)

Na Etapa 2, a matriz HM (Equação (5.17)) é inicializada vetores solução geradasaleatoriamente com os seus respectivos valores para a função objetivo:

HM =

x11 x21 . . . xN1 f(x1)

x12 x22 . . . xN2 f(x2)...

......

......

x1HMS x2HMS . . . xNHMS f(xHMS)

, (5.17)

Page 80: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 5. TÉCNICAS EVOLUTIVAS PARA OTIMIZAÇÃO 64

onde xji indica a variável de decisão j da harmonia i.

Gerando uma Nova Harmonia de HM

Na Etapa 3, um novo vetor harmonia x=(x1,x2 ,. . . , xN ) é gerado baseada nasconsiderações de memória, ajuste de passo, e aleatoriedade (improvisação musical).É possível escolher um novo valor utilizando o parâmetro HMCR, que varia entre 0 e1 como segue:

xj ←

{xj ∈

{xj1, x

j2, . . . , x

jHMS

}com probabilidade HMCR,

xj ∈ X com probabilidade (1-HMCR).(5.18)

HMCR é a probabilidade de escolher um valor a partir dos valores armazenados naHM, e (1-HMCR) é a probabilidade de escolher aleatoriamente um valor factível nãose limitando para aqueles armazenados no HM.

Além disso, toda componente j do novo vetor harmonia x é examinado para deter-minar se o passo deve ser ajustado:

Decisão de ajuste de passo para xj ←

{SIM com probabilidade PAR,

NÃO com probabilidade (1-PAR).(5.19)

O ajuste de passo é frequentemente usado para melhorar as soluções e escaparde ótimos locais. Este mecanismo altera os valores vizinhos da variável de decisão naharmonia. Assim, se a decisão para o ajuste de passo para a variável de decisão xj éSIM, xj é substituído como a seguir:

xj ← xj + rb, (5.20)

onde b é uma distância arbitrária, e r uma distribuição uniforme entre 0 e 1. Em casosde problemas de otimização binária, este cálculo não é usado.

Atualizando a HM

Na Etapa 4, se a nova harmonia é melhor que a pior harmonia da HM, este últimoé substituído por esta nova harmonia. Note que a melhor harmonia é definida comoaquela que maximiza a função objetivo

Critério de Parada

Na Etapa 5, o algoritmo de HS finaliza sua execução quando o critério de parada éatingido. Caso contrário, as Etapas 3 e 4 são repetidas a fim de improvisar novamenteuma nova harmonia.

Page 81: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 5. TÉCNICAS EVOLUTIVAS PARA OTIMIZAÇÃO 65

5.3.2 HS para Seleção de Características

O algoritmo de HS é uma abordagem interessante para diversas aplicações prin-cipalmente devido à sua simplicidade e baixo custo computacional. Da mesma forma,o classificador OPF é muito rápido para o treinamento dos padrões e, além disso, temdemonstrado ser preciso [13]. Desta forma, acredita-se que a combinação de HS eOPF pode fornecer uma solução rápida e robusta para a seleção de características,especialmente em grandes conjuntos de dados, onde o número de características aserem selecionadas é geralmente alta, bem como o número de amostras [87].

O algoritmo híbrido desenvolvido utiliza a precisão de OPF para orientar o algoritmode HS e encontrar uma solução adequada. Basicamente, para cada harmonia na HM,o classificador OPF é treinado com o subconjunto correspondente de característicasem um conjunto de treinamento, e sua taxa de acerto é avaliada sobre um conjuntode avaliação. Este procedimento é apresentado no Algoritmo 5.

Algoritmo 5 – SELEÇÃO DE CARACTERÍSTICAS ATRAVÉS DE Harmony Search

ENTRADA: Conjuntos de treinamento Z1 e de avaliação Z2 λ-rotulados , tamanho da me-mória harmônica HMS, número de características N , taxa de consideraçãoda memória harmônica HMCR e número de iterações T para convergência.

SAÍDA: Vetor harmonia H∗ de tamanho N que fornece a mais alta taxa de acerto declassificação sobre Z2.

AUXILIARES: Memória harmônica HM de tamanho HMS × (N + 1), novo vetor harmoniaH de tamanho N + 1 e variável tmp.

1. Para i← 1 até HMS, faça2. Para j ← 1 até N , faça3. HMi,j ← aleatório{0,1}.4. Crie Z ′1 e Z ′2 de Z1 e Z2, respectivamente, tal5. que ambos contenham características HMi,j = 1, j = 1, 2, . . . , N .6. Treine OPF sobre Z ′1, avalie-o sobre Z ′2 e armazene a7. taxa de acerto em HMi,N+1.8. Para k ← 1 até T , faça9. tmp← bHMCR ∗Nc.10. Para j ← 1 até tmp, faça11. Hj ← n(HMij), i = 1, 2, . . . ,HMS.12. Para j ← tmp+ 1 até N , faça13. Hj ← aleatório{0,1}, i = 1, 2, . . . ,HMS.14. Ache i tal que HMi,N+1 é mínimo.15. Se (HN+1 > HMi,N+1), então16. Para j ← 1 até N + 1, faça17. HMi,j ← Hj .18. Crie Z ′1 e Z ′2 de Z1 e Z2, respectivamente, tal

Page 82: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 5. TÉCNICAS EVOLUTIVAS PARA OTIMIZAÇÃO 66

19. que ambos contenham características HMi,j = 1, j = 1, 2, . . . , N .20. Treine OPF sobre Z ′1, avalie-o sobre Z ′2 e armazene a21. taxa de acerto em HMi,N+1.22. Ache i tal que HMi,N+1 é máximo.23. Para j ← 1 até N, faça24. H∗j ← HMi,j .25. Retorne [H∗]

O laço inicial nas Linhas 1− 7 é responsável pela inicialização da memória harmô-nica. Na Linha 3, cada posição da memória harmônica HMi,j recebe um valor binárioindicando se tal característica será selecionado ou não. Linhas 4 − 5 criam novosconjuntos de treinamento e avaliação apenas com as características previamente se-lecionadas, ou seja, HMi,j = 1, i = 1, 2, . . . , HMS e j = 1, 2, . . . , N . Nas Linhas 6− 7,o classificador OPF é treinado e avaliado com esses novos conjuntos e sua taxa deacerto sobre o conjunto de avaliação é armazenado em HMi,N+1. A Linha 9 calcula onúmero de características que serão selecionadas da memória harmônica para com-por a nova harmonia H. O laço nas Linhas 10 − 11 seleciona valores da memóriaharmônica para construir o novo vetor harmonia H. A função n(HMi,j) retorna o valormais recorrente para a característica j. Além disso, o próximo laço nas Linhas 12− 13

termina a etapa de consideração de memória, alocando valores aleatórios x ∈ {0, 1}para as posições restantes de H. Lembrando que as Linhas 9 − 13 se referem aEquação (5.18).

A Linha 14 encontra a harmonia de índice i em HMi,N+1 que alcançou a mais baixataxa de acerto de classificação sobre Z ′2, e substitui toda a harmonia HMi com a novaharmonia H obtida se HMi,N+1 for menor que a harmonia dada por HN+1 (Linhas15−17). As Linhas 18−21 são responsáveis por atualizar os valores de função objetivoda memória harmônica. As Linhas 18 − 19 criam novos conjuntos de treinamentoe de avaliação apenas com as características para HMi,j = 1, i = 1, 2, . . . , HMS

e j = 1, 2, . . . , N . Nas linhas 20 − 21, o classificador OPF é treinado e avaliadossobre esses novos conjuntos, e sua taxa de acerto sobre o conjunto de avaliação éarmazenada em HMi,N+1. Finalmente, a Linha 22 encontra a harmonia na memóriaharmônica que fornece a mais alta taxa de acerto de classificação do OPF sobre Z ′2 earmazena ela no vetor de melhor harmonia H∗ nas Linhas 23 − 24. Neste algoritmo,a etapa de ajuste do passo foi não aplicada porque o intervalo de valores para asvariáveis de decisão é composto apenas por valores binários. A Linha 25 retorna ovetor de melhor harmonia H∗.

Page 83: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 5. TÉCNICAS EVOLUTIVAS PARA OTIMIZAÇÃO 67

5.3.3 Self-adaptive Global best Harmony Search - SGHS

Nos últimos anos, várias pesquisas se concentraram para desenvolver variantesde HS [88]. Alguns deles propõem formas de estabelecer dinamicamente os parâme-tros de HS, outros propõem novos esquemas de improvisação. Mahdavi et al. [89],por exemplo, propuseram Improved Harmony Search-IHS, que difere do tradicionalmétodo HS quanto a atualização do PAR e aos valores de largura de banda de formadinâmica.

Mais tarde, Omran e Mahdavi [90] proposuseram Global-best Harmony Search-GHS, que tem exatamente os mesmos passos do IHS, exceto por empregar uma novaregra de ajuste de passo, gerando uma nova solução na geração do vetor de melhorharmonia. Zou et al. [91] propuseram Novel Global Harmony Search-NGHS, que di-fere da tradicional HS em três aspectos: em NGHS, os parâmetros HMCR e PAR sãoexcluídos, e uma probabilidade de mutação pm é então utilizado. NGHS tem um es-quema de improvisação modificado, e sempre substitui o pior harmonia com a novaharmonia.

Finalmente, Pan [92] propôs Self-adaptive Global best Harmony Search-SGHS,que tem um novo esquema de improvisação com base em GHS. Além disso, HMCR ePAR são parâmetros auto-adaptativos .

5.4 Cuckoo Search - CS

5.4.1 Teoria Básica

O comportamento parasita de algumas espécies de cuco são extremamente intri-gante. Esses pássaros podem botar seus ovos em um ninho hospedeiro, e imitamcaracterísticas externas de ovos do hospedeiro, como cor e manchas. No caso desua estratégia não for bem sucedida, o hospedeiro pode jogar fora o ovo do cuco, ousimplesmente abandonar o seu ninho, fazendo um novo em outro lugar (Figura 5.4).Com base nesse contexto, Yang e Deb [93] desenvolveram um algoritmo de otimiza-ção evolutivo denominado Cuckoo Search (CS), e eles tem resumido CS usando trêsregras, como segue:

1. Cada cuco escolhe aleatoriamente um ninho para botar ovos.

2. O número de ninhos hospedeiros disponíveis é fixo, e ninhos com alta qualidadede ovos passarão para as próximas gerações.

3. No caso de um pássaro hospedeiro descobrir o ovo de cuco, ele pode jogar oovo fora ou abandonar o ninho, e construir um ninho completamente novo.

Para o algoritmo, cada ninho hospedeiro n é definido como um agente que podeconter um simples ovo x (problema de dimensão única) ou mais de um, quando o

Page 84: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 5. TÉCNICAS EVOLUTIVAS PARA OTIMIZAÇÃO 68

Figura 5.4: Escolha aleatório de um ninho hospereiro. Extraído de [94].

problema considera múltiplas dimensões. O CS se inicia colocando a população doninho, aleatoriamente, no espaço de busca. Em cada iteração do algoritmo, os ninhossão atualizados utilizando caminhada aleatória via voos de Lévy:

xji (t) = xji (t− 1) + α⊕ Levy(λ) (5.21)

eLevy ∼ u = t−λ, (1 < λ ≤ 3), (5.22)

em que α > 0 é o parâmetro de tamanho do passo, e o produto entrywise ⊕ é se-melhante às utilizadas em PSO, e xji representa o j th ovo (característica) no ninhoi (solução), i = 1, 2, . . . ,m e j = 1, 2, . . . , d. Os voos de Lévy empregam um com-primento de passo aleatório que é desenhado a partir de uma distribuição de Lévy.Portanto, o algoritmo CS é mais eficiente em explorar o espaço de busca conformeo seu comprimento de passo é maior a longo prazo [93]. Finalmente, os ninhos quetêm ovos com o menor qualidade, são substituídos por novos de acordo com umaprobabilidade pa ∈ [0, 1].

5.4.2 Binary Cuckoo Search - BCS

No CS tradicional, as soluções são atualizadas no espaço de busca com respeitoas posições contínuas avaliadas. Ao contrário, no BCS para a seleção de caracterís-ticas, o espaço de busca é modelado como uma estrutura booleana n-dimensional,em que as soluções são atualizadas através dos cantos de um hipercubo. Além disso,como o problema é o de selecionar ou não uma determinada característica, um vetorbinário solução é utilizado, onde 1 corresponde se uma característica será selecionadapara compor o novo conjunto de dados e 0 caso contrário. Para construir este vetorbinário, emprega-se a Equação (5.24), que pode fornecer apenas os valores bináriosna estrutura booleana restringindo as novas soluções para apenas valores binários:

Page 85: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 5. TÉCNICAS EVOLUTIVAS PARA OTIMIZAÇÃO 69

S(xji (t)) =1

1 + e−xji (t)

(5.23)

xji (t+ 1) =

{1 , se S(xji (t)) > σ,0 , caso contrário,

(5.24)

em que σ ∼ U(0, 1) e xji (t) denotam o novo valor do ovo no passo de tempo t. OAlgoritmo 6 apresenta o algoritmo desenvolvido (BCS) para seleção de característicasusando o classificador OPF como a função objetivo.

Algoritmo 6 – ALGORITMO DE SELEÇÃO DE CARACTERÍSTICAS ATRAVÉS DO BCS

ENTRADA: Conjuntos de treinamento Z1 e de avaliação Z2 rotulados, parâmetro de perdap, valor de α, número de ninhos n, dimensão d, número de iterações T , valo-res de c1 e c2.

SAÍDA: Melhor posição global g.AUXILIARES: Vetor da função objetivo f com tamanho m e variáveis acc, maxfit, globalfit

e maxindex.

1. Para cada ninho ni (∀i = 1, . . . ,m), faça.2. Para cada dimensão j (∀j = 1, . . . , d), faça.3. xji (0)← Aleatório{0, 1}.4. fi ← −∞5. globalfit← −∞6. Para cada iteração t (t = 1, . . . , T ), faça.7. Para cada ninho ni (∀i = 1, . . . ,m), faça.8. Crie Z ′1 e Z ′2 de Z1 e Z2, respectivamente,9. tal que ambos contenham apenas características em ni em10. que xji (t) 6= 0, ∀j = 1, . . . , d.11. Treine OPF sobre Z ′1 , avalie-o sobre Z ′2 e12. armazene a taxa de acerto em acc.13. Se (acc > fi), então.14. fi ← acc

15. Para cada dimensão j (∀j = 1, . . . , d), faça.16. xji ← xji (t)

17. [maxfit,maxindex]← max(f)

18. Se (maxfit > globalfit), então19. globalfit← maxfit

20. Para cada dimensão j (∀j = 1, . . . , d), faça.21. gj ← xjmaxindex(t)

22. Para cada ninho ni (∀i = 1, . . . ,m), faça.23. Para cada dimensão j (∀j = 1, . . . , d), faça.

Page 86: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 5. TÉCNICAS EVOLUTIVAS PARA OTIMIZAÇÃO 70

24. Selecione os piores ninhos com pa ∈ [0, 1]

25. e substitua-os por novas soluções.26. Para cada ninho ni (∀i = 1, . . . ,m), faça.27. Para cada dimensão j (∀j = 1, . . . , d), faça.28. xji (t)← xji (t− 1) + α⊕ Levy(λ).29. Se (σ < 1

1+exji(t)

), então

30. xji (t)← 1

31. senão xji (t)← 0

O algoritmo começa com o primeiro laço nas Linhas 1 − 4, que inicializam cadaninho com um vetor de valores binários (Linha 3), e as Linhas 6 − 31 estão para olaço do algoritmo principal. Na primeira parte deste laço (Linhas 7 − 16), os novosconjuntos de treinamento e de avaliação são, então, compostos com as característicasselecionadas, e cada ninho é avaliado a fim de atualizar o seu valor da função objetivo(Linhas 13−16). As Linhas 17−21 encontram e armazenam em gj o melhor ninho como melhor vetor solução até o momento. O laço nas Linhas 22 − 25 é responsável porsubstituir os ninhos com as piores soluções usando a probabilidade p, gerando novosninhos aleatoriamente, conforme descrito em [93]. Finalmente, as Linhas 26 − 31

atualizam o vetor binário para cada ninho, restringindo as soluções geradas atravésdos voos de Lévy (Equações (5.21) e (5.22)) e da função sigmóide (Equação (5.24)).

5.5 Bat Algorithm - BA

5.5.1 Teoria Básica

Os morcegos são animais fascinantes e sua capacidade avançada de ecolocaliza-ção tem atraído a atenção de pesquisadores de diferentes áreas. A ecolocalizaçãofunciona como um tipo de sonar: morcegos, principalmente micro-morcegos, emitemum pulso alto e curto de som que atingem um objeto e, após uma fração de tempo, oeco retorna aos seus ouvidos [95]. Assim, os morcegos podem calcular o quanto elesestão de um objeto [96]. Além disso, este incrível mecanismo de orientação faz osmorcegos serem capazes de distinguir a diferença entre um obstáculo e uma presa,permitindo-lhes caçar mesmo na completa escuridão [97].

Com base no comportamento dos morcegos, Yang [98] desenvolveu uma nova e in-teressante técnica de otimização meta-heurística chamado Algoritmo do Morcego (BatAlgorithm-BA). Essa técnica foi desenvolvida explorando como um bando de morcegosfaz o rastreamento das presas ou alimentos usando sua capacidade de ecolocalização(Figura 5.5). Para modelar este algoritmo, Yang [98] idealizou algumas regras, comosegue:

1. Todos os morcegos usam a ecolocalização para o sentido de distância, e eles

Page 87: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 5. TÉCNICAS EVOLUTIVAS PARA OTIMIZAÇÃO 71

Figura 5.5: Comportamento dos morcegos. Extraído de [99].

também sabem a diferença entre alimentos/presas e obstáculos;

2. Um morcego bi voa aleatoriamente com velocidade vi na posição xi, uma frequên-cia fixa fmin, comprimento de onda λ e sonoridade A0 para procurar uma presa.Eles podem ajustar automaticamente o comprimento de onda (ou frequência)dos seus impulsos emitidos e ajustar a taxa de emissão dos pulsos r ∈ [0, 1],dependendo da proximidade do seu alvo;

3. Embora a sonoridade pode variar de muitas formas, Yang [98] assume que a so-noridade varia de um valor grande (positivo) A0 para um valor constante mínimoAmin.

O Algoritmo 7 apresenta o Bat Algorithm (adaptado de [98]):

Algoritmo 7 – Bat Algorithm

ENTRADA: Função Objetivo f(x), x = (x1, ..., xn).SAÍDA: Melhor solução x.

1. Defina a frequência do pulso fi em xi, ∀i = 1, 2, . . . ,m.2. Inicialize as taxas de pulso ri e a sonoridade Ai, i = 1, 2, . . . ,m.3. Enquanto t < T , faça4. Para cada morcego bi, faça5. Gere novas soluções através das Equações (5.25), (5.26) e (5.27).6. Se rand > ri, então

Page 88: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 5. TÉCNICAS EVOLUTIVAS PARA OTIMIZAÇÃO 72

7. Selecione uma solução entre as melhores soluções.8. Gere uma solução local em volta da melhor solução.9. Se rand < Ai e f(xi) < f(x), então10. Aceite novas soluções.11. Aumente ri e reduza Ai.12. Classifique os morcegos e ache o melhor atual x

Em primeiro lugar, a posição inicial de xi, a velocidade vi e a frequência fi sãoinicializadas para cada morcego bi. Para cada passo de tempo t, sendo T o númeromáximo de iterações, o movimento dos morcegos virtuais é dado pela atualização desua velocidade e posição, usando as Equações (5.25), (5.26) e (5.27), como se segue:

fi = fmin + (fmin − fmax)β, (5.25)

vji (t) = vji (t− 1) + [xj − xji (t− 1)]fi, (5.26)

xji (t) = xji (t− 1) + vji (t), (5.27)

onde β denota um número gerado aleatoriamente dentro do intervalo [0, 1]. Lembrandoque xji (t) denota o valor da variável de decisão j para o morcego i em tempo de passot. O resultado de fi (Equação (5.25)) é usado para controlar o ritmo e o alcance domovimento dos morcegos. A variável xj representa a atual melhor localização global(solução) para a variável de decisão j, que é alcançada comparando todas as soluçõesfornecidas pelos m morcegos.

A fim de melhorar a variabilidade das possíveis soluções, Yang [98] propôs a uti-lização de caminhos aleatórios. Primeiramente, uma solução é selecionada entre asatuais melhores soluções, em seguida, o caminho aleatório é aplicado de forma agerar uma solução nova para cada morcego que aceita a condição na Linha 5 deAlgoritmo 7:

xnew = xold + εA(t), (5.28)

em que A(t) representa a sonoridade média de todos os morcegos no tempo t eε ∈ [−1, 1] atenta para a direção e a energia do caminho aleatório. Para cada iteraçãodo algoritmo, a sonoridade Ai e a taxa de emissão do pulso ri são atualizados, comosegue:

Ai(t+ 1) = αAi(t) (5.29)

eri(t+ 1) = ri(0)[1− e(−γt)], (5.30)

Page 89: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 5. TÉCNICAS EVOLUTIVAS PARA OTIMIZAÇÃO 73

onde α e γ são os parâmetros do algoritmo. No primeiro passo do algoritmo, a taxade emissão ri(0) e a sonoridade Ai(0) são muitas vezes escolhidas aleatoriamente.Geralmente, Ai(0) ∈ [1, 2] e ri(0) ∈ [0, 1] [98]. Embora, a sonoridade e as taxas deemissão serão atualizadas somente se as novas soluções são melhoradas, o quesignifica que esses morcegos estão se movendo em direção à melhor solução.

5.5.2 Binary Bat Algorithm - BBA

Como se pode observar, no BA padrão cada morcego se move no espaço de buscapara posições de valores contínuos. No entanto, em caso de seleção de característica,o espaço de busca é modelado como uma arquitetura booleana n-dimensional, em queos morcegos se movem entre os cantos de um hipercubo. Uma vez que o problema éo de selecionar ou não uma determinada característica, a posição do morcego é entãorepresentado por vectores binários.

Nakamura et al. [100] propuseram uma versão binária do Bat Algorithm restrin-gindo a posição do novo morcego para apenas valores binários utilizando uma funçãosigmóide:

S(vji ) =1

1 + e−vji

. (5.31)

Portanto, a Equação (5.27) pode ser substituída por:

xji =

{1 , se S(vji ) > σ,0 , caso contrário

(5.32)

em que σ ∼ U(0, 1). Portanto, a Equação (5.32) pode fornecer apenas os valores biná-rios para as coordenadas de cada morcego na arquitetura booleana, que representama presença ou não das características.

5.6 Firefly Algorithm - FFA

5.6.1 Teoria Básica

O Firelfy Algorithm (FFA) é uma algoritmo de otimização metaheurística inspiradana natureza desenvolvido por Yang [101]. Inspira-se no comportamento de cintilaçãodos vaga-lumes produzida através de um processo de bioluminescência, considerandoque o brilho do vaga-lume funciona como um sistema de sinais para atrair outros vaga-lumes para acasalamento ou presas (Figura 5.6). A luz cintilante foi formulada de talforma que está associada com a função objetivo a ser otimizado. Este algoritmo utilizaas três regras idealizadas a seguir [102]:

• Todos os vaga-lumes são de um mesmo sexo de modo que um vaga-lume seráatraído por outros vaga-lumes, independentemente do seu sexo;

Page 90: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 5. TÉCNICAS EVOLUTIVAS PARA OTIMIZAÇÃO 74

Figura 5.6: Comportamento dos vaga-lumes. Extraído de [103].

• A atratividade é proporcional ao seu brilho, e para quaisquer dois vaga-lumes, omenos brilhante se moverá para o mais brilhante, no entanto, o brilho diminui àmedida que aumenta a distância entre eles. Se não houver um mais brilhante doque o outro, ele irá se mover aleatoriamente; e

• O brilho de um vaga-lume é afetado ou determinado pelo panorama da funçãoobjetivo. Para um problema de maximização, o brilho pode ser simplesmenteproporcional ao valor da função objetivo.

Na FFA, há duas questões importantes: a variação de intensidade de luz e formu-lação da atratividade [104]. Supõe-se que a atratividade de um vaga-lume é deter-minado pelo seu brilho, ou intensidade da luz, (I) que está associado com a funçãoobjetivo codificada. O brilho I de um vaga-lume em um local específico x pode serescolhido como I(x)αf(x). No entanto, a capacidade de atração β é relativa, deve-seser visto nos olhos de quem vê ou julgado por outros vaga-lumes. Assim, deve-sevariar com a distância rij entre o vaga-lume i e o vaga-lume j. Como a intensidade daluz diminui com a distância a partir da sua fonte, e a capacidade de atração varia como grau de absorção da luz, tem-se que

I(r) = I0e−ιr (5.33)

onde I0 é a intensidade da luz original, ι é um coeficiente de absorção e r é a distânciaentre o vaga-lume i e o vaga-lume j.

A atratividade é proporcional a intensidade da luz vista pelo vaga-lume adjacente,pode-se determinar a atratividade β de um vaga-lume por:

β(r) = β0e−ιr2 (5.34)

Page 91: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 5. TÉCNICAS EVOLUTIVAS PARA OTIMIZAÇÃO 75

onde β0 é a atratividade em r = 0. Pode-se substituir o expoente ιr por outras funçõescomo ιrm quando m > 0.

A distância entre dois vaga-lumes i e j em xi e xj pode ser a distância cartesiana,mas também o tempo de atraso ou qualquer forma conveniente.

O movimento de um vaga-lume i que é atraído por outro vaga-lume j mais atraenteé determinado por [102]

xi(t+ 1) = xi(t) + β0e−ιr2ij(xj − xi) + α(rand− 1

2) (5.35)

onde o segundo termo é devido a atração enquanto que o terceiro termo é de aleato-riedade com α sendo um parâmetro de aleatoriedade e rand é um gerador de númeroaleatório uniformemente distribuído em [0, 1].

O parâmetro ι caracteriza a variação da capacidade de atração e seu valor é crucialimportância na determinação da velocidade de convergência e de como o algoritmode FFA se comporta [104].

Considerando cada passo de tempo t e T o número máximo de iterações, o códigodo FFA é apresentado no Algoritmo 8.

Algoritmo 8 – Firefly Algorithm

ENTRADA: Função Objetivo f(x), x = (x1, ..., xn).SAÍDA: Melhor solução x.

1. Gere a população inicial de vaga-lumes xi (∀i = 1, 2, . . . , n).2. A intensidade da luz Ii em xi é determinado por f(xi).3. Defina o coeficiente de absorção da luz ι.4. Enquanto t < T , faça5. Para cada vaga-lume i (∀i = 1, . . . , n), faça6. Para cada vaga-lume j (∀i = 1, . . . , n), faça7. Se Ij > Ii, então8. Mova o vaga-lume i em direção ao vaga-lume j9. utilizando a Equação (5.35).10. Varie a atratividade de acordo com a distância r11. Avalie novas soluções e atualize a intensidade da luz.12. Classifique os vaga-lumes e ache o melhor vaga-lume atual.13. Resultados e visualização do pós-processamento.

5.6.2 Binary Firefly Algorithm - BFFA

Para a seleção de características foi utilizado uma abordagem binária do FireflyAlgorithm usado primeiramente em [105].

Page 92: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 5. TÉCNICAS EVOLUTIVAS PARA OTIMIZAÇÃO 76

Nessa abordagem, após a atualização da posição dos vaga-lumes de acordo coma Equação (5.35), um mapeamento entre o espaço de vetor com valor real <N e oespaço binário [0, 1]N é empregado por meio de uma regra probabilística baseadanuma transformação sigmoidal aplicada a cada componente do vetor de posição devalor real, tal como mostrado pelas Equações (5.36) e (5.37) [106]:

S(xi) =1

1 + e−xi. (5.36)

xji =

{1, se S(xi) > σ,0, caso contrário

(5.37)

onde j = 1, . . . , N e que σ ∼ U(0, 1). A Equação (5.37) emprega para a codificaçãoda posição de cada vaga-lume ser do tipo binário, tal como exigido pela a representa-ção problema, na qual representam a presença ou não das características, depois dereceber “orientação de busca” de cada vaga-lume com que se está comunicando xi,como na Equação (5.35).

5.7 Charged System Search - CSS

5.7.1 Teoria Básica

A lei de Coulomb é uma lei da física usada para descrever as interações entrepartículas eletricamente carregadas. Considere uma carga ser uma esfera sólida comraio r e volume de densidade uniforme. A força de atração Fij entre duas esferas i ej, com cargas totais qi e qj, é definido por:

Fij =keqiqjd2ij

, (5.38)

onde ke é a constante de Coulomb e dij é a distância entre as cargas.Com base na definição mencionada anteriormente, Kaveh e Talatahari [107] propu-

seram um novo algoritmo meta-heurístico chamado Charged System Search (CSS).Nesse algoritmo, cada partícula carregada (Charged Particle-CP) no sistema é afe-tado por campos elétricos de outros, gerando uma força resultante sobre cada CP,que é determinada usando as leis eletrostáticas. O movimento de interação da CP édeterminado usando as leis de Newton da mecânica (Figura 5.7). Portanto, Kaveh eTalatahari [107] têm substanciado a técnica CSS sobre as seguintes definições:

• Definição 1: A magnitude da carga qi, com i = 1, 2, ..., n, é definida considerandoa qualidade de sua solução, ou seja, o valor da função objetivo fit(i):

Page 93: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 5. TÉCNICAS EVOLUTIVAS PARA OTIMIZAÇÃO 77

Figura 5.7: Movimento de uma partícula carregada. Extraído de [107].

qi =fit(i)− fitworstfitbest− fitworst

, (5.39)

onde fitbest e fitworst denotam, respectivamente, até o momento a melhor ea pior função objetivo de todas as partículas. A distância dij entre duas CPs édado pela seguinte equação:

dij =‖~xi − ~xj‖

‖~xi−~xj2− ~xbest‖+ ε

, (5.40)

em que ~xi, ~xj e ~xbest denotam as posições do i-ésimo, j-ésimo e da melhor CPatual, respectivamente, e ε é um pequeno número positivo para evitar singulari-dades.

• Definição 2: A posição inicial de xij(0) e velocidade vij(0), para cada j-ésimavariável do i-ésima CP, com j = 1, 2, . . . ,m, é dada por:

xij(0) = xi,min + θ(xi,max − xi,min) (5.41)

evij(0) = 0, (5.42)

onde xi,max e xi,min representam os limites mais alto e o mais baixo, respectiva-mente, e θ ∼ U(0, 1)

• Definição 3: Para o problema de maximização, a probabilidade de cada CP mo-

Page 94: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 5. TÉCNICAS EVOLUTIVAS PARA OTIMIZAÇÃO 78

ver em direção a outras CPs é dada como a seguir:

pij =

{1 Se fit(j)−fitworst

fit(i)−fit(j) > θ ∨ fit(i) > fit(j),

0 caso contrário(5.43)

• Definição 4: O valor da força resultante atuando sobre uma CP j é definido como:

r = 0.1max(xi,max − xi,min) (5.44)

Fj = qj∑j,i6=j

(qir3· dij · c1 +

qid2ij· c2)pij(~xi − ~xj), (5.45)

onde c1 = 1 e c2 = 0 se dij < r, caso contrário c1 = 0 e c2 = 1.

• Definição 5: A nova posição e velocidade de cada CP é dado por

~xj(t) = θj1 · ka · Fj + θj2 · kv · ~vj(t− 1) + ~xj(t− 1) (5.46)

e~vj(t) = ~xj(t)− ~xj(t− 1), (5.47)

onde ka = 0.5(1 + tT

) e kv = 0.5(1 − tT

) são a aceleração e os coeficientes develocidade, respectivamente, sendo t as iterações atuais e T o número máximode iterações.

• Definição 6: Um número das melhores soluções até o momento é guardadoutilizando uma Memória Carregada (Charged Memory -CM). As piores soluçõessão excluídas de CM, e as novas melhores soluções são incluídas em CM.

5.8 Considerações Finais

Neste capítulo foram apresentados os algoritmos evolutivos de otimização (PSO,HS, GSA, CS, BA, FFA e CSS) para a classificação e/ou seleção de característicasutilizadas nos experimentos realizados no Capítulo 7, afim de identificar e caracterizaros perfis de consumidores do conjunto de dados.

No capítulo a seguir, é descrito o conjunto de dados disponibilizado por uma con-cessionária brasileira e a metodologia que foram utilizados nos experimentos realiza-dos durante o desenvolvimento da tese.

Page 95: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

Capítulo 6

Base de Dados eProcedimentos Metodológicos

Neste capítulo são descritos os conjuntos de dados e os procedimentos metodoló-gicos dos experimentos realizados neste trabalho.

6.1 Conjunto de Dados

Neste trabalho, não foi possível realizar experimentos com a classe residencial,pois o conjunto de dados de clientes residenciais disponibilizado não era represen-tativo, já que haviam pouquíssimas amostras de perfis de consumidores com irregu-laridades. Mesmo que estejam em menores proporções com relação ao número deconsumidores residenciais, foi considerado também o fato de que os consumidores co-merciais e industriais causam maiores impactos com relação as perdas não-técnicas.

Para os experimentos, foram utilizados dois conjuntos de dados, já rotulados, obti-dos de uma concessionária de energia elétrica brasileira, representados pelas basesBi e Bc. A primeira base é composta de 3182 amostras de perfis industriais, sendo que197 estavam em situação irregular, e a segunda por 4952 amostras de perfis de con-sumidores comerciais, das quais 270 eram irregulares. Diferentemente do habitual,onde se costuma usar curvas de carga para extrair as características, a concessio-nária forneceu uma base de dados já com as características extraídas das curvas decarga, ou seja, as curvas de carga não foram disponibilizadas. Dessa maneira, cadaperfil industrial e comercial é representado por 8 características, como a seguir:

• Demanda Faturada (DF): é o valor de demanda da potência ativa consideradapara faturamento, expressa em quilowatts (kW);

• Demanda Contratada (DC): é o valor de demanda a ser obrigatória e continua-mente disponibilizada pela concessionária, conforme valor e período de vigênciado contrato. Este valor, que é contratado pelo consumidor, deverá ser pago àconcessionária, seja ou não utilizado, expressa em quilowatts (kW);

• Demanda Máxima (Dmax): é a maior demanda de potência ativa, verificada por

79

Page 96: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 6. BASE DE DADOS E PROCEDIMENTOS METODOLÓGICOS 80

medição, no intervalo de quinze minutos durante o período de faturamento, ex-pressa em quilowatts (kW);

• Energia Reativa (ER): é a energia que flui continuamente entre os campos elé-tricos e magnéticos de um sistema de corrente alternada (AC), sem produzirtrabalho, expressa em quilovolt-amperes-reativos-hora (kVArh);

• Transformador de Potência (TP): indica o valor da potência nominal do trans-formador de potência instalado para os consumidores, expressa em quilovolt-amperes (kVA);

• Fator de Potência (FP): é a razão entre a potência ativa e a potência aparenteem um circuito. FP indica a eficiência do sistema elétrico;

• Potência Instalada (Pinst): é soma das potências nominais de equipamentos elé-tricos instalados e em condições de entrar em funcionamento na unidade consu-midora, expressa em quilowatts (kW);

• Fator de Carga (FC): é a razão entre a demanda média e a demanda máxima daunidade consumidora, registrado no mesmo período de tempo. FC é um índiceque permite verificar o quanto a energia elétrica é utilizada de forma racional.

6.1.1 Observações Adicionais

É interessante dar uma atenção especial ao fator de carga (FC) e ao fator de po-tência (FP), pois são dois importantes índices referentes a qualidade de energia e aeficiência energética.

Fator de Carga

FC é calculado como a razão entre a demanda média (Dmedia) e a demanda máxima(Dmax) da unidade consumidora (Equação (6.1)), registrado no mesmo período detempo.

FC =Dmedia

Dmax

. (6.1)

Dmedia é definida como a razão entre a energia total (εT ) e o período de T , comodescrito por

Dmedia =εTT, (6.2)

e εT é dado por ∫ T

0

D(t)dt, (6.3)

em que D(t) é a curva de demanda (Figura 6.1).

Page 97: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 6. BASE DE DADOS E PROCEDIMENTOS METODOLÓGICOS 81

Figura 6.1: Interpretação gráfica das características extraídos do perfil dos consumidores.

Este índice varia entre 0 e 1 de acordo com a Equação (6.1), deste modo, tem-seque quanto maior o valor do fator de carga obtido, melhor terá sido a utilização dascargas elétricas ao longo do tempo. Por outro lado, um fator de carga baixo podeindicar que houve concentração de consumo de energia elétrica em um curto períodode tempo, determinando alterações na demanda. A seguir, algumas situações queconduzem a esses valores baixos [108]:

• Equipamentos de grande potência, operando a plena carga somente algumashoras do período de utilização, funcionando com carga reduzida ou sendo desli-gados nos demais períodos;

• Cargas de grande porte ligadas simultaneamente;

• Curtos-circuitos e fugas de corrente; e

• Falta de programação para utilização de energia.

A melhoria do fator de carga, além de diminuir as despesas com energia consu-mida, conduz a um melhor aproveitamento e aumento da vida útil de toda a instalaçãoelétrica, inclusive de motores e equipamentos, e a uma otimização dos investimentosnas instalações. O aumento do fator de carga pode ser conseguido através de medi-das que, em sua maioria, não implica em investimentos. Estão relacionadas, a seguir,algumas delas [108]:

• Selecionar e reprogramar os equipamentos e sistemas que possam operar forado horário de maior demanda da instalação, fazendo um cronograma de utili-zação de seus equipamentos elétricos, anotando a capacidade e o regime detrabalho de cada um, através de seus horários de funcionamento;

• Evitar partidas simultâneas de motores que iniciem operação com carga;

Page 98: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 6. BASE DE DADOS E PROCEDIMENTOS METODOLÓGICOS 82

• Diminuir, sempre que possível, a operação simultânea dos equipamentos; e

• Verificar se a manutenção e a proteção da instalação elétrica e dos equipamen-tos são adequadas, de modo a se evitar a ocorrência de curtos-circuitos e fugasde corrente.

Fator de Potência

O fator de potência (FP) é um índice que indica quanto da energia foi utilizadaem trabalho e quanto foi utilizada em magnetização, respectivamente representadaatravés da potência ativa e reativa. É calculado pelo quociente da potência ativa (kW)pela potência aparente (kVA), conforme a Figura 6.2, que é igual ao cosseno do ânguloϕ (Equação (6.4)) [109].

Figura 6.2: Interpretação gráfica do cálculo do fator de potência.

FP = cos(ϕ) =P (kW )

S(kV A). (6.4)

A Resolução no 414 [29] da ANEEL estabelece um nível máximo para a utilizaçãode energia reativa pela unidade consumidora, em função da energia ativa consumida.O fator de potência indica qual a porcentagem da potência total fornecida é efetiva-mente usada como potência ativa.

Por este princípio, o nível máximo de energia reativa fornecida, sem cobrança, é odefinido pelo fator de potência de referência = 92% ou 0,92. Sempre que o fator depotência de uma unidade consumidora for inferior a 0,92 ou 92,00%, cabe a cobrançada energia e demanda reativas excedentes.

O baixo fator de potência pode ter a seguinte origem [109]:

• Nível de tensão da instalação acima da nominal;

• Motores trabalhando a vazio durante grande parte do tempo;

• Motores superdimensionados para as respectivas cargas;

• Grandes transformadores alimentando pequenas cargas, por muito tempo;

Page 99: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 6. BASE DE DADOS E PROCEDIMENTOS METODOLÓGICOS 83

• Transformadores ligados em vazio, por longos períodos;

• Lâmpadas de descarga (vapor de mercúrio, fluorescentes, etc), sem correçãoindividual do fator de potência; e

• Grande quantidade de motores de pequena potência.

Um baixo fator de potência mostra que a energia está sendo mal aproveitada epode levar as seguintes consequências [109]:

• Variações de tensão que, por sua vez, podem ocasionar a queima de motores;

• Perdas de energia dentro de sua instalação;

• Redução do aproveitamento da capacidade dos transformadores;

• Condutores aquecidos; e

• Diminuição da vida útil da instalação.

Para melhorar o FP, deve-se reduzir o consumo de energia reativa, ou seja, soli-citar menos energia reativa da concessionária. Essa redução pode ser feito de duasmaneiras basicamente: eliminação de instalações deficientes e instalação de bancode capacitores.

Efetuando-se uma correção adequada do fator de potência, obtém-se as seguintesvantagens [109]:

• Eliminação da cobrança da energia e demanda reativa excedentes nas contasde energia elétrica;

• Redução das perdas de energia elétrica;

• Os condutores tornam-se menos aquecidos;

• Diminuição das variações de tensão; e

• Liberação de uma parte da capacidade do(s) transformador(es), que pode seraproveitada por outras cargas.

6.2 Procedimentos Metodológicos

Nesta seção é apresentada a metodologia empregada para realizar os experimen-tos. O diagrama de blocos representado pela Figura 6.3 resume o emprego da me-todologia adotada de maneira sucinta, onde é possível observar a utilização de cadaconjunto de dados, ou seja, é possível notar que o conjunto de treinamento e de avali-ação serão utilizados no processo de seleção de características e o conjunto de testes

Page 100: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 6. BASE DE DADOS E PROCEDIMENTOS METODOLÓGICOS 84

Figura 6.3: Diagrama de blocos para representar a metodologia empregada.

Figura 6.4: Demonstração da metodologia através de uma arquitetura inteligente.

para classificação dos perfis de consumidores. Já o diagrama de blocos da Figura 6.4apresenta como as características e as técnicas inteligentes são utilizadas, de modoa facilitar a compreensão dos métodos empregados.

Observando a Figura 6.4, nota-se que as amostras de cada perfil de consumidorcom as 8 características descritas anteriormente servem de entrada para a arquitetura

Page 101: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 6. BASE DE DADOS E PROCEDIMENTOS METODOLÓGICOS 85

inteligente. As amostras do conjunto de teste são classificadas primeiro pelas técni-cas de inteligência artificial treinadas com as amostras do conjunto de treinamentopara determinar o classificador mais robusto, ou seja, aquele que possui maior taxade acerto. O classificador mais robusto é o escolhido para calcular as taxas de acertode maneira que possa guiar a função objetivo das técnicas evolutivas. Em seguida,as amostras do conjunto de avaliação são classificadas pelos algoritmos evolutivostreinados com as amostras do conjunto de treinamento a fim de selecionar as carac-terísticas mais relevantes que são apontados com o maior valor de função objetivo.Definidas as características mais importantes, as amostras do conjunto de teste sãonovamente classificadas para identificar a possibilidade de ocorrência de irregulari-dade dos consumidores, porém utilizando apenas as características mais relevantesselecionadas e não mais todas as oito características como anteriormente. Logo, nasaída da arquitetura inteligente se tem a caracterização e a identificação de potenciaisconsumidores com irregularidades.

6.3 Considerações Finais

Neste capítulo foi apresentado o conjunto de dados disponibilizado por uma con-cessionária brasileira, bem como a importância de algumas das características des-critas, como o fator de carga e o fator de potência, e o procedimento metodológicoempregado para o desenvolvimento do trabalho.

Ressalta-se também que técnicas computacionais não enxergam as relações entreos fundamentos teóricos das características, somente entre seus valores, de modoque justifique a possível ocorrência das perdas comerciais, por isso um conjunto commaior quantidade de características seria mais adequado para uma avaliação maisaprimorada da metodologia empregada.

A ideia da metodologia desta tese é que ela pode ser empregada em qualquer tipode consumidor, independente de sua classe de tensão. Através das característicasapresentadas anteriormente, supõe-se que os consumidores estejam conectados àrede de média tensão, mas não é pretendido especificar um tipo de consumidor.

A seguir, serão abordados os experimentos realizados através de um computadorcom um processador Intel Core i7 R© de 2,8 Ghz, 4 GB de memória RAM e, como osistema operacional, Linux Ubuntu 11.04 LTS.

Page 102: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

Capítulo 7

Resultados Experimentais

Os experimentos realizados neste capítulo geraram diversos artigos publicados emconferências e periódicos. Logo, tem-se que cada seção se trata praticamente de umartigo publicado ou que está em fase de desenvolvimento.

7.1 Experimento 1

Nesta seção, foi conduzido o experimento inicial afim de contribuir com objetivoprincipal deste trabalho, onde são abordadas as técnicas aqui desenvolvidas. O Ex-perimento 1 gerou a publicação [84].

7.1.1 Procedimentos Experimentais

No Experimento 1 foram realizadas duas rodadas: na primeira (Seção 7.1.3) é ava-liada a robustez das técnicas de reconhecimento de padrões mais conhecidas paraidentificação de perdas não-técnicas, neste caso OPF [13], SVM-RBF (com mape-amento de função núcleo RBF), SVM-noKernel (SVM sem mapeamento de funçãonúcleo), ANN-MLP, SOM e o algoritmo k-NN, usando 25% das amostras para treina-mento e 50% para o teste em ambas bases de dados (comercial e industrial). Foramrealizadas 10 iterações para o cálculo da taxa de acerto média e do tempo de treina-mento das técnicas.

Na segunda rodada (Seção 7.1.4), foi aplicado as mesmas amostras do conjuntode treinamento da rodada anterior para treinar OPF com os algoritmos evolutivos paraa seleção de características. As demais amostras não utilizadas no experimento ante-rior (25% da base de dados) foram agora aplicadas para compor uma avaliação afimde usar a taxa de acerto de OPF sobre este conjunto como a função objetivo para astécnicas de seleção de características abordadas neste trabalho. Optou-se por utilizarapenas OPF na segunda rodada, devido ao seu baixo custo computacional para o trei-namento, já que é necessário treinar o classificador para cada instância do problema,isto é, partículas em PSO, harmonias em HS e massas em GSA. Assim, denomina-sea técnica evolutiva baseada da seguinte forma:

• PSO-OPF: PSO com função objetivo guiada pela taxa de acerto de OPF sobre

86

Page 103: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 7. RESULTADOS EXPERIMENTAIS 87

o conjunto de avaliação [110];

• HS-OPF: HS com função objetivo guiada pela taxa de acerto de OPF sobre oconjunto de avaliação [87]; e

• GSA-OPF: GSA com função objetivo guiada pela taxa de acerto de OPF sobreo conjunto de avaliação [84].

Para SVM-RBF, foi utilizada a versão mais recente do pacote LibSVM [69] comotimização de parâmetros. Com relação ao SVM-noKernel, foi utilizado o pacote Li-bLINEAR [111] também com a otimização de parâmetros. Para OPF, foi utilizada aLibOPF [112], que é uma biblioteca para o desenvolvimento de classificadores basea-dos em floresta de caminhos ótimos. Por último, para a ANN-MLP, foi utilizada a FastArtificial Neural Network Library (FANN) [113].

A configuração da rede é 8:8:8:2, já que se tem oito características na camadade entrada para descrever cada perfil de consumidor (Seção 6.1), seguida de duascamadas intermediárias com oito neurônios cada e duas classes possíveis na camadade saída: consumo regular ou irregular. A ANN-MLP foi treinada com um algoritmobackpropagation e sua arquitetura foi empiricamente escolhida. Para a rede SOMfoi utilizado uma grade retangular com 100×100 neurônios e com 10 iterações para aconvergência do algoritmo. Quanto ao algoritmo k-NN foi utilizada uma implementaçãoprópria, no qual o k valor escolhido foi a que maximizou a taxa de acerto sobre oconjunto de treinamento.

7.1.2 Avaliação dos Métodos

A taxa de acerto para os classificadores utilizados no presente trabalho será calcu-lada como proposta por Papa et al. [13]. Esta abordagem leva em consideração queas classes podem ter diferentes tamanhos no conjunto de avaliação Z2 com amos-tras rotuladas. Caso se tenha duas classes, por exemplo, com diferentes tamanhos eum classificador sempre associasse o rótulo da classe com mais representantes, suataxa de acerto diminuiria devido a alta taxa de erro na classe com menor número deelementos.

Seja NZ2(i), i = 1, 2, . . . , c, o número de elementos em Z2 de cada classe i. Defi-nimos, então:

ei,1 =FP (i)

|Z2| − |NZ2(i)|e ei,2 =

FN(i)

|NZ2(i)|, i = 1, . . . , c (7.1)

onde FP (i) e FN(i) são os falsos positivos e falsos negativos, respectivamente. Istosignifica que FP (i) corresponde ao número de amostras de outras classes que foramclassificadas como sendo da classe i em Z2, e FN(i) é o número de amostras daclasse i que foram incorretamente classificadas como sendo de outras classes em Z2.

Page 104: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 7. RESULTADOS EXPERIMENTAIS 88

Os erros ei,1 e ei,2 são usados para definir

E(i) = ei,1 + ei,2, (7.2)

onde E(i) é a soma parcial dos erros da classe i. Finalmente, a taxa de acerto Acc decada classificação é dada por:

Acc =2c−

∑ci=1E(i)

2c= 1−

∑ci=1E(i)

2c. (7.3)

7.1.3 Avaliação da Robustez

A Tabela 7.1 mostra os resultados para as bases de dados Bc e Bi no seguinteformato: x[y], em que x e y significam, respectivamente, a taxa de acerto e o tempode treinamento (em segundos).

Tabela 7.1: Taxa de Acerto e Tempo de Treinamento para as Bases Bc e BiClassificador Bc Bi

OPF 55,88%[0,106] 64,65%[0,043]SVM-RBF 51,46%[82,64] 53,53%[34,02]

SVM-noKernel 51,27%[49,15] 45,38%[21,46]ANN-MLP 50,00%[89,16] 50,00%[58,91]

SOM 52,15%[95,56] 60,10%[53,03]k-NN 56,20%[26,21] 65,02%[4,848]

Pode-se observar OPF e k-NN alcançaram resultados próximos para a base Bc,superando os demais classificadores. Entretanto, OPF foi 247, 26 vezes mais rápidodo que o k-NN durante o treinamento. Com relação à base Bi, OPF foi 112, 74 maisrápido do que o k-NN durante o treinamento. Embora seja possível argumentar que otempo de treinamento não é crucial, é importante esclarecer que algumas aplicaçõesexigem rápidas fases de treinamento. Na segunda rodada do experimento realizadoaqui, cada possível solução exigirá o cálculo da função objetivo, que é justamente ataxa de acerto do classificador OPF sobre o conjunto de avaliação, considerando umcaso particular de seleção de características. Isto implica que o classificador OPFserá treinado e avaliado sobre o conjunto de dados de cada partícula em movimento.Assim, uma fase de treinamento rápida é crucial para este tipo de aplicação.

7.1.4 Comparação das Técnicas para Seleção de Características

Nesta seção, foi comparado OPF tradicional (sem a seleção de características)com PSO-OPF, HS-OPF e GSA-OPF no contexto de seleção de características paracaracterizar a identificação de perdas não-técnicas.

Foram usados os seguintes parâmetros para ajustar PSO: w = 1, 2, c1 = 2, 8,c2 = 0, 9, e o número de partículas foi estabelecido em 300. Para HS, foi utilizado

Page 105: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 7. RESULTADOS EXPERIMENTAIS 89

HMS = 300 (número de harmonias) e HMCR = 0, 65. Com relação ao GSA, utilizou-se G0 = 100, ε = 0, 7 e k = 300. Note que o valor de k foi diminuído por uma unidadea cada iteração de GSA. Também foram utilizadas 10 iterações para a convergênciade todas as técnicas. Observe que esses valores foram escolhidos empiricamente, afim de evitar a meta-otimização, ou seja, a otimização dos parâmetros do algoritmo deotimização.

Na Tabela 7.2 são exibidos os resultados para as bases Bc e Bi. O valor dentrodos colchetes indica o tempo computacional (em segundos) do algoritmo de seleçãode características. Na Tabela 7.3 são apresentadas as características selecionadaspara cada técnica.

Tabela 7.2: Taxas de Acerto para as Bases Bc e BiClassificador Acerto sobre Bc Acerto sobre Bi

OPF 55,88%[-] 64,65%[-]PSO-OPF 92,28%[780,27] 98,93%[325,08]HS-OPF 90,38%[82,66] 97,27%[33,53]

GSA-OPF 90,71%[869,58] 93,70%[357,63]

Tabela 7.3: Características Selecionadas para as Bases Bc e BiClassificador Características para Bc Características para Bi

PSO-OPF Dmax, FP, Pinst, FC Dmax, FP, Pinst, FCHS-OPF DC, Dmax, FP, Pinst, FC DC, Dmax, FP, Pinst, FC

GSA-OPF DB, DC, TP, FP, Pinst, FC Dmax, FP, FC

Pode-se notar uma importante melhoria na taxa de acerto das técnicas evolutivaspara a seleção de características. Com relação a Bc, PSO-OPF superou as demaistécnicas, seguido pelo GSA-OPF e HS-OPF. Entretanto, HS-OPF foi 9, 43 e 10, 51 ve-zes mais rápido do que PSO-OPF e GSA-OPF, respectivamente. GSA-OPF foi a téc-nica mais lenta, principalmente por causa da etapa de classificação de cada iteração(Equação (5.11)), sendo que foi usado o algoritmo Quicksort, que é um método deordenação muito rápido e eficiente, para implementação desta tarefa. Com relação àbase Bi, PSO-OPF alcançou o melhor resultado, seguido por HS-OPF e GSA-OPF.Novamente, HS-OPF foi o mais rápido, com sua taxa de acerto próximo da taxa obtidapelo PSO-OPF.

Uma outra observação relevante diz respeito às características fator de carga (FC)e fator de potência (FP) estarem presentes entre todas as características selecionadasnos experimentos de seleção de características abordadas neste trabalho, compro-vando a importância desses índices referentes a qualidade de energia e a eficiênciaenergética.

Page 106: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 7. RESULTADOS EXPERIMENTAIS 90

7.1.5 Observações Adicionais

Neste experimento, foram realizadas duas séries em dois conjuntos distintos a fimde avaliar a importância da seleção de características. Na primeira foi comparado OPFcontra SVM-RBF, SVM-noKernel , ANN-MLP, SOM e k-NN. Na segunda, três técnicasevolutivas baseadas na seleção de características foram comparadas: Otimização porEnxames de Partículas (PSO), Busca Harmônica (HS) e Algoritmo de Busca Gravita-cional (GSA).

Para os resultados da primeira série de experimentos, os classificadores mais pre-cisos foram OPF e k-NN, que superaram os demais. Após a escolha do OPF comoclassificador, em relação a segunda série, que é voltada para a seleção de caracte-rísticas, PSO-OPF superou HS-OPF e GSA-OPF para ambos os conjuntos de dados,sendo HS-OPF a técnica mais rápida. Utilizando PSO-OPF para selecionar as carac-terísticas mais representativas, pode-se melhorar a taxa de reconhecimento para osconjuntos de dados Bc e Bi. No entanto, considera-se HS-OPF como o algoritmo como melhor equilíbrio entre precisão e complexidade computacional. Também é possívelobservar através dos resultados que a presença das características fator de carga (FC)e fator de potência (FP) selecionadas nos experimentos reforça a relevância dessesíndices no tema do problema abordado.

7.2 Experimento 2

Neste segundo experimento, são adicionadas novas abordagens com diferentesalgoritmos evolutivos para o cumprimento do objetivo. O artigo para publicação frutodo Experimento 2 está em processo de finalização, ou seja, até este momento aindanão foi publicado.

7.2.1 Procedimentos Experimentais

Suponha um conjunto de dados totalmente rotulado Z = Z1∪Z2∪Z3∪Z4, em queZ1, Z2, Z3 e Z4 denotam os conjunto de treinamento, de aprendizado, de validação ede testes, respectivamente. A ideia é utilizar Z1 e Z2 para encontrar o subconjunto decaracterísticas que maximizam a taxa de acerto sobre Z2, sendo tal taxa de acerto afunção objetivo. Portanto, cada agente (partícula, cuco, etc) é então inicializado composições binárias aleatórias e o conjunto de dados original é mapeado para um novo,que contém as características que foram selecionadas nesta primeira amostragem.

Além disso, a função objetivo de cada agente é definida como a taxa de reconhe-cimento de um classificador sobre Z2 após o treinamento em Z1. Assim que o agentemuda a sua posição, um novo treinamento em Z1 seguido pela classificação em Z2,precisa ser executada. Como se pode ver, tal formulação requer etapas eficientes detreinamento e de classificação. Esta é a razão pela qual é empregado o classifica-dor Floresta de Caminhos Ótimos, uma vez que é um classificador não paramétrico e

Page 107: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 7. RESULTADOS EXPERIMENTAIS 91

muito robusto, para calcular a taxa de acerto da função objetivo.No entanto, a fim de permitir uma comparação justa, foi acrescentado um terceiro

conjunto nos experimentos chamado de conjunto de validação (Z3): a ideia é estabe-lecer um limiar que varia de 10% a 90% e, para cada valor deste limiar, são marcadasas características que foram selecionadas pelo menos uma percentagem mínima dasiterações (10 vezes) ao longo de um processo de aprendizagem em Z1 e Z2, comomencionado anteriormente.

Por exemplo, um limiar de 40% significa escolher as características que foram sele-cionadas em, pelo menos, 40% das execuções. Para cada limiar, calcula-se a funçãoobjetivo sobre o conjunto de validação Z3 para avaliar a capacidade de generaliza-ção da solução selecionada. Assim, o subconjunto final será aquele que maximiza acurva sobre o intervalo de valores, ou seja, as características que maximizam a taxade acerto sobre Z3.

Ademais, essas características selecionadas são então aplicadas para avaliar ataxa de acerto sobre Z4. Nota-se que a função objetivo empregada neste trabalhoé a taxa de acerto proposta por Papa et al. [13], que é capaz de lidar com classesdesequilibradas. Observe que é usado 30% do conjunto de dados original para Z1,20% para Z2, 20% para Z3, e 40% para Z4. Estas percentagens foram empiricamenteescolhidas. Ainda, é executada uma validação cruzada com 10 iterações, ou seja,geram-se 10 diferentes conjuntos de treinamento, de aprendizagem e de teste paracalcular a taxa de acerto média e o tempo de execução.

7.2.2 Experimentos e Resultados

Nesta seção, são discutidos os experimentos realizados para avaliar a robustez doBCS combinado com o classificador OPF no contexto da caracterização de perdasnão técnicas.

Os experimentos foram realizados em três rodadas: (i) na primeira, comparou-seo classificador OPF contra três conhecidos classificadores (ANN-MLP, SVM e SOM)a fim de evidenciar a sua robustez para ser utilizado como função objetivo de BCS;(ii) na segunda rodada, BCS foi avaliado contra quatro técnicas de otimização bi-nária, sendo elas o Binary Bat Algorithm (BBA), Binary FireFly Algorithm (BFFA), oBinary Gravitational Search Algorithm (BGSA) e o Binary Particle Swarm Optimization(BPSO); (iii) e na terceira, finalmente, foi avaliada a sensibilidade de BCS de acordocom seus parâmetros (pa,α). Lembrando que, para o cálculo das taxas de acerto nosexperimentos, foi usado o mesmo método da Seção 7.1.2.

Configuração Experimental

Implementação dos classificadores: no que diz respeito às técnicas supervisiona-das de reconhecimento de padrão empregadas neste trabalho, comparam-se OPF,SVM com função de base radial como mapeamento do núcleo (SVM-RBF) e sem ma-

Page 108: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 7. RESULTADOS EXPERIMENTAIS 92

peamento do núcleo (SVM-Nokernel), Mapas de Auto-Organização (SOM) e RedesNeurais com Perceptron Multicamadas (ANN-MLP). Para a implementação de OPF foiutilizado o pacote LibOPF [112], e com respeito à SVM-RBF e SVM-Nokernel foramempregados a LibSVM [69] e a LibLINEAR [111], respectivamente. Para ANN-MLP,usou-se FANN [113]. Finalmente, para as redes SOM se utilizou uma implementa-ção própria. Lembrando que os parâmetros de SVM-RBF e de SVM-Nokernel foramotimizados através de validação cruzada, e para redes SOM são utilizadas duas di-ferentes configurações: arquiteturas neurais de 5 × 5 (SOM5) e de 10 × 10 (SOM10)com 10 iterações para a aprendizagem. Note-se que estes valores foram escolhidosempiricamente, com base em nossa experiência anterior.

Parâmetros das técnicas: Na Tabela 7.4 são apresentados os parâmetros em-pregados para cada técnica evolutiva. Nota-se que, para todas as técnicas, foramempregados 30 agentes com 10 iterações. Tais valores mostrados na Tabela 7.4 sãoempiricamente definidos.

Tabela 7.4: Parâmetros usados para cada abordagem de otimizaçãoTécnica Parâmetros

BCS α = 0, 1, pa = 0, 25BBA α = 0, 9, γ = 0, 9BFFA γ = 0, 7, β0 = 1, 0, α = 0, 01BGSA G0 = 100BPSO c1= 2, 0, c2= 2, 0, w= 0, 7

Avaliação dos Conjuntos de Dados

Nesta subseção é realizado um experimento inicial para mostrar a eficácia dosclassificadores usando o conjunto de dados original, ou seja, sem a seleção de carac-terísticas. Para este fim, foi realizada uma validação cruzada com 10 iterações comconjuntos de treinamento, de aprendizagem, de validação e de teste gerados aleatori-amente.

No entanto, para esta primeira rodada, foram empregados apenas os conjuntosde treinamento e de teste, que são os mesmos que os usados no experimento deseleção de características realizado em seguida. Nas Tabelas 7.5 e 7.6 são exibidosos resultados para os conjuntos de dados Bc e Bi, respectivamente.

Como se pode observar, OPF superou os classificadores restantes nos dois con-juntos de dados. Para o conjunto de dados Bc, OPF foi 15, 57% mais eficaz do queSVM-RBF e 19, 92% mais eficaz do que SVM-nokernel, que são o segundo e o ter-ceiro, respectivamente. Em relação à ANN, o classificador OPF foi cerca de 23, 00%

mais eficaz.Para conjunto de dados Bi, o classificador OPF manteve seu desempenho mais

próximo ao alcançado para o conjunto de dados Bc. O classificador SVM-RBF melho-

Page 109: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 7. RESULTADOS EXPERIMENTAIS 93

Tabela 7.5: Taxas de Acerto Média da Classificação Sobre Z4 para o Conjunto de Dados BcTécnica Taxa de acerto Tempo de treinamento[s] Tempo de teste[s]ANN-MLP 50,00%±0,00 109,151494 0,000556OPF 61,52%±0,74 0,153449 0,077215SOM5 50,84%±0,86 0,032827 0,000546SOM10 50,84%±0,86 0,176827 0,001738SVM-nokernel 51,30%±1,37 73,183140 0,004584SVM-RBF 53,23%±0,17 119,276475 0,203827

Tabela 7.6: Taxas de Acerto Média da Classificação Sobre Z4 para o Conjunto de Dados BiTécnica Taxa de acerto Tempo de treinamento[s] Tempo de teste[s]ANN-MLP 50,39%±1,08 69,091675 0,000335OPF 61,41%±0,33 0,067404 0,031755SOM5 50,53%±0,41 0,020881 0,000332SOM10 56,24%±1,70 0,113863 0,001086SVM-nokernel 47,50%±2,49 19,731038 0,003426SVM-RBF 53,77%±1,56 48,565947 0,088544

rou seu desempenho, mas ainda foi 14, 20% menos eficaz do que OPF. Ao contrário,o classificador SVM-nokernel piorou seu desempenho, alcançando 47, 50% de taxa deacerto, sendo o pior desempenho entre OPF e outros classificadores, ou seja, teve29, 28% menos de eficaz. O SOM5 e ANN-MLP mantiveram as mesmas taxas de clas-sificação alcançadas para Bc. O classificador SOM10 melhorou seu desempenho em10, 60% com relação ao conjunto de dados Bi, sendo o segundo melhor desempenho.

Em relação ao tempo de execução, os classificadores SOM foram as técnicas maisrápidas. O classificador SOM5 apresentou a mais rápidas fases de treinamento e deteste, sendo ligeiramente mais rápido do que SOM10. O classificador OPF foi a terceiratécnica no que diz respeito ao tempo de execução, sendo mais rápida do que SOM10

na fase de treinamento. As abordagens baseadas em SVM apresentaram uma ele-vada carga computacional na fase de treinamento, o que as tornam impraticáveis parausar como o classificador da abordagem BCS para seleção de características. Em-bora os classificadores baseados em SOM tenham sido as técnicas mais rápidas, elesapresentam baixos desempenhos de taxa de acerto em relação ao OPF. Portanto, oOPF foi escolhido como a abordagem central para seleção de características baseadaem BCS.

Experimentos de Seleção de Característica

Nesta segunda rodada é levado em conta o processo de seleção de caracterís-tica. A principal questão é: pode-se aumentar a taxa de classificação através de umconjunto reduzido de características?

Na Figura 7.1 é exibida a curva de taxa de acerto sobre Z3 para o conjunto de

Page 110: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 7. RESULTADOS EXPERIMENTAIS 94

dados Bc. Como se pode observar, todas as técnicas alcançaram a mesma taxa dereconhecimento para todos limiares, exceto BGSA para valores inferiores a 40%. Issosignifica que se pode usar as características que apareceram em apenas 40% dasiterações. Na Tabela 7.7 são apresentadas as taxas de acerto após a seleção decaracterísticas e também as características selecionadas para o conjunto de dadosBc. A carga média computacional de cada técnica de otimização também é exibida.

Figura 7.1: Curva de taxa de acerto do OPF sobre Z3 para o conjunto de dados Bc.

Tabela 7.7: Tempo de Execução Médio (s), Limiar, Características Selecionadas e Taxa deAcerto Sobre Z4 para o Conjunto de Dados Bc

Técnica Tempo de Limiar Características Taxa de acerto daExecução [s] Selecionadas Classificação

BCS 1141,221069 40% 10101111 91,44%BBA 1033,354248 40% 10101111 91,44%BFFA 1116,442017 40% 10101111 91,44%BGSA 1133,031860 40% 10101111 91,44%BPSO 1078,860962 40% 10101111 91,44%

Pode-se observar que todas as técnicas alcançaram a mesma taxa de acerto sobreo conjunto de teste (Z4) e selecionaram o mesmo subconjunto de características. Nacadeia de bits, da terceira coluna, é indicada se a característica foi selecionada ou nãopara compor o conjunto final de características. Além disso, segue a mesma ordemde descrição das características na Seção 6.1, ou seja, a cadeia de bits 1010111significa que as características DF, Dmax, TP, FP, Pinst e FC foram selecionadas, eDC e ER não foram selecionadas. Com este subconjunto de características, as taxasde acerto também foram significativamente melhoradas quando comparadas com asobtidas para o classificador OPF sobre o conjunto de dados original (Tabela 7.5). Ataxa de classificação do OPF aumentou em 48.90%. No que diz respeito ao tempo deexecução, BBA foi a técnica mais rápida, seguida por BPSO, BFFA, BGSA e BCS.

Page 111: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 7. RESULTADOS EXPERIMENTAIS 95

Figura 7.2: Curva de taxa de acerto do OPF sobre Z3 para o conjunto de dados Bi.

Na Figura 7.2 é exibida a curva da taxa de acerto sobre Z3 para o conjunto dedados Bi. Pode-se observar que todas as técnicas alcançaram a taxa de acerto má-xima sobre Z3 utilizando um limiar de 20%, e as taxas de acerto foram melhoradasem 47.73% quando comparadas com as que utilizam o conjunto de dados original (Ta-bela 7.6). Da Tabela 7.8, exceto para BGSA, o restante das técnicas de otimizaçãoobtiveram a mesma taxa de acerto sobre o conjunto de teste Z4, que também sele-cionaram o mesmo subconjunto de características (Dmax, FP, Pinst e FC). No que dizrespeito ao tempo de execução, BCS foi a técnica mais rápida, seguida por BPSO,BBA, BFFA e BGSA.

Tabela 7.8: Tempo de Execução Médio (s), Limiar, Características Selecionadas e Taxa deAcerto Sobre Z4 para o Conjunto de Dados Bi

Técnica Tempo de Limiar Características Taxa de acerto daExecução [s] Selecionadas Classificação

BCS 674,715332 20% 00100111 97,33%BBA 784,976318 20% 00100111 97,33%BFFA 948,428711 20% 00100111 97,33%BGSA 1071,962036 20% 01100111 96,67%BPSO 685,916077 20% 00100111 97,33%

Avaliação dos parâmetros de sensibilidade de BCS

O interessante nesta seção é que BCS possui um parâmetro a menos do queBPSO e BFFA, o que faz uma diferença em termos de eficiência da meta-otimização.A fim de se obter resultados mais conclusivos sobre o desempenho de BCS paraidentificação de perdas não-técnicas, foi conduzido um experimento extra para realizaruma busca exaustiva (Grid Search-GS) em torno dos intervalos [0, 1; 1] e [0, 25; 0, 75]

para os parâmetros α e pa, respectivamente, com passos de 0, 1.Neste caso, são empregados os conjuntos de treinamento (Z1), de aprendizagem

Page 112: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 7. RESULTADOS EXPERIMENTAIS 96

(Z2) e de teste (Z4) com as mesmas porcentagens usadas anteriormente, ou seja, 30%

para o treinamento, 20% para validação e 40% para o conjunto de teste. O método GSconsiste na aplicação de cada par (αi, pia) para construir o modelo de BCS sobre Z1

e Z2 e, em seguida, calcular a taxa de acerto sobre Z4. Nas Figuras 7.3 e 7.4 sãoretratados os resultados para os conjuntos de dados Bc e Bi, respectivamente.

Figura 7.3: Resultados de busca de grade para o conjunto de dados Bc.

Figura 7.4: Resultados de busca de grade para o conjunto de dados Bi.

Em relação ao conjunto de dados Bc, a melhor taxa de acerto, ou seja, 94, 80%,foi obtida com α = 0, 7 e pa = 0, 55. Com relação ao conjunto de dados Bi, a melhortaxa de acerto de 92, 20% foi obtida com α = 0, 7 e pa = 0, 55. Da Tabela 7.4, pode-seobservar que é adotado α = 0, 1 e pa = 0, 25 para ambos conjuntos de dados, umavez que estes valores também obtiveram resultados próximos aos melhores obtidospela busca exaustiva. Como mencionado anteriormente, um tipo de busca exaustivaé muito interessante para uma melhor compreensão do comportamento de BCS nocontexto deste trabalho, e os valores dos parâmetros que conduzem a resultados se-melhantes também podem ser usados.

7.2.3 Observações Adicionais

Neste experimento, foi considerado o problema de modelagem do processo de se-leção de característica como um procedimento de otimização baseado em enxames,em que se apresenta uma versão binária do algoritmo Cuckoo Search para lidar comessa tarefa.

Page 113: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 7. RESULTADOS EXPERIMENTAIS 97

Foram realizadas três rodadas de experimentos: na primeira, foram comparadosvários classificadores sobre o conjunto de dados original, isto é, sem a seleção decaracterística, sendo OPF a técnica mais eficaz. Nos experimentos seguintes, é com-parada BCS contra BBA, BFFA, BGSA e BPSO. Pode-se observar todas as técnicastem alcançado taxas de reconhecimento semelhantes, sendo BCS a mais rápido paraconjunto de dados Bi. Além disso, é apresentada a robustez de BCS em relação avariações em seus parâmetros sobre ambos os conjuntos de dados.

7.3 Experimento 3

Nesta seção é realizado um experimento através do uso da técnica Charged Sys-tem Search (CSS) para otimizar os parâmetros utilizados pela ANN-MLP afim de me-lhorar a identificação de perdas comerciais, embora este não seja o objetivo principaldeste trabalho. Entretanto, este tipo de experimento demonstra que é possível diver-sificar, com bastante flexibilidade, as técnicas de Inteligência Artificial (IA), de modoa melhorar o desempenho do método escolhido. O Experimento 3 gerou a publica-ção [114].

7.3.1 Treinamento de ANN-MLP Através do CSS

Como já mencionado, a ideia é usar CSS para realizar uma busca global e atuali-zar os pesos e os coeficientes da rede neural. Em primeiro lugar, os vetores de pesos(Charged Particles-CPs) são aleatoriamente inicializados com valores dentro do in-tervalo de [−1, 1]. A fim de lidar com partículas que violem os limites do espaço debusca, ou seja, valores que estão fora do intervalo de [−1, 1], Kaveh e Talatahari [107]propuseram usar uma abordagem baseada em HS. Por isso, uma nova solução ge-rada pela Equação (5.46) que excede os limites pode ser regenerado de acordo como mecanismo de HS [11].

Variantes do HS tradicional podem ser empregados nesta tarefa. Assim, adotou-seGlobal Harmony Search (GHS) [90], que emprega uma nova regra de ajuste de passo,gerando uma nova solução pelo uso do melhor vetor harmonia, neste caso, usa-sea melhor CP na Memória Carregada (Charged Memory ). O Erro Quadrático Médio(Mean Squared Error -MSE), já apresentado na Seção 4.1 (Equação (4.13)), é usadocomo a função objetivo para guiar as CPs para as melhores soluções.

O critério de parada é o número de iterações do CSS, e a melhor solução globalde CSS é usada como a configuração dos pesos na fase de testes da ANN-MLP.

7.3.2 Configuração dos Parâmetros

É comparada a abordagem ANN-MLP com CSS contra PSO, Self-adaptive Globalbest Harmony Search (SGHS) e o bem conhecido algoritmo de treinamento Back-propagation (BP). A Tabela 7.9 apresenta os parâmetros utilizados para cada técnicaevolutiva. Nota-se que para todas as técnicas foram empregadas 50 agentes com

Page 114: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 7. RESULTADOS EXPERIMENTAIS 98

10.000 iterações. Estes parâmetros foram empiricamente definidos.

Tabela 7.9: Configuração dos Parâmetros dos Algoritmos Meta-heurísticosTécnica ParâmetrosCSS HMCR = 0, 9, PARmin = 0, 01, PARmax = 0, 98PSO c1 = 2, 0, c2 = 2, 0, w = 0, 7SGHS HMCRm = 2, 0, BWmin = 0, 0005, BWmax = 0, 2

PARm = 2, 0, LP = 100, LB = −1, 0, UB = 1, 0

7.3.3 Resultados Experimentais

Nesta seção são discutidos os experimentos realizados para avaliar a robustezdo algoritmo baseado em CSS contra PSO, SGHS e BP para treinamento da ANN-MLP. Lembrando que para o cálculo das taxas de acerto nos experimentos foi usadoo mesmo método da Seção 7.1.2. Os experimentos foram realizados utilizando va-lidação cruzada com 10 subconjuntos gerados aleatoriamente para os conjuntos detreinamento e de teste.

Na Tabela 7.10 são exibidos os valores do MSE obtidos por cada algoritmo nafase de treinamento sobre os conjuntos de dados. Pode-se ver que as técnicas deotimização alcançaram menores taxas de erros do que o BP para os conjuntos dedados da base comercial (Bc) e da base industrial (Bi). Para o conjunto de dados Bc,PSO e CSS possuem os melhores resultados, respectivamente. No caso de Bi, PSOalcançou a menor taxa de erro.

Tabela 7.10: Média do MSE para os Conjuntos de Dados Bc e BiTécnica Bc Bi

CSS 0,025±0,0003 0,027±0,0006PSO 0,024±0,0004 0,023±0,0008

SGHS 0,029±0,002 0,031±0,0023BP 0,105±0,00004 0,114±0,001

Na Tabela 7.11 é mostrada a taxa de acerto da ANN-MLP sobre o conjunto de testeutilizando as melhores soluções alcançados por todas as técnicas avaliadas. Para Bc,todas as técnicas de otimização obtiveram bons resultados com similaridade muitopróxima. Para o conjunto de dados de Bi , PSO e CSS apresentaram as melhorestaxas de acerto seguido por SGHS com cerca de 1% a menos. Portanto, de acordocom a taxa de acerto de teste, pode-se considerar que CSS e PSO tem semelhantestaxas de acerto relacionados com a detecção de perdas não-técnicas.

No que diz respeito ao tempo de treinamento da ANN-MLP (Tabela 7.12), pode-seobservar que SGHS foi a técnica mais rápida, seguida de PSO e CSS, que tem cargacomputacional muito semelhante.

Page 115: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 7. RESULTADOS EXPERIMENTAIS 99

Tabela 7.11: Média da Taxa de Acerto para os Conjuntos de Dados Bc e BiTécnica Bc Bi

CSS 94,54±0,006 94,09±0,751PSO 94,58±0,085 94,50±0,690

SGHS 94,54±0,006 93,81±0,572BP 50,00±0,0 52,24±2,744

Tabela 7.12: Média do Tempo de Execução do Treinamento em Segundos para os Conjuntosde Dados Bc e Bi

Técnica Bc Bi

CSS 2230,89±27,87 1446,71±30,73PSO 2003,10±75,72 1299,87±40,88

SGHS 42,58±0,60 27,72±0,13BP 621,88±151,16 394,25±80,0355

7.3.4 Observações Adicionais

São apresentados, neste experimento, os algoritmos Charged System Search,Particle Swarm Optimization e Self-adaptive Global best Harmony Search para trei-namento de rede Perceptron Multi-Camada relacionados à detecção de perdas não-técnicas.

Em relação aos resultados experimentais, CSS e PSO tem taxas de acertos se-melhantes relacionados com a detecção de perdas não-técnicas e se pode considerarbastante interessante a utilização de técnicas evolutivas, em vez do tradicional algo-ritmo Backpropagation, para melhorar as taxas de acertos das Redes Neurais Artifici-ais.

7.4 Experimento 4

Nesta seção são apresentados alguns experimentos realizados com o softwareWEKA (Waikato Environment for Knowledge Analysis) [115] como uma ferramentacomputacional alternativa, diferente dos métodos tradicionais, tais como implementa-ções em C (linguagem de programação) e MATLAB, para detectar e selecionar ca-racterísticas no contexto de perdas comerciais. O Experimento 4 gerou a publica-ção [116].

7.4.1 Software WEKA

O software WEKA (Waikato Environment for Knowledge Analysis) foi desenvolvidona Universidade de Waikato, Nova Zelândia, e tem licença livre. O WEKA visa agregaralgoritmos de diferentes abordagens ou paradigmas no sub-campo da inteligência arti-ficial dedicado ao estudo da aprendizagem por máquinas [115]. Este trabalho utiliza oWEKA para detectar e selecionar características pois a implementação e manipulação

Page 116: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 7. RESULTADOS EXPERIMENTAIS 100

de técnicas inteligentes são simples e rápidas.

7.4.2 Procedimentos Experimentais

Durante a etapa de classificação, os dados foram divididos aleatoriamente da se-guinte maneira: 50% dos perfis de consumidores passaram pela etapa de treinamentoe os 50% restantes foram utilizados para a etapa de testes. Como já foi identificado seestes perfis possuem perdas comerciais ou não, através de inspeções realizadas pelostécnicos da própria concessionária com comprovação de irregularidades, foi possívelcomparar os resultados entre as técnicas inteligentes escolhidas, as Redes Bayesia-nas (RB) [76] e k-Vizinhos Mais Próximos (k-NN) [117].

Na etapa de otimização, foram usados os métodos da Busca Exaustiva (BE) edo Método de Ranqueamento (Ranker ) para a seleção das características mais re-levantes implementados no WEKA [115]. A Busca Exaustiva consiste em determinara combinação de características que possuem a maior função custo dentre todas ascombinações de características possíveis. Como existem 8 características, o númerode combinações possíveis é 28 = 256. O Método de Ranqueamento consiste em or-denar as características de maior função custo para as de menor função custo. Lem-brando que a função custo é a função custo padrão pré-definida do software WEKA, ouseja, ela não foi alterada e/ou modificada para ambos os métodos. Usou-se a função“Ganho de Informação” para o Ranqueamento e a função “Seleção baseada em Cor-relação” para a Busca Exaustiva. Desta maneira, é esperado uma melhora na etapaclassificação. A metodologia deste experimento está representada pelo fluxograma daFigura 7.5.

7.4.3 Avaliação dos Resultados e Discussões

Primeiramente foram utilizadas todas as características disponíveis na base de da-dos, e verificada a taxa de acerto das Redes Bayesianas e da técnica dos k-VizinhosMais Próximos. Os resultados estão mostrados na Tabela 7.13, onde os dados emnegrito representam a maior taxa de acerto obtida neste experimento. Diferentementedos experimentos anteriores onde as taxas de acerto são capazes de lidar com clas-ses desequilibradas, no WEKA a taxa de acerto é a porcentagem de acertos calculadasobre o número de amostras do conjunto de testes.

Tabela 7.13: Resultados com Todas as CaracterísticasBase de Dados Classificador Taxa de acerto Erro

Comercial RB 87,00% 13,00%Comercial k-NN 96,04% 3,96%Industrial RB 89,06% 10,94%Industrial k-NN 96,73% 3,27%

Em seguida, foram analisadas quais as características foram mais relevantes para

Page 117: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 7. RESULTADOS EXPERIMENTAIS 101

Figura 7.5: Fluxograma da metodologia dos experimentos realizados com o Software WEKA.

os classificadores, utilizando a Busca Exaustiva e o Método de Ranqueamento. Osresultados da Busca Exaustiva estão apresentadas na Tabela 7.14. Para o Método deRanqueamento, são apresentados na Tabela 7.15 os resultados das característicasordenadas da mais relevante para a menos relevante.

Tabela 7.14: Resultados da Busca ExaustivaBase de Dados Comercial Base de Dados Industrial

1-Transformador de Potência (TP) 1-Demanda Máxima (Dmax)2-Potência Instalada (Pinst) 2-Demanda Contratada (DC)

3-Energia Reativa (ER)4-Fator de Carga (FC)

5-Potência Instalada (Pinst)

Tabela 7.15: Resultados do RanqueamentoBase de Dados Comercial Base de Dados Industrial1-Potência Instalada (Pinst) 1-Potência Instalada (Pinst)

2-Demanda Contratada (DC) 2-Transformador de Potência (TP)3-Demanda Faturada (DF) 3-Demanda Contratada (DC)4-Demanda Máxima (Dmax) 4-Demanda Máxima (Dmax)

5-Transformador de Potência (TP) 5-Demanda Faturada (DF)6-Energia Reativa (ER) 6-Fator de Carga (FC)7-Fator de Carga (FC) 7-Energia Reativa (ER)

8-Fator de Potência (FP) 8-Fator de Potência (FP)

Page 118: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 7. RESULTADOS EXPERIMENTAIS 102

Os resultados de classificação para a detecção de perdas comerciais somentecom as características selecionadas pela Busca Exaustiva estão apresentados na Ta-bela 7.16.

Tabela 7.16: Resultados com as Características Selecionadas pela Busca ExaustivaBase de Dados Classificador Taxa de Acerto Erro

Comercial RB 93,29% 6,71%Comercial k-NN 95,56% 4,44%Industrial RB 94,28% 5,72%Industrial k-NN 96,42% 3,58%

A seguir, foram realizados diversos experimentos reduzindo o número de caracte-rísticas utilizadas de acordo com o nível de relevância do Método de Ranqueamento.Os melhores resultados obtidos para ambas as bases de dados foi quando utilizadoapenas as três características melhores ranqueadas de cada base de dados. Ob-servando as Tabelas 7.16 e 7.17, nota-se que o resultado do experimento com ascaracterísticas selecionadas pela Busca Exaustiva não atingiu a maior taxa de acertocomo era esperado, sendo que esta casualidade pode ter ocorrido pelo fato de seadotar diferentes funções custo para as técnicas, todavia a maior taxa de acerto foiobtida através da seleção das 3 melhores características ranqueadas pelo Método deRanqueamento.

Comparando as Tabelas 7.13, 7.16 e 7.17, nota-se que a técnica k-NN foi a queapresentou os melhores resultados em todos os casos, e que tanto k-NN como RBdemonstraram uma maior taxa de acerto quando é utilizado menos características deentrada.

Tabela 7.17: Resultados com as 3 Características Melhores RanqueadasBase de Dados Classificador Taxa de Acerto Erro

Comercial RB 95,23% 4,77%Comercial k-NN 97,37% 2,63%Industrial RB 94,28% 5,72%Industrial k-NN 99,87% 0,13%

Nas Tabelas 7.18 e 7.19 são mostradas as matrizes de confusão para os experi-mentos realizados com o classificador k-NN, considerando todas as 8 características.As matrizes de confusão são tabelas de visualização do desempenho dos algoritmos,ou seja, elas apresentam o número de classificações corretas em oposição às classi-ficações preditas para cada classe.

Em seguida, são apresentadas as Tabelas 7.20 e 7.21 com as matrizes de con-fusão da técnica (k-NN) que mais se destacou nos experimentos. Observa-se que o

Page 119: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 7. RESULTADOS EXPERIMENTAIS 103

Tabela 7.18: Matriz de Confusão do Classificador k-NN Para Consumidores Comerciais comTodas as Características

Classificados Classificadoscomo Regulares como Irregulares

Perfis Regulares 2.301 53Perfis Irregulares 45 77

Tabela 7.19: Matriz de Confusão do Classificador k-NN Para Consumidores Industriais comTodas as Características

Classificados Classificadoscomo Regulares como Irregulares

Perfis Regulares 1.468 18Perfis Irregulares 34 71

número de inspeções para os consumidores comerciais passaria de 130 para 121 epara os consumidores industriais o número de inspeções passaria de 89 para 107.

Analisando a Tabela 7.20, a matriz confusão da técnica k-NN que apresentou omelhor desempenho com apenas 3 características obtidas a partir da combinaçãocom os melhores resultados, pode-se verificar que a concessionária realizaria 121inspeções, que resultariam em 89 consumidores com perdas comerciais detectadosrealmente, o que representa uma taxa de acerto de 73,55%. Ressalta-se que os121 consumidores visitados equivalem a apenas 4,88% do total de perfis do banco dedados que foram testados, ou seja, o número de inspeções que seriam realizadas pelaconcessionária é reduzido. Por outro lado, 33 consumidores com irregularidades nãoforam detectados pelo classificador, o que corresponde a um erro de 27,05%. Essevalor pode ser considerado bastante razoável, lembrando-se sempre que se trata deum banco de dados comercial, onde as perdas de menor amplitude, sendo necessárioreduzir o número de inspeções realizadas, mesmo que não detectando a totalidadedas perdas comerciais.

Tabela 7.20: Matriz de Confusão do Classificador k-NN Para Consumidores Comerciais com 3Características

Classificados Classificadoscomo Regulares como Irregulares

Perfis Regulares 2.322 32Perfis Irregulares 33 89

Já no caso do banco de dados industrial, a situação é oposta. Devido a maiorimportância das perdas comerciais envolvidas, pois o impacto financeiro é maior paraas concessionárias, é tolerado um maior número de visitas com o objetivo de detectaro maior número possível de consumidores irregulares. Nota-se na Tabela 7.21 queo classificador k-NN apresentou um desempenho considerável, indicando 107 inspe-

Page 120: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 7. RESULTADOS EXPERIMENTAIS 104

Tabela 7.21: Matriz de Confusão do Classificador k-NN Para Consumidores Industriais com 3Características

Classificados Classificadoscomo Regulares como Irregulares

Perfis Regulares 1.484 2Perfis Irregulares 0 105

ções como necessárias, sendo que apenas 2 eram falsos-positivos, representando umerro de 0,13% do total de perfis do banco de dados que foram testados, além de con-seguir detectar todos os 105 perfis de consumidores que apresentavam reais perdascomerciais, ou seja, apresenta uma taxa de acerto de 98,13%.

7.4.4 Observações Adicionais

Foi apresentado o software WEKA como uma forma alternativa simples para classi-ficar e selecionar as características mais representativas, mostrando que um subcon-junto de características pode aumentar a taxa de acerto de um classificador. Nesteexperimento, a técnica dos k-Vizinhos Próximos (k-NN) apresenta grande potencial deutilização na detecção de perdas comerciais, pois superou as redes Bayesianas.

7.5 Considerações Finais

Neste capítulo foram abordados os experimentos realizados para o desenvolvi-mento do trabalho a fim de contribuir com a caracterização das perdas comerciais. Osexperimentos foram voltados para a identificação e seleção de características no con-texto de perdas não-técnicas. Destaca-se nos experimentos realizados, o classificadorOPF em conjunto do algoritmo evolutivo HS, demonstrando a eficácia deste sistemahíbrido, o que viabiliza o emprego dessas técnicas em aplicações com resultados queprecisam ser apresentados em tempo real. Como opção alternativa, é apresentado osoftware WEKA, pois não há necessidade de profundos conhecimentos em linguagensde programação, facilitando a implementação e manipulação de técnicas inteligentesde maneira simples e rápida, porém esta opção não é a mais favorável devido a sualimitação quanto a flexibilidade das técnicas. Vale lembrar que as taxas de acerto eas características selecionadas podem variar de experimento para experimento, poisos conjuntos de dados utilizados são escolhidos aleatoriamente, ou seja, como essesconjuntos não são fixos, cada base de dados pode ter diferentes subconjuntos de ca-racterísticas, que foram selecionadas através das técnicas de otimização, para melhorrepresentar os perfis de consumidores. Assim, entre todos os experimentos realiza-dos, os resultados possuem subconjuntos de características diferentes. No capítuloa seguir, será abordado um estudo de viabilidade econômica em relação ao tema datese.

Page 121: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

Capítulo 8

Estudo de Viabilidade Econômica

8.1 Introdução

Visto o contexto abordado, é comum questionar se o método é efetivo para secombater as perdas não-técnicas, já que é uma difícil abordagem quantificar as perdasnão-técnicas em valores reais. Pergunta-se: será que um programa de computadordetecta potenciais consumidores com irregularidades ou fraudulentos corretamente?

Não se pode dizer que um programa de computador irá apontar com 100% de cer-teza que um consumidor está cometendo fraude ou não, o programa apenas irá darsuporte à tomada de decisão diante de milhares de consumidores, apontando aque-les que podem ter algum tipo de irregularidade em suas medições, ou seja, ele auxiliaa redução do número de inspeções, averiguando os suspeitos de irregularidades eevitando as vistorias desnecessárias. Desta maneira, é possível reduzir custos cominspeções periódicas aleatórias, pois essa inspeção determinará o que pode estarcausando a perda não-técnica, verificando se o consumidor está cometendo algumtipo de fraude ou se o medidor está lendo as medições corretamente. Assim, a con-cessionária pode decidir qual o melhor tipo de providência que ela deve tomar demaneira rápida e eficaz. Entre as soluções estão: uma simples troca de medidor, umaregularização do consumidor através de acordos, uma melhoria do sistema elétricojá deficiente, atualização dos dados cadastrais do consumidor, calibração do sistemade medição, entre outras. Além disso, a distribuidora de energia contará com a recu-peração de receita, pois os consumidores irregulares estarão de volta à regularidade,pagando devidamente pela energia consumida.

E por que usar inteligência artificial? É muito comum fazer o combate às per-das comerciais através de busca exaustiva em planilhas eletrônicas. Assim, pode-secomparar manualmente os históricos de consumo de milhares consumidores, o queconsome tempo e dinheiro, por isso o uso de métodos computacionais para realizaresta tarefa de modo automático.

Outra maneira de se combater essas perdas é através de denúncias anônimasfeitas pelos próprios usuários, porém esta prática não é muito comum no Brasil, pois

105

Page 122: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 8. ESTUDO DE VIABILIDADE ECONÔMICA 106

ninguém quer se passar por mau vizinho, ou ter fama de “dedo-duro”, e comprometer apolítica da boa vizinhança. Muito embora as denúncias sejam anônimas, sempre exis-tem aquelas pessoas suspeitas e que são mal vistas por serem o “estraga-prazeres”dos outros. Este tipo de atitude pode até ser relacionado com os fatores históricos eculturais da população. Ao contrário do que acontece em países mais desenvolvidos,onde a denúncia é uma prática mais frequente, pois as pessoas possuem uma melhoreducação e consciência dos seus atos, já que não é correto consumidores regularespagarem mais pelos atos fraudulentos de outras pessoas, visto que as perdas de ener-gia são rateadas entre os consumidores, e ainda não há o recolhimento de impostospara o governo e futuros investimentos.

Além disso, com a chegada dos medidores inteligentes e do Smart Grid, todosos dados registrados por esse tipo de medidor de energia serão enviados instan-taneamente para a concessionária, onde serão armazenados e calculados todos equaisquer tipos de informações técnicas e sócio-econômicas. A análise desses dadosserão feitas de forma automática, ou seja, sem intervenção humana, a partir de umprograma computacional.

Nesse programa computacional normalmente se faz uso de técnicas com inteli-gência artificial afim de aprender como se comporta e como se pode caracterizar umpotencial consumidor com irregularidades. Como existem muitas abordagens para astécnicas de inteligência artificial, é conveniente que diversos experimentos com diver-sas metodologias diferentes sejam realizadas e avaliadas, pois uma mesma técnicainteligente pode ter um desempenho diferente para cada caso ou cada problema.

Técnicas evolutivas no contexto de inteligência artificial, ou seja, algoritmos inteli-gentes baseados em comportamento coletivo e na dinâmica social, estão em ascen-são para a otimização de sistemas, como o tema abordado neste trabalho não envolveapenas reconhecimento de padrões, mas também problemas de otimização, atravésda seleção de características, preocupou-se em fazer uma caracterização do perfil dosconsumidores de modo a minimizar as perdas comerciais.

Portanto, percebe-se a vantagem de se usar um programa computacional para fa-zer a identificação e caracterização dos possíveis consumidores com irregularidades,seja ele fraudador ou não.

8.2 Aspectos Sociais

Segundo a ANEEL, as dimensões de violência, escolaridade, renda, desigualdade,infraestrutura, número demográfico, investimentos e índices de inadimplência são ana-lisadas para compor o “índice de complexidade”, que agrega as variáveis que repre-sentam os fatores mais relevantes. Desta maneira, pode-se facilitar a diferenciaçãodas áreas de concessão quanto à determinadas características sócio-econômicas eretratar o nível de dificuldade enfrentado por cada concessionária no combate às per-

Page 123: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 8. ESTUDO DE VIABILIDADE ECONÔMICA 107

das não-técnicas.É notório que essas dimensões, frutos dos fatores históricos associados ao mo-

delo de colonização e das políticas de governo, possuem grande influência no ba-lanço energético e no crescimento das perdas comerciais. Apesar da importânciadessas grandezas, este estudo não leva em consideração as características sócio-econômicas de cada região ou estado, considera-se apenas os aspectos técnicosapresentados na Seção 6.1 do Capítulo 6, pois os conjuntos de dados disponibiliza-dos para a execução deste trabalho não apresentam informações sócio-econômicaspara se desenvolver um estudo mais aprofundado nesta área.

8.3 Aspectos Econômicos

Nesta seção foi realizado um experimento com finalidade de demonstrar uma apli-cação prática da metodologia desta tese para a recuperação das perdas comerciaise dos seus prejuízos. Lembrando que neste trabalho, não foi considerado o valor dastarifas de energia e das inspeções, pois essas informações não foram disponibilizadaspela concessionária. Também não foi possível realizar o experimento com a classeresidencial, pois o conjunto de dados de clientes residenciais disponibilizado não erarepresentativo, ou seja, haviam pouquíssimas amostras de perfis de consumidorescom irregularidades. Considera-se que o impacto de perdas não-técnicas é maiorem consumidores comerciais e industriais, além do número de consumidores nessasclasses ser em menor proporção em relação aos consumidores residenciais.

8.3.1 Experimento

A metodologia adotada nesta tese apresentou um maior destaque para a técnicaHS-OPF que desenvolveu resultados bastantes interessantes com relação a taxa deacerto e a sua eficiência. Sendo assim, foi realizado um novo experimento para sefazer uma estimativa de quanto se pode economizar levando em consideração os pre-juízos citados anteriormente (Seção 2.2) para demonstrar, de maneira mais sucinta, oquanto a metodologia poderia ser útil para a recuperação da receita de uma conces-sionária de energia.

Neste experimento, as mesmas bases de dados descritas anteriormente (Bc e Bi

- Seção 6.1) foram particionadas exatamente como no Experimento 1: em 25% dasamostras para treinamento e 50% para o teste em ambos os conjuntos de dados. Ob-serve que conjuntos de treinamento e teste foram gerados aleatoriamente, e foramexecutadas 10 iterações para o cálculo da taxa de acerto média de cada classe, di-ferente dos experimentos do Capítulo 7, onde foram calculadas uma taxa de acertocombinada entre as classes.

São duas rodadas de experimentos. A primeira rodada foi executada sem seleçãode características, ou seja, todas as características foram consideradas, utilizandoapenas o classificador OPF para o cálculo das taxas de acerto. Para a segunda ro-

Page 124: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 8. ESTUDO DE VIABILIDADE ECONÔMICA 108

dada, as demais amostras não utilizadas na rodada anterior (25% da base de dadosinteira) foram agora aplicadas para compor uma avaliação, utilizando a taxa de acertodo OPF como função objetivo sobre o mesmo conjunto de treinamento da primeirarodada. O algoritmo HS, para selecionar as características mais relevantes, foi im-plementado utilizando 300 harmonias (HMS), HMCR=0,65 e, novamente, 10 iteraçõespara convergência como critério de parada da técnica implementada.

Duas classes são consideradas para o experimento realizado: (i) a “Classe Re-gular”, que representa os consumidores que estão em condições regulares, e (ii) a“Classe Irregular”, que representa os potenciais consumidores com irregularidades.A Tabela 8.1 apresenta os resultados com a taxa de acerto por classe da primeirarodada.

Tabela 8.1: Taxa de Acerto por Classe em Bc e Bi Através do Método Sem Seleção de Carac-terísticas

Base Classe Regular Classe IrregularBc 95,01% 58,87%Bi 94,86% 64,14%

Através da Tabela 8.1, nota-se que 58,87% dos consumidores comerciais e 64,14%do consumidores industriais que apresentam algum tipo de irregularidade foram iden-tificados corretamente. Logo, os resultados obtiveram valores razoáveis.

A Tabela 8.2 apresenta as características selecionadas durante a segunda rodadado experimento, caracterizando os perfis de consumidores comerciais (Bc) e industri-ais (Bi) para os conjuntos de dados utilizados.

Tabela 8.2: Características Selecionadas para as Bases Bc e BiCaracterísticas para Bc Características para Bi

DC, Dmax, FP, Pinst, FC DC, Dmax, FP, Pinst, FC

É apresentado, na Tabela 8.3, o resultado com as taxas de acerto por classe dasegunda rodada, ou seja, com o procedimento de seleção de características.

Tabela 8.3: Taxa de Acerto por Classe em Bc e Bi Através do Método Com Seleção de Carac-terísticas

Base Classe Regular Classe IrregularBc 98,70% 90,23%Bi 99,07% 95,54%

Através da Tabela 8.3, nota-se que 90,23% dos consumidores comerciais e 95,54%do consumidores industriais que tinham algum tipo de irregularidade foram identifica-dos corretamente, ou seja, a taxa de acerto aumentou aproximadamente 31% em

Page 125: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 8. ESTUDO DE VIABILIDADE ECONÔMICA 109

comparação com os resultados do experimento sem a seleção de características.Logo, os resultados obtiveram valores bastante otimistas.

Visto que, segundo a MME/EPE [15], em 2011, o consumo de energia elétrica daclasse comercial representou 21,90% do consumo total cativo, e da classe industrialrepresentou 23,90%, e que, de acordo com dados da ANEEL [26], o prejuízo comperdas não-técnicas (consumo irregular) de energia elétrica atingiu o patamar de R$8,10 bilhões ao ano, o que corresponde a 27 mil Gigawatts-hora (GWh), e conside-rando ainda uma distribuição uniforme de perdas comerciais entre os consumidores,supõe-se uma estimativa, através da analogia entre as informações, de que a classecomercial teria um prejuízo de aproximadamente R$ 1,77 bilhões ao ano, desperdi-çando cerca de 5.913 GWh, e a classe industrial um prejuízo de aproximadamente R$1,94 bilhões ano ano, cerca de 6.453 GWh desperdiçados, somando R$ 3,71 bilhões.Este cenário energético brasileiro está apresentado na Tabela 8.4.

Tabela 8.4: Cenário Energético Brasileiro em 2011Participação Perdas Perdas

Classe Percentual Não-Técnicas Não-Técnicasno Consumo (%) (GWh) (R$ bilhões)

Brasil 100,00 27.000 8,10Comercial 21,90 5.913 1,77Industrial 23,90 6.453 1,94

Total - 12.366 3,71

Correlacionando as informações citadas com os resultados obtidos nesta seção(sem a seleção de características - primeira rodada do experimento) e considerandoainda que todos os consumidores tivessem um consumo irregular uniformemente dis-tribuídos, ou seja, sem distinção de consumo entre os consumidores, se 58,87% detodos consumidores comerciais irregulares tivessem sido identificados, aproximada-mente R$ 1,04 bilhões seriam recuperados, o que corresponde a cerca de 3.481 GWh,e o prejuízo perante a classe comercial cairia para R$ 730 milhões ao ano, desper-diçando cerca de 2.432 GWh. E se 64,14% de todos consumidores industriais irre-gulares tivessem sido identificados, o prejuízo perante a classe industrial cairia paraR$ 690 milhões ao ano, desperdiçando cerca de 2.314 GWh, ou seja, R$ 1,24 bilhõesseriam recuperados, o que corresponde a 4.139 GWh. Totalizando um prejuízo deR$ 1,42 bilhões (4.746 GWh) considerando apenas as classes comerciais e industri-ais, ao invés de R$ 3,71 bilhões como dito anteriormente, logo, uma economia de R$2,28 bilhões (7.620 GWh). Visualiza-se os valores prejuízos projetados na Tabela 8.5,considerando a metodologia sem seleção de características.

Continuando com o mesmo raciocínio, correlaciona-se em seguida as informaçõescitadas com os resultados obtidos com a seleção de características (segunda rodadado experimento). Também, considera-se que todos os consumidores tenham um con-

Page 126: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 8. ESTUDO DE VIABILIDADE ECONÔMICA 110

Tabela 8.5: Projeção do Consumo e dos Prejuízos Anuais Aproximados Através da Metodolo-gia Sem Seleção de Características

Taxa de Acerto Recuperação de PNT Perdas Não-TécnicasClasse (%) GWh R$ bilhões GWh R$ bilhões

Comercial 58,87 3.481 1,04 2.432 0,73Industrial 64,14 4.139 1,24 2.314 0,69

Total - 7.620 2,28 4.746 1,42

sumo irregular uniformemente distribuído, ou seja, sem distinção de consumo entreos consumidores. Assim, se 90,23% de todos os consumidores comerciais irregularestivessem sido identificados, aproximadamente R$ 1,60 bilhões seriam recuperados, oque corresponde a 5.335 GWh, e o prejuízo perante a classe comercial cairia paraR$ 170 milhões ao ano, desperdiçando cerca de 578 GWh. Caso 95,54% de todosconsumidores industriais irregulares tivessem sido identificados, o prejuízo perante aclasse industrial cairia para R$ 90 milhões ao ano, desperdiçando cerca de 288 GWh,ou seja, R$ 1,85 bilhões seriam recuperados, o que corresponde a 6.165 GWh. As-sim, projetou-se um prejuízo de R$ 260 milhões (866 GWh) considerando apenas asclasses comerciais e industriais, ao invés de R$ 3,71 bilhões (12.366 GWh) como ditoanteriormente, ou seja, houve uma redução de 92,7%, o que corresponde a uma eco-nomia de R$ 3,45 bilhões (11.500 GWh). Visualiza-se a projeção dos prejuízos naTabela 8.6, considerando a metodologia com seleção de características.

Tabela 8.6: Projeção do Consumo e dos Prejuízos Anuais Aproximados Através da Metodolo-gia Com Seleção de Características

Taxa de Acerto Recuperação de PNT Perdas Não-TécnicasClasse (%) GWh R$ bilhões GWh R$ bilhões

Comercial 90,23 5.335 1,60 578 0,17Industrial 95,54 6.165 1,85 288 0,09

Total - 11.500 3,45 866 0,26

Comparando as Tabelas 8.5 e 8.6, observa-se que o prejuízo pode ser reduzidoconsideravelmente utilizando a metodologia com seleção de características, pois oprejuízo passou de R$ 1,42 bilhões para R$ 260 milhões ao ano, ou seja, haveriauma redução de aproximadamente 81% no valor do prejuízo entre a rodada 1 e arodada 2 do experimento realizado nesta seção. Mesmo que não houvesse o proce-dimento de seleção de características, o prejuízo reduziria aproximadamente 61,35%em relação ao valor estimado. Observa-se que, através da metodologia com seleçãode características, houve uma melhora de 31,35% do prejuízo em relação ao métodosem seleção de características, o que justifica a importância de caracterizar os perfisde consumidores através do processo de seleção das características mais relevan-tes. Desta maneira, pode-se notar que é possível conseguir economizar uma quantia

Page 127: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 8. ESTUDO DE VIABILIDADE ECONÔMICA 111

monetária bastante satisfatória através da metodologia empregada neste trabalho, tra-zendo grandes contribuições para o combate contra as perdas não-técnicas.

É importante lembrar que o consumo geral, em 2011, aumentou 4,2% em relaçãoao ano de 2010, de acordo com a MME/EPE [15], sendo que as classes comercial eindustrial foram responsáveis por um aumento no consumo de 6,2% e 2,3%, respec-tivamente, nesse mesmo período. Observando a Tabela 8.7 [118], percebe-se que atendência de consumo de energia elétrica é sempre aumentar, por isso a necessidadede racionar energia para evitar a construção de grandes novas usinas hidrelétricas emtempo mínimo para solução rápida do problema da falta de energia, correndo o riscode gerar apagões. Levando-se em conta, também, as dificuldades de implementação,devido aos impactos ambientais e aos confrontos entre órgãos públicos e concessio-nárias, pois cada um defendem o seu lado, para a concretização de projetos com afinalidade de aumentar a demanda de energia necessária futuramente.

Tabela 8.7: Projeção de Aumento Consumo ano Ano de Energia Elétrica entre 2011-2021(Fonte: EPE/MME)

Classe Aumento AnualResidencial 4,5%Comercial 5,8%Industrial 3,8%Outros 3,6%

Brasil (total) 4,3%

É preciso procurar planejar os investimentos de forma cuidadosa, até mesmo coma implementação de novas fontes de energia alternativas renováveis, como através daforça dos ventos (usinas eólicas), e dentre outras, como forma de administrar adequa-damente a demanda de energia elétrica gerada de forma gradual sem precisar correro risco de altos investimentos em curtos períodos de tempo, evitando até mesmo gran-des impactos ambientais.

Uma das maneiras de racionar energia de forma inteligente é buscar a diminui-ção das perdas não-técnicas, pois elas podem causar uma sobrecarga do sistemaelétrico, visto que se gasta um montante de energia que não é contabilizado, ocasi-onando uma queda da qualidade de energia entregue aos consumidores, prejuízospara as concessionárias e, ainda, perigo de risco de vida que as pessoas podemcorrer durante a realização das instalações ilegais sem o auxílio de técnicos especi-alizados das concessionárias de energia, devido aos choques elétricos que podemcausar queimaduras e fibrilação cardíaca.

8.4 Considerações Finais

Este capítulo apresenta um estudo de viabilidade econômica com relação às per-das não-técnicas, sem levar em consideração os aspectos sociais da população. Po-

Page 128: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 8. ESTUDO DE VIABILIDADE ECONÔMICA 112

rém, pode-se notar que fatores históricos, culturais e políticos da população tem grandeinfluência no contexto do problema. Um experimento adicional foi executado para de-monstrar como a metodologia desta tese poderia ser aplicada, caracterizando e iden-tificando os potenciais consumidores com irregularidades. É apresentado, também,um exemplo de recuperação de receita. No capítulo a seguir, serão expostos as con-clusões obtidas durante o desenvolvimento da tese.

Page 129: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

Capítulo 9

Conclusões

9.1 Conclusões Finais

O tema Perdas Comerciais ou Perdas Não-técnicas é apresentado neste traba-lho e se discute o quanto este assunto é atual e de abrangência mundial, mostrandoos danos causados, em se tratando de dinheiro e de energia elétrica. Tem-se queem regiões menos desenvolvidas, onde os aspectos sócio-econômicos, como edu-cação, distribuição de renda e violência, são muito precários, os índices de perdasnão-técnicas são extremamente altos, demonstrando o quanto esses fatores podemimpactar nas perdas comerciais.

É observado que fraudes e furtos de energia são atitudes de muitos consumidoressem condições de pagar pela energia consumida ou mesmo mal-intencionados afimde economizar, desafiando as concessionárias de energia, pois esta é uma práticacriminosa sujeita a penalidades. Além disso, a inadimplência é um fator, estimuladopelas altas tarifas, que está crescendo nos últimos anos e possui relações diretas comas perdas comerciais, pois o consumidor está propenso a cometer furtos ou fraudesapós o corte no fornecimento de energia.

Por isso a necessidade do estudo de maneiras alternativas de se combater es-sas perdas não-técnicas para que não comprometa o sistema elétrico, gerando umaenergia elétrica de qualidade aos consumidores e postergando futuros grandes in-vestimentos, que podem ser mal planejados e de difícil execução. As inspeções sãoprocedimentos de combate às perdas comerciais bastante comuns, mas são ativida-des que geram um custo muito grande para a concessionária, principalmente com arealização de visitas desnecessárias.

Um artifício que tem ganhado volume é o desenvolvimento de ferramentas compu-tacionais com algoritmos inteligentes para contribuir com a minimização das perdascomerciais de forma automática, ou seja, sem intervenção humana, visto que este éum método que pode ser facilmente empregado nas redes inteligentes (Smart Grid),que irá, muito provavelmente, ser futuramente implantado no mundo todo. Atravésdesse mecanismo, é possível identificar com mais precisão e rapidez os consumidores

113

Page 130: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 9. CONCLUSÕES 114

que possuem algum tipo de irregularidade. Porém, essas ferramentas somente auxi-liam na tomada de decisão apontando um potencial consumidor com irregularidades,que é verificado após uma inspeção, ou seja, elas não confirmam se o consumidor éfraudador ou não.

Muitos trabalhos abordam apenas a identificação ou detecção de perdas comerci-ais, diferentemente do que é abordado nesta tese de doutorado, onde há uma maiorpreocupação em caracterizar os consumidores, através de procedimentos de seleçãode características, ou seja, determinar quais as características são mais relevantespara o contexto do problema. Assim, é possível estabelecer o nível de importância decada característica e aumentar a efetividade da ferramenta computacional, já que éinteressante que o diagnóstico com relação as irregularidades seja em tempo real.

Neste trabalho foi desenvolvida uma metodologia que é baseada na inserção deamostras de uma base de dados (entradas) em uma ferramenta computacional, ondeestão implementadas diversas técnicas inteligentes de otimização e de classificaçãode padrões. Primeiramente, esses algoritmos híbridos são treinados de acordo comas classes previamente rotuladas e, em seguida, após a inserção e avaliação de no-vas amostras desconhecidas, retornam os resultados (saídas) apontando a classe asquais pertencem, ou seja, se possuem irregularidades ou não, bem como as suascaracterísticas mais relevantes.

A base de dados possui amostras de diversos perfis de consumidores comerciaise industriais disponibilizada por uma concessionária brasileira composta por 8 carac-terísticas na seguinte ordem: Demanda Faturada, Demanda Contratada, DemandaMáxima, Energia Reativa, Transformador de Potência, Fator de Potência, Potência Ins-talada e Fator de Carga. Os perfis de consumidores residenciais não foram abordadosneste trabalho, pois haviam pouquíssimas amostras representativas de usuários comirregularidades.

As técnicas de reconhecimento ou classificação de padrões implementadas foram:Redes Neurais Artificiais (Perceptron Multi-camadas e Mapas de Auto-organização,Máquinas de Vetores de Suporte (com e sem função núcleo), k-Vizinhos Mais Próxi-mos, Redes Bayesianas, e Floresta de Caminhos Ótimos.

Entre as técnicas de otimização, foram implementados os seguintes algoritmosevolutivos: Particle Swarm Optimization, Gravitational Search Algorithm, Harmony Se-arch, Cuckoo Search, Bat Algoritm, Firefly Algorithm e Charged System Search.

Após a implementação dos algoritmos inteligentes, foram realizados 4 experimen-tos. O experimento principal desta tese é o Experimento 1, sendo que os demaisexperimentos possuem como finalidade a adição de novos conhecimentos na meto-dologia adotada através da apresentação novos algoritmos e novas formas de atendero objetivo deste trabalho.

Através dos resultados do Experimento 1, nota-se que na avaliação da robustez

Page 131: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 9. CONCLUSÕES 115

dos classificadores, o algoritmo OPF superou os demais tanto pela sua eficiênciaquanto pela sua eficácia. Logo, OPF foi o classificador escolhido para as técnicasde otimização para a seleção de características. Já na comparação entre os algorit-mos híbridos, o algoritmo HS-OPF se destacou por apresentar melhor equilíbrio entrea taxa de acerto e a complexidade computacional, embora as taxas de acerto do PSO-OPF terem sido levemente superiores.

São apresentados no Experimento 2 diversas novas técnicas de otimização queforam lançadas recentemente e que estão sendo bastante utilizadas em pesquisasdo mundo inteiro. Entre elas, destaque para o Cuckoo Search, com a utilização deuma versão binária (BCS) para a seleção de características. Percebe-se que as taxasde acerto foram muito semelhantes em todos os casos, prova de que essas técnicassão muito semelhantes em seu funcionamento. Apesar dos resultados estarem umpouco acima da taxa de acerto do HS-OPF, como mostrado no Experimento 1, todosos algoritmos apresentaram elevada carga computacional.

Com relação ao Experimento 3, é mostrado que é possível diversificar as ANNscom a aplicação de novos algoritmos de treinamento, além do tradicional Backpro-pagation. É possível notar que as taxas de acerto aumentaram consideravelmente,porém a substituição do classificador OPF para alguma outra ANN implementada comum algoritmo evolutivo não é viável, pois elevaria muito o tempo de treinamento devidoa maior complexidade computacional.

A função do Experimento 4 é apenas apresentar um método alternativo de maneirasimples e rápida, sem a necessidade de conhecimentos de linguagens de alto nívelpara programação. O software WEKA é uma ferramenta computacional que possuidiversas técnicas inteligentes implementadas, sendo apresentado numa interface ami-gável. Nesse ambiente, foi possível atender o objetivo proposto nesta tese sem muitasdificuldades. Nos resultados do Experimento 4, a técnica k-NN superou a Rede Baye-siana (RB) em todas as situações, seja ela com ou sem seleção de características.

Entretanto, é importante ressaltar que o objetivo principal deste trabalho é o dedestacar a importância da seleção de características no contexto das perdas não-técnicas, e não para descobrir qual técnica de seleção de características é a melhor.

Após a realização dos experimentos, foi realizado um estudo de viabilidade econô-mica para demonstrar a utilidade da metodologia descrita nesta tese. Apesar de nãoconsiderar os aspectos sócio-econômicos, pois as bases de dados disponibilizadaspara este trabalho não continham informações deste tipo, somente informações técni-cas, realizou-se um experimento adicional apenas para apresentar de forma sucinta oprocesso de caracterização dos perfis de consumidores.

Neste experimento, comparou-se para quanto poderia ser reduzido o prejuízo deR$ 3,71 bilhões de reais ao ano devido as perdas comerciais, vindo das classes co-merciais e industriais. Os resultados foram bastante otimistas, pois considerando a

Page 132: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 9. CONCLUSÕES 116

metodologia sem seleção de características, o prejuízo seria de R$ 1,42 bilhões, umaredução de 61,35%. Para a metodologia com seleção de características, o prejuízocaiu para R$ 260 milhões, ou seja, reduziu cerca de 92,70%. Desta maneira, as con-cessionárias poderiam ter uma recuperação de receita de aproximadamente R$ 3,45bilhões de reais ao ano, sem contar a classe residencial. Pode-se visualizar, também,no resultado deste experimento adicional, quais são as características fundamentaisque melhor definem o comportamento de um perfil de consumidor com irregularidadesno consumo de energia elétrica.

Neste trabalho de doutorado é abordado o problema da caracterização de perdasnão-técnicas. Pode-se concluir que, dado que as bases de dados são geralmentecompostas por milhares de perfis de consumidores regulares e irregulares, o uso deferramentas inteligentes para selecionar as características mais relevantes e identifi-car os usuários que apresentam alguma irregularidade de forma automática é muitointeressante se forem consideradas a eficácia e a eficiência das técnicas como umarelação de custo/benefício.

9.2 Trabalhos Publicados

Esta seção apresenta os artigos publicados durante a execução deste trabalho.Dentre os artigos relacionados com o tema proposto estão:

• Luis A. M. Pereira, Douglas Rodrigues, Thiago N. S. Almeida, Caio C. O. Ramos,André N. Souza, Xin-She Yang, João P. Papa. A Binary Cuckoo Search andits Application for Feature Selection. Capítulo de livro em “Cuckoo Search andFirefly Algorithm: Theory and Applications”, 2014.

• Caio C. O. Ramos, André N. Souza, Tiago Forti da Silva, Danilo S. Gastaldello,João P. Papa. Study of Non-Technical Losses for Smart Grids Applications inBrazil. X Latin American Congress on Generation, Transmission and Distribution(CLAGTEE), Viña del Mar, Chile, 2013.

• Douglas Rodrigues, Luis Pereira, Joao P. Papa, Caio C. O. Ramos, Andre N.Souza, Luciene Papa. Optimizing Feature Selection through Binary ChargedSystem Search. 15th International Conference on Computer Analysis of Imagesand Patterns (CAIP), York, Reino Unido, 2013.

• Caio C. O. Ramos, Tiago Forti da Silva, Danilo S. Gastaldello, André N. Souza.Seleção de Características para Detecção de Perdas Comerciais Usando oSoftware WEKA. X Conferência Brasileira sobre Qualidade da Energia Elétrica(CBQEE), Araxá-MG, 2013.

• Karila M. Santos, André N. Souza, Danilo S. Gastaldelo, Caio C. O. Ramos. Ava-liação do Uso de Ferramentas Inteligentes no Estudo de Padrões em Curvas de

Page 133: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 9. CONCLUSÕES 117

Carga. X Conferência Brasileira sobre Qualidade da Energia Elétrica (CBQEE),Araxá-MG, 2013.

• Luis A. M. Pereira, Luis C. S. Afonso, João P. Papa, Zita A. Vale, Caio C. O.Ramos, Danilo S. Gastaldello, André N. Souza. Multilayer Perceptron NeuralNetworks Training Through Charged System Search and its Application for Non-Technical Losses Detection. II Conferência em “Innovative Smart Grid Technolo-gies” (IEEE ISGT Latin America), São Paulo-SP, 2013.

• Douglas Rodrigues, Luis A. M. Pereira, Thiago N. S. Almeida, João P. Papa,André N. Souza, Caio C. O. Ramos, Xin-She Yang. BCS: a Binary Cuckoo SearchAlgorithm for Feature Selection. IEEE International Symposium on Circuits andSystems (ISCAS), Pequim, China, 2013.

• Caio C. O. Ramos, André N. Souza, Danilo S. Gastaldello, João P. Papa. Identi-fication and Feature Selection of Non-Technical Losses for Industrial ConsumersUsing the Software WEKA. IEEE/IAS 10th International Conference on IndustryApplications (INDUSCON), Fortaleza-CE, 2012.

• Karila M. Santos, André N. Souza, Danilo S. Gastaldello, Caio C. O. Ramos, Pe-dro da Costa Jr. Desenvolvimento de um Algoritmo para Determinar Curvas deCarga a partir da Posse e dos Hábitos de Consumo para Consumidores: Resi-denciais, Comerciais e Industriais. IV Simpósio Brasileiro de Sistemas Elétricos(SBSE), Goiania-GO, 2012.

• Caio C. O. Ramos, André N. Souza, Alexandre X. Falcão, João P. Papa. NewInsights on Non-technical Losses Characterization Through Evolutionary-basedFeature Selection. IEEE Transactions on Power Delivery, 2012 (periódico qualisA1).

• Caio C. O. Ramos, André N. Souza, Giovani Chiachia, Alexandre X. Falcão, JoãoP. Papa. A Novel Algorithm for Feature Selection using Harmony Search and itsApplication for Non-Technical Losses. Computers and Electrical Engineering,2011 (periódico qualis A2).

• Caio C. O. Ramos, André N. Souza, Danilo S. Gastaldello, João P. Papa. Seleçãode Características para Identificação e Caracterização de Perdas Não-TécnicasUtilizando Busca Harmônica e Floresta de Caminhos Ótimos. The 9th Latin-American Congress On Electricity Generation and Transmission (CLAGTEE),Mar Del Plata, Argentina, 2011.

• Caio C. O. Ramos, André N. Souza, Rodrigo Y. M. Nakamura, João P. Papa.Electrical Consumers Data Clustering Through Optimum-Path Forest. 16th Inter-

Page 134: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 9. CONCLUSÕES 118

national Conference on Intelligent System Application on Power Systems (ISAP),Hersonissos, Grécia, 2011.

• Caio C. O. Ramos, André N. Souza, Danilo S. Gastaldello, Rodrigo Y. M. Naka-mura, João P. Papa. Identificação de Perdas Não-Técnicas Utilizando Agrupa-mento de Dados por Floresta de Caminhos Ótimos. X Simpósio Brasileiro deAutomação Inteligente (SBAI), São João Del Rei-MG, Brasil, 2011.

• Caio C. O. Ramos, André N. Souza, João P. Papa, Giovani Chiachia, Alexan-dre X. Falcão. What is the Importance of Selecting Features for Non-TechnicalLosses Identification? IEEE International Symposium on Circuits and Systems(ISCAS), Rio de Janeiro-RJ, Brazil, 2011.

• Caio C. O. Ramos, André N. Souza, Alexandre X. Falcão, João P. Papa. A NewApproach for Nontechnical Losses Detection Based on Optimum-Path Forest.IEEE Transactions on Power Systems, 2011 (periódico qualis A1).

• Caio C. O. Ramos, André N. Souza, João P. Papa. On the Evaluation of Diffe-rent Metrics for Non-Technical Losses Estimation Through Optimum-Path Forest.XVIII Congresso Brasileiro de Automática (CBA), Bonito-MS, Brasil, 2010.

• Caio C. O. Ramos, André N. Souza, Alexandre X. Falcão, João P. Papa. Lear-ning to Identify Non-Technical Losses with Optimum-Path Forest. 17th Internati-onal Conference on Systems, Signals and Image Processing (IWSSIP), Rio deJaneiro-RJ, Brasil, 2010.

A seguir são listados os artigos publicados que não estão dentro do tema proposto,mas que contam com a participação do aluno de doutorado:

• Tiago Forti da Silva, André N. Souza, Danilo S. Gastaldello, Caio C. O. Ramos.Expansion Planning of the Transmission System Using Intellingent Techniques. XLatin American Congress on Generation, Transmission and Distribution (CLAG-TEE), Viña del Mar, Chile, 2013.

• André N. Souza, Jônatas L. Padilha, Wallace H. Sato, Danilo S. Gastaldello, CaioC. O. Ramos, Karila M. Santos. Estudos para Identificação e Classificação deHarmônicos em Medição de Energia Elétrica Utilizando uma Arquitetura Neural.IV Simpósio Brasileiro de Sistemas Elétricos (SBSE), Goiania-GO, 2012.

• Danilo S. Gastaldello, André N. Souza, Haroldo L. M. Amaral, Maria G. Zago,Caio C. O. Ramos. Estudos para Localização de Faltas em Redes SubterrâneasIntegrando o Software PSCAD/EMTDC e Ferramentas Inteligentes. IV SimpósioBrasileiro de Sistemas Elétricos (SBSE), Goiania-GO, 2012.

Page 135: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

CAPÍTULO 9. CONCLUSÕES 119

• André N. Souza, Danilo S. Gastaldello, Caio C. O. Ramos, J. M. Prado, E. S.Gusmão, Maria G. Zago, João Paulo Papa. Implementação de Ferramentas In-teligentes Para Diagnóstico e Apoio à Decisão na Identificação de Falhas emPara-raios. Congresso Brasileiro de Automática (CBA), Campina Grande-PB,2012.

• André N. Souza, Caio C. O. Ramos, Danilo S. Gastaldello, Rodrigo Y. M. Naka-mura, João P. Papa. Fast Fault Diagnosis in Power Transformers Using Optimum-Path Forest. IEEE 16th International Conference on Intelligent Engineering Sys-tems (INES), Lisboa, Portugal, 2012.

• Danilo S. Gastaldello, André N. Souza, Caio C. O. Ramos, Pedro da Costa Jr.,Maria G. Zago. Fault location in Underground Systems Using Artificial NeuralNetworks and PSCAD/EMTDC. IEEE 16th International Conference on IntelligentEngineering Systems (INES), Lisboa, Portugal, 2012.

• André N. Souza, Pedro da Costa Jr., Paulo S. da Silva, Caio C. O. Ramos, João P.Papa. Efficient Fault Location in Underground Systems Through Optimum-PathForest. Applied Artificial Intelligence, 2012 (periódico qualis A2).

• André N. Souza, Pedro da Costa Jr., Paulo S. da Silva, Caio C. O. Ramos, JoãoP. Papa. Fault Location in Underground Systems Through Optimum-Path Forest.16th International Conference on Intelligent System Application on Power Sys-tems (ISAP), Herssonissos, Grécia, 2011.

• André N. Souza, Maria G. Zago, Osvaldo R. Saavedra, Caio C. O. Ramos, KleberFerraz. A Computational Tool to Assist the Analysis of the Transformer BehaviorRelated to Lightning. International Journal of Electrical Power and Energy Sys-tems, 2011 (periódico qualis A2).

Page 136: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

Referências Bibliográficas

[1] S. Haykin. Neural networks: a comprehensive foundation. Prentice Hall, 1994.

[2] L. A. Zadeh. Fuzzy logic. Computer, 21(4):83–93, 1988.

[3] J. R. Koza. Genetic programming: on the programming of computers by meansof natural selection. The MIT Press, Cambridge, MA, 1992.

[4] V. N. Vapnik. An overview of statistical learning theory. In IEEE Transactions onNeural Networks, volume 10, pages 988–999, 1999.

[5] B. Schölkopf and A. J. Smola. Learning with Kernels. MIT Press, 2002.

[6] J. Nagi, A. M. Mohammad, K. S. Yap, S. K. Tiong, and S. K. Ahmed. Non-technical loss analysis for detection of electricity theft using support vector ma-chines. In Proceedings of the 2nd IEEE International Power and Energy Confe-rence, pages 907–912, 2008.

[7] Í. Monedero, F. Biscarri, C. León, J. Biscarri, and R. Millán. Midas: Detection ofnon-technical losses in electrical consumption using neural networks and statis-tical techniques. In Proc. of the Int. Conf. on Computational Science and Appli-cations, volume 3984, Springer Berlin/Heidelberg, 2006. Lec. Notes in ComputerScience.

[8] C. C. O. Ramos, A. N. Souza, J. P. Papa, and A. X. Falcão. A new approach fornontechnical losses detection based on optimum-path forest. IEEE Transactionson Power Systems, 26:181–189, 2011.

[9] A. H. Nizar, J. H. Zhao, and Z. Y. Dong. Customer information system data pre-processing with feature selection techniques for non-technical losses predictionin an electricity market. In International Conference on Power System Techno-logy, pages 1–7, 2006.

[10] J. Kennedy and R. C. Eberhart. Swarm Intelligence. M. Kaufman, 2001.

[11] Z. W. Geem. Music-Inspired Harmony Search Algorithm: Theory and Applicati-ons. Springer Publishing Company, Incorporated, 1st edition, 2009.

[12] M. Dorigo, V. Maniezzo, and A. Colorni. The ant system: Optimization by a colonyof cooperating agents. IEEE Transactions on Systems, Man, and Cybernetics-Part B, 26:29–41, 1996.

[13] J. P. Papa, A. X. Falcão, and C. T. N. Suzuki. Supervised pattern classificationbased on optimum-path forest. International Journal of Imaging Systems andTechnology, 19(2):120–131, 2009.

120

Page 137: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

REFERÊNCIAS BIBLIOGRÁFICAS 121

[14] J. P. Papa, A. X. Falcão, V. H. C. Albuquerque, and J. M. R. S. Tavares. Effi-cient supervised optimum-path forest classification for large datasets. PatternRecognition, 45(1):512–520, 2012.

[15] MME/EPE. Anuário estatístico de energia elétrica 2012. Technical report, Go-verno Federal, 2012.

[16] R. F. Calili. Desenvolvimento de sistema para detecção de perdas comerciais emredes de distribuição de energia elétrica. Master’s thesis, Pontifícia UniversidadeCatólica do Rio de Janeiro, 2005.

[17] E. X. Vieiralves. Proposta de uma metodologia para avaliação das perdas co-merciais dos sistemas elétricos. o caso manaus. Master’s thesis, UniversidadeEstadual de Campinas, 2005.

[18] A. C. M. de Araújo. Perdas e Inadimplência na Atividade de Distribuição deEnergia Elétrica no Brasil. PhD thesis, Universidade Federal do Rio de Janeiro,2007.

[19] A. Méffe. Metodologia para cáculos de perdas técnicas por segmento do sis-tema de distribuição. Master’s thesis, Escola Politécnica da Universidade deSão Paulo, 2001.

[20] A. Méffe. Cálculo de Perdas Técnicas em Sistemas de Distribuição − ModelosAdequáveis às Características do Sistema e à Disponibilidade de Informações.PhD thesis, Escola Politécnica da Universidade de São Paulo, 2007.

[21] I. E. Davidson. Evaluation and effective management of nontechnical losses inelectrical power networks. In IEEE AFRICON Conference in Africa, volume 1,pages 473–477, 2002.

[22] N. A. Eller. Arquitetura de Informação para o Gerenciamento de Perdas Comer-ciais de Energia Elétrica. PhD thesis, Universidade Federal de Santa Catarina,2003.

[23] R. Millard and M. Emmerton. Non-technical losses - how do other countriestackle the problem? In AMEU Proceedings 2009, pages 67–81, 2009.

[24] A. Pyasi and V. Verma. Improvement in electricity distribution efficiency to mi-tigate pollution. In Proceedings of International Symposium on Electronics andthe Environment, pages 1–1, San Fracisco, California, USA, 2008.

[25] D. Maia. O uso de inteligência na redução das perdas comerciais. Revista GTDEnergia Elétrica, 43:22–29, 2011.

[26] ANEEL. Consumo irregular de energia gera prejuízo de R$ 8,1 bilhões ao ano.Clic Energia, 2011.

[27] ABRADEE. Perdas: Furto e Fraude de Energia, 2012. Disponí-vel em http://www.abradee.com.br/setor-de-distribuicao/perdas/furto-e-fraude-de-energia.

Page 138: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

REFERÊNCIAS BIBLIOGRÁFICAS 122

[28] C. A. S. Penin. Combate, Prevenção e Otimização das Perdas Comerciais deEnergia Elétrica. PhD thesis, Universidade de São Paulo, 2008.

[29] ANEEL. Resolução Normativa 414, 2010.

[30] ANEEL. Informações Técnicas, 2012. Disponível em http://www.aneel.gov.br/.

[31] ANEEL. Manual do Programa de Pesquisa e Desenvolvimento Técnológico doSetor de Energia Elétrica, 2012.

[32] ANEEL. Revista Pesquisa e Desenvolvimento da ANEEL, (4), 2011.

[33] X. Fang, S. Misra, G. Xue, and D. Yang. Smart grid - the new and improvedpower grid: A survey. IEEE Communications Surveys and Tutorials, PP:1–37,2011.

[34] ANEEL. Revista Pesquisa e Desenvolvimento da ANEEL, (1), 2006.

[35] ANEEL. Revista Pesquisa e Desenvolvimento da ANEEL, (3), 2009.

[36] L. T. de Faria. Sistema inteligente híbrido intercomunicativo para detecção deperdas comerciais. Master’s thesis, Universidade Estadual Paulista, 2012.

[37] G. V. C. Ortega. Redes neurais na identificação de perdas comerciais do setorelétrico. Master’s thesis, Pontifícia Universidade Católica do Rio de Janeiro,2008.

[38] G. M. F. Paula. Curvas típicas de carga para o planejamento operacional dosistema de distribuição. Master’s thesis, Universidade de São Paulo, 2006.

[39] T. Kohonen. Self-organizing map. In Proceedings of the IEEE, volume 78, pages1464–1480, 1990.

[40] I. Ali, F.A. Butt, A. Malik, and T. Khalid. Need for smart transmission grid in pakis-tan: (technical and non-technical challenges in its development). In 2013 IEEEBusiness Engineering and Industrial Applications Colloquium (BEIAC), pages145–149, April 2013.

[41] A. Chauhan and S. Rajvanshi. Non-technical losses in power system: A review.In 2013 International Conference on Power, Energy and Control (ICPEC), pages558–561, Feb 2013.

[42] P.R. Babu, B. Sushma, and K.B. Ashwin. Hvds approach for reducing the te-chnical and non-technical losses to enhance the electrical distribution systemperformance. In 2012 IEEE 5th India International Conference on Power Elec-tronics (IICPE), pages 1–5, Dec 2012.

[43] M. Anas, N. Javaid, A. Mahmood, S. M. Raza, U. Qasim, and Z. A. Khan. Minimi-zing electricity theft using smart meters in ami. In Proceedings of the 2012 Se-venth International Conference on P2P, Parallel, Grid, Cloud and Internet Com-puting, 3PGCIC ’12, pages 176–182. IEEE Computer Society, 2012.

Page 139: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

REFERÊNCIAS BIBLIOGRÁFICAS 123

[44] J.R. Aguero. Improving the efficiency of power distribution systems through te-chnical and non-technical losses reduction. In 2012 IEEE PES Transmission andDistribution Conference and Exposition (T&D), pages 1–8, 2012.

[45] M.C. Evaldt, J.V. Canto dos Santos, R.M. Figueiredo, L.T. da Silva, and M.R.Stracke. Payback analysis in identification and monitoring of commercial lossesin distribution networks. In 2012 9th International Conference on the EuropeanEnergy Market (EEM), pages 1–6, May 2012.

[46] V. Paruchuri and S. Dubey. An approach to determine non-technical energy los-ses in india. In 2012 14th International Conference on Advanced CommunicationTechnology (ICACT), pages 111–115, Feb 2012.

[47] A. Al-Hinai, A. Al-Badi, E. A. Feilat, and M. Albadi. Efficiency enhancements ofelectric power system and economic analysis − practical case study. Internatio-nal Journal of Thermal & Environmental Engineering, 5(2):183–190, 2013.

[48] S. Agrawal and V. Bhuria. Determination of nontechnical losses via matlab envi-ronment. International Journal of Advanced Research in Computer Engineeringand Technology, 2(6):2085–2090, 2013.

[49] Shih-Che Huang, Yuan-Liang Lo, and Chan-Nan Lu. Non-technical loss detec-tion using state estimation and analysis of variance. IEEE Transactions on PowerSystems, 28(3):2959–2966, Aug 2013.

[50] S.S. Ribeiro, T. Cazes, R.F. Mano, and D. Maia. Investment optimization metho-dology applied to investments on non-technical losses reduction actions. In 2012IEEE Symposium on Computers and Communications (ISCC), pages 000354–000360, July 2012.

[51] E. de O da Costa, F. Fabris, A. Rodrigues Loureiros, H. Ahonen, F.M. Varejao,and R.M. Ferro. Using ga for the stratified sampling of electricity consumers. In2013 IEEE Congress on Evolutionary Computation (CEC), pages 261–268, June2013.

[52] S. V. Verdú, M. O. Garcia, F. J. G. Franco, N. Encinas, A. G. Marín, and E. G.Lázaro. Characterization and identification of electrical customers through theuse of self-organizing maps and daily load parameters. In IEEE Power SystemsConference and Exposition, 2004.

[53] Y. M. C Masselli, E. Ferreira, G. L. Torres, L. E. B. da Silva, R. Rossi, and L. O. M.dos Reis. Suggestion of a neuro-genetic hybrid system as an alternative for theelectric power consumption curves evaluation. Revista Ciências Exatas, 12:13–18, 2006.

[54] Í. Monedero, F. Biscarri, C. León, J.I. Guerrero, J. Biscarri, and R. Millá. Detectionof frauds and other non-technical losses in a power utility using pearson coeffi-cient, bayesian networks and decision trees. International Journal of ElectricalPower and Energy Systems, 34:90–98, 2012.

[55] J. E. Cabral, J. O. P. Pinto, E. M. Martins, and A. M. A. C. Pinto. Fraud detectionin high voltage electricity consumers using data mining. In IEEE Transmissionand Distribution Conference and Exposition, 2008.

Page 140: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

REFERÊNCIAS BIBLIOGRÁFICAS 124

[56] J. Nagi, A. M. Mohammad, K. S. Yap, S. K. Ahmed, and S. K. Tiong. Detectionof abnormalities and electricity theft using genetic support vector machines. InIEEE Conference TENCON, pages 1–6, 2008.

[57] A. H. Nizar, Z. Y. Dong, and P. Zhang. Detection rules for non-technical lossesanalysis in power utilities. In IEEE Power and Energy Society General Meeting,pages 1–8, 2008.

[58] A. H. Nizar, Z. Y. Dong, P. M. Jalaluddin, and M. J. Raffles. Load profiling methodin detecting non-technical loss activities in a power utility. In IEEE InternationalPower and Energy Conference, pages 82–87, 2006.

[59] A. H. Nizar, Z. Y. Dong, J. H. Zhao, and P Zhang. A data mining based ntlanalysis method. In IEEE Power Engineering Society General Meeting, pages1–8, 2007.

[60] A.H. Nizar, Z.Y. Dong, and Y. Wang. Power utility nontechnical loss analysiswith extreme learning machine method. IEEE Transactions on Power Systems,23:946–955, 2008.

[61] A.H. Nizar and Z.Y. Dong. Identification and detection of electricity customerbehaviour irregularities. In Proceedings of the IEEE/PES Power Systems Con-ference and Exposition, pages 1–10, 2009.

[62] Z. L Kovacs. Redes Neurais Artificiais: Fundamentos e Aplicações. EscolaPolitécnica da Universidade de São Paulo, 1996.

[63] P. P. Raghu, R. Poongodi, and B. Yegnanarayana. A combined neural networkapproach for texture classification. Neural Networks, 8:975–987, 1995.

[64] T. Kohonen. Self-Organizing and Associative Memory. Springer-Verlag, 1989.

[65] T. Kohonen. Things you haven’t heard about self-organiznig map. In IEEE Inter-national Conference on Neural Networks, volume III, pages 1147–1156, 1993.

[66] B. Schölkopf, R. C. Williamson, and P. L. Bartlett. New support vector algorithms.In Neural Computation, pages 1207–1245. MIT Press, 2000.

[67] C. Cortes and V. Vapnik. Support-vector networks. In Machine Learning, pages273–297. Kluwer Academic Publishers, 1995.

[68] P. J. Phillips. Support vector machines applied to face recognition. In Advances inNeural Information Processing Systems, volume 11, pages 803–809. MIT Press,1999.

[69] C. C. Chang and C. J. Lin. LIBSVM: A Library for Support Vector Machines,2001. Software disponível em http://www.csie.ntu.edu.tw/~cjlin/libsvm.

[70] T. M. Mitchell. Machine Learning. WCB/McGraw-Hill, 1997.

[71] J. Pan, Y. Qiao, and S. Sun. A fast k nearest neighbors classification algorithm. InIEICE Transactions on Fundamentals of Electronics, Communications and Com-puter Sciences, volume E87-A, 2004.

Page 141: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

REFERÊNCIAS BIBLIOGRÁFICAS 125

[72] J. P. Papa and A. X. Falcão. A new variant of the optimum-path forest classifier. In4th International Symposium on Advances in Visual Computing, pages 935–944,2008.

[73] J. P. Papa and A. X. Falcão. A learning algorithm for the optimum-path forestclassifier. In 7th IAPR Workshop on Graph-based Representations in PatternRecognition, 2009.

[74] A.X. Falcão, J. Stolfi, and R.A. Lotufo. The image foresting transform: Theory, al-gorithms, and applications. IEEE Transactions on Pattern Analysis and MachineIntelligence, 26(1):19–29, 2004.

[75] R. E. Neapolitan. Learning Bayesian Networks. Prentice Hall, 2003.

[76] F. V. Jensen. Bayesian Networks and Decision Graphs. Springer, 2001.

[77] C. Karcher. Redes bayesianas aplicadas À análise do risco de crédito. Master’sthesis, Escola Politécnica da Universidade de São Paulo, 2009.

[78] H. A. Firpi and E. Goodman. Swarmed feature selection. In Proceedings of the33rd Applied Imagery Pattern Recognition Workshop, pages 112–118, Washing-ton, DC, USA, 2004. IEEE Computer Society.

[79] J. Kennedy and R. C. Eberhart. A discrete binary version of the particle swarmalgorithm. In IEEE International Conference on Systems, Man, and Cybernetics,volume 5, pages 4104–4108, 1997.

[80] D. Halliday, R. Resnick, and J. Walker. Extended , Fundamentals of Physics, 6thEdition. Wiley, 2000.

[81] R. Mansouri, F. Nasseri, and M. Khorrami. Effective time variation of g in a modeluniverse with variable space dimension. Physics Letters, 259:194–200, 1999.

[82] E. Rashedi, H. Nezamabadi-pour, and S. Saryazdi. Gsa: A gravitational searchalgorithm. Information Sciences, 179(13):2232–2248, 2009.

[83] E. Rashedi, S. Saryazdi, and H. Nezamabadi-pour. Bgsa: binary gravitationalsearch algorithm. Natural Computing, 9:727–745, 2010.

[84] C. C. O. Ramos, A. N. Souza, A. X. Falcão, and J. P. Papa. New insights on non-technical losses characterization through evolutionary-based feature selection.IEEE Transactions on Power Delivery, 27:140–146, 2012.

[85] Z. W. Geem. Novel derivative of harmony search algorithm for discrete designvariables. Applied Mathematics and Computation, 199:223–230, 2008.

[86] K. S. Lee and Z. W. Geem. A new meta-heuristic algorithm for continuous engi-neering optimization: harmony search theory and practice. Computer Methodsin Applied Mechanics and Engineering, 194:3902–3933, 2005.

[87] C. C. O. Ramos, A. N. Souza, Giovani Chiachia, A. X. Falcão, and J. P. Papa. Anovel algorithm for feature selection using harmony search and its application fornon-technical losses detection. Computers and Electrical Engineering, 37:886–894, 2011.

Page 142: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

REFERÊNCIAS BIBLIOGRÁFICAS 126

[88] O. Alia and R. Mandava. The variants of the harmony search algorithm: anoverview. Artificial Intelligence Review, 36:49–68, 2011.

[89] M. Mahdavi, M. Fesanghary, and E. Damangir. An improved harmony searchalgorithm for solving optimization problems. Applied Mathematics and Compu-tation, 188(2):1567 – 1579, 2007.

[90] M.G.H. Omran and M. Mahdavi. Global-best harmony search. Applied Mathe-matics and Computation, 198(2):643 – 656, 2008.

[91] D. Zou, L. Gao, J. Wu, and S. Li. Novel global harmony search algorithm forunconstrained problems". Neurocomputing, 73(1618):3308 – 3318, 2010.

[92] Q.-K. Pan, P.N. Suganthan, M. F. Tasgetiren, and J.J. Liang. A self-adaptive glo-bal best harmony search algorithm for continuous optimization problems. AppliedMathematics and Computation, 216(3):830 – 848, 2010.

[93] X.-S. Yang and S. Deb. Engineering optimisation by cuckoo search. Internatio-nal Journal of Mathematical Modelling and Numerical Optimisation, 1:330–343,2010.

[94] R. Rajabioun. Cuckoo optimization algorithm. Applied Soft Computing, 11:5508–5518, 2011.

[95] D.R. Griffin, F.A. Webster, and C.R. Michael. The echolocation of flying insectsby bats. Animal Behaviour, 8(3-4):141 – 154, 1960.

[96] W. Metzner. Echolocation behaviour in bats. Science Progress Edinburgh,75(298):453–465, 1991.

[97] H.-U. Schnitzler and E.K.V. Kalko. Echolocation by insect-eating bats. BioSci-ence, 51(7):557–569, July 2001.

[98] X.-S. Yang. Bat algorithm for multi-objective optimisation. International Journalof Bio-Inspired Computation, 3(5):267–274, 2011.

[99] SwarmsLab. Bat Algorithm, 2012. Disponível em http://www.mathworks.com/matlabcentral/fx_files/39116/1/SwarmsBat_1.jpg.

[100] R. Y. M. Nakamura, L. A. M. Pereira, K. A. Costa, D. Rodrigues, J. P. Papa, andX.-S. Yang. BBA: A binary bat algorithm for feature selection. In Proceedingsof the XXV SIBGRAPI - Conference on Graphics, Patterns and Images, pages291–297, 2012.

[101] X.S. Yang. Nature-Inspired Metaheuristic Algorithms. Luniver Press, 2008.

[102] X.S. Yang. Firefly algorithms for multimodal optimization. Lecture Notes in Com-puter Sciences, 5792:169–178, 2009.

[103] SwarmsLab. Firefly Algorithm, 2013. Disponível em http://www.mathworks.com/matlabcentral/fx_files/38931/3/SwarmFireFly_distance.jpg.

[104] X.S. Yang. Firefly algorithm, stochastic test functions and design optimisation.International Journal Bio-Inspired Computation, 2:78–84, 2010.

Page 143: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

REFERÊNCIAS BIBLIOGRÁFICAS 127

[105] M. K. Sayadi, R. Ramezanian, and N. Ghaffari-Nasab. A discrete firefly meta-heuristic with local search for makespan minimization in permutation flow shopscheduling problems. International Journal of Industrial Engineering Computati-ons, 1:1–10, 2010.

[106] H. Banati and M. Bajaj. Fire Fly Based Feature Selection Approach. InternationalJournal of Computer Science Issues, 8(4):473–480, 2011.

[107] A. Kaveh and S. Talatahari. A novel heuristic optimization method: chargedsystem search. Acta Mechanica, 213(3):267–289, 2010.

[108] COPEL. Manual de Eficiência Energética na indústria, 2005.

[109] CELESC. Fator de carga e Fator de Potência, 2011. Disponível em http://portal.celesc.com.br/portal/grandesclientes/.

[110] C. C. O. Ramos, A. N. Souza, Giovani Chiachia, A. X. Falcão, and J. P. Papa.What is the importance of selecting features for non-technical losses identifica-tion? In IEEE International Symposium on Circuits and Systems - ISCAS, pages1045–1048, 2011.

[111] R. E. Fan, K. W. Chang, C. J. Hsieh, X. R. Wang, and C. J. Lin. LIBLINEAR:A library for large linear classification. Journal of Machine Learning Research,9:1871–1874, 2008.

[112] J. P. Papa, C. T. N. Suzuki, and A. X. Falcão. LibOPF: A library for the designof optimum-path forest classifiers, 2009. Software version 2.0 disponível emhttp://www.ic.unicamp.br/~afalcao/LibOPF.

[113] S. Nissen. Implementation of a Fast Artificial Neural Network Library (FANN),2003. Department of Computer Science University of Copenhagen (DIKU). Soft-ware disponível em http://leenissen.dk/fann/.

[114] L.A.M. Pereira, L.C.S. Afonso, J.P. Papa, Z.A. Vale, C.C.O. Ramos, D.S. Gastal-dello, and A.N. Souza. Multilayer perceptron neural networks training throughcharged system search and its application for non-technical losses detection. In2013 IEEE PES Conference On Innovative Smart Grid Technologies Latin Ame-rica (ISGT LA), pages 1–6, April 2013.

[115] M. Hall, E. Frank, G. Holmes, B. Pfahringer, P. Reutemann, and I. H. Witten. Theweka data mining software: An update; sigkdd explorations. IEEE Transactionson Power Delivery, 11(1), 2009.

[116] C.C.O. Ramos, T.F. Silva, D.S. Gastaldello, and A.N. de Souza. Seleção decaracterísticas para detecção de perdas comerciais usando o software weka. InX Conferência Brasileira sobre Qualidade da Energia Elétrica (CBQEE), pages1–6, 2013.

[117] J. Pan, Y. Qiao, and S. Sun. A fast k nearest neighbors classification algorithm. InIEICE Transactions on Fundamentals of Electronics, Communications and Com-puter Sciences, volume E87-A, 2004.

Page 144: Caracterização de Perdas Comerciais em Sistemas de Energia ... · BFFA Binary Firefly Algorithm (Algoritmo do Vaga-lume Binário) B i Base de Dados de Consumidores Industriais

REFERÊNCIAS BIBLIOGRÁFICAS 128

[118] MME/EPE. Projeção da demanda de energia elétrica prar os próximos dez anos(2012−2021). Technical report, Governo Federal, 2011. Nota Técnica DEA16/11.