algoritmos gen eticos can^onico e elitista: uma … · mudan˘cas."(charles darwin) ... tais...

59
UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE CI ˆ ENCIAS EXATAS E DA TERRA PROGRAMA DE P ´ OS-GRADUAC ¸ ˜ AO EM MATEM ´ ATICA APLICADA E ESTAT ´ ISTICA PAULO DE SOUSA SOBRINHO Algoritmos Gen´ eticos Canˆ onico e Elitista: uma abordagem comparativa Natal/RN - 2014 1

Upload: vuongcong

Post on 02-Oct-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTECENTRO DE CIENCIAS EXATAS E DA TERRA

PROGRAMA DE POS-GRADUACAO EMMATEMATICA APLICADA E ESTATISTICA

PAULO DE SOUSA SOBRINHO

Algoritmos Geneticos

Canonico e Elitista:

uma abordagem comparativa

Natal/RN - 2014

1

Page 2: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

PAULO DE SOUSA SOBRINHO

Algoritmos Geneticos

Canonico e Elitista:

uma abordagem comparativa

Dissertacao apresentada ao Programada Pos-Graduacao em Matematica Aplicadae Estatıstica - PPGMAE, da UniversidadeFederal do Rio Grande do Norte, como requi-sito parcial para obtencao do tıtulo de Mestreem Matematica Aplicada e Estatıstica.

Orientador:

Prof. Dr. Andre Gustavo Campos Pereira.

Natal/RN - 2014

2

Page 3: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTECENTRO DE CIENCIAS EXATAS E DA TERRA

PROGRAMA DE POS-GRADUACAO EMMATEMATICA APLICADA E ESTATISTICA

PAULO DE SOUSA SOBRINHO

Algoritmos Geneticos

Canonico e Elitista:

uma abordagem comparativa

Comissao Examinadora:

Prof. Dr. Andre Gustavo Campos Pereira (PPGMAE/UFRN - Orientador)Profa. Dra. Dione Maria Valenca (PPGMAE/UFRN - Membro interno)

Prof. Dr. Edmilson Rodrigues Pinto (UFU - Membro externo)

Natal/RN - 2014

3

Page 4: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

Agradecimentos

Ao meu orientador professor Andre Gustavo Campos Pereira pela paciencia e estımulodepositados em minha pessoa. Ao companheiro e amigo professor Carlos Alexandre Gomespela ajuda inestimavel. A incansavel professora Dione Maria Valenca, amiga das horas maisdifıceis que passei no curso de mestrado. Aos queridos professores Nir Cohen, Debora Borges,Viviane Simioli Medeiros Campos, Rubens Leao de Andrade e Claudio Carlos Dias, pelo suporteque tiveram na minha formacao. Ao professor Juan Rojas Cruz, pelas primeiras licoes emAlgoritmos Geneticos. A nossa coordenadora do PPGMAE, professora Carla Vivacqua, peloempenho e serenidade com que se posiciona diante das questoes mais delicadas e urgentes.A Ingrid Katiucha, minha companheira de muitos anos e que teve ao meu lado sabores edissabores, encantos e desencantos, coragens e medos, mas que nunca deixou de dar animonos momentos mais tormentosos e dilacerantes. Ao meu querido professor Benedito TadeuVasconcelos Freire, a minha gratidao pela motivacao matematica explıcita em seu entusiasmoe alegria de ensinar e aprender. Ao professor Edmilson Rodrigues Pinto, membro externo dabanca examinadora, pelas valiosas sugestoes e correcoes apropriadas. Ao meu querido professordo curso de verao, Joao Maurıcio Araujo Mota, a minha gratidao eterna pela motivacao quepassa aos alunos e pela forma como ministra o conteudo, democratizando o conhecimento. Aoprofessor Francisco Gurgel de Freitas, alem do reconhecimento, a minha homenagem postuma.A todos aqueles que, direta ou indiretamente, contribuıram para que eu conseguisse esse tıtuloe a Deus por tudo.

4

Page 5: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

Dedicatoria

Dedico este trabalho a todos aquelesque acreditaram em mim, quando eu mesmoja nao mais acreditava.

5

Page 6: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

Resumo

Neste trabalho, comparamos os algoritmos geneticos canonico e elitista que sao metodos es-tocasticos de busca de otimos globais fundamentados na teoria da evolucao biologica e modela-dos por cadeias de Markov. Neste sentido, desenvolvemos exemplos ilustrativos e comparativos,avaliando atraves de simulacoes as suas propriedades. Veremos que, ao contrario do algoritmogenetico canonico, o algoritmo genetico elitista converge para o conjunto das populacoes quepossui o ponto de otimo como um de seus pontos. E por fim, sao feitas simulacoes computa-cionais contemplando os algoritmos expostos em Dorea [6], sempre fazendo uso do elitismo emisturando varios metodos, a saber, o Simulated Annealing e o uso do conceito de vizinhanca,de modo a comprovar a teoria aqui apresentada.

Palavras chaves: algoritmos geneticos, teoria da evolucao, cadeias de markov, otimosglobais, convergencia e simulacoes.

6

Page 7: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

Abstract

In this work, we compare the canonical and elitist genetic algorithms are stochastic searchmethods based on global optimum theory of biological evolution and modeled by Markov chains.Accordingly, we have developed illustrative and comparative examples, through simulationsevaluating its properties. We will see that, unlike the canonical genetic algorithm, elitist ge-netic algorithm converges to the set of the population that has the optimal point as one of itspoints. Finally, computer simulations are made considering the algorithms exposed in Dorea[6], always making use of elitism and mixing various methods, namely simulated annealing andthe use of the neighborhood concept, in order to prove the theory presented here.

Keywords: genetic algorithms, evolution theory, markov chains, optimal points, conver-gence and simulations.

7

Page 8: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

Sumario

1 Introducao 9

2 Cadeias de Markov 122.1 Cadeias de Markov Homogeneas . . . . . . . . . . . . . . . . . . . . . . . . . . . 122.2 Classificacao dos Estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142.3 Cadeias de Markov Ergodicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

3 Algoritmos Geneticos 193.1 O Algoritmo Genetico Canonico . . . . . . . . . . . . . . . . . . . . . . . . . . . 193.2 Modelagem dos Algoritmos Geneticos por Cadeia de Markov . . . . . . . . . . . 20

3.2.1 Inicializacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213.2.2 Populacao inicial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233.2.3 Selecao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243.2.4 Cruzamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263.2.5 Mutacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3.3 A Convergencia do Algoritmo Genetico Canonico . . . . . . . . . . . . . . . . . 293.4 Algoritmo Genetico Elitista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.4.1 Elitismo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303.4.2 A Convergencia do Algoritmo Genetico Elitista . . . . . . . . . . . . . . 33

4 Simulacoes 374.1 Simulacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384.2 Graficos das Simulacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

4.2.1 Simulacoes de f1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414.2.2 Simulacoes de f2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 444.2.3 Simulacoes de f3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 474.2.4 Simulacoes de f4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504.2.5 Simulacoes de f5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

5 Conclusoes 56

8

Page 9: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

Capıtulo 1

Introducao

“Nao e o mais forte que sobrevive, nem o mais inteligente, mas o que melhor se adapta asmudancas.”(Charles Darwin)

Ate meados do seculo XIX, os mais brilhantes cientistas acreditavam que cada especie haviasido criada por um ser supremo ou atraves de geracao espontanea, onde a vida surge de essenciaspresentes no ar. O trabalho do biologo Karl Von Linnee [19] sobre a classificacao biologica deorganismos mostrou semelhancas entre certas especies, levando a acreditar na existencia de al-guma relacao entre elas. Outros trabalhos influenciaram os naturalistas em direcao a teoria daselecao natural, tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracterısticasque os animais adquirem durante a vida, podem ser transmitidas pelos mecanismos da heredi-tariedade, a chamada “LEI DO USO E DO DESUSO”, alem de Thomas Robert Malthus [21]que, no seu livro “ENSAIO SOBRE A POPULACAO”, propos que fatores ambientais tais comodoencas e carencia de alimentos, limitavam o crescimento de uma populacao. E famoso seuargumento classico de que a populacao cresce em progressao geometrica enquanto a producaode alimentos cresce em progressao aritmetica.

Em 1859, Charles Darwin, em sua obra “ORIGEM DAS ESPECIES”, fala sobre uma“SELECAO NATURAL”em que, o meio ambiente seleciona os seres mais aptos para o CRUZA-MENTO (troca de material genetico) e os menos adaptados sao eliminados ou reduzidos a umaminoria. Desse modo, somente as diferencas que facilitam a sobrevivencia serao transmitidasas geracoes seguintes. Ha tambem, neste processo evolutivo, a MUTACAO, em que, a naturezasimplesmente muda o material genetico dos seres que, por sua vez, se estiverem mais adapta-dos apos este processo, terao grandes chances de serem aproveitados em uma futura SELECAO.

Por volta de 1900, o trabalho de Gregor Mendel [22], desenvolvido em 1865, sobre osprincıpios basicos de heranca genetica, foi redescoberto pelos cientistas e teve grande influenciasobre os futuros trabalhos relacionados a evolucao. A moderna teoria da evolucao (neodarwin-ismo) combina a genetica e as ideias de Darwin sobre a selecao natural, criando o princıpiobasico da Genetica Populacional: a variabilidade entre indivıduos em uma populacao de or-ganismos que se reproduzem sexuadamente e produzida pela mutacao e pela recombinacaogenetica. A mais importante contribuicao individual da Genetica, extraıda dos trabalhos deMendel, e a substituicao do conceito de heranca por meio da mistura de sangue pelo conceitode heranca por meio de partıculas chamadas genes. O gene, que e a unidade fundamentalda hereditariedade, e formado por uma sequencia de DNA (acido desoxirribonucleico) e RNA

9

Page 10: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

(acido ribonucleico), sendo este ultimo o responsavel pela sıntese de proteınas. Em Linder [18],pode ser visto que a estrutura do DNA foi descoberta por James Watson e Francis Crick, em1953.

A primeira tentativa de representacao, atraves de um modelo matematico da teoria de Dar-win, surgiu com o livro “THE GENETIC THEORY OF NATURAL SELECTION”, escrito pelobiologo evolucionista R. A. Fisher [9] . Segundo Fisher, a evolucao e uma aprendizagem, umaforma de adaptacao, diferindo apenas na escala do tempo. Em vez de ser um processo de umavida, e o processo de muitas geracoes [11]. Podemos ver em [11] que as primeiras simulacoescomputacionais de sistemas geneticos foram desenvolvidas por biologos (Barricelli, 1957; Fraser,1960,; Martin e Cockerhan, 1960). Nestes estudos os genes eram codificados atraves de umasequencia de 0’s e 1’s, o que originou a codificacao binaria de indivıduos.

O Algoritmo Genetico foi fundamentado inicialmente pelo americano John Henry Holland[12], no livro “ADAPTATION IN NATURAL AND ARTIFICIAL SYSTEMS”, publicado em1975 e considerado a Bıblia dos Algoritmos Geneticos. Segundo as palavras do proprio Holland:“algoritmos geneticos sao modelos computacionais que imitam os mecanismos da evolucao natu-ral para resolver problemas de otimizacao.”Desde entao, estes algoritmos vem sendo aplicadoscom sucesso nos mais diversos problemas de otimizacao.

Em 1989, e publicado o livro de David E. Goldberg [11], denominado “GENETIC ALGO-RITHMS IN SEARCH, OPTIMIZATION AND MACHINE LEARNING”, considerado tambemum marco na literatura dos algoritmos geneticos. Segundo [11], a primeira aplicacao de algorit-mos geneticos a um problema puro de otimizacao matematica foi desenvolvida por Hollstien em1971. O problema consistia na otimizacao de funcoes de duas variaveis f(x, y), com o objetivode realizar o controle com realimentacao de uma planta ou modelo de engenharia. Este algo-ritmo genetico usava operadores geneticos como cruzamento, mutacao e esquemas de criacaobaseados na pratica tradicional de criacao de animais e horticultura.

Estes algoritmos atualizam repetidamente uma populacao de candidatos as solucoes otimas,onde cada indivıduo possui representacao binaria. Nos algoritmos geneticos, a populacao ini-cial contem um numero definido de indivıduos (tamanho da populacao) que, serao submetidosaos processos de SELECAO, de CRUZAMENTO e de MUTACAO, respectivamente. SegundoSuzuki [28], embora varias operacoes geneticas possam ser aplicadas nesses algoritmos, todoseles tem em comum as seguintes propriedades: objetivam encontrar pontos que maximizemuma dada funcao e suas populacoes sao estados de uma cadeia de Markov finita.

Varios resultados que avaliam a performance dos algoritmos geneticos expressos por cadeiasde Markov tem sido conhecidos desde 1990. Ha um trabalho de Freidlin - Wentzell [8] que analisaos algoritmos geneticos usando o Princıpio dos Grandes Desvios (Large Deviation Principle),cuja ideia basica foi dada por R. Cerf [3]. Olivier Francois [10] considerou um algoritmo quegera aleatoriamente uma populacao finita e, aleatoriamente, muda materiais geneticos em cadaindivıduo desta populacao e faz a probabilidade de mutacao decrescer a medida que as mudancasocorrem.

A experiencia mostra que os algoritmos geneticos, algumas vezes, encontram boas solucoespara problemas de complexidade avancada, embora existam poucos resultados teoricos rela-

10

Page 11: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

cionados a convergencia deles [1]. Os primeiros resultados bem fundamentados sobre a con-vergencia dos algoritmos geneticos foram obtidos por Cerf [4] que construiu uma teoria assintoticapara o algoritmo genetico canonico.

Segundo Rudolf [27], na teoria da otimizacao, um algoritmo e dito convergente para ummaximo global, se ele gera uma sequencia de solucoes ou uma sequencia de valores numericoscujo o limite e o maximo global. Baseado nesta definicao, Rudolf mostra que o algoritmogenetico canonico nao converge para o conjunto de populacoes que tem o ponto de otimo comoum dos seus pontos, ou seja, de modo geral, a convergencia de um algoritmo genetico para umotimo global nao e garantida. No mesmo artigo, Rudolph propoe o algoritmo genetico elitistaque converge para uma populacao que tera o ponto de otimo como um de seus elementos.

Muitos trabalhos foram escritos propondo modificacoes em cada etapa do algoritmo genetico,como em Suzuki [28], Francois [10] e Dorea [6]. Outros trabalhos mais ousados propuseram queos parametros variem com o tempo, como em Campos, Rojas Cruz, Pereira [24]. O presentetrabalho e baseado no artigo de Dorea [6], onde sao propostas duas novas versoes do algoritmogenetico, a saber: uma, onde a maneira de fazer o cruzamento foi modificada e nao haveriaa etapa de mutacao e outra, onde nao haveria cruzamento e foi criado um superindivıduo naetapa da mutacao. A contribuicao do presente trabalho e compreender os fundamentos dos al-goritmos expostos em Dorea [6] com exemplos distintos e atraves de simulacoes computacionaiscomparar os resultados e avaliar as propriedades.

Este trabalho e dividido em capıtulos, a saber:

No Capıtulo 2, relembramos algumas definicoes e resultados sobre cadeias de Markovhomogeneas que serao usados nos capıtulos seguintes, para mostrar a convergencia dos algorit-mos geneticos utilizados no trabalho de Dorea [6]. No Capıtulo 3, relembramos a modelagemdo algoritmo genetico por cadeias de Markov apresentadas em Rudolph [27] e fazemos a mode-lagem dos algoritmos geneticos apresentados em Dorea [6]. No Capıtulo 4, faremos simulacoescomputacionais onde os algoritmos apresentados em Dorea [6], serao comparados com os algo-ritmos geneticos tradicionais, com fim ilustrativo, uma vez que, a teoria de acoplamento quepoderia ser usada para medir a velocidade da convergencia, nao pode ser estudada, a fim dedar uma resposta mais teorica as simulacoes. No Capıtulo 5, apresentamos as consideracoesfinais e as conclusoes que tiramos deste estudo.

11

Page 12: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

Capıtulo 2

Cadeias de Markov

“Uma ideia nao precisa ser complexa para ser verdadeira.”(Montaigne).

Neste capıtulo e feita uma revisao das definicoes e teoremas relativos as cadeias de Markovhomogeneas, em particular, dos teoremas que tratam da convergencia de tais cadeias. Estarevisao sera fundamental quando formos tratar da convergencia dos Algoritmos Geneticos noproximo capıtulo. Aos leitores que, porventura, se interessarem por estes topicos sugerimos asseguintes referencias: Isaacson and Madson [14] e Resnick [25].

2.1 Cadeias de Markov Homogeneas

Comecamos essa secao relembrando algumas definicoes importantes.

Definicao 2.1.1 Um processo estocastico e uma famılia Xtt∈T de variaveis aleatorias definidassobre um mesmo espaco de probabilidade (Ω,F , P ) e tomando valores em (Rn,B (Rn)), onde Te o conjunto de ındices do processo, t e o tempo e B (Rn) e um boreliano. Se T for enumeravel,o processo e chamado a tempo discreto, caso contrario, a tempo contınuo.

Definicao 2.1.2 O conjunto S dos valores assumidos por um processo estocastico e chamadoespaco de estados. Se o espaco de estados de um processo estocastico for enumeravel, oprocesso sera chamado de cadeia.

Definicao 2.1.3 Uma cadeia Xtt∈N, com espaco de estados S satisfaz a propriedade deMarkov, se para todo n ∈ N e para todos os estados i1, i2, · · · , in ∈ S for verdade que:

P (Xn = in|Xn−1 = in−1, Xn−2 = in−2, · · · , X1 = i1) = P (Xn = in|Xn−1 = in−1)

A equacao anterior sugere que o estado presente, dado todo o passado do processo, dependeapenas do estado anterior. Nos referimos a (Xn = j), dizendo que a cadeia no tempo n esta noestado j.

12

Page 13: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

Definicao 2.1.4 Uma cadeia Xtt∈N que satisfaz a propriedade de Markov e chamada decadeia de Markov.

Chamamos P (Xn = j|Xn−1 = i) de probabilidade de transicao de um passo da cadeia deMarkov, que pode depender ou nao do tempo n. A fim de nomearmos essa dependencia defin-imos:

Definicao 2.1.5 Uma Cadeia de Markov a tempo discreto e chamada de homogenea, se aprobabilidade de transicao de um estado para outro independe do tempo em que o passo e dado,ou seja, para os estados i e j, teremos:

P (Xn = j|Xn−1 = i) = P (Xn+k = j|Xn+k−1 = i)

para k = −(n − 1),−(n − 2), · · · ,−1, 0, 1, 2, · · ·.Caso a probabilidade de transicao dependa dotempo em que o passo e dado, dizemos que a cadeia de Markov e nao homogenea.

Definicao 2.1.6 Seja Xtt∈N, uma cadeia de Markov homogenea, com espaco de estadosfinito, S = 1, 2, · · · , N. Para esta cadeia existem N2 probabilidades de transicao, ondepij = P (Xn+1 = j|Xn = i) e a probabilidade de que a cadeia saia do estado i para o estadoj, em apenas um passo, com i = 1, 2, · · · , N e j = 1, 2, · · · , N . O modo mais conveniente deorganizar estas informacoes e na forma de uma matriz P , que e chamada matriz de transicaoda Cadeia de Markov.

P =

p11 · · · p1N...

. . ....

pN1 · · · pNN

Define-se ainda p

(0)ij =

1, se i = j0, se i 6= j

, onde p(0)ij e a probabilidade de sair do estado i para o

estado j no tempo 0.

A matriz de transicao P goza das seguintes propriedades:

• Todos os seus elementos pij sao numeros reais nao negativos, ou seja, 0 ≤ pij ≤ 1 paratodo i, j ∈ 1, 2, · · · , N.

• A soma dos elementos em cada linha da matriz e igual a 1, ou seja,N∑j=1

pij = 1 para todo

i, j ∈ 1, 2, · · · , N.

Definicao 2.1.7 Uma matriz quadrada e dita estocastica quando todos os seus elementos saonumeros reais nao negativos e a soma dos elementos de cada linha e igual a 1

De acordo com a definicao anterior, segue que a matriz de transicao P de uma cadeia deMarkov e uma matriz estocastica.

Definicao 2.1.8 A probabilidade de transicao em m passos de uma cadeia de Markov e dadapor

p(m)ij = P (Xn+m = j|Xn = i) , com i, j ∈ S

em que p(m)ij e a probabilidade de que a cadeia visite o estado j, apos m transicoes (passos),

dado que no instante n, encontrava-se no estado i.

13

Page 14: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

Definicao 2.1.9 Um vetor π(0) =(π

(0)1 , π

(0)2 , · · · , π(0)

N

), e chamado vetor inicial se,

π(0)i ≥ 0 e

N∑i=1

π(0)i = 1 , (1 ≤ i ≤ N)

Este vetor tambem e chamado de distribuicao inicial da cadeia e denotaremos por:

π(0)i = P (X0 = i)

Este vetor nos diz como o processo comeca e e usado para calcular qualquer probabilidade sobreas variaveis do processo da seguinte forma: P (Xn = j) =

(π(0).P n

)j, onde P n e o produto de

P , n vezes e ( )j significa a j−esima coordenada do vetor π(0).P n.

Uma propriedade muito util e bastante utilizada e a equacao de Chapman-Komolgorov

Teorema 1 (Chapman-Komolgorov) Se P e a matriz de transicao de uma cadeia de Markovcom espaco de estados S, entao para todos inteiros nao negativos m e n e i, j ∈ S vale

p(n+m)ij =

∑k∈S

p(n)ik .p

(m)kj , com i, j ∈ S.

Desse modo, as probabilidades p(n+m)ij podem ser calculadas atraves do produto das matrizes

de transicao em n e m etapas, respectivamente, isto e, P n+m = P n.Pm.

2.2 Classificacao dos Estados

Agora que sabemos o que significa uma cadeia de Markov homogenea, enunciamos os conceitose resultados necessarios para entender as hipoteses que a cadeia precisa satisfazer a fim deconvergir (este conceito e abordado na proxima secao e e o objetivo deste capıtulo).

Definicao 2.2.1 Um subconjunto C do espaco de estados S e fechado se pik = 0, para todoi ∈ C e k /∈ C. Se um conjunto fechado e composto de apenas um estado, este estado e chamadoabsorvente.

Teorema 2 Se C e fechado com i ∈ C e k /∈ C, entao p(n)ik = 0, para todo n ∈ N.

Este teorema diz que se a cadeia entra num conjunto fechado, ela nao sai mais.

Definicao 2.2.2 Dizemos que o estado j e acessıvel a partir de i e denotamos por i → j , sep

(n)ij > 0 para algum n ∈ N.

Esta definicao diz que existe uma probabilidade positiva da cadeia sair de i e chegar em jem um numero finito de passos.

Definicao 2.2.3 Dois estados i e j se comunicam se para algum n ≥ 0, p(n)ij > 0 e, para algum

m ≥ 0, p(m)ji > 0. A notacao para i e j se comunicarem entre si e i↔ j.

14

Page 15: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

Definicao 2.2.4 Uma cadeia de Markov e irredutıvel se, e somente se, todos os pares deestados i e j se comunicam.

Outro conceito muito importante e o de perıodo de um estado, que definimos agora.

Definicao 2.2.5 O perıodo de um estado i em uma cadeia de Markov e definido por

d(i) = mdcn : P

(n)ii > 0

onde o mdc e o maximo divisor comum. Se d(i) = 1, dizemos que i e um estado aperiodico.

Definicao 2.2.6 Um cadeia de Markov e aperiodica se todos os seus estados forem aperiodicos.

O proximo teorema nos garante que estados que se comunicam possuem o mesmo perıodo.

Teorema 3 Se os estados i e j se comunicam, entao d(i) = d(j). Em particular, se a cadeiafor irredutıvel, todos os seus estados possuem o mesmo perıodo.

Agora precisamos desenvolver ferramentas que nos garantam a existencia do limite, limn→∞ p(n)ij .

Para isso nos concentramos novamente nos estados i, j ∈ S. Classificando tais estados comorecorrentes ou transientes, e para tal definicao precisamos do seguinte conceito:

Definicao 2.2.7 O tempo da primeira visita da cadeia ao estado j, e dado por:

τj = inf n > 0;Xn = j

Definicao 2.2.8 O numero de visitas da cadeia ao estado j e dado por:

N(j) =∞∑n=1

Ij(Xn), onde Ij(Xn) =

1, se Xn = j0, caso contrario.

Definicao 2.2.9 Para quaisquer i, j ∈ S,a probabilidade da cadeia sair do estado i e fazer aprimeira visita ao estado j no tempo n, e dada por:

f(n)ij = P (Xn = j,Xn−1 6= j, · · · , X1 6= j|X0 = i)

Se i = j, f(n)ii representa a probabilidade de que o primeiro retorno ao estado i ocorra no

tempo n . Por definicao, f(0)ij = 0 e f

(0)ii = 1.

Definicao 2.2.10 Para quaisquer i, j ∈ S, f ∗ij =∑∞

n=1 f(n)ij representa a probabilidade de,

saindo do estado i, chegar ao estado j. Se i = j, f ∗ii =∑∞

n=1 f(n)ii denota a probabilidade de

retorno ao estado i.Com isso definimos,

15

Page 16: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

Definicao 2.2.11 Dizemos que um estado i e:

• recorrente, se f ∗ii = 1.

• transiente, se f ∗ii < 1.

Definicao 2.2.12 Se j for um estado recorrente, isto e, f ∗jj = 1, define-se o tempo esperadode retorno ao estado j como

µj =∞∑n=1

nf(n)jj

.

Teorema 4 Se o estado i e recorrente e i↔ j, entao o estado j e recorrente.

Teorema 5 Em uma cadeia de Markov com espaco de estados finito, pelo menos um estado erecorrente.

Da definicao 2.2.4 e dos teoremas 4 e 5, concluimos que:

Corolario 1 Uma cadeia de Markov irredutıvel com espaco S de estados finito, e sempre recor-rente, isto e, todos os seus estados sao recorrentes.

Precisamos ainda de uma subclassificacao quando tratamos dos estados recorrentes, a saber:

Definicao 2.2.13 Seja j um estado recorrente:

i)Quando µj <∞, dizemos que j e recorrente positivo

ii)Quando µj =∞, dizemos que j e recorrente nulo.

O que o item (ii) da definicao diz e que mesmo voltando com probabilidade 1, o tempo mediode retorno pode ser infinito.

Teorema 6 Seja P = (pij) a matriz de transicao de uma cadeia de Markov recorrente, irre-dutıvel e aperiodica, entao

limn→∞

p(n)ij =

1µj, se µj <∞

0, se µj =∞

Teorema 7 Toda cadeia de Markov com espaco de estados finito, aperiodica e irredutıvel erecorrente positiva.

Corolario 2 Toda cadeia de Markov homogenea irredutıvel, aperiodica com espaco de estadosfinito e convergente.

Pelo teorema 7, podemos concluir que a cadeia e irredutıvel, aperiodica e recorrente positiva,

logo pelo teorema 6, limn→∞

p(n)ij =

1

µj, portanto a cadeia converge.

16

Page 17: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

2.3 Cadeias de Markov Ergodicas

Finalizamos este capıtulo com um resumo dos resultados sobre cadeias de Markov, que iremosutilizar para garantir a convergencia do Algoritmo Genetico do proximo capıtulo

Definicao 2.3.1 Seja P uma matriz de transicao de uma cadeia de Markov. Se, para todoj ∈ S, tivermos a existencia de lim

n→∞p

(n)ij = πj independente de i ∈ S e

∑j∈S πj = 1, entao a

cadeia e chamada ergodica ou dizemos que a cadeia converge.

Definicao 2.3.2 Uma distribuicao πj, j ∈ S e chamada de estacionaria para a cadeia deMarkov com matriz de transicao P , se πj =

∑k∈S πkpkj , para todo j ∈ S.

Usando a notacao matricial temos que π = πP = πP 2 = πP 3, · · ·, ou seja, π = πP n, para todon ∈ N.

Teorema 8 Uma cadeia de Markov irredutıvel, aperiodica e recorrente positiva possui umaunica distribuicao estacionaria π, onde os πj satisfazem as seguintes condicoes:

πj > 0,∑j∈S

πj = 1 e πj =∑i∈S

πipij, para todo j ∈ S

,

Corolario 3 Se Xnn∈N e uma cadeia de Markov ergodica com espaco de estados finito Sentao

limn→∞

P (Xn = j) = πj

onde π = (π1, π2, · · · , πN) e a sua distribuicao estacionaria.

Demonstracao:

P (Xn = j) =∑i∈S

P (Xn = j,X0 = i) =∑i∈S

P (Xn = j|X0 = i) .P (X0 = i) =∑i∈S

p(n)ij π

(0)i

Usando o fato de que limn→∞

p(n)ij = πj e que o espaco de estados S e finito, segue que

limn→∞

P (Xn = j) = limn→∞

∑i∈S

p(n)ij π

(0)i =

∑i∈S

limn→∞

p(n)ij π

(0)i = πj

∑i∈S

π(0)i = πj.1 = πj

Para finalizar este capıtulo, enunciamos mais uma definicao e dois resultados relevantes.

Definicao 2.3.3 Uma matriz A e positiva quando todos os seus elementos sao positivos.

Lema 1 Sejam C,M e S matrizes estocasticas com M positiva. Entao a matriz produto P =SCM e positiva.

Demonstracao:

Como S e C sao estocasticas, a matriz SC tambem e estocastica, logo existe pelo menosuma entrada positiva em cada linha de A = SC. O fato de M ser positiva faz com queP = AM = SCM seja positiva, ja que pij =

∑Nk=1 aikmkj > 0, para todo i, j ∈ 1, 2, , N .

Concluımos assim que SCM e positiva.

17

Page 18: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

Teorema 9 A cadeia de Markov, num espaco de estados finito, representada por P = SCM ,com S e C matrizes estocasticas e M positiva e convergente.

Demonstracao:

Como a matriz P e positiva, pelo lema 1, para quaisquer i, j do espaco de estados, teremospij > 0 e pji > 0, logo a cadeia e irredutıvel, ja que todos os estados se comunicam entre si.Como todos os estados se comunicam entre si, pelo teorema 3, eles possuem o mesmo perıodo.Como pii > 0, para todo i, vem que o perıodo da cadeia e 1, logo a cadeia e aperiodica. Como oespaco de estados e finito, segue-se que a cadeia e finita, irredutıvel e aperiodica e, pelo corolario2, concluımos que e convergente.

18

Page 19: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

Capıtulo 3

Algoritmos Geneticos

“Algoritmos geneticos sao modelos computacionais que imitam os mecanismos da evolucaonatural para resolver problemas de otimizacao.”

(John Henry Holland)

3.1 O Algoritmo Genetico Canonico

Os algoritmos geneticos sao metodos estocasticos de busca de otimos globais e que realizam talbusca atraves da evolucao de uma populacao de indivıduos, onde cada indivıduo representa umapossıvel solucao do problema. O princıpio de funcionamento do algoritmo genetico e baseadona Teoria da Evolucao de Darwin, como ja foi mencionado na introducao. Os problemas deotimizacao geralmente levam a um subproblema do tipo

max f(t); t ∈ Ω

onde Ω ⊂ RN e o domınio da funcao f , a qual e positiva e limitada superiormente.

Neste capıtulo, apresentamos o algoritmo genetico que foi desenvolvido a fim de resolvertais problemas. Para facilitar a exposicao suponha que Ω = [a1, b1]× [a2, b2]× · · · × [aN , bN ].O domınio Ω sera discretizado em uma malha de pontos que sera o nosso espaco de busca desolucoes otimas. A quantidade de pontos depende da precisao desejada e cada ponto destamalha (cromossomo), sera um candidato em potencial a ponto de otimo. A aptidao de cadaponto depende da sua imagem pela funcao f , isto e, um ponto e tanto mais apto quanto maiorfor a sua imagem pela funcao f .

A discretizacao do domınio se da da seguinte maneira: divide-se cada intervalo [ai, bi] emuma quantidade de pontos que seja potencia de 2, ou seja, 2, 4, 8, 16, · · · 2`. Em seguida, escolhe-se aleatoriamente uma quantidade finita de pontos da malha, chamada de populacao inicial.Aplica-se entao na populacao, os operadores de selecao, cruzamento e mutacao, obtendo umanova populacao, a qual passara novamente por essas etapas ate que algum criterio de paradaseja atingido. Na pratica, geralmente, o criterio de parada e o numero iteracoes. Espera-se quea populacao no tempo n + 1 seja melhor do que a populacao no tempo n, isto e, que os seuspontos possuam imagens maiores pela funcao objetivo f : Ω→ R.

19

Page 20: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

O algoritmo genetico canonico pode ser resumido assim:

Escolha na malha uma populac~ao inicial.

Determine a imagem de cada indivıduo pela func~ao objetivo.

Repita.

Realize a selec~ao na populac~ao.

Realize o cruzamento na populac~ao obtida na selec~ao.

Realize a mutac~ao na populac~ao obtida no cruzamento.

Ate que algum criterio de parada seja atingido.

3.2 Modelagem dos Algoritmos Geneticos por Cadeia de

Markov

Nesta secao, mostramos como o algoritmo genetico e naturalmente modelado por cadeiasde Markov, e estudamos a convergencia de tal cadeia. Mostramos tambem que a convergenciada cadeia nao se da quase certamente para o conjunto formado pelas populacoes que possui oponto de otimo como um dos seus pontos.

Note que, basicamente, o algoritmo entra com uma populacao inicial, a qual sofre a atuacaodos operadores de selecao, cruzamento e mutacao, obtendo desta forma uma nova populacao,e este processo se repete. Observe entao que a proxima populacao so depende da populacaoatual (que sofrera a acao dos operadores geneticos). Desta forma, se conseguirmos modelar oproblema de modo que os estados sejam as possıveis populacoes, temos uma situacao em que aforma com que a mudanca de estados ocorre so depende do estado anterior, o que faz com queas cadeias de Markov, pela definicao (2.1.1), sejam um modelo apropriado para os algoritmosgeneticos. Os primeiros a estudarem a modelagem dos algoritmos geneticos como cadeias deMarkov foram Eiben et al. [7] , Nix et al. [23] e Rudolph [27].

Note tambem que o resultado de cada etapa do algoritmo genetico depende apenas da popu-lacao presente antes da aplicacao do operador. Logo, cada etapa tambem pode ser vista comouma cadeia de Markov, sendo desta forma, cada etapa descrita por sua matriz de transicao,a saber, S,C e M para selecao, cruzamento e mutacao. Dorea et al [6] chamam a cadeia quemodela o algoritmo genetico de Cadeia de Markov Multiestagio, e Rudolph [27] mostra que amatriz de transicao de tal cadeia e P = SCM . Depois que o algoritmo genetico se transformaem uma cadeia de Markov, nosso objetivo e mostrar que tal cadeia converge para o conjuntodas populacoes que tem um de seus pontos como sendo o ponto de otimo procurado.

Nas proximas secoes, explicamos, com a ajuda de um exemplo, cada etapa do algoritmogenetico. Com esta explanacao, esperamos que fique claro como foram desenvolvidos os algo-ritmos utilizados nas simulacoes apresentadas no Capıtulo 4.

20

Page 21: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

3.2.1 Inicializacao

Dissemos, no inıcio desse capıtulo, que a primeira etapa na inicializacao do algoritmo geneticopara encontrar o ponto de otimo de uma funcao f : Ω = [a1, b1]× · · · × [aN , bN ]→ R e cons-truir uma malha que tenha uma quantidade finita de pontos que seja uma potencia de 2. Paracumprirmos cada etapa de forma mais concreta, consideramos f : [−4.5, 4.5]×[−4.5, 4.5]→ R+,dada por f(x, y) = xy−x2− y2− 2x− 2y+ 64, cuja representacao grafica e exibida na figura 1.

Figura 1: grafico de f.

Se quisermos uma malha de 2N` = 28 = 256 pontos, basta dividirmos cada intervalo doproduto cartesiano em 24 = 16 pontos e assim cada intervalo [−4.5, 4.5] fica particionado emsubintervalos de comprimentos iguais, a saber:

xsup − xinf

24 − 1eysup − yinf

24 − 1, respectivamente.

Essa quantidade de pontos da malha e importante, pois nos da uma enumeracao dos seus pontose uma representacao binaria, que sera util na etapa do cruzamento. Cada ponto desta malha,em particular, sera formado por vetores de dimensao 8, cujas entradas sao 0 ou 1. Assim, oconjunto de todos os pontos presentes na malha e:

S = (v1, v2, · · · , v8) ; vi ∈ 0, 1

Mostremos como converter esses vetores binarios nos respectivos pontos com coordenadas reais.Para isso, perceba que o vetor binario (a`−1, · · · a1, a0, b`−1, · · · , b1, b0) representara um par or-denado (x, y) onde

x =`−1∑i=0

ai2i e y =

`−1∑i=0

bi2i.

De posse do par ordenado (x, y) podemos obter o par ordenado (x, y) ∈ [−4.5, 4.5] ×[−4.5, 4.5] atraves das seguinte formulas:

x = xmin + x.

(xsup − xinf

24 − 1

)e y = ymin + y.

(ysup − yinf

24 − 1

),

21

Page 22: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

onde xinf , xsup, yinf e ysup sao os limites inferior e superior do intervalo de variacao da primeirae segundas variaveis respectivamente.

Para ilustrar esse processo, tomamos como exemplo, o ponto x1 → 10101111. Vejamos:

x = 1.23 + 0.22 + 1.21 + 0.20 = 10

y = 1.23 + 1.22 + 1.21 + 1.20 = 15

portanto os valores reais de x, y ∈ [−4.5, 4.5] sao

x = −4, 5 + 10× 0.6 = 1.5

y = −4, 5 + 15× 0.6 = 4.5

ou seja, o ponto no R2 e (1.5, 4.5).

Repetindo esse processo para todos os pontos da malha, a enumeracao fica:

−4.5↔ 0000−3.9↔ 0001−3.3↔ 0010

...3.9↔ 11104.5↔ 1111

A malha e exibida na figura 2.

Figura 2: representacao da malha.

22

Page 23: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

Note que, pela figura 2, o ponto de coordenadas (−1.5, 1.5) e representado por 01011010,uma vez que −1.5 corresponde a 0101 e 1.5 corresponde a 1010.

No caso geral, quando temos mais de duas dimensoes temos f : Ω → R+, onde Ω =[a1, b1] × [a2, b2] × · · · × [aN , bN ] e, dada a precisao desejada, cada uma dos intervalos [ai, bi],com i = 1, 2, 3, · · · , N sao particionados em 2` − 1 partes iguais. Com isso, e produzida umamalha com 2N` pontos.

3.2.2 Populacao inicial

O proximo passo e escolher uma populacao inicial composta de pontos da malha, ou seja,escolhemos aleatoriamente uma quantidade k de pontos da malha com reposicao. O conjuntoformado por todas as populacoes possıveis sera o espaco de estados da cadeia de Markov querepresenta o algoritmo genetico. A populacao inicial, cujo tamanho e k, nao deve ser excessiva-mente pequena, pois a convergencia se torna demorada e nem demasiadamente grande, ja quetorna o algoritmo pesado computacionalmente.

No caso geral, cada ponto da malha sera formado por vetores N` dimensional. Cada entradadesses vetores e 0 ou 1, ou seja, um vetor em representacao binaria

S = (v1, v2, · · · , vN`) ; vi ∈ 0, 1 .

Considerando uma populacao inicial S1 = (z1, z2, · · · , zk) ; zi ∈ S e que todas as demaispopulacoes tambem terao k indivıduos, segue que o conjunto S1 e o espaco de estados da cadeiade Markov.

Para o nosso exemplo consideramos uma populacao inicial com 6 elementos:

(10101111, 01011010, 10000001, 10100110, 00111111, 01001001) .

O conjunto de todas as populacoes possıveis sera entao:

S1 = (z1, z2, · · · , z6) ; zi ∈ S .

Como sabemos, os pontos da populacao sao vetores em forma binaria e necessitamos agoracalcular o valor na funcao nesses pontos. Portanto, o valor da funcao objetivo f(x, y) =xy − x2 − y2 − 2x − 2y + 64 em z1 → 10101111, cujo ponto correspondente no R2 e (1.5, 4.5)sera f (1.5, 4.5) = 36.25.Repetindo esse mesmo processo para os demais pontos, podemos resumir os resultados obtidos

23

Page 24: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

na tabela 1.

Indivıduo (x, y) f(x, y)(v1, · · · , v8)

z1 10101111 (1.5, 4.5) 36.25z2 01011010 (−1.5, 1.5) 57.25z3 10000001 (0.3,−3.9) 54.73z4 10100110 (1.5,−0, 9) 58.39z5 00111111 (−2.7, 4.5) 20.71z6 01001001 (−2.1, 0.9) 59.29

Tabela 1: pontos e imagens.

A etapa seguinte do algoritmo consiste em aplicar o operador selecao a populacao inicial.

3.2.3 Selecao

O operador genetico Selecao faz com que os elementos mais aptos da populacao sejam preser-vados, enquanto os menos aptos sejam substituıdos por copias dos mais aptos. A maioriados metodos de selecao sao formulados exatamente para que estes indivıduos tenham maioresprobabilidades de serem escolhidos, com o objetivo de que boas caracterısticas destes passema predominar nas novas populacoes. Um metodo de selecao muito utilizado e o metodo daroleta viciada, sugerido por Holland [12], onde os indivıduos de uma populacao sao escolhidospara fazer parte da nova populacao atraves de um sorteio. Cada indivıduo zi desta populacaocom 6 elementos, tem uma probabilidade de ser selecionado proporcional ao valor de sua imagempela funcao f , isto e, Ps(zi) = f(zi)/

∑6j=1 f(zj).

Depois de calculado o valor da funcao em cada ponto, precisamos calcular a probabilidadede cada ponto ser selecionado conforme a tabela da figura 4:

Indivıduo (x, y) f(x, y) f(zi)∑6j=1 f(zj)

(v1, · · · , v8)

z1 10101111 (1.5, 4.5) 36.25 0.126z2 01011010 (−1.5, 1.5) 57.25 0.199z3 10000001 (0.3,−3.9) 54.73 0.190z4 10100110 (1.5,−0, 9) 58.39 0.203z5 00111111 (−2.7, 4.5) 20.71 0.072z6 01001001 (−2.1, 0.9) 59.29 0.210

Tabela 2: pontos e probabilidades.

Consideramos agora um grafico de setores dividido em 6 setores, onde a area de cada setore proporcional ao valor da funcao f em cada ponto da populacao, conforme ilustra a figura 3.

24

Page 25: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

Figura 3: grafico de setores.

Dessa forma, os pontos correspondentes aos maiores valores da funcao apresentarao maioresprobabilidades de serem selecionados para compor a nova populacao. Distribuamos estas quan-tidades no intervalo [0, 1], coloquemos primeiro a quantidade referente a z1, ou seja, 0.126.Depois acrescentemos a quantidade referente a z2, que e 0.199. Portanto a faixa determinadapor z2 vai de 0.126 a 0.325 e assim cada quantidade e distribuıda obtendo a figura 4.

Figura 4: ilustracao do grafico de setores na reta.

A selecao dos pontos para a proxima populacao se da da seguinte maneira: e gerada umaquantidade de numeros aleatorios, no intervalo [0, 1], igual ao tamanho da populacao, cujaimplementacao e mostrada a seguir.

Suponhamos que sejam gerados os numeros aleatorios a1 = 0.26, a2 = 0.10, a3 = 0.94, a4 =0.31, a5 = 0.44 e a6 = 0.89 no intervalo (0, 1):

a1 = 0.26, como 0.126 < a1 < 0.325 devemos selecionar z2, para a 1a coordenada da populacao.a2 = 0.10, como 0.0 < a2 < 0.126 devemos selecionar z1 para a 2a coordenada da populacao.a3 = 0.94, como 0.79 < a1 < 1.0 devemos selecionar z6 para a 3a coordenada da populacao.a4 = 0.31, como 0.126 < a4 < 0.325 devemos selecionar z2 para a 4a coordenada da populacao.a5 = 0.44, como 0.325 < a5 < 0.515 devemos selecionar z3 para a 5a coordenada da populacao.a6 = 0.89, como 0.79 < a6 < 1.0 devemos selecionar z6 para a 6a coordenada da populacao.

Apos esta etapa, os cromossomos da nova populacao sao:

z′1 = 01011010

z′2 = 10101111

z′3 = 01001001

z′4 = 01011010

z′5 = 10000001

z′6 = 01001001

25

Page 26: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

No caso geral, com mais de duas dimensoes e com uma populacao com k indivıduos (z1, z2, · · · , zk)monta-se uma roleta com setores dados por f(zi)∑k

j=1 f(zj)e geram-se k numeros aleatorios para de-

terminar a populacao resultante da mesma forma que fizemos anteriormente.

Deste modo, dada uma populacao z = (z1, z2, · · · , zk), a probabilidade de, na selecao, obter-mos a populacao w = (w1, w2, · · · , wk) e dada por

K(z, w) =

∏k

j=1 f(wj)

(∑k

j=1 f(zj))k , se w1, · · · , wk e uma amostra ordenada com reposicao de z1, · · · , zk

0, caso contrario

3.2.4 Cruzamento

O cruzamento e o operador responsavel pelas trocas geneticas entre os pais durante a re-producao, permitindo assim que as proximas geracoes herdem as caracterısticas paternas. Aquantidade de cromossomos que serao submetidos ao processo e determinada pelo parametrochamado probabilidade de cruzamento pc ∈ [0, 1], que, no caso canonico, e escolhida pelousuario.

A escolha e feita gerando-se numeros aleatorios ai ∈ (0, 1) e usando o seguinte criterio: seai < pc, o indivıduo z′i e escolhido para o cruzamento. Chamamos de pais aqueles indivıduosda populacao que sao escolhidos para o cruzamento.

Uma vez escolhidos os pontos que participarao do cruzamento, existem varias maneiras parao efetivarmos. Neste trabalho, usamos o seguinte procedimento: supondo que s indivıduos foramselecionados, o primeiro indivıduo selecionado cruzara com o segundo, o terceiro com o quartoe assim por diante ate que tenhamos [s/2] pares, onde [ ] e a funcao maior inteiro.

Ilustramos quantitativamente como isto e feito, a seguir.

E gerada uma quantidade de numeros aleatorios em (0, 1) igual ao tamanho da populacao.Suponhamos que, no nosso exemplo, temos pc = 0.35 e os numeros aleatorios gerados forama1 = 0.42, a2 = 0.29, a3 = 0.45, a4 = 0.81, a5 = 0.11 e a6 = 0.33. Verificamos agora se ai < pc ounao. Se ai < pc, o indivıduo z′i da populacao e escolhido para participar do processo de cruza-mento, caso contrario, o indivıduo permanece na populacao resultante sem sofrer alteracaonenhuma. Portanto, neste caso

a1 = 0.42⇒ a1 > pc, nao seleciona z′1.a2 = 0.29⇒ a2 < pc, seleciona z′2.a3 = 0.45⇒ a3 > pc, nao seleciona z′3.a4 = 0.81⇒ a4 > pc, nao seleciona z′4.a5 = 0.11⇒ a5 < pc, seleciona z′5.a6 = 0.33⇒ a6 < pc, seleciona z′6.

Em uma populacao com k indivıduos, em que cada indivıduo possui N` coordenadas, paracada par de indivıduos escolhidos (pais) para o cruzamento, e gerado um ponto de corte entre 1

26

Page 27: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

e N`−1, que e um ponto a partir do qual os bits serao trocados, dando origem aos descendentes.A figura 7 ilustra este procedimento.

Figura 5: ponto de corte.

Os pontos escolhidos para o cruzamento foram z′2, z′5 e z′6. Pela regra estabelecida anteri-

ormente, segue que apenas os indivıduos z′2 e z′5 cruzarao. Para decidir onde sera o ponto decorte do cruzamento, geramos um numero aleatorio t de 1 ate 7. Assim, por exemplo, se t = 2teremos o seguinte cruzamento entre z′2 e z′5:

z′2 = 10|101110

z′5 = 10|000001

efetuando as trocas dos genes, obtemos:

z′′2 = 10|000001

z′′5 = 10|101110

Apos essa etapa do processo, a nova populacao e:

z′1 = 01011010

z′′2 = 10000001

z′3 = 01001001

z′4 = 01011010

z′′5 = 10101110

z′6 = 01001001

3.2.5 Mutacao

A mutacao introduz modificacoes aleatorias na informacao genetica, operando independen-temente em cada bit de cada indivıduo da populacao com uma probabilidade pm ∈ (0, 1),parametro chamado de probabilidade de mutacao. A mutacao assegura que a probabili-dade de transformar uma populacao em outra nunca sera zero. Isso vai evitar que o algoritmofique preso em mınimos locais, ja que qualquer quantidade de bits pode ser mudada.

27

Page 28: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

Definicao 3.2.1 A distancia de Hamming entre dois indivıduos a = (a1, a2, · · · , aN`) eb = (b1, b2, · · · , bN`) ∈ S e definida por

H(a, b) =N∑j=1

|aj − bj|

onde H(a, b) representa o numero de diferencas de todos os bits correspondentes nos indivıduosa e b, aj e bj ∈ 0, 1, para todo j ∈ 1, 2, · · · , N`.

De forma geral, podemos contar a quantidade de bits alterados usando a distancia de Ham-ming. Desse modo, a probabilidade de uma populacao z = (z1, z2, · · · , zk) se transformar numapopulacao w = (w1, w2, · · · , wk) depois da etapa de mutacao e dada por:

M (z, w) = pH(z,w)m .(1− pm)kN`−H(z,w)

onde kN` e o numero de bits das populacoes z e w e H(z, w) e a distancia de Hammingentre as populacoes z e w.

Para aplicar o operador mutacao numa populacao com k indivıduos de tamanho N`, e pre-ciso gerar k ×N` numeros aleatorios ai ∈ [0, 1]. Se ai < pm, sera feita uma mutacao no bit denumero i, caso contrario o bit fica inalterado.

No nosso exemplo, cada bit sera testado. Como temos 6 × 8 = 48 bits na populacao, seranecessario gerar 6× 8 = 48 numeros aleatorios e comparar cada um deles com a probabilidadede mutacao pm. Supondo que pm = 0.01 e que geramos os numeros aleatorios a1, a2, · · · , a48,se tivermos apenas dois numeros menores que pm, a saber, a5 = 0.007 e a31 = 0.0028, segueque sofrerao mutacao apenas os bits de numeros 5 e 31. Como ja foi dito, se ai < pm, o bit i etrocado, passa a ser 0 se for 1 ou passa a ser 1 se for 0.

Considerando que neste ponto, os indivıduos da populacao sao z′1, z′′2 , z′3, z′4, z′′5 e z6, podemos

pensar nesta populacao como sendo um vetor com 6 componentes, onde o bit 1 e o primeirobit de z′1, o bit 8 sera o oitavo bit de z′1, o bit 9 sera o primeiro bit de z′′2 ate que o bit 48 serao ultimo bit de z′6. Assim, neste exemplo, as mutacoes serao nos bits 5 e 31.

z′1 = 0101 1︸︷︷︸bit 5

010

z′′2 = 10000001

z′3 = 01001001

z′4 = 010110 1︸︷︷︸bit 31

0

z′′5 = 10101110

z′6 = 01001001

Efetuando-se as mutacoes nos bits 5 e 31 obtemos a seguinte populacao:

28

Page 29: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

z′′1 = 01010010

z′′2 = 10000001

z′3 = 01001001

z′′4 = 01011000

z′′5 = 10101110

z′6 = 01001001

o que conclui uma iteracao do algoritmo. Resumimos as informacoes desta nova geracao deindivıduos na tabela 3.

Indivıduo (x, y) f(x, y)(v1, · · · , v8)

z′′1 01010010 (−1.5,−3.3) 65.41z′′2 10000001 (0.3,−3.9) 54.73z′3 01001001 (−2.1, 0.9) 59.29z′′4 01011000 (−1.5, 0.3) 63.61z′′5 10101110 (1.5, 3.9) 41.59z′6 01001001 (−2.1, 0.9) 59.29

Tabela 3: pontos apos a acao dos operadores geneticos.

Seria muito otimismo esperar que, ao final da primeira iteracao, o ponto de otimo fosse encon-trado. De fato, mesmo depois de muitas iteracoes, este ponto pode ser perdido. Isso se deveao fato de que, embora a cadeia de Markov, por ser ergodica, convirja, o algoritmo geneticocanomico nao converge quase certamente para o otimo global, que sera o nosso proximo objetode estudo.

3.3 A Convergencia do Algoritmo Genetico Canonico

Seja Xn a cadeia de Markov que representa o algoritmo genetico, ou seja, em cada tempo n,Xn = (z1, z2, · · · , zk) onde cada zi e da forma (v1, v2, · · · , vN`), onde k e a dimensao do espacoe ` e o numero de divisoes em cada eixo, que e determinado pela precisao exigida. Em outraspalavras, o espaco de estados da cadeia que representa o algoritmo genetico pode ser visto como

S1 = (z1, z2, · · · , zk) , zi ∈ S, 1 ≤ i ≤ k ,onde S sao os pontos da malha.

Na proxima definicao, consideramos Zn = maxf(znj

); j = 1, 2, · · · , k

, onde znj

e a coor-denada j de Xn.

29

Page 30: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

Definicao 3.3.1 Dizemos que o algoritmo genetico converge para o maximo global se, e so-mente se,

limn→∞

P (Zn = f ∗) = 1

onde f ∗ = max f (t) , t ∈ S.

Teorema 10 Um algoritmo genetico canonico, representado por uma cadeia de markov ho-mogenea, finita, aperiodica e irredutıvel, nao converge para um maximo global.

Demonstracao:

Como f nao e constante, temos que existe x ∈ S tal que f (x) < f ∗, ja que f ∗ = max f (t) , t ∈ S,logo (x, x, · · · , x) ∈ S1. Como Xnn∈N e irredutıvel, aperiodica e com espaco de estados finito,segue que e recorrente positiva, logo

P (Xn = (x, x · · · , x))→ a > 0

Como P (Zn 6= f ∗) ≥ P (Xn = (x, x, · · · , x)), segue que

P (Zn = f ∗) ≤ 1− P (Xn = (x, x, · · · , x))

o que implicalimn→∞

P (Zn = f ∗) ≤ 1− a < 1

Logo, o algoritmo genetico canonico nao converge para o maximo global.

3.4 Algoritmo Genetico Elitista

Rudolph [27] mostra que o algoritmo genetico canonico nao converge para uma populacaoque possui o ponto de otimo como um de seus elementos. Entao ele propoe uma nova versao parao algoritmo genetico, o algoritmo genetico elitista, no qual esta convergencia ocorre. Dorea [6]provou a convergencia deste algoritmo quando outros tipos de operadores de selecao, cruzamentoe mutacao sao utilizados.

3.4.1 Elitismo

Com o elitismo, dada uma populacao inicial com k pontos, gerada aleatoriamente, umacopia do “melhor”ponto, isto e, do ponto que tem a maior imagem pela funcao objetivo f , eguardada em uma posicao extra k+ 1, e, logo em seguida, os operadores geneticos atuam sobreos k primeiros pontos para, em seguida, comparar o melhor ponto gerado com a copia do pontoguardada. Se um dos pontos gerados pela atuacao dos operadores geneticos, tiver imagem maiordo que a copia guardada, entao esta sera substituıda por aquele ponto; se nao, o ponto guardadopermanecera na posicao k+1, e o processo continua ate que algum criterio de parada ocorra, queno nosso caso, e o numero de iteracoes. Com isto, espera-se que a melhor solucao encontradaate o momento nao se perca devido ao carater estocastico do metodo. Sejam a populacao inicial

z =(z

(1)1 , z

(1)2 , · · · , z(1)

k

)e j, com 1 ≤ j ≤ k, tal que f

(z

(1)j

)= max

f(z

(1)i

), com 1 ≤ i ≤ k

.

30

Page 31: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

Criamos agora uma posicao extra k + 1 onde uma copia de z(1)j sera guardada, ou seja, z

(1)k+1 =

z(1)j . Desta forma, nossa populacao sera agora

(z

(1)1 , z

(1)2 , · · · , z(1)

k , z(1)k+1

). Os operadores de

selecao, cruzamento e mutacao atuarao nos k primeiros elementos da populacao, gerando ask primeiras entradas na nova populacao z

(2)1 , z

(2)2 , · · · , z(2)

k . Se existir m com 1 ≤ m ≤ k e

f(z

(2)m

)> f

(z

(1)j

), entao z

(2)k+1 = z

(2)m e caso contrario, z

(2)k+1 = z

(1)j e assim teremos a populacao(

z(2)1 , z

(2)2 , · · · , z(2)

k , z(2)k+1

)Caso haja mais de um ponto z

(2)m com f

(z

(2)m

)> f

(z

(1)j

), o ponto escolhido sera o de maior

imagem pela funcao f . Em seguida, o processo se repete sobre os k primeiros elementos danova populacao, ate que algum criterio de parada ocorra. Note que, em linhas gerais, o fun-cionamento do algoritmo genetico elitista e semelhante ao do algoritmo genetico canonico, jaque os operadores geneticos atuam sempre sobre a populacao com k elementos e o indivıduoseparado fica sempre a espera do resultado dessas operacoes, para a substituicao ou nao desteindivıduo na posicao extra do vetor populacao. O algoritmo genetico elitista pode ser resumidoassim:

Gere aleatoriamente uma populac~ao inicial de tamanho k.

Crie uma posic~ao extra no vetor populac~ao, a posic~ao k + 1, e coloque nesta posic~ao

uma copia do ponto de maior imagem pela func~ao objetivo f.

Repita

Aplique o operador selec~ao na populac~ao (k primeiros elementos).

Aplique o operador cruzamento na populac~ao obtida da selec~ao.

Aplique o operador mutac~ao na populac~ao obtida do cruzamento.

Se o ponto de maior imagem dentre os k primeiros elementos, tiver imagem maior que

a imagem do ponto da posic~ao k + 1 da populac~ao anterior, coloque nesta posic~ao

uma copia deste ponto, caso contrario, mantenha a mesma coordenada da populac~ao

anterior.

Ate que algum criterio de parada seja atingido

No exemplo que discutimos para o Algoritmo Genetico Canonico, tinhamos a seguinte po-pulacao inicial (

z(1)1 , z

(1)2 , z

(1)3 , z

(1)4 , z

(1)5 , z

(1)6

)

31

Page 32: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

cuja tabela esta representada abaixo.

Indivıduo (x, y) f(x, y)(v1, · · · , v8)

z(1)1 10101111 (1.5, 4.5) 36.25

z(1)2 01011010 (−1.5, 1.5) 57.25

z(1)3 10000001 (0.3,−3.9) 54.73

z(1)4 10100110 (1.5,−0, 9) 58.39

z(1)5 00111111 (−2.7, 4.5) 20.71

z(1)6 01001001 (−2.1, 0.9) 59.29

Tabela 4: pontos e imagens.

Escolhemos o indivıduo z(1)6 para a posicao extra como sendo o z

(1)7 no vetor populacao, ja que

e o ponto de maior imagem pela funcao f , a saber, 59.29. Assim temos:(z

(1)1 , z

(1)2 , z

(1)3 , z

(1)4 , z

(1)5 , z

(1)6 , z

(1)7 = z

(1)6

)Apos a Selecao, Cruzamento e Mutacao, nos 6 primeiros elementos, obtivemos a populacao(z

(2)1 , z

(2)2 , z

(2)3 , z

(2)4 , z

(2)5 , z

(2)6 , z

(1)6

), cuja tabela esta representada abaixo.

Indivıduo (x, y) f(x, y)(v1, · · · , v8)

z(2)1 01010010 (−1.5,−3.3) 65.41

z(2)2 10000001 (0.3,−3.9) 54.73

z(2)3 01001001 (−2.1, 0.9) 59.29

z(2)4 01011000 (−1.5, 0.3) 63.61

z(2)5 10101110 (1.5, 3.9) 41.59

z(2)6 01001001 (−2.1, 0.9) 59.29

Tabela 5: pontos apos a acao dos operadores geneticos.

Neste momento, comparamos a imagem de z(2)1 , que e o que tem maior imagem dentre os pontos

obtidos pela evolucao do algoritmo, com a imagem de z(1)7 . Como a imagem de x

(2)1 e maior que

a de z(1)7 , entao z

(2)7 = z

(2)1 . Assim teremos como populacao resultante:(

z(2)1 , z

(2)2 , z

(2)3 , z

(2)4 , z

(2)5 , z

(26 , z

(2)7 = z

(2)1

).

Como ja dissemos, o processo continua ate que algum criterio de parada seja satisfeito.

32

Page 33: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

3.4.2 A Convergencia do Algoritmo Genetico Elitista

O nosso objetivo agora e mostrar a convergencia quase certa do Algoritimo Genetico Elitista.Usamos o fato de que a populacao no tempo n, denotada por Xn so depende da populacao notempo n− 1, denotada por Xn−1.

Note que agora nosso espaco de estados e S = (z1, z2, · · · , zk, zk+1) ; zi ∈ S, onde S e oconjunto dos pontos da malha. Observe que a forma com que a cadeia se move mudou pois,agora, se na ultima coordenada temos um ponto cuja imagem vale α, entao nunca poderemosno proximo passo ter um ponto, nesta coordenada, cuja imagem seja menor que α. Agora acadeia nao e mais irredutıvel. Em compensacao, o conjunto das populacoes onde o ultimo pontoe o ponto de otimo, e um conjunto fechado; ou seja, uma vez que a cadeia atinja este conjunto,ela nao sai mais. Alem do mais, a cadeia restrita a este conjunto e irredutıvel, aperiodica e finita.

Para discutirmos a convergencia, precisamos definir claramente o nosso conjunto de inte-resse.

Definicao 3.4.1 O conjunto das populacoes que possui o ponto de otimo como um dos seuselementos, pode ser definido da seguinte maneira:

Emax =u = (u1, u2, · · · , uk, uk+1) ∈ S; f (uk+1) = fmax

onde fmax = max f(t); t ∈ S.

Lema 2 Se γ = infu∈S

∑v∈Emax

Puv, entao γ > 0

Demonstracao:

De fato, como o algoritmo genetico canonico, que e utilizado na evolucao das k primeirasentradas do vetor u ∈ S, e uma cadeia de Markov irredutıvel com a matriz de mutacao positiva,segue, pelo lema 1, que a probabilidade de ir de qualquer ponto de S1, para qualquer outroponto de S1 e positiva. Entretanto, quando acrescentamos a ultima coordenada, uma serie derestricoes ocorrem:

1. Ir de uma populacao u ∈ S para outra v ∈ S onde a ultima coordenada de v tem imagem,por f , menor do que a imagem por f da ultima coordenada de u, tem probabilidade zeropela propria evolucao do algoritmo.

2. Ir de uma populacao u ∈ S para outra v ∈ S ambos possuindo a mesma ultima coor-denada, so acontece se as k primeiras coordenadas de v, que foram geradas a partir deu, pelo algoritmo, tiverem as suas imagens por f , menores ou iguais que a imagem daultima coordenada.

3. Ir de uma populacao u ∈ S para outra v ∈ S com v possuindo a ultima coordenada igualao ponto de maximo e u nao possuindo nenhuma coordenada igual ao ponto de maximo,e possıvel, desde que um dos k primeiros pontos de v tambem seja um ponto de maximo.

4. Ir de uma populacao u ∈ S para outra v ∈ S com ambas possuindo a ultima coordenadacomo o ponto de maximo, e sempre possıvel.

33

Page 34: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

Desta forma, vemos que tomando um ponto qualquer u ∈ S e v ∈ Emax:

• Se u possuir a ultima coordenada como sendo ponto de maximo, pelo item 4, Puv > 0,para todo v ∈ Emax.

• Se u nao possuir a ultima coordenada como sendo ponto de maximo, segue que nenhumacoordenada e ponto de maximo. Contudo, as k primeiras coordenadas tem probabilidadepositiva de gerar uma outra populacao de tamanho k que possui o ponto de otimo. Logo,a populacao de S que tenha estas primeiras coordenadas e a copia do ponto de otimona ultima coordenada, tem probabilidade positiva de acontecer, ou seja, existe um pontov ∈ Emax tal que Puv > 0.

Resumindo, se u ∈ S possui a ultima coordenada igual ao ponto de maximo, Puv > 0 paratodo v ∈ Emax e, caso nao tenha, existe v ∈ Emax tal que Puv > 0. Portanto, em qualquer caso,∑

v∈Emax

Puv = PuEmax > 0

Como S e finito, podemos concluir que γ > 0.

A seguir, demonstramos um resultado importante que sera util no teorema seguinte.

Teorema 11 Sendo Xnn∈N a cadeia que representa o algoritmo genetico elitista, temos

P (Xn+1 /∈ Emax|Xn = u) ≤ 1− γ, ∀u ∈ S com γ > 0.

Demonstracao:

P (Xn+1 /∈ Emax|Xn = u) = 1− P (Xn+1 ∈ Emax|Xn = u)

= 1− PuEmax

≤ 1− γja que PuEmax ≥ γ.

Teorema 12 Considerando o resultado do Teorema 11, P(∩Mn=1 (Xn /∈ Emax) |X0 = u

)≤ (1− γ)M ,

∀u ∈ S, com M ∈ N.

Demonstracao:

Tomando os eventos An = [Xn /∈ Emax] e A0 = [X0 = u], usando a definicao de probabilidadecondicional, o produto de probabilidades, o fato de cada estado da cadeia so depender do estado

34

Page 35: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

anterior e, por ultimo, o Teorema 11, segue que:

P(⋂M

n=1 (Xn /∈ Emax) |X0 = u)

= P(⋂M

n=1(An)|A0

)=

P (Ao ∩ A1 ∩ A2 ∩ · · · ∩ AM)

P (A0)

=P (A0)P (A1|A0)P (A2|A1)(AM |AM−1)

P (A0)

≤ (1− γ)(1− γ) · · · (1− γ)

= (1− γ)M

Corolario 4 De acordo com o teorema 12, no algoritmo genetico elitista temos que

limM→∞

P (XM ∈ Emax|X0 = u) = 1, ∀u ∈ S.

Demonstracao:

Como P(∩Mn=1 (Xn /∈ Emax) |X0 = u

)≤ (1− γ)M , pelo teorema 12, vem que

P(∪Mn=1 (Xn ∈ Emax) |X0 = u

)= 1− P

(∩Mn=1 (Xn /∈ Emax) |X0 = u

)≥ 1− (1− γ)M

o que implicalimM→∞

P(∪Mn=1 (Xn ∈ Emax) |X0 = u

)≥ 1, ∀u ∈ S

ja que (1− γ)M → 0. Logo,

limM→∞

P(∪Mn=1 (Xn ∈ Emax) |X0 = u

)= 1

Como, no algoritmo genetico elitista, o melhor ponto sera preservado na proxima geracao, segueque Xn ∈ Emax ⊂ Xn+1 ∈ Emax,donde

limM→∞

P (XM ∈ Emax|X0 = u) = 1

ou seja, a sequencia Xnn∈N converge para uma populacao que possui o ponto de otimo como

um de seus pontos. Como u ∈ S foi qualquer, temos que independente da populacao inicial,teremos a convergencia desejada.

A fim de definirmos a ideia de vizinhanca apresentada em Dorea[6], lembramos que cadaindivıduo (cromossomo) u e caracterizado pelos genes correspondentes (bits), ou seja,

a = (a1, a2, · · · , aNl) com aj ∈ 0, 1 , j = 1, 2, ..., Nl.

35

Page 36: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

Definicao 3.4.2 A vizinhanca do ponto a e definida como

η (a) =

b; b ∈ S,H (a, b) =

N∑j=1

|aj − bj| ≤ 1

onde H e a distancia de Hamming (Definicao 3.2.1.)

Em Dorea [6] e proposta a etapa de cruzamento, com vizinhanca de tamanho fixo, daseguinte forma: a etapa de selecao dos elementos da populacao (z1, z2, · · · , zk) que participaraodesta etapa e feito da mesma maneira que no algoritmo genetico tradicional, entretanto nao hauma “troca”propriamente dita de material genetico. Nao existe a ideia de gerar filhos atravesdos pais. Para cada indivıduo zj com 1 ≤ j ≤ k, escolhido para o cruzamento, um numeroaleatorio m de 1, 2, 3, · · · , N` e gerado e o bit m de zj e mudado, ou seja, se o bit for 1 passaa ser zero ou vice versa.

Uma outra proposta de Dorea [6] e, na etapa de mutacao, usar o algoritmo SimulatedAnnealing com agenda de resfriamento C. Quando o Simulated Annealing (SA) for utilizado,dado um ponto x do domınio de f , para a distribuicao que gera o proximo ponto y do domıniode f , havera uma probabilidade de aceitacao deste ultimo dada por:

P (y|x) =

1 , se f(y) ≥ f(x)

exp(−f(x)−f(y)

C

), se f(y) < f(x)

Note que existe uma probabilidade do SA aceitar pontos piores, o que faz com que o mesmonao fique preso a maximos locais. Quanto aumentamos os valores de C, a probabilidade doalgoritmo aceitar pontos piores diminui, o que acarreta uma melhora significativa na busca deotimos de f . Agora, e valido salientar, que a inclusao do SA no presente trabalho, e apenaspara enriquecer as comparacoes entre as simulacoes do proximo capıtulo. Para mais detalhes,ver [26].

36

Page 37: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

Capıtulo 4

Simulacoes

“Nao ha nenhum ramo da Matematica, por mais abstrato que seja, que nao possa ser aplicadoaos fenomenos do mundo real.”

(Nicolai Lobachevsky)

Neste capıtulo, apresentamos um estudo numerico comparativo entre os algoritmos geneticosapresentados em Dorea [6]. Para este fim, apresentamos a seguir um resumo das etapas de cadaum dos algoritmos e, na proxima secao, explicamos sob que condicoes foram realizados os ex-perimentos e qual a medida utilizada nesta comparacao.

Damos agora uma rapida explicacao sobre a nomenclatura que aparece nas legendas dosgraficos que serao expostos mais adiante neste trabalho.

ALGORITMO 1 (SnCnMn)

Neste algoritmo, utilizamos a selecao, cruzamento e mutacao usuais.

ALGORITMO 2 (SnCviz)

Na etapa de selecao, utilizamos a roleta. Na etapa de cruzamento utilizamos uma vizinhancade tamanho fixo e nao existe etapa de mutacao.

ALGORITMO 3 (SnMSA)

Na etapa de selecao, utilizamos a roleta, sem etapa de cruzamento e, na mutacao, utilizamos oalgoritmo Simulated Annealing.

ALGORITMO 4 (SnCvizMSA)

Na etapa de selecao, usamos a roleta; na etapa de cruzamento, utilizamos uma vizinhancade tamanho fixo e, na etapa de mutacao, utilizamos o Simulated Annealing.

37

Page 38: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

4.1 Simulacoes

As simulacoes numericas a seguir foram realizadas com o intuito de encontrar os pontos demaximo das funcoes f1, f2, f3, f4 e f5 definidas a seguir:

f1 : [−2, 1]× [−2, 1]→ R, definida por:

f1(x, y) = 6 + x2 + y2 − 3cos (2πx)− 3cos (2πy)

f2 : [−20.3, 19.6]× [−20.3, 19.6]→ R, definida por:

f2(x, y) = 0.50−sen2

(√x2 + y2

)− 0.50

(1 + 0.001 (x2 + y2))2

f3 : [−4, 2]× [−4, 2]→ R, definida por:

f3(x, y) =1

0.30 + x2 + y2

f4 : [−2, 2]× [−2, 2]→ R, definida por:

f4(x, y) =(1 + (19− 14x+ 3x2 − 14y + 6xy + 3y2) (x+ y + 1)2)×(30 + (18− 32x+ 12x2 + 48y − 36xy + 27y2) (2x− 3y)2)

f5 : [−5, 10]× [0, 15]→ R, definida por:

f5(x, y) =

(y − 5.1x2

4π2+

5x

π− 6

)2

+ 10

(1− 1

)cosx+ 10

Os graficos destas funcoes podem ser vistos nas figuras seguintes.

Figura 6: grafico de f1.

38

Page 39: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

Figura 7: grafico de f2.

Figura 8: grafico de f3.

Figura 9: grafico de f4.

39

Page 40: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

Figura 10: grafico de f5.

Nestas simulacoes, cada intervalo do produto cartesiano foi dividido em 26 pontos, resultandoem uma malha de 212 pontos. Em cada um destes problemas realizamos simulacoes com osseguintes tamanhos de populacao: 10, 30 e 50 indivıduos. O objetivo de usar tamanhos depopulacoes diferentes e ilustrar o que acontece com os resultados a medida que a populacaoaumenta. Utilizamos nestas simulacoes a versao elitista dos algoritmos, pois sabemos que estesconvergem para o conjunto das populacoes que possuem um de seus pontos como sendo o pontode otimo procurado.

Alem de mudar o tamanho da populacao, realizamos simulacoes com tamanhos de vizinhan-ca 1 e 2 quando usamos na etapa de cruzamento a ideia proposta em Dorea [6]. Tambem rea-lizamos simulacoes com diferentes valores para a agenda de resfriamento: 10 e 100, quandousamos o Simulated Annealing.

Os resultados sao apresentados em forma de graficos, obtidos a partir de 1000 realizacoesdo algoritmo, cada um deles rodando 1000 passos. Um ponto (q, r) deste grafico, significa queem q passos, o algoritmo encontrou o ponto de otimo em r das 1000 realizacoes. Logo, se oponto (10, 20) pertence ao grafico, entao das 1000 repeticoes, em 20 delas, o ponto de otimo foiencontrado em 10 passos.

40

Page 41: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

4.2 Graficos das Simulacoes

4.2.1 Simulacoes de f1

(a) p = 10, c = 10, v = 1. (b) p = 10, c = 10, v = 1.

(c) p = 10, c = 100, v = 1. (d) p = 10, c = 10, v = 2.

Figura 11: Simulacoes de f1 para tamanho de populacao 10 ediferentes valores para agenda de resfriamento c e vizinhanca v.

41

Page 42: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

(e) p = 30, c = 10, v = 1. (f) p = 30, c = 10, v = 2

(g) p = 30, c = 100, v = 1. (h) p = 30, c = 100, v = 2.

Figura 12: Simulacoes de f1 para tamanho de populacao 30 ediferentes valores para agenda de resfriamento c e vizinhanca v.

42

Page 43: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

(i) p = 50, c = 10, v = 1. (j) p = 50, c = 10, v = 2.

(l) p = 50, c = 100, v = 1. (m) p = 50, c = 100, v = 2.

Figura 13: Simulacoes de f1 para tamanho de populacao 50 ediferentes valores para agenda de resfriamento c e vizinhanca v.

43

Page 44: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

4.2.2 Simulacoes de f2

(a) p = 10, c = 10, v = 1. (b) p = 10, c = 10, v = 2.

(c) p = 10, c = 100, v = 1. (d) p = 10, c = 100, v = 2.

Figura 14: Simulacoes de f2 para tamanho de populacao 10 ediferentes valores para agenda de resfriamento c e vizinhanca v.

44

Page 45: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

(e) p = 30, c = 10, v = 1. (f) p = 30, c = 10, v = 2.

(g) p = 30, c = 100, v = 1. (h) p = 30, c = 100, v = 2.

Figura 15: Simulacoes de f2 para tamanho de populacao 30 ediferentes valores para agenda de resfriamento c e vizinhanca v.

45

Page 46: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

(i) p = 50, c = 10, v = 1. (j) p = 50, c = 10, v = 2.

(l) p = 50, c = 100, v = 1. (m) p = 50, c = 100, v = 2.

Figura 16: Simulacoes de f2 para tamanho de populacao 50 ediferentes valores para agenda de resfriamento c e vizinhanca v.

46

Page 47: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

4.2.3 Simulacoes de f3

(a) p = 10, c = 10, v = 1. (b) p = 10, c = 10, v = 2.

(c) p = 10, c = 100, v = 1. (d) p = 10, c = 100, v = 2.

Figura 17: Simulacoes de f3 para tamanho de populacao 10 ediferentes valores para agenda de resfriamento c e vizinhanca v.

47

Page 48: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

(e) p = 30, c = 10, v = 1. (f) p = 30, c = 10, v = 2.

(g) p = 30, c = 100, v = 1. (h) p = 30, c = 100, v = 2.

Figura 18: Simulacoes de f3 para tamanho de populacao 30 ediferentes valores para agenda de resfriamento c e vizinhanca v.

48

Page 49: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

(i) p = 50, c = 10, v = 1. (j) p = 50, c = 10, v = 2.

(l) p = 50, c = 100, v = 1. (m) p = 50, c = 100, v = 2.

Figura 19: Simulacoes de f3 para tamanho de populacao 50 ediferentes valores para agenda de resfriamento c e vizinhanca v.

49

Page 50: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

4.2.4 Simulacoes de f4

(a) p = 10, c = 10, v = 1. (b) p = 10, c = 10, v = 2.

(c) p = 10, c = 100, v = 1. (d) p = 10, c = 100, v = 2.

Figura 20: Simulacoes de f4 para tamanho de populacao 10 ediferentes valores para agenda de resfriamento c e vizinhanca v.

50

Page 51: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

(e) p = 30, c = 10, v = 1. (f) p = 30, c = 10, v = 2.

(g) p = 30, c = 100, v = 1. (h) p = 30, c = 100, v = 2.

Figura 21: Simulacoes de f4 para tamanho de populacao 30 ediferentes valores para agenda de resfriamento c e vizinhanca v.

51

Page 52: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

(i) p = 50, c = 10, v = 1. (j) p = 50, c = 10, v = 2.

(l) p = 50, c = 100, v = 1. (m) p = 50, c = 10, v = 2.

Figura 22: Simulacoes de f4 para tamanho de populacao 50 ediferentes valores para agenda de resfriamento c e vizinhanca v.

52

Page 53: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

4.2.5 Simulacoes de f5

(a) p = 10, c = 10, v = 1. (b) p = 10, c = 10, v = 2.

(c) p = 10, c = 100, v = 1. (d) p = 10, c = 100, v = 2.

Figura 23: Simulacoes de f5 para tamanho de populacao 10 ediferentes valores para agenda de resfriamento c e vizinhanca v.

53

Page 54: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

(e) p = 30, c = 10, v = 1. (f) p = 30, c = 10, v = 2.

(g) p = 30, c = 100, v = 1. (h) p = 30, c = 100, v = 2.

Figura 24: Simulacoes de f5 para tamanho de populacao 30 ediferentes valores para agenda de resfriamento c e vizinhanca v.

54

Page 55: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

(i) p = 50, c = 10, v = 1. (j) p = 50, c = 10, v = 2.

(l) p = 50, c = 100, v = 1. (m) p = 50, c = 100, v = 2.

Figura 25: Simulacoes de f5 para tamanho de populacao 50 ediferentes valores para agenda de resfriamento c e vizinhanca v.

55

Page 56: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

Capıtulo 5

Conclusoes

“O ultimo passo da razao e reconhecer a existencia de uma infinidade de coisas que aultrapassam.”(PASCAL)

Neste trabalho, vimos a vantagem que o algoritmo genetico elitista leva sobre o algo-ritmo genetico canonico, pois o primeiro converge para o conjunto das populacoes que possuio ponto de otimo de uma dada funcao positiva e limitada superiormente, enquanto o segundonao converge. Nas simulacoes realizadas, ilustramos varios cenarios possıveis de cruzamento(canonico, modificado por vizinhanca e sem esta etapa) e mutacao (canonico, com simulatedannealing e sem essa etapa) e realizamos simulacoes com combinacoes destas diversas possibil-idades de escolha destes operadores. Nestas simulacoes, alem de combinarmos estes possıveisoperadores, tambem modificamos o tamanho da vizinhanca no operador cruzamento que utilizaa ideia apresentada em Dorea [7] e a agenda de resfriamento na etapa de mutacao que utilizao simulated annealing, alem de realizar simulacoes com tamanhos de populacoes diferentes.

Vimos teoricamente que os algoritmos elitistas sempre encontrarao o ponto de otimo procu-rado, entretanto podemos ver em nossas simulacoes que isso nao significa que, em 1000 passos,eles encontrararao o ponto de otimo desejado em todas as realizacoes, e isso serve para ilustraro significado de comportamento assintotico, ou seja, resultados que valem no limite.

Olhando para as simulacoes realizadas, observamos que o algoritmo 1 (SnCnMn) parece sero que menos vezes encontra os ponto de otimo. Ja os graficos das simulacoes ilustram quenos experimentos realizados, os algoritmos 2 (SnCviz),3(SnMSA) e 4 (SnCvizMSA) encontrammais vezes os pontos de otimo para um mesmo numero de passos. Vemos nas simulacoes que,a medida que a populacao aumenta, os resultados parecem diferir menos, ou seja, gastam-semenos passos para encontrar os pontos de otimo. Entao, uma questao que se pode levantar e:se ao aumentarmos o tamanho da populacao melhoramos o desempenho dos algoritmos, porque nao tomamos populacoes grandes? A resposta e a seguinte: quanto maior a populacao,mais calculos o algoritmo precisa fazer em cada passo, o que aumenta muito o seu esforco com-putacional e acarreta um aumento de tempo para realizar cada passo. Assim, quanto maior apopulacao, menor a quantidade de passos necessarios para encontrar o ponto desejado e maioro tempo que cada passo leva para ser realizado. Um problema em aberto e justamente esse,saber qual o tamanho de populacao otimo, ou seja, qual deve ser o tamanho da populacao emque o ponto de otimo seja encontrado em menor tempo?

56

Page 57: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

A conclusao que, se pode tirar e que embora exista um resultado que nos garanta a con-vergencia destes algoritmos, nem sempre ela se da numa quantidade finita de passos e pareceque algumas abordagens (utilizando formas diferentes de fazer as etapas de selecao, cruzamentoe mutacao) fazem com que o algoritmo encontre o ponto procurado em menos passos.

Para trabalhos futuros, pretendemos estudar a velocidade de convergencia destes algoritmose com isso poder realmente dizer se existe uma melhora entre um algoritmo e outro. Mesmoassim, o estudo da velocidade de convergencia se da em relacao ao numero de passos do algo-ritmo, que como comentado acima, o tempo de cada passo depende da quantidade de calculosque o algoritmo precisa realizar em cada passo.

57

Page 58: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

Referencias

[1] Albuquerque, P.; Mazza, C. Mutation Selection Algorithm: A Large Desviation Approach -Fundations od Genetic Algorithms vol 06, pag. 227 - Morgan Kaufmann Publishers, AcademicPress, 2001.

[2] Attenborough, Charles. Documentario Charles Darwin e a Arvore da Vida, BBC, Londres,2008.

[3] Cerf, R. The Dinamics of Mutations - Selections Algorithms with Large Populations Sizes -Ann. Inst. H.Poincare - Prob. Statist 32 - pp.455-508, 1996.

[4] Cerf, R. Asymptotic Convergence of Genetic Algorithms, Advanced Applied Probability, 30,pp. 521-550, 1998.

[5] Darwin, C. A Origem das Especies, Ediouro - Rio de Janeiro, 2004.

[6] Dorea, C.C.Y. Junior et al. Multistage Markov Chain modelling of the Genetic Algorithmand Convergence results, 2010.

[7] Eiben, A. E.; Aarps, E. M. L.; Van Hee, K. M. Global Convergence of Genetic Algorithms:Markov Chaim Analysis, in Parallel Problem Solving from Nature - Springer, pp.04-12, 1991.

[8] Freidlin, M. L. Wentzell, A. D. Random Perturbations of Dynamical Systems, Springer -NY, 1984.

[9] Fischer, R. A. The Genetic Theory of Natural Seletion - Dover Publications, 1958.

[10] Francois, O. Global Optimization with Explorations - Selections Algorithms and SimulatedAnnealing, The Annals of Applied Probability, vol.0 - number 0, pp.1-24, 2001.

[11] Goldberg, D.E. Genetic Algorithms in Search Optimization and Machine Learning- Read-ing M.A - Addison Wesley, 1989.

[12] Holland, J.H. Adaptation in Natural and Artificial Systems - Univ. Michigan Press, AnnArbor, 1975.

[13] Iofescu, Marius. Finite Markov Process and Their Applications. 1a ed. Dover, 2007.

[14] Isaacson, Dean L. Markov Chains Theory and Applications. 1a ed. Robert E. KriegerPublishing Company, INC Malabar, Florida, 1985.

[15] James, Barry R. Probabilidade: Um curso intermediario. 3a ed. Rio de Janeiro: IMPA,2004.

58

Page 59: Algoritmos Gen eticos Can^onico e Elitista: uma … · mudan˘cas."(Charles Darwin) ... tais como os de Jean Baptiste Lamark [17], o qual sugeriu que as caracter sticas ... y), com

[16] Kirkpatrick, S.; Gellatt, C.D.; Vecchi, M.P. Jr. Optmization by Simulated Annealling.Science 220:671-680, 1983.

[17] Lamarck, J. B. Philosophie Zoologique, Paris, Libraire Schleicher Freres, 1907.

[18] Linder, R. Algoritmos Geneticos, 3a edicao - Ed. Ciencia Moderna, 2012.

[19] Linnee, Karl Von. Systeme de La Nature, Bruxelas; Lemaire, 1793.

[20] Magalhaes, M. Nascimento. Probabilidade e Variaveis aleatorias. Sao Paulo: Edusp, 2004.

[21] Malthus, T. An Essay on the Principle of Population, Eletronic Scholarly Projeet, 1998.

[22] Mendel, G. Experimentos sobre Hibridacao das Plantas. In: Freire-Maia, N. Gregor Mendel- Vida e Obra. T.A Queiroz, Sao Paulo, 1995.

[23] Nix, A.E.; Vose, M.D. Modeling Genetic Algorithms with Markov Chains, Annals of Math-ematics and Artifical Intelligence, v.5 n.1, pp 79-88, 1992.

[24] Pereira, A.G.C.; Cruz, J.A.R.; Campos, V.S.M. Modeling the Genetic Algorithm by aNon-Homogeneous Markov Chains: weak and strong ergodicity, ISSN 0040585X, 2012.

[25] Resnick, S. I. Adventures in Stochastic Process - Birkhauser, 2002:

[26] Rosa, J. C. Modelagem dos Algoritmos Geneticos Simples e Simulated Annelling porCadeias de Markov, Dissertacao de Mestrado do PPGMAE-UFRN, 2010.

[27] Rudolph, G. Convergency Analysis of Canonical Genetic Algorithms, IEE. Transactinosou neural Networks, Special Neural Networks, Special issue on Evolutionary Compilation 5,96− 101, 1994.

[28] Suzuki, J. A Markov Chain Analysis on Genetic Algorithms - Large Deviation PrincipleApproach, Applied Probability Trust, 2010.

59