redes de funções de base radial radial basis functions...

23
© Germano Vasconcelos Redes de Funções de Base Radial Radial Basis Functions (RBFs) Germano C. Vasconcelos Centro de Informática - UFPE

Upload: others

Post on 06-Nov-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Redes de Funções de Base Radial Radial Basis Functions (RBFs)cin.ufpe.br/~dss2/Aula-RBFs-sem-fundo.pdf · Uma superfície F no espaço multidimensional é definida como uma combinação

© Germano Vasconcelos

Redes de Funções de Base Radial

Radial Basis Functions (RBFs)

Germano C. Vasconcelos

Centro de Informática - UFPE

Page 2: Redes de Funções de Base Radial Radial Basis Functions (RBFs)cin.ufpe.br/~dss2/Aula-RBFs-sem-fundo.pdf · Uma superfície F no espaço multidimensional é definida como uma combinação

© Germano Vasconcelos

Introdução

“Em uma RBF, a rede é definida do ponto de vista

de um problema de aproximação de funções”

Uma superfície F no espaço multidimensional é

definida como uma combinação linear de funções

de base radial

F ⇒ comb. linear de funções de base radial

Page 3: Redes de Funções de Base Radial Radial Basis Functions (RBFs)cin.ufpe.br/~dss2/Aula-RBFs-sem-fundo.pdf · Uma superfície F no espaço multidimensional é definida como uma combinação

© Germano Vasconcelos

Estrutura de uma RBF

x1

Y=F(X)

x2

xn

φ2|X-C2|

φ1|X-C1|

φ3|X-C3|

φk|X-Cn|

bias

camada

de entrada

camada intermediária

camada

de saída

Cjw1

w3

wk

w2

w0

F(X)=ΣΣΣΣjwj.φφφφj|X-Cj|

Page 4: Redes de Funções de Base Radial Radial Basis Functions (RBFs)cin.ufpe.br/~dss2/Aula-RBFs-sem-fundo.pdf · Uma superfície F no espaço multidimensional é definida como uma combinação

© Germano Vasconcelos

Características das RBFs

• Estrutura do tipo feedforward com uma mistura de

treinamento supervisionado e não-supervisionado

• Normalmente uma camada de neurônios que

computam funções de base radial

• Os pesos na camada intermediária representam

centroids

• Os pesos na camada de saída ponderam as saídas

da camada intermediária

Page 5: Redes de Funções de Base Radial Radial Basis Functions (RBFs)cin.ufpe.br/~dss2/Aula-RBFs-sem-fundo.pdf · Uma superfície F no espaço multidimensional é definida como uma combinação

© Germano Vasconcelos

Características das RBFs

• São aproximadores universais de funções

• Estimam a probabilidade a posteriori do ponto de vista Bayesiano

• Desenvolvem superfícies de decisãofechadas para representar os padrões

• Têm sido empregadas em um grandenúmero de aplicações tal como as redes do tipo MLP

Page 6: Redes de Funções de Base Radial Radial Basis Functions (RBFs)cin.ufpe.br/~dss2/Aula-RBFs-sem-fundo.pdf · Uma superfície F no espaço multidimensional é definida como uma combinação

© Germano Vasconcelos

Características das RBFs

• Estratégias de treinamento diferentes para as

funções radiais, os centroids e os pesos da camada

de saída

• Regra de propagação = função radial

Ex: Distância Euclideana ⇒ netj = |X-C| = √ Σ(xi - ci)2

• Função de ativação = função local

Ex: Gaussiana ⇒ oj = f(netj) = exp(- netj2/cj

2)

Page 7: Redes de Funções de Base Radial Radial Basis Functions (RBFs)cin.ufpe.br/~dss2/Aula-RBFs-sem-fundo.pdf · Uma superfície F no espaço multidimensional é definida como uma combinação

© Germano Vasconcelos

Trabalhos com RBFs

• Broomhead & Lowe (1988)

• Moody & Darken (1989)

• Poggio & Girosi (1990)

• Niranjan & Fallside (1990)

E muitos outros ...

Page 8: Redes de Funções de Base Radial Radial Basis Functions (RBFs)cin.ufpe.br/~dss2/Aula-RBFs-sem-fundo.pdf · Uma superfície F no espaço multidimensional é definida como uma combinação

© Germano Vasconcelos

Treinamento

• Três conjuntos de parâmetros a serem

estimados

• As larguras d das funções de base radial

• Os centros Cj

• Os pesos Wji da camada de saída

Page 9: Redes de Funções de Base Radial Radial Basis Functions (RBFs)cin.ufpe.br/~dss2/Aula-RBFs-sem-fundo.pdf · Uma superfície F no espaço multidimensional é definida como uma combinação

© Germano Vasconcelos

As Larguras d

• Valor definido a priori

• Técnica de gradiente descendente

• Heurística do vizinho mais próximo

Page 10: Redes de Funções de Base Radial Radial Basis Functions (RBFs)cin.ufpe.br/~dss2/Aula-RBFs-sem-fundo.pdf · Uma superfície F no espaço multidimensional é definida como uma combinação

© Germano Vasconcelos

Os Centros Cj

• Distribuir uniformemente ou aleatoriamente

• Tomar uma amostra do conjunto de

treinamento

• Método não supervisionado de agrupamento

(clustering)

• Gradiente descendente

Page 11: Redes de Funções de Base Radial Radial Basis Functions (RBFs)cin.ufpe.br/~dss2/Aula-RBFs-sem-fundo.pdf · Uma superfície F no espaço multidimensional é definida como uma combinação

© Germano Vasconcelos

Método Não-supervisionado - Algoritmo K-Médias

(K-means clustering)

• Particiona o espaço de padrões em K grupos

• K vetores de entrada são escolhidos aleatoriamente comocentros de K grupos de padrões

• Outros vetores de treinamento são atribuídos ao grupo com o centro mais próximo (distância Euclideana, por exemplo)

• Centros são recalculados como o vetor médio do grupo(média dos vetores do grupo)

• Vetores de treinamento são novamente apresentados e atribuídos aos centros mais próximos

• Processo é repetido até não ocorrer mais alterações namodificação dos centros

Page 12: Redes de Funções de Base Radial Radial Basis Functions (RBFs)cin.ufpe.br/~dss2/Aula-RBFs-sem-fundo.pdf · Uma superfície F no espaço multidimensional é definida como uma combinação

© Germano Vasconcelos

Pesos Wji na Camada de Saída

• Processo de otimização linear

• Solução de mínimo global

Esquema de Correção

de Erros

Mínimo Erro

Quadrado (LMS)

Newton-like

Method

Procedimento direto Manipulação de

matrizes

Page 13: Redes de Funções de Base Radial Radial Basis Functions (RBFs)cin.ufpe.br/~dss2/Aula-RBFs-sem-fundo.pdf · Uma superfície F no espaço multidimensional é definida como uma combinação

© Germano Vasconcelos

Manipulação de Matrizes

(Pseudo-inverse method)

E[f] = Σ np (yp – f(xp ))2

\

f(xp) = Σ wj. φ (|xp – cj|)

W = (GT . G + λ Go )-1 . GT. Y

onde...

Page 14: Redes de Funções de Base Radial Radial Basis Functions (RBFs)cin.ufpe.br/~dss2/Aula-RBFs-sem-fundo.pdf · Uma superfície F no espaço multidimensional é definida como uma combinação

© Germano Vasconcelos

φ (|x1 – c1|) φ (|x1 – c2|) ...φ (|x1 – c3|)

φ (|x2 – c1|) φ (|x2 – c2|) ...φ (|x2 – ck|)

φ (|xp – c1|) φ (|xp – c2|) ...φ (|xp – ck|)

G=

φ (|c1 – c1|) φ (|c1 – c2|) ...φ (|c1 – c3|)

φ (|c2 – c1|) φ (|c2 – c2|) ...φ (|c2 – ck|)

φ (|cp – c1|) φ (|cp – c2|) ...φ (|cp – ck|)

Go=

Page 15: Redes de Funções de Base Radial Radial Basis Functions (RBFs)cin.ufpe.br/~dss2/Aula-RBFs-sem-fundo.pdf · Uma superfície F no espaço multidimensional é definida como uma combinação

© Germano Vasconcelos

Treinamento por Gradiente

Descendente

ej = dj – F (X)

= dj - Σ wi. φ (||xi – ci||ci)

1. Camada de saida

∂ E(n)/ ∂Wi(n) =Σ ej(n). φ (||xi – ci(n)||ci)

Wi (n+1) = Wi(n) - η1 ∂ E(n)/ ∂Wi(n) i=1,2…,M

Page 16: Redes de Funções de Base Radial Radial Basis Functions (RBFs)cin.ufpe.br/~dss2/Aula-RBFs-sem-fundo.pdf · Uma superfície F no espaço multidimensional é definida como uma combinação

© Germano Vasconcelos

Treinamento por Gradiente

Descendente

2. Centros

∂ E(n)/ ∂Ci(n) = 2 WiΣ ej(n). φ’(||xj – cj(n)||ci) Σ-1 [xj – cj(n)]

Ci (n+1) = Ci(n) - η2 ∂ E(n)/ ∂Ci(n) i=1,2…,M

Page 17: Redes de Funções de Base Radial Radial Basis Functions (RBFs)cin.ufpe.br/~dss2/Aula-RBFs-sem-fundo.pdf · Uma superfície F no espaço multidimensional é definida como uma combinação

© Germano Vasconcelos

Treinamento por Gradiente

Descendente

3. Larguras das funções

∂ E(n)/ ∂ Σ-1 i(n) = -WiΣ ej(n). φ’(||xj – tj(n)||ci) Qji(n)

Qji(n) = [xj – ti(n)] [xj – ti(n)] T

ciΣ-1i (n+1) = Σ-1

i (n) - η3 ∂ E(n)/ ∂ Σ-1i (n) i=1,2…,M

Page 18: Redes de Funções de Base Radial Radial Basis Functions (RBFs)cin.ufpe.br/~dss2/Aula-RBFs-sem-fundo.pdf · Uma superfície F no espaço multidimensional é definida como uma combinação

© Germano Vasconcelos

RBFs Construtivas

• Um conjunto de modelos RBFs tem sido

desenvolvido dentro do paradigma

construtivo...

• DDA (Dynamic Decay Adjustment)

– Berthold & Diamond (1995)

Page 19: Redes de Funções de Base Radial Radial Basis Functions (RBFs)cin.ufpe.br/~dss2/Aula-RBFs-sem-fundo.pdf · Uma superfície F no espaço multidimensional é definida como uma combinação

© Germano Vasconcelos

Princípio de Funcionamento do

Algoritmo DDA

B

Aθ+

θ-

novo padrão

de entrada - classe A

Ver Berthold & Diamond - NIPS’7

Page 20: Redes de Funções de Base Radial Radial Basis Functions (RBFs)cin.ufpe.br/~dss2/Aula-RBFs-sem-fundo.pdf · Uma superfície F no espaço multidimensional é definida como uma combinação

© Germano Vasconcelos

Funcionamento do Algoritmo DDA

Ver Berthold & Diamond - NIPS’7

Page 21: Redes de Funções de Base Radial Radial Basis Functions (RBFs)cin.ufpe.br/~dss2/Aula-RBFs-sem-fundo.pdf · Uma superfície F no espaço multidimensional é definida como uma combinação

© Germano Vasconcelos

Aplicações• Reconhecimento de voz

• Diagnose médica

• Reconhecimento de caracteres

• Detecção de falhas

• Detecção de fraudes

• Reconhecimento de alvos

• Classificação de fonemas

• Análise de crédito

• Previsão e controle

Page 22: Redes de Funções de Base Radial Radial Basis Functions (RBFs)cin.ufpe.br/~dss2/Aula-RBFs-sem-fundo.pdf · Uma superfície F no espaço multidimensional é definida como uma combinação

Superfícies de Decisão em uma

RBF

Page 23: Redes de Funções de Base Radial Radial Basis Functions (RBFs)cin.ufpe.br/~dss2/Aula-RBFs-sem-fundo.pdf · Uma superfície F no espaço multidimensional é definida como uma combinação

© Germano Vasconcelos

Um Problema Potencial com uma RBF

Considere a figura abaixo:

Mostre que é possível para uma RBF

com duas entradas, duas unidades

intermediárias e duas saídas definir

superfícies de decisão como as

mostradas. Uma superfície fechada é

definida para uma das classes; para a

outra classe a superfície é aberta.