retele neuronale - curs 81 retele cu functii de baza radiale (retele rbf) arhitectura si functionare...

Retele neuronale - curs 8 1

Retele cu functii de baza radiale (retele RBF)

• Arhitectura si functionare

• Puterea de reprezentare

• Algoritmi de invatare

Arhitectura si functionareRBF - “Radial Basis Function”:

Arhitectura: – Doua nivele de unitati

functionale– Functii de agregare:

• Unitati ascunse: distanta dintre vectorul de intrare si cel al ponderilor corespunzatoare unitatii ascunse

• Unitati de iesire: suma ponderata

centri ponderi

kk cxCXCXG1

2)(),(

OBS: unitatile ascunse nu au asociat

prag de activare

Functii de activare

Functiile de activare pentru unitatile ascunse au simetrie radiala:

– Unitatile ascunse genereaza un semnal de iesire semnificativ doar pentru vectori de intrare suficient de apropiati de centrii corespunzatori

Functia de activare pentru unitatile de iesire este de regula o functie liniara

centers weights

Functii cu simetrie radiala

Exemple:

-3 -2 -1 1 2 3

)/(1)(

))2/(exp()(

g1 (σ=1)

g2 (σ=1)

g3 (σ=1)

Obs: parametrul σ controleaza largimea graficului

FunctionareCalculul semnalului de iesire:

,1 ,)(

CXgzwzwy

MiwCXgwy

Centers matrix Weight matrix

Vectorii Ck pot fi interpretati ca prototipuri ale datelor de intrare;

- doar vectorii de intrare similari cu vectorul de ponderi asociat unitatii ascunse poate activa unitatea ascunsa corespunzatoare

- pentru un vector de intrare dat, semnalul produs de retea este determinat de catre unitatile ascunse al caror centru este suficient de apropiat de vectorul de intrare

FunctionareFiecare unitate ascunsa este

“sensibila” la semnalele de intrare provenite dintr-o regiune a spatiului de intrare aflata in vecinatatea centrului. Aceasta regiune este denumita camp receptiv

Dimensiunea campului receptiv depinde de σ

2exp)(

-3 -2 -1 1 2 3

σ =1.5

σ =0.5

Functionare• Campurile receptive ale unitatilor

ascunse trebuie sa asigure o “acoperire” a spatiului de intrare

• O buna acoperire a spatiului de intrare asigura o buna capacitate de aproximare

• Valori prea mici sau prea mari ale largimii functiilor radiale conduc la acoperiri inadecvate

-10 -7.5 -5 -2.5 2.5 5 7.5 10

subacoperire supraacoperire

acoperire adecvata

Putere de reprezentareExemple (caz particular) : retea RBF pentru reprezentarea lui XOR• 2 unitati de intrare• 4 unitati ascunse• 1 unitate de iesire

Centrii:

u.a. 1: (0,0)

u.a. 2: (1,0)

u.a. 3: (0,1)

u.a. 4: (1,1)

Ponderi:

Functie de activare:

g(u)=1 if u=0

g(u)=0 if u<>0

Aceasta abordare nu poate fi aplicata pentru probleme generale de aproximare

Putere de reprezentare

Retelele RBF sunt aproximatori universali:

o retea cu N intrari si M iesiri poate aproxima orice functie definita pe RN, cu valori in RM, cu o acuratete care depinde de numarul de unitati ascunse

Suportul teoretic al retelelor RBF este reprezentat de:• Teoria aproximarii• Teoria regularizarii (determinarea atat a functiilor de baza

(nucleu) cat si a parametrilor acestora astfel incat sa fie optimizata eroarea si un termen de regularizare care se refera la proprietati ale functiilor de baza – de exemplu netezime).

AplicabiliteRetelele RBF sunt aplicate pentru clase de probleme similare celor

pentru care sunt aplicate retelele feef-forward cu functii sigmoidale:

• Aproximare

• Clasificare

• Predictie

AntrenareParametri adaptivi:• Centrii (prototipurile) corespunzatoare unitatilor ascunse• Largimile campurilor receptive (parametrii functiilor de activare

cu simetrie radiala)• Ponderile asociate conexiunilor dintre nivelul ascuns si cel de

iesire

Variante de antrenare:• Antrenarea simultana a tuturor parametrilor (similara

algoritmului BackPropagation – doar regulile de ajustare ale centrilor se modifica)– Obs: aceleasi dezavantaje ale algoritmului BackPropagation

• Antrenare separata a parametrilor: – centri, largimi, ponderi

AntrenareAntrenare separata :Set de antrenare: {(x1,d1), …, (xL,dL)}

1. Estimarea centrilor• K=L (nr de centri = nr de exemple),

• Ck=xk (vezi exemplul cu XOR)

• K<L : centri sunt stabiliti prin • selectie aleatoare din setul de antrenare

• selectie sistematica din setul de antrenare (Orthogonal Least Squares - metoda celor mai mici patrate ortogonale)

• utilizand o metoda de grupare

AntrenareOrthogonal Least Squares:

• Selectie incrementala a centrilor astfel incat eroarea sa fie minimizata cat mai mult

• Noul centru este ale astfel incat sa fie ortogonal pe spatiul gnerat de catre centrii selectati (procesul este bazat pe metoda de ortogonalizare Gram-Schmidt)

• Abordarea este corelata cu regresia de tip “ridge”

AntrenareGrupare (clustering):

• Se urmareste identificarea a K clase in setul de date de antrenare {X1,…,XL} astfel incat datele din fiecare clasa sa fie suficient de similare pe cand datele din clase diferite sa fie suficient de diferite

• Fiecare clasa va avea un reprezentant (e.g. media datelor din clasa) care va fi considerat centrul clasei

• Algoritmii pentru determinarea reprezentantilor clasei sunt cunoscuti sub numele de algoritmi partitionali (realizeaza o partitionare a spatiului de intrare)

• Algoritm clasic: K-means

Antrenare

K-means:

• Se porneste de la centri initializati aleator

• Proces iterativ:– Se asigneaza datele la clase

folosind criteriul distantei minime (sau a celui mai apropiat centru)

– Se recalculeaza centrii ca fiind medii ale elementelor asignate fiecarei clase

Antrenare

K-means:

• Ck:=(rand(min,max),…,rand(min,max)), k=1..K

• REPEAT– FOR l:=1,L

Determina k(l) astfel incat d(Xl,Ck(l)) <=d(Xl,Ck) Asigneaza Xl clasei k(l)– Calculeaza Ck: = media elementelor ce au fost asignate clasei kUNTIL “nu s-au mai efectuat modificari ale centrilor”

Obs: • Centrii nu sunt de regula vectori din setul de antrenare • Numarul de clase trebuie cunoscut de la inceput.

Antrenare

Varianta incrementala:

• Se porneste cu un numar mic de centri initializati aleator

• Se parcurge setul de antrenare:

– Daca exista un centru suficient de similar cu data de intrare atunci componentele centrului respectiv se modifica pentru a asigura asimilarea datei de intrare in clasa aferenta centrului.

– Daca data de intrare este diferita de toti centrii atunci este adaugat un nou centru (unitate ascunsa) care este initializat chiar cu data de intrare analizata.

Antrenare

Varianta incrementala:

OR UNTIL

:;1: ELSE

)(: THEN ),( IF

),(),(incat astfel },...,1{* determina

DO L1,:l FOR

REPEAT

..1;..1max),(min,:

CXCCCXd

CXdCXdKk

KkNirandC

klkkkl

Antrenare

Estimarea largimilor campurilor receptive.

Reguli euristice:

CmCCCCdm

CCCCdσ

de centri apropiati mai cei:,...,),,(1

]1,5.0[, deapropiat mai cel centrul),,(

centri dintre maxima distanta ,2

maxmax

Antrenare

Estimarea ponderilor conexiunilor dintre nivelul ascuns si cel de iesire:

• Problema este echivalenta cu cea a antrenarii unei retele cu un singur nivel de unitati functionale liniare

• Variante:– Aplicarea unor instrumente din algebra liniara– Aplicarea algoritmului Widrow-Hoff

Retele RBF vs. retele BPRetele RBF:

• 1 nivel ascuns

• Functii de agregare bazate pe distante (pt. nivelul ascuns)

• Functii de activare cu simetrie radiala (pt. nivelul ascuns)

• Unitati de iesire cu functie liniara

• Antrenare separata a parametrilor adaptivi

• Similare cu tehnicile de aproximare locala

Retele BP:

• Mai multe nivele ascunse

• Functii de agregare bazate pe suma ponderata

• Functii de activare sigmoidale (pt. nivelul ascuns)

• Unitati de iesire liniare sau neliniare

• Antrenare simultana a parametrilor adaptivi

• Similare cu tehnicile de aproximare globala

retele neuronale - curs 81 retele cu functii de baza radiale (retele rbf) arhitectura si functionare...

Documents

hit park al... · 2020. 3. 9. · retele de apa, retele...

reguli de reprezentare în design

plan de prezentare 1. introducere · 3.10.1.retele de...

retele electrice

retele neuronale.docdb414

lab retele

fantasticul Între naraŢie Şi reprezentare

legendă judeȚul sĂlaj reprezentare …

radiale basis-funktionen as1-5

8. modalitĂȚi de reprezentare a

retele calculatoare

retele wifi

pompe cu pistoane radiale

15859 - ts · 2017-11-07 · schema retele calculatore plan...

retele wireless

retele wirless-

protectia liniilor radiale

radiale basis-funktionen

impianti orc con turbina radiale

chip retele