fakulteti i ekonomisË departamenti statistikË dhe ... · “analiza dhe dizenjimi i një sistemi...

Udhëheqës Shkencor:

Prof. Dr. KOZETA SEVRANI

Doktoranti:

BLERINA VIKA

ANALIZA DHE DIZENJIMI

I NJË SISTEMI INTELIGJENT PËR PARASHIKIME

NËPËRMJET RRJETAVE NEURALE

Tiranë, Shtator 2016

PËR MBROJTJEN E GRADËS SHKENCORE

DOKTOR

DISERTACION

UNIVERSITETI I TIRANËS

FAKULTETI I EKONOMISË

DEPARTAMENTI

STATISTIKË DHE INFORMATIKË E ZBATUAR

DISERTACION

Paraqitur nga:

znj. BLERINA VIKA

për mbrojtjen e gradës shkencore

Specialiteti: Sisteme Informacioni në Ekonomi

“DOKTOR ”

TEMA:

Mbrohet më datë __ /__ / 2016, para Komisionit të përbërë nga:

1. ................................................... Kryetar

2. ...................................................Anëtar / oponent

3. ...................................................Anëtar / oponent

4. ................................................... Anëtar

5. ................................................... Anëtar

UNIVERSITETI I TIRANËS FAKULTETI I EKONOMISË

DEPARTAMENTI STATISTIKË DHE INFORMATIKË E ZBATUAR

REPUBLIKA E SHQIPËRISË

ANALIZA DHE DIZENJIMI

I NJË SISTEMI INTELIGJENT PËR PARASHIKIME

NËPËRMJET RRJETAVE NEURALE

“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet

Rrjetave Neurale “

Blerina VIKA

3

Abstrakt

Përgjatë njëzet viteve të fundit është theksuar gjithmonë dhe më shumë përdorimi i

rrjetave neurale (RN), si mjete me vlerë në zgjidhjen e problemave të ndryshëm për

parashikim. Suksesi i një rrjetit neural për parashikim lidhet ngushtë me gjetjen e strukturës

së duhur të rrjetit. Tipi i strukturës së një rrjeti neural përcaktohet nga numri i njësive bazë në

rrjet si dhe lidhjet që vendosen midis njësive brenda rrjetit. Parashikimi me anë të RN

ndryshon nga metodat tradicionale të përdorura për parashikim. Pavarësisht se mbështeten në

disa parime thelbësore të përgjithshme, aplikimi i tyre praktikisht nuk arrin të standartizohet

në një metodologji të plotë. Në këtë punim, fokusi kryesorë është në analizën dhe dizenjimin

e një sistemi inteligjent për parashikim, i cili gjeneron në mënyrë automatike strukturën e

përshtatshme të rrjetit neural bazuar në të dhënat reale të problemit për parashikim.

Përmbledhja e studimit është përshkruar në kapitullin e parë. Në të trajtohen argumenta të

ndryshëm si dhe evidentohen elementët të cilët janë të domosdoshëm për të kuptuar qëllimin

dhe objektivat e këtij punimi kërkimor shkencor. Përcaktimi i problemit, qëllimi dhe zgjidhjet

e mundshme janë paraqitur në këtë pjesë të punimit.

Në këtë disertacion adresohen dhe trajtohen në mënyrë të detajuar çështje të ndryshme që

lidhen me modelimin e automatizuar të strukturës së rrjeti neural për parashikimin e serive

kohore. Një pjesë e kësaj teze bën një vështrim të përgjithshëm për plotësimin e bazës teorike

në lidhje me mënyrat dhe format e përdorimit të rrjetit neural në parashikim. Ky hulumtim

mbështetet dhe analizon gjithashtu rezultatet empirike të trajtuara në literaturën e gjerë.

Në pjesën e dytë ilusturojmë efektivitetin e analizës së kryer përgjatë literaturës, duke e

mbështetur atë me rezultatet e nxjerra në analizë empirike. Krahasimi i metodave të

ndryshme ofron rezultate të krahasueshme si dhe shpesh nxjerrin që RN i tejkalon modelet

tradicionale.

Pjesa e tretë përshkruan analizën dhe dizenjimin që i bëhet sistemit inteligjent për parashikim.

Gjithashtu në këtë pjesë të disertacionit ilustrohen metodat dhe strategjitë e nevojshme për të

ndërtuar rrjetin neural parashikues. Në fund paraqiten përfundimet dhe konkluzionet në lidhje

me qëllimet dhe objektivat e këtij studimi duke theksuar kontributin e tij në literaturë. Pjesë

plotësuese është përfshirja e shënimeve dhe sugjerimeve për punën në të ardhmen.

Fjalë Kyçe: Rrjeta Neurale SHS, Parashikimi i Serive Kohore, Algoritëm trajnimi, matje

performance, dizenjim sistemi inteligjent

4

Familjes time .....



Blerina VIKA

5

Mirënjohje

Është mëse natyrale që ndjesitë dhe emocionet është e vështirë të shkruhen, e megjithatë

tanimë, në kryerjen e këtij studimi mendoj se është e nevojshme të shprehem në pak rreshta.

Përgjatë gjithë këtij rrugëtimi , relativisht të gjatë, ndihem mirënjohëse ndaj atyre të cilëve ia

kushtoj këtë punim, familjes time, të cilët më kanë ndihmuar e qëndruar pranë me dashuri

dhe frymëzim. Ky përkushtim i tyre me ka bërë të ndihem e privilegjuar dhe me fat.

Si fillimi, dëshiroj të shpreh mirënjohjen më të thellë për udhëheqësen time, prof. Kozetën, që

me dashamirësinë e saj, ka arritur të më jap mbështjeje të vazhdueshme përgjatë punës sime

shkencore e profesionale. Faleminderit për durimin, motivimin, pozitivitetin, energjinë dhe

gatishmërinë, si dhe përpjekjen e palodhur për të ngritur më lart kërkimin shkencor në

departamentin tonë!

Gjithashtu, me një falenderim të sinqert dua të përmend prof. Dhimitrin i cili me diskutimet

e gjata dhe të shpeshta ka qenë përherë i gatshëm, dhe me komentet e tij, puna ime kërkimore

të zgjerohej në këndvështrime të ndryshme. Nuk mund të mos përmend kolegët e

departamentit që me diskutimet, vlerësimet dhe sugjerimet e tyre kanë kontribuar në

përmirësimin e vazhdueshëm si dhe kanë qenë nxitje për rritjen e cilësisë përgjatë punës sime

kërkimore.

Ju falenderoj pa fund të gjithëve!



Blerina VIKA

6

Pasqyra e Disertacionit

KAPITULLI 1 ...................................................................................................................... 12

1 PËRMBLEDHJE E STUDIMIT .................................................................................. 12

1.1 Hyrje ...................................................................................................................................... 12

1.2 Qëllimi ................................................................................................................................... 14

1.3 Objektivat e studimit ............................................................................................................ 15

1.3.1 Objektivat: ..................................................................................................................... 16

1.3.2 Hipotezat e disertacionit: .............................................................................................. 16

1.4 Organizimi i Disertacionit ...................................................................................................... 17

KAPITULLI 2 ...................................................................................................................... 20

2 METODOLOGJIA ........................................................................................................ 20

2.1 Hyrje ...................................................................................................................................... 20

2.2 Ndërtimi teorik ...................................................................................................................... 23

2.2.1 Studimi i Literaturës ...................................................................................................... 23

2.2.2 Analizë empirike e prototipave ..................................................................................... 24

2.3 Modelimi i Sistemit Inteligjent .............................................................................................. 25

KAPITULLI 3 ...................................................................................................................... 27

3 RRJETAT NEURALE ARTIFICIALE ........................................................................ 27

3.1 Rrjetat neural biologjike kundrejt artificiale ......................................................................... 27

3.2 Struktura e rrjetit neural ....................................................................................................... 30

3.2.1 Perceptroni ................................................................................................................... 30

3.2.2 Funksionet e aktivizimit ................................................................................................ 32

3.2.3 Topologjitë e rrjetit neural ............................................................................................ 36

3.2.4 Procesi i të mësuarit për RNA ...................................................................................... 39

KAPITULLI 4 ...................................................................................................................... 41

4 PARASHIKIMI NËPËRMJET RRJETAVE NEURALE ......................................... 41

4.1 Hyrje ...................................................................................................................................... 41

4.2 Parashikimi i serive kohore në këndvështrimin ekonomik ................................................... 42

4.3 Rrjetat neurale si mjete parashikimi ..................................................................................... 46

4.4 Hapat e parashikimit me anë të RN-l .................................................................................... 48



Blerina VIKA

7

4.4.1 Parapërgatitja e të Dhënave për Parashikim ................................................................ 50

4.4.2 Ndërtimi i RN-l për parashikim ..................................................................................... 55

4.4.3 Procedurat e trajnimit të RN-l ....................................................................................... 61

4.4.4 Ndërtimi i modelit parashikues ..................................................................................... 68

4.5 Të metat e RNA-le si modele parashikuese ......................................................................... 69

KAPITULLI 5 ...................................................................................................................... 71

5 VLERËSIMI I RRJETIT NEURAL PARASHIKUES (raste studimi) .................. 71

5.1 Hyrje ...................................................................................................................................... 71

I. Përdorimi i rrjetave neurale për parashikimin e Kursit të këmbimit .................................... 72

5.1.1 Përshkrimi i problemit .................................................................................................. 72

5.1.2 Të dhënat për metodologjitë Konkurruese ................................................................... 73

5.1.3 Modelimi i Rrjetit Neural për parashikimin kursit të këmbimit .................................... 74

5.1.4 Implementimi rrjetit neural parashikues për kursin USD/EUR ..................................... 80

5.1.5 Modeli ARIMA ............................................................................................................... 82

5.1.6 Krahasim i aftësisë parashikuese të modeleve ............................................................. 84

5.1.7 Vërejtje përfundimtare ................................................................................................. 86

KAPITULLI 6 ....................................................................................................................... 88

6 ANALIZA DHE DIZENJIMI I RRJETIT NEURAL PARASHIKUES PËR

KURSIN E KËMBIMIT ....................................................................................................... 88

6.1 Hyrje ...................................................................................................................................... 88

6.2 Qëllimi i softuerit .................................................................................................................. 89

6.3 Organizimi i zhvillimit të sistemit inteligjent ......................................................................... 89

6.4 Specifikimi dhe analiza e problemit ...................................................................................... 91

6.5 Dizenjimi i sistemit ................................................................................................................ 98

6.6 Sigurimi i cilësisë për SIP ..................................................................................................... 101

6.7 Paralelizimi i SIP .................................................................................................................. 103

KAPITULLI 7 ..................................................................................................................... 105

7 KONKLUZIONE, DISKUTIME DHE REKOMANDIME.................................. 105

7.1 Konkluzione ......................................................................................................................... 105

7.2 Rekomandime të studimit................................................................................................... 113

…………………………………………………………………………………………………………………………………………………………….

8 REFERENCAT ............................................................................................................. 115



Blerina VIKA

8

…………………………………………………………………………………………………………………………………………………………….

Shtojca A .............................................................................................................................. 121

9 Kodi Burim për Parashikimin e Kursit të Këmbimit .......................................... 121



Blerina VIKA

9

Lista e figurave

Figure 2-1. Modeli që tregon se eksperimentet shërbejnë si drejtues të kërkimit konstruktiv të

modelit (Bang, A. L., et al., 2012). ........................................................................................... 22

Figure 2-2:Një qasje metodologjike për ndërtimin e një Artifakti për Sistemin Inteligjent

Parashikues (Përshtatur nga: Nunamaker, W., Chen, M., dhe Purdin, T., 1991, f.

përshtatur):) ............................................................................................................................. 24

Figure 3-1:Neuroni Biologjik (AnkushKhere dhe MayurPatankar, 2012) .............................. 27

Figure 3-2: Paraqitja e përgjithshme e punës së neuronit (Modeli McCulloch-Pitts) ............ 31

Figure 3-3: Struktura të ndryshme të rrjetit neural artificial .................................................. 36

Figure 4-1: Struktura e një rrjeti SHS ..................................................................................... 56

Figure 4-2:Paraqitja e rrjetit SHS me tre-shtresa ................................................................... 64

Figura 5-1: Paraqitja grafike e kursit mujor USD/EUR për periudhën janar 1994-dhjetor

2014.......................................................................................................................................... 74

Figure 5-2: Dizenjimi i rrjetit neural parashikimit për kursin e këmbimit USD/EUR ........... 79

Figure 5-3: Parashikimi jashtë-periudhe i kursit USD/EUR për 12-muaj .............................. 85

Figure 6-1: Cikli jetësore i ndërtimit të SIP ............................................................................ 90

Figure 6-2: Modulet e sistemit inteligjent për parashikim ...................................................... 92

Figure 6-3: Fazat e specifikimit të kërkesave për SIP ............................................................. 92

Figure 6-4: Modelimi i rrjedhjes së inforamcionit në sistem ................................................ 100



Blerina VIKA

10

Lista e tabelave

Tabela 3-1: Funksionet e Aktivizimit për Neuronin ................................................................ 33

Tabela 3-2: Funksionet e aktivizimit, a) Threshold, b)Linearitet i pjesshëm, c)Sigmoid,

d)Gaussian ............................................................................................................................... 34

Tabela 5-1: Performanca statistikore e rrjetit NAR për kursin USD/EUR ............................ 81

Tabela 5-2: Testet Unit Root mbi kursine e këmbimit USD/EUR ........................................... 83

Tabela 5-3: Vlerësimi i parashikimeve të kursit USD/EUR ................................................... 86

Lista e algoritmeve

Algoritmi 4-1: Bllok-skema e procesit të përgjithshëm për parashikim ................................. 44

Algoritmi 4-2: Hapat e ndërtimit të RN parashikues .............................................................. 49

Algoritmi 4-3: Algoritmi PP që përdorë zvogëlimin e gradientit ........................................... 66

Algoritmi 5-1: Algoritmi për zgjedhje e rrjetit më të mirë për një strukturë të caktuar ......... 80

Algoritmi 6-1: Hapat e përllogaritjeve të kryera nga rrjeti SHS .......................................... 104



Blerina VIKA

11

Lista e shkurtimeve dhe akronimeve

RNA Rrjeti neural artificial

RN Rrjeti neural

SHS Shumë shtresore

FD Furnizim në një drejtim

PM Propagandim mbrapa

ARJ Auto regresiv jo-linear

IA Inteligjenca Artificiale

LM Levenberg-Marquardt

GN Gauss-Njuton

SIP Sistemi Inteligjent Parashikues

RR Rrjeti Rekurent



Blerina VIKA

12

Kapitulli 1

1 PËRMBLEDHJE E STUDIMIT

1.1 Hyrje

Një pjesë e konsiderueshme e veprimtarisë njerëzore ndikohet dhe drejtohet nga

parashikimet e të ardhmes. Parashikimi përdoret në një numër të gjerë fushash të cilat

mbështesin vendimmarrjet e tyre mbi pritshmërinë apo vlerësimet që ato kanë për të

ardhmen, ku mund të përmendim në ndryshimet klimaterike, hidrologji, teknologji, ekonomi,

politikë etj. Parashikimet luajnë një rol thelbësor në marrjen e vendimeve. Në të shumtën e

rasteve parashikimi shihet si një pjesë integrale për aktivitetet e vendimmarrjes duke sjellë

sukses ose dështim në aspektin politik, shoqëror si dhe ekonomik. Vendimmarrjet mund të

jenë që nga ato operacionale ditore deri në vendime strategjike afatgjate organizative apo

ekonomike (Zhang G. P., 2004).

Shumë kërkime dhe studime janë zhvilluar për të përmirësuar aftësitë parashikuese si dhe

procesin e vendimmarrjes. Pjesa më e madhe e metodologjive të përdorura në to bazohen në

teknika statistikore tradicionale. Metodologjitë parashikuese përkufizohen shpesh si një

koleksion metodash dhe mjetesh për mbledhjen e të dhënave për serinë/të kohore, të cilat do

të përdoren për të parashikuar vlerat e ardhshme të serisë, mbi bazën e vlerave të së shkuarës

(Palit A. K. dhe Popovic D., 2005). Përpjekjet të shumta bëhen për të modeluar sisteme

parashikimi sa më të sakta. Në dy dekadat e fundit ka marrë hov të madh zhvillimi i një

metode tepër sfiduese që njihen si rrjeti neural.

Rrjeti neural është një metodë e inteligjencës artificiale që përdoret për të modeluar funksione

komplekse. Kohët e fundit, në një numër të gjerë punimesh, rrjetat neurale janë përdorur në

fushën e parashikimit të serive kohore financiare duke rritur rëndësinë e këtyre modeleve



Blerina VIKA

13

inteligjente në këtë fushë. RN-le analizohen si mjete të fuqishëm për kërkuesit dhe kjo lidhet

me tiparet që kjo metodologji zotëron. Disa veçori që i bëjnë këto modele të krahasueshme

me ato ekzistuese janë që: (1) RN-le janë në gjendje të nxjerrin apo prodhojnë rregulla

nëpërmjet procesit të trajnimit nga shembuj, pa përdorur supozime fillestare (ChangI. Ch.,

Hwang H. G., 1998); (2) Ato kanë aftësi të mëdha për të zbuluar dhe riprodhuar lidhjet

lineare dhe jo-lineare midis të dhënave që i ofrohen (Gonzaley, 2007); (3) Rrjetat neurale

klasifikohen si modele jo-lineare duke bërë të mundur të arrihet në një shpjegim më të mirë

për të dhënat në krahasim me modelet lineare tradicionale (Basheer I.A. dhe Hajmeer M,,

2000); (4) Duke qenë se këto modele janë të pandjeshme ndaj zhurmave atëherë ato ofrojnë

parashikime të sakta kur të dhënat janë jo të sigurta apo kanë gabime në matje (Basheer I.A.

dhe Hajmeer M,, 2000); (5) Rrjeti neural artificial është përgjithësues. Ai mund të mësoj nga

shembujt duke shfaqur aftësi përgjithësuese të cilat shkojnë përtej të dhënave të përdorura për

trajnimin e tyre (Yao, 2002).

Disa tipare që ndikojnë në saktësinë e parashikimit të RN-l janë arkitektura e rrjetit neural,

shkalla e të mësuarit, algoritmi i trajnimit, tipi i funksioneve të aktivizimit etj. Megjithatë

duhet theksuar se metodologjia dhe teknikat e modelimit të rrjetave neurale ndryshojnë

shpesh ndërsa teknikat e modelimit statistikor janë të qëndrueshme dhe të zhvilluara mirë.

Nuk ka metodologji të saktë për ndërtimi dhe përzgjedhjen e arkitekturës së rrjetit neural të

përshtatshëm për një fushë të caktuar. Proceset aktuale të modelimit në një numër të madh

punimesh janë me bazë empirike.

Parashikimi me anë të RN-le edhe pse mbështeten në disa parime thelbësore të përgjithshme,

realizimi i tyre praktikisht nuk arrin të standardizohet në një metodologji të plotë. Për këtë

arsye lind si nevojë zhvillimin i modeleve të qëndrueshëm të cilët nuk janë specifik për një

treg apo për një periudhë kohe. Aktualisht informacioni apo eksperienca për ndërtimin e një

modeli të mirë parashikues nëpërmjet rrjetit neural nuk është i mjaftueshëm. Burimi për këtë

pengesë shpesh bëhen mungesa e modeleve industriale, si dhe mos publikimi i punimeve

akademike të dështuar. Aktualisht një problem tjetër është se punime që klasifikohen si të

suksesshme nuk publikohen qëllimisht dhe kjo për arsye vetjake përfituese. Aktualisht lind

nevoja për të ndërtuar një sistem të automatizuar që të bëjë ndërtimin e modeleve për rrjetin

neural (Yao, 2002).

Këto janë disa arsye që motivuan për të zhvilluar një punim në nivel doktorate që

kryen studimin e ciklit jetësorë që duhet ndjekur për të ndërtuar një sistem të automatizuar

për parashikimin e serive kohore. Ky studim përpiqet të trajtojë në mënyrë të detajuar se cilët

janë faktorët kryesorë që duhet të studiohen dhe përdoren për të rritur cilësinë e sistemit

parashikuesi. Kuptohet që peshën më të madhe në këtë punim e zë mënyra se si ndërtohen

dhe mësohen rrjetat neurale. Duke qenë se për rrjetat neurale nuk ekziston ndonjë



Blerina VIKA

14

metodologji solide, element bazë për realizimin e këtij studimi është kryesisht literatura e

gjerë në dispozicion.

Në shumë punime të ndryshme të literaturës ndeshen të dhëna kontradiktore të

rezultateve, gjë e cila vështirëson nxjerrjen dhe eksplorimin e faktorëve kryesore për

modelimin e sistemit si dhe kërkesave që duhet të përmbush ky sistem. Për këtë arsye pjesë e

studimit janë dhe analiza empirike të cilat përdoren për të plotësuar këto pengesa.

Në këtë tezë synojmë të analizojmë dhe modelojmë një mënyrë të automatizuar për

ndërtimin e një sistemi inteligjent parashikues që përdor rrjetin neural. Sistemi duhet të

përdor seri kohore e luhatshme me një-ndryshore. Synim i këtij punimi është të kontribuojë

në përmirësimin e punës kërkimore të zhvillimit dhe aplikimit të rrjetave neurale si mjete të

dobishme për parashikim. Në përfundim, përpiqet të vë në dispozicion një model të

përgjithshëm për të ndihmuar zhvillues të ndryshëm të zhvillojnë zgjidhje më lehtë dhe

shpejtë nëpërmjet testimit të formave të ndryshme të përpunimit të të dhënave, strukturave të

ndryshme të rrjetit dhe algoritme të ndryshme trajnimi. Nëpërmjet realizimit të një ndarjeje të

sistemit në disa module më të vogla, mundësohet ripërdorimi i pjesëve të sistemit dhe në

aplikacionet të tjerat.

Ky studim është një vlerë e shtuar për disa fusha të rëndësishme si shkenca

kompjuterike, Ekonomike dhe çdo fushë tjetër e cila kërkon të kryej parashikime mbi të

dhëna kohore. Studimet empirike të realizuar nga institucione të rëndësishme të ndryshme në

Shqipëri përdorin gjerësisht metoda ekonometrie lineare dhe shumë rrallë regresione jo-

lineare apo rrjeta neurale. Në numrin e paktë të punime që përdorin rrjetin neural, si modele

parashikuese, vuajnë nga dobësi të ndërtimit të rrjetit.

1.2 Qëllimi

Qëllimi i kryesorë i këtij disertacioni është të analizojë dhe modelojë një sistemi

inteligjent parashikues nëpërmjet përdorimit të rrjetave neurale. Ky qëllim është arritur

nëpërmjet studimit të literaturës bashkëkohore për të kuptuar mënyrën e përdorimit të rrjetave

neurale me qëllim parashikues si dhe faktorëve bazë që ndikojnë në performancën e rrjetit:

cilësinë, saktësinë dhe shpejtësinë e parashikimit. Gjithashtu janë marrë në konsideratë dhe

mënyra se si zhvillues të ndryshëm të rrjetave neurale shmangin probleme specifike të

ndryshme që lidhen modelimin e rrjetave neurale.



Blerina VIKA

15

Në këtë studim bëhet një analizë në lidhje me mënyrën e saktë dhe efektive se si duhet

të realizohet inxhinierimi për ndërtimin më të mirë të arkitekturës së rrjetit neural artificial

për parashikimet që bazohet në seri kohore të luhatshme me një-ndryshore. Përcaktimi i

metodës së përshtatshme për përpunimin e të dhënave përshkruese të modelit është pjesë e

integruar e sistemit inteligjent. Ndërsa një pjesë tjetër e përbërëse e rëndësishme e sistemit

është përzgjedhja e algoritmit të trajnimit që rrit performancën parashikuese të rrjetit neural.

Vlerësimi i përformancës së rrjetit neural në lidhje me aftësitë parashikuese të tij realizohet

nëpërmjet tregueseve të ndryshëm statistikorë.

Pjesë e rëndësishme e punimit do të jetë një inxhinierim për gjithë ciklin jetësorë të

sistemit inteligjent parashikues. Në këtë pjesë të punimit përcaktohen se cilat mjete të

disiplinës së inxhinierimit të softuerëve janë të përshtatshëm për t‟u përdorur si dhe cilat janë

mjetet specifike që duhet të përfshihen për të përshkruar më mirë tiparet e veçanta të rrjetit

neural. Përveç përcaktimit të këtyre mjeteve është dhënë një mënyrë për aplikimin e tyre.

Janë zhvilluar disa shembuj të rrjetave neural të cilat paraqesin mënyrën e përdorimit të

inxhinierimit të sistemit inteligjent parashikues. Sistemi inteligjent parashikues i analizuar

dhe modeluar merr në konsideratë jo vetëm performancën parashikues të tij por dhe efiçencën

kohore. Evidentohet përdorimi i paralelizimit të përpunimit të detyrave specifike të sistemit të

cilat janë të pavarura nga njëra-tjetra.

1.3 Objektivat e studimit

Qëllimi i këtij studimi është specifikimi, dizenjimi dhe zhvillimi i një sistemi inteligjent

parashikues, i cili mund të ndërtojë automatikisht një model parashikues bazuar në të dhënat

kohore të luhatshme me një-ndryshore, që atij i paraqiten. Realizimi i këtij sistemi kërkon që

fillimisht të realizohet eksplorimi dhe përcaktimi i parametrave apo faktorëve të rrjetit neural

që sigurojnë aftësi parashikuese më të mira.

Për përcaktimin e këtyre faktorëve do të studiohen llojet e ndryshme për përpunimin e të

dhënave dhe strukturave të ndryshme të rrjetave neural artificiale si dhe variacionet e

rregullave që lidhen me të mësuarin. Nëpërmjet studimit të këtyre faktorëve detajohen dhe

ekzaminohen efektet që ato kanë mbi modelimin dhe parashikimin e të dhënave kohore jo-

lineare. Ky disertacion ka këto objektiva kryesore të përgjithshme:



Blerina VIKA

16

1.3.1 Objektivat:

1. Të paraqes konceptet kryesore në përdorimet ekzistuese të modelimit të rrjetave

neurale për parashikim e bazuar mbi literaturën e studiuar. Krahasimi i përqasjeve të

ndryshme për aplikimin e rrjetave neurale në problemet parashikuese. Evidentimi i

elementëve kryesorë që lidhen me strukturën e RN si kërkesat mbi përpunimin e të

dhënat kohore, metodat e trajnimit dhe tiparet e ndryshme operacionale të tyre.

2. Përcaktimi dhe diskutimi i efekteve që kanë faktorët kryesorë të ndërtimit të rrjetit

neural në aftësitë parashikuese të tij bazuar në literaturën e deritanishme:

a. Përzgjedhja e përpunimit për të dhënat që i paraqiten rrjetit neural

b. Përcaktimi i strukturës së rrjetit neural, njësive bazë dhe lidhjeve midis tyre.

c. Algoritmet e trajnimit të rrjetit neurale që përcakton se si duhet të mësojë RN-l

nga shembujt.

3. Analizimi, modelimi dhe implementimi i një rasti konkret i përdorimit të rrjetit neural

parashikues si dhe krahasimi i performancës së tij me rezultatet e metodave

statistikore.

4. Analizimi dhe modelimi i sistemit inteligjent parashikues që automatizon:

përzgjedhjen e përpunimit për të dhënat, përzgjedhjen e strukturës së rrjetit neural si

dhe algoritmin e trajnimit që do të përdoret nga sistemi. Realizimi i kësaj analize dhe

modelimi bëhet duke përshtatur mjetet dhe metodat të disiplinës së inxhinierimit të

softuerëve me tiparet specifike të RN-l.

5. Dizenjimi i sistemit përfshinë fazat që nga përgatitja paraprake e të dhënave deri tek

testimi i rrjetit neural.

6. Aplikimi i teknikave të avancuara për modelimin e sistemit inteligjent parashikues si:

ndarja në module të veçanta të sistemit, paralelizimi i përpunimit të detyrave të

sistemit si dhe përcaktimi i metrika të matjes së performancës.

1.3.2 Hipotezat e disertacionit:

Natyra kërkimore për këtë disertacioni bënë pjesë në punët kërkimore të tipit „hulumtim i

modelimit konstruktiv‟ ose më qartë kërkim nëpërmjet modelimit (Bang, A. L., Krough, P.,

Ludvigsen, M., & Markussen, T., 2012). Specifike, për këtë lloj natyre kërkimore, është



Blerina VIKA

17

realizimi i integrimit të punës kërkimore me praktikat e modelimit. Modelimi ka të bëjë me

orientimin e të ardhmes ndërsa puna kërkimore lidhet me të shkuarën dhe të tashme.

Nuk është e lehtë të mund të realizohet lidhja ndërmjet punës kërkimore dhe modelimit.

Ngritja e hipotezave të mëposhtme janë ndërtuar duke u mbështetur në këtë metodologji. Në

këtë përqasje hipotezat duhet të drejtojnë procesin e dizenjimit të sistemit.

H1. Çdo lloj strukture e rrjetin neural për parashikimin e serive kohore me një-

ndryshore mund të tejkaloj metodat tradicionale statistikore.

H2. Ndërmjet faktorëve që ndikojnë në performancën e rrjetit neural parashikues nuk

ka ndërveprim dhe tiparet e tyre mund të përcaktohen në mënyrë të pavarur.

H3. Automatizimi i përzgjedhjes së strukturës së rrjetit neural përmirëson aftësitë

parashikuese të sistemit inteligjent për kursin e këmbimit kundrejt metoda

tradicionaleve.

H4. Për analizën dhe modelimin e sistemit inteligjent parashikues (SIP) nëpërmjet

rrjetit neural, mund të përdoren mjetet dhe metodat standarde ekzistuese të

disiplinës së inxhinierimit të softuerëve.

H5. Procesimi i përllogaritjeve që kryhen nga SIP mund të paralelizohen.

1.4 Organizimi i Disertacionit

Për të arritur qëllimin dhe objektivat e vendosura është ndjekur organizimi i mëposhtëm për

këtë disertacion:

Kapitulli i parë: Paraqet një përmbledhje të fushës së studimit. Si fillimi bëhet përshkrimi i

sfondit të problemit duke u ndjekur nga formulimi i qëllimit të disertacionit dhe përcaktimi i

objektivave të tij. Objektivat përshkruajnë fazat kryesore që duhet të jenë pjesë e studimit për

të arritur qëllimin kryesore të tij. Pjesë tjetër e këtij kapitulli është përcaktimi i hipotezave që

drejtojnë procesin e dizenjimit të sistemit.

Kapitulli i dytë: Në të trajtohet në mënyrë të detajuar metodologjia e zgjedhur për të zhvilluar

këtë disertacion. Ky kapitull evidenton elementët dhe tiparet kryesore që e karakterizojnë

këtë punim. Nëpërmjet një analize dhe shtrimit të argumenteve tregohet se pse është

përzgjedhur metodologjia përkatëse.



Blerina VIKA

18

Kapitulli i tretë: Qëllimi i këtij kapitulli është që të jap një kuptim fillestar për RNA duke

evidentuar tiparet e abstraguara nga modeli biologjik si dhe ti përgjigjet pyetjeve se pse dhe

kur janë të nevojshme këto mjete përllogaritëse. Nëpërmjet shqyrtimit të literaturës realizohet

krahasimi dhe evidentimi i ndryshimeve që ekzistojnë ndërmjet programeve kompjuterike

tradicionale dhe rrjetave neurale si mjete përllogaritëse. Më pas vazhdohet me diskutimin e

çështjeve kryesore që lidhen me zhvillimin e modeleve RNA-l si p.sh struktura e rrjetit,

funksionet e aktivizimit të perceptronit (njësisë bazë të RN-l), proceset e ndryshme për të

mësuar rrjetin neural, mënyrat e trajnimit të rrjetit dhe kritereve të ndryshme të vlerësimit të

rrjetit.

Kapitulli i katërt: Nëpërmjet studimit të literaturës bëhet një analizë e detajuar e përdorimit të

rrjetave në parashikim duke evidentuar avantazhet dhe dizavantazhet kryesore të përdorimit

të tyre krahasuar me metodat tradicionale statistikore. Baza teorike për RNA-le parashikuese

dhe elementët përbërës të modelimit të tyre përdoren për të shpjeguar hapat e përgjithshëm që

duhen ndjekur për të modeluar një rrjet neural për parashikim. Për çdo hap të modelimit të

rrjetit ofrohen qasjet e ndryshme të sugjeruara në punime të ndryshme shkencore. Kjo analizë

e kryer në këtë kapitull përdoret si bazë për specifikimin e kërkesave që duhet të ketë sistemi

inteligjentë parashikues si dhe për të argumentuar disa prej hipotezave të ngritura në këtë

disertacion.

Kapitulli i pestë: Ky kapitull paraqet një rast studimi konkret të parashikimit të kursit të

këmbimit USD/EUR. Për të ndërtuar rrjetin neural parashikues të përshtatshëm për kursin e

këmbimit ndiqen hapat kryesorë që janë përshkruar në kapitullin e katërt. Në vazhdim të këtij

kapitulli bëhet një analizë dhe diskutimi mbi rezultatet e përftuara nga rrjeti neural krahasuar

me modelin ARIMA dhe atë të ecjes së rastësishme duke përdorur kritere të ndryshme

vlerësimesh.

Kapitulli i gjashtë: Duke ndjekur procesin e inxhinierimit të softuerëve bëhet analiza dhe

dizenjimi i sistemit inteligjent parashikues për një seri kohore me një-ndryshore për një-hap-

përpara jashtë periudhe. Në këtë pjesë evidentohen tiparet të cilat ndikojnë në procesin e

inxhinierimit të zgjedhur për zhvillimin e sistemit. Sistemit i propozuar është organizuar në

module dhe për secilin modul janë bërë specifikimi i kërkesave dhe dizenjimi i tyre. Çështje e

rëndësishme në këtë pjesë është trajtimi i elementëve të sigurisë që duhen vlerësuar përgjatë

ndërtimit të sistemit inteligjent parashikues duke ofruar kështu rezultate më të qëndrueshme

dhe më cilësore. Së fundi trajtohen teknikat e paralelizimit, përdorimi i tyre në ndërtimin e

këtij sistemi tentojnë të përmirësojnë problematikën që lidhet me kohën e gjatë të trajnimit të

rrjetit neural.



Blerina VIKA

19

Kapitulli i shtatë: Paraqet përmbledhjet dhe përfundimet e këtij punimi në lidhje me

objektivat e vendosura në fillim. Në vazhdim, për çdo hipotezë të ngritur bëhet argumentimi i

vlefshmërisë ose jo të tyre. Gjithashtu në të evidentohen problemet dhe kufizimet të hasura

përgjatë punimit duke dhënë rekomandimet për punën kërkimore në të ardhmen që do të

ndihmonin në shmangien e tyre si dhe në implementimin dhe testimin e sistemit inteligjent

parashikues.



Blerina VIKA

20

Kapitulli 2

2 METODOLOGJIA

2.1 Hyrje

Përzgjedhja e metodologjisë së duhur që përshtatet me problemin e trajtuar nga ky punim

është shumë e rëndësishme. Ky punim, ashtu siç është përshkruar në kapitullin e mësipërm,

ka si qëllim të analizojë dhe modelojë një sistem inteligjent për parashikimi e serive kohore.

Modelimi i sistemeve që përdorin teknika të fushës së Inteligjencës Artificiale është i vështirë

dhe kërkon një mënyrë të veçantë trajtimi që ndryshon nga dizenjimi i sistemeve tradicionale.

Teknikat e fushës së IA kanë si veçori të tyre eksplorimin e njohurive, identifikimin të teorive

ekzistuese që shpesh janë dhe kundërshtuese (Hall, P. R. & Kibler, F. D., 1985). Rrjetat

neurale, si një pjesë e fushë së IA, i trashëgojnë këto problematika.

Për trajtimin e këtij punimi është zgjedhur një metodologji e re dhe shumë premtuese që

njihet si kërkimi konstruktiv i modelimit (Koskinen I., Zimmerman J. et al, 2011) që është një

përmirësim i kërkimit përmes modelimit (Bang, A. L., et al., 2012).

“ Kërkimi Konstruktiv i Modelimit është një kërkim në të cilin „konstruksioni - qoftë ai një

produkt, sistem apo media –„ është boshti kryesorë dhe luan rolin bazë në ndërtimin e

njohurive” (Koskinen I., Zimmerman J. et al, 2011).

Kjo mënyrë e përqasjes së kërkimit fillohet me formulimin e një pyetjeje kërkimore ose

hipoteze mbi një teori apo filozofi ekzistuese e cila më pas hetohet nëpërmjet një procesi

„provo dhe modelo‟. Kjo metodologji, e përshtatshme për fusha të ndryshme kërkimore,

mbështetet në tre elemente kryesore të ndryshme: (i) Eksperimentet, (ii) Fushat e studimit dhe

(iii) ekspozimi. Veprimet që duhet të ndiqen përgjatë metodologjisë së kërkimit konstruktiv

të modelimit ndahen në atë kërkimore dhe modeluese. Puna kërkimore përdoret për të

kuptuar të kaluarën dhe të tashmen ndërsa modelimi kërkon të pasqyroj të ardhmen. Puna

kërkimore është një përmbledhje e rezultateve të nxjerrja nga eksperimentet dhe studimi i

fushave të interesit. Ndërsa modelimi ka të bëjë me zgjidhjen praktike të problemit duke

përdorur bazën teorike të punës kërkimore. Por vështirësia më madhe, siç përmendet dhe në



Blerina VIKA

21

punimin e Bang (2012), është përcaktimi i lidhjes më të mirë që mund të realizohet midis

kërkimit dhe modelimit.

Procesi i kërkimit përfshinë komponentët e mëposhtëm (Beverly, 2016):

1. Përzgjedhja e problemit të përshtatshëm praktik që është i fokusuar në probleme të

botës real.

2. Të kuptuarit qartë dhe plotësisht i fushës/ave të problemit real.

3. Dizenjimi i një apo më shumë zgjidhjeve të mundshme për problemin.

4. Demonstrimi i ekzistencës së mundësisë së zgjidhjes për problemin.

5. Lidhja e rezultateve me teorinë dhe tregimi i kontributit të tyre në praktikë.

6. Shqyrtimi i përgjithësimit të rezultateve.

Në punën e tyre Zimmerman dhe Forlizzi (2008) trajtojnë dy qasje kryesore të kërkimit të

cilat i emërtojnë si filozofike dhe mjedisore të cilat janë të nevojshme të kryhen në rastin e

probleme të cilat përdorin teknika inteligjente. Në qasjen filozofike fillohet duke formuluar

një pyetjeje kërkimore ose hipotezë bazuar në filozofi apo teori ekzistuese dhe pasohet me

hulumtimin e saj nëpërmjet një procesit të krijimit dhe modelimit të artifakteve.

Një qasje mjedisore iniciohet nga probleme të botës reale duke krijuar modele të cilat

sugjerojnë një gjendje specifike dhe të preferuar si synim për rezultatet që duhet të jap

zgjidhja. Por Bang në punimin e saj (Bang, A. L., et al., 2012) evidenton se këto dy qasje në

të shumtën e rasteve ecin së bashku duke u kombinuar midis tyre. Kjo mënyrë e trajtimit të

këtyre dy qasjeve kryesore përdoren për të ndërtuar në punimin tonë artifaktet teorike, mbi të

cilën do të mbështet modelimi i sistemit inteligjent parashikues.

Një çështje që duhet theksuar në lidhje me përdorimin e kësaj metodologjie lidhet me

përcaktimin e elementëve bazë të një pune kërkimore, nga qëllimi dhe objektivat deri tek

ngritja e hipotezave apo pyetjeve kërkimore. Për specifikimin e tyre nuk mund të ndiqet një

proces linear gjenerues. Shpesh në të tilla rastesh pyetjet kërkimore apo hipotezat mund të

gjenerohen nëpërmjet eksperimenteve të mirëfillta pa pasur një qëllim apo strategji të qartë.

Një pjesë e hipotezave të ngritura në këtë disertacion mbështetet në modelin e propozuar të

Bang (Bang, A. L., et al., 2012). Përcaktimi i hipotezave në metodologjinë kërkimore

konstruktive të modelimit është një proces i vazhdueshëm që mbështet qëllimin dhe

objektivat e kërkimit. Zhvillimi i këtij procesi bazohet në rezultatet që sjellin eksperimentet e

kryera si dhe në hipotezat ekzistuese.

Në lidhje me këtë model, një hipotezë takohet në themelimin e një motivimi të qartë më pas

shtrohet një pyetje kërkimore bazike dhe gjenden e përdoren kriteret e vlerësimit në lidhje me



Blerina VIKA

22

të. Njohurit e reja të përftuara nga ky model, që përbëjnë dhe elementin më të rëndësishëm,

pasi përmbushin kriteret e vlerësimit ato bëhen pjesë e punës kërkimore.

Siç mund të shihet dhe në figurën e mëposhtme (Figure 2-1. Modeli që tregon se eksperimentet

shërbejnë si drejtues të kërkimit konstruktiv të modelit., në pjesën qendrore të modelit janë

vendosur eksperimentet, të cilat janë mjetet drejtuese të kësaj metodologjie. Eksperimentet,

për elementë përbërës të modelit, realizojnë aprovimin ose jo të tyre duke prodhuar kështu

njohuri në formë e objekteve konkrete si dhe propozime për modelimin. E thënë më qartë

kemi që eksperimentet furnizojnë (apo dhe vetë furnizohen nga) të gjitha nivelet në procesin

e kërkimit.

Figure 2-1. Modeli që tregon se eksperimentet shërbejnë si drejtues të kërkimit konstruktiv të modelit (Bang,

A. L., et al., 2012).

Duke u mbështetur në metodologjinë e zgjedhur për studimin tonë në vazhdim të kapitullit do

të diskutohen se si janë aplikuar çështje të ndryshme specifike për dy fazat kryesore të

metodologjisë: ndërtimin teorikë dhe modelimin e sistemit inteligjent.



Blerina VIKA

23

2.2 Ndërtimi teorik

Ky disertacion është një punim i orientuar nga modelimi që mbështetet në rezultatet e punës

kërkimore. Trajtime të tilla janë të shpeshtat në fushën e sistemeve të informacionit

(Vahidov, 2012) dhe aq më tepër në disiplinën e Inteligjencës Artificiale. Nëpërmjet këtij

punimi synojmë të ndihmojmë modeluesit në dizenjimin efektive dhe efecient të sistemit

inteligjent parashikues. Zhvillimi i zgjidhjeve inventive realizohet nga kërkime të tipit

konstruktiv. Ku produkti kryesorë i punës kërkimore është artifakti. Një artifakt është njohuri

që duhet të shfaqë një nivel përgjithësimi. Ndërsa funksioni i një artifakti arrihet duke

specifikuar strukturën e përshtatshme për çdo elementë bazë të tij në mënyrë që të

përmbushet sa më mirë detyra e tij. Rrjetat neurale bëjnë pjesë në disiplinën e Inteligjencës

Artificial. Megjithëse numri i punimeve shkencore që trajtojnë përdorimin e tyre në

parashikim është relativisht i madh, shpesh metodologjia e përdorur në këto punime është jo e

plotë, kontradiktore apo dhe minimaliste. Modelimi i një sistemi kërkon që ne të kemi të

specifikuar kërkesat të cilat sistemi duhet të përmbush. Pjesa kërkimore e këtij punimi

fokusohet në nxjerrjen e bazës së njohurive të domosdoshme, në formë e një teorie të re ose

të vlefshme, për specifikimin e kërkesave të sistemit.

2.2.1 Studimi i Literaturës

Pjesa e parë e punës kërkimore fokusohet në studimin e fushave të ndryshme që ndërthuren

në sistem, nëpërmjet literaturës së gjerë. Për të kuptuar më mirë se si duhet të projektohet

rrjeti neural i përshtatshëm për parashikimet e serive kohore, bëhet analizimi dhe studimi i

literaturës së plotë. Ky hap është i rëndësishëm për të krijuar një pamje të qartë në lidhje me

hapat që duhen ndjekur për modelimin e sistemit si dhe të mjeteve apo mekanizmave që

duhet të përdoren në çdo hap. Një studim i dytë i literaturës nëpërmjet një procesi analizues

dhe krahasues, do të bëhet mbi ekzistencën e algoritmeve që mund të mbulojnë pjesë të

ndryshme të procesit.

Gjithashtu për të pasur një pamje më të qartë dhe të plotë janë marrë në shqyrtimin dhe

studimet të cilat bëjnë një analizë empirike të përdorimit të rrjetave neurale si mjete për

modele parashikues. Këto punime kanë ndihmuar për të përcaktuar elementët që ndikojnë në

rezultatin e parashikimi si dhe në përcaktimin e metodave efiçente të ndërthurjes së këtyre

elementëve.



Blerina VIKA

24

Theksojmë se shqyrtimi i literaturës ka qenë një aktivitet i pandashëm përgjatë punimit të

këtij disertacioni. Rezultatet e këtij procesi kanë shërbyer për të plotësuar njohuritë e fushës

kërkimore duke krijuar një kornizë të plotë të gjendjes aktuale dhe identifikimin e çështjeve

të mundshme kërkimore për të ardhmen. Literatura e përdorur ka qenë bashkëkohore

përfshirë këtu libra, artikuj, referate të konferencave që paraqesin përdorimin e rrjetave

neurale dhe shpjegojnë aplikimin e tyre për çështjen e realizimit të modeleve parashikuese.

Produkti i studimit të literaturës dhe analiza kualitative teorike e bërë mbi to kanë shërbyer si

themele bazë për analizën e prototipave dhe modelimin e SIP. Ky produkt është organizuar

në kapitujt teorik të cilët trajtojnë rrjetat neurale artificiale si dhe RNA-l për parashikimin e

serive kohore.

2.2.2 Analizë empirike e prototipave

Në një kërkim konstruktiv të modelimit ndërtohen prototipa, produkte dhe modele për të

demonstruar dhe vlerësuar kuptueshmërinë e një situate të veçantë, për të siguruar një skemë

konkrete të problemit si dhe një përshkrim të gjendjes së dëshiruar. Kjo mënyrë është

adoptuar dhe në këtë punim ku janë realizuar prototipa të pjesshme të sistemit për të kuptuar

më mirë elementët ndikuese në eficiencën dhe efektivitetin e rrjetave neurale. Në figurën

(Figure 2-2:Një qasje metodologjike për ndërtimin e një Artifakti për Sistemin Inteligjent

Parashikues :) paraqitet në mënyrë skematike gjenerimi i njohurive që shërbejnë si bazë për

specifikimin e kërkesave të sistemit inteligjent.

Figure 2-2:Një qasje metodologjike për ndërtimin e një Artifakti për Sistemin Inteligjent Parashikues

(Përshtatur nga: Nunamaker, W., Chen, M., dhe Purdin, T., 1991, f. përshtatur) :)



Blerina VIKA

25

Procesi i ndërtimi të çdo artifakti, për këtë disertacion, ndjek në mënyrë më të detajuar fazat e

përcaktuar nga Zimmerrman et al (Zimmerman, J., & Forlizzi, J., 2008):

- Përcaktimi: përzgjedhja e qëllimit dhe motivacionit

- Zbulimi: ndërtimi i një plani për nxjerrjen dhe mbledhjen e të dhënave.

- Sintetizimi: sintetizohen të dhënat, krijohet një model që identifikon faktorët ndikues,

krijohen modele konceptuale.

- Gjenerimi: përshkruhen dhe krijohen prototipa që vlerësojnë dhe demonstrojnë

arritjen e qëllimit.

- Përmirësimi dhe Reflektimi: prototipat përmirësohen në përputhje me qëllimin që

duhet të arrihet duke ndihmuar në nxjerrjen e detajeve për procesin e modelimit.

Nëpërmjet kësaj qasjeje kërkimore të zgjedhur formuam bazë për projektimin e të dhënave,

formës parapërgatitore të tyre, gjenerimit të strukturave të rrjetit neural më të mirë për

parashikim, zgjedhjes së kritereve të vlerësimit për performancën e rrjetit neural dhe

përzgjedhjes së algoritmeve të trajnimit.

2.3 Modelimi i Sistemit Inteligjent

Qëllimi kryesorë i këtij studimi është dizenjimi i sistemit inteligjent për parashikimin e serive

kohore. Në këtë kuptim, fokusi kryesorë janë analiza dhe modelimi artifakteve të gjeneruara

përgjatë ndërtimit të teorisë. Modelimi i artifakteve është një lloj shkence, e cila për t‟u

konkretizuar duhet të përfshijë disa vendime dizenjimi në mënyrë që të përshtaten në një

kontekst specifik. Ky aktivitet nënkupton transformimin e informacionit nga kërkesa në

specifikimin e një zgjidhjeje teknike.

Metodologjia e zgjedhur për këtë punim, sugjeron që kërkimi konstruktiv të niset nga kuptimi

i qartë i fushës së aplikimit. Kjo gjë arrihet nëpërmjet njohurive të shpërndara dhe përdorimit

të artifakteve të njohura. Mbi bazën e ofruar nga ndërtimi teorikë, në këtë pjesë të punimit,

përcaktohet se cili është cikli jetësorë më i mirë për inxhinierimin softuerikë të SIP.

Prototipat e krijuar shpërbejnë për të ilustruar me shembuj hipotezat nga secila fushë dhe për

të shtuar fakte dhe parime nga eksperienca reale (Koskinen I., Zimmerman J. et al, 2011).

Edhe në këtë fazë puna kërkimore është një faktorë mbështetës në konstruktimin e

artifakteve. Duke qenë se nuk ekzistojnë rregulla të qarta se si duhet kryer kjo fazë është e

nevojshme konsultimi me literaturën, për të adresuar në mënyrë të përshtatshme këtë

problem. Mbështetur në aktivitetet e ciklit jetësorë të zgjedhur, specifikohen kërkesat e



Blerina VIKA

26

sistemit. Për të lehtësuar proceset e implementimit dhe mirëmbajtjes është realizuar një

analizë për modularizimin e sistemit SIP.

Elementë të rëndësishëm gjatë modelimit janë përcaktimi i transformimit të përshtatshëm të

dhënave si pjese e integruar e sistemit SIP, kriteret për vlerësimin e performancës së sistemit,

aftësia e sistemit që të përmirësoj gjendjen e tij si dhe përzgjedhja e algoritmit të trajnimit më

të mirë nga vetë sistemi automatikisht.



Blerina VIKA

27

Kapitulli 3

3 RRJETAT NEURALE ARTIFICIALE

3.1 Rrjetat neural biologjike kundrejt artificiale

Rrjetat neurale artificiale, të konsideruar si një degë e Inteligjencës Artificiale, në thelb është

një program kompjuterik i modeluar dhe i projektuar për të mësuar në mënyrë të ngjashme

me trurin e njeriut. Camillo Golgi (1843-1926) në 1873 zhvilloi një teknikë ngjyrosjeje, e cila

lejonte vëzhgimin individual të neuroneve në tru. Kjo teknikë, më pas u përdorë nga Santiago

Ramon y Cajal (1852- 1934) në studimet e tyre kërkimore për të nxjerrë strukturën e

neuroneve në tru (Russell S. J. dhe Norvig P, 2009).

Shumë studime bëhen për të kuptuar se si funksionon procesi i njohjes në trurin e njeriut.

Nisur nga pikëpamja biologjike neuronet janë njësi strukturore dhe funksionale të cilat janë të

specializuara për t‟iu përgjigjur ngacmimeve, për të përçuar impulset dhe për të çliruar

neurotejçues kimikë specifikë. Aksonet të cilat gjenden në dalje të qelizave mbartin sinjale

elektrike. Këto sinjale transmetohen nëpërmjet sinapseve, që ndodhen në fund të aksonit, tek

dentritet e një neuroni tjetër me të cilin këto janë lidhur.

Figure 3-1:Neuroni Biologjik (AnkushKhere dhe MayurPatankar, 2012)



Blerina VIKA

28

Efektiviteti i sinapsit mund të rregullohet nëpërmjet sinjaleve që kalojnë në të. Kjo lejon që

sinapset të mund të mësojnë nga aktivitetet në të cilat ato marrin pjesë (AnkushKhere dhe

MayurPatankar, 2012).

Një konkluzion me të vërtetë i mahnitshëm është se një bashkësi me qeliza të thjeshta mund

të çojë në mendime, veprime si dhe ndërgjegjësim, që e thënë me fjalët e John Searle truri

shkakton inteligjencë (Russell S. J. dhe Norvig P, 2009).

Duhet të theksojmë se pavarësisht analizave të ndryshme dhe të shumta të kryera, rrjetat

neurale i përkasin rrjetave neurale artificiale dhe jo atyre biologjike. Megjithëse rrjetat

neurale janë një abstraksion i atyre biologjikë, thelbi i rrjetave neurale artificiale (ANN-ve)

nuk është të kopjojë veprimin e sistemit biologjikë, por të shfrytëzoj funksionalitete të

njohura, që përdoren nga rrjeti neural biologjikë për të zgjidhur problemet komplekse

(Basheer I.A. dhe Hajmeer M,, 2000). Sistemi biologjik i neuroneve dhe rrjetat neurale

artificiale përafrohen në dy pika: Së pari, ato fitojnë njohuri nëpërmjet rrjetit, me anë të një

procesi të mësuari dhe së dyti, përdorin lidhje të forta ndërmjet neuroneve për të ruajtur

njohuritë e fituara (Indranarain, 2010).

Ndër përkufizimet që e plotësojnë më mirë atë se çfarë është një RNA-l mund të përmendim:

„... një rrjet neural është një sistem i përbërë nga disa elementë përpunues të cilët veprojnë

në paralel, funksioni i të cilit përcaktohet nga struktura e rrjetit, fortësia e lidhjeve si dhe nga

përpunimi që kryhet nga çdo element përpunues ose nyje...‟

Në „DARPA Neural Network Study‟, (1988) AFCEA International Press, p. 629

Një tjetër përkufizim dhënë nga Maureen Caudill në „Neural Network Primer: Part I‟ (1989)

është:

„... një sistem llogaritës i përbërë nga një numër i madh elementësh përpunues të ndërlidhur

midis tyre, të cilët përpunojnë informacione nëpërmjet gjendjes së tyre dinamike për t‟iu

përgjigjur të dhënave të jashtme.‟

Rrjetat neurale artificiale janë mjete modelimi llogaritëse, të cilat së fundmi janë pranuar dhe

përdorur gjerësisht për projektimin e problemeve komplekse të botës reale në disiplina të

ndryshme. Vlen të theksojmë se, megjithëse rrjetat neurale përdoren për ti dhënë zgjidhje

problemave të ndryshme, ato dallojnë nga programet kompjuterike tradicionale që ne jemi

njohur.

Një program, në kuptimin e mirëfilltë, ka në bazë një algoritëm i cili zgjidh një problem të

caktuar duke përdorur një varg me instruksione të renditura. Në këtë rast, problemi që



Blerina VIKA

29

zgjidhet është i kuptueshëm, dihen të dhënat si dhe vargu i hapave të përpunimit të këtyre të

dhënave për të arritur rezultatin/et. Nëse nuk do i kishim të gjitha hapat atëherë algoritmi nuk

do të jepte zgjidhje. Gjithashtu, pavarësisht se sa herë ekzekutohet një program, për të dhëna

të njëjta rezultati do të ngelej i njëjtë.

Shpesh jemi të interesuar të kemi zgjidhje kompjuterike për problema të cilat nuk dimë se si

ti zgjidhim. Karakteristikë tjetër për programet tradicionale është se nëse ato nuk

funksionojnë në mënyrë korrekte apo dështojnë, atëherë kjo ndodh nga ndonjë problem në

softuerë ose në harduerë.

Rrjetat neurale artificiale, kanë marrë nga ato biologjike, aftësinë për të mësuar nga

„eksperienca‟. Rrjetit neural i vendosen në dispozicion disa shembuj dhe mbi bazën e të

dhënave në to, ai trajnohet në mënyrë që të nxjerr një formë të përgjithësuar për zgjidhjen e

problemit. Në këtë përqasje, rol të rëndësishëm dhe kryesorë zë përzgjedhja e shembujve të

duhur për të bërë trajnimin e rrjetit.

Rrjetat nuk ndjekin një rrugë lineare me instruksione për zgjidhjen e problemit por

përpunojnë një bashkësi informacioni në paralel dhe kjo nëpërmjet njësive elementare

përpunuese.

Pavarësisht këtyre ndryshimeve nuk duhet menduar se këto dy përqasje të zgjidhjes së

problemit janë në konkurrencë me njëra-tjetrën përkundrazi, ato plotësojnë njëra-tjetrën.

Shpesh problema me kompleksitet të lartë dekompozohen në nën/problema më të thjeshta.

Disa nga nën/problemat mund të zgjidhen me anë të rrjetave neurale. Disa tipare dhe aftësi që

i bëjnë RNA-le të rëndësishme në zgjidhjen e shumë detyrave janë:

- Aftësia për të mësuar pa pasur asnjë informacion fillestar mbi shembujt (që janë në

formën e të dhënave hyrëse-dalëse) që do të përdorë për tu trajnuar.

- I adaptueshëm, kjo ndodh pasi rrjeti ndryshon strukturën e tij të brendshme ndërkohë

që informacioni kalon në të.

- Jo-lineariteti, është një nga veçoritë kryesore sidomos kur shpërndarja e të dhënave ka

natyrë të tillë.

- Vlerësim të përgjigjes, kjo është një aftësi e cila në rastet kur rrjeti përdoret për të

kryer klasifikime mbi bazë të disa ndarjeve, atëherë ai është në gjendje të përcaktoj

dhe se me çfarë sigurie një mostër i përket një grupit të caktuar.

Pyetjes se pse duhet të përzgjidhen rrjetat neurale, autorët (Jain A. K., Mao J., Mohiuddin K.

M., 1996) në punimin e tyre kanë shtuar se vlerë e shtuar për rrjetat neurale kundrejt



Blerina VIKA

30

sistemeve të von Neuman është se kanë karakteristikë : paralelizim masivë, përllogaritje dhe

paraqitje të shpërndarë, procesim të informacionit në një kontekst të trashëguar, tolerancë

gabimi si dhe konsumim energjie të ulët.

RNA-e kanë gjetur përdorim në një sërë aplikacionesh të ndryshme, për zgjidhje e

problemave klasifikim/njohje të mostrave, klasterizimi, përafrime funksionale, diagnostikime

mjekësore dhe shumë të tjera.

3.2 Struktura e rrjetit neural

Rrjeti neural është një model matematikë ose llogaritës që tenton të imitojë aspektet

strukturore dhe funksionale të rrjetit neural biologjik (Kaastra, I. dhe Boyd, M, 1996). Një

rrjet neural përbëhet nga një grup neuronesh artificiale të ndërlidhura me njëra-tjetrën. RN

është një sistem i adaptueshëm, i cili ndryshon strukturën e tij mbi bazë e informacioneve të

brendshme ose të jashtme që kalon në rrjet gjatë fazës së të mësuarit. Struktura e RNA-l është

një abstragim dhe implementim i ndërlidhjeve neurale në tru.

3.2.1 Perceptroni

Arkitektura më e thjeshtë e RN njihet si perceptron, nyja njësi përpunuese etj. Kjo njësi

përpunuese është një abstragim i neuronit biologjik, elementi bazë i sistemit nervor. Një

përkufizim i qartë për këtë abstragim jepet nga dy autorët Chang dhe Huang të cilët e

përshkruajnë:

„...Elementi i përpunueshëm (nyja) është i ngjashëm me neuronin, funksioni

transferues luan rolin e dendtrit dhe aksonit, ndërsa peshat e lidhjes midis nyjeve janë

analogji e fortësisë sinaptike në lidhjet e neuroneve (ChangI. Ch., Hwang H. G., 1998)‟.

Një model llogaritës (Figure 3-2) për të ilustruar mënyrën e përpunimit të informacionit nga

një neuron artificial është propozuar nga McCulloch dhe Pitts (McCulloch W. S., Pitts W.,

1943).

Perceptroni ka si pjesë të tij dy tipa nyjesh: nyjet hyrëse dhe ato dalëse (në Figure 3-2 ka

vetëm një nyje dalëse). Nyjet hyrëse (xj, j=1,2,...,m) janë vlerat që shërbejnë si informacion

hyrës që duhet të përpunohen nga vetë neuroni. Nyjet dalëse, y në figurë, përbëjnë dhe

rezultatin e modelit.

31

Figure 3-2: Paraqitja e përgjithshme e punës së neuronit (Modeli McCulloch -Pitts)

Në strukturën e paraqitur, të neuronit artificial, evidentohet lehtë që për çdo nyje hyrëse

vendoset një peshë e lidhjes (wj, j=1,2,...,m). Mbështetur në natyrën e tyre biologjike, peshat

lidhëse të vendosura, imitojnë fortësinë lidhëse sinaptike midis neuroneve, që në këtë rast

tregon fortësinë e lidhjes së nyjeve hyrëse me ato dalëse. Trajnimi i perceptronit nënkupton

përcaktimin e peshave në mënyrë të tillë që modeli të përshkruaj sa më saktë lidhjet që

ekzistojnë midis të dhënave hyrëse dhe atyre dalëse.

Neuroni llogarit shumën e peshave për m sinjalet hyrëse xj, j=1,2,...,m së bashku me

prodhimin e bias (b) me peshën respektive të saj për të përcaktuar kështu vlerë funksionit të

transferimit:

ku ∑

(3.1)

b- (bias) është një vlerë hyrëse me vlerë 1 ose 0, e pavarur nga nyjet e tjera hyrëse. Bias-i

shërben për të bërë zhvendosjen e kufijve të vendimmarrjes nga origjina.

Në modelin e propozuar nga McCulloch dhe Pitts (McCulloch W. S., Pitts W., 1943) në

strukturën e neuronit nuk përdoret bias por përdoret një element i njohur me termin threshold

apo prag. Në këtë rast vlera e kthyer nga funksioni i transformimit krahasohet me atë të

pragut dhe bazuar në këtë krahasim përcaktohet dhe vlera dalëse e neuronit.

Neuroni i propozuar nga McCulloch dhe Pitts mund të marr vetëm dy vlera prandaj dhe në

literaturë njihet si një neuron me prag binarë. Në rast se vlerat e funksionit të transformimit

janë më të mëdha ose të barabarta me pragun atëherë thuhet se të dhënat shkaktojnë zjarr, në

analogji me natyrën biologjike apo argumenti është i vlefshëm, dhe në këtë rast vlera dalëse

është 1. Në të kundërt, argumenti quhet negative dhe vlera dalëse është 0.



Blerina VIKA



Blerina VIKA

32

Për të lehtësuar veprimet bëhet zëvendësimi i pragut nga një peshë e shtuar që njihet pesha e

bias-it. Vlerat e tij është:

(3.2)

Në këtë mënyrë përcaktimi nëse një funksion është argument pozitivë apo negativë lidhet

direkt me shenjën që do ketë funksioni i transformimit, respektivisht pozitivë apo negativë.

Peshat me vlerë pozitive përkojnë me sinapse ngacmuese ndërsa peshat me vlerë negative me

sinapset penguese. McCulloch dhe Pitts (McCulloch W. S., Pitts W., 1943) kanë provuar se:

„ përzgjedhja e peshave në mënyrë të përshtatshme realizon sinkronizimin e punës së

neuroneve për të kryer llogaritje universale‟.

Ndërsa vlera dalëse e perceptronit përcaktohet nga rezultati që merret nga funksioni i

aktivizimit:

ku ( ) (3.3)

ku: - funksioni i aktivizimit.

Në analogji me neuronet biologjike funksioni i aktivizimit lidhet me shkallën e fuqisë së

veprimit në qelizë. Një neuron mund të përdoret për të implementuar një klasifikues binar.

Funksioni më i thjeshtë i aktivizimit është ai binarë si në rastin e shpjeguar më sipër

(McCulloch W. S., Pitts W., 1943).

3.2.2 Funksionet e aktivizimit

Siç u theksua, rezultati në portën dalëse të një neuroni është shuma e ponderuar e nyjeve

hyrëse. Modeli i McCulloch dhe Pitts është aplikuar në disa mënyra. Një nga modifikimet e

aplikuar mbi të është që në vend të një funksioni prag të përdoret një funksion aktivizimi.

Një funksion aktivizimi përdoret për të ndryshuar nivelin e aktivizimit të një neuroni në një

sinjal dalës. Ky funksion ka një efekt “shformues” të sinjalit që përcillet nga funksioni i

transferimit dhe luan rolin e një filtri jo-linear. Përzgjedhja e funksionit të aktivizimit

përcakton dhe mënyrën se si duhet të sillet neuroni , në një rrjet neural artificial.

Numri i funksioneve të aktivizimit të përdorura është shumë i madh. Duke qenë se ato

kategorizohen në bazë të problemit që duhet të zgjidhjet nga neuroni, disa prej tyre janë

përcaktuar si funksione të paravendosura për një tip problemash të caktuara, të tjera janë lënë

në përzgjedhje të modeluesit. Në tabelën e mëposhtëm (Tabela 3-1) jepen të detajuara



Blerina VIKA

33

emërtimet, funksionet përkatëse të aktivizimit si dhe intervalet në të cilën shtrihen vlerat e

funksionit.

Tabela 3-1: Funksionet e Aktivizimit për Neuronin1

Emërtimi Përcaktimi Intervali i Vlerave

Identitet ( )

Logjistik

(0, 1)

Hiperbolik

(-1, 1)

Eksponencial (0, )

Softmax

∑ (0, 1)

Unit Sum

∑ (0, 1)

Rrënja Katrore √ ( 0, )

Sinuse [0, 1]

Segment Devijues {

[-1,1]

Linearitet i pjesshëm {

[0, 1]

Hap Njësi (threshold) {

[0, 1]

Disa nga funksionet e aktivizimit që përdoren më gjerë janë Hap Njësi (threshold), Sigmoid,

Gaussian, linearitete të pjesshme (piecewised linear PWL), format e tyre grafike janë

paraqitur në vazhdimësi (në Tabela 3-2):

1 Shënim: me x është shenuar vlera e kthyer nga funksioni i transferimit të neuronit.



Blerina VIKA

34

Tabela 3-2: Funksionet e aktivizimit, a) Threshold, b)Linearitet i pjesshëm, c)Sigmoid, d)Gaussian

a)

b)

c)

d)

Hap Njësi (threshold), përdoren për të modeluar rrjeta të thjeshtë siç janë perceptronet.

Përdoren kur kërkohet të bëhet një klasifikim binarë. E thënë më thjeshtë kur duam të bëjmë

klasifikimin e një grupi të dhënash hyrëse në një nga dy grupet e mundshme. Ky funksion

aktivizimi është i përdorur gjerësisht në zgjidhjen e problemave të klasifikimit dhe

grumbullimit (Clustering). Format e këtij funksioni mund të jenë të tipit binarë ose të tipit

bipolar.

a) threshold binarë (figura 4.a) llogarit vlerën dalëse të neuronit në bazë të

ekuacionit: {

(3.4)

b) threshold bipolar ekuacioni i llogaritjes së vlerës dalëse realizohet si mëposhtë:

{

(3.5)

Linearitete të pjesshme (Tabela 3-2.b), rezultati në dalje të neuronit është në proporcion me

peshën totale të funksionit të transferimit. Funksioni i aktivizimit në këtë rast shprehet me anë

të formulës:

(3.6)

𝑦 { 𝑛𝑞𝑠 𝑥 𝑛𝑞𝑠 𝑥

𝑦 {

𝑥 𝑥𝑚𝑖𝑛

𝑚𝑥 𝑏 𝑥𝑚𝑎𝑥 𝑥 𝑥𝑚𝑖𝑛

𝑥 𝑥𝑚𝑎𝑥

𝑦

𝑒 𝛽𝑥 𝑦

√2𝜋𝜎𝑒−(𝑥−𝜇)2

2𝜎2

𝑦 {

𝑥 𝑥𝑚𝑖𝑛

𝑚𝑥 𝑏 𝑥𝑚𝑎𝑥 𝑥 𝑥𝑚𝑖𝑛

𝑥 𝑥𝑚𝑎𝑥



Blerina VIKA

35

Nëpërmjet këtij funksioni mund të përafrohen funksione logjistike jo-lineare në një formë

lineare. Përzgjedhja e vlerave në të dy skajet e pjesës lineare, të poshtëm dhe të sipërm,

përcaktohen nga modeluesit e rrjetit.

Sigmoid (Tabela 3-1. c), paraqitja grafike e këtij funksioni është në form „S-je‟, ndërsa

matematikisht kemi që është i derivueshëm dhe rrigorozisht rritës. Ekuacionin i përgjithshëm

për këtë funksion aktivizimi është:

(3.7)

Si informacion hyrës ky funksion merr vlera reale dhe i „ngjesh‟ ato në segmentin [0,1].

Parametri β njihet si parametri përcaktues i pjerrësisë, vlerat e ndryshime që ajo merr tregojnë

dhe pjerrësinë e grafikut. Karakteristik për këtë funksion është se ka vlera reale, është i

derivueshëm, ka vetëm një minimum lokal dhe një maksimum lokal. Nëse vlerat absolute të

x-it janë të vogla atëherë funksioni i aktivizimit paraqet një sjellje lineare. Në rastet kur vlerat

janë të mëdha atëherë tentojnë të shkojnë drejt vlerës 0 ose 1. Shpesh përdorimi i tyre në

rrjetat neurale bëhet në rastet kur duhet të përfshihet jo-linearitet në model.

Funksioni Gaussian (Tabela 3-1.d), me formën grafike si të një kambane. Shprehet me anë të

ekuacionit:

(3.8)

Në këtë rast merret një parametër që përdoret si vlerë qendrore (mesatarja) e funksionit dhe

njihet si vlera e dëshiruar. Më pas rezultati i funksionit për çdo vlerë reale përcakton

distancën nga vlera qendrore. Nëse kjo distancë është shumë e madhe atëherë funksioni

Gaussian kthen 0 që tregon se me rritjen e distancë zvogëlohet dhe influenca. Karakteristikë

për këtë funksion është se ai është i derivueshëm, jo- monoton dhe ngjeshës.

Funksioni që përdoret më shpesh në rrjetat neurale është sigmoid (Vika B., Martiri E. &

Xhaja D., 2011) pasi ofron një rritje në mënyrë rigoroze, të zbutur dhe me vetitë asimptotike

të dëshiruara.

Sinjali që merr një nyje mund të jetë informacioni që nyje të tjera ia dërgojnë ose stimulime

të jashtme. Çdo nyje merr një sinjal hyrës e përpunon atë nëpërmjet një funksioni aktivizimi

ose transferimi dhe prodhon një sinjal të përpunuar në dalje për t‟ia kaluar nyjeve të tjera ose

për të nxjerr një rezultat të jashtëm. Ekzistojnë struktura të ndryshme të rrjetave neurale

artificiale me një shtresë, me shumë shtresa, përsëritëse dhe vetë-organizuese.

𝑦

𝑒 𝛽𝑥

𝑦

√2𝜋𝜎𝑒−(𝑥−𝜇)2

2𝜎2



Blerina VIKA

36

3.2.3 Topologjitë e rrjetit neural

Më sipër u trajtuan veçoritë dhe elementët kryesorë të njësisë përpunuese bazë të një rrjeti

neural artificial. Një perceptron i vetëm do të ishte i aftë të trajtonte problemet e ndarjeve

lineare. Bazuar në analogjinë me sistemin biologjik, një rrjet neural artificial përbëhet nga

disa neurone artificiale të cilat janë të lidhura në mënyrë të tillë që të lehtësojnë përpunimin e

shpërndarë.

„..Një topologji e rrjetit neural artificial paraqet mënyrën në të cilën neuronet lidhen për të

formuar një rrjet. ..‟ (Fiesler, 1996)

Topologjia që i përcaktohet një rrjeti neural artificial luan një rol të rëndësishëm në

funksionalitetet dhe performancën që do të ketë rrjeti neural artificial (Vika B., Martiri E. &

Xhaja D., 2011). Struktura e rrjetit neural artificial mund të paraqitet nëpërmjet një grafi me

lidhje të orientuara dhe të ponderuara në të cilën nyjet janë neurone artificiale. Lidhjet e

orientuar të shoqëruara me pesha tregojnë lidhjet e mundshme ndërmjet shtresave dhe

neuroneve që ndodhën në secilën shtresë. Lidhjet midis nyjeve vendosen në rastet kur ka

transferim informacion midis tyre. Klasifikimet e përgjithshme për topologjitë e RNA-le

bëhen bazuar në tre elemente kryesore:

a. Numri i shtresave të përdorura

b. Numri i nyjeve në çdo shtresë

c. Lidhjet ndërmjet nyjeve dhe shtresave.

Figure 3-3: Struktura të ndryshme të rrjetit neural artificial

A) B)



Blerina VIKA

37

C)

Nisur nga elementi i parë që lidhet me numrin e shtresave të përdorura kemi ndarje të rrjetave

me një-shtresë dhe ato me shumë-shtresa. Në një shtresë grumbullohen neuronet në bazë të

rolit që ato duhet të kenë në përpunimin e të dhënave.

Rrjetat me një-shtresë (Figure 3-3/A) përbëhen vetëm nga shtresa hyrëse dhe shtresa dalëse.

Neuronet në shtresën hyrëse të rrjetit (neuronet hyrëse) shërbejnë vetëm për të përçuar dhe

shpërndarë sinjalin hyrës por nuk realizojnë asnjë llogaritje apo transformim. Shtresa dalëse

është ajo e cila mban neuronet artificiale (neuronet dalëse) të cilat marrin sinjalin hyrës

nëpërmjet lidhjeve të ponderuara (me pesha) të neuroneve hyrëse dhe bazuar në të

përllogarisin vlerat dalëse në këtë shtresë.

Në rastin kur ekzistojnë të gjitha lidhjet midis neuroneve hyrëse dhe atyre dalëse themi që

rrjeti është plotësisht i lidhur. Në rast të kundërt kemi mungesë të lidhjeve ose kemi lidhje me

peshë zero.

Rrjetat artificiale shumë-shtresore (Multi Layer Perceptron) përveç shtresës hyrëse dhe

dalëse përfshijnë në topologji dhe një apo shumë shtresa të ndërmjetme të cilat quhen shtresa

të fshehta, ndërsa nyjet që ndodhen në këto shtresa njihen si neurone të fshehta (Vika B.,

Martiri E. & Xhaja D., 2011). Të gjitha neuronet që ndodhen në rrjet janë të shpërndara

ndërmjet shtresës hyrëse, shtresës dalëse si dhe shtresave të fshehura. Lidhjet janë një-

drejtimore dhe vendosen midis neuroneve që ndodhen në shtresa të ndryshme. Edhe në këtë

topologji nyjet e shtresës hyrëse janë pasive që do të thotë që ato nuk e transformojnë të

dhënën. Nyje aktive janë nyjet që ndodhen në shtresat e fshehura dhe në shtresën dalëse.

Shtresat e fshehta përdoren për të rritur aftësitë shprehëse të rrjetit. Është e kuptueshme që një

rrjet i cili nuk përdorë shtresë/a të fshehtë është më i kufizuar në modelet që mund të

paraqesë.



Blerina VIKA

38

„Njësitë e fshehta realisht duhet të emërtohen „detektorët e tipareve të mësuara‟ ose

„njësitë e ri-paraqitjes‟ kjo sepse modeli i aktivitetit në shtresën e fshehur është një

kodim i asaj se çfarë rrjeti mendon që janë tiparet domethënëse në të dhënat hyrëse.‟

(Touretzky D. S. & Pomerleau D. A. , 1989)

Disa aftësi shtesë të rrjetit që arrihen nga përdorimi i shtresave të fshehta në strukturën e tyre

listohen në vazhdim:

Janë të domosdoshme për të kapur varësitë jo lineare midis të dhënave që i paraqiten

rrjetit.

Kanë aftësi për të mësuar nga të dhënat që i paraqiten rrjetit.

Kanë aftësi ruajtëse të informacioneve që përmbahen në të dhënat hyrëse të rrjetit

Kriteri i tretë i përdorur për klasifikimin e rrjetave neurale bazohet në mënyrën se si

realizohen lidhjet ndërmjet nyjeve që ndodhen në shtresa të ndryshme. Format e ndryshme të

lidhjeve bëjnë që rrjeti neural të shfaq sjellje të ndryshme. Prezenca ose jo e lidhjeve me efekt

prapaveprues (feedback) në rrjet bëjnë që të kemi dy kategori kryesore në të cilat ndahen

arkitekturat e një rrjeti (Jain A. K., Mao J., Mohiuddin K. M., 1996):

Rrjetat feed –forward (FD): Në këtë arkitekturë (Figure 3-3/C) grafet nuk përmbajnë

lidhje të cilat kthejnë informacion mbrapa në shtresat furnizuese. Rrjedhja e informacionit, e

cila tregohet nga lidhjet që vendosen në këtë lloj strukture, bëhet nga shtresa hyrëse drejt

shtresës dalëse. Rrjeti FD është një rrjet statik i cili prodhon një bashkësi me vlera dalëse.

Ky rrjet nuk përdorë memorie që do të thotë se vlerat dalëse që ofrohen mbi bazën e

informacionit hyrës nuk varen nga gjendjet e mëparshme të rrjetit. Kjo topologji është më e

përdorura në shumë aplikacione praktike.

Rrjetat rekurente kanë në strukturën e tyre cikle (Figure 3-3/B), të cilat krijohen nga

lidhjet që mundësojnë kthim të informacionit mbrapa. Rrjeti me këtë lloj topologji është një

sistem dinamik në të cilën gjendja e tij është në ndryshim të vazhdueshëm deri në momenti

kur arrihet një gjendje ekuilibri për të. Në rastet kur përdoret një model i ri hyrës, llogariten

neuronet dalëse. Prezenca apo ekzistenca e lidhjeve ciklike bënë që informacioni hyrës i çdo

neuroni të modifikohet dhe si rezultat rrjeti kalon në një gjendje të re. Këto cikle të

kthyeshme bëjnë që rrjetat rekurente të kenë çfarëdolloj strukture, pasi mund të lejohen

lidhjet midis çdo dy nyje si dhe lidhje të një nyje me vetveten. Kthimi i informacionit

mundëson aftësi mësuese të ndryshme duke i bërë të mundur që RR të ketë një „memorie‟

në të cilën ruan informacion mbi llogaritjet e kryera në hapat e mëparshme.



Blerina VIKA

39

3.2.4 Procesi i të mësuarit për RNA

Për një rrjet neural një ndër tiparet më impresionuese për të cilën evidentohet nga shumë

teknika të tjera është aftësia e tij për të evoluar „dijet‟ e tij. Rrjeti mëson mbi bazë të

eksperiencës së tij dhe kushteve në të cilat vendoset. Eksperienca ka të bëjë me sasinë e

shembujve që i jepen atij për të mësuar, ndërsa kushtet lidhen me cilësinë e shembujve që ai

përdorë.

RN është i aftë të nxjerr njohuri nga shembujt që përpunon nëpërmjet një procesi të mësuari.

Të mësuarit nënkupton që një njësi e përpunimit është e aftë të ndryshoj sjelljen e tij hyrëse-

dalëse si rezultat i ndryshimit të mjedisit. Duke e lidhur më shumë me strukturën që ka rrjeti,

theksojmë që mësimi ka të bëjë me ndryshimin në mënyrë të përsëritur të peshave për të

ofruar një rezultat të saktë në dalje të rrjetit neural.

Procesi i të mësuarit klasifikohet në tre paradigma kryesore:

Mënyra e Mbikëqyrur (Supervised mode) e cila përfshin një „mësues‟ të jashtëm, në të

cilën çdo nyje dalëse pajiset me përgjigjet e dëshiruar në mënyrë që të vlerësohen sinjalet

hyrëse. Përgjatë procesit të trajnimit, për të gjitha vlerat hyrëse që i jepen rrjetit neural janë

të njohura dhe vlera reale të daljes. Duke pasur njëkohësisht të dhënat hyrëse dhe ato dalës

llogaritet gabimi mbi vlerën e daljes të nxjerr nga rrjeti dhe vlerës reale. Rregullimi i

peshave të rrjetit duhet të realizohet bazuar mbi gabimin e llogaritur në mënyrë që të ofrohet

një rezultat në dalje sa më afër me vlerave reale. Një nga algoritmet që zbatohet më shpesh

për këtë kategori është propagandim mbrapa (back-propagation).

Mënyra e Pambikëqyrur (Unsupervised mode) nuk përdor asnjë „mësues‟ të jashtëm

dhe bazohet vetëm në informacionin lokal. Kjo mënyrë konsiderohet si vetë-organizuese, që

nënkupton se i vetë organizon të dhënat që janë në rrjet dhe zbulon vetitë emergjente të

përbashkëta të tyre. Realizohen eksplorime për të evidentuar lidhje strukturore në të dhënat

hyrëse si dhe korrelacione midis të dhënave. Më pas bëhet dhe kategorizimi i të dhënave

mbështetur mbi këto korrelacione. Kjo paradigmë përdoret shpesh në gërmimin e të

dhënave (Data Mining) pasi kanë aftësi të parashikojnë preferencat e një subjekti bazuar në

subjekte të tjera të ngjashëm me të.

Mënyra e Përforcuar (Reinforcement learning) në të cilën bëhet një kombinim i dy

mënyrave të përshkruara më sipër. Në këtë teknikë një pjesë e peshave të rrjetit neural

përcaktohen duke përdorur mënyrën e mbikëqyrur ndërsa pjesa tjetër përcaktohet nëpërmjet

mësimit të pambikëqyrur. Në këtë rast rrjeti mëson nga pasojat që sjell rezultati i tij, pasi

atij nuk i jepet asnjë gjë në mënyrë eksplicite si dhe nga aftësitë e tij eksploruese për të



Blerina VIKA

40

nxjerrë lidhje nëse ekzistojnë midis të dhënave që ka përdorur. Pasojat e rrjetit shprehen mbi

bazën e një „shpërblimi‟ numerik që nënkupton dhe suksesin e arritur në një moment për

rrjetin.



Blerina VIKA

41

Kapitulli 4

4 PARASHIKIMI NËPËRMJET RRJETAVE NEURALE

4.1 Hyrje

Aftësia për të njohur dhe parashikuar të ardhmen ka qenë gjithmonë tërheqëse për njerëzit,

gjatë gjithë ekzistencës së tyre. Përdorimi i serive kohore për të realizuar parashikime është

një fushë me interesa në rritje, në të cilën janë përqendruar kërkime të shumta. Parashikimi

dhe analiza e serive kohore janë shumë të rëndësishme në fushat inxhinierike, shkencore dhe

ekonomike. Propozime të shumta janë bërë në lidhje me metodologjitë që duhen përdorur për

të kryer parashikime.

Metodologjitë parashikuese nënkuptohen shpesh si një koleksion metodash dhe mjetesh për

mbledhjen e të dhënave të serive kohore të cilat do të përdoren për të parashikuar vlerat e

ardhshme të këtyre serive mbi bazën e vlerave të së shkuarës (Palit A. K. dhe Popovic D.,

2005). Parashikimet luajnë një rol thelbësore për marrjen e vendimeve. Vendimmarrjet, të

cilat bëhen mbi bazën e parashikimeve, mund të jenë që nga ato operacionale ditore deri në

vendime strategjike afatgjate organizative apo ekonomike (Zhang G. P., 2004). Gjithashtu

parashikimet afatgjate shihen nga industri të ndryshme si mjete për të përmirësuar dhe arritur

efikasitetin e veprimtarisë si dhe të kontrollit të perfomancës

Realizimi i parashikimeve efektive në makroekonomi është një punë shumë e vështirë, kjo si

pasojë e mungesës së një modeli ekonomik të saktë dhe bindës (Moody J., 1995). Në teorinë

makroekonomike, modelimi realizohet mbi supozime kufizuese të cilat janë në varësi të

aftësisë së njerëzve për të mësuar si dhe të nivelit të tyre të njohurive. Të dhënat ekonomike

dhe të biznesit shpesh nuk përmbushin me rigorozitet supozimet e modeleve statistikore



Blerina VIKA

42

parashikuese. Gjithashtu, modelet më të sakta për parashikime trajtojnë shumë pak supozime

në lidhje me strukturën e ekonomisë. Për më tepër, ekzistenca e një jo-lineariteti të theksuar

në modelet ekonomike bëjnë që metodat klasike të mos jenë të përshtatshme për t‟u përdorur

ose që modelet e ndërtuara nuk arrijnë të përfaqësojnë realitetin (Stencl M. dhe Stastny J.,

2011).

Një alternativë që propozohet për kryerjen e parashikimeve është përdorimi i rrjetave neurale

artificiale. Kërkimet e kryera në rrjetat neurale kanë treguar që kjo metodologji ka aftësi

shumë efikase në njohjen e mostrave dhe klasifikimin e tyre. E përbashkëta e metodave

tradicionale statistikore dhe rrjetave neurale artificiale është se procesi i të mësuarit bëhet mbi

bazën e të dhënave që mbajnë informacione nga e shkuara.

Rrjetat neurale artificiale pasi trajnohen me anë të shablloneve të së shkuarës mund të

përdoren për parashikime si dhe mund të punojnë me një bashkësi shumë të madhe të

dhënash në një kohë të arsyeshme. Një rrjet neural është një sistem i adaptueshëm, i cili

ndryshon strukturën e tij mbi bazë e informacioneve të brendshme ose të jashtme që kalon në

rrjet gjatë fazës së të mësuarit.

Rrjetat neurale janë mjete modelimi për të dhëna statistikore të cilat nuk kanë linearitet. Kjo

metodologji mund të përdoret gjithashtu për të modeluar lidhjet komplekse midis të dhënave

hyrëse apo përshkruese dhe atyre që duhet të parashikohen si dhe për të gjetur modele

(pattern) në të dhënat.

4.2 Parashikimi i serive kohore në këndvështrimin ekonomik

Një seri kohore është një sekuencë e renditur kohore e vlerave të vëzhguara për një ndryshore

fizike ose financiare të bëra në hapësira kohore të njëjta Δt, të cilat paraqiten me anë të një

bashkësie me vlera diskrete X1, X2, X3, ... , etj (Palit A. K. dhe Popovic D., 2005). Analiza e

një serie të caktuar kohore ka si qëllim kryesisht studimin e strukturës së saj të brendshme

(trendin, autokorrelacioni, sezonalitetin etj), për të fituar një kuptim më të mirë të procesit

dinamik me të cilin janë krijuar të dhënat e serisë kohore.

Vlerat e parashikuara nga të dhënat e serisë kohore ndihmojnë në marrjen e vendimeve në

lidhje me veprimet pasardhëse që duhet të ndërmerren. Disa aktivitete që kanë të bëjnë me

analizën e serive kohore janë: përcaktimi i serisë kohore, klasifikimi i tyre duke evidentuar

karakteristika specifike të saj si dhe informacione statistikore që lidhen me të. Në varësi të

karakteristikave që të dhënat mbartin, seritë kohore mund të jenë stacionare dhe jo-stacionare



Blerina VIKA

43

, sezonale dhe jo-sezonale, lineare dhe jo-lineare si dhe me një-ndryshore ose me shumë

ndryshore (Palit A. K. dhe Popovic D., 2005). Një seri kohore mund të shfaqë një ose më

shumë nga këto tipare.

Seritë kohore nisur dhe nga emri i tyre kanë si tipar një renditje natyrale të tyre bazuar në

kohën e vëzhguar. Parashikimi i serive kohore lidhet me përdorimin apo ndërtimin e një

modeli që parashikon vlerat e ardhshme të ndryshores nisur nga vlerat e shkuara të vëzhguara

të tij.

Modelet e parashikimit mund të jenë me një-ndryshore ose me shumë-ndryshore. Në rrjetat

neurale që përdoren për problema parashikuese me natyrë përshkruese, model me shumë-

ndryshore, të dhënat hyrëse zakonisht përbëhen nga disa ndryshore përshkrues të pavarur dhe

një ndryshore dalëse të varur. Funksioni vlerësues i lidhjes, që përdorë rrjetin neural, mund të

shkruhet si:

Y = (X1, X2, …, Xp) (4.1)

ku X1, X2, …, Xp janë p-ndryshore të pavarura dhe y është ndryshorja e varur. I parë në këtë

këndvështrim, rrjeti neural është ekuivalent nga ana funksionale me një model të regresionit

jo-linear.

Nga ana tjetër, për një problem parashikues të serive kohore apo ekstrapoluese, si model me

një-ndryshore, të dhënat hyrëse përbëhen nga vëzhgime të kaluara të ndryshores ndërsa e

dhëna dalëse është një vlerë e ardhshme e parashikuar (Vika B., Martiri E. & Xhaja D.,

2011). Rrjeti neural në këtë rast kryen funksionin e hartuar më poshtë:

Yt+1 = (Yt, Yt-1, ..., Yt-p) (4.2)

Ku Yt është vlera e ndryshores së vëzhguar në kohën t. Në këtë rast, rrjeti neural është

ekuivalent me një model auto regresiv jo-linear për problemat e parashikimit të serive kohore

(Zhang G., Patuwo E. B., Hu M., 1998). Qëllimi i parashikimit të serisë kohore është në

modelimin e mekanizmit që mund të parashikoj vlerat e ardhshme të serisë në afatshkurtër

apo atë të mesëm.

Parashikimi ekonomik apo ai financiarë është procesi i kryerjes së parashikimeve rreth

treguesve të ndryshëm të ekonomisë. Parashikimet mund të kryhen në një nivel të lartë

agregimi, p.sh për GDP, inflacioni, papunësinë ose deficitin fiskal, ose në një nivel më të ulët

agregimi si për sektorë specifikë të ekonomisë ose dhe për firma specifike. Kuptimi dhe

parashikimi i „ciklit të biznesit‟ në ekonomi ndikon shoqërinë në tërësi si dhe ka ndikim të

rëndësishëm gjithashtu në faktorët politiko-sociale (Moody J., 1995).



Blerina VIKA

44

Në kohën e sotme ekzistojnë një numër i madh metodologjish që përdoren për parashikim.

Secila prej këtyre metodave ka avantazhet dhe kufizimet e saj. Përzgjedhja e metodës më të

përshtatshme shpesh bëhet bazuar në eksperiencë personal dhe gjykime profesionale. Në

përgjithësi në rastet kur duhet të parashikohen fenomene të ndryshme përdoren përqasje të

thjeshta për ta përshkruar fenomenin.

Nëse modeli i aplikuar rezulton si një paraqitje e mirë për kushtet në botën reale atëherë

modeli pranohet si një mjet i përshtatshëm për të parashikuar të ardhmen. Por në rast se

modelet e thjeshta nuk japin rezultate te kënaqshme atëherë zgjidhen modele më komplekse.

Në vetvete modelet komplekse kërkojnë që të bëhen më shumë supozime lidhur me të.

Por pavarësisht nëse ne zgjedhim një model të thjesht ose jo, procesi i parashikimit kërkon

zbatimin e disa hapave të njëjtë. Në Algoritmi 4-1 e mëposhtme jepen me anë të një skeme

hapat e procesit të përgjithshëm për parashikim:

Algoritmi 4-1: Bllok-skema e procesit të përgjithshëm për parashikim



Blerina VIKA

45

Siç mund të shihet qartë nga skema e paraqitur, procesi fillon me përcaktimin e fenomenit që

kërkohet të studiohet. Duhet që në hapin e parë të jenë përcaktuar mirë dhe qartë objektivat e

studimit. Më pas kalohet në mbledhjen e të dhënave të cilat janë thelbësore, duke evidentuar

varësitë e ndryshme të cilat mund të ekzistojnë, si dhe gjatësinë e kohës për parashikim.

Në hapin pasardhës bëhet një analizë teorike mbi modelin që duhet zhvilluar në mënyrë që ti

jap zgjidhje objektivave të studimit. Kjo lloj analize ndihmon në përpunimin e mëtejshëm të

varësive të ndryshme midis ndryshoreve të modelit. Si dhe në ndarjen e faktorëve në të

jashtëm apo të brendshëm.

Pasi është zhvilluar modeli teorik kalohet në dizenjimin dhe ndërtimin e modelit praktikisht.

Mbi këtë model duhen bërë testime në lidhje me besueshmërinë dhe vlefshmërinë e tij. Në

këtë fazë modeli është në gjendje të ofroj rezultate të cilat interpretohen dhe vlerësohen. Për

të vlerësuar saktësinë e tij krahasohen rezultatet e parashikuara me rezultatet reale. Mbi bazën

e vlerësimit nëse nuk rezulton i suksesshëm atëherë kemi kthim në fazat e mëparshme, e cila

përcaktohet nga analiza e këtyre rezultateve. Në rast suksesi, modeli përdoret si një mjet për

vendimmarrje dhe analiza të fushës. Por saktësia e një modelit nuk mund të jetë e përhershme

pasi mund të kemi ndryshime të kushteve në fushën e aplikuar gjë që do të çonte në fillim të

procesit.

Një aftësi e lartë parashikuese nënkupton një vendimmarrje më të mirë. Të parashikosh

nënkupton të përpiqesh të kuptosh influencën e mundshëm në disa ngjarje ekonomike apo

fenomene mbi tregjet financiare në mënyrë që të krijohen politika të suksesshme me

probabilitet të lartë apo të mund të vetë-pozicionohemi në mënyrë që të jemi të përgatitur në

lidhje me rreziqe potenciale të cilat mund të përballemi (Roche, 2014).

Por procesi i parashikimit në përgjithësi, por edhe ai ekonomik në veçanti është shumë i

vështirë dhe shterues. Pengesa hasen në të dhënat që do të përdoren të cilat nuk janë në

cilësinë dhe sasinë e nevojshme, si dhe në modelet e përdorura pasi çdo model ka avantazhet

dhe kufizimet e tij.

Modelimi dhe parashikimi i serive kohore në ekonomi janë një sfidë për disa arsye (Vika B.,

Sevrani K. & Vika I., 2016):

1. Edhe modelet më të sakta për parashikimin e ekonomisë janë modele të tipit „kuti e

zezë ‟, ato nuk kryejnë supozime në lidhje me strukturën e ekonomisë. Nuk është

paraqitur ende një model shkencorë bindës dhe i përshtatshëm për dinamikën e ciklit të

biznesit.



Blerina VIKA

46

2. Sistemi ekonomik është kompleks dhe është e pamundur të kryhen kontrolle

eksperimentale në ekonomi (Stencl M. dhe Stastny J., 2011).

3. Të dhënat reale të ekonomisë dhe të biznesit shpesh nuk i përmbushin në mënyrë

rigoroze supozimet e metodave të thjeshta statistikore të parashikimit.

4. Një problem tipik i bashkësisë reale për të dhënat lidhet me cilësinë e parashikimeve

numerike. Në përgjithësi këto të dhëna janë shumë të zhurmshëm dhe kanë sinjale të

dobëta për të treguar zhurmat në to. Mungesa e të dhënave ka ndikim në zvogëlimin e

cilësisë së parashikimit numerik (Stencl M. dhe Stastny J., 2011)

5. Lineariteti i fortë përshkrues që ekziston në modelet tradicionale çon shpesh në metoda

të papërdorshme ose në ndërtimin e modeleve që nuk arrijnë të paraqesin realitetin.

6. Një vështirësi që përballen të gjitha modelet lidhet me përcaktimin e informacionit të

nevojshëm dhe të mjaftueshëm për një parashikim të mirë. Ky është dhe një problem

thelbësor që lidhet me Shqipërinë, seritë kohore aktualisht në dispozicion janë

relativisht të shkurtra. Gjatësia e vlerave ekonomike të përzgjedhura nuk janë të gjata

mjaftueshëm për të siguruar cilësi të mirë për parashikimet.

7. Metodat që përdorin modelet tradicionale jo-lineare bazohen në të dhënat parametrike,

duke ngritur supozime rreth lidhjeve që mund të kenë ato në një problem të caktuar.

Këto janë vetëm disa nga vështirësitë që lidhen me modelimin e parashikimeve ekonomike

dhe financiare.

4.3 Rrjetat neurale si mjete parashikimi

Rrjetat neurale artificiale janë propozuar dhe përdorur gjerësisht, në literatura të ndryshme, si

modele parashikuese. Veçoritë që kanë seritë kohore ekonomike dhe financiare bëjnë që

RNA-e të shihen si modele të suksesshme për parashikimet. Rrjetat neurale i tejkalojnë

teknikat tradicionale të parashikimit në disa aspekte.

Karakteristikë për modelet neurale është se, pa përdorur supozime fillestare janë në gjendje të

nxjerrin apo gjenerojnë rregulla nëpërmjet procesit të trajnimit nga shembuj (ChangI. Ch.,



Blerina VIKA

47

Hwang H. G., 1998). Kjo karakteristikë e RNA-e është shumë e dëshiruar në rastet kur të

dhënat bazë nuk mund të përftohen nëpërmjet parashikimeve financiare.

Sipas S. Gonzalez, rrjetat neurale kanë aftësi të mëdha për të zbuluar dhe riprodhuar lidhjet

lineare dhe jo-lineare midis ndryshoeve (Gonzaley, 2007). Tregues të ndryshëm ekonomikë

nuk mund të përshkruhen saktësisht nga modele lineare. Rrjetat neruale klasifikohen si

modele jo-lineare duke bërë të mundur të arrihet në një shpjegim më të mirë për të dhënat në

krahasim me modelet tradicionale lineare (Basheer I.A. dhe Hajmeer M,, 2000).

Këto modele shihen si të përshtatshme dhe në rastet kur kemi seri kohore shumë të luhatshme

apo e thënë ndryshe me luhatshmëri të lartë si dhe kur seritë përmbajnë zhurma apo mbajnë

informacion të pjesshëm (C. Kandilar, M.Simsek, C. H. Aladag, 2009). Duke qenë se këto

modele janë të pandjeshme ndaj zhurmave atëherë ato ofrojnë parashikime të sakta kur të

dhënat janë të pasigurta apo kanë gabime në matje (Basheer I.A. dhe Hajmeer M,, 2000).

Një tjetër elementë që është avantazh i rrjetave neurale kundrejt modeleve tradicionale

statistikore lidhet me natyrën lehtësisht të ndryshueshme të arkitekturës së rrjetit neurale.

Nëpërmjet një procesi mësimi të shoqëruar me përshtatje bëjnë të mundur që rrjeti të

modifikoi apo përditësoi strukturën e tij duke ju përshtatur dhe natyrës dinamike të mjedisit

(Basheer I.A. dhe Hajmeer M,, 2000).

Rrjetat neurale artificiale janë përgjithësues. Ato mund të mësojnë nga shembujt duke shfaqur

disa aftësi përgjithësuese të cilat shkojnë përtej të dhënave të përdorura për trajnim (Yao,

2002).

Kanë një strukturë funksionale përgjithësuese (C. Kandilar, M.Simsek, C. H. Aladag, 2009).

RNA-e janë në gjendje të përafrojnë automatikisht çfarëdolloj forme funksionale që

karakterizon më mirë të dhënat (T. Hill, L. Marquez, W. Remus, 1994).



Blerina VIKA

48

4.4 Hapat e parashikimit me anë të RN-l

„Një rrjet neural nuk është një sistem magjik të

cilit i jepen disa të dhëna dhe ai të mund të arrijë të gjej

mënyrën për t‟u pasuruar‟

Realizimi i parashikimit nëpërmjet RN-e ndjek hapat kryesore të procesit të përgjithshëm të

parashikimit të ilustruar në Algoritmi 4-1. Duhet theksuar se është e domosdoshme të

evidentohen më shumë elementë apo detaje specifike në çdo hap, për të qartësuar tiparet dhe

cilësitë të cilat janë thelbësore për aplikimin e rrjetit neural në parashikim. Përpara se një RN

të përdoret për parashikimi ai duhet të jetë ndërtuar dhe vlerësuar për aftësitë e tij. Sipas

Haykin (Haykin, 1999) në përgjithësi modelimi i një rrjeti neural përbëhet nga tre etapa

kryesorë:

1. Konfigurimi – në të cilën përcaktohet se si organizohen dhe lidhen shtresat

2. Mësimi – që lidhet me mënyrën se si ruhet informacioni

3. Përgjithësimi – Si arrin RN të prodhoj të dhëna dalëse të arsyeshme për të dhënat

hyrëse që nuk i ka përdorur më parë në fazën e mësimit.

Për të plotësuar më mirë këtë modelim do të ishte e nevojshme që të përfshihen dhe analizat

që duhen kryer mbi të dhënat që do të përdoren në parashikim. Konfigurimi përbëhet në

përcaktimin e të dhënave që do përdoren si dhe zgjedhja e topologjisë së përshtatshme.

Aktivitetet kryesore që duhen përfshirë në secilën fazë shprehen më të detajuara në vazhdim:

Përgatitja e të dhënave për parashikim p.sh mbledhja, normalizimi, strukturimi i të dhënave,

përcaktimi i bashkësisë së të dhënave që do të shërbejnë për trajnim dhe testim e vetë

RN-l. Përzgjedhja e mënyrës për procesimin e të dhënave hyrëse dhe përzgjedhja e duhur

e të dhënave përshkruese pasi kjo do të ndikonte në performancën e parashikimit.

Përcaktimi i arkitekturës së rrjetit, çfarë nënkupton zgjedhjen e tipit të rrjetit që duhet të

përdoret për parashikim, përcaktimit i numrit të nyjeve hyrëse, të fshehura dhe dalëse të

rrjetit, numri i shtresave, përcaktimi i lidhjeve ndërmjet nyjeve etj.

Projektimi i strategjisë së trajnimit të rrjetit p.sh përzgjedhja e algoritmeve të trajnimit dhe

teknikat e monitorimit të trajnimit.

Vlerësimi i përgjithshëm i rezultateve të parashikimit duke përdorur grupet e reja për të

dhënat e vëzhguara të cilat RN-l nuk i ka parë gjatë fazës së trajnimit të tij.



Blerina VIKA

49

Një metodologji me tetë hapa ndërtues është përdorur për modelimin e rrjetave neurale

parashikuese, e prezantuar nga Boyd dhe Kaastra (Kaastra, I. dhe Boyd, M, 1996) paraqitet

në figurën e mëposhtme (Algoritmi 4-2):

Këto hapa zakonisht nuk janë të kalueshme vetëm nga një herë por mund të jetë e nevojshme

rikthimi në hapat e mëparshme sidomos ndërmjet përzgjedhjes së ndryshores dhe trajnimit të

rrjetit. Siç shihet, tre hapat e parë të kësaj metodologjie përzgjedhja, mbledhja dhe përpunimi

i të dhënave përbëjnë të gjithë fazën e përgatitjes së të dhënave që do të „ushqejnë‟ rrjetin/tat

neural.

Hapi i pestë përcakton arkitekturën që duhet të ketë rrjeti neural. Strategjia që do të

përzgjidhet për të trajnuar rrjetin do të realizohet në hapat 6 dhe 7 më tej pasohet me

implementimin dhe vlerësimin e rrjetit.

Dizenjimi i një rrjeti neural të suksesshëm për të bërë parashikime mbi seritë kohore është një

çështje komplekse. Nuk ekzistojnë rregulla të qarta dhe të mirë përcaktuar për t‟u aplikuar në

secilën nga hapat e modelimit të rrjetit neural. Në literaturë gjenden një numër i madh

sugjerimesh të ndryshme që bëhen bazuar në analizat teorike dhe ato empirike të kryera në

to.

Ajo që pranohet gjerësisht është se dizenjimi i rrjetit neural në vetvete është art. Më poshtë do

bëhet një përshkrim më i detajuar për secilin nga hapat.

Hapi 1: Përzgjedhja e Ndryshoreve;

Hapi 2: Mbledhja e të dhënave;

Hapi 3: Përpunimi i të dhënave;

Hapi 4: Përcaktimi i bashkësisë së të dhënave Trajnuese, Testimit dhe

Validimit;

Hapi 5: Struktura e rrjetit neural;

numri i shtresave të fshehura

numri i nyjeve të fshehura

numri i nyjeve dalëse

funksioni transferues apo aktivizimit

Hapi 6: Kriteret e vlerësimit;

Hapi 7: Trajnimi i rrjetit neural;

Numri i iteracioneve të trajnimit

Shkalla dhe intesiteti i të mësuarit

Hapi 8: Implementimi.

Algoritmi 4-2: Hapat e ndërtimit të RN parashikues



Blerina VIKA

50

4.4.1 Parapërgatitja e të Dhënave për Parashikim

Suksesi i projektimit të një rrjeti neural varet nga kuptimi sa më i qartë i problemit. Përgjatë

përzgjedhjes së ndryshoreve, fokusi është rreth të dhënave të papërpunuara nga të cilat do të

zhvillohen një shumëllojshmëri treguesish. Këta tregues do të formojnë të dhënat hyrëse për

rrjetin neural. Të dhënat që përdoren për analizën dhe parashikimin e serive kohore janë të

dhëna të mbledhura nëpërmjet vëzhgimeve ose nga matjet e ndryshores së zgjedhur.

Hapi 1: Përzgjedhja e ndryshores/ve

Dy janë trajtimet thelbësore për të zgjedhur seritë kohore të ndryshores/ve që do të përdoren

për të realizuar parashikimin. Trajtimi me një ndryshore në të cilën parashikimi i ndryshores

së varur (që kërkohet të parashikohet) bazohet mbi një model të ndërtuar vetëm mbi vonesat

kohore të vetë ndryshores së varur, ndryshe të quajtura të dhëna teknike. Ndërsa në përqasjen

e dytë, atë të shumë ndryshoreve, parashikimi i serisë kohore varet, qoftë dhe pjesërisht, nga

disa seri të tjera të njohura si të dhëna thelbësore të cilat mendohen se kanë efekt në sjelljen e

ndryshores së varur.

Në përgjithësi, përzgjedhja e ndryshoreve bëhet duke u bazuar në fushën e aplikimit dhe në

qëllimet e vetë kërkuesve. Në këtë fazë përcaktohen numri i ndryshoreve që do të studiohen

si dhe intervali kohor i vëzhgimeve për çdo variabël.

Megjithatë nuk është e lehtë të identifikosh se cilat janë ndryshoret hyrëse të cilat do të

ndikonin në parashikim. Në parashikimet që bëhen mbi bazën e shumë ndryshoreve

përzgjedhja mund të kryhet nëpërmjet modeleve statistikore të cilët përcaktojnë se cilët janë

ndryshore të cilat kanë ndikim në parashikim ose nëpërmjet teorive ekzistuese ekonomike.

Shumë modele parashikuese mund të përdorin si ndryshore hyrëse. jo vetëm vonesat kohore

të vetë ndryshores që kërkohet të parashikohet por dhe ndryshore të tjera ekonomik të cilët

mendohet se ndikojnë në ndryshoren e varur.

Hapi 2: Mbledhja e të dhënave

Në momentin që merret një vendim në lidhje me ndryshoret që do të përdoren për të kryer

parashikimin është e nevojshme të merret në konsideratë kostoja dhe mundësia e sigurimit të



Blerina VIKA

51

tyre. Shpesh ekzistojnë disa burime nga ku mund të merren të dhëna por është e rëndësishme

që cilësia e të dhënave të jetë sa më e lartë. Mbi të dhënat e përzgjedhura duhen realizuar

kontrolle për të evidentuar ekzistencën e gabime të ndryshme apo nëse ka mungesa të vlerave

të ndryshores në serinë kohore. Të dhënat e mbledhura duhet të jenë të përshtatshme, të

vlefshme si dhe të besueshme. Është e qartë se këto kritere do të përmirësonin saktësinë e

parashikimit.

Shpesh seritë e kohore për ndryshoret që do të përdoren në parashikim mund të

karakterizohen nga mungesa të observimeve apo dhe zhurmave në to. Problemet që lidhen me

mungesën e vëzhgimeve ose prezencën e zhurmave trajtohen në dy mënyra: të gjitha

vëzhgimet që mungojnë hiqen dhe supozohen që ngelen të pandryshuara me anën e

interpolimit ose merren si mesatarja e vlerave të afërta (Zhang G., Patuwo E. B., Hu M.,

1998).

Hapi 3: Përpunimi i të dhënave

Një hap i rëndësishëm është përpunimi i të dhënave ose parapërgatitja e të dhënave për t‟u

përdorur më pas si vlera hyrëse të rrjetit neural. Parapërgatitja ka të bëjë me analizimin dhe

transformimin e të dhënave hyrëse dhe dalëse. Një fazë që ndihmon në minimizimin e

zhurmave, evidentimin e lidhjeve të rëndësishme, gjetjen e trend-eve dhe normalizimin e

shpërndarjes së ndryshores për të lehtësuar dhe ndihmuar rrjetin neural për të mësuar

(Kaastra, I. dhe Boyd, M, 1996). Të dhënat e përpunuara i japin mundësinë rrjetit neural që të

nxjerrë më lehtë shembujt domethënës të cilat mbarten në këto të dhëna.

Në raste shumë të rralla rrjetit mund t‟i jepen të dhëna hyrëse dhe dalëse në trajtë të

papërpunuar. Por dhe në këto raste të dhënat i nënshtrohet një shkallëzimi, vlerat e tyre

transformohen brenda segmentit [0,1] ose [-1,1] (Kaastra I. dhe Boyd M. , 1996). Ky

shkallëzim realizohet nga funksioni i transferimit që përdorin nyjet e rrjetit neural. Por për të

kryer një parashikim sa më efikas transformimi i të dhënave duhet të përputhet me vlerat e të

dhënave hyrëse, me mesataren dhe variancën e tyre, e kombinuar kjo me funksionin e

aktivizimit të zgjedhur.

Nuk ekzistojnë rregullat të specifikuar për të bërë parapërgatitjen e të dhënave. Praktikisht ky

proces bëhet duke realizuar një procedure, me disa hapa, provo-dhe-vlerëso gabim.

Në rastet kur parashikimi i rrjetit nerual mbështetet në një seri kohore me një variabël atëherë

është e nevojshme të identifikohet dhe gjendet sezonaliteti në seri dhe më pas të aplikohen



Blerina VIKA

52

teknika transformuese të përshtatshme për të eliminuar atë, kjo do të ndihmonte të kuptohej

më mirë procesi që ndodhë (Virili, F. & Freisleben, B., 2000). Në qoftë se të dhënat shfaqin

një variancë në rritje ose në zbritje përgjatë serisë atëherë është e nevojshme të kryhen

transformime të serisë.

Dy teknika kryesore të transformimit të serisë të cilat aplikohen gjerësisht si në metodat

tradicionale të parashikimit ashtu dhe në parashikimin me anë të rrjetave neurale janë

diferencë e parë (në vlerë absolute apo përqindje) dhe logaritmi natyrorë i ndryshores.

Diferencë e parë shpesh përdoret për të hequr trendin linear që mund të kenë të dhënat.

Transformimi logaritmik i serisë është më përshkrues, bënë të mundur që ndryshimet në

vlerat logaritmike të interpretohen si ndryshime relative të shkallëzimit fillestar të serisë.

Gjithashtu në këtë transformim parashikimet detyrohen që të qëndrojnë pozitive në lidhje me

shkallëzimin fillestar.

Teknika më e përdorur në transformimin e të dhënave është normalizimi i të dhënave.

Normalizimi i të dhënave është një proces i parapërgatitjes finale për të dhënat, të gatshme

për t‟u përdorur në vijim për trajnimin e rrjetit neural (Kaastra, I. dhe Boyd, M, 1996). Kjo

teknikë përdoret për të shkallëzuar vlerat e të dhënave në një segment më të ngushtë.

Parapërgatitja e të dhënave hyrëse duhet të bëhet në mënyrë të tillë që të gjitha ndryshoret të

marrin një shpërndarje të njëjtë për nga rëndësia. Të dhënat me vlerë absolute më të madhe

duhet të kenë rëndësi të njëjtën me ato të dhëna që kanë një vlerë më të vogël (P. W. Ch.

Prasad & Azam Beg, 2009). Shpesh herë të dhënat me vlerë më të madhe mund të kenë efekt

më të madh se sa një e dhënë me vlerë më të vogël. Është e rëndësishme të theksohet që i

njëjti normalizim duhet të kryhet si për të dhënat hyrëse dhe për ato dalëse.

Teknika e normalizimit në rastin e rrjetave neurale kryhet për të siguruar:

1. „Peshë‟ të njëjtë për çdo të dhënë hyrëse

2. Për të zbuluar dinamizmin e njësive të fshehura që ndodhen në shtresën e parë të

fshehtë.

3. Një kohë më të shkurtër për procesin e trajnimit duke bërë që rrjetin neural të mësojë

më lehtë lidhjet e rëndësishme në të dhënat e paraqitura.

4. Të dhëna me një shpërndarje të rregullt

Zhang (Zhang G., Patuwo E. B., Hu M., 1998) ka përmendur katër metoda kryesore që duhen

përdorur për normalizimin e të dhënave:



Blerina VIKA

53

1. Normalizim nëpër kanal: ku çdo kanal përbën një të dhënë hyrëse të „pavarur‟. E

thënë ndryshe çdo e dhënë hyrëse normalizohet në mënyrë të pavarur nga të dhënat e

tjera.

2. Normalizim përgjatë kanalit: Normalizimi në këtë rast kryhet për çdo vektorë hyrës.

Pra normalizohen të gjithë elementët përbërës të një modeli të dhënash.

3. Normalizim me kanale të përziera: në këtë metodë bëhet një kombinim i

normalizimit përgjatë kanalit dhe atij nëpër kanal.

4. Normalizim i jashtëm: Të gjitha të dhënat e trajnimit normalizohen brenda një

segmenti të caktuar.

Përzgjedhja e metodës së normalizimit bëhen në lidhje me strukturën që ka vektori i të

dhënave hyrëse. Në rastet kur dëshirohet të përdoren rrjetat neurale për parashikim, si metodë

e përshtatshme për normalizim është vetëm normalizimi i jashtëm. Pavarësisht metodës së

zgjedhur për normalizimin e të dhënave formulat me të përdorura janë:

Transformim linear në segmentin [0,1] (normalizim min-max):

( ) ( ) (4.3)

Transformim linear në [a,b] (normalizim min-max):

( )( )

( ) (4.4)

Normalizim z-score (ose zero- mesatare) :

( ̅) (4.5)

Normalizim i thjeshtë :

(4.6)

Ku me dhe janë shënuar respektivisht vlera e normalizuar e të dhënës dhe vlera

origjinale e saj. Ndërsa me ̅ janë minimumi, maksimumi, devijimi

standard dhe mesatarja e të dhënave.



Blerina VIKA

54

Normalizimi është e qartë që bënë ndryshimin e të dhënave fillestare prandaj për këtë arsye

është e domosdoshme që parametrat e normalizimit të ruhen në mënyrë që të ripërdoren në

dhënat e reja për të pasur transformim në mënyrë uniforme për të gjitha të dhënat. I njëjti tip

normalizimi duhet bërë dhe mbi të dhënat dalëse. Kështu që për të interpretuar rezultatin e

prodhuar nga rrjeti neural duhet që të dhënat dalëse të rikthehen në vlerat origjinale.

Vlerësimi i saktësisë së rrjetit realizohet mbi vlerat origjinale.

Vlen të theksohet që nuk ekziston ndonjë teknikë normalizimi e cila mund të jetë e

përshtatshme për çdo lloj modeli apo çdo lloj problemi. Për të gjetur normalizimin që jep

rezultatin më të mirë duhet të provohen lloje të ndryshme dhe të zgjidhjet më i miri ndërmjet

tyre. Në literaturë tregohet që për të rritur performancën e parashikimit të modelit,

normalizimi duhet përzgjedhur dhe mbështetur mbi problemin që trajtohet.

Hapi 4: Përcaktimi i bashkësive për të dhënat: Trajnimin, Testimin dhe Validimin;

Rrjeti neural që do të përdoret për parashikim duhet që fillimisht ai të trajnohet mbi të dhënat

e serisë. Qëllimi i trajnimit është gjetja e parametrave të rrjetit të cilët do të prodhojnë

performancë më të mirë parashikuese. Performanca e rrjetit vlerësohet me të dhënat të cilat

rrjeti nuk i ka ndeshur më parë.

Në përgjithësi për të ndërtuar rrjetin neural artificial kërkohen shembuj të dhënash për trajnim

dhe testim e tij. Të dhënat e trajnimit përdoren për të zhvilluar modelin e rrjetit neural ndërsa

të dhënat e testimit përdoren për të vlerësuar aftësitë parashikuese të modelit. Gjithashtu

përdoret dhe një grup i tretë shembujsh, ai i validimit, i cili përdoret për të shmangur

problemin e përshtatjes së tepërt ose për të përcaktuar pikën e ndalimit për procesin e

trajnimit. Bashkësia e të dhënave trajnuese është më e madhe se ajo e validimit dhe e

testimit. Këto janë tre bashkësi të pavarura nga njëra-tjetra që së bashku formojnë serinë e

plotë e të dhënave.

Sasia e të dhënave që janë në dispozicion nga fusha e aplikimit shpeshherë është shumë e

kufizuar. Ndarja e serisë në tre bashkësi do të bënte që sasia e të dhënave për trajnimi do të

ishte shumë e vogël. Rrjeti neural në këtë rast do të kishte shumë pak shembuj për të mësuar

si dhe për të përgjithësuar njohurit e veçanta në këto të dhëna.

Në situata të tilla shpesh mund të përdoren teknika si boosting, bagging etj. të cilat

mundësojnë përmirësimin e performancës së algoritmit trajnues (Zheng, 2006). Këto teknika

aplikohen shpesh pasi është bërë ndarja e serisë në nën/bashkësi, në mënyrë që të përftohet

një model i cili funksionon për çdo nën/bashkësi të dhënash (Yao, 2002).



Blerina VIKA

55

Një tjetër element thelbësorë që kërkon të përcaktohet nga ndërtuesit e rrjetit neural lidhet më

mënyrën se si duhet bërë ndarja e bashkësisë së të dhënave në tre nën/bashkësi. Bashkësia e

testimit duhet të jetë ndërmjet 10% deri 30% e bashkësisë së trajnimit (Kaastra I. dhe Boyd

M. , 1996). Një rregull i përgjithshëm, që mbështetet në eksperiencën e autorëve të ndryshëm,

për ndarjen e serisë në tre bashkësitë, trajnim, validim dhe testim është 70%, 15% dhe 15%

ose 80%, 15% dhe 5% (Gonzaley, 2007) (Zhang G., Patuwo E. B., Hu M., 1998).

Në një numër të konsiderueshëm punimesh sugjerohet që pjesa e seria që do të përdoret për

trajnim të përbëhet vetëm nga ngjarje kritike ose të jetë një përzgjedhje e rastësishme e

ngjarjeve (Gupta J. N. D., Smith K. A., 2001) (Singh, S.K.; Jain, S.K.;Bardassy, A., 2014).

Është e kuptueshme që ngjarjet historike nuk mund të kontribuojnë njësoj në ndërtimin e

modelimit të rrjetit neural. RN-l është një model që udhëhiqet nga të dhënat që i paraqiten.

4.4.2 Ndërtimi i RN-l për parashikim

Hapi 5: Struktura e RN-l

Në këtë hap përcaktohet topologjia e RN, shtresat e ndërmjetme dhe funksioni i aktivizimit.

Ky punim studion topologjinë SHS të rrjetave neurale. SHS (Figure 4-1) janë rrjetat neruale

më të përdoruara në fushën e parashikimeve (Zhang G., Patuwo E. B., Hu M., 1998) (Kaastra

I. dhe Boyd M. , 1996). Rrjetat SHS janë një strukturë me shumë shtresa që kryen hartëzimin

e lidhjeve jo-lineare midis të dhënave hyrëse dhe dalëse. Ndryshe ato njihen si rrjetat furnizim

me një-drejtimi (FD) pasi në këtë arkitekturë nuk përfshihen lidhje që të kthejnë informacion

mbrapa në shtresat furnizuese. Rrjedhja e informacionit bëhet nga shtresa hyrëse drejt

shtresës dalëse.

Rrjeti FD është një rrjet statik i cili prodhon një bashkësi me vlera dalëse. Ky rrjet nuk përdor

memorie, që do të thotë se vlerat dalëse që prodhohen nga rrjeti në një moment nuk varen nga

gjendjet e mëparshme të rrjetit. Rrjetat FD janë modele përgjithësuese universale (Bishop,

2006) (Gonzaley, 2007) (Kaastra, I. dhe Boyd, M, 1996).

Në rastin e përdorimit të kësaj topologjie për parashikim, si vlera në njësit hyrëse të rrjetit

SHS vendosen vlerat e ndryshoreve të pavarura që do përdoren për parashikimin e ndryshores



Blerina VIKA

56

së varur. Ndërsa vlera e parashikuar për ndryshoren e varur merret në njësinë dalëse.

Funksioni vlerësues i lidhjes që përdorë rrjetin neural mund të shkruhet si:

Y = (X1, X2, …, Xp) (4.7)

ku X1, X2, …, Xp janë p-ndryshore të pavarur dhe Y është një ndryshore e varur.

Figure 4-1: Struktura e një rrjeti SHS

Në këtë rast është e rëndësishme të përcaktohen ndryshoret që ndikojnë në parashikimin e

ndryshores së varur. Në pjesën më të madhe zgjedhja e ndryshoreve të pavarur bëhet mbi

bazën e teorive ekonomike. Nëse numri i tyre është i madh atëherë përdoren metoda

statistikore për të bërë vlerësimin e ndikimit të çdo ndryshoreje të pavarur në ndryshoren e

varur.

Kurse në rastin kur kërkohet të modelohen seritë kohore me një ndryshore (univariate),

nëpërmjet rrjetave neurale, si vlera hyrëse të rrjetit vendosen vonesat kohore të vetë

ndryshores dhe vlera e parashikuar merret vlera e nxjerr në njësisë dalëse. Rrjeti neural në

këtë rast kryen funksionin e hartuar më poshtë:

Yt+1 = (Yt, Yt-1, ..., Yt-p) (4.8)



Blerina VIKA

57

ku Yt është vlera e ndryshores së vëzhguar në kohën t. Në këtë rast është shumë e

rëndësishëm përcaktimi i numrit të përshtatshëm, për vonesat kohore p të ndryshores së

vëzhguar, që do të përdoren për të evidentuar modelet përgjithësuese në atë seri. Përdorimi i

të dhëna hyrëse me pakicë ose me tepri do të rezultonte në një rrjet me aftësi parashikuese të

ulët.

Në punimin e tyre May et al (May R.,Dandy G., & Maier H., 2011) evidentojnë se në

përzgjedhjen e numrit për të dhënat hyrëse, tiparet të cilat ndikojnë në performancën e

modelit janë:

a. Rëndësia e të dhënave, Në rast se të dhënat e përzgjedhura janë të pakta apo

informacioni që ato mbartin nuk janë të mjaftueshme për të përshkruar sjelljen e

ndryshores do të bënin që modeli të kishte një sjellje të dobët.

b. Përpjekje të lartë llogaritëse, si rezultat i përdorimit të një sasie të madhe për të

dhënat hyrëse, rrjeti neural do të kishte një strukturë të madhe. Për të dhënë vlerat

dalëse rrjetit do të duhet të realizonte një numër shumë herë më të madh veprimesh.

Veprimet përllogaritëse që do të bënte rrjeti do të rritesh në mënyrë eksponenciale me

rritjen e të dhënave hyrës së rrjetit.

c. Vështirësi trajnimi, procesi i trajnimit të rrjetit do të vështirësohej nëse të dhënat janë

me tepri dhe të papërshtatshme. Në këtë rast mund të përballeshim me problemin e

ngecjes në optimalitete lokale dhe jo ato globale, si dhe fokusim të tepërt në

rregullimin e parametrave lidhës në rrjet që nuk kanë lidhje me rezultatin e rrjetit.

d. Përmasa. Nëse përmasa e modelit rritet në mënyrë linearet atëherë kapaciteti që

nevojitet për modelimin e parashikimit rritet në mënyrë eksponenciale. Pra hapësira e

nevojshme për të realizuar trajnimin e rrjetit do të ishte shumë e madhe.

e. Kuptueshmëria, përdorimi i RN-l për të parashikuar ka si mangësi aftësinë për të

shpjeguar se si e realizon parashikimin. Rrjetat neurale shihen si „kuti të zeza‟ për sa i

përket aftësisë shpjeguese të rezultatit, nisur nga të dhënat hyrëse. Minimizimi i

kompleksitetit të RN-l duke zvogëluar informacionin e tepërt apo madhësinë e rrjetit,

do të rriste mundësinë për të kuptuar procesin parashikues.

Përpjekje të shumta janë bërë nga autorë të ndryshëm për të ofruar teknika të përshtatshme që

realizojnë përzgjedhjen e ndryshoreve hyrëse për rrjetit neural. Pavarësisht kësaj duhet thënë

se nuk ekzistojnë rezultatet teorike të cilat të sugjerojnë se cili është numri më i mirë i

vonesave kohore të ndryshores që duhet përdorur. Sipas Maier (Maier H. R.,Jain A., Dandy

G. C. & Sudheer K. P., 2010) është e nevojshme të vlerësohet dhe krahasohet besueshmëria



Blerina VIKA

58

për metoda të ndryshme të ndarjes së të dhënave që propozohen në literaturën e gjerë. Më

pas duhet të zgjidhet ajo e cila jep performancën më të mirë të rrjetit.

Në këtë punim përzgjedhja e të dhënave hyrëse bëhet nëpërmjet një procesi përsëritës provo-

dhe-vlerëso sasi të ndryshme të dhënash, duke përzgjedhur atë që sjell rritje të performancës

së modelit parashikues.

Numri i Shtresave të fshehta: Shtresat e fshehta janë ato që i mundësojnë rrjetit neural aftësi

përgjithësuese. Si nga ana teorike dhe ajo empirike sugjerohet që nëse përdorim më shumë se

një shtrese të fshehtë nuk rezulton detyrimisht në përmirësimin e rezultatit të RN-l. Për më

tepër rritja e numrit të shtresa të ndërmjet apo të fshehta do të rrisnin rrezikun për të pasur një

përshtatjet të tepërt me të dhënat e trajnimit si dhe rritje të kohës përllogaritëse të nevojshme

për trajnimin e rrjetit. Përshtatja e tepërt me të dhënat (Overfitting) ndodh sepse rrjeti kërkon

ti përshtatet të dhënave që përdoren për trajnim saqë ai humbë aftësitë e tij përgjithësuese mbi

të dhënat testuese.

Edhe pse rrjetat me shumë shtresa mund paraqesin një numër të madh funksionesh

përgjithësues, trajnimi i tyre ka qenë gjithmonë një sfidë. Kjo deri në kohën kur studimet

empirike kanë gjetur se këto rrjeta nuk performojnë më mirë, për të mos thënë që shpesh më

keq, se sa rrjetat SHS me një apo dy shtresa të fshehura (Bengio Y. & LeCun Y., 2007).

Rrjetat SHS me një shtresë të vetme janë rrjetat që përdoren më shpesh në ekonomi dhe në

problema të ndryshme klasifikimi. Në rastet kur të dhënat përmbajnë zhurmë, rezultatet e

arritura nëpërmjet rrjetave neurale SHS kanë ofruar saktësi më të lartë (Wang dhe Fu, 2005).

Rrjetat SHS me një shtresë me funksion aktivizimi sigmoidal mund të përafrojnë çfarëdolloj

funksioni të vazhdueshëm në çfarëdolloj shkalle saktësie (Hines, 1996).

Për të pasur një rrjet të trajnuar që përgjithëson mirë dhe që minimizon gabimin është e

nevojshme që të zgjidhet numri optimal jo vetëm për shtresat e fshehta që do të përdorë rrjeti

por dhe për nyjet e fshehtat që do të ketë secila shtresë e fshehur. Nëse përdoren më pak nyje

do të kishim si rezultat parashikim me gabim të lartë. Një numër i vogël nyjesh do e kishin të

vështirë të përshkruanin mirë njohuritë që gjenden në serinë kohore. Gjithashtu në të

kundërt, përdorimi i shumë nyjeve, do bënte rrjetin që të përshtatet shumë me të dhënat

trajnuese duke humbur aftësinë përgjithësuese për të dhënat testuese.

Ekzistojnë përqasje të ndryshme të cilat sugjerojnë mënyrën se si duhet përzgjedhur numri

më i mirë i neuroneve të fshehta që duhen përdorur.

1. Metoda provo dhe kontrollo gabimin (Panchal F., S. ; Panchal M., 2014): Në këtë

rast provohen sasi të ndryshme dhe testohet suksesi. Zgjidhet ai që performon më

mirë. Kjo metodë aplikohet në dy mënyra:



Blerina VIKA

59

a. drejtim i përparmë në të cilën fillohet me një numër të vogël neuronesh

(minimalisht 2) dhe vazhdohet duke e rritur numrin e tyre në shtresën e

fshehtë. Për çdo rrjet bëhet trajnimi i rrjetit dhe testimi i tyre dhe zgjidhet rrjeti

me performancën më të mirë.

b. drejtim së prapthi është e kundërta. Fillohet me një numër të madh neuronesh.

Pasi trajnohet dhe testohet ky rrjet bëhet zvogëlimi i neuroneve duke përsëritur

të njëjtin proces për çdo rrjet.

2. Metoda udhëzuese të përgjithshme2 (Karsoliya, 2012)

a. Numri i neuroneve në shtresën e fshehtë duhet të jenë sa 2/3 (nga 70%-90%) e

madhësisë së të dhënave hyrëse plus madhësinë e të dhënave dalëse.

b. Numri i neuroneve në shtresën e mesme duhet të jetë më pak se dyfishi i

numrit të neuroneve në shtresën hyrëse.

c. Numri i neuroneve në shtresën e fshehtë është midis madhësisë së shtresës

hyrëse dhe shtresës dalëse.

Funksionet e transferimit(aktivizimit) që përdoren në rrjetat neurale bëjnë një përqendrim të

vlerave dalëse rreth një vlere të caktuar që luan rolin e mesatares. Funksioni logjistik i

përqendron rreth vlerës 0.5. Më të përdorura janë funksionet jo-lineare.

Një rrjet SHS pa jo-linearitet nuk do të ndryshonte nga një filtër i thjeshtë linear. Kjo pasi

rrjeti do e kishte të pamundur të realizonte ndarjen jo-lineare apo të mësonte trajektoren për

të dhënat jo-lineare dhe jo-stacionare (Mandic D. P. & Chambers J. A., 2001). Funksioni i

aktivizimit ndikon në kompleksitetin dhe performancën e RN-l.

Në rastin e përdorimit të rrjetave neurale për parashikim, seritë kohore karakterizohen nga

natyra jo-lineare dhe të vazhdueshme. Funksioni sigmoid-al dhe ata të ngjashme me të, janë

përdorur shpesh në rrjetat neural parashikues pasi ato janë jo-lineare dhe me derivat të

vazhdueshëm. Këto janë veçori të përshtatshëm për trajnimin e rrjetit neural (Kaastra, I. dhe

Boyd, M, 1996).

Shpesh mund të përzgjidhen funksione të ndryshme transferimi për nyje që ndodhen në

shtresa të ndryshme. Por theksohet se nyjet e shtresës së mesme, në një rrjet neural për

parashikim, nuk duhet të kenë një funksion aktivizimi logjistik. Shpesh në punime të

ndryshme përdoren funksioni sigmoidal ose tanget hiperbolik. Është më mirë të ndërtohen

shtresa homogjene në lidhje me funksionin e aktivizimit.

2 Të tre këto mite në disa raste janë kundërshtuar pasi në to përjashtohet roli i topologjisë, i funksionit të

aktivizimit të rrjetit si dhe i algoritmit të trajnimit.



Blerina VIKA

60

Në rastin e nyjeve në shtresën dalëse mund të përdoret një funksion aktivizimi i përshtatshëm

për t‟i bërë një shpërndarje të caktuar vlerave ose një parapërgatitje për të dhënat hyrëse, në

mënyrë të tillë që të arrijnë shpërndarjen e dëshiruar të vlerave (Mandic D. P. & Chambers J.

A., 2001). Vetëm në rastin e përdorimit të RN-l për parashikimin e serive kohore me trend

duhet të përdoren neurone dalëse me një funksion jo-linear (Palit A. K. dhe Popovic D.,

2005).

Hapi 6: Kriteret e vlerësimit

Në rastin e RN-l, të dhënat ndahen në tre bashkësi të veçanta: trajnimi, validimi dhe testimi.

Të dhënat trajnuese dhe validuese përdoren për të gjetur parametrat e rrjetit që do të

zvogëlonin gabimin e modelit. Ndërsa të dhënat testuese luajnë rol në përcaktimi dhe

vlerësimin e performancës së rrjetit neural. Qëndrueshmëria e RN-l vlerësohet nëpërmjet

gabimit të tij. Gabim minimal do të thotë qëndrueshmëri më e mirë ndërsa gabim i lartë

nënkupton qëndrueshmëri më e keqe. Kriteret më të përdorura, të matjes së performancës,

janë: MSE, RMSE, MAE.

RMSE (Root Mean Square Error) përshkruan madhësinë mesatare të gabimeve:

√ √

∑ ( ̂ ) (4.9)

ku ̂ është vlera e parashikuar për vlerën aktuale ndërsa n është numri i vëzhgimeve. Në

këtë rast kuptohet se kanë peshë më të madhe në përcaktimin e vlerësimit ato që kanë gabim

më të madh. Kjo sepse gabimet ngrihen në fuqi përpara se të gjendet mesatarja e tyre.

MAE (Mean Absolute Error) përshkruan magnitudën mesatare të gabimeve pa marrë

parasysh shenjën e tyre. Në këtë rast të gjitha gabimet kanë rëndësi të barabartë në vlerësim.

∑ | ̂ | (4.10)

Në secilën nga rastet, vlerat që marrin janë ndërmjet intervalit 0 deri në ∞. Rrjeti neural më i

qëndrueshëm është ai që ka kriter performance më të vogël. Një tjetër specifik që lidhet me

këto kritere është paraqitja e gabimeve me njësi dhe shkallëzim të njëjtë si vetë parametri.



Blerina VIKA

61

Nëse përdoren njëkohësisht të dy kriteret MAE dhe RMSE mund të identifikohen luhatjet në

gabime. RMSE është më e madhe ose e barabartë me MAE. Një diferencë shumë e madhe

midis MAE-s dhe RMSE-s nënkupton një luhatje të madhe në gabimin e serisë kohore

(Yonaba H., Anctil F., & Fortin V., 2010). Praktikisht për të përzgjedhur modelin e rrjetit

neural më të mirë, në shumë literatura sugjerohet që të krahasohet kriteri i vlerësimit për të

dhënat në in-sample (të dhënat e trajnimit) dhe ato out-of-sample (të dhënat e testimit). Por

nuk janë të paktë dhe ato punime që përzgjedhjen e rrjetit neural parashikues më të „mirë‟ e

mbështesin vetëm në të dhënat out-of-sample.

4.4.3 Procedurat e trajnimit të RN-l

Hapi 7: Trajnimi i rrjetit neural;

Pasi është përzgjedhur struktura e rrjetit neural është e nevojshme që të përcaktohen lidhjet

ndërmjet nyjeve të rrjetit neural. Këto lidhje nuk janë të njëjta. Në rrjetat neurale artificiale

për çdo lidhje, vendoset një peshë e cila tregon fortësinë e lidhjes midis nyjeve. Duke u

mbështetur në kuptimi biologjik të rrjetit neural, lidhjet tregojnë ndikimin që ka një neuron

mbi rezultatin e një neuroni tjetër. Rrjeti neural njihet për aftësinë e tij të përshtatjes, për të

mësuar nga të dhënat që i paraqiten. Procesi i trajnimit të rrjetit neural artificial ka si qëllim të

gjej bashkësinë më të mirë të peshave, që do të maksimizonin aftësitë parashikuese të RN-l

ose e thënë ndryshe do të zvogëlonin gabimet e modelit. Të dhënat trajnuese përdoren nga

rrjeti neural për të rregulluar peshat (mësuar) në mënyrë që të arrihet rezultati i dëshiruar. Dy

aspektet kryesore në të cilat përqendrohet trajnimi i rrjetit është përshpejtimi i trajnimit të

rrjetit si dhe në rezultatit e procesit trajnues.

Në literaturë janë sugjeruar 3 paradigma kryesore për realizimin e trajnimit: i mbikëqyrur, i

pambikëqyrur dhe i përforcuar. Përzgjedhja e paradigmës së duhur që do të përdoret

mbështetet në formën e të dhënave që do t‟i vihen në dispozicion RN-l si dhe në qëllimin që

do të përdoret rrjeti neural. Pasi zgjidhet paradigma është e nevojshme të kuptohet se kush

janë rregullat e trajnimit që të drejtojnë përditësimin e peshave të rrjetit, pra algoritmi i

trajnimit që do të përdoret.

Procesi i trajnimit të rrjetit është përsëritës. Për RN-l parashikues të dhënat trajnuese që e

furnizojnë atë janë në formën e çiftuar hyrëse/dalëse. Të dhënat hyrëse që merr rrjeti

transformohen nëpërmjet parametrave të tij duke prodhuar rezultatin/et. Këto të dhëna i



Blerina VIKA

62

paraqiten rrjetit një nga një dhe për çdo rast bëhet rregullimi i peshave të rrjetit duke

krahasuar rezultatin/et e rrjetit me të dhënat dalëse reale. Bazuar në këtë krahasim bëhet

vlerësimi i gabimit të parashikimit si dhe përcaktohen vlerat e ndryshimit të peshave për

rrjetin në mënyrë që në hapin pasardhës të trajnimit, rezultati i rrjetit të jetë sa më afër me

vlerat reale dalëse. Pasi të gjitha rastet e të dhënave trajnuese i janë paraqitur rrjetit, shpesh

kërkohet që të ri-përsëritet procedura. Kjo procedurë, që përputhet me paradigmën e

mbikëqyrur, ndiqet përgjatë të gjithë procesit të trajnimit. Rrjetat neurale artificiale

parashikuese përdorin paradigmën e mbikëqyrur për të mësuar nga të dhënat trajnuese.

„...Një teori trajnimi duhet të adresoj tre çështje praktike bazë: kapacitetin, kompleksitetin

e shembujve dhe kompleksitetin e kohor..‟ (Jain A. K., Mao J., Mohiuddin K. M., 1996).

Kapaciteti në këtë rast lidhet me numri i shembujve që mund të ruhen si dhe me çfarë

funksionesh dhe kufizimesh mund të formohen nga rrjeti. Kompleksiteti i shembujve

përcakton numrin e nevojshëm për të dhënat trajnuese që do të garantonin një aftësi të lartë

përgjithësues të RN-l. Kompleksiteti kohor lidhet me kohë që kërkon një algoritëm trajnimi

për të arritur nivelin trajnues të dëshiruar të rrjetit. Për shumë algoritme trajnimi

kompleksiteti kohorë është i madh. Një numër studimesh fokusohen në modelimin e

algoritmeve efecientë për trajnimin e RN-l.

Ky punim është përqendruar në përdorimin e algoritmeve trajnues të mbikëqyrur mbi rrjetat

SHS. Edhe pse ekzistojnë një numër i konsiderueshëm algoritmesh për trajnim, më i përdorur

në literaturën e gjerë është algoritmi i trajnimit me propagandim-prapa (PP), i njohur

ndryshe me emërtimin rregulli i përgjithësuar delta (Fu, 1994; Walczak, S. dhe Cerpa, N.,

1999). Ky algoritëm është një përafrues universal. Shumë autorë kanë treguar që rrjetat

neural të trajnuar me anë të PP rezultojnë me një performancë shumë më të mirë se RN-le të

trajnuar me algoritme të tjerë (Barnard, E. and Wessels, L., 1992; Walczak, 1998; Nouir Z,

Sayrac B, Fourestie B, Tabbara W, Brouaye F., 2007). Për këtë arsye algoritmi PP është i

vetmi algoritëm që është përdorur në këtë punim për trajnimin e rrjetit neural.

Algoritmi Propagandim-Prapa

Në këtë algoritëm bëhet përhapja prapa e gabimit. Kjo mënyrë përdoret sëbashku me një

metodë optimizimi, si për shembull gradient descent. Si fillim ky algoritëm është zhvilluar që



Blerina VIKA

63

në 1971 nga Werbos por për një kohë të gjatë ai nuk është përdorur. Por ishte Rumelhart

(1986) që bëri formulimin e qartë të algoritmit duke e rritur përdorimin e tij gjërësisht.

Mitchell (1997) në librin e tij Machine Learning ka bërë një përmbledhje se cilat janë

karakteristikat e problemave në të cilët përdorimi i algoritmit PP është i përshtatshëm:

Shembujt paraqiten nga disa kombinime të trajtës cilësi-vlerë. Funksioni qëllim që

kërkohet të mësohet duhet të përcaktohet si një vektorë i tipareve të paracaktuara.

Këto cilësi hyrëse mund të kenë një korrelacion të lartë me njëri-tjetrin ose mund të

jenë të pavarura. Vlerat hyrëse mund të jenë vlera reale të ndryshme.

Rezultati i funksionit qëllim mund të jetë një cilësi me vlerë diskrete, reale ose një

vektorë me disa vlera reale/diskret.

Shembujt e trajnimit mund të përmbajnë gabime. Rrjetat neurale artificiale njihen si

struktura me qëndrueshmëri të konsiderueshme në lidhje me zhurma që mund të kenë

të dhënat trajnuese.

Kur mund të pranohet dhe një kohë e gjatë trajnimi. Në ndryshim nga modele të tjera

algoritmet e trajnimit të rrjetave neural kërkojnë një kohë të gjatë trajnimi duke filluar

nga disa sekonda deri në disa orë. Kjo varet nga disa faktorë si numri i peshave që

përdorë rrjeti, numri i shembujve që përdoren për trajnim etj.

Në rast se kërkohet vlerësimi i shpejtë për funskionin qëllim të mësuar. Pavarësisht

kohës relativisht të gjatë që kërkohet për trajnimin e rrjetit neural, vlerësimi i rrjetit të

trajnuar realizohet shumë shpejt.

Nuk është e domosdoshme që njerzit të jenë të aftë të kuptojnë funksionin qëllim të

mësuar. Peshat që përdor një rrjet i trajnuar janë shpesh të vështira për t‟u intrepretuar

nga njerëzit. Shpesh rrjeti neural njihet si „kuti-e-zeze‟ pasi ato nuk mund të

shpjegojnë se si e prodhojnë një rezultat të caktuar.

Në algoritmin e trajnimit PP dallohen dy faza bazë të funksionimit të tij: përhapja dhe

përditësimi i peshave. Në fazën e parë atë të përhapjes kemi dy mënyra të kryerjes së saj:

a. Përhapja përpara (PP) e shembujve hyrës të trajnimit përgjatë RN-l për të vlerësuar

sinjalet dalëse në nyjet e shtresës së fundit.

b. Përhapja mbrapa (PM) e sinjalit dalëse nëpërmjet RN-l. Përdoren të dhënat reale

dalëse korresponduese për shembujt e trajnimit për të gjeneruar të gjitha deltat

(ndryshimi midis vlerave hyrëse dhe dalëse) për të gjitha nyjet dalëse dhe të fshehura.



Blerina VIKA

64

Në fazën e dytë të përditësimit të peshave ndiqen këto hapa për peshën e çdo lidhjeje:

a. Gjendet gradienti i peshës nëpërmjet prodhimit të deltës dalëse dhe sinjalit hyrës

b. Vlerës së peshës i zbritet një përqindje e caktuar e gradientit.

Figure 4-2:Paraqitja e rrjetit SHS me tre-shtresa

Në

Figure 4-2 paraqitet një RN-l, SHS-r me tre shtresa (hyrëse, e fshehtë dhe dalëse). Rrjeti

përmban dhe dy nyje paragjykuese (Bias) dhe . Këto nyje kanë gjithmonë vlerë 1 dhe

përdoren për rritur aftësitë e rrjetit për të përshkruar të dhënat. Parametrat wij janë peshat e

lidhjeve midis dy nyjeve, janë të dhënat hyrëse për rrjetin, tregojnë nyjet në shtresën

fshehtë dhe nyjet dalëse për rrjetin SHS. Ndërsa për fO dhe fH janë funksionet e aktivizimit

respektivisht për nyjet dalëse dhe për nyjet e fshehta. Shigjetat tregojnë drejtimin e rrjedhjes

së informaciont përgjatë rrjetit në fazën e përhapjes përpara.

Më poshtë jepet ekuacioni i cili tregon sesi gjenerohet vlera e nyjes dalëse :

(∑

(∑

)

) (4.11)

Algoritmi PP është një teknikë e thjeshtë zvogëlim gradienti që konsiston në minimizimin e

një funksioni të caktuar të gabimit p.sh minimizimi e mesatares së katrorëve të gabimeve:



Blerina VIKA

65

∑ ( ̂ )

∑

(4.12)

ku është vlera e reale dhe ̂ është vlera i-t e gjeneruar nga rrjeti.

Rezultati për çdo nyje në shtresën dalëse është një funksion i peshave w. Për të zvogëluar

funksionin e gabimit duhet të kemi që:

( ) ( )

(4.13)

Gradienti i gabimit specifikon drejtimin që jep rritje më të fortë në E. Negativi i tij jep

drejtimin e zbritjes më të fortë. Ndërsa në rregulli i trajnimit me zvogëlim të gradientit

përditësimi i peshave shprehet me:

( ) ( ) ( ) (4.14)

dhe:

(4.15)

ku: parametri 0 < < 1 është shkalla e të mësuarit dhe shërben për të kontrolluar shkallën e

konvergjencës së algoritmit. Shkalla e të mësuarit ndikon në shpejtësinë dhe cilësinë e të

trajnimit. Sa më e madhe vlera e saj aq më e shpejt është trajnimi i rrjetit, ndërsa sa më e

vogël të jetë vlera aq më i saktë është trajnimi. Megjithatë në rast se parametrit i jepet një

vlerë shumë e madhe atëherë funksioni i gabimit do të pësonte ndryshime të forta duke mos

shfaqur një përmirësim të vazhdueshëm. Por edhe e kundërta, zgjedhja e një vlere të vogël

për shkallën e të mësuarit do të rriste kohën e trajnimit.

Për të eleminuar ndryshimin e shkallës së të mësuarit për çdo kalimit nëpër bashkësinë

trajnuese përdoret një parametër që njihet si termi i shpejtësisë (Kaastra I. dhe Boyd M. ,

1996). Termi i shpejtësisë përcakton se si do të ndikojnë ndryshimet e peshës së hapit të

mëparshëm mbi atë aktualë. Shkalla e të mësuarit në këtë rast do të mbaj në çdo hap të

iteracionit vlerën më të madhe të mundshme brenda vlerave të lejuara ndërkohë që ruhet

qëndrueshmëria e procesit të trajnimit. Ekuacioni i modifikuar do të shkruhej si mëposhtë:



Blerina VIKA

66

( )

( )

(4.16)

ku: 0 < < 1 termi i shpejtësisë dhe t-numri i iteracioneve.

Pseudokodi për algoritmin bazë të trajnimin PP për rrjetin SHS, jepet mëposhtë në Algoritmi

4-3. Në këtë algoritëm instruksioni në rreshti e katërt realizon fazën e përhapjes përpara për të

dhënat hyrëse, ndërsa rreshti i gjashtë dhe shtatë përbëjnë dhe fazën përhapjes mbrapa të

gabimit përgjatë rrjetit. Mësimi nëpërmjet shembujve mund të kryhet në mënyrë sekuenciale

(online) ose në grupe (offline).

Në mësimin sekuencial të rrjetit peshat përditësohen pas çdo shembulli. Në këtë rast saktësia

e trajnimit varet nga renditja e shembujve që i paraqiten rrjetit. Shpesh, përdoret në rastet kur

nuk mund të sigurohen të gjithë shembujt trajnues njëherësh.

Një epokë trajnimi përbëhet nga kalimi i të gjithë të dhënave trajnuese në rrjet. Mësimi në

grupe bëhet duke akumuluar ndryshimet e peshave përgjatë një epoke trajnimi dhe duke i

përditësuar peshat e rrjetit vetëm në fund të epokës. Në këtë mënyrë nuk ka rëndësi renditja e

shembujve trajnues. Numri i epokave trajnuese në shumë punime përcaktohet nga qindra në

mijëra.

Algoritëm PropagandimPrapa

1. Për çdo peshë 𝑤𝑖𝑗𝐼 dhe 𝑤𝑗𝑙

𝐻 të rrjetit përcaktohen vlera fillestare të rastësishme të vogla

2. Derisa të gjithë shembujt klasifikohen korrektësisht ose plotësohet ndonjë kriter ndalimi

kryej

3. Për çdo bashkësi trajnimi hyrëse xinput me përmasë n bëj

4. { Parashikim = nn_vlerë_dalëse (rrjet, xinput)

5. VlerëReale = vl_qëllim_për_shembullin( xinput)

6. Llogarit 𝑤𝑗𝑙𝐻 për çdo lidhje midis shtresës së fshehtë dhe dalëse

7. Llogarit 𝑤𝑖𝑗𝐼 për çdo lidhje ndërmjet shtresës hyrëse dhe të fshehtë

8. Përditëso peshat e rrjetit }

9. Return rrjet

Algoritmi 4-3: Algoritmi PP që përdorë zvogëlimin e gradientit



Blerina VIKA

67

Kufizime të algoritmit PP

Pavarësisht se përdorimi i këtij algoritmi është shumë i gjerë shumë punime përqendrohen në

studimin dhe përmirësimin e tij. Ekzistojnë disa variante të këtij algoritmi të cilët sjellin

përmirësime të pjesshme të tij. Disa nga problematikat që ndeshen më shpesh janë:

Problemi i minimumit lokal. Përmendëm që ky algoritëm përdorë metodën e

zvogëlimit të gradientit për të gjetur peshat të cilat do të zvogëlonin gabimin.

Algoritmi PP funksionon në përgjithësi si një algoritëm hill-climbing (ngjitje në

kodër). Algoritmi nuk është optimal që do të thotë se kjo metodë shpesh mund të

ngecë në një minimum lokal në vend që të ketë gjetur minimumin global. Një mënyrë

për të përmirësuar këtë algoritëm është përdorimi i termit të shpejtësisë të shpjeguar

më sipër. Një mënyrë e dytë është përdorimi i metodës simulated annealing në të cilën

provohen disa vlera të ndryshme për inicializimin e peshave të rrjetit. Shpeshherë

këto mënyra mund të kombinohen me njëra-tjetrën

Shmangia e problemit të përshtatjes së tepërt në fazën trajnuese (overfitting). Në këtë

rast ekziston problemi i përshtatjes së mirë të rrjetit me të dhënat trajnuese duke

humbur kështu aftësitë përgjithësuese për të dhëna të reja. Për të minimizuar këtë

problem janë zhvilluar disa metoda të ndryshme. Një nga metodat më të përdorura

gjerësisht është ndalim i herët (Gonzaley, 2007). Të dhënat ndahen në tre bashkësi

trajnuese, validuese dhe testuese.

Bashkësia e validimit përdoret pas çdo iteracion në procesin e vlerësimit për të bërë

një parashikim dhe më pas llogaritet MSE-ja për të dy bashkësitë trajnuese dhe

validuese. Vihet re se fillimisht me rritjen e numrit të iteracioneve (epokave)

parametri MSE për të dy bashkësitë vjen duke u zvogëluar. Por në literaturë vihet re

se vazhdimi i iteracioneve në një numër të madh do të rezultonte që MSE-ja, për

bashkësinë trajnuese do vazhdonte të zvogëlohej ndërsa për bashkësinë validuese do

të filloj të rritet. Kjo gjë ndodh pasi rrjeti arrin të përshkruaj shumë saktë të dhënat

trajnuese por humbet aftësitë e tij përgjithësuese. Në këtë rast trajnimi ndalon në

momentin kur arrihet gabimi më i vogël për bashkësinë e validimit në mënyrë që të

marrim një rrjet me një performancë të mirë përgjithësuese (Bishop, 2006). Kjo

metodë do të kërkonte që shembujt që ne kemi të jenë të konsiderueshme, në të

kundërt nuk do të kishte kuptim që ne të përdornim një bashkësi trajnuese e cila nuk

do të përmbante të dhëna të mjaftueshme për të mësuar rrjeti. Kritere ndalimi të tjera

që mund të përdoren janë:



Blerina VIKA

68

- Përcaktohet një parametër përgjithësim humbjeje si funksion i gabimit të

validimit dhe gabimit optimal të dëshiruar në epokën t. Nëse vlera e këtij

parametri e tejkalon një vlerë të përcaktuar paraprakisht atëherë ndalohet.

- Përcaktohet numri maksimal i epokave për të cilat duhet të kryhet trajnimi.

Nëse ky numër arrihet atëherë ndalohet procesi i trajnimit të rrjetit.

Gjetja e kriterit të ndalimit të suksesshëm është një tjetër sfidë në dizenjimin e rrjetave

neurale. Duke qenë se secili nga kriteret në veçanti nuk është i plotë shpesh përdoren

kombinime të këtyre teknikave. Kjo gjë është e ilustruar dhe në algoritmin PP të paraqitur në

Algoritmi 4-3 tek rreshti 2.

4.4.4 Ndërtimi i modelit parashikues

Hapi 8: Implementimi

Në këtë hap është i mundur ndërtimi i modelit parashikues sipas specifikave të përcaktuar në

hapat e mëparshëm. Gjithashtu të dhënat e grumbulluar i nënshtrohen parapërgatitjes së

duhur duke u ndarë më pas në tre bashkësitë kryesore. Ndërtimi i modelit në një platformë të

caktuar kërkon që fillimisht të përcaktohet se kush do të jetë gjuha e programimit që do të

përdoret, strukturat e të dhënave të nevojshme për t‟u përdorur si dhe algoritmet që do të

përdoren.

Për të dhënat është e nevojshme të specifikohen forma e ruajtjes dhe paraqitjes së tyre.

Vlefshmëria e të dhënave, kriteret e vlerësimit dhe koha e trajnimit janë specifik në lidhje me

fushën e zbatimit dhe përcaktojnë se si do të ndërtohet rrjeti neural.

Një avantazh i rrjetave neurale është aftësia e tyre për t‟iu përshtatur ndryshimeve që pësojnë

kushtet e tregut nëpërmjet ri-trajnimeve periodike të tij (Kaastra, I. dhe Boyd, M, 1996). Një

rrjet neural i ndërtuar humbet aftësitë e tij parashikuese me kalimin e kohës. Për këtë arsye do

të ishte i nevojshëm ri-trajnimi i tij me të dhënat të reja për të pasuruar rrjeti me informacione

të rëndësishme.

Rekomandohet që frekuenca e ri-trajnimit të jetë e njëjtë me frekuencë e testimit të modelit

final por në rast se testimit është shumë i shpeshtë atëherë mund të bëhet në një periudhë më

të gjatë.



Blerina VIKA

69

Një model i mirë duhet të jetë i qëndrueshëm në lidhje me frekuencë e ri-trajnimit dhe shpesh

duhet të përmirësohet përgjatë ri-trajnimeve të tij.

4.5 Të metat e RNA-le si modele parashikuese

Ekzistojnë shumë studime të cilët tregojnë rezultate pozitive apo që nxjerrin përfundime në

avantazh të rrjetave neurale krahasuar me teknikat statistikore. Megjithatë nga pikëpamja

teorike përballemi me disa pengesa mbi të cilat duhet punuar për t‟u kapërcyer. Disa nga

problematika që lidhen me rrjetin neural janë (T. Hill, L. Marquey, M. O'Connor dhe W.

Remus, 1994; Portugal, 1995; Basheer I.A. dhe Hajmeer M,, 2000):

Metodologjia dhe teknikat e modelimit të rrjetave neurale ndryshojnë shpesh ndërsa

teknikat e modelimit statistikor janë të qëndrueshme dhe të zhvilluara mirë. Nuk ka

metodologji të saktë për ndërtimi dhe përzgjedhjen e arkitekturës së rrjetit neural të

përshtatshëm për një fushë studimi të caktuar. Proceset aktuale të modelimit në një

numër të madh punimesh janë me bazë empirike.

Aktualisht mund të gjenden lehtësisht softuerë që lehtësojnë përdorimin e modeleve

tradicionale statistikore por nuk mund të themi të njëjtën gjë për zhvillimin e

softuerëve cilësorë që përdorin rrjetat neurale artificiale për parashikim. Pavarësisht

përpjekjeve të shumta këto softuerë kërkojnë aftësi teknike për ti modeluar apo

përdorur ato.

Modelet neurale artificiale janë të vështirë për t‟u interpretuar dhe për ti dhënë atyre

një kuptim fizik me fushën e studimit. Duke qenë se RN-le nuk kanë aftësi

shpjeguese është e pamundur të njihet se si një rrjet arrin në një rezultat të caktuar.

Nga shumë kritikë këto modele janë përkufizuar si „kuti-të-zeza‟. Disa modele

parashikuese tradicionale janë të pajisura me këto aftësi shpjeguese.

Në rastin e RNA ekzistenca e shumë parametrave që kërkojnë të vlerësohen shpesh

bën që të shfaqet problemi i përshtatjes së tepërt si dhe kërkon një kohë shumë herë

më të madhe se në rastin e modeleve statistikore. Shpesh herë kjo pengon që shumë

autorë të zhvillojnë studime gjithëpërfshirëse në lidhje me rrjetat neurale. Modelet

neurale i ndërtojnë bazuar në procedura trajnimi manuale (Yao, 2002).

Një tjetër arsye se pse zhvillimi i aplikimeve të rrjetave neurale në fushën ekonomike

kanë një përparim të ulët është fakti se shumë zhvillues nuk duan të lëshojnë

„sekretet‟ e tyre komerciale për arsye përfitimi.



Blerina VIKA

70

Rrjetat neural nuk janë perfekt për të gjithë problemet reale. Nuk mund të themi që

ato mund të zgjidhin çdo lloj problemi apo probleme për të cilat nuk ekziston ndonjë

metodë e suksesshme. Është një tendencë për ti përdorur rrjetat neural edhe në ato

raste kur nuk janë të përshtatshëm.

Gjithashtu duhet theksuar se suksesi i parashikimit për rrjetin neural artificial bazohet

në cilësinë dhe sasinë e të dhënave.



Blerina VIKA

71

Kapitulli 5

5 VLERËSIMI I RRJETIT NEURAL PARASHIKUES

(raste studimi)

5.1 Hyrje

Në këtë kapitull të punimit tonë tregohet praktikisht se si realizohet përzgjedhja arkitekturës

së rrjetit neural parashikues. Përzgjedhja bëhet bazuar në analiza statistikore. Gjithashtu bëhet

një analizë krahasuese e rrjetit të përzgjedhur për parashikim me metodat statistikore, për të

vlerësuar performancën e rrjetit. Një pjesë e rëndësishme në këtë pjesë të punimit është

realizimi i krahasimeve jo vetëm ndërmjet strukturave të ndryshme të rrjetit neural por edhe

ndërmjet modelit tradicional të përdorur për parashikim. Kriteret e vlerësimit të aftësive

parashikuese bëhet në zvogëlimin e gabimit të parashikimit. Eksperimentet parashikuese të

realizuar bëhen për kursin e këmbimit mujor të dollarit ndaj euros. Rezultatet eksperimentale

që janë arritur në këtë kapitull kanë ndihmuar në ngritjen e artifakteve që drejtojnë analizën

dhe dizenjimin e sistemit inteligjent për parashikim.

Ky seksion kërkon të kontribuoj në literaturën e rrjeteve neurale artificiale duke evidentuar sa

të fuqishme e të përdorshme mund të jenë ato si një mjet në procesin e vendimmarrjeve

ekonomike. Në të shqyrtohet vlefshmëria e Rrjeteve Auto regresive Jo-lineare (NAR)3 në

krahasim me modelet ARIMA, të cilat përdoren zakonisht si referencë në parashikimin e

kursit të këmbimit. Për demonstrim, ne kemi përdorur kursin e këmbimit të dollarit ndaj

euros, si një aset mjaft i luhatshëm dhe shumë i tregtuar në tregjet financiare ndërkombëtare,

e megjithatë mjaft i kontestuar në punët akademike për shkak të devijimeve shpesh të mëdha

të tij nga nivelet ekuilibër të sugjeruar nga teoritë ekonomike. Ne gjejmë se, edhe pse përmes

një aplikimi modest, modelet e rrjeteve neurale mund të shërbejnë si vlerë e shtuar e ndoshta

3 Janë të emërtuara rrjetat neurale të cilat e kryejnë parashikim bazuar në vonesat kohore të variablit të

parashikuar(kështu emërtohen dhe në MATLAB)



Blerina VIKA

72

lënë pas modelet tradicionale në parashikimin e kursit të këmbimit. Rezultatet pohojnë se

rrjeti auto regresiv jo-linear arrin të mposhtë vazhdimisht modelin ARIMA (dhe ecjen

rastësore) në parashikimin statik të kursit të këmbimit.

I. Përdorimi i rrjetave neurale për parashikimin e Kursit të këmbimit

5.1.1 Përshkrimi i problemit

Parashikimi i serive kohore po përdoret gjithnjë e më shumë si një mjet i vlefshëm në dhënien

e informacionit në procesin e vendimmarrjes. Ai është i rëndësishëm jo vetë për menaxher të

ndryshëm, tregtarët global dhe politikë-bërësit por edhe për fusha të tjera. Megjithatë,

parashikimi i serive financiare është provuar të jetë një punë sfiduese, sidomos për seri

kohore të luhatshme të tilla si kursi i këmbimit. Duke qenë tregu më i madh e më likuid me

trilionë dollarë të shkëmbyera çdo ditë, literatura empirike bazuar në modele teorike ka hasur

shpesh në vështirësi për të thyer parashikimet nga procese më naive të ecjes rastësore.

Meqë kurset e këmbimit influencohen nga shumë faktorë ekonomik, politik e psikologjik,

është e vështirë për të identifikuar një model ekonomik unik që mund të japë parashikime të

qëndrueshme. Disa autorë pohojnë se “...fuqia shpjeguese e dobët e teorive ekzistuese të

kursit të këmbimit është e mundur të jetë dobësia kryesore e makroekonomiksit

ndërkombëtar...” (Bacchetta & Wincoop, 2006), dhe se modelet empirike të kursit të

këmbimit “...përgjithësisht dështojnë keq në testet e parashikimeve jashtë-periudhe në

kuptimin që ato dështojnë t‟ia kalojnë ecjes rastësore” (Sarno & Taylor, 2002). Edhe nëse

teoritë e kursit të këmbimit duken fondamentalisht të shëndosha, shumë kërkues fajësojnë

implementimin empirik nëpërmjet modeleve statistikore lineare për ecurinë e dëshpëruar të

parashikimit. Prandaj, ata propozojnë përdorimin e metodave me kohë të ndryshueshme ose

jo-lineare, të cilat mund të ndihmojnë për të kapur më mirë korrektimet e kursit drejt

ekuilibrit të tij afatgjatë në një mënyrë jo-lineare (Kilian & Taylor, 2001).

Në fakt, seritë e kursit të këmbimit paraqesin shpesh shenja të jo-linearitetit, për të cilat

teknikat parashikuese tradicionale nuk janë të pajisura mirë për t'i trajtuar, duke prodhuar

shpesh rezultate të pakënaqshme (Philip, Taofiki, & Bidem, 2011). Kërkuesit e përballur me

këto karakteristika u kthehen teknikave deduktive e jo-lineare. Në këtë pjesë të punimit ne

vlerësojmë fillimisht strukturën më të mirë të rrjetit neural artificial auto-regresiv jo-linear

(NAR) dhe pastaj një model auto-regresiv linear që përngjan me ecjen rastësore për të

parashikuar kursin mujor USD/EUR. Më pas kryhet një analizë krahasuese e performancave



Blerina VIKA

73

që kanë këto dy modele me një variabël. Të dy llojet e modeleve do të krahasohen mbi bazën

e ecurisë së parashikimit, ku fokusi do të jetë mbi minimizimin e gabimit të parashikimit

jashtë-periudhe më tepër se maksimizimin e „përshtatjes sa më të mirë‟ brenda-periudhe.

Në të vërtetë, modelimi i ecjes rastësore (sipas formës yt = yt-1 + et, ku et është termi i gabimit

rastësor) mund të jetë efektiv në trajtimin e pasigurisë apo natyrës së paqëndrueshme që

karakterizon lëvizjet e kursit të këmbimit. Në vend të tij, ne do të përdorim modelin auto-

regresiv të integruar me mesatare lëvizëse (ARIMA), i cili përdoret gjerësisht si model

referimi në parashikimet dhe analizat e serive kohore. ARIMA është një nëngrup i modelimit

me një variabël, i cili supozon se karakteristikat historike të një serie kohore (d.m.th.

karakteristikat e saj sistematike strukturore) do të jenë prezentë në të ardhmen; prandaj ato

mund të jenë të volitshme për qëllime parashikimi.

Në anën tjetër, rrjetet neurale artificiale (RNA) kanë dalë në pah në dekadën e shkuar si një

metodë alternative e fuqishme për parashikimin e serive kohore për shkak të aftësive të tyre

më të larta. RNA-le janë qasje jo-parametrike të udhëhequra nga të dhënat që mund të kapin

strukturat jo-lineare për të dhënat, pa supozuar më parë mbi marrëdhënien e brendshme të një

problemi të caktuar. RNA-le mund të mësojnë nga shembujt e të demonstrojnë disa aftësi për

përgjithësimet, përtej të dhënave trajnuese. Një numër i madh studimesh që përdorin RNA-le

për parashikime mund të gjenden në literaturë. Megjithatë, rezultatet e raportuara janë shpesh

të ndryshme.

Për të pasur një pamje të shpejtë të rezultateve, vlerësimi i parashikimeve i bazuar në ME,

MAE dhe RMSE tregon se modeli i rrjeteve neurale ka qenë i aftë të japë parashikime për-

një-muaj më të mira se modeli ARIMA gjatë gjithë vitit 2014. Këto gjetje mund të jenë

mbështetje për literaturën mbi RNA-le për zbatueshmërinë e tyre në teknikat e parashikimit të

kursit të këmbimit. Në vijim, ne do të përshkruajmë fillimisht faktet bazike mbi dy

metodologjitë e përdorura në procesin tonë të parashikimit, dhe më pas do të paraqesim e të

krahasojmë rezultatet e tyre përkatëse.

5.1.2 Të dhënat për metodologjitë Konkurruese

Modelet me-një-ndryshore RNA dhe ARIMA i kemi aplikuar mbi kursin mujor USD/EUR, të

publikuara online në faqen e internetit Thomson Reuters. Analiza e të dhënave fillon nga

janari 1994 deri në dhjetor 2014 – gjithsej 252 të dhëna të vëzhguara. Për modelin ARIMA

kemi përdorur programin EViews 7. Ndërsa të gjitha matjet e pjesshme të modeleve RNA

janë zbatuar direkt në programin MATLAB 2010b, të cilin e kemi përdorur për

eksperimentet. Të dhënat e aplikuar në secilin nga modelet janë të papërpunuara. Më poshtë



Blerina VIKA

74

kemi përshkruar veçmas të dy metodologjitë e aplikuara në këtë artikull, duke treguar

ndërkohë modelet e preferuara për secilën metodë. Modelet e përzgjedhura janë krahasuar më

pas në bazë të performancës së parashikimit një-muaj-përpara.

Figura 5-1 tregon paraqitjen grafike të kursit të këmbimit USD/EUR nga janar 1994 deri në

dhjetor 2014. Aty mund të vërehet se monedha e përbashkët evropiane ka ndjekur një trend

zhvlerësimi deri në vitin 2000, pastaj ajo ndryshoi në kahun e kundërt duke rikuperuar

humbjet deri në vitin 2007 dhe pas kësaj euro është luhatur rreth atij niveli. Me fjalë të tjera,

kursi i euros është luhatur rreth mesatares $1.33 në gjysmën e parë të kësaj dekade, krahasuar

me nivelin mjaft më të ulët prej $1.19 gjatë 16 viteve të mëparshme.

Figura 5-1: Paraqitja grafike e kursit mujor USD/EUR për periudhën janar 1994 -dhjetor 2014

0.8

0.9

1.0

1.1

1.2

1.3

1.4

1.5

1.6

94 96 98 00 02 04 06 08 10 12 14

5.1.3 Modelimi i Rrjetit Neural për parashikimin kursit të këmbimit

Ky seksion bën një përshkrim të metodologjisë së përdorur për modelimin e rrjeteve neurale

artificiale (RNA). Bazuar në modelimin me tetë hapa (Algoritmi 4-2) të përshkruar në

kapitullin e katërt, do të përcaktohet dhe vlerësohet struktura më e mirë e rrjetit neural për

parashikimi e kursit USD/EUR. Si fillim do të specifikohen për secilin nga hapat zgjedhjet që

janë bërë për rastin specifik të parashikimit të kursit të këmbimit dhe më pas vazhdohet me

ndërtimin e modelit auto-regresiv jo-linear (NAR) për parashikimin e kursit USD/EUR.



Blerina VIKA

75

Përzgjedhja, mbledhja dhe përpunimi i të dhënave

Siç kemi përmendur dhe më parë, kjo teknikë përcaktohet nga të dhënat që i paraqiten rrjetit,

dhe është jo-parametrike në kuptimin që nuk ka nevojë të njohë ndonjë informacion apriori

mbi procesin që prodhon sinjalin. Të dhënat e përdorur për parashikim është kursi mujor

USD/EUR. Në këtë rast do të përdoret parashikimi me një-ndryshore në të cilën parashikimi

varet vetëm nga vonesat kohore të vetë variablit të varur. Periudha e marrë në studim është

nga janar 1994 deri në dhjetor 2014 që përbëhet nga gjithsej nga 252 vlera të vëzhguara.

Është një seri e rregullt e cila nuk ka mungesa në të. Të dhënat hyrëse për modelimin e

rrjetave neurale janë vlerat e vëzhguar të vetë variablit të papërpunuara. Të dhënat e

përpunuara i japin mundësinë rrjetit neural që të nxjerrë më lehtë shembujt domethënës të

cilat mbarten në këto të dhëna (Kaastra, I. dhe Boyd, M, 1996). Por duhet theksuar që këto të

dhëna pësojnë një shkallëzim nga vetë rrjetit. Ky shkallëzim realizohet nga funksioni i

transferimit që përdorin nyjet e rrjetit neural.

Ndarja e të dhënave në trajnues, testuese dhe validuese.

Një rrjet trajnohet përmes algoritmeve me qëllim-përgjithësues. Këto algoritme bazohen mbi

seritë kohore si dhe fokusohen në llogaritjen e peshave për lidhjet midis neuroneve në një

rrjet FD për të krijuar hartën e dëshiruar të hyrje-daljeve (Zhang & Hu, 1998). Një pjesë

shumë e rëndësishme për ndërtimin e rrjetave neurale parashikuese është përcaktimi i tre

bashkësive: trajnuese, validuese dhe testuese. Bashkësia trajnuese përmban më shumë

vëzhgime pasi përdoret për të mësuar rrjetin. Bashkësia testuese përdoret për të bërë

vlerësimin e parashikimit të rrjetit jashtë-periudhe. Rrjeti më i mirë parashikues është ai që

minimizon kriterin e vlerësimit në bashkësinë testuese.

Në këtë punim është zgjedhur dhe një bashkësi e tretë, validuese, e cila shërben për të ndaluar

procesin e trajnimit në mënyrë që të shmanget përshtatja e tepërt e rrjetit me të dhënat

trajnuese dhe maksimizuar aftësitë e tij parashikuese (Bishop, 2006). Duke qenë se të dhënat

kanë një lidhje midis tyre, atë historike, ndarja e të dhëna në këtë punim është bërë në blloqe

dhe jo në mënyrë rastësore.

Të dhënat deri në vitin 2013 (240 vëzhgime) janë përdorur për të vlerësuar modelet, ndërsa

12 muajt e fundit në vitin 2014 (ose 5% e të dhënave) janë ruajtur për vlerësimin e

parashikimeve jashtë-periudhe. Gjithashtu, vëzhgimet brenda-periudhe të përdorura për

vlerësimin e modelit janë ndarë në tre pjesë: periudha e trajnimit përbën 70% të totalit, ndërsa



Blerina VIKA

76

pjesa e mbetur është ndarë barabar ndërmjet periudhës së validimit (15%) dhe të testimit

(15%). Kjo ndarje është aplikuar për çdo rrjet neural të ndërtuar.

Struktura e një Rrjeti Neural

Topologjia e përdorur në këtë punim për rrjetat neural është FD, ose SHS, që organizohet në

tre shtresa dhe informacion rrjedh vetëm në një drejtim, (Janil & Mao, 1996) nga shtresa e

parë deri në atë të fundit pa formuar cikle në këtë arkitekturë Figure 4-2:Paraqitja e rrjetit SHS

me tre-shtresa(Figure 4-2). Fillimisht vendoset shtresa hyrëse, ku vendosen një numër i nyjesh

që korrespondon me numrin e vonesave kohore të serisë së vëzhguar që do të përdoren për të

parashikuar vlerën dalëse.

Ndërsa shtresa e fundit, e njohur si shtresa dalëse, vendosen nyje që përkojnë me numrin e

hapave të parashikimit nga rrjeti. Duke qenë se ne do të parashikojmë një muaj përpara

atëherë për të gjithë rrjetat e ndërtuar do të kemi një nyje për shtresë dalëse. Gjithashtu në të

gjithë rrjetat neural e ndërtuar kemi përdorur, ndërmjet dy shtresave të hyrjes e asaj të daljes,

vetëm një shtresë të fshehur. Nyjet e fshehura përdoren për të kapur strukturat jo-lineare të

një serie kohore. Shumë autorë kanë demonstruar se një rrjet neural prej tre shtresash me një

funksion aktivizimi logjistik në njësitë e fshehura është i aftë të realizoj një përafrim

universal me çfarë do lloj shkalle saktësie (Gonzalez S., 2000; Hines, 1996).

Shtresat kanë lidhje që lejojnë kalim e informacionit në një-drejtim mes tyre. Çdo lidhje ka

një peshë numerike që paraqet fortësinë e lidhjes ndërmjet dy neuroneve. Vlerat e peshave

fillimisht përcaktohen në mënyrë rastësore dhe nëpërmjet trajnimit ato ndryshojnë.

Numri i nyjeve në shtresën hyrëse dhe të fshehtë

Detyra më sfiduese është se si të dizajnohet një rrjet i një madhësie të përshtatshme për të

kapur karakteristikat themelore tek të dhënat e trajnuara. Eventualisht, që modeli i RNA të

jetë i përdorshëm duhet të jetë përgjithësues ose të ketë aftësi parashikuese. Përcaktimi i

numrit të nyjave të fshehura që nevojiten është një çështje tjetër që vështirëson procesin e

ndërtimit të modelit RNA.

Meqë nuk ekziston një bazë teorike të na orientojë për përzgjedhjen, në praktikë numri i

nyjave të hyrjeve e i atyre të fshehura përzgjidhet shpesh përmes eksperimentimit provo-dhe-

mat-gabimin (Zhang, Patuwo, & Hu, 1998). Numri i nyjeve në shtresën e fshehtë nuk duhet



Blerina VIKA

77

të jetë shumë i madh pasi koha e trajnimit të rrjetit do të rritej në mënyrë eksponenciale si dhe

do të kërkohej hapësirë e madhe për ruajtjen e parametrave e rrjetit.

Për përcaktimin e numrit të nyjeve në shtresën e vetme të fshehur jemi mbështetur në

metodën provo dhe kontrollo gabimin (Panchal F., S. ; Panchal M., 2014). Provohen një

numër i ndryshëm nyjesh dhe për secilin rrjet vlerësohet saktësia e parashikimit. Gjithashtu

janë marrë parasysh dhe metodat udhëzuese të përgjithshme (Karsoliya, 2012), numri i

nyjeve në shtresën e fshehtë është midis madhësisë së shtresës hyrëse dhe shtresës dalëse, si

dhe numri i nyjeve në shtresën e fshehtë duhet të jenë sa 2/3 (nga 70%-90%) e numrit të

nyjeve hyrëse plus numrit të nyjeve dalëse.

Në këtë rast studimi, numri i vonesave kohore të përdorura si vlera hyrëse në shtresën e parë,

shtrihen nga një deri në dymbëdhjetë. Kjo kufizon që numri i neuroneve në shtresën e fshehur

duhet të jetë në të njëjtën madhësi, nga një në dymbëdhjetë, për çdo numër të nyje hyrëse.

Numri i rrjetave neurale të marra në shqyrtim për t‟u analizuar është 144 arkitektura (12x12)

të ndryshme. Ndërmjet tyre do të zgjidhet ai që përformon më mirë për të dhënat jashtë-

periudhe.

Trajnimi i rrjetit neural

Rrjeti neural mëson duke korrigjuar peshat. Algoritme të ndryshme e të mësuarit përdoren për

të trajnuar rrjetet. Për trajnimin e këtyre rrjeteve, kemi përdorur algoritmin e trajnimit

Levenberg-Marquardt (LM), në të cilin vlerat e peshave dhe nyjeve paragjykuese (bias)

përditësohen pas çdo epoke derisa të gjendet konfigurimi më i mirë i peshave. Numri

maksimal i epokave trajnuese është vendosur 1000 epoka. Një numër i gjerë studimesh të

cilët studiojnë numrin e epokave trajnuese tregojnë se konvergjenca e peshave arrihet

ndërmjet epokave nga 100 deri në 5000 (Klaussen, K. L. dhe Uhrig, J. W., 1994).

Algoritmi i trajnimi LM realizon një kombinim të dy metodave trajnuese ekzistuese asaj me

zvogëlim gradienti (të përdorur në algoritmin BP) dhe algoritmit Gauss-Njuton (GN). LM

trashëgon avantazhin e algoritmit GN duke pasur një shpejtësi konvergjimi të peshave

relativisht të lartë dhe nga metoda me zvogëlim gradienti qëndrueshmërinë e përafrimit.

Nëpërmjet një faktori të ndezjes ky algoritëm përcakton se cilin nga algoritmet do të përdoret

në një moment të caktuar të procesit të trajnimit. Nëse ky faktorë ka një vlerë të vogël

përdoret algoritmi i GN përndryshe nëse vlera e tij është e madhe atëherë metoda e përdorur

në këtë rast është zvogëlimi i gradientit.

Duke qenë se algoritmi LM i trajnimit i përditëson peshat duke përdorur edhe zvogëlim

gradienti, shpesh herë ky minimum i gjetur mund të jetë lokal dhe jo global, pra ky algoritëm

është i plotë por jo optimal. Për problemat që kanë një minimum të vetëm ky algoritëm gjen



Blerina VIKA

78

zgjidhje më të mirë ndërsa në rastet kur kemi shumë minimume ky algoritëm konvergjon në

minimumin global vetëm në qoftë se vlerat fillestare të peshave të rrjetit janë afër zgjidhjes

më të mirë.

Për të shmangur ngecjet në minimumet lokale është e nevojshme të përdoret teknika e

simulimit të nxehjes (Annealing). Kjo teknikë ndihmon në gjetje e një zgjidhjeje të mirë, por

jo perfekt, për problemat e optimizimit duke sugjeruar aplikimin e një numri të ndryshëm

vlerash fillestare për peshat e një rrjeti neural. Në këtë punim, për secilën arkitekturë të

rrjetave neurale për parashikim, trajnimi është përsëritur dhjetë herë duke përdorur vlera

fillestare të ndryshme për peshat. Këto vlera në çdo herë janë caktuar në mënyrë rastësore për

të gjetur minimumin global. Pasi ato trajnohen, zgjidhet ajo arkitekturë rrjeti që performon

më mirë duke u bazuar në kriterin e ecurisë së vendosur.

Kriteret e vlerësimit dhe përzgjedhja e rrjetit neural më të mirë

Pasi janë përcaktuar të gjitha tiparet që duhen për të ndërtuar një rrjet neural për parashikimin

e kursit të këmbimit USD/EUR fillohet me implementimin e tyre dhe vlerësimin. Për secilën

nga strukturat e ndryshme të rrjetave të ndërtuar bëhet trajnimi nëpërmjet këtyre hapave bazë:

1. Hyrja e të dhënave për t‟u trajnuar dhe të dhënat e shenjëstruara;

2. Mëso „rregullat‟ nga koleksioni i të dhënave;

3. Përmirëso ecurinë e rrjetit duke korrigjuar peshat në mënyrë përsëritëse.

Të dhënat me të cilat bëhet trajnimi i rrjetit janë të dhënat trajnuese validuese.

Pasi rrjetat janë trajnuar atëherë bëhet vlerësimi i tyre duke përdorur të dhënat në bashkësinë

e tretë atë testuese.

Kriteret e vlerësimit të rrjetit për aftësitë parashikuese bëhen mbi rezultatin e prodhuar nga

vetë këto rrjeta kur i jepen këto të dhënat. Vlerësimi realizohet jashtë-periudhe për çdo rrjet.

Dy janë matësit e përdorur për matjen e cilësisë së rrjetit RMSE dhe MAE4. Ndër rrjetat e

testuar zgjidhet si më i mirë, për parashikimin jashtë periudhe, ai që rezulton me vlerën më të

vogël të RMSE dhe MAE në këtë periudhë.

4 Akronimet tregojnë rrënjën e mesatares së katrorit të gabimeve (RMSE), dhe mesataren e gabimeve absolute

(MAE).



Blerina VIKA

79

Figure 5-2: Dizenjimi i rrjetit neural parashikimit për kursin e këmbimit USD/EUR

Seria kohore origjinale e USD/EUR

Te dhena trajnuese (70%)

Te dhena validuese (15%)

Te dhena testuese (15%)

Përcaktohet

struktura e NN1

- Tipi i lidhjeve mes shtresave

- Nr nyjeve në shtresë e fshehtë

- Nr nyjeve në shtresë hyrëse

- Funksioni i ativizimit

Përcaktohet Alg. I

Trajnimit

Trajnohet çdo 1..10 rrjetat

të strukturës NN1

- Nr i epokave të trajnimt

- Shkalla e të mësuarit

- Termi i shpejtësisë

- Kriteri i Vlerësimit (KV)

Persa kohë që nuk është arritur asnjë

kriterë ndalimi

inicializim të peshave 1..10

Jo

Po

Simulohet dhe

parashikohet me secilin

nga NN1 duke llogaritet

vlera e KV

Identifikohet rrjeti më i

mirë për këtë strukturë të

NN1

Rrjete Neural Parashikues

1..144

Fillimi i modelimit të NN më të mire

Rezultatet e parashikimit për

secilën nga 144 NN ruhen në DB

..Fund Modelimi..



Blerina VIKA

80

Në Figure 5-2 të mësipërme tregohet skematikisht se si realizohet trajnimi dhe përzgjedhja e

rrjetit neural më të mirë për kursin e këmbimit USD/EUR. Kjo skemë shërben si material

bazë për fazën pasardhëse të implementimit apo ndërtimit të programit.

5.1.4 Implementimi rrjetit neural parashikues për kursin USD/EUR

Ndërtimi i rrjetave neural është bërë në programin MATLAB 2010b. Rrjetat të cilët

parashikojnë bazuar vetëm në vonesat kohore të vetë variablit të varur në matlab njihen me

emrin rrjetat NAR (Nonlinear AutoRegressive). Ky lloj rrjeti është përdorur dhe në punimin

tonë. Për të trajnuar secilin nga rrjetat është zbatuar algoritmi i mëposhtëm:

Tabela 5-1 tregon rezultatet për 144 strukturat e vlerësuara të rrjeteve neurale dhe ecurinë

përkatëse të parashikimit një-muaj-para gjatë vitit 2014. Nga rezultatet del se struktura e

rrjetit neural 11-12-1, e cila përfshin njëmbëdhjetë vonesa kohore dhe dymbëdhjetë shtresa të

fshehura, është rrjeti më i përsosur që predikon më saktë se të tjerët kursin për muajin e

ardhshëm. Të dy matësit për vlerësimin e parashikimeve, RMSE dhe MAE, tregojnë se

gabimet e parashikimeve të përftuara nga rrjeti 11-12-1 janë më të ulëtat krahasuar me rrjetet

e tjera NAR.

Algoritëm StrukturaMë_e_Mirë_e_Rrjetit_NARi

1. Përcaktohen të dhënat për trajnimin yt, validimin yv dhe të testimit ytest për rrjetin i

2. minRMSE //për të gjetur rrjetin që e gjeneron

3. Për nrvlerashfillestare nga 1 deri në 100

4. { Për të gjitha peshat 𝑤𝑗𝑙𝐻 , 𝑤𝑖𝑗

𝐼 dhe nyjet paragjykuese bH,b

I vendosen vlera

rastësore

5. Të dhënat trajnuese yt organizohen për t‟u përshtaten strukturës së rrjetit i

6. Përcaktohen shkalla e të mësuar dhe termi i shpejtësisë për Alg. e trajnimit si

dhe numri i epokave të trajnimit.

7. Trajnohet(rrjeti i)

8. Llogaritet RMSE dhe MAE për të dhënat ytest

9. Nqs RMSE është më e vogël se minRMSE ath

10. { ruhet rrjeti që rezulton me RMSE më të vogël;

11. ruhen dhe vlerat e RMSE dhe MAE;

12. }

13. }

14. Return rrjetMeRMSEmëTëvogël

Algoritmi 5-1: Algoritmi për zgjedhje e rrjetit më të mirë për një strukturë të caktuar



Blerina VIKA

81

Tabela 5-1: Performanca statistikore e rrjetit NAR për kursin USD/EUR

NR Stuktura e rrjetit RMSE MAE

NR

Stuktura e rrjetit RMSE MAE

NR


NR


1 1-1-1 0.0157 0.0123

37 4-1-1 0.0162 0.0136

73 7-1-1 0.0123 0.0093

109 10-1-1 0.0147 0.0119

2 1-2-1 0.0178 0.0144

38 4-2-1 0.0149 0.0122

74 7-2-1 0.0139 0.0113

110 10-2-1 0.0125 0.0096 3 1-3-1 0.0166 0.0133

39 4-3-1 0.0125 0.0107

75 7-3-1 0.0137 0.0111

111 10-3-1 0.0140 0.0121

4 1-4-1 0.0160 0.0128

40 4-4-1 0.0138 0.0113

76 7-4-1 0.0120 0.0101

112 10-4-1 0.0130 0.0109

5 1-5-1 0.0176 0.0141

41 4-5-1 0.0142 0.0117

77 7-5-1 0.0128 0.0101

113 10-5-1 0.0121 0.0093

6 1-6-1 0.0169 0.0133

42 4-6-1 0.0130 0.0113

78 7-6-1 0.0132 0.0100

114 10-6-1 0.0131 0.0114

7 1-7-1 0.0165 0.0133

43 4-7-1 0.0138 0.0109

79 7-7-1 0.0147 0.0135

115 10-7-1 0.0120 0.0098

8 1-8-1 0.0178 0.0144

44 4-8-1 0.0129 0.0101

80 7-8-1 0.0159 0.0124

116 10-8-1 0.0141 0.0099

9 1-9-1 0.0192 0.0150

45 4-9-1 0.0138 0.0115

81 7-9-1 0.0130 0.0105

117 10-9-1 0.0118 0.0091

10 1-10-1 0.0178 0.0147

46 4-10-1 0.0128 0.0101

82 7-10-1 0.0138 0.0100

118 10-10-1 0.0118 0.0093

11 1-11-1 0.0175 0.0150

47 4-11-1 0.0141 0.0113

83 7-11-1 0.0117 0.0094

119 10-11-1 0.0121 0.0095

12 1-12-1 0.0181 0.0152

48 4-12-1 0.0135 0.0109

84 7-12-1 0.0136 0.0107

120 10-12-1 0.0113 0.0083

13 2-1-1 0.0149 0.0123

49 5-1-1 0.0154 0.0128

85 8-1-1 0.0133 0.0102

121 11-1-1 0.0129 0.0104

14 2-2-1 0.0137 0.0104

50 5-2-1 0.0140 0.0113

86 8-2-1 0.0133 0.0102

122 11-2-1 0.0135 0.0102

15 2-3-1 0.0140 0.0114

51 5-3-1 0.0140 0.0114

87 8-3-1 0.0122 0.0087

123 11-3-1 0.0106 0.0083

16 2-4-1 0.0139 0.0114

52 5-4-1 0.0129 0.0109

88 8-4-1 0.0127 0.0103

124 11-4-1 0.0132 0.0105

17 2-5-1 0.0123 0.0090

53 5-5-1 0.0138 0.0114

89 8-5-1 0.0124 0.0095

125 11-5-1 0.0126 0.0090

18 2-6-1 0.0125 0.0091

54 5-6-1 0.0116 0.0090

90 8-6-1 0.0122 0.0098

126 11-6-1 0.0115 0.0096

19 2-7-1 0.0129 0.0102

55 5-7-1 0.0127 0.0104

91 8-7-1 0.0175 0.0146

127 11-7-1 0.0132 0.0106

20 2-8-1 0.0132 0.0102

56 5-8-1 0.0138 0.0114

92 8-8-1 0.0120 0.0097

128 11-8-1 0.0126 0.0114

21 2-9-1 0.0125 0.0106

57 5-9-1 0.0122 0.0101

93 8-9-1 0.0152 0.0122

129 11-9-1 0.0134 0.0114

22 2-10-1 0.0144 0.0117

58 5-10-1 0.0125 0.0100

94 8-10-1 0.0138 0.0112

130 11-10-1 0.0111 0.0087

23 2-11-1 0.0129 0.0109

59 5-11-1 0.0127 0.0108

95 8-11-1 0.0133 0.0100

131 11-11-1 0.0149 0.0111

24 2-12-1 0.0125 0.0094

60 5-12-1 0.0135 0.0113

96 8-12-1 0.0132 0.0102

132 11-12-1 0.0105 0.0079

25 3-1-1 0.0157 0.0130

61 6-1-1 0.0154 0.0128

97 9-1-1 0.0150 0.0127

133 12-1-1 0.0157 0.0135

26 3-2-1 0.0144 0.0115

62 6-2-1 0.0150 0.0123

98 9-2-1 0.0134 0.0108

134 12-2-1 0.0156 0.0135

27 3-3-1 0.0143 0.0116

63 6-3-1 0.0130 0.0104

99 9-3-1 0.0147 0.0122

135 12-3-1 0.0135 0.0105

28 3-4-1 0.0163 0.0139

64 6-4-1 0.0126 0.0099

100 9-4-1 0.0146 0.0108

136 12-4-1 0.0129 0.0116

29 3-5-1 0.0146 0.0119

65 6-5-1 0.0134 0.0107

101 9-5-1 0.0157 0.0128

137 12-5-1 0.0126 0.0086

30 3-6-1 0.0143 0.0116

66 6-6-1 0.0119 0.0100

102 9-6-1 0.0126 0.0101

138 12-6-1 0.0116 0.0093

31 3-7-1 0.0131 0.0099

67 6-7-1 0.0132 0.0107

103 9-7-1 0.0123 0.0099

139 12-7-1 0.0120 0.0091

32 3-8-1 0.0139 0.0112

68 6-8-1 0.0124 0.0099

104 9-8-1 0.0156 0.0128

140 12-8-1 0.0133 0.0095

33 3-9-1 0.0145 0.0120

69 6-9-1 0.0137 0.0110

105 9-9-1 0.0177 0.0138

141 12-9-1 0.0181 0.0151

34 3-10-1 0.0146 0.0120

70 6-10-1 0.0140 0.0118

106 9-10-1 0.0135 0.0108

142 12-10-1 0.0138 0.0100

35 3-11-1 0.0126 0.0103

71 6-11-1 0.0113 0.0090

107 9-11-1 0.0120 0.0099

143 12-11-1 0.0126 0.0086

36 3-12-1 0.0154 0.0132

72 6-12-1 0.0125 0.0103

108 9-12-1 0.0126 0.0102

144 12-12-1 0.0159 0.0135



Blerina VIKA

82

5.1.5 Modeli ARIMA

Ndryshe nga modelet shumë-variabëlshe me ndryshore shpjeguese që mbështeten në teoritë

ekonomike, ARIMA është një model i pastër statistikor, në të cilin seria kohore regresohet

mbi vlerat e veta të mëparshme (komponenti auto-regresiv) plus vlerat e tashme e të kaluara

të termit të „bardhë‟ të gabimit (komponenti i mesatares lëvizëse) (Meylar, Kenny, & Quinn,

1998). Kështu, për nga natyra e tyre modelet ARIMA ofrojnë pak logjikë ekonomike;

predikimet për të ardhmen formohen ekskluzivisht nga informacioni i ruajtur në lëvizjet e

kaluara dhe gabimet e parashikimit. Por, pavarësisht të qenit me “kokën mbrapa” dhe jo fort

të mirë në predikimin e një pike kthese, modelet ARIMA shpesh ua kalojnë predikimeve të

modeleve me shumë ndryshore, veçanërisht në afatin e shkurtër.

Një mënyrë e përgjithshëm për shprehjen e këtij modeli është ARIMA (p, d, q), ku p është

numri i termave auto-regresiv, d tregon operatorin e diferencës (numri i diferencave që

nevojitet për të konvertuar serinë një nivel stacionar), dhe q është rendi i termave të mesatares

lëvizëse në model. Meqë shumë të dhëna ekonomike, përfshirë kursin e këmbimit, përmbajnë

sezonalitet të ndryshueshëm e të paqartë do të ishte e rëndësishme të testonim specifikimin

standard ARIMA me ndryshore cilësore sezonale shtesë.

Në praktikë, kemi ndjekur këto hapa për të përcaktuar modelin parashikues ARIMA më të

mirë. Në fillim testojmë rendin e integrimit, nëse të dhënat janë stacionare apo nëse kërkohet

diferencimi i tyre. Pastaj vlerësojmë regresione të ndryshme deri sa të identifikohet

kombinimi më i mirë ARIMA, bazuar në teste diagnostikimi të caktuara. Në këtë hap,

vëmendje e veçantë i kushtohet jo vetëm karakteristikave të mira brenda-periudhe të modelit,

por edhe ndaj ecurisë së parashikimit të tyre dhe numrit të parametrave që përfshihen në

model.

Në paraqitjen grafike të kursit të këmbimit USD/EUR mund të vërehet se monedha e

përbashkët evropiane ka ndjekur një trend zhvlerësimi deri në vitin 2000; pastaj ajo ndryshoi

në kahun e kundërt duke rikuperuar humbjet deri në vitin 2007; pas kësaj euro është luhatur

rreth atij niveli. Me fjalë të tjera, kursi i euros është luhatur rreth mesatares $1.33 në gjysmën

e parë të kësaj dekade, krahasuar me nivelin mjaft më të ulët prej $1.19 gjatë 16 viteve të

mëparshme. Ndërkaq, koeficienti i saj i variacionit ka qenë përgjithësisht i kontrolluar në

vetëm 4.1 gjatë periudhës pas krizës globale, nivel ky rreth katër herë më i ulët se periudha

para krizës.

Ngjashëm me këtë përfundim, testet e rrënjës njësi tregojnë që kursi USD/EUR është jo-

stacionar në nivel. Testet ADF dhe Phillips-Perron shfaqin, megjithatë, se seria mund të bëhet

stacionare rreth konstantes (dhe trendit) nëse diferencohet një herë. Rezultatet e ndryshme



Blerina VIKA

83

qëndrojnë për të gjithë periudhën e vëzhguar, ashtu dhe për nën-periudhën që fillon prej vitit

2000. Prandaj, kursi i euros do të hyjë në modelin ARIMA në diferencë të parë.

Tabela 5-2: Testet Unit Root mbi kursine e këmbimit USD/EUR

ADF test results Phillips-Perron test results

Null Hypothesis: Unit root Null Hypothesis: Unit root

Levels 1st difference Levels 1st difference

Variables Prob. Laga Prob. Lag

a Prob. Bandwidth

b Prob. Bandwidth

b

1994M01:2014M12

With constant 0.3000 1 0.0000 0 0.3854 5 0.0000 1

With constant and trend 0.5571 1 0.0000 0 0.6542 5 0.0000 1

None 0.6590 1 0.0000 0 0.6672 5 0.0000 1

2000M01:2014M12

With constant 0.3948 1 0.0000 0 0.4649 4 0.0000 1

With constant and trend 0.6792 1 0.0000 0 0.7898 4 0.0000 1

None 0.7277 1 0.0000 0 0.7443 4 0.0000 2

aAutomatic selection of lags based on SIC;

bNewey-West bandwidth selection using Bartlett kernel

Pas përcaktimit të rendit të integrimit, I(1), jemi përpjekur të identifikojmë komponentët e

tjerë AR dhe MA të përshtatshëm për modelin tonë, duke u mbështetur në vlerësime formale

të testeve të caktuara diagnostike dhe në aftësinë parashikuese të çdo specifikimi potencial.

Prej disa metodave identifikuese alternative për përcaktimin e parametrave p dhe q ne kemi

ndjekur kriteret e penalitetit të funksionit, të cilët edhe pse nuk ofrojnë ndonjë udhëzim teorik

për përzgjedhjen e rendit maksimal të ARIMA-s, ata janë të përputhshme asintotikisht dhe jo

të bazuar në interpretime subjektive. Kriteret e penalitetit të funksionit të tilla si statistikat

Akaike, Schwartz dhe Hannan-Quinn ndihmojnë në përzgjedhjen e modelit me shumën e

gabimeve në katror më të minimizuar. Megjithatë, theksi ynë në fund ishte mbi ecurinë e

parashikimeve, e cila sugjeron vëmendje më të madhe mbi minimizimin e gabimeve të

parashikimit jashtë-periudhe sesa mbi maksimizimin e „përshtatjes së mirë‟ brenda-periudhe

– apo R2 i korrektuar (Meylar, Kenny, & Quinn, 1998).

Në praktikë, ne vlerësuam forma të ndryshme ARIMA me duzinë vonesash AR e MA dhe me

ndryshore cilësore sezonale, të cilat u testuan vazhdimisht për shpërndarjen normale,

korrelacionin serial dhe heteroskedasticitetin tek mbetjet. Periudha e vlerësuar mbulon janar

1994 deri në dhjetor 2013, kurse të dhënat e vrojtuara në 2014 u ruajtën për të vlerësuar

ecurinë e parashikimit jashtë-periudhe. Ndodhi që mbushja e modelit me shumë parametra

rriste fuqinë shpjeguese brenda-periudhe por dobësonte testet diagnostike dhe/ose aftësinë

parashikuese jashtë-periudhe. Prandaj ne në fund ruajtëm një model të kursyer me numrin më



Blerina VIKA

84

të vogël të mundshëm të parametrave. Termi i konstantes e gjithashtu ndryshoret cilësore

sezonale qëndruan në model meqenëse, edhe pse jo fort të rëndësishme statistikisht, ato

dukeshin se ndihmonin në përmbushjen e kritereve të përmendura më lart. Struktura e

modelit tonë të preferuar është ARIMA sezonale (7, 1, 48), vlerësuar nëpërmjet metodës së

kursyer të Katrorëve më të Vegjël të Kushtëzuar ARMA (Marquardt) sipas specifikimit më

poshtë:

(USDEUR) = 0.35*AR(1) – 0.16*AR(2) + 0.08*AR(3) – 0.12*AR(7) – 0.28*MA(48) + 0.01*c + sezon

Prob koeficien. 0.00 0.02 0.23 0.07 0.00 0.16 0.36

R2-axhust. = 0.12 Gabimi standard i regresionit = 0.0277

Shpërndarja normale: prob. testit JB = 0.15

Korrelacioni serial: testi LM, probabiliteti Chi2(12) = 0.55

Heteroskedasticiteti: testi BPG, probabiliteti Chi2(11) = 0.53

ku „‟ përfaqëson operatorin e ndryshimit; c tregon konstanten; dhe sezon është për 11

variablat cilësore të sezonalitetit të përfshira në specifikim. Shumica e termave të përzgjedhur

autoregresiv e të mesatares lëvizëse janë të rëndësishëm statistikisht, siç tregohet nga

propabilitetet poshtë secilit koeficient. Analiza në vijim diskuton se si krahasohet kjo me

ecurinë e parashikimit të modelit NAR 11-12-1 që vlerësuam më lart.

5.1.6 Krahasim i aftësisë parashikuese të modeleve

Matësit e zakonshëm për vlerësimin dhe krahasimin e fuqisë parashikuese të një modeli janë

Gabimi Mesatar (ME), Mesatarja e Gabimeve Absolute (MAE), Rrënja e Mesatares së

Katrorit të Gabimeve (RMSE), dhe statistika U e Theil-it. Matësi i parë, ME, jep indikacione

mbi tendencën për të mbivlerësuar (nënvlerësuar) zhvillimet aktuale të kursit të këmbimit. Dy

matësit e tjerë, MAE dhe RMSE, janë të vlefshëm për ekzaminimin e madhësisë së gabimeve

të parashikimit. MAE nënkupton se përkeqësimi i gabimeve rritet në proporcion me MAE

(p.sh. gabimi 2 përqind është 2 herë më serioz se gabimi 1 përqind), ndërsa RMSE supozon

se gabimet më të mëdha të parashikimit janë më keq se ato më të vogla. Matësi i fundit, U e

Theil-it, është një tregues tërheqës mbi saktësinë relative, i cili na mundëson të kuptojmë nëse

teknikat parashikuese të aplikuara këtu janë më të mira, të mira si, apo më keq se një

hamendje e thjeshtë.

Siç përmendëm më parë, periudha e vlerësimit të parashikimit për të dy modelet konkurruese,

ARIMA dhe rrjeti NAR, është përzgjedhur qëllimshëm për vëzhgimet jashtë-periudhe. Kjo

është një procedurë e zakonshme mes parashikuesve, të cilët besojnë se evidencat e aftësisë

parashikuese brenda-periudhe nuk garanton parashikueshmëri të kënaqshme jashtë-periudhe



Blerina VIKA

85

(Inoue & Kilian, 2002). Prandaj, për të shmangur çdo mundësi të përfundimeve të rreme,

krahasimi i fuqisë parashikuese të modeleve tona të përzgjedhura është realizuar për

periudhën janar-dhjetor 2014, e cila nuk është përdorur gjatë vlerësimit të regresioneve apo

në procesin e testimit.

Figure 5-3 paraqet kursin e këmbimit USD/EUR gjatë vitit 2014 dhe 12 parashikimet e tij një-

muaj-përpara sipas modeleve ARIMA (7,1,48) dhe NAR (11-12-1), si dhe një parashikim

naiv që supozon „asnjë ndryshim‟ në muajin pasardhës. Një inspektim i shpejtë vizual

sugjeron për një ecuri më të mirë të modelit të rrjetit neural, meqenëse parashikimet nga NAR

duken përgjithësisht më afër me vëzhgimet aktuale se vlerat e tjera të parashikuara. Nga ana

tjetër, nuk duket qartë nëse predikimet nga ARIMA ua kalojnë vlerave të hamendjeve naive.

Në të vërtetë, vlerat e parashikuara nga ARIMA tentojnë të alternojnë pozicionin e tyre deri

në korrik, po mbeten përmbi vëzhgimeve aktuale (d.m.th. gabime pozitive) më pas. Kjo

nënkupton se modeli ARIMA na ka dhënë parashikime robuste në kohë më normale, por

pastaj e ka tejparashikuar kursin USD/EUR e ka qenë i ngadaltë në kapjen e trendit të ri në

gjysmën e dytë të vitit, gjatë së cilës Banka Qendrore Evropiane i ngacmoi tregjet me shenja

paralajmëruese për inicimin e programit të lehtësimit sasior të parasë5.

Figure 5-3: Parashikimi jashtë-periudhe i kursit USD/EUR për 12-muaj

5“Markets rally after Draghi QE hint”, artikull në Financial Times, 25 gusht 2014. Gjithashtu shih artikullin

“ECB meeting recap: Draghi hints at more easing action next year”, në blogs.marketwatch.com, 4 dhjetor 2014.

1.20

1.22

1.24

1.26

1.28

1.30

1.32

1.34

1.36

1.38

1.40

Actual data ARIMA forecast NAR forecast Naive forecast



Blerina VIKA

86

Tabela 5-3:Vlerësimi i parashikimeve të kursit USD/EUR

12 periudha një-muaj-përpara, Janar deri Dhjetor 2014

ARIMA(7,1,48) NAR 11-12-1

Mean Error 0.0115 -0.0008

Mean Absolute Error 0.0159 0.0079

Root Mean Squared Error 0.0181 0.0105

Theil‟s U statistic 0.9921 0.5748

Tabela 5-3 paraqet matësit për vlerësimin e parashikimeve të modeleve ARIMA dhe NAR.

Vërehet se rezultatet konfirmojnë superioritetin e teknikës NAR sipas të gjithë matësve.

Mesatarja e gabimeve të tij është pranë zeros – ose më saktë, më pak se një e dhjeta e një

centi – duke sugjeruar se mesatarisht, NAR nuk ka mbivlerësuar e as ka nënvlerësuar kursin e

këmbimit gjatë vitit 2014. Përkundër tij, mesatarja e gabimeve të parashikimeve nga modeli

ARIMA, edhe pse i moderuar, tregon një shmangie të parashikimeve ndaj aktualeve me 1.15

cent gjatë të njëjtës periudhë.

Madhësia e ME në modelin ARIMA është rreth tre-të-katërtat e MAE, duke sugjeruar se

modeli nuk predikon vazhdimisht shumë lart. Por përsëri, ky raport është vetëm një-e-dhjeta

në rastin e modelit NAR. Përfundime të ngjashme arrihen edhe kur vërejmë madhësitë e

matësve MAE dhe RMSE, të cilët tregojnë se gabimet e parashikimeve më të mëdha duhet të

merren më seriozisht në rastin e modelit ARIMA, dhe më pak në rastin e rrjetit neural.

Së fundi, statistika Theil në rreshtin e fundit të tabelës paraqet se si krahasohen të dy modelet

me një pritje naive (d.m.th. nëse supozojmë se kursi i këmbimit në muajin tjetër do të jetë i

njëjtë si këtë muaj). I llogaritur si raporti i RMSE-së së modelit ARIMA (NAR) ndaj RMSE-

së së modelit naiv, statistika Theil më e madhe se një do të sugjeronte se parashikimet e

modeleve tona të vlerësuara ecin më keq se një model me ecje të rastësishme. Kjo statistikë

për modelin ARIMA është pranë njëshit, duke na thënë se – ashtu si inspektimi i grafikëve –

predikimet e tij në vitin 2014 ishin mesatarisht jo më të mira se një hamendje „asnjë

ndryshim‟ i kursit. Në anën tjetër, predikimet nga NAR shfaqen të tejkalojnë edhe modelin

naiv, arsyetimet e të cilit për kursin në muajin pasardhës janë dy herë më të gabuara.

5.1.7 Vërejtje përfundimtare

Në këtë seksion përpiqemi të kontribuojmë në literaturën e rrjeteve neurale duke demonstruar

se sa e fuqishme dhe e vlefshme mund të jenë ato në procesin e vendimmarrjeve ekonomike e

financiare. Për të demonstruar këtë, ne zgjodhëm kursin USD/EUR si një aset mjaft i

luhatshëm e shumë i përdorur në transaksionet e tregjeve financiare globale, e megjithatë



Blerina VIKA

87

shumë i debatuar në punimet akademike për shkak të devijimeve shpesh të mëdha të tij nga

nivelet fondamentale të sugjeruara nga teoritë ekonomike.

Ne ishim në gjendje të tregojmë, edhe pse përmes një aplikimi modest, se modelet e rrjeteve

neurale mund të kenë vlerë të shtuar e ndoshta të tejkalojnë modelet tradicionale të përdorura

për parashikimin e kursit të këmbimit. Rezultatet janë afirmative se rrjeti autoregresiv jo-

linear thyente vazhdimisht parashikimet statike të modelit ARIMA (dhe të ecjes rastësore)

për kursin euro-dollar. Megjithatë, përveç teknikave autoregresive dhe parashikimeve statike,

kjo punë kërkimore mund të zgjerohet më tej duke përfshirë modele më të avancuara të

bazuara në fondamente ekonomike e gjithashtu të bëhen krahasime edhe për parashikime

dinamike.



Blerina VIKA

88

Kapitulli 6

6 ANALIZA DHE DIZENJIMI I RRJETIT NEURAL PARASHIKUES

PËR KURSIN E KËMBIMIT

6.1 Hyrje

Në këtë pjesë të punimit tonë përshkruajmë analizën dhe dizenjimin që duhet ndjekur për të

zhvilluar sistemin inteligjent parashikues (SIP) bazuar në përqasjen e rrjetave neurale. Hapat

e ndjekur për zhvillimin e sistemit janë në përputhje me teknikat e disiplinës së inxhinierimit

të softuerëve. Bazuar në të, duhet që çdo softuer të ndërtohet nëpërmjet aktiviteteve të

ndryshme të ciklit të tij jetësorë6. Aktivitetet mund të përsëriten dhe organizohen në forma të

ndryshme përgjatë zhvillimit dhe mirëmbajtjes së softuerit, në përputhje me karakteristikat e

tij. Trajtimi i zhvillimit të softuerit në këtë mënyrë përbën një vlerë të shtuar të këtij

disertacion.

Pavarësisht se rrjetat neurale kanë gjetur një përdorim të gjerë në probleme të ndryshme,

shpeshherë zhvillimin softuerik që i bëhet ndërtimit të aplikacioneve që përdorin rrjetat

neurale ndeshet me mangësi. Në përgjithësi në punime të shumta, softuerët të mbështetur në

ndërtimin e rrjetave neurale zhvillohen me anë të modelit të procesit „ndërto-dhe-rregullo‟.

Ripërdorimi i këtyre softuerëve, të ndërtuar me anë të këtij modeli, do të ishte i vështirë nëse

nuk do të zotëroheshin njohuri të mjaftueshme dhe eksperiencë mbi përdorimin e rrjetat

neurale. Një çështje e rëndësishme është dhe adresimi që i bëhet praktikave të inxhinierimit të

softuerit për zhvillimin e rrjetave neurale. Zhvillimi i sistemit inteligjent do të përdorë një

sërë metodash dhe teknikash të disiplinës së inxhinierimit për të ndërtuar dhe vlerësuar rrjetat

neurale për parashikim. Këto teknika dhe metoda, në të shumtën e rasteve, do të aplikohen në

mënyrë të përsëritur në faza dhe pjesë të ndryshme të softuerit.

6 Ka të bëjë me ndarjen hap-pas-hapi të procesit të zhvillimit të softuerit në një bashkësi aktivitetesh.



Blerina VIKA

89

Një çështje e rëndësishme, në lidhje me analizën dhe dizenjimin, është inxhinierimi i

komponentëve të përgjithshëm të rrjetit neural në mënyrë të pavarur nga specifikat e fushës

së problemit duke bërë që softueri të ketë një përdorueshmëri më të gjerë. Ky softuer do të

mbështetet në topologjinë e rrjetave neurale SHS-e dhe trajnimi i tyre do të bëhet me

mënyrën e mbikëqyrur. Seria kohore që përdoret në këtë softuerë është me një-ndryshore, të

zhurmshme, me luhatshmëri të madhe dhe jo-stacionare.

6.2 Qëllimi i softuerit

Qëllimi i softuerit është të automatizojë gjenerimin e topologjisë së rrjetit neural më të mirë

për parashikimin e kursit të këmbimit si dhe mënyrën më të përshtatshme të përpunimit

paraprak të serisë kohore me një-ndryshore. Përzgjedhja automatike e rrjetit më të mirë do të

bëhet mbështetur mbi aftësitë e tij për të parashikuar. Softueri duhet të përcaktojë vetë se

kush do të jetë algoritmi i trajnimit më i mirë për të mësuar rrjetin, në lidhje me dy kritere

bazë: (i) në lidhje me saktësinë parashikuese të rrjetit si dhe (ii) me kohën e nevojshme për të

realizuar trajnimin e tij. Automatizimi do të bëhet mbështetur mbi serinë kohore që i paraqitet

rrjetit neural. Seria kohore është me një-ndryshore dhe kërkohet të parashikohet jashtë

periudhe një hap7 përpara.

Objektivat kryesore të sistemit inteligjent parashikues janë:

Të parashikoj vlera të ardhshme të serisë kohore, me një-ndryshore, një numër të

caktuar hapash që përcaktohen nga përdoruesi.

Të mund të përcaktojë një para-përpunim të serisë kohore bazuar në ecurinë e aftësisë

parashikuese të rrjetit.

Të ruajë modelet e suksesshme parashikuese për një seri kohore të dhënë që të

mundësojë ripërdorimin e tyre nëse kërkohen parashikime në kohë të ndryshme.

Nëse seria kohore rritet atëherë softueri duhet të ri-mësoj modelin parashikues me të

dhënat e reja për të rritur aftësitë parashikuese.

6.3 Organizimi i zhvillimit të sistemit inteligjent

Teknologjitë e reja shpesh kërkojnë një metodë modelimi dhe zhvillim të ri ose të përshtatur.

Në momentin që ne kuptojmë se çfarë është ndryshe në këto teknologji mund të përcaktojmë

7 Lidhet me frekuencën e serisë kohore nëse ajo është p.sh ditore, javore etj.



Blerina VIKA

90

dhe mënyrën se si duhen përshtatur metodat ekzistuese. Projektet që përdorin RN-le

ndryshojnë nga projektet softuerike tradicionale (Tarassenko, 1998) dhe kjo në disa aspekte

si:

Ato janë të drejtuar nga të dhënat, për këtë arsye mbledhja dhe analiza e të

dhënave duhet të jetë pjesë e procesit të modelimit dhe trajnimit të rrjetit.

Nuk mund të përcaktohet zgjidhja e plotë që në fazën e modelimit. Për këtë

ndërtohen prototipa të cilët vlerësohen për të gjykuar mbi elementët e

përfshirë në modelim.

Efektshmëria e rrjetit është më e rëndësishme se shpejtësia përllogaritëse.

Kujdesi për performancën tregohet që në fazën e analizës, dizenjimit dhe

testimit.

Bazuar në këto aspekte është e nevojshme që dhe zhvillimi i tyre duhet të ndryshojë nga

zhvillimi i softuerëve tradicionale për të adresuar më mirë këto tipare. Ngjashmëria me

dizenjimin e softuerëve të zakonshëm është se, për të zhvilluar një softuer që përdorë RNA-e

të suksesshëm, duhet që cikli i tij jetësorë të përbëhet nga 6 faza kryesore (Basheer I.A. dhe

Hajmeer M,, 2000): Përcaktimi dhe formulimi i problemit, dizenjimi, realizimi i sistemit,

vlerësimi (validimi) dhe verifikimi, implementimi dhe mirëmbajtja (Figure 6-1 ).

Figure 6-1: Cikli jetësore i ndërtimit të SIP

Këto faza ndiqen për çdo pjesë të sistemit. Por detyrat që kryhen për çdo fazë ndryshojnë në

varësi të tipit dhe karakteristikave të modulit që zhvillohet. Gjithashtu theksojmë se për pjesë

të caktuara të sistemit këto faza kanë një rrjedhshmëri të ndryshme ndërmjet tyre. Mënyra se



Blerina VIKA

91

si organizohen këto faza dhe se si ato komunikojnë me njëra-tjetrën përbëjnë dhe modelin e

procesit inxhinierues të zhvillimit të softuerit.

Suksesi i një modeli procesi mbështetet shumë në mjetet që përdoren për të paraqitur atë. Për

të dhënë një pamje të përgjithshme të procesit, një mënyrë shumë e përdorshme është

nëpërmjet paraqitjes grafike të hapave përpunues të informacionit bazë të sistemi.

Për të menaxhuar më mirë kompleksitetin e sistemit tonë kemi bërë ndarjen e sistemit në

pjesë më të vogla të quajtura module. Përpunimi i informacionit në secilën nga modulet është

i pavarur nga të tjerët. Modulimi bën të mundur që secili nga modulet të analizohet,

zhvillohet dhe testohet në mënyrë të pavarur. Gjithashtu kjo mënyrë e ndërtimit të sistemit

rrit mundësinë e ripërdorimit të moduleve, në zgjidhjen e problemave të tjerë të ngjashëm apo

dhe të lokalizimit të ndryshimeve në module pa qenë i nevojshëm rikonceptimi i sistemit në

tërësi.

Një çështje e rëndësishme e trajtuar në këtë punim është përdorimi i metodave të validimit

dhe verifikimit për rrjetat neurale të ndërtuar, si dhe vendosja e disa udhëzimeve për të

drejtuar përzgjedhjen e parametrave. Për këto elementë nuk ekzistojnë metoda standarde

prandaj dhe sugjerimet e realizuara në këtë punim janë rezultat i një procesi kërkimorë dhe

analizues. Në seksionin e mëposhtëm bëhet analiza e sistemit tonë.

6.4 Specifikimi dhe analiza e problemit

Në bazë të analizës së bërë ndaj fushës së aplikimit të SIP janë përcaktuar qëllimi dhe

kufizimet e sistemit. Gjithashtu janë bërë vlerësimet e pikave dhe kritereve që duhen

analizuar dhe trajtuar në fazat e mëtejshme. Pasi është përcaktuar qëllimi kryesorë i SIP është

e nevojshme të përcaktohen se cilat janë funksionet kryesore që do të kryejë sistemi ynë si

dhe kush janë aktorët kryesore që ndërveprojnë me sistemin.

Ashtu siç shihet dhe në Figure 6-1 jepen aktivitetet kryesore të ciklit jetësorë të zhvillimit të

SIP, faza e parë është specifikimi dhe formulimi i problemit. Në këtë fazë është e nevojshme

të mund të analizohen dhe ndërthuren informacione të fushës së problemit, që merren nga

ekspert të fushës si dhe zhvilluesit, për të kuptuar më mirë se çfarë kërkohet. Informacioni i

mbledhur në këtë fazë përdoret për të indeksuar dhe karakterizuar problemin që më pas të

mund të përdoren si themele për fazat e mëvonshme.

Sistemi ynë përbëhet nga tre module kryesore: moduli i përgatitjes së të dhënave hyrëse të

rrjetit, moduli i gjenerimit të strukturave të ndryshme të rrjetave neurale si dhe moduli i



Blerina VIKA

92

përzgjedhjes së algoritmit trajnues për rrjetat neurale. Këto module nuk janë plotësisht të

ndarë nga njëri-tjetrit por trajtimi i zhvillimit të tyre si pjesë të veçanta lehtëson specifikimin,

analizën dhe zhvillimin e tyre. Rezultati i nxjerr nga një modul shërben si një të dhëna hyrëse

për një modul tjetër (Figure 6-2).

Figure 6-2: Modulet e sistemit inteligjent për parashikim

Specifikimi i sistemit tonë është bazuar në artifaktet e formuara si rezultat i studimit të

literaturave të ndryshme, që përdorin rrjetat neurale si modele parashikuese. Metodologjia që

përdorë ky sistem për të modeluar rrjetin neural parashikues më të mirë, mbështetet në

teknikat më të mira të përzgjedhura dhe aplikuara në punime të ndryshme. Skema në Figure

6-3 paraqet fazat e ndjekura për të specifikuar sistemin tonë:

Figure 6-3: Fazat e specifikimit të kërkesave për SIP



Blerina VIKA

93

Specifikimet e kryera në këtë fazë janë kategorizuar sipas modulimit të sistemit në:

specifikime për përpunimin e të dhënave, modelimin e rrjetit neural dhe përzgjedhjes së

algoritmit të trajnimit. Për të gjithë sistemin është e rëndësishme të ndërtohen modele formale

për specifikimin e kërkesave. Këto modele mundësojnë një sfond të përshtatshëm dhe të qartë

për të kryer analizën dhe dizenjimin e kërkesave për të arritur në identifikimin e pasojave për

çdo zgjedhje të kryer. Modelet formale njihen si mjete të cilat eliminojnë çdo paqartësi apo

paqëndrueshmëri në kërkesa, të cilat janë të pashmangshme në specifikimin joformal të tyre.

Në këtë fazë është e rëndësishme të tregohen se cilat janë aftësitë dhe objektivat që duhet të

përmbushen nga sistemi që duam të zhvillojmë. Këto kërkesa ndahen në funksionet që duhet

të kryej sistemi, specifikat që duhet të përmbushin të dhënat që do përdoren, si dhe kufizimet

e sistemit që po zhvillohet.

Funksionet kryesore të SIP paraqiten në pikat e mëposhtme:

1. Sistemi duhet të marrë të dhënat nëpërmjet një skedari të dhënash ose nga ndonjë bazë

të dhënash.

2. Sistemi përcakton bashkësinë e të dhënave hyrëse dhe atyre dalëse nisur nga seria

kohorë e dhënë.

3. Nëse përdoruesi nuk përcakton ndonjë preferencë për transformimin që i duhet bërë të

dhënave atëherë sistemi, duke përdorur disa rregulla përpunimi, para-përpunon të

dhënat hyrëse dhe dalëse në n mënyra të ndryshme si dhe ruan parametrat dhe

informacionet e nevojshme mbi çdo përpunimin e kryer.

4. Për secilën nga n-seritë e të dhënave realizohet ndarja në tre bashkësisë, trajnuese ,

validuese dhe testuese.

5. Krijon një numër m struktura të ndryshme të rrjetit neural ku për çdo strukturë

përcaktohen numrin e shtresave dhe numrin e nyjave në secilën shtresë. Përveç tyre

jepen dhe vlerat fillestare për parametrat e tjerë si, shkalla e të mësuarit, treguesi i

shpejtësisë, numri i cikleve të trajnimit si dhe algoritmi i trajnimit.

6. Për çdo kombinimi të mënyrës përpunuese së të dhënave me strukturat e ndryshme të

rrjetave neurale realizohet trajnimi për to. Trajnimi për secilin kombinim përsëritet një

numër t-herësh për secilën nga t-bashkësitë e ndryshme të peshave të rrjetit. (për të

eliminuar ngecjen në një minimum lokal)

7. Rezultatet e aftësisë parashikuese jashtë periudhe, si dhe rrjetat neurale të trajnuara

ruhen.

8. Sistemi krahason këto rezultate dhe zgjedh një numër të caktuar rrjetash të cilat kanë

rezultuar me aftësitë më të mira parashikuese.



Blerina VIKA

94

9. Rrjetat e përzgjedhur ritrajnohen, por tashmë me algoritme të ndryshme trajnimi.

Ndërmjet tyre zgjidhet ai rrjet që ka aftësitë më të mira përgjithësuese.

10. Sistemi më pas përdor këtë rrjet për të gjeneruar parashikime të mëtejshme.

11. Në qoftë se i jepen të dhëna të tjera trajnuese atëherë sistemi e ritrajnon rrjetin e

përzgjedhur me të dhënat më të reja.

12. Sistemi gjeneron paraqitje grafike për demonstruar të dhënat e parashikuara.

Gjithashtu mund të ofroj dhe forma të tjera të rezultateve si p.sh Excel etj.

Në lidhje me kërkesat e të dhënave kemi që të dhënat janë seri me një ndryshore të

zhurmshme, të luhatshme dhe jo-stacionare.

Specifikimi i kërkesave për përpunimin e të dhënat

Përpara se të ndërtohet dhe të trajnohet rrjeti neural është e rëndësishme zgjedhja dhe

përgatitja e të dhënave që do të furnizojnë rrjetin me informacion të nevojshme për të

përgjithësuar. Edhe pse modelet e rrjetit neural kanë si avantazh të tyre aftësinë për të operuar

me të dhëna me cilësi të ulët, të dhënat me cilësi të lartë ndikojnë shumë në realizimin e

procesit të mësimit të rrjetit.

Për të siguruar të dhëna të sigurta është e nevojshme të analizohet seria për të nxjerr se cilat

janë karakteristikat e saj. Më pas, duhen aplikuar transformime të ndryshme për të rritur

cilësinë e tyre. Megjithatë ka dhe raste kur transformimi i të dhënave eliminon tipare që janë

të rëndësishme në të dhënat. Në modelimin e të dhënave duhen evituar përpunimet e tepruara

mbi të dhënat. Në literatura të ndryshme sugjerohet krahasimi i formave të ndryshme për

përpunimi e serisë dhe të shikohet se si ndryshojnë aftësitë parashikuese të rrjetit neural.

Më poshtë listohen disa tipare që janë specifike për përdorimin e të dhënave në modelin e

rrjetave neurale.

1. Ajo çfarë shohim si specifike për këtë sistem është se ne nuk mund të përcaktojmë

mënyrën më të mirë të përpunimit pa realizuar implementim të sistemit. Ky vendim merret

nga vetë sistemi gjatë ekzekutimit. Për ne është e nevojshme që në këtë fazë të japin mënyrën

se si do të arrijë vetë sistemi të realizojë këtë përzgjedhje.

2. Të gjitha të dhënat që do të përdoren për të ndërtuar rrjetin më të mirë duhet të kenë të

njëjtin përpunim. Këto të dhëna përdoren në hapa të ndryshëm të procesit modelues, prandaj

është e nevojshme që të ruhen të gjitha specifikimet për çdo përpunim të kryer mbi të dhënat.



Blerina VIKA

95

3. Edhe nëse rrjeti është ndërtuar dhe përdoret për parashikim, gjatë fazës së ritrajnimit

të rrjetit me të dhëna të reja duhet që këto të dhëna të përpunohen në të njëjtën mënyrë si të

dhënat ekzistuese.

Duke konsideruar tiparin e 1. sistemi jonë realizon disa procesime të ndryshme mbi të dhënat

dhe për secilin prej tyre ai shikon performancën e rrjetave neurale. Përpunimi i të dhënave

kryhet përpara se të ndërtohen strukturat e rrjetave neural si dhe përpara se të bëhet ndarja e

të dhënave në tre bashkësitë: trajnuese, validuese dhe testuese (që bënë plotësimin e tiparit të

2.).

Përzgjedhja e mënyrave të përpunimit ndaj të dhënave, në këtë softuer, mbështet në rezultatet

që vijnë nga punime të ndryshme të cilët përdorin rrjetat neurale për parashikimin e një serie

kohore me një-ndryshore. Në rastin tonë janë marrë në konsiderat 5 mënyra të përpunimit të

të dhënave që janë si më poshtë:

P1. Të dhëna të pa-përpunuara (DPP)

P2. Metoda e Normalizimit MIN-MAX mbi të dhënat (NMM)

P3. Metoda e Normalizimit Z-Score i të dhënave(NZS)

P4. Metoda e Normalizimit Transformim-Log (NTL)

P5. Metoda e Normalizimit me anë të Shkallëzimit Decimal (NSHD)

Duke provuar forma të ndryshme të transformimit të serisë, ky sistem përpiqet të gjejë jo

vetëm strukturën më të mirë të rrjetit neural parashikues por gjithashtu përzgjedh dhe

teknikën më të mirë të përpunimit ndaj të dhënave. Integrimi i analizës së të dhënave në

sistemi, parimisht do të rezultojë në rritjen e kohës së përgjigjes së programit, por kjo do të

ishte vetëm për trajnimin fillestar të rrjetit.

Përdoruesi i SIP, në lidhje me të dhënat me një ndryshore, ka këto funksionalitete:

1. Ngarkon serinë kohore, në SIP, e cila mund që ti jepet në formën e një skedari ose

nëpërmjet një adresimi në ndonjë bazë të dhënash.

2. Jep informacione shtesë mbi tipare të caktuar të serisë si, frekuenca (ditore, javore,

mujore, tre-mujore)

3. Mund të përcaktojë vetë para-përpunimin që dëshiron të aplikojë mbi serinë

(opsionale).

4. Përcakton se cila pjesë e serisë duhet të përdoret nga SIP për gjenerimin e modelit

parashikues përndryshe përdoret e gjithë sasia e të dhënave.



Blerina VIKA

96

Në rastin e vetë sistemit SIP, funksionalitetet kryesore të tij në lidhje me të dhënat

përmblidhen më poshtë:

1. Sistemi lexon të dhënat nga burimi bazë (skedari i të dhënave ose baza e të dhënave).

2. Krijon vektorin e të dhënave që do të përdoret nga vetë sistemi.

3. Merr nga përdoruesi dhe i ruan karakteristikat mbi të dhënat (frekuenca, sasia që

duhet të përdoret si dhe mënyrën e përpunimit për të dhënat).

a. Nëse përdoruesi nuk ka zgjedhur asnjë mënyrë përpunimi për të dhënat

atëherë sistemi krijon pesë seri të reja si rezultat i përdorimit të 5 mënyrave të

ndryshme të përpunimit për të dhënat (DPP, NMM, NZS, NTL, NSHD).

b. Nëse përdoruesi nuk ka kufizuar sasinë e të dhënave që do të përdoren nga

sistemi për t‟u përdorur atëherë ai përdorë të gjithë serinë në përllogaritjet që

do të kryej.

4. Rezultatet që merren nga strukturat e ndryshme të rrjetit i nënshtrohen ritransformimit

për t‟u kthyer në formën e tyre fillestare të papërpunuar. Prandaj sistemi, në mënyrë

që të sigurojë këtë gjë, duhet të ruaj të gjitha informacionet e nevojshme për çdo

transformim të kryer.

5. Për çdo grup të ri të dhënash të shtuar në sistem, që përdoren për të furnizuar modelin

parashikues me informacione të reja, duhet ti nënshtrohet të njëjtit proces përpunues

si të dhënat ekzistues.

Specifikimi i kërkesave për gjenerimin e rrjetit neural më të mirë

Çështjet që duhen specifikuar për gjenerimin e strukturës së rrjetit neural parashikues më të

mirë lidhen me detajimin e kërkesave për dy pika bazë:

a. Mënyrën se si çdo rrjet neural duhet të realizojë përllogaritje e shumta për të

arritur që të mësoj më mirë.

b. Mënyra përzgjedhëse për strukturën e rrjetit neural si dhe kriteret që do të

përdoren për të kryer përzgjedhjen.

Për të adresuar çështjen e gjetjes së rrjetit neural të përshtatshëm, në këtë punim është

përdorur një trajtim me teknikën brutë-forcë. Duke qenë se nuk ekzistojnë metodologji që të

mund të drejtojë në ndërtimin e strukturës më të mirë të rrjetit neural parashikues atëherë

merren në shqyrtim një sasi rrjetash neurale, të cilat ndryshojnë nga njëri-tjetri nga numri i



Blerina VIKA

97

neuroneve për çdo shtresë, numri i shtresave dhe algoritmet e trajnimit. Kjo mënyrë e

trajtimit gjen përdorim të gjerë në punime të ndryshme që përdorin rrjetat neurale për

parashikim. Pasi gjenerohen këto struktura të ndryshme të rrjetave neurale, ato trajnohen dhe

krahasohen për të zgjedhur më pas strukturën që ka aftësi përgjithësuese më të mira.

Duke qenë se për ndërtimin e çdo rrjeti neural kërkohet një numër i konsiderueshëm

përllogaritjesh, në këtë punim është bërë dhe një trajtim i trajnimit të këtyre rrjetave duke

përdorur një përpunimi të shpërndarë. Kjo pasi ndërtimi dhe vlerësimi i performancës së një

rrjeti është i pavarur nga modelimet e rrjetave të tjerë. Në vazhdimi do të specifikohen

kërkesat që kanë aktorët e sistemit në këtë pjesë të SIP. Duhet theksuar se në këtë pjesë nuk

ekzistojnë funksionalitete për përdoruesi e sistemit pasi kjo pjesë realizohet nëpërmjet një

procesi të automatizuar. Një avantazh që lidhet me këtë mënyrë konceptimit të sistemit

qëndron se, për përdoruesin e tij, nuk është e nevojshme që ai të jetë ekspert i modelimit të

rrjetave neurale. Fillimisht do të japim se çfarë funksionalitetesh ka sistemi për të ndërtuar

një rrjet neural. Këto funksionalitete përsëriten për të gjithë strukturat e rrjetave të tjerë. Duke

vazhduar me kërkesat që duhet të përmbush sistemi për të gjeneruar një numër të fundmë të

rrjetave neural dhe përzgjedhje ndërmjet tyre.

I. Funksionalitetet e sistemit në ndërtimin më të mirë të një rrejti neural parashikues:

1. Ndanë bashkësinë e të dhënave në tre bashkësi të veçanta që do përdoren në faza të

ndryshme të ndërtimit të rrjetit neural: bashkësia e të dhënave trajnuese, bashkësia e të

dhënave validuese si dhe bashkësia e të dhënave testuese. Këto bashkësi nuk duhet të

kenë prerje të tyre si dhe ndarja duhet bërë në blloqe dhe jo në mënyrë rastësore.

2. Inicializohen elementët bazë të strukturës së rrjetit neural si: numrin e të dhënave

hyrëse, numrin e nyjeve në shtresën e mesme, funksionet e aktivizimit për secilën nga

shtresat e rrjetit si dhe algoritmi i trajnimit që do të përdoret.

3. Mbi bazën e numrit në të dhënat hyrëse dhe atyre dalëse të strukturës së rrjetit

organizohen të dhënat në të tre bashkësitë, në rreshta dhe kolona. Për çdo kolonë

duhet që të ketë një vlerë korresponduese si vlerë dalëse të rrjetit.

4. Për algoritmin e trajnimit që do të përdoret sistemi përcakton vlerat fillestare për

kriteret e ndalimit të trajnimit si: numri i epokave të trajnimit, shkallën e të mësuarit,

treguesin e shpejtësisë si dhe kriteret e vlerësimit të performancës së rrjetit.

5. Përcakton një numër të fundmë vektorësh me vlera fillestaret rastësore për të gjitha

peshat e rrjetit neural.

a. Për çdo vektorë sistemi:

i. trajnon rrjetin neural me bashkësinë e të dhënave trajnuese deri kur

arrihet ndonjë nga kriteret e ndalimit.



Blerina VIKA

98

ii. Sistemi përdorë bashkësinë e të dhënave validuese për t‟u siguruar që

rrjetin neural nuk humb aftësitë e tij përgjithësuese.

iii. Vlerëson rrjetin neural nëpërmjet kritereve të vlerësimit mbi

bashkësinë testuese.

6. Zgjedh instancën e rrjetit neural të trajnuar që performon më mirë ndër vektorët e

ndryshëm të peshave të aplikuar.

II. Funksionalitetet e sistemit për përzgjedhjen e strukturës së rrjetit neural më të mirë:

1. Përcakton se cilët janë përmasat e ndryshme për numrin e të dhënave hyrëse, që

do të përdoren për secilën strukturë të rrjetit neural.

2. Përcakton dhe përmasat e ndryshme të nyjeve që do të përdoren në shtresën e

vetme të fshehtë.

3. Për çdo kombinimi të përmasës së të dhënave hyrëse dhe përmasës së nyjeve në

shtresën e mesme ndiqen të njëjtët hapa që specifikuam në ndërtimin e rrjetit më

të mirë parashikues. Si rezultat, për çdo kombinim ruhen instancat më të mira.

4. Ruan të gjitha vlerësimet e bëra me anë të kritereve të vlerësimit për çdo

kombinim si dhe të gjitha instancat e kthyera nga çdo kombinim.

5. Dy janë mundësitë që bënë sistemi. Në qoftë se përdoruesi nuk do të testojë

algoritme të ndryshme trajnimi

a. atëherë sistemi përzgjedh strukturën e rrjetit neural që vlerësohet me aftësi të

larta përgjithësuese.

b. Përndryshe ai përzgjedh 7 strukturat e rrjetave më të mirë parashikues për t‟iu

nënshtruar përllogaritjeve të tjera për algoritme të ndryshme trajnimi.

Specifikimi i kërkesave për zgjedhjen e algoritmit trajnues

Trajnimi i rrjetit neural si proces realizohet nëpërmjet një algoritmi i cili duhet të përfshijë

ndryshimin e të dhënave hyrëse të algoritmit, ekzekutimit e përllogaritjeve transformuese të

këtyre të dhënave si dhe kontroll të rezultateve që sjell ky ndryshim.

6.5 Dizenjimi i sistemit

Faza e dizenjimit të softuerëve, në inxhinierimin e softuerëve tradicional, përbëhet nga një

proces orientues për zhvillimin e një zgjidhjeje. Në këtë proces bëhet evidentimin i



Blerina VIKA

99

elementeve që përmbushin kërkesat e përdoruesit. Këto elemente mund të krijohen nga fillimi

apo nëpërmjet përshtatjes të elementeve ekzistuese dhe mund të përmbushin detyra të

përgjithshme ose detyra specifike që lidhen me kërkesat e përdoruesit.

Në këtë fazë përcaktohen strukturat e të dhënave dhe algoritmet që do të përdoren në fazën e

implementimit të sistemit tonë parashikues.

Duke qenë se për çdo rrjet neural kërkohet një numër i konsiderueshëm përllogaritjesh, në

këtë punim është bërë dhe një trajtim i trajnimit të këtyre rrjetave duke përdorur një

përpunimi të shpërndarë. Në dizenjimit e sistemin tonë janë përcaktuar se cilët janë elementët

të cilat mund të thjeshtohen duke përdorur paralelizimin e përllogaritjeve.



Blerina VIKA

100

Figure 6-4: Modelimi i rrjedhjes së inforamcionit në sistem



Blerina VIKA

101

6.6 Sigurimi i cilësisë për SIP

Në një pjesë të mirë të programit SIP mund të aplikohen teknikat tradicionale të testimit. Por

ky trajtim ndryshon lidhur me rrjetat neurale. Aplikimi i mënyrave të ndryshme të validimit

dhe verifikimit të cilësisë vjen si rezultat i natyrës së zhvillimit të rrjetave neurale. RN njihen

si njësi të cilat ndryshojnë gjendjen e tyre, ato mësojnë, përgjatë ekzekutimit. Ky ndryshim

mund të jetë për mirë ose dhe për keq. Një analist i cili do të kontrolloj dhe vlerësoj cilësinë e

rrjetit neural ndeshet me këto çështje (Taylor BJ, Darrah MA and Moats CD, 2003):

- A ka mësuar rrjeti të dhënat e sakta, apo ai ka përgjithësuar tipare të tjerat të cilat janë

të përfshira në të dhënat?

- A ka konvergjuar rrjeti në një minimum global apo në një minimum lokal?

- Si do të sillet rrjeti me të dhëna të tjera që nuk janë pjesë e të dhënave trajnuese?

- A ekziston ndonjë teknikë e cila përshkruan memorien e një rrjetit apo ruajtjen e të

dhënave?

- A është duke përdorur rrjeti bashkësinë e duhur të parametrave hyrëse për fushën e

problemit?

Është e rëndësishme të aplikohen metodat të ndryshme të cilat të mund të vlerësojnë cilësinë

e softuerit përgjatë zhvillimit të tij. Sigurimi për cilësinë e çdo rrjeti neural të zhvilluar duhet

bërë përpara se të bëhet validimi dhe verifikimi i tij. Vlerësimi i cilësisë për rrjetat neurale

bëhet për të identifikuar nëse rrjeti mund të përdoret për problemin që shqyrtohet. Për çdo

rrjet neural, matja e cilësisë së tij bëhet nëpërmjet kritereve të specifikuara si p.sh :

1. Llogaritja dhe vlerësimi i gabimit (RMSE, MAE) për bashkësinë e të dhënave testuese.

2. Shpejtësia e prodhimit të rezultatit apo toleranca e gabimit.

Zhvillimi i softuerit duhet të sigurojë që ky proces të zhvillohet nëpërmjet një procesi të

automatizuar, që ruan në bazë të dhënash, të dhënat e vlerësimit të tij. Mbi bazën e këtyre të

dhënave përzgjidhen rrjetat që përmbushin kriteret dhe më pas i nënshtrohen metodave të

validimit dhe verifikimit.

Në lidhje me rrjetat neurale artificiale duhet theksuar se është e pamundur të provohet

funksionalitetit i tij. E thënë më qartë, nuk mund të kontrollojmë nëse të gjitha të dhënat

hyrëse ndikojnë në prodhimin e rezultatin të dëshiruar nga RN. Si rezultat, zhvilluesit duhet

të ideojnë dhe vizualizojnë në mënyrë individuale metodat për verifikimin dhe validimin.



Blerina VIKA

102

Studimet të cilat kryejnë një punë kërkimore në lidhje me verifikimin dhe validimit e RN

është i kufizuar. Për këtë arsye nuk ka procese apo standarde të unifikuar të cilat mund t‟i

përdorin zhvillues të rrjetave neurale. Objektivat kryesorë që duhet të arrihen në këtë fazë

janë:

Të tregohet dhe nëse ka mundësi të vlerësohet korrektësia e rrjetave neural artificial,

nga pikëpamja e strukturës (analizës së peshave, lidhjeve etj.) si dhe me kufizimet e

vendosura (p.sh koha e shpenzuar, kosto e zgjidhjes etj.).

Të tregohet që rezultatet e softuerit përputhen me specifikimet e problemit që duhet të

zgjidhë.

Duke qenë se kostoja e validimit dhe verifikimit të rrjetave neurale është e madhe, sugjerohet

që metodat e tyre të aplikohen vetëm mbi rrjetat neural të përzgjedhur mbi kriterin e

performancës më të mirë. Në këtë mënyrë bëhet një ndarje e kësaj faze nga cikli i zhvillimit

të softuerit që bënë një zvogëlim të ndjeshëm të kostos së rimodelimit.

Ekzistojnë metoda të ndryshme të cilat mund të aplikohen në faza të ndryshme të zhvillimit të

rrjetit neural.

Gjatë fazës së dizenjimit mund të kryhet validim i kryqëzuar. Ky validim realizohet duke

përdorur një bashkësi rrjetash të të njëjtit tip ose të tipeve të ndryshme të cilat përmbushin të

njëjtën detyrë duke përmirësuar besueshmërinë e programit. Rezultatet që jep secili nga

rrjetat krahasohen me njëri-tjetrin për të konfirmuar validimin dhe përshtatshmërinë.

Teknika e vizualizimit është shumë e përdorshme, pasi ndihmon për të arritur kuptimin e

plotë të performancës së rrjetit neural. Kjo teknikë ndihmon të kuptohet se si mëson rrjeti

neural apo se si janë proceset e vendimmarrjes së tij nëpërmjet formave të ndryshme të

vizualizimit.

Fazat në të cilat mund të aplikohet teknika, janë përgjatë trajnimit dhe testimit. Për të dy fazat

paraqiten grafikisht mënyra se si ndryshojnë peshat dhe lidhjet e brendshme të rrjetit neural.

Duhet theksuar se fusha e validimit dhe verifikimit të rrjetave neurale është në zhvillim dhe

ende nuk ka një metodologji të plotë që të ndihmojë zhvilluesit. Prandaj, shpesh, eksperienca

e zhvillimit të programeve të ngjashme është një avantazh.



Blerina VIKA

103

6.7 Paralelizimi i SIP

Metodat dhe teknologjitë bazë për implementimin e një rrjeti neural, rezultojnë të jenë

komplekse. Trajnimi i rrjetit neural kërkon realizimin e një numri të madh përllogaritjesh dhe

shpenzimin e një kohe të gjatë. Koha rritet në mënyrë eksponenciale me ndryshimin e numrit

të nyjeve në strukturën e RN-l. Një nga zgjidhjet harduerike të cilat i lehtësojnë

implementimet e këtyre rrjetave është përdorimi i sistemeve paralele.

Paralelizimi ka si ide, që një detyrë mund të ndahet në mënyrë të tillë që në vend që të kemi

një proces që i bën të gjitha, të kemi disa procese të cilët bëjnë nga një pjese të punës në të

njëjtën kohë. Ekzekutimi në paralel zvogëlon në mënyrë dramatike kohën e përgjigjes për

veprimet intensive me të dhënat që ndodhen në baza të mëdha, që zakonisht shoqërohen me

sisteme që mbështesin marrjen e vendimeve, veprime matematikore ose dhe baza të dhënash

historike (Seiffert U., 2002). Multiprocesimi simetrik, sistemet që përdorin një numër të

madh cluster-ash dhe GPU-t arrijnë performancë të lartë nëpërmjet ekzekutimit në paralel,

pasi procesimi i instruksione mund të ndahet midis procesorëve në një sistem të vetëm.

Për më tepër, zotërimi, menaxhimi dhe punimi me një aplikacion kritik të biznesit nënkupton

të merresh me probleme të performancës. Aplikacionet nuk mund të menaxhojnë vëllimet e

të dhënave gjithmonë në rritje, përmbushjen e kërkesave të reja në përshkallëzim apo dhe

performancën e cila nuk është asnjëherë e mirë apo e shpejt sa duhet. Nevojitet një nivel më i

lartë performance në mënyrë që të shumëfishohet numri i veprimeve që aplikacioni ynë të

mundet ti përballoj. Në mjediset kompjuterike, ka vetëm një mënyrë për të arritur këtë:

përdorimi i një strukture paralele për të ekzekutuar shumë punë njëkohësisht (Martiri E.,

Tyxhari G. dhe Gorishti A., 2010).

Qëllimi në këtë pjesë të punimit është realizimi i paralelizimit për pjesë të SIP të cilët janë të

pavarur nga njëri-tjetri si dhe nga të dhënat që ato transformojnë. Mund të arrihen paralelizim

të përllogaritjeve që duhet të kryejnë arkitekturat e ndryshme të rrjetave parashikues.

Duke analizuar rrjetin neural FD me shumë shtresa, i cili përmban vetëm një shtresë të

fshehtë kryen hartëzimin e jo-linaritetit ndërmjet shtresës hyrëse dhe dalëse sipas formulës:

)))((( xwffwfy T

hhffd .

Paralelizimi i sistemit është shumë i aplikueshëm në vektorë, matrica dhe gjithashtu në

shprehje shumatore. Në këtë rast, paralelizimi i kësaj shume bëhet si më poshtë:



Blerina VIKA

104

Në të ka dy cikle for të cilat janë një burim i mirë për paralelizim të një numri të madh

instruksionesh (Hoxha, 2004). Gjithashtu nuk ekzistojnë varësi midis cikleve for në të dy

algoritmet, ky është dhe kriteri kryesorë që një algoritëm duhet të plotësoj për tu paralelizuar

(Martiri E., Tyxhari G. dhe Gorishti A., 2010). Ky proces ofron disa avantazhe: zvogëlon

kohën e llogaritjeve dhe mundëson përpunim të një grupi të madh të dhënash. Aktualisht

hapësira kohore e serive që përdoren në Shqipëri nuk është shumë i madh por tenton të bëhet

e tillë. Për këtë arsye rekomandohet implementimi në paralel i sistemit duke mundësuar

procesim në paralel për të dhënat.

// Pseudo-kode për hartëzimin e SHS

15. S_hyrës=0

16. S_dalës=0

17. for h=1 to n, step 1

18. lexo wT(h), x

19. S_hyrës(h)=wt(h)*x

20. S_ hyrës =S_ hyrës +S_hyrës (h)

21. for f=1 to n

22. lexo w(f)

23. S_dalës(f)= (h)*S_dalës(f)

24. S_dalës=S_dalës+S_dalës(f)

Algoritmi 6-1:Hapat e përllogaritjeve të kryera nga rrjeti SHS (Vika B., Martiri E. & Xhaja D., 2011)



Blerina VIKA

105

Kapitulli 7

7 KONKLUZIONE, DISKUTIME DHE REKOMANDIME

Ky kapitull paraqet analizën e rezultateve të arritura në këtë punim në lidhje me analizën dhe

dizenjimin e sistemit inteligjent. Gjithashtu shtrohen dhe diskutohen realizimi i qëllimit të

disertacionit si dhe hipotezave të ngritura në të. Në fund të tij japim rekomandimet tona në

lidhje me punën në të ardhme.

7.1 Konkluzione

Qëllimi i këtij punimi ishte zhvillimi i analizës dhe modelimit të një sistemit inteligjent për

parashikimin e serive kohore të cilët përdorin rrjetat neurale artificiale. Ky punim përpiqet të

shërbejë si një material ndihmues në implementimin e programeve parashikues të cilët

kërkojnë të përfitojnë nga avantazhet e teknikave inteligjente si për shembull: rrjetat neurale.

Rezultatet e punimit mbështeten njëkohësisht në: (i) përmbledhjen dhe analizën e literaturës

së gjerë bashkëkohore , dhe (ii) në rezultatet eksperimentale të kryera mbi seri kohore reale.

Analiza dhe dizenjimi i sistemit është sugjeruar në mënyrë të tillë që elemente të ndryshme të

sistemit të mund të trajtohen në veçanti si dhe mund të përdoren si module të pavarura. Çdo

modul i sistemit mund të ripërdoret si dhe zgjerohet me tipare të tjera shtesë për t‟u plotësuar

dhe përshtatur me probleme të fushave të ndryshme.

Trajtimi i këtij punimi kryen analizën dhe modelimin e sistemit inteligjent të distancuara nga

tiparet teknike të zhvillimit duke mos e fokusuar në ndonjë platformë specifike, si rrjedhojë

krijon mundësinë që zhvillues të ndryshëm të mund të ripërdorin dhe përshtatin rezultate të

këtij punimi lehtësisht. Një pjesë të rëndësishëm në këtë disertacion zë diskutimi dhe

vlerësimi i dilemave të ndryshme të dizenjimit të rrjetave neurale për të arritur rezultate sa më



Blerina VIKA

106

të mira parashikuese. Rezultatet e nxjerra nga studimi i literaturës dhe e mbështetur me

analizë empirike tregojnë që elementët përbërës në ndërtimin e rrjetit neural kanë ndikimi të

ngushtë ndërmjet njëri-tjetri. Ndryshimi i bërë në njërin prej tyre ndikon në elementët e tjerë.

Këto veçori janë marrë në shqyrtimin nga sistemin përgjatë procesit automatizues, të

nxjerrjes së strukturës më të mirë të rrjetit neural që i përgjigjet serisë kohore specifike.

Në fillimi të këtij punimi, në kapitullin 3 dhe 4, është përfshirë një përmbledhje e literaturës

bashkëkohore në lidhje me përdorimin e rrjetave neurale në parashikimin e serive kohore,

duke e trajtuar si një element bazë shumë të rëndësishëm në arritjen e qëllimit të këtij punimi.

Në këtë analizë përmbledhëse ofrohen bazat për analizën dhe modelimin e sistemit inteligjent

për parashikim. Bazuar në metodologjinë që kemi zgjedhur për të zhvilluar këtë punim, që

përshtatet me karakteristikat e komponentëve përbërëse të sistemit inteligjent për parashikim,

literatura bashkëkohore ndihmon në përcaktimin dhe analizën e elementëve përbërës për çdo

pjesë të sistemit. Për rrjetat neurale janë evidentuar modelet e topologjisë, modelet e të

dhënave si dhe mënyrat e trajnimit. Gjerësisht janë diskutuar karakteristikat që duhet të

implementohen nga sistemi inteligjent i propozuar si për shembull:

Para-përpunimi i përshtatshëm i të dhënave për të ofruar rezultatet më të mira.

Krahasimi i struktura të ndryshme të ndërtimit të rrjetit neural

Përdorimi i paradigmave të ndryshëm për trajnimin e rrjetit siç janë: i mbikëqyrur, i

pambikëqyrur dhe i përforcuar.

Rezultatet empirike në këtë studim ka luajtur një rol të rëndësishëm në mirë konceptimin dhe

analizën e sistemit. Objektivi primar i tyre është formimi i sfondit të nevojshëm për të

kuptuar lidhjen ndërmjet komponentëve kryesorë e domethënës në modelimin e rrjetit neural

artificial të përshtatshëm për parashikim.

Së bashku me anën teorike dhe analitike kemi ofruar shkurtimisht shembuj aplikative të

rrjetave neurale të cilat përdorin gjerësisht paketat e librarit e ofruara në MATLAB duke i

ndërthurur me implementime shtesë të pjesëve plotësuese të qëllimit. Një përshkrim më i

detajuar i punës tonë të ndërtimit të modeleve, testimit dhe analizës së rezultateve është kryer

në kapitullin 5.

Metodologjia e ndjekur për zhvillimin e këtij punimi, kërkimi konstruktiv i modelimit,

sugjeron që rezultatet e fushës së studimit dhe ato të analizës empirike të ndërthuren sëbashku

për të formësuar artifaktet që shërbejnë si shtylla ndërtimi në modelimin e sistemit inteligjent

parashikues.



Blerina VIKA

107

Në kapitullin 6 të këtij disertacioni është përshkruar inxhinierimi softuerik për zhvillimin e

analizës dhe modelimit të sistemit të propozuar. Cikli jetësorë i adaptuar për këtë sistem

ndryshon me ciklin jetësore të përdorur për inxhinierimin e softuerëve klasikë. Karakteristikat

të cilat përcaktojnë këtë mënyrë të ndryshme trajtimi janë analizuar dhe argumentuar duke

nxjerr në pah formën më të mirë të përdorimit.

Analiza dhe modelimi i paraqitur për sistemin inteligjent për parashikim lejon që të

implementohen lehtësisht nga zhvilluesit, në platforma të ndryshme. Modularizimi i sistemi

është një qasje e përdorur në trajtimin e këtij disertacioni. Disa nga avantazhet që rrjedhin nga

kjo formë e trajtimit lidhet me maksimizimin e fleksibilitetit, ripërdorueshmërinë dhe ndarjes

së qartë midis komponentëve përbërës. Për të plotësuar më mirë modelim e sistemit janë

evidentuar dhe përshkruar çështjet kryesore të aplikimit të mjeteve dhe modeleve që

sigurojnë besueshmërinë dhe cilësinë e sistemit përgjatë gjithë fazave të zhvillimit të tij.

Një tjetër element në të cilën ky punim sugjeron që të fokusohet zhvillimi i mëtejshëm i

sistemit është paralelizimi i përllogaritjeve të tij. E përmendur gjerësisht dhe në literaturën e

shqyrtuar, një disavantazh për përdorim e rrjetave neurale dhe gjetjes së strukturës më të mirë

për parashikimi është koha e gjatë përllogaritëse e shpenzuar. Në analizën e sistemit janë

përcaktuar dhe komponentët dhe veprimet që mund t‟i nënshtrohen një përpunimi paralel. Në

rastet kur shpenzimet për harduerin nuk janë problemi kryesore, por koha e përgjigjes është

ajo çfarë na intereson atëherë sistemi do të duhet të aplikojë procesim paralel. Në këtë rast

është bërë një paralelizim i problemeve.

Në fazën e dizenjimit, sistemi është projektuar direkt në paralel, duke e ndarë problemin, për

faza të caktuara të ekzekutimit, në pjesë të pavarura nga njëra-tjetra. Kjo ndarje është bërë

pasi problemi është kuptuar qartë, jo vetëm në aspektin e rrjedhshmerisë së përpunimit por

gjithashtu dhe rezultatet që ai duhet të nxjerrë.

Ky disertacion është organizuar dhe zhvilluar mbi bazën e disa hipotezave të ngritura të cilat

mbështeten në metodologjinë „hulumtim i modelimit konstruktiv‟. Në këtë përqasje hipotezat

drejtojnë procesin e dizenjimit të sistemi, ku përmendim sërish që dizenjimi ka të bëjë me

orientimin e të ardhmesh ndërsa puna kërkimore lidhet me të shkuarën dhe të tashme.

Specifike, për këtë lloj natyre kërkimore, është realizimi i integrimit të punës kërkimore me

praktikat e modelimit. Si dhe ngritja e të gjitha hipotezave nuk është bërë që në fillim por

përgjatë eksplorimit të literaturës dhe analizës së rezultateve empirike.

Për hipotezat e ngritura në fillim të këtij punimi kemi arritur të bëjmë vlerësimin e tyre gjatë

rrugëtimit të këtij hulumtimit. Në vazhdim të këtij kapitulli, në përputhje me objektivat e këtij



Blerina VIKA

108

studimi, analizojmë nëse rezultatet e arritura në këtë disertacion mbështesin ose jo hipotezat e

ngritura.

H1. Çdo lloj strukture e rrjetit neural për parashikimin e serive kohore me një-

ndryshore mund të tejkaloj metodat tradicionale statistikore.

Në këtë pohim kërkohet të krahasohen strukturat e ndryshme të rrjetave neurale me metodat

konkurruese tradicionale për një problem parashikimi bazuar në seri kohore me një

ndryshore. Për të kontrolluar këtë pohim të këtij disertacioni jemi mbështetur në analizën

empirike të performancës parashikuese të strukturave të ndryshme të rrjetit neural, krahasuar

me modelin tradicional „më të mirë‟ për parashikimin e kursit mujorë EUR/USD. Gjithsej

janë shqyrtuar 144 struktura të ndryshme të rrjetit neural të cilat ndryshojnë nga njëra-tjetra,

jo vetëm nga numri i vonesave kohore të vetë variablit të varur por dhe nga numri i njësive

shtesë përpunuese të informacionit.

Duke përmendur që modeli tradicional i marrë në shqyrtim për t‟u krahasuar me rrjetat neural

është përzgjedhur në bazë të literaturës së shqyrtuar dhe përformancës së tij në parashikimin

jashtë-periudhe. Kriteret e vlerësimit të performancës parashikuese janë RMSE dhe MAE.

Modeli tradicional më i mirë rezultoi ARIMA(7,1,48) me RMSE 0,0181 dhe MAE 0.0159.

Nga 144 strukturat e ndryshme të rrjetit neural të shqyrtuar, në analizën krahasuese të kryer,

rezultojnë që 143 rrjeta neural performojnë më mirë në parashikimin jashtë–periudhe ose po

aq mirë sa model i tradicional ARIMA. Vetëm struktura e rrjetit neural (1-9-1) tregon një

performancë më të dobët parashikuese me RMSE 0.0192 dhe MAE 0.0149.

Pra, mund të themi se në lidhje me këto rezultate rrjetat neurale kanë aftësi shumë të mira për

të mësuar nga seritë me një ndryshore. Ndërkaq, evidentojmë se hipoteza e parë mbështetet

nga rezultatet e këtij studimi.

H2. Ndërmjet faktorëve që ndikojnë në performancën e rrjetit neural parashikues nuk

ka ndërveprim dhe tiparet e tyre mund të përcaktohen në mënyrë të pavarur.

Ky pohim vlerësohet dhe evidentohet nëse faktorët përbërës të strukturës së rrjetit neural

mund të trajtohen si entitete të veçanta që nuk influencojnë në performancën e ndonjë faktori

tjetër apo ndërmjet tyre duhet vendosur një ekuilibër për të arritur maksimizimin e

performancës. Vërtetësia e kësaj hipoteze është bërë nëpërmjet studimit dhe analizës së



Blerina VIKA

109

literaturës shkencore si dhe rezultateve empirike për parashikimin e kursit EUR/USD.

Fillimisht janë nxjerrë se faktorët të cilët ndikojnë në parashikimin e serisë kohore me një

ndryshore janë:

Sasia e vlerave të serisë kohore, që rrjeti neural përdorur për të mësuar në çdo etapë të ciklit

trajnues. Rritja ose zvogëlimi i tij ndikon në ndryshimin e performancës. Në rezultatet e

përftuara në punën tonë eksperimentale shohim që me ndryshimin e sasisë së vlerave nuk

ekziston ndonjë varësi lineare e drejtpërdrejt me performancën.

Numri i njësive në shtresën e fshehtë në strukturën e rrjetit neural. Nyjet e shtresës së

mesme shërbejnë për të mësuar jo-linearitetin që ekziston në të dhënat e paraqitur të rrjetit.

Në shqyrtimin e literaturës rezulton se, për përcaktimin e numrit të tyre në lidhje me një

problem të caktuar, nuk ekzistojnë baza teorike të mjaftueshme. Në këtë rast procesi duhet

bërë nëpërmjet testimeve të drejtpërdrejt me të dhënat reale të problemit. Analiza empirike e

realizuar për parashikimin mujorë të kursit EUR/USD tregon që, edhe për këtë faktorë, nuk

mund të gjejmë ndonjë lidhje direkte me kahun e ndryshimit të numrit të njësive në shtresën e

fshehtë dhe cilësisë së aftësisë parashikuese.

Përpunimi i të dhënave është një tjetër faktorë që ndikon në cilësinë parashikuese. Sipas

literaturës së shqyrtuar theksohet se rrjetat neurale janë në gjendje të mësojnë nga të dhënat të

cilat përmbajnë sezonalitet, zhurma, trend etj. Megjithatë ekzistojnë disa punime të cilat

shohin parapërgatitjen e të dhënave si një faktorë të rëndësishëm në cilësinë e parashikimit, si

dhe në shpejtësinë e parashikimit.

Algoritmi i trajnimit i cili përcakton mënyrën se si rrjeti duhet të mësoj nga të dhënat që i

paraqiten atij në fazën e trajnimit. Problemi kryesorë që ndeshet përgjatë trajnimit të rrjetit

lidhet me ngecjen në minimume lokale të gabimit të parashikimit duke mos arritur atë që

është konfigurimi më i mirë i rrjetit. Ndërkohë që nuk duhet lënë jashtë fokusit dhe koha e

nevojshme për të kryer trajnimin, i cili shpesh mund të rezultojnë në një kohë shumë të gjatë.

Për të realizuar një analizë dhe dizenjim sa më të mirë për sistemin inteligjent parashikues

është parë e rëndësishme studimi i këtyre faktorë si dhe lidhjet që ekziston ndërmjet tyre në

rritjen e cilësisë së parashikimit. Ashtu siç është e sugjeruar në literaturën bashkëkohore por

edhe në analizën empirike të kryer në këtë disertacion shikojmë që këto elementë nuk duhen

vlerësuar në mënyrë të pavarur. Për të gjetur strukturën më të mirë të rrjetit neural duhet të

eksperimentohen dhe vlerësohen kombinime të ndryshme të sasive të vlerave të serisë kohore

me numra të ndryshëm të nyjeve në shtresën e fshehtë.

Gjithashtu dhe përzgjedhja e përpunimit për të dhënat ndikon në kohën që i duhet algoritmit

të trajnimit për të gjetur konfigurimin e rrjetit neural me cilësi parashikuese me të lartë.



Blerina VIKA

110

Rezultatet e arritura në analizën empirike të këtij disertacioni tregojnë që për të arritur cilësi

të larta në parashikim duhet të vlerësohen struktura të ndryshme të rrjetit neural që

ndryshojnë nga njëri-tjetri nga numri i nyjeve në shtresën e mesme si dhe sasia e vlerave të

serisë kohore.

Vlen të përmendim se për numërin e nyjeve në shtresën e fshehtë, nga 1 deri në 12 tregohet

që sasia e vlerave për strukturat e rrjetit neural të cilat prodhojnë aftësitë më të mira

parashikuese ndodhet në numrat 10 dhe 11 për 67% të rasteve të shqyrtuara. Pra, e thënë më

qartë kemi se parashikimi më i mirë për një hap jashtë periudhe mund të përcaktohet mirë

nisur nga 10 ose 11 vlerat e shkuara.

Këto të dhëna dalin për rastin kur seria kohore përbëhet nga kursin mujorë i EUR/USD të cilit

nuk i është bërë asnjë përpunim paraprak. Ky rezultat mund të tregoj se seria kohore mund të

jetë stacionare. Por, ky përfundim nuk mund ta përgjithësojmë pasi do të duhet të shqyrtohen

dhe analizohen më shumë seri të ndryshme. Nëse kjo gjë do të plotësohesh për disa raste

atëherë do të ndikonte në zvogëlimin e intervalit të strukturave të rrjetave neural që do të

duheshin për t‟u vlerësuar.

Pra, mund të themi se në lidhje me këto rezultate, faktorët që ndikojnë në cilësinë e

parashikimit të rrjetit neural kanë ndikim ndaj njëri-tjetrit. Prandaj, për të përcaktuar

strukturën e përshtatshme të rrjetit neural për parashikim duhen konsideruar në të njëjtën

kohë të gjithë këto faktorë.

Kështu evidentojmë se në lidhje me hipotezën e dytë, rezultatet e këtij studimi nuk e

mbështesin atë.

H3. Automatizimi i përzgjedhjes së strukturës së rrjetit neural përmirëson aftësitë

parashikuese të sistemit inteligjent për kursin e këmbimit kundrejt metoda

tradicionaleve.

Ndërtimi i strukturave të ndryshme të rrjetit neural në mënyrë manuale nga përdoruesit do të

kërkonte që ata të ishin të pajisur me njohuritë e nevojshme se si funksionojnë këto metoda

inteligjente. Për më tepër, do të kërkonin që përdoruesit të njihnin mirë elementët ndërtuese

të rrjetit neural si dhe tiparet e tyre. Ndërthurja e njohurive të përdorimit të këtyre modeleve

inteligjente me atë të fushës ekonomike do të rezultonte në rritjen e vështirësisë së përdorimit

të tyre.



Blerina VIKA

111

Integrimi i rezultateve të nxjerra nga struktura të ndryshme të rrjetave neurale dhe vlerësimi i

tyre në varësi të cilësisë parashikuese bazuar në kriteret e vlerësimit do të ishte një proces i

cili do të shoqërohej nga një probabilitet i konsiderueshëm gabimi. Faktorë tjetër i

rëndësishëm i cili duhet të konsiderohet është koha. Duke qenë se përzgjedhja e strukturës së

rrjetit neural për parashikim dhe konfigurimi i tij për të arritur aftësi më të mira parashikuese

është një proces i cili kërkon që të testohen dhe krahasohen një numër i madh strukturash.

Në analizën e realizuar, mbështetur njëkohësisht në literaturën bashkëkohore si dhe në punën

tonë në këtë disertacion është parë se ky proces i përgjithshëm mund të automatizohet duke

sjellë si avantazh që:

- përdoruesit të mos jetë i detyruar të ketë njohuri të thelluar në fushat e aplikimit,

- zvogëlon gabimet njerëzore përgjatë fazës së vlerësimit të strukturave,

- në rritjen e numrit të strukturave dhe faktorëve që merren në konsideratë,

- uljen e kohës së përpunimit dhe procesimit të veprimeve të nevojshme përgjatë fazës

së konfigurimit dhe vlerësimit të rrjetave.

Pra, shohim që në përgjithësi automatizimi është jo vetëm një alternativë por dhe një

domosdoshmëri për përdorimin e rrjetave neurale si mjete për parashikim.

Kështu, mund të themi se hipoteza e tretë mbështetet nga rezultatet e studimit.

H4. Për analizën dhe modelimin sistemi inteligjent parashikues (SIP) nëpërmjet rrjetit

neural, mund të përdoren mjetet dhe metodat standarde ekzistuese të disiplinës së

inxhinierimit të softuerëve.

Në studimin e bërë në këtë punim tregohet se çfarë tiparesh ndryshojnë në filozofinë e

ndërtimit të aplikimeve të cilat përdorin rrjetat neurale, prandaj është e nevojshme që

inxhinierimi i zgjedhur për to duhet ti përshtatet këtyre tipareve. Projektet që përdorin RN-le

ndryshojnë nga projektet softuerike tradicional në lidhje me disa aspekte si:

- Ato janë të drejtuar nga të dhënat, për këtë arsye mbledhja dhe analiza e të dhënave

duhet të jetë pjesë e procesit të modelimit dhe trajnimit të rrjetit.

- Nuk mund të përcaktohet zgjidhja e plotë që në fazën e dizenjimit. Për këtë ndërtohen

prototipa të cilët vlerësohen për të gjykuar mbi elementët e përfshirë në dizenjim.

- Performanca e rrjetit është më e rëndësishme se shpejtësia përllogaritëse. Kujdesi për

performancën tregohet që në fazën e analizës, dizenjimi dhe testimit.



Blerina VIKA

112

Për këtë ishte e nevojshme që zhvillimi i sistemit inteligjent parashikues të ndryshojë nga

zhvillimi i softuerëve tradicionale për t‟i adresuar sa më mirë aspektet e ndryshme. Një

çështje e rëndësishme e trajtuar në këtë punim është përdorimi i metodave të validimit dhe

verifikimit për rrjetat neural të zhvilluar si dhe vendosja e disa udhëzimeve që drejtojnë

përzgjedhjen e parametrave. Për këto elementë nuk ekzistojnë metoda standarde.

Si konkluzion që në ndërtimin e sistemit inteligjent parashikues mund të përdoren, për pjesë

të caktuara të këtij sistemit, mjetet apo metodat standarde që janë të njohura në inxhinierimin

e softuerëve tradicionalë. Por, nuk mund të gjejmë për çdo pjesë të sistemit tonë. Kjo për

shkak të tipareve që kanë ndërtimi i një rrjeti neural. Prandaj është e nevojshme të përdoren

teknika verifikimi dhe validimi që janë specifike për rrjetat neurale.

Nga çfarë ne përmendëm, mund të themi që hipoteza e katërt nuk mbështetet nga të dhënat e

arritura në studim.

H5. Procesimi i përllogaritjeve të kryera nga SIP mund të paralelizohen.

Si disavantazh i rëndësishëm i ndërtimit të rrjetit neural dhe trajnimit të tij është koha e gjatë

që kërkon ky proces në vetvete. Gjithashtu, sistemi inteligjent parashikues realizon

përpunimin e të dhënave, ndërtimin e strukturave të ndryshme dhe trajnimin të tyre si dhe

përdorimin e algoritmeve të ndryshme të trajnimit. Një nga zgjidhjet harduerike të cilat i

lehtësojnë implementimet e këtyre rrjetave, është përdorimi i paralelizimit.

Në këtë punimi është marrë në konsideratë si mund të përfitonim në kohë nëse do të

përdornim elementë të paralelizimit. Pasi është bërë analiza e sistemit dhe dizenjimi i tij janë

vlerësuar mundësitë e përdorimit të përpunimit të informacionit në paralel. Sistemi i plotë

nuk mund të ndahet në pjesë të veçanta të pavarura në procesim.

Megjithatë në këtë studim jemi fokusuar nëse pjesë të caktuara të përllogaritjeve të mund të

paralelizohen. Si rezultat, kemi përcaktuar pikat kyçe të cilat mund të paralelizohen:

(i) secila nga strukturat e rrjetit neural, për çdo lloj përpunimi të dhënash, mund të trajnohet

në mënyrë të pavarur.

(ii) Për çdo algoritëm trajnimi që merret në vlerësim ne mund të përdorim përllogaritje

paralele për trajnimet e ndryshme.

(iii) Gjithashtu dhe për çdo strukturë të rrjetit neural, që ka strukturë të tipit SHS, mund të

përdorim teknika të paralelizimit meqenëse baza koduese e tyre janë ciklet „for‟ që



Blerina VIKA

113

mundësojnë shpërndarjen e blloqeve të njëjta të instruksioneve në njësi të veçanta

përpunuese.

Nga analiza e kryer mbi analizën dhe dizenjimin e sistemit inteligjent parashikues tregon se

ne mund të përdorimi teknika të paralelizimit në faza të ndryshme të përllogaritjeve. Pra, të

dhënat e studimit tonë mbështesin hipotezën 5 të ngritur në këtë disertacion.

Në përmbledhje, shtojmë se 3 hipoteza nga 5 mbështetet nga të dhënat e këtij disertacioni.

Duke ripërmendur që në metodologjinë e përzgjedhur për zhvillimin e këtij punimi roli i

hipotezave është që të drejtojnë procesin e analizës dhe modelimit të sistemit inteligjent

parashikues. Këto rezultate të arritura tregojnë se si duhet të analizohen dhe integrohen këto

teknika dhe elemente për të arritur qëllimin kryesorë që ka ky punim. Nëpërmjet vlerësimit të

këtyre hipotezave janë arritur të evidentohen se kush janë faktorët kryesorë që ndikojnë në

strukturën e rrjetit neural si dhe mënyrën se si ndërveprojnë ato me njëri-tjetrin, si duhen

inxhinieruar softuerët të cilët përdorin këto metoda inteligjent dhe si të zvogëlohet koha e

përllogaritjeve nëpërmjet teknikave të ndryshme të paralelizimit.

7.2 Rekomandime të studimit

Sistemi i analizuar dhe dizenjuar për parashikimin e serive kohore me një ndryshore, përbën

një kontribut të rëndësishëm në literaturën për ndërtimin e modeleve parashikuese të serive

kohore me një ndryshore. SIP është një instrument i cili lejon zhvilluesit të implementojnë në

mënyrë efikase dhe të shpejt programe për ndërtimin e modeleve parashikuese në çfarë do

platforme. Zhvillues të ndryshëm mund të zgjedhin të ripërdorin dhe pjesë të këtij sistemi

duke qenë se për modelimin e tij është bërë një ndarje në module e sistemit.

Megjithatë, sistemi i modeluar, duhet të konsiderohet si një instrument i cili kërkon të

përditësohet si rezultat i kërkimeve empirike shtesë që arrihen në punime të ndryshme. Një

tjetër tipar i rëndësishëm është se për çdo modul të sistemit, mund të ndryshohen dhe

pasurohen kërkesat në mënyrë që sistemi të mund të trajtojnë një numër më të gjerë

problemash. Gjithashtu, ndarja e sistemit në module, mundëson që ky sistem të mund të

zhvillohet duke shtuar veçori specifike nëpërmjet moduleve shtesë të krijuara.



Blerina VIKA

114

Rekomandime kryesore që dalin nga ky punim janë:

Të krijohen hapësirat dhe mundësitë që teknikat inteligjente të jenë një alternative e

krahasueshme me metodat tradicionale parashikuese, rezultati i të cilave të konsiderohet në

procesin e vendimmarrjeve në fusha të ndryshme.

Zhvillimi i moduleve mësimore, në fushën akademike, të cilat të ndërthurin metodat

inteligjente me analizën e serive kohore. Duke rritur numrin e individëve me njohuri të thella

në zhvillimin e sistemeve inteligjente që i përgjigjen kërkesave të kohës.

Nga pikëpamja e biznesit, ky punim i vjen në ndihmë sektorit privat, duke sugjeruar që të

zhvillojnë programe të cilët përdorin parashikime me anë të metodave inteligjente si një

alternativë e mirë përfitimi.



Blerina VIKA

115

8 REFERENCAT

AnkushKhere dhe MayurPatankar. (2012). Artificial Intelligence: Artificial Neural Network Simplified.

World Research Journal of Transactions on Algorithms, 1(1), 13-17.

Bacchetta, P., & Wincoop, E. v. (2006). Can information heterogeneity explain the exchange rate

determination puzzle? American Economic Review 96, 552-576.

Bang, A. L., et al. (2012). The Role of Hypothesis in Constructive Desing Research. Proceedings of the

Arts of Research Iv.

Bang, A. L., Krough, P., Ludvigsen, M., & Markussen, T. (2012). The Role of Hypothesis in Constructive

Design Research. . Proceedings of the Art of Research Iv.

Barnard, E. and Wessels, L. (1992). Extrapolation and Interpolation in Neural Network Classifiers.

IEEE Control Systems, 50-53.

Basheer I.A. dhe Hajmeer M,. (2000). Artificial Neural Networks: fundamentals, computing, design,

and application. Journal of Microbiological Methods, 43, 3-31.

Bengio Y. & LeCun Y. (2007). Scaling Learning Algorithms Towards AI. Large-Scale Kernel Machines, 1,

1-41.

Beverly, P. (2016). Designs, Methods and Practices for Research of Project Management. Burlington:

Gower Publishing Company.

Bishop, C. M. (2006). Pattern Recognition and Machine Learning. Singapore: Springer.

C. Kandilar, M.Simsek, C. H. Aladag. (2009). Forecasting The Exchange Rate Series With Ann: The

Case of Turkey. Istanbul Univ. Econometrics and Statistics e-Journal, 9(1), 17-29.

ChangI. Ch., Hwang H. G. (1998). Applying Neural Networks in Time Series Forecasting. Information

and Management Science, 9(3), 35-43.

Crone, S. F., Guajardo, F., & Weber, R. . (2006). The impact of preprocessing on support vector

regression and neural networks in time series prediction . DMIN, 37-44.

F., H. (2004). Elementë të njehsimit paralel. Tirana: SHBLU.

Fiesler, E. (1996). 'Neural Network Topologies' The Handbook of Neural Computation. Oxford

University Press and IOP Publishing.

Fu, L. (1994). Neural Networks in Computer Intelligence. New York: McGraw-Hill.

Giles, C. L., Lawrence, S. dhe Tsoi, A. C. (2001). Noisy time series prediction usign recurrent neural

networks and grammatical inference. . Machine Learning , 44(1-2), 161-183.



Blerina VIKA

116

Gonzaley, S. (2007). Neural Networks for Macroeconomic Forecasting: A Complementary Approach

to Linear Regression Models. Canada.

Gonzalez S. (2000). Neural networks for macroeconomic forecasting: a complementary approach to

linear regression models. Canada Economic and Fiscal Policy Branch.

Gonzalez, Steven; Canada Economic and Fiscal Policy Branch. (2000). Neural networks for

macroeconomic forecasting: a complementary approach to linear regression models.

Gupta J. N. D., Smith K. A. (2001). Neural Networks in Business: Techniques and Applications. London:

idea Group inc (IGI).

Hall, P. R. & Kibler, F. D. (1985). Differing Methodological Prespectives in Artificial Intelligence

Research. AI Magazine, AAAI, Vo 6, Nr 3, 166-179.

Haykin, S. (1999). Neural Networks and Learning machines. Ontario, Canada: Pearson.

Hines, J. W. (1996). A logarithmic neural network architecture for a PRA approxiation. American

Nuclear Society, International Topical Meeting on Nuclear Plant Instrumantation, Control

and Human-Machine Interface Tchnologjies, 235-241.

Indranarain, R. (2010). Artificial Intelligence: Neural Networks Simplified. International Research

Journal of Finance and Economics, 39.

Inoue, A., & Kilian, L. (2002). In-sample or out-of-sample tests of predicability: which one should we

use? European Central Bank, Working Paper no. 195.

Jain A. K., Mao J., Mohiuddin K. M. (1996). Artificial Neural Networks: A Tutorial. Computer, 29(3),

31-44.

Janil, A. K., & Mao, J. (1996). Artificial Neural Networks: A Tutorial. IEEE Transactions on Computer,

29(3 (March)), 31-44; doi:10.1109/2.485891.

JingTao, Y. A. O, & Tan, C. L. (2001). Guidelines for financial forecasting with neural networks. In

International Conference of Neural Information Processing.

Kaastra I. dhe Boyd M. . (1996). Designing a neural network for forecasting financial and economic

time series. Neurocomputing 10, 215-236.

Kaastra, I. dhe Boyd, M. (1996). Designing a Neural Network for Forecasting Financial and Economic

Times Series. . Neurocomputing, 10, 215-236.

Karsoliya, S. (2012). Approximating Number of Hidden Layer neurons in Multiple Hidden Layer BPNN

Architecture. International Journal of Engineering Trends and Technology, 31(6), 714-717.

Kilian, L., & Taylor, M. P. (2001). Why is it so difficult to beat the random walk forecast of exchange

rates?



Blerina VIKA

117

Klaussen, K. L. dhe Uhrig, J. W. (1994). Cash soybean price prediction with neural networks.

Conference on Applied Comodity Analysis, Price, Forecasting and Market Risk Management

Proceedings, (fv. 56-65). Chicago.

Koskinen I., Zimmerman J. et al. (2011). Design Research through Practice. USA: Elsevier.

Krystyna, K., & Maciej, Z.,. (2011). Data pre-processing in the neural network identification of the

modified walls natural frequencies. Computer Methods in Mechanics, Ms12, 9-12.

L. Yu, Sh. Wang and K. K. Lai. (2007). Foreign-Exchange-Rate forecasting with Artificial Neural

Networks. New York: Springer.

Maier H. R.,Jain A., Dandy G. C. & Sudheer K. P. (2010). Methods used for the development of neural

networks for the prediciton of water resource variable in river systems: Current status and

future directions. Environmental Modelling & Software, 25(8), 891-909.

Mandic D. P. & Chambers J. A. (2001). Recurrent Neural Networks for Prediction. England: John Wiley

& Sons Ltd.

Martiri E., Tyxhari G. dhe Gorishti A. (2010). Parallel Computing: still missing in the Albanian reality.

Economic & Social Challenges and Problems at the Time of Crisis, FE, UT.

May R.,Dandy G., & Maier H. (2011). Review of input variable selection methods for artificial neural

networks. Artifcial neural networks - methodological advances and biomedical application,

Doi:10.16004.

McCulloch W. S., Pitts W. (1943). A Logical Calculus of Ideas Immanent in Nervous Activity. Bull.

Mathematical Biophysic, 5, 115-133.

McNelis, P. D. (2004). Neural Networks in Finance: Gaining Predictive Edge in the Market . Orlando,

FL: Academic Press.

Meylar, A., Kenny, G., & Quinn, T. (1998). Forecasting Irish inflation using ARIMA models. Munich

Personal RePEs Archive (MPRA) paper no 11359 (December).

Mitchell, T. M. (1997). Machine Learning. McGraw-Hill.

Moody J. (1995). Economic Forecasting: Challenges and Neural Network Solution. International

Symposium on Artificial Neural Network. Hsichu, Taivan.

Nawi, N. M., Atomi, W. H., & Rehman, M. Z. (2013). The effect of data pre-processing on optimized

training of artificial neural networks. Procedia Technology, 11, 32-39.

Nouir Z, Sayrac B, Fourestie B, Tabbara W, Brouaye F. (2007). Comparison of neural network learning

algorithms for prediction enhancement of a planning tool. In 13th European Wireless

Conference .



Blerina VIKA

118

P. W. Ch. Prasad & Azam Beg. (2009). Investigating data preprocessing methods for circuit

complexity models. Expert Systems with Applications, 36(1), 519–526.

Palit A. K. dhe Popovic D. (2005). Computational Intelligence in Time Series Forecasting.

Panchal F., S. ; Panchal M. (2014). Review on Methods of Selecting Number of Hidden Nodes in ANN.

International Journal of Computer Science and Mobile Computing, 3(11), 455-464.

Përshtatur nga: Nunamaker, W., Chen, M., dhe Purdin, T. (1991). Systems development in

information systems research. Journal of Management Information Systems, 7(3) 89-106.

Philip, A., Taofiki, A., & Bidem, A. (2011). Artificial Neural Network Model for Forecasting Foreign

Exchange Rate. 1(No. 3), 110-118.

Portugal, M. S. (1995). Neural Network Versus Time Series: a Forecasting Exercise. Revista Brasileira

de Economia, 49(4) 611-629.

Roche, C. (2014, 08 13). Why economic and market forecasting matters to everyone. Gjetur 11 16,

2015, nga Pragmatic Capitalism: http://www.pragcap.com/why-economic-and-market-

forecasting-matters-to-everyone/

Rumelhart DE, Hinton GE, dhe Williams RJ. (1986). Learning internal representation by back-

propagation errors. Cambridge, MA: MIT Press.

Russell S. J. dhe Norvig P. (2009). Artificial Intelligence: A Modern Approach (Vëll. i III). Prentice Hall.

Sarno, L., & Taylor, M. P. (2002). The Economics of Exchange Rates. Cambridge University Press.

Seiffert U. (2002). Artificial Neural Networks on Massively Parallel Computer Hardware. European

Symposium on Artificial Neural Networks . Bruges (Belgium): ESANN'2002.

Seiffert, U. (2002). Artificial Neural Networks on Massively Parallel Computer Hardware. Europeab

Symposium on Artificial neural networks. Bruges (Belgium): Essann'2002 .

Shamsuddin, S. M., Sallehuddin, R., & Yusof, n. M. (2008). Artificial Neural Network time series

modeling for revenue forecasting. Chiang Mai J. Sci, 35(3), 411-426.

Singh, S.K.; Jain, S.K.;Bardassy, A. (2014). Training of artificial neural networks using information-rich

data. Hydrology, 1, 40-62.

Smith, S. W. (2013, Dhjetor 15). The Scientist and Enginner's Guide to Digital Signal Proccessing.

Gjetur në DspGuide: http://www.dspguide.com/ch26/2.htm

Stencl M. dhe Stastny J. (2011). Artificial Neural Network Numerical Forecasting Of Economic Time

Series. intech.

T. Hill, L. Marquey, M. O'Connor dhe W. Remus. (1994). Artificial Neural Network models for

Forecasting and Decision Making. International Journal of Forecasting , 10:5-15.



Blerina VIKA

119

T. Hill, L. Marquez, W. Remus. (1994). Artificial Neural Network models for forecasting and decision

making. Int. J. Forecast, 10, 5-15.

Tarassenko, L. (1998). Guide to Neural Computing Applications. New York: John Wiley & Sons Inc.

Taylor BJ, Darrah MA and Moats CD. (2003). Verification and validation of neural networks: a

sampling of research in progress. AeroSense; International Society for Optics and Photonics,

(fv. 8-16).

Touretzky D. S. & Pomerleau D. A. . (1989, August ). What's hidden in the hidden units? BYTE, f. 14:8.

Turan, P. D. (2011). Artificial Neural Network Application in Economics: A Survey of Emprical

Literature and its Using on Economic Studies. 1st International Symposium on Computing in

Informatics and Mathematics.

Vahidov, R. (2012). Design-Type Research in Information Systems: Findings and Practices. Canada:

IGI-Global.

Virili, F. & Freisleben, B. (2000). Nonstationary and data preprocessing for neural network prediction

of an economic time series. International Joint conference (fv. 129-134). IEEE-INNS-ENNS vol.

5.

Walczak, S. (1998). Neural Network Models for A Resource Allocation Problem . Transaction on

Systems, Man and Cybernetics, 276-284.

Walczak, S. dhe Cerpa, N. (1999). Heurisitic principles for the design of artificial neural networks.

Information and Software Technology(41(2)), 109-119.

Wang Lp, Fu Xj . (2005). Data Mining with Computational Intelligence. Berlin: Springer-Verlag.

Y, H. (2009). Advances in Artificial Neural Networks - Methodological development and application.

Algorithms, 2(3), 973-1007.

Yao, J. T. (2002). Towards a Better Forecasting Model for Economic Indices. International Conference

on Computer Science and Informatics, 6, fv. 299-303. Durham, USA.

Yonaba H., Anctil F., & Fortin V. (2010). Comparing sigmoid Transfer Function for NN multistep

Ahead Streamflow Forecasting. Hydrologic Engineerig, 15(4), 275-283.

Yu, L., Wang, S., & Lai, K. K. (2010). Foreign-Exchange-Rate Forecasting with artificial neural

networks. Springer Science and Business Media, 107.

Zhang G. P. (2004). Neural Networks in Business Forecasting. EUA: Idea Group Publishing.

Zhang G., Patuwo E. B., Hu M. (1998). Forecasting with artificial neural network: The state of the art.

International Journal of Forecasting(14), 35-62.

Zhang, G., & Hu, M. Y. (1998). Neural network forecasting of the British pound/US dollar exchange

rate. Omega 26.4, 495-506.



Blerina VIKA

120

Zhang, G., Patuwo, B., & Hu, M. Y. (1998). Forecasting with artificial neural networks: The state of

the art. International Journal of Forecasting(14 (1)), 35-62.

Zhang, S., Zhang, C., Yang, Q. (2003). Data preparation for data mining. Applied Artificial Intelligence,

5-6(17), 375-381.

Zhang, Sh., Zhang, Ch. dhe Yang, Q. (2003). Data preparation for data mining. Applied Artificial

Itelligence: An International Journal, 17(5-6), 375-381.

Zheng, Z. (2006). Boosting and Bagging of Neural Networks with Applications to financial time series.

Working paper, Department of Statistics, University of Chicago, Tech. Rep.

Zimmerman, J., & Forlizzi, J. (2008). The Role fo Design Artifacts in Design Theory Construction.

Artifact, 2(1):41-45.

fakulteti i ekonomisË departamenti statistikË dhe ... · “analiza dhe dizenjimi i një sistemi...

Documents