fakulteti i ekonomisË departamenti statistikË dhe ... · “analiza dhe dizenjimi i një sistemi...
TRANSCRIPT
Udhëheqës Shkencor:
Prof. Dr. KOZETA SEVRANI
Doktoranti:
BLERINA VIKA
ANALIZA DHE DIZENJIMI
I NJË SISTEMI INTELIGJENT PËR PARASHIKIME
NËPËRMJET RRJETAVE NEURALE
Tiranë, Shtator 2016
PËR MBROJTJEN E GRADËS SHKENCORE
DOKTOR
DISERTACION
UNIVERSITETI I TIRANËS
FAKULTETI I EKONOMISË
DEPARTAMENTI
STATISTIKË DHE INFORMATIKË E ZBATUAR
DISERTACION
Paraqitur nga:
znj. BLERINA VIKA
për mbrojtjen e gradës shkencore
Specialiteti: Sisteme Informacioni në Ekonomi
“DOKTOR ”
TEMA:
Mbrohet më datë __ /__ / 2016, para Komisionit të përbërë nga:
1. ................................................... Kryetar
2. ...................................................Anëtar / oponent
3. ...................................................Anëtar / oponent
4. ................................................... Anëtar
5. ................................................... Anëtar
UNIVERSITETI I TIRANËS FAKULTETI I EKONOMISË
DEPARTAMENTI STATISTIKË DHE INFORMATIKË E ZBATUAR
REPUBLIKA E SHQIPËRISË
ANALIZA DHE DIZENJIMI
I NJË SISTEMI INTELIGJENT PËR PARASHIKIME
NËPËRMJET RRJETAVE NEURALE
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
3
Abstrakt
Përgjatë njëzet viteve të fundit është theksuar gjithmonë dhe më shumë përdorimi i
rrjetave neurale (RN), si mjete me vlerë në zgjidhjen e problemave të ndryshëm për
parashikim. Suksesi i një rrjetit neural për parashikim lidhet ngushtë me gjetjen e strukturës
së duhur të rrjetit. Tipi i strukturës së një rrjeti neural përcaktohet nga numri i njësive bazë në
rrjet si dhe lidhjet që vendosen midis njësive brenda rrjetit. Parashikimi me anë të RN
ndryshon nga metodat tradicionale të përdorura për parashikim. Pavarësisht se mbështeten në
disa parime thelbësore të përgjithshme, aplikimi i tyre praktikisht nuk arrin të standartizohet
në një metodologji të plotë. Në këtë punim, fokusi kryesorë është në analizën dhe dizenjimin
e një sistemi inteligjent për parashikim, i cili gjeneron në mënyrë automatike strukturën e
përshtatshme të rrjetit neural bazuar në të dhënat reale të problemit për parashikim.
Përmbledhja e studimit është përshkruar në kapitullin e parë. Në të trajtohen argumenta të
ndryshëm si dhe evidentohen elementët të cilët janë të domosdoshëm për të kuptuar qëllimin
dhe objektivat e këtij punimi kërkimor shkencor. Përcaktimi i problemit, qëllimi dhe zgjidhjet
e mundshme janë paraqitur në këtë pjesë të punimit.
Në këtë disertacion adresohen dhe trajtohen në mënyrë të detajuar çështje të ndryshme që
lidhen me modelimin e automatizuar të strukturës së rrjeti neural për parashikimin e serive
kohore. Një pjesë e kësaj teze bën një vështrim të përgjithshëm për plotësimin e bazës teorike
në lidhje me mënyrat dhe format e përdorimit të rrjetit neural në parashikim. Ky hulumtim
mbështetet dhe analizon gjithashtu rezultatet empirike të trajtuara në literaturën e gjerë.
Në pjesën e dytë ilusturojmë efektivitetin e analizës së kryer përgjatë literaturës, duke e
mbështetur atë me rezultatet e nxjerra në analizë empirike. Krahasimi i metodave të
ndryshme ofron rezultate të krahasueshme si dhe shpesh nxjerrin që RN i tejkalon modelet
tradicionale.
Pjesa e tretë përshkruan analizën dhe dizenjimin që i bëhet sistemit inteligjent për parashikim.
Gjithashtu në këtë pjesë të disertacionit ilustrohen metodat dhe strategjitë e nevojshme për të
ndërtuar rrjetin neural parashikues. Në fund paraqiten përfundimet dhe konkluzionet në lidhje
me qëllimet dhe objektivat e këtij studimi duke theksuar kontributin e tij në literaturë. Pjesë
plotësuese është përfshirja e shënimeve dhe sugjerimeve për punën në të ardhmen.
Fjalë Kyçe: Rrjeta Neurale SHS, Parashikimi i Serive Kohore, Algoritëm trajnimi, matje
performance, dizenjim sistemi inteligjent
4
Familjes time .....
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
5
Mirënjohje
Është mëse natyrale që ndjesitë dhe emocionet është e vështirë të shkruhen, e megjithatë
tanimë, në kryerjen e këtij studimi mendoj se është e nevojshme të shprehem në pak rreshta.
Përgjatë gjithë këtij rrugëtimi , relativisht të gjatë, ndihem mirënjohëse ndaj atyre të cilëve ia
kushtoj këtë punim, familjes time, të cilët më kanë ndihmuar e qëndruar pranë me dashuri
dhe frymëzim. Ky përkushtim i tyre me ka bërë të ndihem e privilegjuar dhe me fat.
Si fillimi, dëshiroj të shpreh mirënjohjen më të thellë për udhëheqësen time, prof. Kozetën, që
me dashamirësinë e saj, ka arritur të më jap mbështjeje të vazhdueshme përgjatë punës sime
shkencore e profesionale. Faleminderit për durimin, motivimin, pozitivitetin, energjinë dhe
gatishmërinë, si dhe përpjekjen e palodhur për të ngritur më lart kërkimin shkencor në
departamentin tonë!
Gjithashtu, me një falenderim të sinqert dua të përmend prof. Dhimitrin i cili me diskutimet
e gjata dhe të shpeshta ka qenë përherë i gatshëm, dhe me komentet e tij, puna ime kërkimore
të zgjerohej në këndvështrime të ndryshme. Nuk mund të mos përmend kolegët e
departamentit që me diskutimet, vlerësimet dhe sugjerimet e tyre kanë kontribuar në
përmirësimin e vazhdueshëm si dhe kanë qenë nxitje për rritjen e cilësisë përgjatë punës sime
kërkimore.
Ju falenderoj pa fund të gjithëve!
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
6
Pasqyra e Disertacionit
KAPITULLI 1 ...................................................................................................................... 12
1 PËRMBLEDHJE E STUDIMIT .................................................................................. 12
1.1 Hyrje ...................................................................................................................................... 12
1.2 Qëllimi ................................................................................................................................... 14
1.3 Objektivat e studimit ............................................................................................................ 15
1.3.1 Objektivat: ..................................................................................................................... 16
1.3.2 Hipotezat e disertacionit: .............................................................................................. 16
1.4 Organizimi i Disertacionit ...................................................................................................... 17
KAPITULLI 2 ...................................................................................................................... 20
2 METODOLOGJIA ........................................................................................................ 20
2.1 Hyrje ...................................................................................................................................... 20
2.2 Ndërtimi teorik ...................................................................................................................... 23
2.2.1 Studimi i Literaturës ...................................................................................................... 23
2.2.2 Analizë empirike e prototipave ..................................................................................... 24
2.3 Modelimi i Sistemit Inteligjent .............................................................................................. 25
KAPITULLI 3 ...................................................................................................................... 27
3 RRJETAT NEURALE ARTIFICIALE ........................................................................ 27
3.1 Rrjetat neural biologjike kundrejt artificiale ......................................................................... 27
3.2 Struktura e rrjetit neural ....................................................................................................... 30
3.2.1 Perceptroni ................................................................................................................... 30
3.2.2 Funksionet e aktivizimit ................................................................................................ 32
3.2.3 Topologjitë e rrjetit neural ............................................................................................ 36
3.2.4 Procesi i të mësuarit për RNA ...................................................................................... 39
KAPITULLI 4 ...................................................................................................................... 41
4 PARASHIKIMI NËPËRMJET RRJETAVE NEURALE ......................................... 41
4.1 Hyrje ...................................................................................................................................... 41
4.2 Parashikimi i serive kohore në këndvështrimin ekonomik ................................................... 42
4.3 Rrjetat neurale si mjete parashikimi ..................................................................................... 46
4.4 Hapat e parashikimit me anë të RN-l .................................................................................... 48
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
7
4.4.1 Parapërgatitja e të Dhënave për Parashikim ................................................................ 50
4.4.2 Ndërtimi i RN-l për parashikim ..................................................................................... 55
4.4.3 Procedurat e trajnimit të RN-l ....................................................................................... 61
4.4.4 Ndërtimi i modelit parashikues ..................................................................................... 68
4.5 Të metat e RNA-le si modele parashikuese ......................................................................... 69
KAPITULLI 5 ...................................................................................................................... 71
5 VLERËSIMI I RRJETIT NEURAL PARASHIKUES (raste studimi) .................. 71
5.1 Hyrje ...................................................................................................................................... 71
I. Përdorimi i rrjetave neurale për parashikimin e Kursit të këmbimit .................................... 72
5.1.1 Përshkrimi i problemit .................................................................................................. 72
5.1.2 Të dhënat për metodologjitë Konkurruese ................................................................... 73
5.1.3 Modelimi i Rrjetit Neural për parashikimin kursit të këmbimit .................................... 74
5.1.4 Implementimi rrjetit neural parashikues për kursin USD/EUR ..................................... 80
5.1.5 Modeli ARIMA ............................................................................................................... 82
5.1.6 Krahasim i aftësisë parashikuese të modeleve ............................................................. 84
5.1.7 Vërejtje përfundimtare ................................................................................................. 86
KAPITULLI 6 ....................................................................................................................... 88
6 ANALIZA DHE DIZENJIMI I RRJETIT NEURAL PARASHIKUES PËR
KURSIN E KËMBIMIT ....................................................................................................... 88
6.1 Hyrje ...................................................................................................................................... 88
6.2 Qëllimi i softuerit .................................................................................................................. 89
6.3 Organizimi i zhvillimit të sistemit inteligjent ......................................................................... 89
6.4 Specifikimi dhe analiza e problemit ...................................................................................... 91
6.5 Dizenjimi i sistemit ................................................................................................................ 98
6.6 Sigurimi i cilësisë për SIP ..................................................................................................... 101
6.7 Paralelizimi i SIP .................................................................................................................. 103
KAPITULLI 7 ..................................................................................................................... 105
7 KONKLUZIONE, DISKUTIME DHE REKOMANDIME.................................. 105
7.1 Konkluzione ......................................................................................................................... 105
7.2 Rekomandime të studimit................................................................................................... 113
…………………………………………………………………………………………………………………………………………………………….
8 REFERENCAT ............................................................................................................. 115
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
8
…………………………………………………………………………………………………………………………………………………………….
Shtojca A .............................................................................................................................. 121
9 Kodi Burim për Parashikimin e Kursit të Këmbimit .......................................... 121
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
9
Lista e figurave
Figure 2-1. Modeli që tregon se eksperimentet shërbejnë si drejtues të kërkimit konstruktiv të
modelit (Bang, A. L., et al., 2012). ........................................................................................... 22
Figure 2-2:Një qasje metodologjike për ndërtimin e një Artifakti për Sistemin Inteligjent
Parashikues (Përshtatur nga: Nunamaker, W., Chen, M., dhe Purdin, T., 1991, f.
përshtatur):) ............................................................................................................................. 24
Figure 3-1:Neuroni Biologjik (AnkushKhere dhe MayurPatankar, 2012) .............................. 27
Figure 3-2: Paraqitja e përgjithshme e punës së neuronit (Modeli McCulloch-Pitts) ............ 31
Figure 3-3: Struktura të ndryshme të rrjetit neural artificial .................................................. 36
Figure 4-1: Struktura e një rrjeti SHS ..................................................................................... 56
Figure 4-2:Paraqitja e rrjetit SHS me tre-shtresa ................................................................... 64
Figura 5-1: Paraqitja grafike e kursit mujor USD/EUR për periudhën janar 1994-dhjetor
2014.......................................................................................................................................... 74
Figure 5-2: Dizenjimi i rrjetit neural parashikimit për kursin e këmbimit USD/EUR ........... 79
Figure 5-3: Parashikimi jashtë-periudhe i kursit USD/EUR për 12-muaj .............................. 85
Figure 6-1: Cikli jetësore i ndërtimit të SIP ............................................................................ 90
Figure 6-2: Modulet e sistemit inteligjent për parashikim ...................................................... 92
Figure 6-3: Fazat e specifikimit të kërkesave për SIP ............................................................. 92
Figure 6-4: Modelimi i rrjedhjes së inforamcionit në sistem ................................................ 100
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
10
Lista e tabelave
Tabela 3-1: Funksionet e Aktivizimit për Neuronin ................................................................ 33
Tabela 3-2: Funksionet e aktivizimit, a) Threshold, b)Linearitet i pjesshëm, c)Sigmoid,
d)Gaussian ............................................................................................................................... 34
Tabela 5-1: Performanca statistikore e rrjetit NAR për kursin USD/EUR ............................ 81
Tabela 5-2: Testet Unit Root mbi kursine e këmbimit USD/EUR ........................................... 83
Tabela 5-3: Vlerësimi i parashikimeve të kursit USD/EUR ................................................... 86
Lista e algoritmeve
Algoritmi 4-1: Bllok-skema e procesit të përgjithshëm për parashikim ................................. 44
Algoritmi 4-2: Hapat e ndërtimit të RN parashikues .............................................................. 49
Algoritmi 4-3: Algoritmi PP që përdorë zvogëlimin e gradientit ........................................... 66
Algoritmi 5-1: Algoritmi për zgjedhje e rrjetit më të mirë për një strukturë të caktuar ......... 80
Algoritmi 6-1: Hapat e përllogaritjeve të kryera nga rrjeti SHS .......................................... 104
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
11
Lista e shkurtimeve dhe akronimeve
RNA Rrjeti neural artificial
RN Rrjeti neural
SHS Shumë shtresore
FD Furnizim në një drejtim
PM Propagandim mbrapa
ARJ Auto regresiv jo-linear
IA Inteligjenca Artificiale
LM Levenberg-Marquardt
GN Gauss-Njuton
SIP Sistemi Inteligjent Parashikues
RR Rrjeti Rekurent
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
12
Kapitulli 1
1 PËRMBLEDHJE E STUDIMIT
1.1 Hyrje
Një pjesë e konsiderueshme e veprimtarisë njerëzore ndikohet dhe drejtohet nga
parashikimet e të ardhmes. Parashikimi përdoret në një numër të gjerë fushash të cilat
mbështesin vendimmarrjet e tyre mbi pritshmërinë apo vlerësimet që ato kanë për të
ardhmen, ku mund të përmendim në ndryshimet klimaterike, hidrologji, teknologji, ekonomi,
politikë etj. Parashikimet luajnë një rol thelbësor në marrjen e vendimeve. Në të shumtën e
rasteve parashikimi shihet si një pjesë integrale për aktivitetet e vendimmarrjes duke sjellë
sukses ose dështim në aspektin politik, shoqëror si dhe ekonomik. Vendimmarrjet mund të
jenë që nga ato operacionale ditore deri në vendime strategjike afatgjate organizative apo
ekonomike (Zhang G. P., 2004).
Shumë kërkime dhe studime janë zhvilluar për të përmirësuar aftësitë parashikuese si dhe
procesin e vendimmarrjes. Pjesa më e madhe e metodologjive të përdorura në to bazohen në
teknika statistikore tradicionale. Metodologjitë parashikuese përkufizohen shpesh si një
koleksion metodash dhe mjetesh për mbledhjen e të dhënave për serinë/të kohore, të cilat do
të përdoren për të parashikuar vlerat e ardhshme të serisë, mbi bazën e vlerave të së shkuarës
(Palit A. K. dhe Popovic D., 2005). Përpjekjet të shumta bëhen për të modeluar sisteme
parashikimi sa më të sakta. Në dy dekadat e fundit ka marrë hov të madh zhvillimi i një
metode tepër sfiduese që njihen si rrjeti neural.
Rrjeti neural është një metodë e inteligjencës artificiale që përdoret për të modeluar funksione
komplekse. Kohët e fundit, në një numër të gjerë punimesh, rrjetat neurale janë përdorur në
fushën e parashikimit të serive kohore financiare duke rritur rëndësinë e këtyre modeleve
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
13
inteligjente në këtë fushë. RN-le analizohen si mjete të fuqishëm për kërkuesit dhe kjo lidhet
me tiparet që kjo metodologji zotëron. Disa veçori që i bëjnë këto modele të krahasueshme
me ato ekzistuese janë që: (1) RN-le janë në gjendje të nxjerrin apo prodhojnë rregulla
nëpërmjet procesit të trajnimit nga shembuj, pa përdorur supozime fillestare (ChangI. Ch.,
Hwang H. G., 1998); (2) Ato kanë aftësi të mëdha për të zbuluar dhe riprodhuar lidhjet
lineare dhe jo-lineare midis të dhënave që i ofrohen (Gonzaley, 2007); (3) Rrjetat neurale
klasifikohen si modele jo-lineare duke bërë të mundur të arrihet në një shpjegim më të mirë
për të dhënat në krahasim me modelet lineare tradicionale (Basheer I.A. dhe Hajmeer M,,
2000); (4) Duke qenë se këto modele janë të pandjeshme ndaj zhurmave atëherë ato ofrojnë
parashikime të sakta kur të dhënat janë jo të sigurta apo kanë gabime në matje (Basheer I.A.
dhe Hajmeer M,, 2000); (5) Rrjeti neural artificial është përgjithësues. Ai mund të mësoj nga
shembujt duke shfaqur aftësi përgjithësuese të cilat shkojnë përtej të dhënave të përdorura për
trajnimin e tyre (Yao, 2002).
Disa tipare që ndikojnë në saktësinë e parashikimit të RN-l janë arkitektura e rrjetit neural,
shkalla e të mësuarit, algoritmi i trajnimit, tipi i funksioneve të aktivizimit etj. Megjithatë
duhet theksuar se metodologjia dhe teknikat e modelimit të rrjetave neurale ndryshojnë
shpesh ndërsa teknikat e modelimit statistikor janë të qëndrueshme dhe të zhvilluara mirë.
Nuk ka metodologji të saktë për ndërtimi dhe përzgjedhjen e arkitekturës së rrjetit neural të
përshtatshëm për një fushë të caktuar. Proceset aktuale të modelimit në një numër të madh
punimesh janë me bazë empirike.
Parashikimi me anë të RN-le edhe pse mbështeten në disa parime thelbësore të përgjithshme,
realizimi i tyre praktikisht nuk arrin të standardizohet në një metodologji të plotë. Për këtë
arsye lind si nevojë zhvillimin i modeleve të qëndrueshëm të cilët nuk janë specifik për një
treg apo për një periudhë kohe. Aktualisht informacioni apo eksperienca për ndërtimin e një
modeli të mirë parashikues nëpërmjet rrjetit neural nuk është i mjaftueshëm. Burimi për këtë
pengesë shpesh bëhen mungesa e modeleve industriale, si dhe mos publikimi i punimeve
akademike të dështuar. Aktualisht një problem tjetër është se punime që klasifikohen si të
suksesshme nuk publikohen qëllimisht dhe kjo për arsye vetjake përfituese. Aktualisht lind
nevoja për të ndërtuar një sistem të automatizuar që të bëjë ndërtimin e modeleve për rrjetin
neural (Yao, 2002).
Këto janë disa arsye që motivuan për të zhvilluar një punim në nivel doktorate që
kryen studimin e ciklit jetësorë që duhet ndjekur për të ndërtuar një sistem të automatizuar
për parashikimin e serive kohore. Ky studim përpiqet të trajtojë në mënyrë të detajuar se cilët
janë faktorët kryesorë që duhet të studiohen dhe përdoren për të rritur cilësinë e sistemit
parashikuesi. Kuptohet që peshën më të madhe në këtë punim e zë mënyra se si ndërtohen
dhe mësohen rrjetat neurale. Duke qenë se për rrjetat neurale nuk ekziston ndonjë
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
14
metodologji solide, element bazë për realizimin e këtij studimi është kryesisht literatura e
gjerë në dispozicion.
Në shumë punime të ndryshme të literaturës ndeshen të dhëna kontradiktore të
rezultateve, gjë e cila vështirëson nxjerrjen dhe eksplorimin e faktorëve kryesore për
modelimin e sistemit si dhe kërkesave që duhet të përmbush ky sistem. Për këtë arsye pjesë e
studimit janë dhe analiza empirike të cilat përdoren për të plotësuar këto pengesa.
Në këtë tezë synojmë të analizojmë dhe modelojmë një mënyrë të automatizuar për
ndërtimin e një sistemi inteligjent parashikues që përdor rrjetin neural. Sistemi duhet të
përdor seri kohore e luhatshme me një-ndryshore. Synim i këtij punimi është të kontribuojë
në përmirësimin e punës kërkimore të zhvillimit dhe aplikimit të rrjetave neurale si mjete të
dobishme për parashikim. Në përfundim, përpiqet të vë në dispozicion një model të
përgjithshëm për të ndihmuar zhvillues të ndryshëm të zhvillojnë zgjidhje më lehtë dhe
shpejtë nëpërmjet testimit të formave të ndryshme të përpunimit të të dhënave, strukturave të
ndryshme të rrjetit dhe algoritme të ndryshme trajnimi. Nëpërmjet realizimit të një ndarjeje të
sistemit në disa module më të vogla, mundësohet ripërdorimi i pjesëve të sistemit dhe në
aplikacionet të tjerat.
Ky studim është një vlerë e shtuar për disa fusha të rëndësishme si shkenca
kompjuterike, Ekonomike dhe çdo fushë tjetër e cila kërkon të kryej parashikime mbi të
dhëna kohore. Studimet empirike të realizuar nga institucione të rëndësishme të ndryshme në
Shqipëri përdorin gjerësisht metoda ekonometrie lineare dhe shumë rrallë regresione jo-
lineare apo rrjeta neurale. Në numrin e paktë të punime që përdorin rrjetin neural, si modele
parashikuese, vuajnë nga dobësi të ndërtimit të rrjetit.
1.2 Qëllimi
Qëllimi i kryesorë i këtij disertacioni është të analizojë dhe modelojë një sistemi
inteligjent parashikues nëpërmjet përdorimit të rrjetave neurale. Ky qëllim është arritur
nëpërmjet studimit të literaturës bashkëkohore për të kuptuar mënyrën e përdorimit të rrjetave
neurale me qëllim parashikues si dhe faktorëve bazë që ndikojnë në performancën e rrjetit:
cilësinë, saktësinë dhe shpejtësinë e parashikimit. Gjithashtu janë marrë në konsideratë dhe
mënyra se si zhvillues të ndryshëm të rrjetave neurale shmangin probleme specifike të
ndryshme që lidhen modelimin e rrjetave neurale.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
15
Në këtë studim bëhet një analizë në lidhje me mënyrën e saktë dhe efektive se si duhet
të realizohet inxhinierimi për ndërtimin më të mirë të arkitekturës së rrjetit neural artificial
për parashikimet që bazohet në seri kohore të luhatshme me një-ndryshore. Përcaktimi i
metodës së përshtatshme për përpunimin e të dhënave përshkruese të modelit është pjesë e
integruar e sistemit inteligjent. Ndërsa një pjesë tjetër e përbërëse e rëndësishme e sistemit
është përzgjedhja e algoritmit të trajnimit që rrit performancën parashikuese të rrjetit neural.
Vlerësimi i përformancës së rrjetit neural në lidhje me aftësitë parashikuese të tij realizohet
nëpërmjet tregueseve të ndryshëm statistikorë.
Pjesë e rëndësishme e punimit do të jetë një inxhinierim për gjithë ciklin jetësorë të
sistemit inteligjent parashikues. Në këtë pjesë të punimit përcaktohen se cilat mjete të
disiplinës së inxhinierimit të softuerëve janë të përshtatshëm për t‟u përdorur si dhe cilat janë
mjetet specifike që duhet të përfshihen për të përshkruar më mirë tiparet e veçanta të rrjetit
neural. Përveç përcaktimit të këtyre mjeteve është dhënë një mënyrë për aplikimin e tyre.
Janë zhvilluar disa shembuj të rrjetave neural të cilat paraqesin mënyrën e përdorimit të
inxhinierimit të sistemit inteligjent parashikues. Sistemi inteligjent parashikues i analizuar
dhe modeluar merr në konsideratë jo vetëm performancën parashikues të tij por dhe efiçencën
kohore. Evidentohet përdorimi i paralelizimit të përpunimit të detyrave specifike të sistemit të
cilat janë të pavarura nga njëra-tjetra.
1.3 Objektivat e studimit
Qëllimi i këtij studimi është specifikimi, dizenjimi dhe zhvillimi i një sistemi inteligjent
parashikues, i cili mund të ndërtojë automatikisht një model parashikues bazuar në të dhënat
kohore të luhatshme me një-ndryshore, që atij i paraqiten. Realizimi i këtij sistemi kërkon që
fillimisht të realizohet eksplorimi dhe përcaktimi i parametrave apo faktorëve të rrjetit neural
që sigurojnë aftësi parashikuese më të mira.
Për përcaktimin e këtyre faktorëve do të studiohen llojet e ndryshme për përpunimin e të
dhënave dhe strukturave të ndryshme të rrjetave neural artificiale si dhe variacionet e
rregullave që lidhen me të mësuarin. Nëpërmjet studimit të këtyre faktorëve detajohen dhe
ekzaminohen efektet që ato kanë mbi modelimin dhe parashikimin e të dhënave kohore jo-
lineare. Ky disertacion ka këto objektiva kryesore të përgjithshme:
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
16
1.3.1 Objektivat:
1. Të paraqes konceptet kryesore në përdorimet ekzistuese të modelimit të rrjetave
neurale për parashikim e bazuar mbi literaturën e studiuar. Krahasimi i përqasjeve të
ndryshme për aplikimin e rrjetave neurale në problemet parashikuese. Evidentimi i
elementëve kryesorë që lidhen me strukturën e RN si kërkesat mbi përpunimin e të
dhënat kohore, metodat e trajnimit dhe tiparet e ndryshme operacionale të tyre.
2. Përcaktimi dhe diskutimi i efekteve që kanë faktorët kryesorë të ndërtimit të rrjetit
neural në aftësitë parashikuese të tij bazuar në literaturën e deritanishme:
a. Përzgjedhja e përpunimit për të dhënat që i paraqiten rrjetit neural
b. Përcaktimi i strukturës së rrjetit neural, njësive bazë dhe lidhjeve midis tyre.
c. Algoritmet e trajnimit të rrjetit neurale që përcakton se si duhet të mësojë RN-l
nga shembujt.
3. Analizimi, modelimi dhe implementimi i një rasti konkret i përdorimit të rrjetit neural
parashikues si dhe krahasimi i performancës së tij me rezultatet e metodave
statistikore.
4. Analizimi dhe modelimi i sistemit inteligjent parashikues që automatizon:
përzgjedhjen e përpunimit për të dhënat, përzgjedhjen e strukturës së rrjetit neural si
dhe algoritmin e trajnimit që do të përdoret nga sistemi. Realizimi i kësaj analize dhe
modelimi bëhet duke përshtatur mjetet dhe metodat të disiplinës së inxhinierimit të
softuerëve me tiparet specifike të RN-l.
5. Dizenjimi i sistemit përfshinë fazat që nga përgatitja paraprake e të dhënave deri tek
testimi i rrjetit neural.
6. Aplikimi i teknikave të avancuara për modelimin e sistemit inteligjent parashikues si:
ndarja në module të veçanta të sistemit, paralelizimi i përpunimit të detyrave të
sistemit si dhe përcaktimi i metrika të matjes së performancës.
1.3.2 Hipotezat e disertacionit:
Natyra kërkimore për këtë disertacioni bënë pjesë në punët kërkimore të tipit „hulumtim i
modelimit konstruktiv‟ ose më qartë kërkim nëpërmjet modelimit (Bang, A. L., Krough, P.,
Ludvigsen, M., & Markussen, T., 2012). Specifike, për këtë lloj natyre kërkimore, është
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
17
realizimi i integrimit të punës kërkimore me praktikat e modelimit. Modelimi ka të bëjë me
orientimin e të ardhmes ndërsa puna kërkimore lidhet me të shkuarën dhe të tashme.
Nuk është e lehtë të mund të realizohet lidhja ndërmjet punës kërkimore dhe modelimit.
Ngritja e hipotezave të mëposhtme janë ndërtuar duke u mbështetur në këtë metodologji. Në
këtë përqasje hipotezat duhet të drejtojnë procesin e dizenjimit të sistemit.
H1. Çdo lloj strukture e rrjetin neural për parashikimin e serive kohore me një-
ndryshore mund të tejkaloj metodat tradicionale statistikore.
H2. Ndërmjet faktorëve që ndikojnë në performancën e rrjetit neural parashikues nuk
ka ndërveprim dhe tiparet e tyre mund të përcaktohen në mënyrë të pavarur.
H3. Automatizimi i përzgjedhjes së strukturës së rrjetit neural përmirëson aftësitë
parashikuese të sistemit inteligjent për kursin e këmbimit kundrejt metoda
tradicionaleve.
H4. Për analizën dhe modelimin e sistemit inteligjent parashikues (SIP) nëpërmjet
rrjetit neural, mund të përdoren mjetet dhe metodat standarde ekzistuese të
disiplinës së inxhinierimit të softuerëve.
H5. Procesimi i përllogaritjeve që kryhen nga SIP mund të paralelizohen.
1.4 Organizimi i Disertacionit
Për të arritur qëllimin dhe objektivat e vendosura është ndjekur organizimi i mëposhtëm për
këtë disertacion:
Kapitulli i parë: Paraqet një përmbledhje të fushës së studimit. Si fillimi bëhet përshkrimi i
sfondit të problemit duke u ndjekur nga formulimi i qëllimit të disertacionit dhe përcaktimi i
objektivave të tij. Objektivat përshkruajnë fazat kryesore që duhet të jenë pjesë e studimit për
të arritur qëllimin kryesore të tij. Pjesë tjetër e këtij kapitulli është përcaktimi i hipotezave që
drejtojnë procesin e dizenjimit të sistemit.
Kapitulli i dytë: Në të trajtohet në mënyrë të detajuar metodologjia e zgjedhur për të zhvilluar
këtë disertacion. Ky kapitull evidenton elementët dhe tiparet kryesore që e karakterizojnë
këtë punim. Nëpërmjet një analize dhe shtrimit të argumenteve tregohet se pse është
përzgjedhur metodologjia përkatëse.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
18
Kapitulli i tretë: Qëllimi i këtij kapitulli është që të jap një kuptim fillestar për RNA duke
evidentuar tiparet e abstraguara nga modeli biologjik si dhe ti përgjigjet pyetjeve se pse dhe
kur janë të nevojshme këto mjete përllogaritëse. Nëpërmjet shqyrtimit të literaturës realizohet
krahasimi dhe evidentimi i ndryshimeve që ekzistojnë ndërmjet programeve kompjuterike
tradicionale dhe rrjetave neurale si mjete përllogaritëse. Më pas vazhdohet me diskutimin e
çështjeve kryesore që lidhen me zhvillimin e modeleve RNA-l si p.sh struktura e rrjetit,
funksionet e aktivizimit të perceptronit (njësisë bazë të RN-l), proceset e ndryshme për të
mësuar rrjetin neural, mënyrat e trajnimit të rrjetit dhe kritereve të ndryshme të vlerësimit të
rrjetit.
Kapitulli i katërt: Nëpërmjet studimit të literaturës bëhet një analizë e detajuar e përdorimit të
rrjetave në parashikim duke evidentuar avantazhet dhe dizavantazhet kryesore të përdorimit
të tyre krahasuar me metodat tradicionale statistikore. Baza teorike për RNA-le parashikuese
dhe elementët përbërës të modelimit të tyre përdoren për të shpjeguar hapat e përgjithshëm që
duhen ndjekur për të modeluar një rrjet neural për parashikim. Për çdo hap të modelimit të
rrjetit ofrohen qasjet e ndryshme të sugjeruara në punime të ndryshme shkencore. Kjo analizë
e kryer në këtë kapitull përdoret si bazë për specifikimin e kërkesave që duhet të ketë sistemi
inteligjentë parashikues si dhe për të argumentuar disa prej hipotezave të ngritura në këtë
disertacion.
Kapitulli i pestë: Ky kapitull paraqet një rast studimi konkret të parashikimit të kursit të
këmbimit USD/EUR. Për të ndërtuar rrjetin neural parashikues të përshtatshëm për kursin e
këmbimit ndiqen hapat kryesorë që janë përshkruar në kapitullin e katërt. Në vazhdim të këtij
kapitulli bëhet një analizë dhe diskutimi mbi rezultatet e përftuara nga rrjeti neural krahasuar
me modelin ARIMA dhe atë të ecjes së rastësishme duke përdorur kritere të ndryshme
vlerësimesh.
Kapitulli i gjashtë: Duke ndjekur procesin e inxhinierimit të softuerëve bëhet analiza dhe
dizenjimi i sistemit inteligjent parashikues për një seri kohore me një-ndryshore për një-hap-
përpara jashtë periudhe. Në këtë pjesë evidentohen tiparet të cilat ndikojnë në procesin e
inxhinierimit të zgjedhur për zhvillimin e sistemit. Sistemit i propozuar është organizuar në
module dhe për secilin modul janë bërë specifikimi i kërkesave dhe dizenjimi i tyre. Çështje e
rëndësishme në këtë pjesë është trajtimi i elementëve të sigurisë që duhen vlerësuar përgjatë
ndërtimit të sistemit inteligjent parashikues duke ofruar kështu rezultate më të qëndrueshme
dhe më cilësore. Së fundi trajtohen teknikat e paralelizimit, përdorimi i tyre në ndërtimin e
këtij sistemi tentojnë të përmirësojnë problematikën që lidhet me kohën e gjatë të trajnimit të
rrjetit neural.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
19
Kapitulli i shtatë: Paraqet përmbledhjet dhe përfundimet e këtij punimi në lidhje me
objektivat e vendosura në fillim. Në vazhdim, për çdo hipotezë të ngritur bëhet argumentimi i
vlefshmërisë ose jo të tyre. Gjithashtu në të evidentohen problemet dhe kufizimet të hasura
përgjatë punimit duke dhënë rekomandimet për punën kërkimore në të ardhmen që do të
ndihmonin në shmangien e tyre si dhe në implementimin dhe testimin e sistemit inteligjent
parashikues.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
20
Kapitulli 2
2 METODOLOGJIA
2.1 Hyrje
Përzgjedhja e metodologjisë së duhur që përshtatet me problemin e trajtuar nga ky punim
është shumë e rëndësishme. Ky punim, ashtu siç është përshkruar në kapitullin e mësipërm,
ka si qëllim të analizojë dhe modelojë një sistem inteligjent për parashikimi e serive kohore.
Modelimi i sistemeve që përdorin teknika të fushës së Inteligjencës Artificiale është i vështirë
dhe kërkon një mënyrë të veçantë trajtimi që ndryshon nga dizenjimi i sistemeve tradicionale.
Teknikat e fushës së IA kanë si veçori të tyre eksplorimin e njohurive, identifikimin të teorive
ekzistuese që shpesh janë dhe kundërshtuese (Hall, P. R. & Kibler, F. D., 1985). Rrjetat
neurale, si një pjesë e fushë së IA, i trashëgojnë këto problematika.
Për trajtimin e këtij punimi është zgjedhur një metodologji e re dhe shumë premtuese që
njihet si kërkimi konstruktiv i modelimit (Koskinen I., Zimmerman J. et al, 2011) që është një
përmirësim i kërkimit përmes modelimit (Bang, A. L., et al., 2012).
“ Kërkimi Konstruktiv i Modelimit është një kërkim në të cilin „konstruksioni - qoftë ai një
produkt, sistem apo media –„ është boshti kryesorë dhe luan rolin bazë në ndërtimin e
njohurive” (Koskinen I., Zimmerman J. et al, 2011).
Kjo mënyrë e përqasjes së kërkimit fillohet me formulimin e një pyetjeje kërkimore ose
hipoteze mbi një teori apo filozofi ekzistuese e cila më pas hetohet nëpërmjet një procesi
„provo dhe modelo‟. Kjo metodologji, e përshtatshme për fusha të ndryshme kërkimore,
mbështetet në tre elemente kryesore të ndryshme: (i) Eksperimentet, (ii) Fushat e studimit dhe
(iii) ekspozimi. Veprimet që duhet të ndiqen përgjatë metodologjisë së kërkimit konstruktiv
të modelimit ndahen në atë kërkimore dhe modeluese. Puna kërkimore përdoret për të
kuptuar të kaluarën dhe të tashmen ndërsa modelimi kërkon të pasqyroj të ardhmen. Puna
kërkimore është një përmbledhje e rezultateve të nxjerrja nga eksperimentet dhe studimi i
fushave të interesit. Ndërsa modelimi ka të bëjë me zgjidhjen praktike të problemit duke
përdorur bazën teorike të punës kërkimore. Por vështirësia më madhe, siç përmendet dhe në
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
21
punimin e Bang (2012), është përcaktimi i lidhjes më të mirë që mund të realizohet midis
kërkimit dhe modelimit.
Procesi i kërkimit përfshinë komponentët e mëposhtëm (Beverly, 2016):
1. Përzgjedhja e problemit të përshtatshëm praktik që është i fokusuar në probleme të
botës real.
2. Të kuptuarit qartë dhe plotësisht i fushës/ave të problemit real.
3. Dizenjimi i një apo më shumë zgjidhjeve të mundshme për problemin.
4. Demonstrimi i ekzistencës së mundësisë së zgjidhjes për problemin.
5. Lidhja e rezultateve me teorinë dhe tregimi i kontributit të tyre në praktikë.
6. Shqyrtimi i përgjithësimit të rezultateve.
Në punën e tyre Zimmerman dhe Forlizzi (2008) trajtojnë dy qasje kryesore të kërkimit të
cilat i emërtojnë si filozofike dhe mjedisore të cilat janë të nevojshme të kryhen në rastin e
probleme të cilat përdorin teknika inteligjente. Në qasjen filozofike fillohet duke formuluar
një pyetjeje kërkimore ose hipotezë bazuar në filozofi apo teori ekzistuese dhe pasohet me
hulumtimin e saj nëpërmjet një procesit të krijimit dhe modelimit të artifakteve.
Një qasje mjedisore iniciohet nga probleme të botës reale duke krijuar modele të cilat
sugjerojnë një gjendje specifike dhe të preferuar si synim për rezultatet që duhet të jap
zgjidhja. Por Bang në punimin e saj (Bang, A. L., et al., 2012) evidenton se këto dy qasje në
të shumtën e rasteve ecin së bashku duke u kombinuar midis tyre. Kjo mënyrë e trajtimit të
këtyre dy qasjeve kryesore përdoren për të ndërtuar në punimin tonë artifaktet teorike, mbi të
cilën do të mbështet modelimi i sistemit inteligjent parashikues.
Një çështje që duhet theksuar në lidhje me përdorimin e kësaj metodologjie lidhet me
përcaktimin e elementëve bazë të një pune kërkimore, nga qëllimi dhe objektivat deri tek
ngritja e hipotezave apo pyetjeve kërkimore. Për specifikimin e tyre nuk mund të ndiqet një
proces linear gjenerues. Shpesh në të tilla rastesh pyetjet kërkimore apo hipotezat mund të
gjenerohen nëpërmjet eksperimenteve të mirëfillta pa pasur një qëllim apo strategji të qartë.
Një pjesë e hipotezave të ngritura në këtë disertacion mbështetet në modelin e propozuar të
Bang (Bang, A. L., et al., 2012). Përcaktimi i hipotezave në metodologjinë kërkimore
konstruktive të modelimit është një proces i vazhdueshëm që mbështet qëllimin dhe
objektivat e kërkimit. Zhvillimi i këtij procesi bazohet në rezultatet që sjellin eksperimentet e
kryera si dhe në hipotezat ekzistuese.
Në lidhje me këtë model, një hipotezë takohet në themelimin e një motivimi të qartë më pas
shtrohet një pyetje kërkimore bazike dhe gjenden e përdoren kriteret e vlerësimit në lidhje me
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
22
të. Njohurit e reja të përftuara nga ky model, që përbëjnë dhe elementin më të rëndësishëm,
pasi përmbushin kriteret e vlerësimit ato bëhen pjesë e punës kërkimore.
Siç mund të shihet dhe në figurën e mëposhtme (Figure 2-1. Modeli që tregon se eksperimentet
shërbejnë si drejtues të kërkimit konstruktiv të modelit., në pjesën qendrore të modelit janë
vendosur eksperimentet, të cilat janë mjetet drejtuese të kësaj metodologjie. Eksperimentet,
për elementë përbërës të modelit, realizojnë aprovimin ose jo të tyre duke prodhuar kështu
njohuri në formë e objekteve konkrete si dhe propozime për modelimin. E thënë më qartë
kemi që eksperimentet furnizojnë (apo dhe vetë furnizohen nga) të gjitha nivelet në procesin
e kërkimit.
Figure 2-1. Modeli që tregon se eksperimentet shërbejnë si drejtues të kërkimit konstruktiv të modelit (Bang,
A. L., et al., 2012).
Duke u mbështetur në metodologjinë e zgjedhur për studimin tonë në vazhdim të kapitullit do
të diskutohen se si janë aplikuar çështje të ndryshme specifike për dy fazat kryesore të
metodologjisë: ndërtimin teorikë dhe modelimin e sistemit inteligjent.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
23
2.2 Ndërtimi teorik
Ky disertacion është një punim i orientuar nga modelimi që mbështetet në rezultatet e punës
kërkimore. Trajtime të tilla janë të shpeshtat në fushën e sistemeve të informacionit
(Vahidov, 2012) dhe aq më tepër në disiplinën e Inteligjencës Artificiale. Nëpërmjet këtij
punimi synojmë të ndihmojmë modeluesit në dizenjimin efektive dhe efecient të sistemit
inteligjent parashikues. Zhvillimi i zgjidhjeve inventive realizohet nga kërkime të tipit
konstruktiv. Ku produkti kryesorë i punës kërkimore është artifakti. Një artifakt është njohuri
që duhet të shfaqë një nivel përgjithësimi. Ndërsa funksioni i një artifakti arrihet duke
specifikuar strukturën e përshtatshme për çdo elementë bazë të tij në mënyrë që të
përmbushet sa më mirë detyra e tij. Rrjetat neurale bëjnë pjesë në disiplinën e Inteligjencës
Artificial. Megjithëse numri i punimeve shkencore që trajtojnë përdorimin e tyre në
parashikim është relativisht i madh, shpesh metodologjia e përdorur në këto punime është jo e
plotë, kontradiktore apo dhe minimaliste. Modelimi i një sistemi kërkon që ne të kemi të
specifikuar kërkesat të cilat sistemi duhet të përmbush. Pjesa kërkimore e këtij punimi
fokusohet në nxjerrjen e bazës së njohurive të domosdoshme, në formë e një teorie të re ose
të vlefshme, për specifikimin e kërkesave të sistemit.
2.2.1 Studimi i Literaturës
Pjesa e parë e punës kërkimore fokusohet në studimin e fushave të ndryshme që ndërthuren
në sistem, nëpërmjet literaturës së gjerë. Për të kuptuar më mirë se si duhet të projektohet
rrjeti neural i përshtatshëm për parashikimet e serive kohore, bëhet analizimi dhe studimi i
literaturës së plotë. Ky hap është i rëndësishëm për të krijuar një pamje të qartë në lidhje me
hapat që duhen ndjekur për modelimin e sistemit si dhe të mjeteve apo mekanizmave që
duhet të përdoren në çdo hap. Një studim i dytë i literaturës nëpërmjet një procesi analizues
dhe krahasues, do të bëhet mbi ekzistencën e algoritmeve që mund të mbulojnë pjesë të
ndryshme të procesit.
Gjithashtu për të pasur një pamje më të qartë dhe të plotë janë marrë në shqyrtimin dhe
studimet të cilat bëjnë një analizë empirike të përdorimit të rrjetave neurale si mjete për
modele parashikues. Këto punime kanë ndihmuar për të përcaktuar elementët që ndikojnë në
rezultatin e parashikimi si dhe në përcaktimin e metodave efiçente të ndërthurjes së këtyre
elementëve.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
24
Theksojmë se shqyrtimi i literaturës ka qenë një aktivitet i pandashëm përgjatë punimit të
këtij disertacioni. Rezultatet e këtij procesi kanë shërbyer për të plotësuar njohuritë e fushës
kërkimore duke krijuar një kornizë të plotë të gjendjes aktuale dhe identifikimin e çështjeve
të mundshme kërkimore për të ardhmen. Literatura e përdorur ka qenë bashkëkohore
përfshirë këtu libra, artikuj, referate të konferencave që paraqesin përdorimin e rrjetave
neurale dhe shpjegojnë aplikimin e tyre për çështjen e realizimit të modeleve parashikuese.
Produkti i studimit të literaturës dhe analiza kualitative teorike e bërë mbi to kanë shërbyer si
themele bazë për analizën e prototipave dhe modelimin e SIP. Ky produkt është organizuar
në kapitujt teorik të cilët trajtojnë rrjetat neurale artificiale si dhe RNA-l për parashikimin e
serive kohore.
2.2.2 Analizë empirike e prototipave
Në një kërkim konstruktiv të modelimit ndërtohen prototipa, produkte dhe modele për të
demonstruar dhe vlerësuar kuptueshmërinë e një situate të veçantë, për të siguruar një skemë
konkrete të problemit si dhe një përshkrim të gjendjes së dëshiruar. Kjo mënyrë është
adoptuar dhe në këtë punim ku janë realizuar prototipa të pjesshme të sistemit për të kuptuar
më mirë elementët ndikuese në eficiencën dhe efektivitetin e rrjetave neurale. Në figurën
(Figure 2-2:Një qasje metodologjike për ndërtimin e një Artifakti për Sistemin Inteligjent
Parashikues :) paraqitet në mënyrë skematike gjenerimi i njohurive që shërbejnë si bazë për
specifikimin e kërkesave të sistemit inteligjent.
Figure 2-2:Një qasje metodologjike për ndërtimin e një Artifakti për Sistemin Inteligjent Parashikues
(Përshtatur nga: Nunamaker, W., Chen, M., dhe Purdin, T., 1991, f. përshtatur) :)
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
25
Procesi i ndërtimi të çdo artifakti, për këtë disertacion, ndjek në mënyrë më të detajuar fazat e
përcaktuar nga Zimmerrman et al (Zimmerman, J., & Forlizzi, J., 2008):
- Përcaktimi: përzgjedhja e qëllimit dhe motivacionit
- Zbulimi: ndërtimi i një plani për nxjerrjen dhe mbledhjen e të dhënave.
- Sintetizimi: sintetizohen të dhënat, krijohet një model që identifikon faktorët ndikues,
krijohen modele konceptuale.
- Gjenerimi: përshkruhen dhe krijohen prototipa që vlerësojnë dhe demonstrojnë
arritjen e qëllimit.
- Përmirësimi dhe Reflektimi: prototipat përmirësohen në përputhje me qëllimin që
duhet të arrihet duke ndihmuar në nxjerrjen e detajeve për procesin e modelimit.
Nëpërmjet kësaj qasjeje kërkimore të zgjedhur formuam bazë për projektimin e të dhënave,
formës parapërgatitore të tyre, gjenerimit të strukturave të rrjetit neural më të mirë për
parashikim, zgjedhjes së kritereve të vlerësimit për performancën e rrjetit neural dhe
përzgjedhjes së algoritmeve të trajnimit.
2.3 Modelimi i Sistemit Inteligjent
Qëllimi kryesorë i këtij studimi është dizenjimi i sistemit inteligjent për parashikimin e serive
kohore. Në këtë kuptim, fokusi kryesorë janë analiza dhe modelimi artifakteve të gjeneruara
përgjatë ndërtimit të teorisë. Modelimi i artifakteve është një lloj shkence, e cila për t‟u
konkretizuar duhet të përfshijë disa vendime dizenjimi në mënyrë që të përshtaten në një
kontekst specifik. Ky aktivitet nënkupton transformimin e informacionit nga kërkesa në
specifikimin e një zgjidhjeje teknike.
Metodologjia e zgjedhur për këtë punim, sugjeron që kërkimi konstruktiv të niset nga kuptimi
i qartë i fushës së aplikimit. Kjo gjë arrihet nëpërmjet njohurive të shpërndara dhe përdorimit
të artifakteve të njohura. Mbi bazën e ofruar nga ndërtimi teorikë, në këtë pjesë të punimit,
përcaktohet se cili është cikli jetësorë më i mirë për inxhinierimin softuerikë të SIP.
Prototipat e krijuar shpërbejnë për të ilustruar me shembuj hipotezat nga secila fushë dhe për
të shtuar fakte dhe parime nga eksperienca reale (Koskinen I., Zimmerman J. et al, 2011).
Edhe në këtë fazë puna kërkimore është një faktorë mbështetës në konstruktimin e
artifakteve. Duke qenë se nuk ekzistojnë rregulla të qarta se si duhet kryer kjo fazë është e
nevojshme konsultimi me literaturën, për të adresuar në mënyrë të përshtatshme këtë
problem. Mbështetur në aktivitetet e ciklit jetësorë të zgjedhur, specifikohen kërkesat e
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
26
sistemit. Për të lehtësuar proceset e implementimit dhe mirëmbajtjes është realizuar një
analizë për modularizimin e sistemit SIP.
Elementë të rëndësishëm gjatë modelimit janë përcaktimi i transformimit të përshtatshëm të
dhënave si pjese e integruar e sistemit SIP, kriteret për vlerësimin e performancës së sistemit,
aftësia e sistemit që të përmirësoj gjendjen e tij si dhe përzgjedhja e algoritmit të trajnimit më
të mirë nga vetë sistemi automatikisht.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
27
Kapitulli 3
3 RRJETAT NEURALE ARTIFICIALE
3.1 Rrjetat neural biologjike kundrejt artificiale
Rrjetat neurale artificiale, të konsideruar si një degë e Inteligjencës Artificiale, në thelb është
një program kompjuterik i modeluar dhe i projektuar për të mësuar në mënyrë të ngjashme
me trurin e njeriut. Camillo Golgi (1843-1926) në 1873 zhvilloi një teknikë ngjyrosjeje, e cila
lejonte vëzhgimin individual të neuroneve në tru. Kjo teknikë, më pas u përdorë nga Santiago
Ramon y Cajal (1852- 1934) në studimet e tyre kërkimore për të nxjerrë strukturën e
neuroneve në tru (Russell S. J. dhe Norvig P, 2009).
Shumë studime bëhen për të kuptuar se si funksionon procesi i njohjes në trurin e njeriut.
Nisur nga pikëpamja biologjike neuronet janë njësi strukturore dhe funksionale të cilat janë të
specializuara për t‟iu përgjigjur ngacmimeve, për të përçuar impulset dhe për të çliruar
neurotejçues kimikë specifikë. Aksonet të cilat gjenden në dalje të qelizave mbartin sinjale
elektrike. Këto sinjale transmetohen nëpërmjet sinapseve, që ndodhen në fund të aksonit, tek
dentritet e një neuroni tjetër me të cilin këto janë lidhur.
Figure 3-1:Neuroni Biologjik (AnkushKhere dhe MayurPatankar, 2012)
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
28
Efektiviteti i sinapsit mund të rregullohet nëpërmjet sinjaleve që kalojnë në të. Kjo lejon që
sinapset të mund të mësojnë nga aktivitetet në të cilat ato marrin pjesë (AnkushKhere dhe
MayurPatankar, 2012).
Një konkluzion me të vërtetë i mahnitshëm është se një bashkësi me qeliza të thjeshta mund
të çojë në mendime, veprime si dhe ndërgjegjësim, që e thënë me fjalët e John Searle truri
shkakton inteligjencë (Russell S. J. dhe Norvig P, 2009).
Duhet të theksojmë se pavarësisht analizave të ndryshme dhe të shumta të kryera, rrjetat
neurale i përkasin rrjetave neurale artificiale dhe jo atyre biologjike. Megjithëse rrjetat
neurale janë një abstraksion i atyre biologjikë, thelbi i rrjetave neurale artificiale (ANN-ve)
nuk është të kopjojë veprimin e sistemit biologjikë, por të shfrytëzoj funksionalitete të
njohura, që përdoren nga rrjeti neural biologjikë për të zgjidhur problemet komplekse
(Basheer I.A. dhe Hajmeer M,, 2000). Sistemi biologjik i neuroneve dhe rrjetat neurale
artificiale përafrohen në dy pika: Së pari, ato fitojnë njohuri nëpërmjet rrjetit, me anë të një
procesi të mësuari dhe së dyti, përdorin lidhje të forta ndërmjet neuroneve për të ruajtur
njohuritë e fituara (Indranarain, 2010).
Ndër përkufizimet që e plotësojnë më mirë atë se çfarë është një RNA-l mund të përmendim:
„... një rrjet neural është një sistem i përbërë nga disa elementë përpunues të cilët veprojnë
në paralel, funksioni i të cilit përcaktohet nga struktura e rrjetit, fortësia e lidhjeve si dhe nga
përpunimi që kryhet nga çdo element përpunues ose nyje...‟
Në „DARPA Neural Network Study‟, (1988) AFCEA International Press, p. 629
Një tjetër përkufizim dhënë nga Maureen Caudill në „Neural Network Primer: Part I‟ (1989)
është:
„... një sistem llogaritës i përbërë nga një numër i madh elementësh përpunues të ndërlidhur
midis tyre, të cilët përpunojnë informacione nëpërmjet gjendjes së tyre dinamike për t‟iu
përgjigjur të dhënave të jashtme.‟
Rrjetat neurale artificiale janë mjete modelimi llogaritëse, të cilat së fundmi janë pranuar dhe
përdorur gjerësisht për projektimin e problemeve komplekse të botës reale në disiplina të
ndryshme. Vlen të theksojmë se, megjithëse rrjetat neurale përdoren për ti dhënë zgjidhje
problemave të ndryshme, ato dallojnë nga programet kompjuterike tradicionale që ne jemi
njohur.
Një program, në kuptimin e mirëfilltë, ka në bazë një algoritëm i cili zgjidh një problem të
caktuar duke përdorur një varg me instruksione të renditura. Në këtë rast, problemi që
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
29
zgjidhet është i kuptueshëm, dihen të dhënat si dhe vargu i hapave të përpunimit të këtyre të
dhënave për të arritur rezultatin/et. Nëse nuk do i kishim të gjitha hapat atëherë algoritmi nuk
do të jepte zgjidhje. Gjithashtu, pavarësisht se sa herë ekzekutohet një program, për të dhëna
të njëjta rezultati do të ngelej i njëjtë.
Shpesh jemi të interesuar të kemi zgjidhje kompjuterike për problema të cilat nuk dimë se si
ti zgjidhim. Karakteristikë tjetër për programet tradicionale është se nëse ato nuk
funksionojnë në mënyrë korrekte apo dështojnë, atëherë kjo ndodh nga ndonjë problem në
softuerë ose në harduerë.
Rrjetat neurale artificiale, kanë marrë nga ato biologjike, aftësinë për të mësuar nga
„eksperienca‟. Rrjetit neural i vendosen në dispozicion disa shembuj dhe mbi bazën e të
dhënave në to, ai trajnohet në mënyrë që të nxjerr një formë të përgjithësuar për zgjidhjen e
problemit. Në këtë përqasje, rol të rëndësishëm dhe kryesorë zë përzgjedhja e shembujve të
duhur për të bërë trajnimin e rrjetit.
Rrjetat nuk ndjekin një rrugë lineare me instruksione për zgjidhjen e problemit por
përpunojnë një bashkësi informacioni në paralel dhe kjo nëpërmjet njësive elementare
përpunuese.
Pavarësisht këtyre ndryshimeve nuk duhet menduar se këto dy përqasje të zgjidhjes së
problemit janë në konkurrencë me njëra-tjetrën përkundrazi, ato plotësojnë njëra-tjetrën.
Shpesh problema me kompleksitet të lartë dekompozohen në nën/problema më të thjeshta.
Disa nga nën/problemat mund të zgjidhen me anë të rrjetave neurale. Disa tipare dhe aftësi që
i bëjnë RNA-le të rëndësishme në zgjidhjen e shumë detyrave janë:
- Aftësia për të mësuar pa pasur asnjë informacion fillestar mbi shembujt (që janë në
formën e të dhënave hyrëse-dalëse) që do të përdorë për tu trajnuar.
- I adaptueshëm, kjo ndodh pasi rrjeti ndryshon strukturën e tij të brendshme ndërkohë
që informacioni kalon në të.
- Jo-lineariteti, është një nga veçoritë kryesore sidomos kur shpërndarja e të dhënave ka
natyrë të tillë.
- Vlerësim të përgjigjes, kjo është një aftësi e cila në rastet kur rrjeti përdoret për të
kryer klasifikime mbi bazë të disa ndarjeve, atëherë ai është në gjendje të përcaktoj
dhe se me çfarë sigurie një mostër i përket një grupit të caktuar.
Pyetjes se pse duhet të përzgjidhen rrjetat neurale, autorët (Jain A. K., Mao J., Mohiuddin K.
M., 1996) në punimin e tyre kanë shtuar se vlerë e shtuar për rrjetat neurale kundrejt
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
30
sistemeve të von Neuman është se kanë karakteristikë : paralelizim masivë, përllogaritje dhe
paraqitje të shpërndarë, procesim të informacionit në një kontekst të trashëguar, tolerancë
gabimi si dhe konsumim energjie të ulët.
RNA-e kanë gjetur përdorim në një sërë aplikacionesh të ndryshme, për zgjidhje e
problemave klasifikim/njohje të mostrave, klasterizimi, përafrime funksionale, diagnostikime
mjekësore dhe shumë të tjera.
3.2 Struktura e rrjetit neural
Rrjeti neural është një model matematikë ose llogaritës që tenton të imitojë aspektet
strukturore dhe funksionale të rrjetit neural biologjik (Kaastra, I. dhe Boyd, M, 1996). Një
rrjet neural përbëhet nga një grup neuronesh artificiale të ndërlidhura me njëra-tjetrën. RN
është një sistem i adaptueshëm, i cili ndryshon strukturën e tij mbi bazë e informacioneve të
brendshme ose të jashtme që kalon në rrjet gjatë fazës së të mësuarit. Struktura e RNA-l është
një abstragim dhe implementim i ndërlidhjeve neurale në tru.
3.2.1 Perceptroni
Arkitektura më e thjeshtë e RN njihet si perceptron, nyja njësi përpunuese etj. Kjo njësi
përpunuese është një abstragim i neuronit biologjik, elementi bazë i sistemit nervor. Një
përkufizim i qartë për këtë abstragim jepet nga dy autorët Chang dhe Huang të cilët e
përshkruajnë:
„...Elementi i përpunueshëm (nyja) është i ngjashëm me neuronin, funksioni
transferues luan rolin e dendtrit dhe aksonit, ndërsa peshat e lidhjes midis nyjeve janë
analogji e fortësisë sinaptike në lidhjet e neuroneve (ChangI. Ch., Hwang H. G., 1998)‟.
Një model llogaritës (Figure 3-2) për të ilustruar mënyrën e përpunimit të informacionit nga
një neuron artificial është propozuar nga McCulloch dhe Pitts (McCulloch W. S., Pitts W.,
1943).
Perceptroni ka si pjesë të tij dy tipa nyjesh: nyjet hyrëse dhe ato dalëse (në Figure 3-2 ka
vetëm një nyje dalëse). Nyjet hyrëse (xj, j=1,2,...,m) janë vlerat që shërbejnë si informacion
hyrës që duhet të përpunohen nga vetë neuroni. Nyjet dalëse, y në figurë, përbëjnë dhe
rezultatin e modelit.
31
Figure 3-2: Paraqitja e përgjithshme e punës së neuronit (Modeli McCulloch -Pitts)
Në strukturën e paraqitur, të neuronit artificial, evidentohet lehtë që për çdo nyje hyrëse
vendoset një peshë e lidhjes (wj, j=1,2,...,m). Mbështetur në natyrën e tyre biologjike, peshat
lidhëse të vendosura, imitojnë fortësinë lidhëse sinaptike midis neuroneve, që në këtë rast
tregon fortësinë e lidhjes së nyjeve hyrëse me ato dalëse. Trajnimi i perceptronit nënkupton
përcaktimin e peshave në mënyrë të tillë që modeli të përshkruaj sa më saktë lidhjet që
ekzistojnë midis të dhënave hyrëse dhe atyre dalëse.
Neuroni llogarit shumën e peshave për m sinjalet hyrëse xj, j=1,2,...,m së bashku me
prodhimin e bias (b) me peshën respektive të saj për të përcaktuar kështu vlerë funksionit të
transferimit:
ku ∑
(3.1)
b- (bias) është një vlerë hyrëse me vlerë 1 ose 0, e pavarur nga nyjet e tjera hyrëse. Bias-i
shërben për të bërë zhvendosjen e kufijve të vendimmarrjes nga origjina.
Në modelin e propozuar nga McCulloch dhe Pitts (McCulloch W. S., Pitts W., 1943) në
strukturën e neuronit nuk përdoret bias por përdoret një element i njohur me termin threshold
apo prag. Në këtë rast vlera e kthyer nga funksioni i transformimit krahasohet me atë të
pragut dhe bazuar në këtë krahasim përcaktohet dhe vlera dalëse e neuronit.
Neuroni i propozuar nga McCulloch dhe Pitts mund të marr vetëm dy vlera prandaj dhe në
literaturë njihet si një neuron me prag binarë. Në rast se vlerat e funksionit të transformimit
janë më të mëdha ose të barabarta me pragun atëherë thuhet se të dhënat shkaktojnë zjarr, në
analogji me natyrën biologjike apo argumenti është i vlefshëm, dhe në këtë rast vlera dalëse
është 1. Në të kundërt, argumenti quhet negative dhe vlera dalëse është 0.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
32
Për të lehtësuar veprimet bëhet zëvendësimi i pragut nga një peshë e shtuar që njihet pesha e
bias-it. Vlerat e tij është:
(3.2)
Në këtë mënyrë përcaktimi nëse një funksion është argument pozitivë apo negativë lidhet
direkt me shenjën që do ketë funksioni i transformimit, respektivisht pozitivë apo negativë.
Peshat me vlerë pozitive përkojnë me sinapse ngacmuese ndërsa peshat me vlerë negative me
sinapset penguese. McCulloch dhe Pitts (McCulloch W. S., Pitts W., 1943) kanë provuar se:
„ përzgjedhja e peshave në mënyrë të përshtatshme realizon sinkronizimin e punës së
neuroneve për të kryer llogaritje universale‟.
Ndërsa vlera dalëse e perceptronit përcaktohet nga rezultati që merret nga funksioni i
aktivizimit:
ku ( ) (3.3)
ku: - funksioni i aktivizimit.
Në analogji me neuronet biologjike funksioni i aktivizimit lidhet me shkallën e fuqisë së
veprimit në qelizë. Një neuron mund të përdoret për të implementuar një klasifikues binar.
Funksioni më i thjeshtë i aktivizimit është ai binarë si në rastin e shpjeguar më sipër
(McCulloch W. S., Pitts W., 1943).
3.2.2 Funksionet e aktivizimit
Siç u theksua, rezultati në portën dalëse të një neuroni është shuma e ponderuar e nyjeve
hyrëse. Modeli i McCulloch dhe Pitts është aplikuar në disa mënyra. Një nga modifikimet e
aplikuar mbi të është që në vend të një funksioni prag të përdoret një funksion aktivizimi.
Një funksion aktivizimi përdoret për të ndryshuar nivelin e aktivizimit të një neuroni në një
sinjal dalës. Ky funksion ka një efekt “shformues” të sinjalit që përcillet nga funksioni i
transferimit dhe luan rolin e një filtri jo-linear. Përzgjedhja e funksionit të aktivizimit
përcakton dhe mënyrën se si duhet të sillet neuroni , në një rrjet neural artificial.
Numri i funksioneve të aktivizimit të përdorura është shumë i madh. Duke qenë se ato
kategorizohen në bazë të problemit që duhet të zgjidhjet nga neuroni, disa prej tyre janë
përcaktuar si funksione të paravendosura për një tip problemash të caktuara, të tjera janë lënë
në përzgjedhje të modeluesit. Në tabelën e mëposhtëm (Tabela 3-1) jepen të detajuara
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
33
emërtimet, funksionet përkatëse të aktivizimit si dhe intervalet në të cilën shtrihen vlerat e
funksionit.
Tabela 3-1: Funksionet e Aktivizimit për Neuronin1
Emërtimi Përcaktimi Intervali i Vlerave
Identitet ( )
Logjistik
(0, 1)
Hiperbolik
(-1, 1)
Eksponencial (0, )
Softmax
∑ (0, 1)
Unit Sum
∑ (0, 1)
Rrënja Katrore √ ( 0, )
Sinuse [0, 1]
Segment Devijues {
[-1,1]
Linearitet i pjesshëm {
[0, 1]
Hap Njësi (threshold) {
[0, 1]
Disa nga funksionet e aktivizimit që përdoren më gjerë janë Hap Njësi (threshold), Sigmoid,
Gaussian, linearitete të pjesshme (piecewised linear PWL), format e tyre grafike janë
paraqitur në vazhdimësi (në Tabela 3-2):
1 Shënim: me x është shenuar vlera e kthyer nga funksioni i transferimit të neuronit.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
34
Tabela 3-2: Funksionet e aktivizimit, a) Threshold, b)Linearitet i pjesshëm, c)Sigmoid, d)Gaussian
a)
b)
c)
d)
Hap Njësi (threshold), përdoren për të modeluar rrjeta të thjeshtë siç janë perceptronet.
Përdoren kur kërkohet të bëhet një klasifikim binarë. E thënë më thjeshtë kur duam të bëjmë
klasifikimin e një grupi të dhënash hyrëse në një nga dy grupet e mundshme. Ky funksion
aktivizimi është i përdorur gjerësisht në zgjidhjen e problemave të klasifikimit dhe
grumbullimit (Clustering). Format e këtij funksioni mund të jenë të tipit binarë ose të tipit
bipolar.
a) threshold binarë (figura 4.a) llogarit vlerën dalëse të neuronit në bazë të
ekuacionit: {
(3.4)
b) threshold bipolar ekuacioni i llogaritjes së vlerës dalëse realizohet si mëposhtë:
{
(3.5)
Linearitete të pjesshme (Tabela 3-2.b), rezultati në dalje të neuronit është në proporcion me
peshën totale të funksionit të transferimit. Funksioni i aktivizimit në këtë rast shprehet me anë
të formulës:
(3.6)
𝑦 { 𝑛𝑞𝑠 𝑥 𝑛𝑞𝑠 𝑥
𝑦 {
𝑥 𝑥𝑚𝑖𝑛
𝑚𝑥 𝑏 𝑥𝑚𝑎𝑥 𝑥 𝑥𝑚𝑖𝑛
𝑥 𝑥𝑚𝑎𝑥
𝑦
𝑒 𝛽𝑥 𝑦
√2𝜋𝜎𝑒−(𝑥−𝜇)2
2𝜎2
𝑦 {
𝑥 𝑥𝑚𝑖𝑛
𝑚𝑥 𝑏 𝑥𝑚𝑎𝑥 𝑥 𝑥𝑚𝑖𝑛
𝑥 𝑥𝑚𝑎𝑥
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
35
Nëpërmjet këtij funksioni mund të përafrohen funksione logjistike jo-lineare në një formë
lineare. Përzgjedhja e vlerave në të dy skajet e pjesës lineare, të poshtëm dhe të sipërm,
përcaktohen nga modeluesit e rrjetit.
Sigmoid (Tabela 3-1. c), paraqitja grafike e këtij funksioni është në form „S-je‟, ndërsa
matematikisht kemi që është i derivueshëm dhe rrigorozisht rritës. Ekuacionin i përgjithshëm
për këtë funksion aktivizimi është:
(3.7)
Si informacion hyrës ky funksion merr vlera reale dhe i „ngjesh‟ ato në segmentin [0,1].
Parametri β njihet si parametri përcaktues i pjerrësisë, vlerat e ndryshime që ajo merr tregojnë
dhe pjerrësinë e grafikut. Karakteristik për këtë funksion është se ka vlera reale, është i
derivueshëm, ka vetëm një minimum lokal dhe një maksimum lokal. Nëse vlerat absolute të
x-it janë të vogla atëherë funksioni i aktivizimit paraqet një sjellje lineare. Në rastet kur vlerat
janë të mëdha atëherë tentojnë të shkojnë drejt vlerës 0 ose 1. Shpesh përdorimi i tyre në
rrjetat neurale bëhet në rastet kur duhet të përfshihet jo-linearitet në model.
Funksioni Gaussian (Tabela 3-1.d), me formën grafike si të një kambane. Shprehet me anë të
ekuacionit:
(3.8)
Në këtë rast merret një parametër që përdoret si vlerë qendrore (mesatarja) e funksionit dhe
njihet si vlera e dëshiruar. Më pas rezultati i funksionit për çdo vlerë reale përcakton
distancën nga vlera qendrore. Nëse kjo distancë është shumë e madhe atëherë funksioni
Gaussian kthen 0 që tregon se me rritjen e distancë zvogëlohet dhe influenca. Karakteristikë
për këtë funksion është se ai është i derivueshëm, jo- monoton dhe ngjeshës.
Funksioni që përdoret më shpesh në rrjetat neurale është sigmoid (Vika B., Martiri E. &
Xhaja D., 2011) pasi ofron një rritje në mënyrë rigoroze, të zbutur dhe me vetitë asimptotike
të dëshiruara.
Sinjali që merr një nyje mund të jetë informacioni që nyje të tjera ia dërgojnë ose stimulime
të jashtme. Çdo nyje merr një sinjal hyrës e përpunon atë nëpërmjet një funksioni aktivizimi
ose transferimi dhe prodhon një sinjal të përpunuar në dalje për t‟ia kaluar nyjeve të tjera ose
për të nxjerr një rezultat të jashtëm. Ekzistojnë struktura të ndryshme të rrjetave neurale
artificiale me një shtresë, me shumë shtresa, përsëritëse dhe vetë-organizuese.
𝑦
𝑒 𝛽𝑥
𝑦
√2𝜋𝜎𝑒−(𝑥−𝜇)2
2𝜎2
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
36
3.2.3 Topologjitë e rrjetit neural
Më sipër u trajtuan veçoritë dhe elementët kryesorë të njësisë përpunuese bazë të një rrjeti
neural artificial. Një perceptron i vetëm do të ishte i aftë të trajtonte problemet e ndarjeve
lineare. Bazuar në analogjinë me sistemin biologjik, një rrjet neural artificial përbëhet nga
disa neurone artificiale të cilat janë të lidhura në mënyrë të tillë që të lehtësojnë përpunimin e
shpërndarë.
„..Një topologji e rrjetit neural artificial paraqet mënyrën në të cilën neuronet lidhen për të
formuar një rrjet. ..‟ (Fiesler, 1996)
Topologjia që i përcaktohet një rrjeti neural artificial luan një rol të rëndësishëm në
funksionalitetet dhe performancën që do të ketë rrjeti neural artificial (Vika B., Martiri E. &
Xhaja D., 2011). Struktura e rrjetit neural artificial mund të paraqitet nëpërmjet një grafi me
lidhje të orientuara dhe të ponderuara në të cilën nyjet janë neurone artificiale. Lidhjet e
orientuar të shoqëruara me pesha tregojnë lidhjet e mundshme ndërmjet shtresave dhe
neuroneve që ndodhën në secilën shtresë. Lidhjet midis nyjeve vendosen në rastet kur ka
transferim informacion midis tyre. Klasifikimet e përgjithshme për topologjitë e RNA-le
bëhen bazuar në tre elemente kryesore:
a. Numri i shtresave të përdorura
b. Numri i nyjeve në çdo shtresë
c. Lidhjet ndërmjet nyjeve dhe shtresave.
Figure 3-3: Struktura të ndryshme të rrjetit neural artificial
A) B)
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
37
C)
Nisur nga elementi i parë që lidhet me numrin e shtresave të përdorura kemi ndarje të rrjetave
me një-shtresë dhe ato me shumë-shtresa. Në një shtresë grumbullohen neuronet në bazë të
rolit që ato duhet të kenë në përpunimin e të dhënave.
Rrjetat me një-shtresë (Figure 3-3/A) përbëhen vetëm nga shtresa hyrëse dhe shtresa dalëse.
Neuronet në shtresën hyrëse të rrjetit (neuronet hyrëse) shërbejnë vetëm për të përçuar dhe
shpërndarë sinjalin hyrës por nuk realizojnë asnjë llogaritje apo transformim. Shtresa dalëse
është ajo e cila mban neuronet artificiale (neuronet dalëse) të cilat marrin sinjalin hyrës
nëpërmjet lidhjeve të ponderuara (me pesha) të neuroneve hyrëse dhe bazuar në të
përllogarisin vlerat dalëse në këtë shtresë.
Në rastin kur ekzistojnë të gjitha lidhjet midis neuroneve hyrëse dhe atyre dalëse themi që
rrjeti është plotësisht i lidhur. Në rast të kundërt kemi mungesë të lidhjeve ose kemi lidhje me
peshë zero.
Rrjetat artificiale shumë-shtresore (Multi Layer Perceptron) përveç shtresës hyrëse dhe
dalëse përfshijnë në topologji dhe një apo shumë shtresa të ndërmjetme të cilat quhen shtresa
të fshehta, ndërsa nyjet që ndodhen në këto shtresa njihen si neurone të fshehta (Vika B.,
Martiri E. & Xhaja D., 2011). Të gjitha neuronet që ndodhen në rrjet janë të shpërndara
ndërmjet shtresës hyrëse, shtresës dalëse si dhe shtresave të fshehura. Lidhjet janë një-
drejtimore dhe vendosen midis neuroneve që ndodhen në shtresa të ndryshme. Edhe në këtë
topologji nyjet e shtresës hyrëse janë pasive që do të thotë që ato nuk e transformojnë të
dhënën. Nyje aktive janë nyjet që ndodhen në shtresat e fshehura dhe në shtresën dalëse.
Shtresat e fshehta përdoren për të rritur aftësitë shprehëse të rrjetit. Është e kuptueshme që një
rrjet i cili nuk përdorë shtresë/a të fshehtë është më i kufizuar në modelet që mund të
paraqesë.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
38
„Njësitë e fshehta realisht duhet të emërtohen „detektorët e tipareve të mësuara‟ ose
„njësitë e ri-paraqitjes‟ kjo sepse modeli i aktivitetit në shtresën e fshehur është një
kodim i asaj se çfarë rrjeti mendon që janë tiparet domethënëse në të dhënat hyrëse.‟
(Touretzky D. S. & Pomerleau D. A. , 1989)
Disa aftësi shtesë të rrjetit që arrihen nga përdorimi i shtresave të fshehta në strukturën e tyre
listohen në vazhdim:
Janë të domosdoshme për të kapur varësitë jo lineare midis të dhënave që i paraqiten
rrjetit.
Kanë aftësi për të mësuar nga të dhënat që i paraqiten rrjetit.
Kanë aftësi ruajtëse të informacioneve që përmbahen në të dhënat hyrëse të rrjetit
Kriteri i tretë i përdorur për klasifikimin e rrjetave neurale bazohet në mënyrën se si
realizohen lidhjet ndërmjet nyjeve që ndodhen në shtresa të ndryshme. Format e ndryshme të
lidhjeve bëjnë që rrjeti neural të shfaq sjellje të ndryshme. Prezenca ose jo e lidhjeve me efekt
prapaveprues (feedback) në rrjet bëjnë që të kemi dy kategori kryesore në të cilat ndahen
arkitekturat e një rrjeti (Jain A. K., Mao J., Mohiuddin K. M., 1996):
Rrjetat feed –forward (FD): Në këtë arkitekturë (Figure 3-3/C) grafet nuk përmbajnë
lidhje të cilat kthejnë informacion mbrapa në shtresat furnizuese. Rrjedhja e informacionit, e
cila tregohet nga lidhjet që vendosen në këtë lloj strukture, bëhet nga shtresa hyrëse drejt
shtresës dalëse. Rrjeti FD është një rrjet statik i cili prodhon një bashkësi me vlera dalëse.
Ky rrjet nuk përdorë memorie që do të thotë se vlerat dalëse që ofrohen mbi bazën e
informacionit hyrës nuk varen nga gjendjet e mëparshme të rrjetit. Kjo topologji është më e
përdorura në shumë aplikacione praktike.
Rrjetat rekurente kanë në strukturën e tyre cikle (Figure 3-3/B), të cilat krijohen nga
lidhjet që mundësojnë kthim të informacionit mbrapa. Rrjeti me këtë lloj topologji është një
sistem dinamik në të cilën gjendja e tij është në ndryshim të vazhdueshëm deri në momenti
kur arrihet një gjendje ekuilibri për të. Në rastet kur përdoret një model i ri hyrës, llogariten
neuronet dalëse. Prezenca apo ekzistenca e lidhjeve ciklike bënë që informacioni hyrës i çdo
neuroni të modifikohet dhe si rezultat rrjeti kalon në një gjendje të re. Këto cikle të
kthyeshme bëjnë që rrjetat rekurente të kenë çfarëdolloj strukture, pasi mund të lejohen
lidhjet midis çdo dy nyje si dhe lidhje të një nyje me vetveten. Kthimi i informacionit
mundëson aftësi mësuese të ndryshme duke i bërë të mundur që RR të ketë një „memorie‟
në të cilën ruan informacion mbi llogaritjet e kryera në hapat e mëparshme.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
39
3.2.4 Procesi i të mësuarit për RNA
Për një rrjet neural një ndër tiparet më impresionuese për të cilën evidentohet nga shumë
teknika të tjera është aftësia e tij për të evoluar „dijet‟ e tij. Rrjeti mëson mbi bazë të
eksperiencës së tij dhe kushteve në të cilat vendoset. Eksperienca ka të bëjë me sasinë e
shembujve që i jepen atij për të mësuar, ndërsa kushtet lidhen me cilësinë e shembujve që ai
përdorë.
RN është i aftë të nxjerr njohuri nga shembujt që përpunon nëpërmjet një procesi të mësuari.
Të mësuarit nënkupton që një njësi e përpunimit është e aftë të ndryshoj sjelljen e tij hyrëse-
dalëse si rezultat i ndryshimit të mjedisit. Duke e lidhur më shumë me strukturën që ka rrjeti,
theksojmë që mësimi ka të bëjë me ndryshimin në mënyrë të përsëritur të peshave për të
ofruar një rezultat të saktë në dalje të rrjetit neural.
Procesi i të mësuarit klasifikohet në tre paradigma kryesore:
Mënyra e Mbikëqyrur (Supervised mode) e cila përfshin një „mësues‟ të jashtëm, në të
cilën çdo nyje dalëse pajiset me përgjigjet e dëshiruar në mënyrë që të vlerësohen sinjalet
hyrëse. Përgjatë procesit të trajnimit, për të gjitha vlerat hyrëse që i jepen rrjetit neural janë
të njohura dhe vlera reale të daljes. Duke pasur njëkohësisht të dhënat hyrëse dhe ato dalës
llogaritet gabimi mbi vlerën e daljes të nxjerr nga rrjeti dhe vlerës reale. Rregullimi i
peshave të rrjetit duhet të realizohet bazuar mbi gabimin e llogaritur në mënyrë që të ofrohet
një rezultat në dalje sa më afër me vlerave reale. Një nga algoritmet që zbatohet më shpesh
për këtë kategori është propagandim mbrapa (back-propagation).
Mënyra e Pambikëqyrur (Unsupervised mode) nuk përdor asnjë „mësues‟ të jashtëm
dhe bazohet vetëm në informacionin lokal. Kjo mënyrë konsiderohet si vetë-organizuese, që
nënkupton se i vetë organizon të dhënat që janë në rrjet dhe zbulon vetitë emergjente të
përbashkëta të tyre. Realizohen eksplorime për të evidentuar lidhje strukturore në të dhënat
hyrëse si dhe korrelacione midis të dhënave. Më pas bëhet dhe kategorizimi i të dhënave
mbështetur mbi këto korrelacione. Kjo paradigmë përdoret shpesh në gërmimin e të
dhënave (Data Mining) pasi kanë aftësi të parashikojnë preferencat e një subjekti bazuar në
subjekte të tjera të ngjashëm me të.
Mënyra e Përforcuar (Reinforcement learning) në të cilën bëhet një kombinim i dy
mënyrave të përshkruara më sipër. Në këtë teknikë një pjesë e peshave të rrjetit neural
përcaktohen duke përdorur mënyrën e mbikëqyrur ndërsa pjesa tjetër përcaktohet nëpërmjet
mësimit të pambikëqyrur. Në këtë rast rrjeti mëson nga pasojat që sjell rezultati i tij, pasi
atij nuk i jepet asnjë gjë në mënyrë eksplicite si dhe nga aftësitë e tij eksploruese për të
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
40
nxjerrë lidhje nëse ekzistojnë midis të dhënave që ka përdorur. Pasojat e rrjetit shprehen mbi
bazën e një „shpërblimi‟ numerik që nënkupton dhe suksesin e arritur në një moment për
rrjetin.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
41
Kapitulli 4
4 PARASHIKIMI NËPËRMJET RRJETAVE NEURALE
4.1 Hyrje
Aftësia për të njohur dhe parashikuar të ardhmen ka qenë gjithmonë tërheqëse për njerëzit,
gjatë gjithë ekzistencës së tyre. Përdorimi i serive kohore për të realizuar parashikime është
një fushë me interesa në rritje, në të cilën janë përqendruar kërkime të shumta. Parashikimi
dhe analiza e serive kohore janë shumë të rëndësishme në fushat inxhinierike, shkencore dhe
ekonomike. Propozime të shumta janë bërë në lidhje me metodologjitë që duhen përdorur për
të kryer parashikime.
Metodologjitë parashikuese nënkuptohen shpesh si një koleksion metodash dhe mjetesh për
mbledhjen e të dhënave të serive kohore të cilat do të përdoren për të parashikuar vlerat e
ardhshme të këtyre serive mbi bazën e vlerave të së shkuarës (Palit A. K. dhe Popovic D.,
2005). Parashikimet luajnë një rol thelbësore për marrjen e vendimeve. Vendimmarrjet, të
cilat bëhen mbi bazën e parashikimeve, mund të jenë që nga ato operacionale ditore deri në
vendime strategjike afatgjate organizative apo ekonomike (Zhang G. P., 2004). Gjithashtu
parashikimet afatgjate shihen nga industri të ndryshme si mjete për të përmirësuar dhe arritur
efikasitetin e veprimtarisë si dhe të kontrollit të perfomancës
Realizimi i parashikimeve efektive në makroekonomi është një punë shumë e vështirë, kjo si
pasojë e mungesës së një modeli ekonomik të saktë dhe bindës (Moody J., 1995). Në teorinë
makroekonomike, modelimi realizohet mbi supozime kufizuese të cilat janë në varësi të
aftësisë së njerëzve për të mësuar si dhe të nivelit të tyre të njohurive. Të dhënat ekonomike
dhe të biznesit shpesh nuk përmbushin me rigorozitet supozimet e modeleve statistikore
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
42
parashikuese. Gjithashtu, modelet më të sakta për parashikime trajtojnë shumë pak supozime
në lidhje me strukturën e ekonomisë. Për më tepër, ekzistenca e një jo-lineariteti të theksuar
në modelet ekonomike bëjnë që metodat klasike të mos jenë të përshtatshme për t‟u përdorur
ose që modelet e ndërtuara nuk arrijnë të përfaqësojnë realitetin (Stencl M. dhe Stastny J.,
2011).
Një alternativë që propozohet për kryerjen e parashikimeve është përdorimi i rrjetave neurale
artificiale. Kërkimet e kryera në rrjetat neurale kanë treguar që kjo metodologji ka aftësi
shumë efikase në njohjen e mostrave dhe klasifikimin e tyre. E përbashkëta e metodave
tradicionale statistikore dhe rrjetave neurale artificiale është se procesi i të mësuarit bëhet mbi
bazën e të dhënave që mbajnë informacione nga e shkuara.
Rrjetat neurale artificiale pasi trajnohen me anë të shablloneve të së shkuarës mund të
përdoren për parashikime si dhe mund të punojnë me një bashkësi shumë të madhe të
dhënash në një kohë të arsyeshme. Një rrjet neural është një sistem i adaptueshëm, i cili
ndryshon strukturën e tij mbi bazë e informacioneve të brendshme ose të jashtme që kalon në
rrjet gjatë fazës së të mësuarit.
Rrjetat neurale janë mjete modelimi për të dhëna statistikore të cilat nuk kanë linearitet. Kjo
metodologji mund të përdoret gjithashtu për të modeluar lidhjet komplekse midis të dhënave
hyrëse apo përshkruese dhe atyre që duhet të parashikohen si dhe për të gjetur modele
(pattern) në të dhënat.
4.2 Parashikimi i serive kohore në këndvështrimin ekonomik
Një seri kohore është një sekuencë e renditur kohore e vlerave të vëzhguara për një ndryshore
fizike ose financiare të bëra në hapësira kohore të njëjta Δt, të cilat paraqiten me anë të një
bashkësie me vlera diskrete X1, X2, X3, ... , etj (Palit A. K. dhe Popovic D., 2005). Analiza e
një serie të caktuar kohore ka si qëllim kryesisht studimin e strukturës së saj të brendshme
(trendin, autokorrelacioni, sezonalitetin etj), për të fituar një kuptim më të mirë të procesit
dinamik me të cilin janë krijuar të dhënat e serisë kohore.
Vlerat e parashikuara nga të dhënat e serisë kohore ndihmojnë në marrjen e vendimeve në
lidhje me veprimet pasardhëse që duhet të ndërmerren. Disa aktivitete që kanë të bëjnë me
analizën e serive kohore janë: përcaktimi i serisë kohore, klasifikimi i tyre duke evidentuar
karakteristika specifike të saj si dhe informacione statistikore që lidhen me të. Në varësi të
karakteristikave që të dhënat mbartin, seritë kohore mund të jenë stacionare dhe jo-stacionare
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
43
, sezonale dhe jo-sezonale, lineare dhe jo-lineare si dhe me një-ndryshore ose me shumë
ndryshore (Palit A. K. dhe Popovic D., 2005). Një seri kohore mund të shfaqë një ose më
shumë nga këto tipare.
Seritë kohore nisur dhe nga emri i tyre kanë si tipar një renditje natyrale të tyre bazuar në
kohën e vëzhguar. Parashikimi i serive kohore lidhet me përdorimin apo ndërtimin e një
modeli që parashikon vlerat e ardhshme të ndryshores nisur nga vlerat e shkuara të vëzhguara
të tij.
Modelet e parashikimit mund të jenë me një-ndryshore ose me shumë-ndryshore. Në rrjetat
neurale që përdoren për problema parashikuese me natyrë përshkruese, model me shumë-
ndryshore, të dhënat hyrëse zakonisht përbëhen nga disa ndryshore përshkrues të pavarur dhe
një ndryshore dalëse të varur. Funksioni vlerësues i lidhjes, që përdorë rrjetin neural, mund të
shkruhet si:
Y = (X1, X2, …, Xp) (4.1)
ku X1, X2, …, Xp janë p-ndryshore të pavarura dhe y është ndryshorja e varur. I parë në këtë
këndvështrim, rrjeti neural është ekuivalent nga ana funksionale me një model të regresionit
jo-linear.
Nga ana tjetër, për një problem parashikues të serive kohore apo ekstrapoluese, si model me
një-ndryshore, të dhënat hyrëse përbëhen nga vëzhgime të kaluara të ndryshores ndërsa e
dhëna dalëse është një vlerë e ardhshme e parashikuar (Vika B., Martiri E. & Xhaja D.,
2011). Rrjeti neural në këtë rast kryen funksionin e hartuar më poshtë:
Yt+1 = (Yt, Yt-1, ..., Yt-p) (4.2)
Ku Yt është vlera e ndryshores së vëzhguar në kohën t. Në këtë rast, rrjeti neural është
ekuivalent me një model auto regresiv jo-linear për problemat e parashikimit të serive kohore
(Zhang G., Patuwo E. B., Hu M., 1998). Qëllimi i parashikimit të serisë kohore është në
modelimin e mekanizmit që mund të parashikoj vlerat e ardhshme të serisë në afatshkurtër
apo atë të mesëm.
Parashikimi ekonomik apo ai financiarë është procesi i kryerjes së parashikimeve rreth
treguesve të ndryshëm të ekonomisë. Parashikimet mund të kryhen në një nivel të lartë
agregimi, p.sh për GDP, inflacioni, papunësinë ose deficitin fiskal, ose në një nivel më të ulët
agregimi si për sektorë specifikë të ekonomisë ose dhe për firma specifike. Kuptimi dhe
parashikimi i „ciklit të biznesit‟ në ekonomi ndikon shoqërinë në tërësi si dhe ka ndikim të
rëndësishëm gjithashtu në faktorët politiko-sociale (Moody J., 1995).
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
44
Në kohën e sotme ekzistojnë një numër i madh metodologjish që përdoren për parashikim.
Secila prej këtyre metodave ka avantazhet dhe kufizimet e saj. Përzgjedhja e metodës më të
përshtatshme shpesh bëhet bazuar në eksperiencë personal dhe gjykime profesionale. Në
përgjithësi në rastet kur duhet të parashikohen fenomene të ndryshme përdoren përqasje të
thjeshta për ta përshkruar fenomenin.
Nëse modeli i aplikuar rezulton si një paraqitje e mirë për kushtet në botën reale atëherë
modeli pranohet si një mjet i përshtatshëm për të parashikuar të ardhmen. Por në rast se
modelet e thjeshta nuk japin rezultate te kënaqshme atëherë zgjidhen modele më komplekse.
Në vetvete modelet komplekse kërkojnë që të bëhen më shumë supozime lidhur me të.
Por pavarësisht nëse ne zgjedhim një model të thjesht ose jo, procesi i parashikimit kërkon
zbatimin e disa hapave të njëjtë. Në Algoritmi 4-1 e mëposhtme jepen me anë të një skeme
hapat e procesit të përgjithshëm për parashikim:
Algoritmi 4-1: Bllok-skema e procesit të përgjithshëm për parashikim
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
45
Siç mund të shihet qartë nga skema e paraqitur, procesi fillon me përcaktimin e fenomenit që
kërkohet të studiohet. Duhet që në hapin e parë të jenë përcaktuar mirë dhe qartë objektivat e
studimit. Më pas kalohet në mbledhjen e të dhënave të cilat janë thelbësore, duke evidentuar
varësitë e ndryshme të cilat mund të ekzistojnë, si dhe gjatësinë e kohës për parashikim.
Në hapin pasardhës bëhet një analizë teorike mbi modelin që duhet zhvilluar në mënyrë që ti
jap zgjidhje objektivave të studimit. Kjo lloj analize ndihmon në përpunimin e mëtejshëm të
varësive të ndryshme midis ndryshoreve të modelit. Si dhe në ndarjen e faktorëve në të
jashtëm apo të brendshëm.
Pasi është zhvilluar modeli teorik kalohet në dizenjimin dhe ndërtimin e modelit praktikisht.
Mbi këtë model duhen bërë testime në lidhje me besueshmërinë dhe vlefshmërinë e tij. Në
këtë fazë modeli është në gjendje të ofroj rezultate të cilat interpretohen dhe vlerësohen. Për
të vlerësuar saktësinë e tij krahasohen rezultatet e parashikuara me rezultatet reale. Mbi bazën
e vlerësimit nëse nuk rezulton i suksesshëm atëherë kemi kthim në fazat e mëparshme, e cila
përcaktohet nga analiza e këtyre rezultateve. Në rast suksesi, modeli përdoret si një mjet për
vendimmarrje dhe analiza të fushës. Por saktësia e një modelit nuk mund të jetë e përhershme
pasi mund të kemi ndryshime të kushteve në fushën e aplikuar gjë që do të çonte në fillim të
procesit.
Një aftësi e lartë parashikuese nënkupton një vendimmarrje më të mirë. Të parashikosh
nënkupton të përpiqesh të kuptosh influencën e mundshëm në disa ngjarje ekonomike apo
fenomene mbi tregjet financiare në mënyrë që të krijohen politika të suksesshme me
probabilitet të lartë apo të mund të vetë-pozicionohemi në mënyrë që të jemi të përgatitur në
lidhje me rreziqe potenciale të cilat mund të përballemi (Roche, 2014).
Por procesi i parashikimit në përgjithësi, por edhe ai ekonomik në veçanti është shumë i
vështirë dhe shterues. Pengesa hasen në të dhënat që do të përdoren të cilat nuk janë në
cilësinë dhe sasinë e nevojshme, si dhe në modelet e përdorura pasi çdo model ka avantazhet
dhe kufizimet e tij.
Modelimi dhe parashikimi i serive kohore në ekonomi janë një sfidë për disa arsye (Vika B.,
Sevrani K. & Vika I., 2016):
1. Edhe modelet më të sakta për parashikimin e ekonomisë janë modele të tipit „kuti e
zezë ‟, ato nuk kryejnë supozime në lidhje me strukturën e ekonomisë. Nuk është
paraqitur ende një model shkencorë bindës dhe i përshtatshëm për dinamikën e ciklit të
biznesit.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
46
2. Sistemi ekonomik është kompleks dhe është e pamundur të kryhen kontrolle
eksperimentale në ekonomi (Stencl M. dhe Stastny J., 2011).
3. Të dhënat reale të ekonomisë dhe të biznesit shpesh nuk i përmbushin në mënyrë
rigoroze supozimet e metodave të thjeshta statistikore të parashikimit.
4. Një problem tipik i bashkësisë reale për të dhënat lidhet me cilësinë e parashikimeve
numerike. Në përgjithësi këto të dhëna janë shumë të zhurmshëm dhe kanë sinjale të
dobëta për të treguar zhurmat në to. Mungesa e të dhënave ka ndikim në zvogëlimin e
cilësisë së parashikimit numerik (Stencl M. dhe Stastny J., 2011)
5. Lineariteti i fortë përshkrues që ekziston në modelet tradicionale çon shpesh në metoda
të papërdorshme ose në ndërtimin e modeleve që nuk arrijnë të paraqesin realitetin.
6. Një vështirësi që përballen të gjitha modelet lidhet me përcaktimin e informacionit të
nevojshëm dhe të mjaftueshëm për një parashikim të mirë. Ky është dhe një problem
thelbësor që lidhet me Shqipërinë, seritë kohore aktualisht në dispozicion janë
relativisht të shkurtra. Gjatësia e vlerave ekonomike të përzgjedhura nuk janë të gjata
mjaftueshëm për të siguruar cilësi të mirë për parashikimet.
7. Metodat që përdorin modelet tradicionale jo-lineare bazohen në të dhënat parametrike,
duke ngritur supozime rreth lidhjeve që mund të kenë ato në një problem të caktuar.
Këto janë vetëm disa nga vështirësitë që lidhen me modelimin e parashikimeve ekonomike
dhe financiare.
4.3 Rrjetat neurale si mjete parashikimi
Rrjetat neurale artificiale janë propozuar dhe përdorur gjerësisht, në literatura të ndryshme, si
modele parashikuese. Veçoritë që kanë seritë kohore ekonomike dhe financiare bëjnë që
RNA-e të shihen si modele të suksesshme për parashikimet. Rrjetat neurale i tejkalojnë
teknikat tradicionale të parashikimit në disa aspekte.
Karakteristikë për modelet neurale është se, pa përdorur supozime fillestare janë në gjendje të
nxjerrin apo gjenerojnë rregulla nëpërmjet procesit të trajnimit nga shembuj (ChangI. Ch.,
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
47
Hwang H. G., 1998). Kjo karakteristikë e RNA-e është shumë e dëshiruar në rastet kur të
dhënat bazë nuk mund të përftohen nëpërmjet parashikimeve financiare.
Sipas S. Gonzalez, rrjetat neurale kanë aftësi të mëdha për të zbuluar dhe riprodhuar lidhjet
lineare dhe jo-lineare midis ndryshoeve (Gonzaley, 2007). Tregues të ndryshëm ekonomikë
nuk mund të përshkruhen saktësisht nga modele lineare. Rrjetat neruale klasifikohen si
modele jo-lineare duke bërë të mundur të arrihet në një shpjegim më të mirë për të dhënat në
krahasim me modelet tradicionale lineare (Basheer I.A. dhe Hajmeer M,, 2000).
Këto modele shihen si të përshtatshme dhe në rastet kur kemi seri kohore shumë të luhatshme
apo e thënë ndryshe me luhatshmëri të lartë si dhe kur seritë përmbajnë zhurma apo mbajnë
informacion të pjesshëm (C. Kandilar, M.Simsek, C. H. Aladag, 2009). Duke qenë se këto
modele janë të pandjeshme ndaj zhurmave atëherë ato ofrojnë parashikime të sakta kur të
dhënat janë të pasigurta apo kanë gabime në matje (Basheer I.A. dhe Hajmeer M,, 2000).
Një tjetër elementë që është avantazh i rrjetave neurale kundrejt modeleve tradicionale
statistikore lidhet me natyrën lehtësisht të ndryshueshme të arkitekturës së rrjetit neurale.
Nëpërmjet një procesi mësimi të shoqëruar me përshtatje bëjnë të mundur që rrjeti të
modifikoi apo përditësoi strukturën e tij duke ju përshtatur dhe natyrës dinamike të mjedisit
(Basheer I.A. dhe Hajmeer M,, 2000).
Rrjetat neurale artificiale janë përgjithësues. Ato mund të mësojnë nga shembujt duke shfaqur
disa aftësi përgjithësuese të cilat shkojnë përtej të dhënave të përdorura për trajnim (Yao,
2002).
Kanë një strukturë funksionale përgjithësuese (C. Kandilar, M.Simsek, C. H. Aladag, 2009).
RNA-e janë në gjendje të përafrojnë automatikisht çfarëdolloj forme funksionale që
karakterizon më mirë të dhënat (T. Hill, L. Marquez, W. Remus, 1994).
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
48
4.4 Hapat e parashikimit me anë të RN-l
„Një rrjet neural nuk është një sistem magjik të
cilit i jepen disa të dhëna dhe ai të mund të arrijë të gjej
mënyrën për t‟u pasuruar‟
Realizimi i parashikimit nëpërmjet RN-e ndjek hapat kryesore të procesit të përgjithshëm të
parashikimit të ilustruar në Algoritmi 4-1. Duhet theksuar se është e domosdoshme të
evidentohen më shumë elementë apo detaje specifike në çdo hap, për të qartësuar tiparet dhe
cilësitë të cilat janë thelbësore për aplikimin e rrjetit neural në parashikim. Përpara se një RN
të përdoret për parashikimi ai duhet të jetë ndërtuar dhe vlerësuar për aftësitë e tij. Sipas
Haykin (Haykin, 1999) në përgjithësi modelimi i një rrjeti neural përbëhet nga tre etapa
kryesorë:
1. Konfigurimi – në të cilën përcaktohet se si organizohen dhe lidhen shtresat
2. Mësimi – që lidhet me mënyrën se si ruhet informacioni
3. Përgjithësimi – Si arrin RN të prodhoj të dhëna dalëse të arsyeshme për të dhënat
hyrëse që nuk i ka përdorur më parë në fazën e mësimit.
Për të plotësuar më mirë këtë modelim do të ishte e nevojshme që të përfshihen dhe analizat
që duhen kryer mbi të dhënat që do të përdoren në parashikim. Konfigurimi përbëhet në
përcaktimin e të dhënave që do përdoren si dhe zgjedhja e topologjisë së përshtatshme.
Aktivitetet kryesore që duhen përfshirë në secilën fazë shprehen më të detajuara në vazhdim:
Përgatitja e të dhënave për parashikim p.sh mbledhja, normalizimi, strukturimi i të dhënave,
përcaktimi i bashkësisë së të dhënave që do të shërbejnë për trajnim dhe testim e vetë
RN-l. Përzgjedhja e mënyrës për procesimin e të dhënave hyrëse dhe përzgjedhja e duhur
e të dhënave përshkruese pasi kjo do të ndikonte në performancën e parashikimit.
Përcaktimi i arkitekturës së rrjetit, çfarë nënkupton zgjedhjen e tipit të rrjetit që duhet të
përdoret për parashikim, përcaktimit i numrit të nyjeve hyrëse, të fshehura dhe dalëse të
rrjetit, numri i shtresave, përcaktimi i lidhjeve ndërmjet nyjeve etj.
Projektimi i strategjisë së trajnimit të rrjetit p.sh përzgjedhja e algoritmeve të trajnimit dhe
teknikat e monitorimit të trajnimit.
Vlerësimi i përgjithshëm i rezultateve të parashikimit duke përdorur grupet e reja për të
dhënat e vëzhguara të cilat RN-l nuk i ka parë gjatë fazës së trajnimit të tij.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
49
Një metodologji me tetë hapa ndërtues është përdorur për modelimin e rrjetave neurale
parashikuese, e prezantuar nga Boyd dhe Kaastra (Kaastra, I. dhe Boyd, M, 1996) paraqitet
në figurën e mëposhtme (Algoritmi 4-2):
Këto hapa zakonisht nuk janë të kalueshme vetëm nga një herë por mund të jetë e nevojshme
rikthimi në hapat e mëparshme sidomos ndërmjet përzgjedhjes së ndryshores dhe trajnimit të
rrjetit. Siç shihet, tre hapat e parë të kësaj metodologjie përzgjedhja, mbledhja dhe përpunimi
i të dhënave përbëjnë të gjithë fazën e përgatitjes së të dhënave që do të „ushqejnë‟ rrjetin/tat
neural.
Hapi i pestë përcakton arkitekturën që duhet të ketë rrjeti neural. Strategjia që do të
përzgjidhet për të trajnuar rrjetin do të realizohet në hapat 6 dhe 7 më tej pasohet me
implementimin dhe vlerësimin e rrjetit.
Dizenjimi i një rrjeti neural të suksesshëm për të bërë parashikime mbi seritë kohore është një
çështje komplekse. Nuk ekzistojnë rregulla të qarta dhe të mirë përcaktuar për t‟u aplikuar në
secilën nga hapat e modelimit të rrjetit neural. Në literaturë gjenden një numër i madh
sugjerimesh të ndryshme që bëhen bazuar në analizat teorike dhe ato empirike të kryera në
to.
Ajo që pranohet gjerësisht është se dizenjimi i rrjetit neural në vetvete është art. Më poshtë do
bëhet një përshkrim më i detajuar për secilin nga hapat.
Hapi 1: Përzgjedhja e Ndryshoreve;
Hapi 2: Mbledhja e të dhënave;
Hapi 3: Përpunimi i të dhënave;
Hapi 4: Përcaktimi i bashkësisë së të dhënave Trajnuese, Testimit dhe
Validimit;
Hapi 5: Struktura e rrjetit neural;
numri i shtresave të fshehura
numri i nyjeve të fshehura
numri i nyjeve dalëse
funksioni transferues apo aktivizimit
Hapi 6: Kriteret e vlerësimit;
Hapi 7: Trajnimi i rrjetit neural;
Numri i iteracioneve të trajnimit
Shkalla dhe intesiteti i të mësuarit
Hapi 8: Implementimi.
Algoritmi 4-2: Hapat e ndërtimit të RN parashikues
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
50
4.4.1 Parapërgatitja e të Dhënave për Parashikim
Suksesi i projektimit të një rrjeti neural varet nga kuptimi sa më i qartë i problemit. Përgjatë
përzgjedhjes së ndryshoreve, fokusi është rreth të dhënave të papërpunuara nga të cilat do të
zhvillohen një shumëllojshmëri treguesish. Këta tregues do të formojnë të dhënat hyrëse për
rrjetin neural. Të dhënat që përdoren për analizën dhe parashikimin e serive kohore janë të
dhëna të mbledhura nëpërmjet vëzhgimeve ose nga matjet e ndryshores së zgjedhur.
Hapi 1: Përzgjedhja e ndryshores/ve
Dy janë trajtimet thelbësore për të zgjedhur seritë kohore të ndryshores/ve që do të përdoren
për të realizuar parashikimin. Trajtimi me një ndryshore në të cilën parashikimi i ndryshores
së varur (që kërkohet të parashikohet) bazohet mbi një model të ndërtuar vetëm mbi vonesat
kohore të vetë ndryshores së varur, ndryshe të quajtura të dhëna teknike. Ndërsa në përqasjen
e dytë, atë të shumë ndryshoreve, parashikimi i serisë kohore varet, qoftë dhe pjesërisht, nga
disa seri të tjera të njohura si të dhëna thelbësore të cilat mendohen se kanë efekt në sjelljen e
ndryshores së varur.
Në përgjithësi, përzgjedhja e ndryshoreve bëhet duke u bazuar në fushën e aplikimit dhe në
qëllimet e vetë kërkuesve. Në këtë fazë përcaktohen numri i ndryshoreve që do të studiohen
si dhe intervali kohor i vëzhgimeve për çdo variabël.
Megjithatë nuk është e lehtë të identifikosh se cilat janë ndryshoret hyrëse të cilat do të
ndikonin në parashikim. Në parashikimet që bëhen mbi bazën e shumë ndryshoreve
përzgjedhja mund të kryhet nëpërmjet modeleve statistikore të cilët përcaktojnë se cilët janë
ndryshore të cilat kanë ndikim në parashikim ose nëpërmjet teorive ekzistuese ekonomike.
Shumë modele parashikuese mund të përdorin si ndryshore hyrëse. jo vetëm vonesat kohore
të vetë ndryshores që kërkohet të parashikohet por dhe ndryshore të tjera ekonomik të cilët
mendohet se ndikojnë në ndryshoren e varur.
Hapi 2: Mbledhja e të dhënave
Në momentin që merret një vendim në lidhje me ndryshoret që do të përdoren për të kryer
parashikimin është e nevojshme të merret në konsideratë kostoja dhe mundësia e sigurimit të
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
51
tyre. Shpesh ekzistojnë disa burime nga ku mund të merren të dhëna por është e rëndësishme
që cilësia e të dhënave të jetë sa më e lartë. Mbi të dhënat e përzgjedhura duhen realizuar
kontrolle për të evidentuar ekzistencën e gabime të ndryshme apo nëse ka mungesa të vlerave
të ndryshores në serinë kohore. Të dhënat e mbledhura duhet të jenë të përshtatshme, të
vlefshme si dhe të besueshme. Është e qartë se këto kritere do të përmirësonin saktësinë e
parashikimit.
Shpesh seritë e kohore për ndryshoret që do të përdoren në parashikim mund të
karakterizohen nga mungesa të observimeve apo dhe zhurmave në to. Problemet që lidhen me
mungesën e vëzhgimeve ose prezencën e zhurmave trajtohen në dy mënyra: të gjitha
vëzhgimet që mungojnë hiqen dhe supozohen që ngelen të pandryshuara me anën e
interpolimit ose merren si mesatarja e vlerave të afërta (Zhang G., Patuwo E. B., Hu M.,
1998).
Hapi 3: Përpunimi i të dhënave
Një hap i rëndësishëm është përpunimi i të dhënave ose parapërgatitja e të dhënave për t‟u
përdorur më pas si vlera hyrëse të rrjetit neural. Parapërgatitja ka të bëjë me analizimin dhe
transformimin e të dhënave hyrëse dhe dalëse. Një fazë që ndihmon në minimizimin e
zhurmave, evidentimin e lidhjeve të rëndësishme, gjetjen e trend-eve dhe normalizimin e
shpërndarjes së ndryshores për të lehtësuar dhe ndihmuar rrjetin neural për të mësuar
(Kaastra, I. dhe Boyd, M, 1996). Të dhënat e përpunuara i japin mundësinë rrjetit neural që të
nxjerrë më lehtë shembujt domethënës të cilat mbarten në këto të dhëna.
Në raste shumë të rralla rrjetit mund t‟i jepen të dhëna hyrëse dhe dalëse në trajtë të
papërpunuar. Por dhe në këto raste të dhënat i nënshtrohet një shkallëzimi, vlerat e tyre
transformohen brenda segmentit [0,1] ose [-1,1] (Kaastra I. dhe Boyd M. , 1996). Ky
shkallëzim realizohet nga funksioni i transferimit që përdorin nyjet e rrjetit neural. Por për të
kryer një parashikim sa më efikas transformimi i të dhënave duhet të përputhet me vlerat e të
dhënave hyrëse, me mesataren dhe variancën e tyre, e kombinuar kjo me funksionin e
aktivizimit të zgjedhur.
Nuk ekzistojnë rregullat të specifikuar për të bërë parapërgatitjen e të dhënave. Praktikisht ky
proces bëhet duke realizuar një procedure, me disa hapa, provo-dhe-vlerëso gabim.
Në rastet kur parashikimi i rrjetit nerual mbështetet në një seri kohore me një variabël atëherë
është e nevojshme të identifikohet dhe gjendet sezonaliteti në seri dhe më pas të aplikohen
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
52
teknika transformuese të përshtatshme për të eliminuar atë, kjo do të ndihmonte të kuptohej
më mirë procesi që ndodhë (Virili, F. & Freisleben, B., 2000). Në qoftë se të dhënat shfaqin
një variancë në rritje ose në zbritje përgjatë serisë atëherë është e nevojshme të kryhen
transformime të serisë.
Dy teknika kryesore të transformimit të serisë të cilat aplikohen gjerësisht si në metodat
tradicionale të parashikimit ashtu dhe në parashikimin me anë të rrjetave neurale janë
diferencë e parë (në vlerë absolute apo përqindje) dhe logaritmi natyrorë i ndryshores.
Diferencë e parë shpesh përdoret për të hequr trendin linear që mund të kenë të dhënat.
Transformimi logaritmik i serisë është më përshkrues, bënë të mundur që ndryshimet në
vlerat logaritmike të interpretohen si ndryshime relative të shkallëzimit fillestar të serisë.
Gjithashtu në këtë transformim parashikimet detyrohen që të qëndrojnë pozitive në lidhje me
shkallëzimin fillestar.
Teknika më e përdorur në transformimin e të dhënave është normalizimi i të dhënave.
Normalizimi i të dhënave është një proces i parapërgatitjes finale për të dhënat, të gatshme
për t‟u përdorur në vijim për trajnimin e rrjetit neural (Kaastra, I. dhe Boyd, M, 1996). Kjo
teknikë përdoret për të shkallëzuar vlerat e të dhënave në një segment më të ngushtë.
Parapërgatitja e të dhënave hyrëse duhet të bëhet në mënyrë të tillë që të gjitha ndryshoret të
marrin një shpërndarje të njëjtë për nga rëndësia. Të dhënat me vlerë absolute më të madhe
duhet të kenë rëndësi të njëjtën me ato të dhëna që kanë një vlerë më të vogël (P. W. Ch.
Prasad & Azam Beg, 2009). Shpesh herë të dhënat me vlerë më të madhe mund të kenë efekt
më të madh se sa një e dhënë me vlerë më të vogël. Është e rëndësishme të theksohet që i
njëjti normalizim duhet të kryhet si për të dhënat hyrëse dhe për ato dalëse.
Teknika e normalizimit në rastin e rrjetave neurale kryhet për të siguruar:
1. „Peshë‟ të njëjtë për çdo të dhënë hyrëse
2. Për të zbuluar dinamizmin e njësive të fshehura që ndodhen në shtresën e parë të
fshehtë.
3. Një kohë më të shkurtër për procesin e trajnimit duke bërë që rrjetin neural të mësojë
më lehtë lidhjet e rëndësishme në të dhënat e paraqitura.
4. Të dhëna me një shpërndarje të rregullt
Zhang (Zhang G., Patuwo E. B., Hu M., 1998) ka përmendur katër metoda kryesore që duhen
përdorur për normalizimin e të dhënave:
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
53
1. Normalizim nëpër kanal: ku çdo kanal përbën një të dhënë hyrëse të „pavarur‟. E
thënë ndryshe çdo e dhënë hyrëse normalizohet në mënyrë të pavarur nga të dhënat e
tjera.
2. Normalizim përgjatë kanalit: Normalizimi në këtë rast kryhet për çdo vektorë hyrës.
Pra normalizohen të gjithë elementët përbërës të një modeli të dhënash.
3. Normalizim me kanale të përziera: në këtë metodë bëhet një kombinim i
normalizimit përgjatë kanalit dhe atij nëpër kanal.
4. Normalizim i jashtëm: Të gjitha të dhënat e trajnimit normalizohen brenda një
segmenti të caktuar.
Përzgjedhja e metodës së normalizimit bëhen në lidhje me strukturën që ka vektori i të
dhënave hyrëse. Në rastet kur dëshirohet të përdoren rrjetat neurale për parashikim, si metodë
e përshtatshme për normalizim është vetëm normalizimi i jashtëm. Pavarësisht metodës së
zgjedhur për normalizimin e të dhënave formulat me të përdorura janë:
Transformim linear në segmentin [0,1] (normalizim min-max):
( ) ( ) (4.3)
Transformim linear në [a,b] (normalizim min-max):
( )( )
( ) (4.4)
Normalizim z-score (ose zero- mesatare) :
( ̅) (4.5)
Normalizim i thjeshtë :
(4.6)
Ku me dhe janë shënuar respektivisht vlera e normalizuar e të dhënës dhe vlera
origjinale e saj. Ndërsa me ̅ janë minimumi, maksimumi, devijimi
standard dhe mesatarja e të dhënave.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
54
Normalizimi është e qartë që bënë ndryshimin e të dhënave fillestare prandaj për këtë arsye
është e domosdoshme që parametrat e normalizimit të ruhen në mënyrë që të ripërdoren në
dhënat e reja për të pasur transformim në mënyrë uniforme për të gjitha të dhënat. I njëjti tip
normalizimi duhet bërë dhe mbi të dhënat dalëse. Kështu që për të interpretuar rezultatin e
prodhuar nga rrjeti neural duhet që të dhënat dalëse të rikthehen në vlerat origjinale.
Vlerësimi i saktësisë së rrjetit realizohet mbi vlerat origjinale.
Vlen të theksohet që nuk ekziston ndonjë teknikë normalizimi e cila mund të jetë e
përshtatshme për çdo lloj modeli apo çdo lloj problemi. Për të gjetur normalizimin që jep
rezultatin më të mirë duhet të provohen lloje të ndryshme dhe të zgjidhjet më i miri ndërmjet
tyre. Në literaturë tregohet që për të rritur performancën e parashikimit të modelit,
normalizimi duhet përzgjedhur dhe mbështetur mbi problemin që trajtohet.
Hapi 4: Përcaktimi i bashkësive për të dhënat: Trajnimin, Testimin dhe Validimin;
Rrjeti neural që do të përdoret për parashikim duhet që fillimisht ai të trajnohet mbi të dhënat
e serisë. Qëllimi i trajnimit është gjetja e parametrave të rrjetit të cilët do të prodhojnë
performancë më të mirë parashikuese. Performanca e rrjetit vlerësohet me të dhënat të cilat
rrjeti nuk i ka ndeshur më parë.
Në përgjithësi për të ndërtuar rrjetin neural artificial kërkohen shembuj të dhënash për trajnim
dhe testim e tij. Të dhënat e trajnimit përdoren për të zhvilluar modelin e rrjetit neural ndërsa
të dhënat e testimit përdoren për të vlerësuar aftësitë parashikuese të modelit. Gjithashtu
përdoret dhe një grup i tretë shembujsh, ai i validimit, i cili përdoret për të shmangur
problemin e përshtatjes së tepërt ose për të përcaktuar pikën e ndalimit për procesin e
trajnimit. Bashkësia e të dhënave trajnuese është më e madhe se ajo e validimit dhe e
testimit. Këto janë tre bashkësi të pavarura nga njëra-tjetra që së bashku formojnë serinë e
plotë e të dhënave.
Sasia e të dhënave që janë në dispozicion nga fusha e aplikimit shpeshherë është shumë e
kufizuar. Ndarja e serisë në tre bashkësi do të bënte që sasia e të dhënave për trajnimi do të
ishte shumë e vogël. Rrjeti neural në këtë rast do të kishte shumë pak shembuj për të mësuar
si dhe për të përgjithësuar njohurit e veçanta në këto të dhëna.
Në situata të tilla shpesh mund të përdoren teknika si boosting, bagging etj. të cilat
mundësojnë përmirësimin e performancës së algoritmit trajnues (Zheng, 2006). Këto teknika
aplikohen shpesh pasi është bërë ndarja e serisë në nën/bashkësi, në mënyrë që të përftohet
një model i cili funksionon për çdo nën/bashkësi të dhënash (Yao, 2002).
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
55
Një tjetër element thelbësorë që kërkon të përcaktohet nga ndërtuesit e rrjetit neural lidhet më
mënyrën se si duhet bërë ndarja e bashkësisë së të dhënave në tre nën/bashkësi. Bashkësia e
testimit duhet të jetë ndërmjet 10% deri 30% e bashkësisë së trajnimit (Kaastra I. dhe Boyd
M. , 1996). Një rregull i përgjithshëm, që mbështetet në eksperiencën e autorëve të ndryshëm,
për ndarjen e serisë në tre bashkësitë, trajnim, validim dhe testim është 70%, 15% dhe 15%
ose 80%, 15% dhe 5% (Gonzaley, 2007) (Zhang G., Patuwo E. B., Hu M., 1998).
Në një numër të konsiderueshëm punimesh sugjerohet që pjesa e seria që do të përdoret për
trajnim të përbëhet vetëm nga ngjarje kritike ose të jetë një përzgjedhje e rastësishme e
ngjarjeve (Gupta J. N. D., Smith K. A., 2001) (Singh, S.K.; Jain, S.K.;Bardassy, A., 2014).
Është e kuptueshme që ngjarjet historike nuk mund të kontribuojnë njësoj në ndërtimin e
modelimit të rrjetit neural. RN-l është një model që udhëhiqet nga të dhënat që i paraqiten.
4.4.2 Ndërtimi i RN-l për parashikim
Hapi 5: Struktura e RN-l
Në këtë hap përcaktohet topologjia e RN, shtresat e ndërmjetme dhe funksioni i aktivizimit.
Ky punim studion topologjinë SHS të rrjetave neurale. SHS (Figure 4-1) janë rrjetat neruale
më të përdoruara në fushën e parashikimeve (Zhang G., Patuwo E. B., Hu M., 1998) (Kaastra
I. dhe Boyd M. , 1996). Rrjetat SHS janë një strukturë me shumë shtresa që kryen hartëzimin
e lidhjeve jo-lineare midis të dhënave hyrëse dhe dalëse. Ndryshe ato njihen si rrjetat furnizim
me një-drejtimi (FD) pasi në këtë arkitekturë nuk përfshihen lidhje që të kthejnë informacion
mbrapa në shtresat furnizuese. Rrjedhja e informacionit bëhet nga shtresa hyrëse drejt
shtresës dalëse.
Rrjeti FD është një rrjet statik i cili prodhon një bashkësi me vlera dalëse. Ky rrjet nuk përdor
memorie, që do të thotë se vlerat dalëse që prodhohen nga rrjeti në një moment nuk varen nga
gjendjet e mëparshme të rrjetit. Rrjetat FD janë modele përgjithësuese universale (Bishop,
2006) (Gonzaley, 2007) (Kaastra, I. dhe Boyd, M, 1996).
Në rastin e përdorimit të kësaj topologjie për parashikim, si vlera në njësit hyrëse të rrjetit
SHS vendosen vlerat e ndryshoreve të pavarura që do përdoren për parashikimin e ndryshores
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
56
së varur. Ndërsa vlera e parashikuar për ndryshoren e varur merret në njësinë dalëse.
Funksioni vlerësues i lidhjes që përdorë rrjetin neural mund të shkruhet si:
Y = (X1, X2, …, Xp) (4.7)
ku X1, X2, …, Xp janë p-ndryshore të pavarur dhe Y është një ndryshore e varur.
Figure 4-1: Struktura e një rrjeti SHS
Në këtë rast është e rëndësishme të përcaktohen ndryshoret që ndikojnë në parashikimin e
ndryshores së varur. Në pjesën më të madhe zgjedhja e ndryshoreve të pavarur bëhet mbi
bazën e teorive ekonomike. Nëse numri i tyre është i madh atëherë përdoren metoda
statistikore për të bërë vlerësimin e ndikimit të çdo ndryshoreje të pavarur në ndryshoren e
varur.
Kurse në rastin kur kërkohet të modelohen seritë kohore me një ndryshore (univariate),
nëpërmjet rrjetave neurale, si vlera hyrëse të rrjetit vendosen vonesat kohore të vetë
ndryshores dhe vlera e parashikuar merret vlera e nxjerr në njësisë dalëse. Rrjeti neural në
këtë rast kryen funksionin e hartuar më poshtë:
Yt+1 = (Yt, Yt-1, ..., Yt-p) (4.8)
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
57
ku Yt është vlera e ndryshores së vëzhguar në kohën t. Në këtë rast është shumë e
rëndësishëm përcaktimi i numrit të përshtatshëm, për vonesat kohore p të ndryshores së
vëzhguar, që do të përdoren për të evidentuar modelet përgjithësuese në atë seri. Përdorimi i
të dhëna hyrëse me pakicë ose me tepri do të rezultonte në një rrjet me aftësi parashikuese të
ulët.
Në punimin e tyre May et al (May R.,Dandy G., & Maier H., 2011) evidentojnë se në
përzgjedhjen e numrit për të dhënat hyrëse, tiparet të cilat ndikojnë në performancën e
modelit janë:
a. Rëndësia e të dhënave, Në rast se të dhënat e përzgjedhura janë të pakta apo
informacioni që ato mbartin nuk janë të mjaftueshme për të përshkruar sjelljen e
ndryshores do të bënin që modeli të kishte një sjellje të dobët.
b. Përpjekje të lartë llogaritëse, si rezultat i përdorimit të një sasie të madhe për të
dhënat hyrëse, rrjeti neural do të kishte një strukturë të madhe. Për të dhënë vlerat
dalëse rrjetit do të duhet të realizonte një numër shumë herë më të madh veprimesh.
Veprimet përllogaritëse që do të bënte rrjeti do të rritesh në mënyrë eksponenciale me
rritjen e të dhënave hyrës së rrjetit.
c. Vështirësi trajnimi, procesi i trajnimit të rrjetit do të vështirësohej nëse të dhënat janë
me tepri dhe të papërshtatshme. Në këtë rast mund të përballeshim me problemin e
ngecjes në optimalitete lokale dhe jo ato globale, si dhe fokusim të tepërt në
rregullimin e parametrave lidhës në rrjet që nuk kanë lidhje me rezultatin e rrjetit.
d. Përmasa. Nëse përmasa e modelit rritet në mënyrë linearet atëherë kapaciteti që
nevojitet për modelimin e parashikimit rritet në mënyrë eksponenciale. Pra hapësira e
nevojshme për të realizuar trajnimin e rrjetit do të ishte shumë e madhe.
e. Kuptueshmëria, përdorimi i RN-l për të parashikuar ka si mangësi aftësinë për të
shpjeguar se si e realizon parashikimin. Rrjetat neurale shihen si „kuti të zeza‟ për sa i
përket aftësisë shpjeguese të rezultatit, nisur nga të dhënat hyrëse. Minimizimi i
kompleksitetit të RN-l duke zvogëluar informacionin e tepërt apo madhësinë e rrjetit,
do të rriste mundësinë për të kuptuar procesin parashikues.
Përpjekje të shumta janë bërë nga autorë të ndryshëm për të ofruar teknika të përshtatshme që
realizojnë përzgjedhjen e ndryshoreve hyrëse për rrjetit neural. Pavarësisht kësaj duhet thënë
se nuk ekzistojnë rezultatet teorike të cilat të sugjerojnë se cili është numri më i mirë i
vonesave kohore të ndryshores që duhet përdorur. Sipas Maier (Maier H. R.,Jain A., Dandy
G. C. & Sudheer K. P., 2010) është e nevojshme të vlerësohet dhe krahasohet besueshmëria
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
58
për metoda të ndryshme të ndarjes së të dhënave që propozohen në literaturën e gjerë. Më
pas duhet të zgjidhet ajo e cila jep performancën më të mirë të rrjetit.
Në këtë punim përzgjedhja e të dhënave hyrëse bëhet nëpërmjet një procesi përsëritës provo-
dhe-vlerëso sasi të ndryshme të dhënash, duke përzgjedhur atë që sjell rritje të performancës
së modelit parashikues.
Numri i Shtresave të fshehta: Shtresat e fshehta janë ato që i mundësojnë rrjetit neural aftësi
përgjithësuese. Si nga ana teorike dhe ajo empirike sugjerohet që nëse përdorim më shumë se
një shtrese të fshehtë nuk rezulton detyrimisht në përmirësimin e rezultatit të RN-l. Për më
tepër rritja e numrit të shtresa të ndërmjet apo të fshehta do të rrisnin rrezikun për të pasur një
përshtatjet të tepërt me të dhënat e trajnimit si dhe rritje të kohës përllogaritëse të nevojshme
për trajnimin e rrjetit. Përshtatja e tepërt me të dhënat (Overfitting) ndodh sepse rrjeti kërkon
ti përshtatet të dhënave që përdoren për trajnim saqë ai humbë aftësitë e tij përgjithësuese mbi
të dhënat testuese.
Edhe pse rrjetat me shumë shtresa mund paraqesin një numër të madh funksionesh
përgjithësues, trajnimi i tyre ka qenë gjithmonë një sfidë. Kjo deri në kohën kur studimet
empirike kanë gjetur se këto rrjeta nuk performojnë më mirë, për të mos thënë që shpesh më
keq, se sa rrjetat SHS me një apo dy shtresa të fshehura (Bengio Y. & LeCun Y., 2007).
Rrjetat SHS me një shtresë të vetme janë rrjetat që përdoren më shpesh në ekonomi dhe në
problema të ndryshme klasifikimi. Në rastet kur të dhënat përmbajnë zhurmë, rezultatet e
arritura nëpërmjet rrjetave neurale SHS kanë ofruar saktësi më të lartë (Wang dhe Fu, 2005).
Rrjetat SHS me një shtresë me funksion aktivizimi sigmoidal mund të përafrojnë çfarëdolloj
funksioni të vazhdueshëm në çfarëdolloj shkalle saktësie (Hines, 1996).
Për të pasur një rrjet të trajnuar që përgjithëson mirë dhe që minimizon gabimin është e
nevojshme që të zgjidhet numri optimal jo vetëm për shtresat e fshehta që do të përdorë rrjeti
por dhe për nyjet e fshehtat që do të ketë secila shtresë e fshehur. Nëse përdoren më pak nyje
do të kishim si rezultat parashikim me gabim të lartë. Një numër i vogël nyjesh do e kishin të
vështirë të përshkruanin mirë njohuritë që gjenden në serinë kohore. Gjithashtu në të
kundërt, përdorimi i shumë nyjeve, do bënte rrjetin që të përshtatet shumë me të dhënat
trajnuese duke humbur aftësinë përgjithësuese për të dhënat testuese.
Ekzistojnë përqasje të ndryshme të cilat sugjerojnë mënyrën se si duhet përzgjedhur numri
më i mirë i neuroneve të fshehta që duhen përdorur.
1. Metoda provo dhe kontrollo gabimin (Panchal F., S. ; Panchal M., 2014): Në këtë
rast provohen sasi të ndryshme dhe testohet suksesi. Zgjidhet ai që performon më
mirë. Kjo metodë aplikohet në dy mënyra:
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
59
a. drejtim i përparmë në të cilën fillohet me një numër të vogël neuronesh
(minimalisht 2) dhe vazhdohet duke e rritur numrin e tyre në shtresën e
fshehtë. Për çdo rrjet bëhet trajnimi i rrjetit dhe testimi i tyre dhe zgjidhet rrjeti
me performancën më të mirë.
b. drejtim së prapthi është e kundërta. Fillohet me një numër të madh neuronesh.
Pasi trajnohet dhe testohet ky rrjet bëhet zvogëlimi i neuroneve duke përsëritur
të njëjtin proces për çdo rrjet.
2. Metoda udhëzuese të përgjithshme2 (Karsoliya, 2012)
a. Numri i neuroneve në shtresën e fshehtë duhet të jenë sa 2/3 (nga 70%-90%) e
madhësisë së të dhënave hyrëse plus madhësinë e të dhënave dalëse.
b. Numri i neuroneve në shtresën e mesme duhet të jetë më pak se dyfishi i
numrit të neuroneve në shtresën hyrëse.
c. Numri i neuroneve në shtresën e fshehtë është midis madhësisë së shtresës
hyrëse dhe shtresës dalëse.
Funksionet e transferimit(aktivizimit) që përdoren në rrjetat neurale bëjnë një përqendrim të
vlerave dalëse rreth një vlere të caktuar që luan rolin e mesatares. Funksioni logjistik i
përqendron rreth vlerës 0.5. Më të përdorura janë funksionet jo-lineare.
Një rrjet SHS pa jo-linearitet nuk do të ndryshonte nga një filtër i thjeshtë linear. Kjo pasi
rrjeti do e kishte të pamundur të realizonte ndarjen jo-lineare apo të mësonte trajektoren për
të dhënat jo-lineare dhe jo-stacionare (Mandic D. P. & Chambers J. A., 2001). Funksioni i
aktivizimit ndikon në kompleksitetin dhe performancën e RN-l.
Në rastin e përdorimit të rrjetave neurale për parashikim, seritë kohore karakterizohen nga
natyra jo-lineare dhe të vazhdueshme. Funksioni sigmoid-al dhe ata të ngjashme me të, janë
përdorur shpesh në rrjetat neural parashikues pasi ato janë jo-lineare dhe me derivat të
vazhdueshëm. Këto janë veçori të përshtatshëm për trajnimin e rrjetit neural (Kaastra, I. dhe
Boyd, M, 1996).
Shpesh mund të përzgjidhen funksione të ndryshme transferimi për nyje që ndodhen në
shtresa të ndryshme. Por theksohet se nyjet e shtresës së mesme, në një rrjet neural për
parashikim, nuk duhet të kenë një funksion aktivizimi logjistik. Shpesh në punime të
ndryshme përdoren funksioni sigmoidal ose tanget hiperbolik. Është më mirë të ndërtohen
shtresa homogjene në lidhje me funksionin e aktivizimit.
2 Të tre këto mite në disa raste janë kundërshtuar pasi në to përjashtohet roli i topologjisë, i funksionit të
aktivizimit të rrjetit si dhe i algoritmit të trajnimit.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
60
Në rastin e nyjeve në shtresën dalëse mund të përdoret një funksion aktivizimi i përshtatshëm
për t‟i bërë një shpërndarje të caktuar vlerave ose një parapërgatitje për të dhënat hyrëse, në
mënyrë të tillë që të arrijnë shpërndarjen e dëshiruar të vlerave (Mandic D. P. & Chambers J.
A., 2001). Vetëm në rastin e përdorimit të RN-l për parashikimin e serive kohore me trend
duhet të përdoren neurone dalëse me një funksion jo-linear (Palit A. K. dhe Popovic D.,
2005).
Hapi 6: Kriteret e vlerësimit
Në rastin e RN-l, të dhënat ndahen në tre bashkësi të veçanta: trajnimi, validimi dhe testimi.
Të dhënat trajnuese dhe validuese përdoren për të gjetur parametrat e rrjetit që do të
zvogëlonin gabimin e modelit. Ndërsa të dhënat testuese luajnë rol në përcaktimi dhe
vlerësimin e performancës së rrjetit neural. Qëndrueshmëria e RN-l vlerësohet nëpërmjet
gabimit të tij. Gabim minimal do të thotë qëndrueshmëri më e mirë ndërsa gabim i lartë
nënkupton qëndrueshmëri më e keqe. Kriteret më të përdorura, të matjes së performancës,
janë: MSE, RMSE, MAE.
RMSE (Root Mean Square Error) përshkruan madhësinë mesatare të gabimeve:
√ √
∑ ( ̂ ) (4.9)
ku ̂ është vlera e parashikuar për vlerën aktuale ndërsa n është numri i vëzhgimeve. Në
këtë rast kuptohet se kanë peshë më të madhe në përcaktimin e vlerësimit ato që kanë gabim
më të madh. Kjo sepse gabimet ngrihen në fuqi përpara se të gjendet mesatarja e tyre.
MAE (Mean Absolute Error) përshkruan magnitudën mesatare të gabimeve pa marrë
parasysh shenjën e tyre. Në këtë rast të gjitha gabimet kanë rëndësi të barabartë në vlerësim.
∑ | ̂ | (4.10)
Në secilën nga rastet, vlerat që marrin janë ndërmjet intervalit 0 deri në ∞. Rrjeti neural më i
qëndrueshëm është ai që ka kriter performance më të vogël. Një tjetër specifik që lidhet me
këto kritere është paraqitja e gabimeve me njësi dhe shkallëzim të njëjtë si vetë parametri.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
61
Nëse përdoren njëkohësisht të dy kriteret MAE dhe RMSE mund të identifikohen luhatjet në
gabime. RMSE është më e madhe ose e barabartë me MAE. Një diferencë shumë e madhe
midis MAE-s dhe RMSE-s nënkupton një luhatje të madhe në gabimin e serisë kohore
(Yonaba H., Anctil F., & Fortin V., 2010). Praktikisht për të përzgjedhur modelin e rrjetit
neural më të mirë, në shumë literatura sugjerohet që të krahasohet kriteri i vlerësimit për të
dhënat në in-sample (të dhënat e trajnimit) dhe ato out-of-sample (të dhënat e testimit). Por
nuk janë të paktë dhe ato punime që përzgjedhjen e rrjetit neural parashikues më të „mirë‟ e
mbështesin vetëm në të dhënat out-of-sample.
4.4.3 Procedurat e trajnimit të RN-l
Hapi 7: Trajnimi i rrjetit neural;
Pasi është përzgjedhur struktura e rrjetit neural është e nevojshme që të përcaktohen lidhjet
ndërmjet nyjeve të rrjetit neural. Këto lidhje nuk janë të njëjta. Në rrjetat neurale artificiale
për çdo lidhje, vendoset një peshë e cila tregon fortësinë e lidhjes midis nyjeve. Duke u
mbështetur në kuptimi biologjik të rrjetit neural, lidhjet tregojnë ndikimin që ka një neuron
mbi rezultatin e një neuroni tjetër. Rrjeti neural njihet për aftësinë e tij të përshtatjes, për të
mësuar nga të dhënat që i paraqiten. Procesi i trajnimit të rrjetit neural artificial ka si qëllim të
gjej bashkësinë më të mirë të peshave, që do të maksimizonin aftësitë parashikuese të RN-l
ose e thënë ndryshe do të zvogëlonin gabimet e modelit. Të dhënat trajnuese përdoren nga
rrjeti neural për të rregulluar peshat (mësuar) në mënyrë që të arrihet rezultati i dëshiruar. Dy
aspektet kryesore në të cilat përqendrohet trajnimi i rrjetit është përshpejtimi i trajnimit të
rrjetit si dhe në rezultatit e procesit trajnues.
Në literaturë janë sugjeruar 3 paradigma kryesore për realizimin e trajnimit: i mbikëqyrur, i
pambikëqyrur dhe i përforcuar. Përzgjedhja e paradigmës së duhur që do të përdoret
mbështetet në formën e të dhënave që do t‟i vihen në dispozicion RN-l si dhe në qëllimin që
do të përdoret rrjeti neural. Pasi zgjidhet paradigma është e nevojshme të kuptohet se kush
janë rregullat e trajnimit që të drejtojnë përditësimin e peshave të rrjetit, pra algoritmi i
trajnimit që do të përdoret.
Procesi i trajnimit të rrjetit është përsëritës. Për RN-l parashikues të dhënat trajnuese që e
furnizojnë atë janë në formën e çiftuar hyrëse/dalëse. Të dhënat hyrëse që merr rrjeti
transformohen nëpërmjet parametrave të tij duke prodhuar rezultatin/et. Këto të dhëna i
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
62
paraqiten rrjetit një nga një dhe për çdo rast bëhet rregullimi i peshave të rrjetit duke
krahasuar rezultatin/et e rrjetit me të dhënat dalëse reale. Bazuar në këtë krahasim bëhet
vlerësimi i gabimit të parashikimit si dhe përcaktohen vlerat e ndryshimit të peshave për
rrjetin në mënyrë që në hapin pasardhës të trajnimit, rezultati i rrjetit të jetë sa më afër me
vlerat reale dalëse. Pasi të gjitha rastet e të dhënave trajnuese i janë paraqitur rrjetit, shpesh
kërkohet që të ri-përsëritet procedura. Kjo procedurë, që përputhet me paradigmën e
mbikëqyrur, ndiqet përgjatë të gjithë procesit të trajnimit. Rrjetat neurale artificiale
parashikuese përdorin paradigmën e mbikëqyrur për të mësuar nga të dhënat trajnuese.
„...Një teori trajnimi duhet të adresoj tre çështje praktike bazë: kapacitetin, kompleksitetin
e shembujve dhe kompleksitetin e kohor..‟ (Jain A. K., Mao J., Mohiuddin K. M., 1996).
Kapaciteti në këtë rast lidhet me numri i shembujve që mund të ruhen si dhe me çfarë
funksionesh dhe kufizimesh mund të formohen nga rrjeti. Kompleksiteti i shembujve
përcakton numrin e nevojshëm për të dhënat trajnuese që do të garantonin një aftësi të lartë
përgjithësues të RN-l. Kompleksiteti kohor lidhet me kohë që kërkon një algoritëm trajnimi
për të arritur nivelin trajnues të dëshiruar të rrjetit. Për shumë algoritme trajnimi
kompleksiteti kohorë është i madh. Një numër studimesh fokusohen në modelimin e
algoritmeve efecientë për trajnimin e RN-l.
Ky punim është përqendruar në përdorimin e algoritmeve trajnues të mbikëqyrur mbi rrjetat
SHS. Edhe pse ekzistojnë një numër i konsiderueshëm algoritmesh për trajnim, më i përdorur
në literaturën e gjerë është algoritmi i trajnimit me propagandim-prapa (PP), i njohur
ndryshe me emërtimin rregulli i përgjithësuar delta (Fu, 1994; Walczak, S. dhe Cerpa, N.,
1999). Ky algoritëm është një përafrues universal. Shumë autorë kanë treguar që rrjetat
neural të trajnuar me anë të PP rezultojnë me një performancë shumë më të mirë se RN-le të
trajnuar me algoritme të tjerë (Barnard, E. and Wessels, L., 1992; Walczak, 1998; Nouir Z,
Sayrac B, Fourestie B, Tabbara W, Brouaye F., 2007). Për këtë arsye algoritmi PP është i
vetmi algoritëm që është përdorur në këtë punim për trajnimin e rrjetit neural.
Algoritmi Propagandim-Prapa
Në këtë algoritëm bëhet përhapja prapa e gabimit. Kjo mënyrë përdoret sëbashku me një
metodë optimizimi, si për shembull gradient descent. Si fillim ky algoritëm është zhvilluar që
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
63
në 1971 nga Werbos por për një kohë të gjatë ai nuk është përdorur. Por ishte Rumelhart
(1986) që bëri formulimin e qartë të algoritmit duke e rritur përdorimin e tij gjërësisht.
Mitchell (1997) në librin e tij Machine Learning ka bërë një përmbledhje se cilat janë
karakteristikat e problemave në të cilët përdorimi i algoritmit PP është i përshtatshëm:
Shembujt paraqiten nga disa kombinime të trajtës cilësi-vlerë. Funksioni qëllim që
kërkohet të mësohet duhet të përcaktohet si një vektorë i tipareve të paracaktuara.
Këto cilësi hyrëse mund të kenë një korrelacion të lartë me njëri-tjetrin ose mund të
jenë të pavarura. Vlerat hyrëse mund të jenë vlera reale të ndryshme.
Rezultati i funksionit qëllim mund të jetë një cilësi me vlerë diskrete, reale ose një
vektorë me disa vlera reale/diskret.
Shembujt e trajnimit mund të përmbajnë gabime. Rrjetat neurale artificiale njihen si
struktura me qëndrueshmëri të konsiderueshme në lidhje me zhurma që mund të kenë
të dhënat trajnuese.
Kur mund të pranohet dhe një kohë e gjatë trajnimi. Në ndryshim nga modele të tjera
algoritmet e trajnimit të rrjetave neural kërkojnë një kohë të gjatë trajnimi duke filluar
nga disa sekonda deri në disa orë. Kjo varet nga disa faktorë si numri i peshave që
përdorë rrjeti, numri i shembujve që përdoren për trajnim etj.
Në rast se kërkohet vlerësimi i shpejtë për funskionin qëllim të mësuar. Pavarësisht
kohës relativisht të gjatë që kërkohet për trajnimin e rrjetit neural, vlerësimi i rrjetit të
trajnuar realizohet shumë shpejt.
Nuk është e domosdoshme që njerzit të jenë të aftë të kuptojnë funksionin qëllim të
mësuar. Peshat që përdor një rrjet i trajnuar janë shpesh të vështira për t‟u intrepretuar
nga njerëzit. Shpesh rrjeti neural njihet si „kuti-e-zeze‟ pasi ato nuk mund të
shpjegojnë se si e prodhojnë një rezultat të caktuar.
Në algoritmin e trajnimit PP dallohen dy faza bazë të funksionimit të tij: përhapja dhe
përditësimi i peshave. Në fazën e parë atë të përhapjes kemi dy mënyra të kryerjes së saj:
a. Përhapja përpara (PP) e shembujve hyrës të trajnimit përgjatë RN-l për të vlerësuar
sinjalet dalëse në nyjet e shtresës së fundit.
b. Përhapja mbrapa (PM) e sinjalit dalëse nëpërmjet RN-l. Përdoren të dhënat reale
dalëse korresponduese për shembujt e trajnimit për të gjeneruar të gjitha deltat
(ndryshimi midis vlerave hyrëse dhe dalëse) për të gjitha nyjet dalëse dhe të fshehura.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
64
Në fazën e dytë të përditësimit të peshave ndiqen këto hapa për peshën e çdo lidhjeje:
a. Gjendet gradienti i peshës nëpërmjet prodhimit të deltës dalëse dhe sinjalit hyrës
b. Vlerës së peshës i zbritet një përqindje e caktuar e gradientit.
Figure 4-2:Paraqitja e rrjetit SHS me tre-shtresa
Në
Figure 4-2 paraqitet një RN-l, SHS-r me tre shtresa (hyrëse, e fshehtë dhe dalëse). Rrjeti
përmban dhe dy nyje paragjykuese (Bias) dhe . Këto nyje kanë gjithmonë vlerë 1 dhe
përdoren për rritur aftësitë e rrjetit për të përshkruar të dhënat. Parametrat wij janë peshat e
lidhjeve midis dy nyjeve, janë të dhënat hyrëse për rrjetin, tregojnë nyjet në shtresën
fshehtë dhe nyjet dalëse për rrjetin SHS. Ndërsa për fO dhe fH janë funksionet e aktivizimit
respektivisht për nyjet dalëse dhe për nyjet e fshehta. Shigjetat tregojnë drejtimin e rrjedhjes
së informaciont përgjatë rrjetit në fazën e përhapjes përpara.
Më poshtë jepet ekuacioni i cili tregon sesi gjenerohet vlera e nyjes dalëse :
(∑
(∑
)
) (4.11)
Algoritmi PP është një teknikë e thjeshtë zvogëlim gradienti që konsiston në minimizimin e
një funksioni të caktuar të gabimit p.sh minimizimi e mesatares së katrorëve të gabimeve:
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
65
∑ ( ̂ )
∑
(4.12)
ku është vlera e reale dhe ̂ është vlera i-t e gjeneruar nga rrjeti.
Rezultati për çdo nyje në shtresën dalëse është një funksion i peshave w. Për të zvogëluar
funksionin e gabimit duhet të kemi që:
( ) ( )
(4.13)
Gradienti i gabimit specifikon drejtimin që jep rritje më të fortë në E. Negativi i tij jep
drejtimin e zbritjes më të fortë. Ndërsa në rregulli i trajnimit me zvogëlim të gradientit
përditësimi i peshave shprehet me:
( ) ( ) ( ) (4.14)
dhe:
(4.15)
ku: parametri 0 < < 1 është shkalla e të mësuarit dhe shërben për të kontrolluar shkallën e
konvergjencës së algoritmit. Shkalla e të mësuarit ndikon në shpejtësinë dhe cilësinë e të
trajnimit. Sa më e madhe vlera e saj aq më e shpejt është trajnimi i rrjetit, ndërsa sa më e
vogël të jetë vlera aq më i saktë është trajnimi. Megjithatë në rast se parametrit i jepet një
vlerë shumë e madhe atëherë funksioni i gabimit do të pësonte ndryshime të forta duke mos
shfaqur një përmirësim të vazhdueshëm. Por edhe e kundërta, zgjedhja e një vlere të vogël
për shkallën e të mësuarit do të rriste kohën e trajnimit.
Për të eleminuar ndryshimin e shkallës së të mësuarit për çdo kalimit nëpër bashkësinë
trajnuese përdoret një parametër që njihet si termi i shpejtësisë (Kaastra I. dhe Boyd M. ,
1996). Termi i shpejtësisë përcakton se si do të ndikojnë ndryshimet e peshës së hapit të
mëparshëm mbi atë aktualë. Shkalla e të mësuarit në këtë rast do të mbaj në çdo hap të
iteracionit vlerën më të madhe të mundshme brenda vlerave të lejuara ndërkohë që ruhet
qëndrueshmëria e procesit të trajnimit. Ekuacioni i modifikuar do të shkruhej si mëposhtë:
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
66
( )
( )
(4.16)
ku: 0 < < 1 termi i shpejtësisë dhe t-numri i iteracioneve.
Pseudokodi për algoritmin bazë të trajnimin PP për rrjetin SHS, jepet mëposhtë në Algoritmi
4-3. Në këtë algoritëm instruksioni në rreshti e katërt realizon fazën e përhapjes përpara për të
dhënat hyrëse, ndërsa rreshti i gjashtë dhe shtatë përbëjnë dhe fazën përhapjes mbrapa të
gabimit përgjatë rrjetit. Mësimi nëpërmjet shembujve mund të kryhet në mënyrë sekuenciale
(online) ose në grupe (offline).
Në mësimin sekuencial të rrjetit peshat përditësohen pas çdo shembulli. Në këtë rast saktësia
e trajnimit varet nga renditja e shembujve që i paraqiten rrjetit. Shpesh, përdoret në rastet kur
nuk mund të sigurohen të gjithë shembujt trajnues njëherësh.
Një epokë trajnimi përbëhet nga kalimi i të gjithë të dhënave trajnuese në rrjet. Mësimi në
grupe bëhet duke akumuluar ndryshimet e peshave përgjatë një epoke trajnimi dhe duke i
përditësuar peshat e rrjetit vetëm në fund të epokës. Në këtë mënyrë nuk ka rëndësi renditja e
shembujve trajnues. Numri i epokave trajnuese në shumë punime përcaktohet nga qindra në
mijëra.
Algoritëm PropagandimPrapa
1. Për çdo peshë 𝑤𝑖𝑗𝐼 dhe 𝑤𝑗𝑙
𝐻 të rrjetit përcaktohen vlera fillestare të rastësishme të vogla
2. Derisa të gjithë shembujt klasifikohen korrektësisht ose plotësohet ndonjë kriter ndalimi
kryej
3. Për çdo bashkësi trajnimi hyrëse xinput me përmasë n bëj
4. { Parashikim = nn_vlerë_dalëse (rrjet, xinput)
5. VlerëReale = vl_qëllim_për_shembullin( xinput)
6. Llogarit 𝑤𝑗𝑙𝐻 për çdo lidhje midis shtresës së fshehtë dhe dalëse
7. Llogarit 𝑤𝑖𝑗𝐼 për çdo lidhje ndërmjet shtresës hyrëse dhe të fshehtë
8. Përditëso peshat e rrjetit }
9. Return rrjet
Algoritmi 4-3: Algoritmi PP që përdorë zvogëlimin e gradientit
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
67
Kufizime të algoritmit PP
Pavarësisht se përdorimi i këtij algoritmi është shumë i gjerë shumë punime përqendrohen në
studimin dhe përmirësimin e tij. Ekzistojnë disa variante të këtij algoritmi të cilët sjellin
përmirësime të pjesshme të tij. Disa nga problematikat që ndeshen më shpesh janë:
Problemi i minimumit lokal. Përmendëm që ky algoritëm përdorë metodën e
zvogëlimit të gradientit për të gjetur peshat të cilat do të zvogëlonin gabimin.
Algoritmi PP funksionon në përgjithësi si një algoritëm hill-climbing (ngjitje në
kodër). Algoritmi nuk është optimal që do të thotë se kjo metodë shpesh mund të
ngecë në një minimum lokal në vend që të ketë gjetur minimumin global. Një mënyrë
për të përmirësuar këtë algoritëm është përdorimi i termit të shpejtësisë të shpjeguar
më sipër. Një mënyrë e dytë është përdorimi i metodës simulated annealing në të cilën
provohen disa vlera të ndryshme për inicializimin e peshave të rrjetit. Shpeshherë
këto mënyra mund të kombinohen me njëra-tjetrën
Shmangia e problemit të përshtatjes së tepërt në fazën trajnuese (overfitting). Në këtë
rast ekziston problemi i përshtatjes së mirë të rrjetit me të dhënat trajnuese duke
humbur kështu aftësitë përgjithësuese për të dhëna të reja. Për të minimizuar këtë
problem janë zhvilluar disa metoda të ndryshme. Një nga metodat më të përdorura
gjerësisht është ndalim i herët (Gonzaley, 2007). Të dhënat ndahen në tre bashkësi
trajnuese, validuese dhe testuese.
Bashkësia e validimit përdoret pas çdo iteracion në procesin e vlerësimit për të bërë
një parashikim dhe më pas llogaritet MSE-ja për të dy bashkësitë trajnuese dhe
validuese. Vihet re se fillimisht me rritjen e numrit të iteracioneve (epokave)
parametri MSE për të dy bashkësitë vjen duke u zvogëluar. Por në literaturë vihet re
se vazhdimi i iteracioneve në një numër të madh do të rezultonte që MSE-ja, për
bashkësinë trajnuese do vazhdonte të zvogëlohej ndërsa për bashkësinë validuese do
të filloj të rritet. Kjo gjë ndodh pasi rrjeti arrin të përshkruaj shumë saktë të dhënat
trajnuese por humbet aftësitë e tij përgjithësuese. Në këtë rast trajnimi ndalon në
momentin kur arrihet gabimi më i vogël për bashkësinë e validimit në mënyrë që të
marrim një rrjet me një performancë të mirë përgjithësuese (Bishop, 2006). Kjo
metodë do të kërkonte që shembujt që ne kemi të jenë të konsiderueshme, në të
kundërt nuk do të kishte kuptim që ne të përdornim një bashkësi trajnuese e cila nuk
do të përmbante të dhëna të mjaftueshme për të mësuar rrjeti. Kritere ndalimi të tjera
që mund të përdoren janë:
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
68
- Përcaktohet një parametër përgjithësim humbjeje si funksion i gabimit të
validimit dhe gabimit optimal të dëshiruar në epokën t. Nëse vlera e këtij
parametri e tejkalon një vlerë të përcaktuar paraprakisht atëherë ndalohet.
- Përcaktohet numri maksimal i epokave për të cilat duhet të kryhet trajnimi.
Nëse ky numër arrihet atëherë ndalohet procesi i trajnimit të rrjetit.
Gjetja e kriterit të ndalimit të suksesshëm është një tjetër sfidë në dizenjimin e rrjetave
neurale. Duke qenë se secili nga kriteret në veçanti nuk është i plotë shpesh përdoren
kombinime të këtyre teknikave. Kjo gjë është e ilustruar dhe në algoritmin PP të paraqitur në
Algoritmi 4-3 tek rreshti 2.
4.4.4 Ndërtimi i modelit parashikues
Hapi 8: Implementimi
Në këtë hap është i mundur ndërtimi i modelit parashikues sipas specifikave të përcaktuar në
hapat e mëparshëm. Gjithashtu të dhënat e grumbulluar i nënshtrohen parapërgatitjes së
duhur duke u ndarë më pas në tre bashkësitë kryesore. Ndërtimi i modelit në një platformë të
caktuar kërkon që fillimisht të përcaktohet se kush do të jetë gjuha e programimit që do të
përdoret, strukturat e të dhënave të nevojshme për t‟u përdorur si dhe algoritmet që do të
përdoren.
Për të dhënat është e nevojshme të specifikohen forma e ruajtjes dhe paraqitjes së tyre.
Vlefshmëria e të dhënave, kriteret e vlerësimit dhe koha e trajnimit janë specifik në lidhje me
fushën e zbatimit dhe përcaktojnë se si do të ndërtohet rrjeti neural.
Një avantazh i rrjetave neurale është aftësia e tyre për t‟iu përshtatur ndryshimeve që pësojnë
kushtet e tregut nëpërmjet ri-trajnimeve periodike të tij (Kaastra, I. dhe Boyd, M, 1996). Një
rrjet neural i ndërtuar humbet aftësitë e tij parashikuese me kalimin e kohës. Për këtë arsye do
të ishte i nevojshëm ri-trajnimi i tij me të dhënat të reja për të pasuruar rrjeti me informacione
të rëndësishme.
Rekomandohet që frekuenca e ri-trajnimit të jetë e njëjtë me frekuencë e testimit të modelit
final por në rast se testimit është shumë i shpeshtë atëherë mund të bëhet në një periudhë më
të gjatë.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
69
Një model i mirë duhet të jetë i qëndrueshëm në lidhje me frekuencë e ri-trajnimit dhe shpesh
duhet të përmirësohet përgjatë ri-trajnimeve të tij.
4.5 Të metat e RNA-le si modele parashikuese
Ekzistojnë shumë studime të cilët tregojnë rezultate pozitive apo që nxjerrin përfundime në
avantazh të rrjetave neurale krahasuar me teknikat statistikore. Megjithatë nga pikëpamja
teorike përballemi me disa pengesa mbi të cilat duhet punuar për t‟u kapërcyer. Disa nga
problematika që lidhen me rrjetin neural janë (T. Hill, L. Marquey, M. O'Connor dhe W.
Remus, 1994; Portugal, 1995; Basheer I.A. dhe Hajmeer M,, 2000):
Metodologjia dhe teknikat e modelimit të rrjetave neurale ndryshojnë shpesh ndërsa
teknikat e modelimit statistikor janë të qëndrueshme dhe të zhvilluara mirë. Nuk ka
metodologji të saktë për ndërtimi dhe përzgjedhjen e arkitekturës së rrjetit neural të
përshtatshëm për një fushë studimi të caktuar. Proceset aktuale të modelimit në një
numër të madh punimesh janë me bazë empirike.
Aktualisht mund të gjenden lehtësisht softuerë që lehtësojnë përdorimin e modeleve
tradicionale statistikore por nuk mund të themi të njëjtën gjë për zhvillimin e
softuerëve cilësorë që përdorin rrjetat neurale artificiale për parashikim. Pavarësisht
përpjekjeve të shumta këto softuerë kërkojnë aftësi teknike për ti modeluar apo
përdorur ato.
Modelet neurale artificiale janë të vështirë për t‟u interpretuar dhe për ti dhënë atyre
një kuptim fizik me fushën e studimit. Duke qenë se RN-le nuk kanë aftësi
shpjeguese është e pamundur të njihet se si një rrjet arrin në një rezultat të caktuar.
Nga shumë kritikë këto modele janë përkufizuar si „kuti-të-zeza‟. Disa modele
parashikuese tradicionale janë të pajisura me këto aftësi shpjeguese.
Në rastin e RNA ekzistenca e shumë parametrave që kërkojnë të vlerësohen shpesh
bën që të shfaqet problemi i përshtatjes së tepërt si dhe kërkon një kohë shumë herë
më të madhe se në rastin e modeleve statistikore. Shpesh herë kjo pengon që shumë
autorë të zhvillojnë studime gjithëpërfshirëse në lidhje me rrjetat neurale. Modelet
neurale i ndërtojnë bazuar në procedura trajnimi manuale (Yao, 2002).
Një tjetër arsye se pse zhvillimi i aplikimeve të rrjetave neurale në fushën ekonomike
kanë një përparim të ulët është fakti se shumë zhvillues nuk duan të lëshojnë
„sekretet‟ e tyre komerciale për arsye përfitimi.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
70
Rrjetat neural nuk janë perfekt për të gjithë problemet reale. Nuk mund të themi që
ato mund të zgjidhin çdo lloj problemi apo probleme për të cilat nuk ekziston ndonjë
metodë e suksesshme. Është një tendencë për ti përdorur rrjetat neural edhe në ato
raste kur nuk janë të përshtatshëm.
Gjithashtu duhet theksuar se suksesi i parashikimit për rrjetin neural artificial bazohet
në cilësinë dhe sasinë e të dhënave.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
71
Kapitulli 5
5 VLERËSIMI I RRJETIT NEURAL PARASHIKUES
(raste studimi)
5.1 Hyrje
Në këtë kapitull të punimit tonë tregohet praktikisht se si realizohet përzgjedhja arkitekturës
së rrjetit neural parashikues. Përzgjedhja bëhet bazuar në analiza statistikore. Gjithashtu bëhet
një analizë krahasuese e rrjetit të përzgjedhur për parashikim me metodat statistikore, për të
vlerësuar performancën e rrjetit. Një pjesë e rëndësishme në këtë pjesë të punimit është
realizimi i krahasimeve jo vetëm ndërmjet strukturave të ndryshme të rrjetit neural por edhe
ndërmjet modelit tradicional të përdorur për parashikim. Kriteret e vlerësimit të aftësive
parashikuese bëhet në zvogëlimin e gabimit të parashikimit. Eksperimentet parashikuese të
realizuar bëhen për kursin e këmbimit mujor të dollarit ndaj euros. Rezultatet eksperimentale
që janë arritur në këtë kapitull kanë ndihmuar në ngritjen e artifakteve që drejtojnë analizën
dhe dizenjimin e sistemit inteligjent për parashikim.
Ky seksion kërkon të kontribuoj në literaturën e rrjeteve neurale artificiale duke evidentuar sa
të fuqishme e të përdorshme mund të jenë ato si një mjet në procesin e vendimmarrjeve
ekonomike. Në të shqyrtohet vlefshmëria e Rrjeteve Auto regresive Jo-lineare (NAR)3 në
krahasim me modelet ARIMA, të cilat përdoren zakonisht si referencë në parashikimin e
kursit të këmbimit. Për demonstrim, ne kemi përdorur kursin e këmbimit të dollarit ndaj
euros, si një aset mjaft i luhatshëm dhe shumë i tregtuar në tregjet financiare ndërkombëtare,
e megjithatë mjaft i kontestuar në punët akademike për shkak të devijimeve shpesh të mëdha
të tij nga nivelet ekuilibër të sugjeruar nga teoritë ekonomike. Ne gjejmë se, edhe pse përmes
një aplikimi modest, modelet e rrjeteve neurale mund të shërbejnë si vlerë e shtuar e ndoshta
3 Janë të emërtuara rrjetat neurale të cilat e kryejnë parashikim bazuar në vonesat kohore të variablit të
parashikuar(kështu emërtohen dhe në MATLAB)
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
72
lënë pas modelet tradicionale në parashikimin e kursit të këmbimit. Rezultatet pohojnë se
rrjeti auto regresiv jo-linear arrin të mposhtë vazhdimisht modelin ARIMA (dhe ecjen
rastësore) në parashikimin statik të kursit të këmbimit.
I. Përdorimi i rrjetave neurale për parashikimin e Kursit të këmbimit
5.1.1 Përshkrimi i problemit
Parashikimi i serive kohore po përdoret gjithnjë e më shumë si një mjet i vlefshëm në dhënien
e informacionit në procesin e vendimmarrjes. Ai është i rëndësishëm jo vetë për menaxher të
ndryshëm, tregtarët global dhe politikë-bërësit por edhe për fusha të tjera. Megjithatë,
parashikimi i serive financiare është provuar të jetë një punë sfiduese, sidomos për seri
kohore të luhatshme të tilla si kursi i këmbimit. Duke qenë tregu më i madh e më likuid me
trilionë dollarë të shkëmbyera çdo ditë, literatura empirike bazuar në modele teorike ka hasur
shpesh në vështirësi për të thyer parashikimet nga procese më naive të ecjes rastësore.
Meqë kurset e këmbimit influencohen nga shumë faktorë ekonomik, politik e psikologjik,
është e vështirë për të identifikuar një model ekonomik unik që mund të japë parashikime të
qëndrueshme. Disa autorë pohojnë se “...fuqia shpjeguese e dobët e teorive ekzistuese të
kursit të këmbimit është e mundur të jetë dobësia kryesore e makroekonomiksit
ndërkombëtar...” (Bacchetta & Wincoop, 2006), dhe se modelet empirike të kursit të
këmbimit “...përgjithësisht dështojnë keq në testet e parashikimeve jashtë-periudhe në
kuptimin që ato dështojnë t‟ia kalojnë ecjes rastësore” (Sarno & Taylor, 2002). Edhe nëse
teoritë e kursit të këmbimit duken fondamentalisht të shëndosha, shumë kërkues fajësojnë
implementimin empirik nëpërmjet modeleve statistikore lineare për ecurinë e dëshpëruar të
parashikimit. Prandaj, ata propozojnë përdorimin e metodave me kohë të ndryshueshme ose
jo-lineare, të cilat mund të ndihmojnë për të kapur më mirë korrektimet e kursit drejt
ekuilibrit të tij afatgjatë në një mënyrë jo-lineare (Kilian & Taylor, 2001).
Në fakt, seritë e kursit të këmbimit paraqesin shpesh shenja të jo-linearitetit, për të cilat
teknikat parashikuese tradicionale nuk janë të pajisura mirë për t'i trajtuar, duke prodhuar
shpesh rezultate të pakënaqshme (Philip, Taofiki, & Bidem, 2011). Kërkuesit e përballur me
këto karakteristika u kthehen teknikave deduktive e jo-lineare. Në këtë pjesë të punimit ne
vlerësojmë fillimisht strukturën më të mirë të rrjetit neural artificial auto-regresiv jo-linear
(NAR) dhe pastaj një model auto-regresiv linear që përngjan me ecjen rastësore për të
parashikuar kursin mujor USD/EUR. Më pas kryhet një analizë krahasuese e performancave
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
73
që kanë këto dy modele me një variabël. Të dy llojet e modeleve do të krahasohen mbi bazën
e ecurisë së parashikimit, ku fokusi do të jetë mbi minimizimin e gabimit të parashikimit
jashtë-periudhe më tepër se maksimizimin e „përshtatjes sa më të mirë‟ brenda-periudhe.
Në të vërtetë, modelimi i ecjes rastësore (sipas formës yt = yt-1 + et, ku et është termi i gabimit
rastësor) mund të jetë efektiv në trajtimin e pasigurisë apo natyrës së paqëndrueshme që
karakterizon lëvizjet e kursit të këmbimit. Në vend të tij, ne do të përdorim modelin auto-
regresiv të integruar me mesatare lëvizëse (ARIMA), i cili përdoret gjerësisht si model
referimi në parashikimet dhe analizat e serive kohore. ARIMA është një nëngrup i modelimit
me një variabël, i cili supozon se karakteristikat historike të një serie kohore (d.m.th.
karakteristikat e saj sistematike strukturore) do të jenë prezentë në të ardhmen; prandaj ato
mund të jenë të volitshme për qëllime parashikimi.
Në anën tjetër, rrjetet neurale artificiale (RNA) kanë dalë në pah në dekadën e shkuar si një
metodë alternative e fuqishme për parashikimin e serive kohore për shkak të aftësive të tyre
më të larta. RNA-le janë qasje jo-parametrike të udhëhequra nga të dhënat që mund të kapin
strukturat jo-lineare për të dhënat, pa supozuar më parë mbi marrëdhënien e brendshme të një
problemi të caktuar. RNA-le mund të mësojnë nga shembujt e të demonstrojnë disa aftësi për
përgjithësimet, përtej të dhënave trajnuese. Një numër i madh studimesh që përdorin RNA-le
për parashikime mund të gjenden në literaturë. Megjithatë, rezultatet e raportuara janë shpesh
të ndryshme.
Për të pasur një pamje të shpejtë të rezultateve, vlerësimi i parashikimeve i bazuar në ME,
MAE dhe RMSE tregon se modeli i rrjeteve neurale ka qenë i aftë të japë parashikime për-
një-muaj më të mira se modeli ARIMA gjatë gjithë vitit 2014. Këto gjetje mund të jenë
mbështetje për literaturën mbi RNA-le për zbatueshmërinë e tyre në teknikat e parashikimit të
kursit të këmbimit. Në vijim, ne do të përshkruajmë fillimisht faktet bazike mbi dy
metodologjitë e përdorura në procesin tonë të parashikimit, dhe më pas do të paraqesim e të
krahasojmë rezultatet e tyre përkatëse.
5.1.2 Të dhënat për metodologjitë Konkurruese
Modelet me-një-ndryshore RNA dhe ARIMA i kemi aplikuar mbi kursin mujor USD/EUR, të
publikuara online në faqen e internetit Thomson Reuters. Analiza e të dhënave fillon nga
janari 1994 deri në dhjetor 2014 – gjithsej 252 të dhëna të vëzhguara. Për modelin ARIMA
kemi përdorur programin EViews 7. Ndërsa të gjitha matjet e pjesshme të modeleve RNA
janë zbatuar direkt në programin MATLAB 2010b, të cilin e kemi përdorur për
eksperimentet. Të dhënat e aplikuar në secilin nga modelet janë të papërpunuara. Më poshtë
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
74
kemi përshkruar veçmas të dy metodologjitë e aplikuara në këtë artikull, duke treguar
ndërkohë modelet e preferuara për secilën metodë. Modelet e përzgjedhura janë krahasuar më
pas në bazë të performancës së parashikimit një-muaj-përpara.
Figura 5-1 tregon paraqitjen grafike të kursit të këmbimit USD/EUR nga janar 1994 deri në
dhjetor 2014. Aty mund të vërehet se monedha e përbashkët evropiane ka ndjekur një trend
zhvlerësimi deri në vitin 2000, pastaj ajo ndryshoi në kahun e kundërt duke rikuperuar
humbjet deri në vitin 2007 dhe pas kësaj euro është luhatur rreth atij niveli. Me fjalë të tjera,
kursi i euros është luhatur rreth mesatares $1.33 në gjysmën e parë të kësaj dekade, krahasuar
me nivelin mjaft më të ulët prej $1.19 gjatë 16 viteve të mëparshme.
Figura 5-1: Paraqitja grafike e kursit mujor USD/EUR për periudhën janar 1994 -dhjetor 2014
0.8
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
94 96 98 00 02 04 06 08 10 12 14
5.1.3 Modelimi i Rrjetit Neural për parashikimin kursit të këmbimit
Ky seksion bën një përshkrim të metodologjisë së përdorur për modelimin e rrjeteve neurale
artificiale (RNA). Bazuar në modelimin me tetë hapa (Algoritmi 4-2) të përshkruar në
kapitullin e katërt, do të përcaktohet dhe vlerësohet struktura më e mirë e rrjetit neural për
parashikimi e kursit USD/EUR. Si fillim do të specifikohen për secilin nga hapat zgjedhjet që
janë bërë për rastin specifik të parashikimit të kursit të këmbimit dhe më pas vazhdohet me
ndërtimin e modelit auto-regresiv jo-linear (NAR) për parashikimin e kursit USD/EUR.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
75
Përzgjedhja, mbledhja dhe përpunimi i të dhënave
Siç kemi përmendur dhe më parë, kjo teknikë përcaktohet nga të dhënat që i paraqiten rrjetit,
dhe është jo-parametrike në kuptimin që nuk ka nevojë të njohë ndonjë informacion apriori
mbi procesin që prodhon sinjalin. Të dhënat e përdorur për parashikim është kursi mujor
USD/EUR. Në këtë rast do të përdoret parashikimi me një-ndryshore në të cilën parashikimi
varet vetëm nga vonesat kohore të vetë variablit të varur. Periudha e marrë në studim është
nga janar 1994 deri në dhjetor 2014 që përbëhet nga gjithsej nga 252 vlera të vëzhguara.
Është një seri e rregullt e cila nuk ka mungesa në të. Të dhënat hyrëse për modelimin e
rrjetave neurale janë vlerat e vëzhguar të vetë variablit të papërpunuara. Të dhënat e
përpunuara i japin mundësinë rrjetit neural që të nxjerrë më lehtë shembujt domethënës të
cilat mbarten në këto të dhëna (Kaastra, I. dhe Boyd, M, 1996). Por duhet theksuar që këto të
dhëna pësojnë një shkallëzim nga vetë rrjetit. Ky shkallëzim realizohet nga funksioni i
transferimit që përdorin nyjet e rrjetit neural.
Ndarja e të dhënave në trajnues, testuese dhe validuese.
Një rrjet trajnohet përmes algoritmeve me qëllim-përgjithësues. Këto algoritme bazohen mbi
seritë kohore si dhe fokusohen në llogaritjen e peshave për lidhjet midis neuroneve në një
rrjet FD për të krijuar hartën e dëshiruar të hyrje-daljeve (Zhang & Hu, 1998). Një pjesë
shumë e rëndësishme për ndërtimin e rrjetave neurale parashikuese është përcaktimi i tre
bashkësive: trajnuese, validuese dhe testuese. Bashkësia trajnuese përmban më shumë
vëzhgime pasi përdoret për të mësuar rrjetin. Bashkësia testuese përdoret për të bërë
vlerësimin e parashikimit të rrjetit jashtë-periudhe. Rrjeti më i mirë parashikues është ai që
minimizon kriterin e vlerësimit në bashkësinë testuese.
Në këtë punim është zgjedhur dhe një bashkësi e tretë, validuese, e cila shërben për të ndaluar
procesin e trajnimit në mënyrë që të shmanget përshtatja e tepërt e rrjetit me të dhënat
trajnuese dhe maksimizuar aftësitë e tij parashikuese (Bishop, 2006). Duke qenë se të dhënat
kanë një lidhje midis tyre, atë historike, ndarja e të dhëna në këtë punim është bërë në blloqe
dhe jo në mënyrë rastësore.
Të dhënat deri në vitin 2013 (240 vëzhgime) janë përdorur për të vlerësuar modelet, ndërsa
12 muajt e fundit në vitin 2014 (ose 5% e të dhënave) janë ruajtur për vlerësimin e
parashikimeve jashtë-periudhe. Gjithashtu, vëzhgimet brenda-periudhe të përdorura për
vlerësimin e modelit janë ndarë në tre pjesë: periudha e trajnimit përbën 70% të totalit, ndërsa
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
76
pjesa e mbetur është ndarë barabar ndërmjet periudhës së validimit (15%) dhe të testimit
(15%). Kjo ndarje është aplikuar për çdo rrjet neural të ndërtuar.
Struktura e një Rrjeti Neural
Topologjia e përdorur në këtë punim për rrjetat neural është FD, ose SHS, që organizohet në
tre shtresa dhe informacion rrjedh vetëm në një drejtim, (Janil & Mao, 1996) nga shtresa e
parë deri në atë të fundit pa formuar cikle në këtë arkitekturë Figure 4-2:Paraqitja e rrjetit SHS
me tre-shtresa(Figure 4-2). Fillimisht vendoset shtresa hyrëse, ku vendosen një numër i nyjesh
që korrespondon me numrin e vonesave kohore të serisë së vëzhguar që do të përdoren për të
parashikuar vlerën dalëse.
Ndërsa shtresa e fundit, e njohur si shtresa dalëse, vendosen nyje që përkojnë me numrin e
hapave të parashikimit nga rrjeti. Duke qenë se ne do të parashikojmë një muaj përpara
atëherë për të gjithë rrjetat e ndërtuar do të kemi një nyje për shtresë dalëse. Gjithashtu në të
gjithë rrjetat neural e ndërtuar kemi përdorur, ndërmjet dy shtresave të hyrjes e asaj të daljes,
vetëm një shtresë të fshehur. Nyjet e fshehura përdoren për të kapur strukturat jo-lineare të
një serie kohore. Shumë autorë kanë demonstruar se një rrjet neural prej tre shtresash me një
funksion aktivizimi logjistik në njësitë e fshehura është i aftë të realizoj një përafrim
universal me çfarë do lloj shkalle saktësie (Gonzalez S., 2000; Hines, 1996).
Shtresat kanë lidhje që lejojnë kalim e informacionit në një-drejtim mes tyre. Çdo lidhje ka
një peshë numerike që paraqet fortësinë e lidhjes ndërmjet dy neuroneve. Vlerat e peshave
fillimisht përcaktohen në mënyrë rastësore dhe nëpërmjet trajnimit ato ndryshojnë.
Numri i nyjeve në shtresën hyrëse dhe të fshehtë
Detyra më sfiduese është se si të dizajnohet një rrjet i një madhësie të përshtatshme për të
kapur karakteristikat themelore tek të dhënat e trajnuara. Eventualisht, që modeli i RNA të
jetë i përdorshëm duhet të jetë përgjithësues ose të ketë aftësi parashikuese. Përcaktimi i
numrit të nyjave të fshehura që nevojiten është një çështje tjetër që vështirëson procesin e
ndërtimit të modelit RNA.
Meqë nuk ekziston një bazë teorike të na orientojë për përzgjedhjen, në praktikë numri i
nyjave të hyrjeve e i atyre të fshehura përzgjidhet shpesh përmes eksperimentimit provo-dhe-
mat-gabimin (Zhang, Patuwo, & Hu, 1998). Numri i nyjeve në shtresën e fshehtë nuk duhet
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
77
të jetë shumë i madh pasi koha e trajnimit të rrjetit do të rritej në mënyrë eksponenciale si dhe
do të kërkohej hapësirë e madhe për ruajtjen e parametrave e rrjetit.
Për përcaktimin e numrit të nyjeve në shtresën e vetme të fshehur jemi mbështetur në
metodën provo dhe kontrollo gabimin (Panchal F., S. ; Panchal M., 2014). Provohen një
numër i ndryshëm nyjesh dhe për secilin rrjet vlerësohet saktësia e parashikimit. Gjithashtu
janë marrë parasysh dhe metodat udhëzuese të përgjithshme (Karsoliya, 2012), numri i
nyjeve në shtresën e fshehtë është midis madhësisë së shtresës hyrëse dhe shtresës dalëse, si
dhe numri i nyjeve në shtresën e fshehtë duhet të jenë sa 2/3 (nga 70%-90%) e numrit të
nyjeve hyrëse plus numrit të nyjeve dalëse.
Në këtë rast studimi, numri i vonesave kohore të përdorura si vlera hyrëse në shtresën e parë,
shtrihen nga një deri në dymbëdhjetë. Kjo kufizon që numri i neuroneve në shtresën e fshehur
duhet të jetë në të njëjtën madhësi, nga një në dymbëdhjetë, për çdo numër të nyje hyrëse.
Numri i rrjetave neurale të marra në shqyrtim për t‟u analizuar është 144 arkitektura (12x12)
të ndryshme. Ndërmjet tyre do të zgjidhet ai që përformon më mirë për të dhënat jashtë-
periudhe.
Trajnimi i rrjetit neural
Rrjeti neural mëson duke korrigjuar peshat. Algoritme të ndryshme e të mësuarit përdoren për
të trajnuar rrjetet. Për trajnimin e këtyre rrjeteve, kemi përdorur algoritmin e trajnimit
Levenberg-Marquardt (LM), në të cilin vlerat e peshave dhe nyjeve paragjykuese (bias)
përditësohen pas çdo epoke derisa të gjendet konfigurimi më i mirë i peshave. Numri
maksimal i epokave trajnuese është vendosur 1000 epoka. Një numër i gjerë studimesh të
cilët studiojnë numrin e epokave trajnuese tregojnë se konvergjenca e peshave arrihet
ndërmjet epokave nga 100 deri në 5000 (Klaussen, K. L. dhe Uhrig, J. W., 1994).
Algoritmi i trajnimi LM realizon një kombinim të dy metodave trajnuese ekzistuese asaj me
zvogëlim gradienti (të përdorur në algoritmin BP) dhe algoritmit Gauss-Njuton (GN). LM
trashëgon avantazhin e algoritmit GN duke pasur një shpejtësi konvergjimi të peshave
relativisht të lartë dhe nga metoda me zvogëlim gradienti qëndrueshmërinë e përafrimit.
Nëpërmjet një faktori të ndezjes ky algoritëm përcakton se cilin nga algoritmet do të përdoret
në një moment të caktuar të procesit të trajnimit. Nëse ky faktorë ka një vlerë të vogël
përdoret algoritmi i GN përndryshe nëse vlera e tij është e madhe atëherë metoda e përdorur
në këtë rast është zvogëlimi i gradientit.
Duke qenë se algoritmi LM i trajnimit i përditëson peshat duke përdorur edhe zvogëlim
gradienti, shpesh herë ky minimum i gjetur mund të jetë lokal dhe jo global, pra ky algoritëm
është i plotë por jo optimal. Për problemat që kanë një minimum të vetëm ky algoritëm gjen
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
78
zgjidhje më të mirë ndërsa në rastet kur kemi shumë minimume ky algoritëm konvergjon në
minimumin global vetëm në qoftë se vlerat fillestare të peshave të rrjetit janë afër zgjidhjes
më të mirë.
Për të shmangur ngecjet në minimumet lokale është e nevojshme të përdoret teknika e
simulimit të nxehjes (Annealing). Kjo teknikë ndihmon në gjetje e një zgjidhjeje të mirë, por
jo perfekt, për problemat e optimizimit duke sugjeruar aplikimin e një numri të ndryshëm
vlerash fillestare për peshat e një rrjeti neural. Në këtë punim, për secilën arkitekturë të
rrjetave neurale për parashikim, trajnimi është përsëritur dhjetë herë duke përdorur vlera
fillestare të ndryshme për peshat. Këto vlera në çdo herë janë caktuar në mënyrë rastësore për
të gjetur minimumin global. Pasi ato trajnohen, zgjidhet ajo arkitekturë rrjeti që performon
më mirë duke u bazuar në kriterin e ecurisë së vendosur.
Kriteret e vlerësimit dhe përzgjedhja e rrjetit neural më të mirë
Pasi janë përcaktuar të gjitha tiparet që duhen për të ndërtuar një rrjet neural për parashikimin
e kursit të këmbimit USD/EUR fillohet me implementimin e tyre dhe vlerësimin. Për secilën
nga strukturat e ndryshme të rrjetave të ndërtuar bëhet trajnimi nëpërmjet këtyre hapave bazë:
1. Hyrja e të dhënave për t‟u trajnuar dhe të dhënat e shenjëstruara;
2. Mëso „rregullat‟ nga koleksioni i të dhënave;
3. Përmirëso ecurinë e rrjetit duke korrigjuar peshat në mënyrë përsëritëse.
Të dhënat me të cilat bëhet trajnimi i rrjetit janë të dhënat trajnuese validuese.
Pasi rrjetat janë trajnuar atëherë bëhet vlerësimi i tyre duke përdorur të dhënat në bashkësinë
e tretë atë testuese.
Kriteret e vlerësimit të rrjetit për aftësitë parashikuese bëhen mbi rezultatin e prodhuar nga
vetë këto rrjeta kur i jepen këto të dhënat. Vlerësimi realizohet jashtë-periudhe për çdo rrjet.
Dy janë matësit e përdorur për matjen e cilësisë së rrjetit RMSE dhe MAE4. Ndër rrjetat e
testuar zgjidhet si më i mirë, për parashikimin jashtë periudhe, ai që rezulton me vlerën më të
vogël të RMSE dhe MAE në këtë periudhë.
4 Akronimet tregojnë rrënjën e mesatares së katrorit të gabimeve (RMSE), dhe mesataren e gabimeve absolute
(MAE).
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
79
Figure 5-2: Dizenjimi i rrjetit neural parashikimit për kursin e këmbimit USD/EUR
Seria kohore origjinale e USD/EUR
Te dhena trajnuese (70%)
Te dhena validuese (15%)
Te dhena testuese (15%)
Përcaktohet
struktura e NN1
- Tipi i lidhjeve mes shtresave
- Nr nyjeve në shtresë e fshehtë
- Nr nyjeve në shtresë hyrëse
- Funksioni i ativizimit
Përcaktohet Alg. I
Trajnimit
Trajnohet çdo 1..10 rrjetat
të strukturës NN1
- Nr i epokave të trajnimt
- Shkalla e të mësuarit
- Termi i shpejtësisë
- Kriteri i Vlerësimit (KV)
Persa kohë që nuk është arritur asnjë
kriterë ndalimi
inicializim të peshave 1..10
Jo
Po
Simulohet dhe
parashikohet me secilin
nga NN1 duke llogaritet
vlera e KV
Identifikohet rrjeti më i
mirë për këtë strukturë të
NN1
Rrjete Neural Parashikues
1..144
Fillimi i modelimit të NN më të mire
Rezultatet e parashikimit për
secilën nga 144 NN ruhen në DB
..Fund Modelimi..
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
80
Në Figure 5-2 të mësipërme tregohet skematikisht se si realizohet trajnimi dhe përzgjedhja e
rrjetit neural më të mirë për kursin e këmbimit USD/EUR. Kjo skemë shërben si material
bazë për fazën pasardhëse të implementimit apo ndërtimit të programit.
5.1.4 Implementimi rrjetit neural parashikues për kursin USD/EUR
Ndërtimi i rrjetave neural është bërë në programin MATLAB 2010b. Rrjetat të cilët
parashikojnë bazuar vetëm në vonesat kohore të vetë variablit të varur në matlab njihen me
emrin rrjetat NAR (Nonlinear AutoRegressive). Ky lloj rrjeti është përdorur dhe në punimin
tonë. Për të trajnuar secilin nga rrjetat është zbatuar algoritmi i mëposhtëm:
Tabela 5-1 tregon rezultatet për 144 strukturat e vlerësuara të rrjeteve neurale dhe ecurinë
përkatëse të parashikimit një-muaj-para gjatë vitit 2014. Nga rezultatet del se struktura e
rrjetit neural 11-12-1, e cila përfshin njëmbëdhjetë vonesa kohore dhe dymbëdhjetë shtresa të
fshehura, është rrjeti më i përsosur që predikon më saktë se të tjerët kursin për muajin e
ardhshëm. Të dy matësit për vlerësimin e parashikimeve, RMSE dhe MAE, tregojnë se
gabimet e parashikimeve të përftuara nga rrjeti 11-12-1 janë më të ulëtat krahasuar me rrjetet
e tjera NAR.
Algoritëm StrukturaMë_e_Mirë_e_Rrjetit_NARi
1. Përcaktohen të dhënat për trajnimin yt, validimin yv dhe të testimit ytest për rrjetin i
2. minRMSE //për të gjetur rrjetin që e gjeneron
3. Për nrvlerashfillestare nga 1 deri në 100
4. { Për të gjitha peshat 𝑤𝑗𝑙𝐻 , 𝑤𝑖𝑗
𝐼 dhe nyjet paragjykuese bH,b
I vendosen vlera
rastësore
5. Të dhënat trajnuese yt organizohen për t‟u përshtaten strukturës së rrjetit i
6. Përcaktohen shkalla e të mësuar dhe termi i shpejtësisë për Alg. e trajnimit si
dhe numri i epokave të trajnimit.
7. Trajnohet(rrjeti i)
8. Llogaritet RMSE dhe MAE për të dhënat ytest
9. Nqs RMSE është më e vogël se minRMSE ath
10. { ruhet rrjeti që rezulton me RMSE më të vogël;
11. ruhen dhe vlerat e RMSE dhe MAE;
12. }
13. }
14. Return rrjetMeRMSEmëTëvogël
Algoritmi 5-1: Algoritmi për zgjedhje e rrjetit më të mirë për një strukturë të caktuar
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
81
Tabela 5-1: Performanca statistikore e rrjetit NAR për kursin USD/EUR
NR Stuktura e rrjetit RMSE MAE
NR
Stuktura e rrjetit RMSE MAE
NR
Stuktura e rrjetit RMSE MAE
NR
Stuktura e rrjetit RMSE MAE
1 1-1-1 0.0157 0.0123
37 4-1-1 0.0162 0.0136
73 7-1-1 0.0123 0.0093
109 10-1-1 0.0147 0.0119
2 1-2-1 0.0178 0.0144
38 4-2-1 0.0149 0.0122
74 7-2-1 0.0139 0.0113
110 10-2-1 0.0125 0.0096 3 1-3-1 0.0166 0.0133
39 4-3-1 0.0125 0.0107
75 7-3-1 0.0137 0.0111
111 10-3-1 0.0140 0.0121
4 1-4-1 0.0160 0.0128
40 4-4-1 0.0138 0.0113
76 7-4-1 0.0120 0.0101
112 10-4-1 0.0130 0.0109
5 1-5-1 0.0176 0.0141
41 4-5-1 0.0142 0.0117
77 7-5-1 0.0128 0.0101
113 10-5-1 0.0121 0.0093
6 1-6-1 0.0169 0.0133
42 4-6-1 0.0130 0.0113
78 7-6-1 0.0132 0.0100
114 10-6-1 0.0131 0.0114
7 1-7-1 0.0165 0.0133
43 4-7-1 0.0138 0.0109
79 7-7-1 0.0147 0.0135
115 10-7-1 0.0120 0.0098
8 1-8-1 0.0178 0.0144
44 4-8-1 0.0129 0.0101
80 7-8-1 0.0159 0.0124
116 10-8-1 0.0141 0.0099
9 1-9-1 0.0192 0.0150
45 4-9-1 0.0138 0.0115
81 7-9-1 0.0130 0.0105
117 10-9-1 0.0118 0.0091
10 1-10-1 0.0178 0.0147
46 4-10-1 0.0128 0.0101
82 7-10-1 0.0138 0.0100
118 10-10-1 0.0118 0.0093
11 1-11-1 0.0175 0.0150
47 4-11-1 0.0141 0.0113
83 7-11-1 0.0117 0.0094
119 10-11-1 0.0121 0.0095
12 1-12-1 0.0181 0.0152
48 4-12-1 0.0135 0.0109
84 7-12-1 0.0136 0.0107
120 10-12-1 0.0113 0.0083
13 2-1-1 0.0149 0.0123
49 5-1-1 0.0154 0.0128
85 8-1-1 0.0133 0.0102
121 11-1-1 0.0129 0.0104
14 2-2-1 0.0137 0.0104
50 5-2-1 0.0140 0.0113
86 8-2-1 0.0133 0.0102
122 11-2-1 0.0135 0.0102
15 2-3-1 0.0140 0.0114
51 5-3-1 0.0140 0.0114
87 8-3-1 0.0122 0.0087
123 11-3-1 0.0106 0.0083
16 2-4-1 0.0139 0.0114
52 5-4-1 0.0129 0.0109
88 8-4-1 0.0127 0.0103
124 11-4-1 0.0132 0.0105
17 2-5-1 0.0123 0.0090
53 5-5-1 0.0138 0.0114
89 8-5-1 0.0124 0.0095
125 11-5-1 0.0126 0.0090
18 2-6-1 0.0125 0.0091
54 5-6-1 0.0116 0.0090
90 8-6-1 0.0122 0.0098
126 11-6-1 0.0115 0.0096
19 2-7-1 0.0129 0.0102
55 5-7-1 0.0127 0.0104
91 8-7-1 0.0175 0.0146
127 11-7-1 0.0132 0.0106
20 2-8-1 0.0132 0.0102
56 5-8-1 0.0138 0.0114
92 8-8-1 0.0120 0.0097
128 11-8-1 0.0126 0.0114
21 2-9-1 0.0125 0.0106
57 5-9-1 0.0122 0.0101
93 8-9-1 0.0152 0.0122
129 11-9-1 0.0134 0.0114
22 2-10-1 0.0144 0.0117
58 5-10-1 0.0125 0.0100
94 8-10-1 0.0138 0.0112
130 11-10-1 0.0111 0.0087
23 2-11-1 0.0129 0.0109
59 5-11-1 0.0127 0.0108
95 8-11-1 0.0133 0.0100
131 11-11-1 0.0149 0.0111
24 2-12-1 0.0125 0.0094
60 5-12-1 0.0135 0.0113
96 8-12-1 0.0132 0.0102
132 11-12-1 0.0105 0.0079
25 3-1-1 0.0157 0.0130
61 6-1-1 0.0154 0.0128
97 9-1-1 0.0150 0.0127
133 12-1-1 0.0157 0.0135
26 3-2-1 0.0144 0.0115
62 6-2-1 0.0150 0.0123
98 9-2-1 0.0134 0.0108
134 12-2-1 0.0156 0.0135
27 3-3-1 0.0143 0.0116
63 6-3-1 0.0130 0.0104
99 9-3-1 0.0147 0.0122
135 12-3-1 0.0135 0.0105
28 3-4-1 0.0163 0.0139
64 6-4-1 0.0126 0.0099
100 9-4-1 0.0146 0.0108
136 12-4-1 0.0129 0.0116
29 3-5-1 0.0146 0.0119
65 6-5-1 0.0134 0.0107
101 9-5-1 0.0157 0.0128
137 12-5-1 0.0126 0.0086
30 3-6-1 0.0143 0.0116
66 6-6-1 0.0119 0.0100
102 9-6-1 0.0126 0.0101
138 12-6-1 0.0116 0.0093
31 3-7-1 0.0131 0.0099
67 6-7-1 0.0132 0.0107
103 9-7-1 0.0123 0.0099
139 12-7-1 0.0120 0.0091
32 3-8-1 0.0139 0.0112
68 6-8-1 0.0124 0.0099
104 9-8-1 0.0156 0.0128
140 12-8-1 0.0133 0.0095
33 3-9-1 0.0145 0.0120
69 6-9-1 0.0137 0.0110
105 9-9-1 0.0177 0.0138
141 12-9-1 0.0181 0.0151
34 3-10-1 0.0146 0.0120
70 6-10-1 0.0140 0.0118
106 9-10-1 0.0135 0.0108
142 12-10-1 0.0138 0.0100
35 3-11-1 0.0126 0.0103
71 6-11-1 0.0113 0.0090
107 9-11-1 0.0120 0.0099
143 12-11-1 0.0126 0.0086
36 3-12-1 0.0154 0.0132
72 6-12-1 0.0125 0.0103
108 9-12-1 0.0126 0.0102
144 12-12-1 0.0159 0.0135
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
82
5.1.5 Modeli ARIMA
Ndryshe nga modelet shumë-variabëlshe me ndryshore shpjeguese që mbështeten në teoritë
ekonomike, ARIMA është një model i pastër statistikor, në të cilin seria kohore regresohet
mbi vlerat e veta të mëparshme (komponenti auto-regresiv) plus vlerat e tashme e të kaluara
të termit të „bardhë‟ të gabimit (komponenti i mesatares lëvizëse) (Meylar, Kenny, & Quinn,
1998). Kështu, për nga natyra e tyre modelet ARIMA ofrojnë pak logjikë ekonomike;
predikimet për të ardhmen formohen ekskluzivisht nga informacioni i ruajtur në lëvizjet e
kaluara dhe gabimet e parashikimit. Por, pavarësisht të qenit me “kokën mbrapa” dhe jo fort
të mirë në predikimin e një pike kthese, modelet ARIMA shpesh ua kalojnë predikimeve të
modeleve me shumë ndryshore, veçanërisht në afatin e shkurtër.
Një mënyrë e përgjithshëm për shprehjen e këtij modeli është ARIMA (p, d, q), ku p është
numri i termave auto-regresiv, d tregon operatorin e diferencës (numri i diferencave që
nevojitet për të konvertuar serinë një nivel stacionar), dhe q është rendi i termave të mesatares
lëvizëse në model. Meqë shumë të dhëna ekonomike, përfshirë kursin e këmbimit, përmbajnë
sezonalitet të ndryshueshëm e të paqartë do të ishte e rëndësishme të testonim specifikimin
standard ARIMA me ndryshore cilësore sezonale shtesë.
Në praktikë, kemi ndjekur këto hapa për të përcaktuar modelin parashikues ARIMA më të
mirë. Në fillim testojmë rendin e integrimit, nëse të dhënat janë stacionare apo nëse kërkohet
diferencimi i tyre. Pastaj vlerësojmë regresione të ndryshme deri sa të identifikohet
kombinimi më i mirë ARIMA, bazuar në teste diagnostikimi të caktuara. Në këtë hap,
vëmendje e veçantë i kushtohet jo vetëm karakteristikave të mira brenda-periudhe të modelit,
por edhe ndaj ecurisë së parashikimit të tyre dhe numrit të parametrave që përfshihen në
model.
Në paraqitjen grafike të kursit të këmbimit USD/EUR mund të vërehet se monedha e
përbashkët evropiane ka ndjekur një trend zhvlerësimi deri në vitin 2000; pastaj ajo ndryshoi
në kahun e kundërt duke rikuperuar humbjet deri në vitin 2007; pas kësaj euro është luhatur
rreth atij niveli. Me fjalë të tjera, kursi i euros është luhatur rreth mesatares $1.33 në gjysmën
e parë të kësaj dekade, krahasuar me nivelin mjaft më të ulët prej $1.19 gjatë 16 viteve të
mëparshme. Ndërkaq, koeficienti i saj i variacionit ka qenë përgjithësisht i kontrolluar në
vetëm 4.1 gjatë periudhës pas krizës globale, nivel ky rreth katër herë më i ulët se periudha
para krizës.
Ngjashëm me këtë përfundim, testet e rrënjës njësi tregojnë që kursi USD/EUR është jo-
stacionar në nivel. Testet ADF dhe Phillips-Perron shfaqin, megjithatë, se seria mund të bëhet
stacionare rreth konstantes (dhe trendit) nëse diferencohet një herë. Rezultatet e ndryshme
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
83
qëndrojnë për të gjithë periudhën e vëzhguar, ashtu dhe për nën-periudhën që fillon prej vitit
2000. Prandaj, kursi i euros do të hyjë në modelin ARIMA në diferencë të parë.
Tabela 5-2: Testet Unit Root mbi kursine e këmbimit USD/EUR
ADF test results Phillips-Perron test results
Null Hypothesis: Unit root Null Hypothesis: Unit root
Levels 1st difference Levels 1st difference
Variables Prob. Laga Prob. Lag
a Prob. Bandwidth
b Prob. Bandwidth
b
1994M01:2014M12
With constant 0.3000 1 0.0000 0 0.3854 5 0.0000 1
With constant and trend 0.5571 1 0.0000 0 0.6542 5 0.0000 1
None 0.6590 1 0.0000 0 0.6672 5 0.0000 1
2000M01:2014M12
With constant 0.3948 1 0.0000 0 0.4649 4 0.0000 1
With constant and trend 0.6792 1 0.0000 0 0.7898 4 0.0000 1
None 0.7277 1 0.0000 0 0.7443 4 0.0000 2
aAutomatic selection of lags based on SIC;
bNewey-West bandwidth selection using Bartlett kernel
Pas përcaktimit të rendit të integrimit, I(1), jemi përpjekur të identifikojmë komponentët e
tjerë AR dhe MA të përshtatshëm për modelin tonë, duke u mbështetur në vlerësime formale
të testeve të caktuara diagnostike dhe në aftësinë parashikuese të çdo specifikimi potencial.
Prej disa metodave identifikuese alternative për përcaktimin e parametrave p dhe q ne kemi
ndjekur kriteret e penalitetit të funksionit, të cilët edhe pse nuk ofrojnë ndonjë udhëzim teorik
për përzgjedhjen e rendit maksimal të ARIMA-s, ata janë të përputhshme asintotikisht dhe jo
të bazuar në interpretime subjektive. Kriteret e penalitetit të funksionit të tilla si statistikat
Akaike, Schwartz dhe Hannan-Quinn ndihmojnë në përzgjedhjen e modelit me shumën e
gabimeve në katror më të minimizuar. Megjithatë, theksi ynë në fund ishte mbi ecurinë e
parashikimeve, e cila sugjeron vëmendje më të madhe mbi minimizimin e gabimeve të
parashikimit jashtë-periudhe sesa mbi maksimizimin e „përshtatjes së mirë‟ brenda-periudhe
– apo R2 i korrektuar (Meylar, Kenny, & Quinn, 1998).
Në praktikë, ne vlerësuam forma të ndryshme ARIMA me duzinë vonesash AR e MA dhe me
ndryshore cilësore sezonale, të cilat u testuan vazhdimisht për shpërndarjen normale,
korrelacionin serial dhe heteroskedasticitetin tek mbetjet. Periudha e vlerësuar mbulon janar
1994 deri në dhjetor 2013, kurse të dhënat e vrojtuara në 2014 u ruajtën për të vlerësuar
ecurinë e parashikimit jashtë-periudhe. Ndodhi që mbushja e modelit me shumë parametra
rriste fuqinë shpjeguese brenda-periudhe por dobësonte testet diagnostike dhe/ose aftësinë
parashikuese jashtë-periudhe. Prandaj ne në fund ruajtëm një model të kursyer me numrin më
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
84
të vogël të mundshëm të parametrave. Termi i konstantes e gjithashtu ndryshoret cilësore
sezonale qëndruan në model meqenëse, edhe pse jo fort të rëndësishme statistikisht, ato
dukeshin se ndihmonin në përmbushjen e kritereve të përmendura më lart. Struktura e
modelit tonë të preferuar është ARIMA sezonale (7, 1, 48), vlerësuar nëpërmjet metodës së
kursyer të Katrorëve më të Vegjël të Kushtëzuar ARMA (Marquardt) sipas specifikimit më
poshtë:
(USDEUR) = 0.35*AR(1) – 0.16*AR(2) + 0.08*AR(3) – 0.12*AR(7) – 0.28*MA(48) + 0.01*c + sezon
Prob koeficien. 0.00 0.02 0.23 0.07 0.00 0.16 0.36
R2-axhust. = 0.12 Gabimi standard i regresionit = 0.0277
Shpërndarja normale: prob. testit JB = 0.15
Korrelacioni serial: testi LM, probabiliteti Chi2(12) = 0.55
Heteroskedasticiteti: testi BPG, probabiliteti Chi2(11) = 0.53
ku „‟ përfaqëson operatorin e ndryshimit; c tregon konstanten; dhe sezon është për 11
variablat cilësore të sezonalitetit të përfshira në specifikim. Shumica e termave të përzgjedhur
autoregresiv e të mesatares lëvizëse janë të rëndësishëm statistikisht, siç tregohet nga
propabilitetet poshtë secilit koeficient. Analiza në vijim diskuton se si krahasohet kjo me
ecurinë e parashikimit të modelit NAR 11-12-1 që vlerësuam më lart.
5.1.6 Krahasim i aftësisë parashikuese të modeleve
Matësit e zakonshëm për vlerësimin dhe krahasimin e fuqisë parashikuese të një modeli janë
Gabimi Mesatar (ME), Mesatarja e Gabimeve Absolute (MAE), Rrënja e Mesatares së
Katrorit të Gabimeve (RMSE), dhe statistika U e Theil-it. Matësi i parë, ME, jep indikacione
mbi tendencën për të mbivlerësuar (nënvlerësuar) zhvillimet aktuale të kursit të këmbimit. Dy
matësit e tjerë, MAE dhe RMSE, janë të vlefshëm për ekzaminimin e madhësisë së gabimeve
të parashikimit. MAE nënkupton se përkeqësimi i gabimeve rritet në proporcion me MAE
(p.sh. gabimi 2 përqind është 2 herë më serioz se gabimi 1 përqind), ndërsa RMSE supozon
se gabimet më të mëdha të parashikimit janë më keq se ato më të vogla. Matësi i fundit, U e
Theil-it, është një tregues tërheqës mbi saktësinë relative, i cili na mundëson të kuptojmë nëse
teknikat parashikuese të aplikuara këtu janë më të mira, të mira si, apo më keq se një
hamendje e thjeshtë.
Siç përmendëm më parë, periudha e vlerësimit të parashikimit për të dy modelet konkurruese,
ARIMA dhe rrjeti NAR, është përzgjedhur qëllimshëm për vëzhgimet jashtë-periudhe. Kjo
është një procedurë e zakonshme mes parashikuesve, të cilët besojnë se evidencat e aftësisë
parashikuese brenda-periudhe nuk garanton parashikueshmëri të kënaqshme jashtë-periudhe
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
85
(Inoue & Kilian, 2002). Prandaj, për të shmangur çdo mundësi të përfundimeve të rreme,
krahasimi i fuqisë parashikuese të modeleve tona të përzgjedhura është realizuar për
periudhën janar-dhjetor 2014, e cila nuk është përdorur gjatë vlerësimit të regresioneve apo
në procesin e testimit.
Figure 5-3 paraqet kursin e këmbimit USD/EUR gjatë vitit 2014 dhe 12 parashikimet e tij një-
muaj-përpara sipas modeleve ARIMA (7,1,48) dhe NAR (11-12-1), si dhe një parashikim
naiv që supozon „asnjë ndryshim‟ në muajin pasardhës. Një inspektim i shpejtë vizual
sugjeron për një ecuri më të mirë të modelit të rrjetit neural, meqenëse parashikimet nga NAR
duken përgjithësisht më afër me vëzhgimet aktuale se vlerat e tjera të parashikuara. Nga ana
tjetër, nuk duket qartë nëse predikimet nga ARIMA ua kalojnë vlerave të hamendjeve naive.
Në të vërtetë, vlerat e parashikuara nga ARIMA tentojnë të alternojnë pozicionin e tyre deri
në korrik, po mbeten përmbi vëzhgimeve aktuale (d.m.th. gabime pozitive) më pas. Kjo
nënkupton se modeli ARIMA na ka dhënë parashikime robuste në kohë më normale, por
pastaj e ka tejparashikuar kursin USD/EUR e ka qenë i ngadaltë në kapjen e trendit të ri në
gjysmën e dytë të vitit, gjatë së cilës Banka Qendrore Evropiane i ngacmoi tregjet me shenja
paralajmëruese për inicimin e programit të lehtësimit sasior të parasë5.
Figure 5-3: Parashikimi jashtë-periudhe i kursit USD/EUR për 12-muaj
5“Markets rally after Draghi QE hint”, artikull në Financial Times, 25 gusht 2014. Gjithashtu shih artikullin
“ECB meeting recap: Draghi hints at more easing action next year”, në blogs.marketwatch.com, 4 dhjetor 2014.
1.20
1.22
1.24
1.26
1.28
1.30
1.32
1.34
1.36
1.38
1.40
Actual data ARIMA forecast NAR forecast Naive forecast
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
86
Tabela 5-3:Vlerësimi i parashikimeve të kursit USD/EUR
12 periudha një-muaj-përpara, Janar deri Dhjetor 2014
ARIMA(7,1,48) NAR 11-12-1
Mean Error 0.0115 -0.0008
Mean Absolute Error 0.0159 0.0079
Root Mean Squared Error 0.0181 0.0105
Theil‟s U statistic 0.9921 0.5748
Tabela 5-3 paraqet matësit për vlerësimin e parashikimeve të modeleve ARIMA dhe NAR.
Vërehet se rezultatet konfirmojnë superioritetin e teknikës NAR sipas të gjithë matësve.
Mesatarja e gabimeve të tij është pranë zeros – ose më saktë, më pak se një e dhjeta e një
centi – duke sugjeruar se mesatarisht, NAR nuk ka mbivlerësuar e as ka nënvlerësuar kursin e
këmbimit gjatë vitit 2014. Përkundër tij, mesatarja e gabimeve të parashikimeve nga modeli
ARIMA, edhe pse i moderuar, tregon një shmangie të parashikimeve ndaj aktualeve me 1.15
cent gjatë të njëjtës periudhë.
Madhësia e ME në modelin ARIMA është rreth tre-të-katërtat e MAE, duke sugjeruar se
modeli nuk predikon vazhdimisht shumë lart. Por përsëri, ky raport është vetëm një-e-dhjeta
në rastin e modelit NAR. Përfundime të ngjashme arrihen edhe kur vërejmë madhësitë e
matësve MAE dhe RMSE, të cilët tregojnë se gabimet e parashikimeve më të mëdha duhet të
merren më seriozisht në rastin e modelit ARIMA, dhe më pak në rastin e rrjetit neural.
Së fundi, statistika Theil në rreshtin e fundit të tabelës paraqet se si krahasohen të dy modelet
me një pritje naive (d.m.th. nëse supozojmë se kursi i këmbimit në muajin tjetër do të jetë i
njëjtë si këtë muaj). I llogaritur si raporti i RMSE-së së modelit ARIMA (NAR) ndaj RMSE-
së së modelit naiv, statistika Theil më e madhe se një do të sugjeronte se parashikimet e
modeleve tona të vlerësuara ecin më keq se një model me ecje të rastësishme. Kjo statistikë
për modelin ARIMA është pranë njëshit, duke na thënë se – ashtu si inspektimi i grafikëve –
predikimet e tij në vitin 2014 ishin mesatarisht jo më të mira se një hamendje „asnjë
ndryshim‟ i kursit. Në anën tjetër, predikimet nga NAR shfaqen të tejkalojnë edhe modelin
naiv, arsyetimet e të cilit për kursin në muajin pasardhës janë dy herë më të gabuara.
5.1.7 Vërejtje përfundimtare
Në këtë seksion përpiqemi të kontribuojmë në literaturën e rrjeteve neurale duke demonstruar
se sa e fuqishme dhe e vlefshme mund të jenë ato në procesin e vendimmarrjeve ekonomike e
financiare. Për të demonstruar këtë, ne zgjodhëm kursin USD/EUR si një aset mjaft i
luhatshëm e shumë i përdorur në transaksionet e tregjeve financiare globale, e megjithatë
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
87
shumë i debatuar në punimet akademike për shkak të devijimeve shpesh të mëdha të tij nga
nivelet fondamentale të sugjeruara nga teoritë ekonomike.
Ne ishim në gjendje të tregojmë, edhe pse përmes një aplikimi modest, se modelet e rrjeteve
neurale mund të kenë vlerë të shtuar e ndoshta të tejkalojnë modelet tradicionale të përdorura
për parashikimin e kursit të këmbimit. Rezultatet janë afirmative se rrjeti autoregresiv jo-
linear thyente vazhdimisht parashikimet statike të modelit ARIMA (dhe të ecjes rastësore)
për kursin euro-dollar. Megjithatë, përveç teknikave autoregresive dhe parashikimeve statike,
kjo punë kërkimore mund të zgjerohet më tej duke përfshirë modele më të avancuara të
bazuara në fondamente ekonomike e gjithashtu të bëhen krahasime edhe për parashikime
dinamike.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
88
Kapitulli 6
6 ANALIZA DHE DIZENJIMI I RRJETIT NEURAL PARASHIKUES
PËR KURSIN E KËMBIMIT
6.1 Hyrje
Në këtë pjesë të punimit tonë përshkruajmë analizën dhe dizenjimin që duhet ndjekur për të
zhvilluar sistemin inteligjent parashikues (SIP) bazuar në përqasjen e rrjetave neurale. Hapat
e ndjekur për zhvillimin e sistemit janë në përputhje me teknikat e disiplinës së inxhinierimit
të softuerëve. Bazuar në të, duhet që çdo softuer të ndërtohet nëpërmjet aktiviteteve të
ndryshme të ciklit të tij jetësorë6. Aktivitetet mund të përsëriten dhe organizohen në forma të
ndryshme përgjatë zhvillimit dhe mirëmbajtjes së softuerit, në përputhje me karakteristikat e
tij. Trajtimi i zhvillimit të softuerit në këtë mënyrë përbën një vlerë të shtuar të këtij
disertacion.
Pavarësisht se rrjetat neurale kanë gjetur një përdorim të gjerë në probleme të ndryshme,
shpeshherë zhvillimin softuerik që i bëhet ndërtimit të aplikacioneve që përdorin rrjetat
neurale ndeshet me mangësi. Në përgjithësi në punime të shumta, softuerët të mbështetur në
ndërtimin e rrjetave neurale zhvillohen me anë të modelit të procesit „ndërto-dhe-rregullo‟.
Ripërdorimi i këtyre softuerëve, të ndërtuar me anë të këtij modeli, do të ishte i vështirë nëse
nuk do të zotëroheshin njohuri të mjaftueshme dhe eksperiencë mbi përdorimin e rrjetat
neurale. Një çështje e rëndësishme është dhe adresimi që i bëhet praktikave të inxhinierimit të
softuerit për zhvillimin e rrjetave neurale. Zhvillimi i sistemit inteligjent do të përdorë një
sërë metodash dhe teknikash të disiplinës së inxhinierimit për të ndërtuar dhe vlerësuar rrjetat
neurale për parashikim. Këto teknika dhe metoda, në të shumtën e rasteve, do të aplikohen në
mënyrë të përsëritur në faza dhe pjesë të ndryshme të softuerit.
6 Ka të bëjë me ndarjen hap-pas-hapi të procesit të zhvillimit të softuerit në një bashkësi aktivitetesh.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
89
Një çështje e rëndësishme, në lidhje me analizën dhe dizenjimin, është inxhinierimi i
komponentëve të përgjithshëm të rrjetit neural në mënyrë të pavarur nga specifikat e fushës
së problemit duke bërë që softueri të ketë një përdorueshmëri më të gjerë. Ky softuer do të
mbështetet në topologjinë e rrjetave neurale SHS-e dhe trajnimi i tyre do të bëhet me
mënyrën e mbikëqyrur. Seria kohore që përdoret në këtë softuerë është me një-ndryshore, të
zhurmshme, me luhatshmëri të madhe dhe jo-stacionare.
6.2 Qëllimi i softuerit
Qëllimi i softuerit është të automatizojë gjenerimin e topologjisë së rrjetit neural më të mirë
për parashikimin e kursit të këmbimit si dhe mënyrën më të përshtatshme të përpunimit
paraprak të serisë kohore me një-ndryshore. Përzgjedhja automatike e rrjetit më të mirë do të
bëhet mbështetur mbi aftësitë e tij për të parashikuar. Softueri duhet të përcaktojë vetë se
kush do të jetë algoritmi i trajnimit më i mirë për të mësuar rrjetin, në lidhje me dy kritere
bazë: (i) në lidhje me saktësinë parashikuese të rrjetit si dhe (ii) me kohën e nevojshme për të
realizuar trajnimin e tij. Automatizimi do të bëhet mbështetur mbi serinë kohore që i paraqitet
rrjetit neural. Seria kohore është me një-ndryshore dhe kërkohet të parashikohet jashtë
periudhe një hap7 përpara.
Objektivat kryesore të sistemit inteligjent parashikues janë:
Të parashikoj vlera të ardhshme të serisë kohore, me një-ndryshore, një numër të
caktuar hapash që përcaktohen nga përdoruesi.
Të mund të përcaktojë një para-përpunim të serisë kohore bazuar në ecurinë e aftësisë
parashikuese të rrjetit.
Të ruajë modelet e suksesshme parashikuese për një seri kohore të dhënë që të
mundësojë ripërdorimin e tyre nëse kërkohen parashikime në kohë të ndryshme.
Nëse seria kohore rritet atëherë softueri duhet të ri-mësoj modelin parashikues me të
dhënat e reja për të rritur aftësitë parashikuese.
6.3 Organizimi i zhvillimit të sistemit inteligjent
Teknologjitë e reja shpesh kërkojnë një metodë modelimi dhe zhvillim të ri ose të përshtatur.
Në momentin që ne kuptojmë se çfarë është ndryshe në këto teknologji mund të përcaktojmë
7 Lidhet me frekuencën e serisë kohore nëse ajo është p.sh ditore, javore etj.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
90
dhe mënyrën se si duhen përshtatur metodat ekzistuese. Projektet që përdorin RN-le
ndryshojnë nga projektet softuerike tradicionale (Tarassenko, 1998) dhe kjo në disa aspekte
si:
Ato janë të drejtuar nga të dhënat, për këtë arsye mbledhja dhe analiza e të
dhënave duhet të jetë pjesë e procesit të modelimit dhe trajnimit të rrjetit.
Nuk mund të përcaktohet zgjidhja e plotë që në fazën e modelimit. Për këtë
ndërtohen prototipa të cilët vlerësohen për të gjykuar mbi elementët e
përfshirë në modelim.
Efektshmëria e rrjetit është më e rëndësishme se shpejtësia përllogaritëse.
Kujdesi për performancën tregohet që në fazën e analizës, dizenjimit dhe
testimit.
Bazuar në këto aspekte është e nevojshme që dhe zhvillimi i tyre duhet të ndryshojë nga
zhvillimi i softuerëve tradicionale për të adresuar më mirë këto tipare. Ngjashmëria me
dizenjimin e softuerëve të zakonshëm është se, për të zhvilluar një softuer që përdorë RNA-e
të suksesshëm, duhet që cikli i tij jetësorë të përbëhet nga 6 faza kryesore (Basheer I.A. dhe
Hajmeer M,, 2000): Përcaktimi dhe formulimi i problemit, dizenjimi, realizimi i sistemit,
vlerësimi (validimi) dhe verifikimi, implementimi dhe mirëmbajtja (Figure 6-1 ).
Figure 6-1: Cikli jetësore i ndërtimit të SIP
Këto faza ndiqen për çdo pjesë të sistemit. Por detyrat që kryhen për çdo fazë ndryshojnë në
varësi të tipit dhe karakteristikave të modulit që zhvillohet. Gjithashtu theksojmë se për pjesë
të caktuara të sistemit këto faza kanë një rrjedhshmëri të ndryshme ndërmjet tyre. Mënyra se
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
91
si organizohen këto faza dhe se si ato komunikojnë me njëra-tjetrën përbëjnë dhe modelin e
procesit inxhinierues të zhvillimit të softuerit.
Suksesi i një modeli procesi mbështetet shumë në mjetet që përdoren për të paraqitur atë. Për
të dhënë një pamje të përgjithshme të procesit, një mënyrë shumë e përdorshme është
nëpërmjet paraqitjes grafike të hapave përpunues të informacionit bazë të sistemi.
Për të menaxhuar më mirë kompleksitetin e sistemit tonë kemi bërë ndarjen e sistemit në
pjesë më të vogla të quajtura module. Përpunimi i informacionit në secilën nga modulet është
i pavarur nga të tjerët. Modulimi bën të mundur që secili nga modulet të analizohet,
zhvillohet dhe testohet në mënyrë të pavarur. Gjithashtu kjo mënyrë e ndërtimit të sistemit
rrit mundësinë e ripërdorimit të moduleve, në zgjidhjen e problemave të tjerë të ngjashëm apo
dhe të lokalizimit të ndryshimeve në module pa qenë i nevojshëm rikonceptimi i sistemit në
tërësi.
Një çështje e rëndësishme e trajtuar në këtë punim është përdorimi i metodave të validimit
dhe verifikimit për rrjetat neurale të ndërtuar, si dhe vendosja e disa udhëzimeve për të
drejtuar përzgjedhjen e parametrave. Për këto elementë nuk ekzistojnë metoda standarde
prandaj dhe sugjerimet e realizuara në këtë punim janë rezultat i një procesi kërkimorë dhe
analizues. Në seksionin e mëposhtëm bëhet analiza e sistemit tonë.
6.4 Specifikimi dhe analiza e problemit
Në bazë të analizës së bërë ndaj fushës së aplikimit të SIP janë përcaktuar qëllimi dhe
kufizimet e sistemit. Gjithashtu janë bërë vlerësimet e pikave dhe kritereve që duhen
analizuar dhe trajtuar në fazat e mëtejshme. Pasi është përcaktuar qëllimi kryesorë i SIP është
e nevojshme të përcaktohen se cilat janë funksionet kryesore që do të kryejë sistemi ynë si
dhe kush janë aktorët kryesore që ndërveprojnë me sistemin.
Ashtu siç shihet dhe në Figure 6-1 jepen aktivitetet kryesore të ciklit jetësorë të zhvillimit të
SIP, faza e parë është specifikimi dhe formulimi i problemit. Në këtë fazë është e nevojshme
të mund të analizohen dhe ndërthuren informacione të fushës së problemit, që merren nga
ekspert të fushës si dhe zhvilluesit, për të kuptuar më mirë se çfarë kërkohet. Informacioni i
mbledhur në këtë fazë përdoret për të indeksuar dhe karakterizuar problemin që më pas të
mund të përdoren si themele për fazat e mëvonshme.
Sistemi ynë përbëhet nga tre module kryesore: moduli i përgatitjes së të dhënave hyrëse të
rrjetit, moduli i gjenerimit të strukturave të ndryshme të rrjetave neurale si dhe moduli i
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
92
përzgjedhjes së algoritmit trajnues për rrjetat neurale. Këto module nuk janë plotësisht të
ndarë nga njëri-tjetrit por trajtimi i zhvillimit të tyre si pjesë të veçanta lehtëson specifikimin,
analizën dhe zhvillimin e tyre. Rezultati i nxjerr nga një modul shërben si një të dhëna hyrëse
për një modul tjetër (Figure 6-2).
Figure 6-2: Modulet e sistemit inteligjent për parashikim
Specifikimi i sistemit tonë është bazuar në artifaktet e formuara si rezultat i studimit të
literaturave të ndryshme, që përdorin rrjetat neurale si modele parashikuese. Metodologjia që
përdorë ky sistem për të modeluar rrjetin neural parashikues më të mirë, mbështetet në
teknikat më të mira të përzgjedhura dhe aplikuara në punime të ndryshme. Skema në Figure
6-3 paraqet fazat e ndjekura për të specifikuar sistemin tonë:
Figure 6-3: Fazat e specifikimit të kërkesave për SIP
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
93
Specifikimet e kryera në këtë fazë janë kategorizuar sipas modulimit të sistemit në:
specifikime për përpunimin e të dhënave, modelimin e rrjetit neural dhe përzgjedhjes së
algoritmit të trajnimit. Për të gjithë sistemin është e rëndësishme të ndërtohen modele formale
për specifikimin e kërkesave. Këto modele mundësojnë një sfond të përshtatshëm dhe të qartë
për të kryer analizën dhe dizenjimin e kërkesave për të arritur në identifikimin e pasojave për
çdo zgjedhje të kryer. Modelet formale njihen si mjete të cilat eliminojnë çdo paqartësi apo
paqëndrueshmëri në kërkesa, të cilat janë të pashmangshme në specifikimin joformal të tyre.
Në këtë fazë është e rëndësishme të tregohen se cilat janë aftësitë dhe objektivat që duhet të
përmbushen nga sistemi që duam të zhvillojmë. Këto kërkesa ndahen në funksionet që duhet
të kryej sistemi, specifikat që duhet të përmbushin të dhënat që do përdoren, si dhe kufizimet
e sistemit që po zhvillohet.
Funksionet kryesore të SIP paraqiten në pikat e mëposhtme:
1. Sistemi duhet të marrë të dhënat nëpërmjet një skedari të dhënash ose nga ndonjë bazë
të dhënash.
2. Sistemi përcakton bashkësinë e të dhënave hyrëse dhe atyre dalëse nisur nga seria
kohorë e dhënë.
3. Nëse përdoruesi nuk përcakton ndonjë preferencë për transformimin që i duhet bërë të
dhënave atëherë sistemi, duke përdorur disa rregulla përpunimi, para-përpunon të
dhënat hyrëse dhe dalëse në n mënyra të ndryshme si dhe ruan parametrat dhe
informacionet e nevojshme mbi çdo përpunimin e kryer.
4. Për secilën nga n-seritë e të dhënave realizohet ndarja në tre bashkësisë, trajnuese ,
validuese dhe testuese.
5. Krijon një numër m struktura të ndryshme të rrjetit neural ku për çdo strukturë
përcaktohen numrin e shtresave dhe numrin e nyjave në secilën shtresë. Përveç tyre
jepen dhe vlerat fillestare për parametrat e tjerë si, shkalla e të mësuarit, treguesi i
shpejtësisë, numri i cikleve të trajnimit si dhe algoritmi i trajnimit.
6. Për çdo kombinimi të mënyrës përpunuese së të dhënave me strukturat e ndryshme të
rrjetave neurale realizohet trajnimi për to. Trajnimi për secilin kombinim përsëritet një
numër t-herësh për secilën nga t-bashkësitë e ndryshme të peshave të rrjetit. (për të
eliminuar ngecjen në një minimum lokal)
7. Rezultatet e aftësisë parashikuese jashtë periudhe, si dhe rrjetat neurale të trajnuara
ruhen.
8. Sistemi krahason këto rezultate dhe zgjedh një numër të caktuar rrjetash të cilat kanë
rezultuar me aftësitë më të mira parashikuese.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
94
9. Rrjetat e përzgjedhur ritrajnohen, por tashmë me algoritme të ndryshme trajnimi.
Ndërmjet tyre zgjidhet ai rrjet që ka aftësitë më të mira përgjithësuese.
10. Sistemi më pas përdor këtë rrjet për të gjeneruar parashikime të mëtejshme.
11. Në qoftë se i jepen të dhëna të tjera trajnuese atëherë sistemi e ritrajnon rrjetin e
përzgjedhur me të dhënat më të reja.
12. Sistemi gjeneron paraqitje grafike për demonstruar të dhënat e parashikuara.
Gjithashtu mund të ofroj dhe forma të tjera të rezultateve si p.sh Excel etj.
Në lidhje me kërkesat e të dhënave kemi që të dhënat janë seri me një ndryshore të
zhurmshme, të luhatshme dhe jo-stacionare.
Specifikimi i kërkesave për përpunimin e të dhënat
Përpara se të ndërtohet dhe të trajnohet rrjeti neural është e rëndësishme zgjedhja dhe
përgatitja e të dhënave që do të furnizojnë rrjetin me informacion të nevojshme për të
përgjithësuar. Edhe pse modelet e rrjetit neural kanë si avantazh të tyre aftësinë për të operuar
me të dhëna me cilësi të ulët, të dhënat me cilësi të lartë ndikojnë shumë në realizimin e
procesit të mësimit të rrjetit.
Për të siguruar të dhëna të sigurta është e nevojshme të analizohet seria për të nxjerr se cilat
janë karakteristikat e saj. Më pas, duhen aplikuar transformime të ndryshme për të rritur
cilësinë e tyre. Megjithatë ka dhe raste kur transformimi i të dhënave eliminon tipare që janë
të rëndësishme në të dhënat. Në modelimin e të dhënave duhen evituar përpunimet e tepruara
mbi të dhënat. Në literatura të ndryshme sugjerohet krahasimi i formave të ndryshme për
përpunimi e serisë dhe të shikohet se si ndryshojnë aftësitë parashikuese të rrjetit neural.
Më poshtë listohen disa tipare që janë specifike për përdorimin e të dhënave në modelin e
rrjetave neurale.
1. Ajo çfarë shohim si specifike për këtë sistem është se ne nuk mund të përcaktojmë
mënyrën më të mirë të përpunimit pa realizuar implementim të sistemit. Ky vendim merret
nga vetë sistemi gjatë ekzekutimit. Për ne është e nevojshme që në këtë fazë të japin mënyrën
se si do të arrijë vetë sistemi të realizojë këtë përzgjedhje.
2. Të gjitha të dhënat që do të përdoren për të ndërtuar rrjetin më të mirë duhet të kenë të
njëjtin përpunim. Këto të dhëna përdoren në hapa të ndryshëm të procesit modelues, prandaj
është e nevojshme që të ruhen të gjitha specifikimet për çdo përpunim të kryer mbi të dhënat.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
95
3. Edhe nëse rrjeti është ndërtuar dhe përdoret për parashikim, gjatë fazës së ritrajnimit
të rrjetit me të dhëna të reja duhet që këto të dhëna të përpunohen në të njëjtën mënyrë si të
dhënat ekzistuese.
Duke konsideruar tiparin e 1. sistemi jonë realizon disa procesime të ndryshme mbi të dhënat
dhe për secilin prej tyre ai shikon performancën e rrjetave neurale. Përpunimi i të dhënave
kryhet përpara se të ndërtohen strukturat e rrjetave neural si dhe përpara se të bëhet ndarja e
të dhënave në tre bashkësitë: trajnuese, validuese dhe testuese (që bënë plotësimin e tiparit të
2.).
Përzgjedhja e mënyrave të përpunimit ndaj të dhënave, në këtë softuer, mbështet në rezultatet
që vijnë nga punime të ndryshme të cilët përdorin rrjetat neurale për parashikimin e një serie
kohore me një-ndryshore. Në rastin tonë janë marrë në konsiderat 5 mënyra të përpunimit të
të dhënave që janë si më poshtë:
P1. Të dhëna të pa-përpunuara (DPP)
P2. Metoda e Normalizimit MIN-MAX mbi të dhënat (NMM)
P3. Metoda e Normalizimit Z-Score i të dhënave(NZS)
P4. Metoda e Normalizimit Transformim-Log (NTL)
P5. Metoda e Normalizimit me anë të Shkallëzimit Decimal (NSHD)
Duke provuar forma të ndryshme të transformimit të serisë, ky sistem përpiqet të gjejë jo
vetëm strukturën më të mirë të rrjetit neural parashikues por gjithashtu përzgjedh dhe
teknikën më të mirë të përpunimit ndaj të dhënave. Integrimi i analizës së të dhënave në
sistemi, parimisht do të rezultojë në rritjen e kohës së përgjigjes së programit, por kjo do të
ishte vetëm për trajnimin fillestar të rrjetit.
Përdoruesi i SIP, në lidhje me të dhënat me një ndryshore, ka këto funksionalitete:
1. Ngarkon serinë kohore, në SIP, e cila mund që ti jepet në formën e një skedari ose
nëpërmjet një adresimi në ndonjë bazë të dhënash.
2. Jep informacione shtesë mbi tipare të caktuar të serisë si, frekuenca (ditore, javore,
mujore, tre-mujore)
3. Mund të përcaktojë vetë para-përpunimin që dëshiron të aplikojë mbi serinë
(opsionale).
4. Përcakton se cila pjesë e serisë duhet të përdoret nga SIP për gjenerimin e modelit
parashikues përndryshe përdoret e gjithë sasia e të dhënave.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
96
Në rastin e vetë sistemit SIP, funksionalitetet kryesore të tij në lidhje me të dhënat
përmblidhen më poshtë:
1. Sistemi lexon të dhënat nga burimi bazë (skedari i të dhënave ose baza e të dhënave).
2. Krijon vektorin e të dhënave që do të përdoret nga vetë sistemi.
3. Merr nga përdoruesi dhe i ruan karakteristikat mbi të dhënat (frekuenca, sasia që
duhet të përdoret si dhe mënyrën e përpunimit për të dhënat).
a. Nëse përdoruesi nuk ka zgjedhur asnjë mënyrë përpunimi për të dhënat
atëherë sistemi krijon pesë seri të reja si rezultat i përdorimit të 5 mënyrave të
ndryshme të përpunimit për të dhënat (DPP, NMM, NZS, NTL, NSHD).
b. Nëse përdoruesi nuk ka kufizuar sasinë e të dhënave që do të përdoren nga
sistemi për t‟u përdorur atëherë ai përdorë të gjithë serinë në përllogaritjet që
do të kryej.
4. Rezultatet që merren nga strukturat e ndryshme të rrjetit i nënshtrohen ritransformimit
për t‟u kthyer në formën e tyre fillestare të papërpunuar. Prandaj sistemi, në mënyrë
që të sigurojë këtë gjë, duhet të ruaj të gjitha informacionet e nevojshme për çdo
transformim të kryer.
5. Për çdo grup të ri të dhënash të shtuar në sistem, që përdoren për të furnizuar modelin
parashikues me informacione të reja, duhet ti nënshtrohet të njëjtit proces përpunues
si të dhënat ekzistues.
Specifikimi i kërkesave për gjenerimin e rrjetit neural më të mirë
Çështjet që duhen specifikuar për gjenerimin e strukturës së rrjetit neural parashikues më të
mirë lidhen me detajimin e kërkesave për dy pika bazë:
a. Mënyrën se si çdo rrjet neural duhet të realizojë përllogaritje e shumta për të
arritur që të mësoj më mirë.
b. Mënyra përzgjedhëse për strukturën e rrjetit neural si dhe kriteret që do të
përdoren për të kryer përzgjedhjen.
Për të adresuar çështjen e gjetjes së rrjetit neural të përshtatshëm, në këtë punim është
përdorur një trajtim me teknikën brutë-forcë. Duke qenë se nuk ekzistojnë metodologji që të
mund të drejtojë në ndërtimin e strukturës më të mirë të rrjetit neural parashikues atëherë
merren në shqyrtim një sasi rrjetash neurale, të cilat ndryshojnë nga njëri-tjetri nga numri i
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
97
neuroneve për çdo shtresë, numri i shtresave dhe algoritmet e trajnimit. Kjo mënyrë e
trajtimit gjen përdorim të gjerë në punime të ndryshme që përdorin rrjetat neurale për
parashikim. Pasi gjenerohen këto struktura të ndryshme të rrjetave neurale, ato trajnohen dhe
krahasohen për të zgjedhur më pas strukturën që ka aftësi përgjithësuese më të mira.
Duke qenë se për ndërtimin e çdo rrjeti neural kërkohet një numër i konsiderueshëm
përllogaritjesh, në këtë punim është bërë dhe një trajtim i trajnimit të këtyre rrjetave duke
përdorur një përpunimi të shpërndarë. Kjo pasi ndërtimi dhe vlerësimi i performancës së një
rrjeti është i pavarur nga modelimet e rrjetave të tjerë. Në vazhdimi do të specifikohen
kërkesat që kanë aktorët e sistemit në këtë pjesë të SIP. Duhet theksuar se në këtë pjesë nuk
ekzistojnë funksionalitete për përdoruesi e sistemit pasi kjo pjesë realizohet nëpërmjet një
procesi të automatizuar. Një avantazh që lidhet me këtë mënyrë konceptimit të sistemit
qëndron se, për përdoruesin e tij, nuk është e nevojshme që ai të jetë ekspert i modelimit të
rrjetave neurale. Fillimisht do të japim se çfarë funksionalitetesh ka sistemi për të ndërtuar
një rrjet neural. Këto funksionalitete përsëriten për të gjithë strukturat e rrjetave të tjerë. Duke
vazhduar me kërkesat që duhet të përmbush sistemi për të gjeneruar një numër të fundmë të
rrjetave neural dhe përzgjedhje ndërmjet tyre.
I. Funksionalitetet e sistemit në ndërtimin më të mirë të një rrejti neural parashikues:
1. Ndanë bashkësinë e të dhënave në tre bashkësi të veçanta që do përdoren në faza të
ndryshme të ndërtimit të rrjetit neural: bashkësia e të dhënave trajnuese, bashkësia e të
dhënave validuese si dhe bashkësia e të dhënave testuese. Këto bashkësi nuk duhet të
kenë prerje të tyre si dhe ndarja duhet bërë në blloqe dhe jo në mënyrë rastësore.
2. Inicializohen elementët bazë të strukturës së rrjetit neural si: numrin e të dhënave
hyrëse, numrin e nyjeve në shtresën e mesme, funksionet e aktivizimit për secilën nga
shtresat e rrjetit si dhe algoritmi i trajnimit që do të përdoret.
3. Mbi bazën e numrit në të dhënat hyrëse dhe atyre dalëse të strukturës së rrjetit
organizohen të dhënat në të tre bashkësitë, në rreshta dhe kolona. Për çdo kolonë
duhet që të ketë një vlerë korresponduese si vlerë dalëse të rrjetit.
4. Për algoritmin e trajnimit që do të përdoret sistemi përcakton vlerat fillestare për
kriteret e ndalimit të trajnimit si: numri i epokave të trajnimit, shkallën e të mësuarit,
treguesin e shpejtësisë si dhe kriteret e vlerësimit të performancës së rrjetit.
5. Përcakton një numër të fundmë vektorësh me vlera fillestaret rastësore për të gjitha
peshat e rrjetit neural.
a. Për çdo vektorë sistemi:
i. trajnon rrjetin neural me bashkësinë e të dhënave trajnuese deri kur
arrihet ndonjë nga kriteret e ndalimit.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
98
ii. Sistemi përdorë bashkësinë e të dhënave validuese për t‟u siguruar që
rrjetin neural nuk humb aftësitë e tij përgjithësuese.
iii. Vlerëson rrjetin neural nëpërmjet kritereve të vlerësimit mbi
bashkësinë testuese.
6. Zgjedh instancën e rrjetit neural të trajnuar që performon më mirë ndër vektorët e
ndryshëm të peshave të aplikuar.
II. Funksionalitetet e sistemit për përzgjedhjen e strukturës së rrjetit neural më të mirë:
1. Përcakton se cilët janë përmasat e ndryshme për numrin e të dhënave hyrëse, që
do të përdoren për secilën strukturë të rrjetit neural.
2. Përcakton dhe përmasat e ndryshme të nyjeve që do të përdoren në shtresën e
vetme të fshehtë.
3. Për çdo kombinimi të përmasës së të dhënave hyrëse dhe përmasës së nyjeve në
shtresën e mesme ndiqen të njëjtët hapa që specifikuam në ndërtimin e rrjetit më
të mirë parashikues. Si rezultat, për çdo kombinim ruhen instancat më të mira.
4. Ruan të gjitha vlerësimet e bëra me anë të kritereve të vlerësimit për çdo
kombinim si dhe të gjitha instancat e kthyera nga çdo kombinim.
5. Dy janë mundësitë që bënë sistemi. Në qoftë se përdoruesi nuk do të testojë
algoritme të ndryshme trajnimi
a. atëherë sistemi përzgjedh strukturën e rrjetit neural që vlerësohet me aftësi të
larta përgjithësuese.
b. Përndryshe ai përzgjedh 7 strukturat e rrjetave më të mirë parashikues për t‟iu
nënshtruar përllogaritjeve të tjera për algoritme të ndryshme trajnimi.
Specifikimi i kërkesave për zgjedhjen e algoritmit trajnues
Trajnimi i rrjetit neural si proces realizohet nëpërmjet një algoritmi i cili duhet të përfshijë
ndryshimin e të dhënave hyrëse të algoritmit, ekzekutimit e përllogaritjeve transformuese të
këtyre të dhënave si dhe kontroll të rezultateve që sjell ky ndryshim.
6.5 Dizenjimi i sistemit
Faza e dizenjimit të softuerëve, në inxhinierimin e softuerëve tradicional, përbëhet nga një
proces orientues për zhvillimin e një zgjidhjeje. Në këtë proces bëhet evidentimin i
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
99
elementeve që përmbushin kërkesat e përdoruesit. Këto elemente mund të krijohen nga fillimi
apo nëpërmjet përshtatjes të elementeve ekzistuese dhe mund të përmbushin detyra të
përgjithshme ose detyra specifike që lidhen me kërkesat e përdoruesit.
Në këtë fazë përcaktohen strukturat e të dhënave dhe algoritmet që do të përdoren në fazën e
implementimit të sistemit tonë parashikues.
Duke qenë se për çdo rrjet neural kërkohet një numër i konsiderueshëm përllogaritjesh, në
këtë punim është bërë dhe një trajtim i trajnimit të këtyre rrjetave duke përdorur një
përpunimi të shpërndarë. Në dizenjimit e sistemin tonë janë përcaktuar se cilët janë elementët
të cilat mund të thjeshtohen duke përdorur paralelizimin e përllogaritjeve.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
100
Figure 6-4: Modelimi i rrjedhjes së inforamcionit në sistem
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
101
6.6 Sigurimi i cilësisë për SIP
Në një pjesë të mirë të programit SIP mund të aplikohen teknikat tradicionale të testimit. Por
ky trajtim ndryshon lidhur me rrjetat neurale. Aplikimi i mënyrave të ndryshme të validimit
dhe verifikimit të cilësisë vjen si rezultat i natyrës së zhvillimit të rrjetave neurale. RN njihen
si njësi të cilat ndryshojnë gjendjen e tyre, ato mësojnë, përgjatë ekzekutimit. Ky ndryshim
mund të jetë për mirë ose dhe për keq. Një analist i cili do të kontrolloj dhe vlerësoj cilësinë e
rrjetit neural ndeshet me këto çështje (Taylor BJ, Darrah MA and Moats CD, 2003):
- A ka mësuar rrjeti të dhënat e sakta, apo ai ka përgjithësuar tipare të tjerat të cilat janë
të përfshira në të dhënat?
- A ka konvergjuar rrjeti në një minimum global apo në një minimum lokal?
- Si do të sillet rrjeti me të dhëna të tjera që nuk janë pjesë e të dhënave trajnuese?
- A ekziston ndonjë teknikë e cila përshkruan memorien e një rrjetit apo ruajtjen e të
dhënave?
- A është duke përdorur rrjeti bashkësinë e duhur të parametrave hyrëse për fushën e
problemit?
Është e rëndësishme të aplikohen metodat të ndryshme të cilat të mund të vlerësojnë cilësinë
e softuerit përgjatë zhvillimit të tij. Sigurimi për cilësinë e çdo rrjeti neural të zhvilluar duhet
bërë përpara se të bëhet validimi dhe verifikimi i tij. Vlerësimi i cilësisë për rrjetat neurale
bëhet për të identifikuar nëse rrjeti mund të përdoret për problemin që shqyrtohet. Për çdo
rrjet neural, matja e cilësisë së tij bëhet nëpërmjet kritereve të specifikuara si p.sh :
1. Llogaritja dhe vlerësimi i gabimit (RMSE, MAE) për bashkësinë e të dhënave testuese.
2. Shpejtësia e prodhimit të rezultatit apo toleranca e gabimit.
Zhvillimi i softuerit duhet të sigurojë që ky proces të zhvillohet nëpërmjet një procesi të
automatizuar, që ruan në bazë të dhënash, të dhënat e vlerësimit të tij. Mbi bazën e këtyre të
dhënave përzgjidhen rrjetat që përmbushin kriteret dhe më pas i nënshtrohen metodave të
validimit dhe verifikimit.
Në lidhje me rrjetat neurale artificiale duhet theksuar se është e pamundur të provohet
funksionalitetit i tij. E thënë më qartë, nuk mund të kontrollojmë nëse të gjitha të dhënat
hyrëse ndikojnë në prodhimin e rezultatin të dëshiruar nga RN. Si rezultat, zhvilluesit duhet
të ideojnë dhe vizualizojnë në mënyrë individuale metodat për verifikimin dhe validimin.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
102
Studimet të cilat kryejnë një punë kërkimore në lidhje me verifikimin dhe validimit e RN
është i kufizuar. Për këtë arsye nuk ka procese apo standarde të unifikuar të cilat mund t‟i
përdorin zhvillues të rrjetave neurale. Objektivat kryesorë që duhet të arrihen në këtë fazë
janë:
Të tregohet dhe nëse ka mundësi të vlerësohet korrektësia e rrjetave neural artificial,
nga pikëpamja e strukturës (analizës së peshave, lidhjeve etj.) si dhe me kufizimet e
vendosura (p.sh koha e shpenzuar, kosto e zgjidhjes etj.).
Të tregohet që rezultatet e softuerit përputhen me specifikimet e problemit që duhet të
zgjidhë.
Duke qenë se kostoja e validimit dhe verifikimit të rrjetave neurale është e madhe, sugjerohet
që metodat e tyre të aplikohen vetëm mbi rrjetat neural të përzgjedhur mbi kriterin e
performancës më të mirë. Në këtë mënyrë bëhet një ndarje e kësaj faze nga cikli i zhvillimit
të softuerit që bënë një zvogëlim të ndjeshëm të kostos së rimodelimit.
Ekzistojnë metoda të ndryshme të cilat mund të aplikohen në faza të ndryshme të zhvillimit të
rrjetit neural.
Gjatë fazës së dizenjimit mund të kryhet validim i kryqëzuar. Ky validim realizohet duke
përdorur një bashkësi rrjetash të të njëjtit tip ose të tipeve të ndryshme të cilat përmbushin të
njëjtën detyrë duke përmirësuar besueshmërinë e programit. Rezultatet që jep secili nga
rrjetat krahasohen me njëri-tjetrin për të konfirmuar validimin dhe përshtatshmërinë.
Teknika e vizualizimit është shumë e përdorshme, pasi ndihmon për të arritur kuptimin e
plotë të performancës së rrjetit neural. Kjo teknikë ndihmon të kuptohet se si mëson rrjeti
neural apo se si janë proceset e vendimmarrjes së tij nëpërmjet formave të ndryshme të
vizualizimit.
Fazat në të cilat mund të aplikohet teknika, janë përgjatë trajnimit dhe testimit. Për të dy fazat
paraqiten grafikisht mënyra se si ndryshojnë peshat dhe lidhjet e brendshme të rrjetit neural.
Duhet theksuar se fusha e validimit dhe verifikimit të rrjetave neurale është në zhvillim dhe
ende nuk ka një metodologji të plotë që të ndihmojë zhvilluesit. Prandaj, shpesh, eksperienca
e zhvillimit të programeve të ngjashme është një avantazh.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
103
6.7 Paralelizimi i SIP
Metodat dhe teknologjitë bazë për implementimin e një rrjeti neural, rezultojnë të jenë
komplekse. Trajnimi i rrjetit neural kërkon realizimin e një numri të madh përllogaritjesh dhe
shpenzimin e një kohe të gjatë. Koha rritet në mënyrë eksponenciale me ndryshimin e numrit
të nyjeve në strukturën e RN-l. Një nga zgjidhjet harduerike të cilat i lehtësojnë
implementimet e këtyre rrjetave është përdorimi i sistemeve paralele.
Paralelizimi ka si ide, që një detyrë mund të ndahet në mënyrë të tillë që në vend që të kemi
një proces që i bën të gjitha, të kemi disa procese të cilët bëjnë nga një pjese të punës në të
njëjtën kohë. Ekzekutimi në paralel zvogëlon në mënyrë dramatike kohën e përgjigjes për
veprimet intensive me të dhënat që ndodhen në baza të mëdha, që zakonisht shoqërohen me
sisteme që mbështesin marrjen e vendimeve, veprime matematikore ose dhe baza të dhënash
historike (Seiffert U., 2002). Multiprocesimi simetrik, sistemet që përdorin një numër të
madh cluster-ash dhe GPU-t arrijnë performancë të lartë nëpërmjet ekzekutimit në paralel,
pasi procesimi i instruksione mund të ndahet midis procesorëve në një sistem të vetëm.
Për më tepër, zotërimi, menaxhimi dhe punimi me një aplikacion kritik të biznesit nënkupton
të merresh me probleme të performancës. Aplikacionet nuk mund të menaxhojnë vëllimet e
të dhënave gjithmonë në rritje, përmbushjen e kërkesave të reja në përshkallëzim apo dhe
performancën e cila nuk është asnjëherë e mirë apo e shpejt sa duhet. Nevojitet një nivel më i
lartë performance në mënyrë që të shumëfishohet numri i veprimeve që aplikacioni ynë të
mundet ti përballoj. Në mjediset kompjuterike, ka vetëm një mënyrë për të arritur këtë:
përdorimi i një strukture paralele për të ekzekutuar shumë punë njëkohësisht (Martiri E.,
Tyxhari G. dhe Gorishti A., 2010).
Qëllimi në këtë pjesë të punimit është realizimi i paralelizimit për pjesë të SIP të cilët janë të
pavarur nga njëri-tjetri si dhe nga të dhënat që ato transformojnë. Mund të arrihen paralelizim
të përllogaritjeve që duhet të kryejnë arkitekturat e ndryshme të rrjetave parashikues.
Duke analizuar rrjetin neural FD me shumë shtresa, i cili përmban vetëm një shtresë të
fshehtë kryen hartëzimin e jo-linaritetit ndërmjet shtresës hyrëse dhe dalëse sipas formulës:
)))((( xwffwfy T
hhffd .
Paralelizimi i sistemit është shumë i aplikueshëm në vektorë, matrica dhe gjithashtu në
shprehje shumatore. Në këtë rast, paralelizimi i kësaj shume bëhet si më poshtë:
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
104
Në të ka dy cikle for të cilat janë një burim i mirë për paralelizim të një numri të madh
instruksionesh (Hoxha, 2004). Gjithashtu nuk ekzistojnë varësi midis cikleve for në të dy
algoritmet, ky është dhe kriteri kryesorë që një algoritëm duhet të plotësoj për tu paralelizuar
(Martiri E., Tyxhari G. dhe Gorishti A., 2010). Ky proces ofron disa avantazhe: zvogëlon
kohën e llogaritjeve dhe mundëson përpunim të një grupi të madh të dhënash. Aktualisht
hapësira kohore e serive që përdoren në Shqipëri nuk është shumë i madh por tenton të bëhet
e tillë. Për këtë arsye rekomandohet implementimi në paralel i sistemit duke mundësuar
procesim në paralel për të dhënat.
// Pseudo-kode për hartëzimin e SHS
15. S_hyrës=0
16. S_dalës=0
17. for h=1 to n, step 1
18. lexo wT(h), x
19. S_hyrës(h)=wt(h)*x
20. S_ hyrës =S_ hyrës +S_hyrës (h)
21. for f=1 to n
22. lexo w(f)
23. S_dalës(f)= (h)*S_dalës(f)
24. S_dalës=S_dalës+S_dalës(f)
Algoritmi 6-1:Hapat e përllogaritjeve të kryera nga rrjeti SHS (Vika B., Martiri E. & Xhaja D., 2011)
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
105
Kapitulli 7
7 KONKLUZIONE, DISKUTIME DHE REKOMANDIME
Ky kapitull paraqet analizën e rezultateve të arritura në këtë punim në lidhje me analizën dhe
dizenjimin e sistemit inteligjent. Gjithashtu shtrohen dhe diskutohen realizimi i qëllimit të
disertacionit si dhe hipotezave të ngritura në të. Në fund të tij japim rekomandimet tona në
lidhje me punën në të ardhme.
7.1 Konkluzione
Qëllimi i këtij punimi ishte zhvillimi i analizës dhe modelimit të një sistemit inteligjent për
parashikimin e serive kohore të cilët përdorin rrjetat neurale artificiale. Ky punim përpiqet të
shërbejë si një material ndihmues në implementimin e programeve parashikues të cilët
kërkojnë të përfitojnë nga avantazhet e teknikave inteligjente si për shembull: rrjetat neurale.
Rezultatet e punimit mbështeten njëkohësisht në: (i) përmbledhjen dhe analizën e literaturës
së gjerë bashkëkohore , dhe (ii) në rezultatet eksperimentale të kryera mbi seri kohore reale.
Analiza dhe dizenjimi i sistemit është sugjeruar në mënyrë të tillë që elemente të ndryshme të
sistemit të mund të trajtohen në veçanti si dhe mund të përdoren si module të pavarura. Çdo
modul i sistemit mund të ripërdoret si dhe zgjerohet me tipare të tjera shtesë për t‟u plotësuar
dhe përshtatur me probleme të fushave të ndryshme.
Trajtimi i këtij punimi kryen analizën dhe modelimin e sistemit inteligjent të distancuara nga
tiparet teknike të zhvillimit duke mos e fokusuar në ndonjë platformë specifike, si rrjedhojë
krijon mundësinë që zhvillues të ndryshëm të mund të ripërdorin dhe përshtatin rezultate të
këtij punimi lehtësisht. Një pjesë të rëndësishëm në këtë disertacion zë diskutimi dhe
vlerësimi i dilemave të ndryshme të dizenjimit të rrjetave neurale për të arritur rezultate sa më
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
106
të mira parashikuese. Rezultatet e nxjerra nga studimi i literaturës dhe e mbështetur me
analizë empirike tregojnë që elementët përbërës në ndërtimin e rrjetit neural kanë ndikimi të
ngushtë ndërmjet njëri-tjetri. Ndryshimi i bërë në njërin prej tyre ndikon në elementët e tjerë.
Këto veçori janë marrë në shqyrtimin nga sistemin përgjatë procesit automatizues, të
nxjerrjes së strukturës më të mirë të rrjetit neural që i përgjigjet serisë kohore specifike.
Në fillimi të këtij punimi, në kapitullin 3 dhe 4, është përfshirë një përmbledhje e literaturës
bashkëkohore në lidhje me përdorimin e rrjetave neurale në parashikimin e serive kohore,
duke e trajtuar si një element bazë shumë të rëndësishëm në arritjen e qëllimit të këtij punimi.
Në këtë analizë përmbledhëse ofrohen bazat për analizën dhe modelimin e sistemit inteligjent
për parashikim. Bazuar në metodologjinë që kemi zgjedhur për të zhvilluar këtë punim, që
përshtatet me karakteristikat e komponentëve përbërëse të sistemit inteligjent për parashikim,
literatura bashkëkohore ndihmon në përcaktimin dhe analizën e elementëve përbërës për çdo
pjesë të sistemit. Për rrjetat neurale janë evidentuar modelet e topologjisë, modelet e të
dhënave si dhe mënyrat e trajnimit. Gjerësisht janë diskutuar karakteristikat që duhet të
implementohen nga sistemi inteligjent i propozuar si për shembull:
Para-përpunimi i përshtatshëm i të dhënave për të ofruar rezultatet më të mira.
Krahasimi i struktura të ndryshme të ndërtimit të rrjetit neural
Përdorimi i paradigmave të ndryshëm për trajnimin e rrjetit siç janë: i mbikëqyrur, i
pambikëqyrur dhe i përforcuar.
Rezultatet empirike në këtë studim ka luajtur një rol të rëndësishëm në mirë konceptimin dhe
analizën e sistemit. Objektivi primar i tyre është formimi i sfondit të nevojshëm për të
kuptuar lidhjen ndërmjet komponentëve kryesorë e domethënës në modelimin e rrjetit neural
artificial të përshtatshëm për parashikim.
Së bashku me anën teorike dhe analitike kemi ofruar shkurtimisht shembuj aplikative të
rrjetave neurale të cilat përdorin gjerësisht paketat e librarit e ofruara në MATLAB duke i
ndërthurur me implementime shtesë të pjesëve plotësuese të qëllimit. Një përshkrim më i
detajuar i punës tonë të ndërtimit të modeleve, testimit dhe analizës së rezultateve është kryer
në kapitullin 5.
Metodologjia e ndjekur për zhvillimin e këtij punimi, kërkimi konstruktiv i modelimit,
sugjeron që rezultatet e fushës së studimit dhe ato të analizës empirike të ndërthuren sëbashku
për të formësuar artifaktet që shërbejnë si shtylla ndërtimi në modelimin e sistemit inteligjent
parashikues.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
107
Në kapitullin 6 të këtij disertacioni është përshkruar inxhinierimi softuerik për zhvillimin e
analizës dhe modelimit të sistemit të propozuar. Cikli jetësorë i adaptuar për këtë sistem
ndryshon me ciklin jetësore të përdorur për inxhinierimin e softuerëve klasikë. Karakteristikat
të cilat përcaktojnë këtë mënyrë të ndryshme trajtimi janë analizuar dhe argumentuar duke
nxjerr në pah formën më të mirë të përdorimit.
Analiza dhe modelimi i paraqitur për sistemin inteligjent për parashikim lejon që të
implementohen lehtësisht nga zhvilluesit, në platforma të ndryshme. Modularizimi i sistemi
është një qasje e përdorur në trajtimin e këtij disertacioni. Disa nga avantazhet që rrjedhin nga
kjo formë e trajtimit lidhet me maksimizimin e fleksibilitetit, ripërdorueshmërinë dhe ndarjes
së qartë midis komponentëve përbërës. Për të plotësuar më mirë modelim e sistemit janë
evidentuar dhe përshkruar çështjet kryesore të aplikimit të mjeteve dhe modeleve që
sigurojnë besueshmërinë dhe cilësinë e sistemit përgjatë gjithë fazave të zhvillimit të tij.
Një tjetër element në të cilën ky punim sugjeron që të fokusohet zhvillimi i mëtejshëm i
sistemit është paralelizimi i përllogaritjeve të tij. E përmendur gjerësisht dhe në literaturën e
shqyrtuar, një disavantazh për përdorim e rrjetave neurale dhe gjetjes së strukturës më të mirë
për parashikimi është koha e gjatë përllogaritëse e shpenzuar. Në analizën e sistemit janë
përcaktuar dhe komponentët dhe veprimet që mund t‟i nënshtrohen një përpunimi paralel. Në
rastet kur shpenzimet për harduerin nuk janë problemi kryesore, por koha e përgjigjes është
ajo çfarë na intereson atëherë sistemi do të duhet të aplikojë procesim paralel. Në këtë rast
është bërë një paralelizim i problemeve.
Në fazën e dizenjimit, sistemi është projektuar direkt në paralel, duke e ndarë problemin, për
faza të caktuara të ekzekutimit, në pjesë të pavarura nga njëra-tjetra. Kjo ndarje është bërë
pasi problemi është kuptuar qartë, jo vetëm në aspektin e rrjedhshmerisë së përpunimit por
gjithashtu dhe rezultatet që ai duhet të nxjerrë.
Ky disertacion është organizuar dhe zhvilluar mbi bazën e disa hipotezave të ngritura të cilat
mbështeten në metodologjinë „hulumtim i modelimit konstruktiv‟. Në këtë përqasje hipotezat
drejtojnë procesin e dizenjimit të sistemi, ku përmendim sërish që dizenjimi ka të bëjë me
orientimin e të ardhmesh ndërsa puna kërkimore lidhet me të shkuarën dhe të tashme.
Specifike, për këtë lloj natyre kërkimore, është realizimi i integrimit të punës kërkimore me
praktikat e modelimit. Si dhe ngritja e të gjitha hipotezave nuk është bërë që në fillim por
përgjatë eksplorimit të literaturës dhe analizës së rezultateve empirike.
Për hipotezat e ngritura në fillim të këtij punimi kemi arritur të bëjmë vlerësimin e tyre gjatë
rrugëtimit të këtij hulumtimit. Në vazhdim të këtij kapitulli, në përputhje me objektivat e këtij
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
108
studimi, analizojmë nëse rezultatet e arritura në këtë disertacion mbështesin ose jo hipotezat e
ngritura.
H1. Çdo lloj strukture e rrjetit neural për parashikimin e serive kohore me një-
ndryshore mund të tejkaloj metodat tradicionale statistikore.
Në këtë pohim kërkohet të krahasohen strukturat e ndryshme të rrjetave neurale me metodat
konkurruese tradicionale për një problem parashikimi bazuar në seri kohore me një
ndryshore. Për të kontrolluar këtë pohim të këtij disertacioni jemi mbështetur në analizën
empirike të performancës parashikuese të strukturave të ndryshme të rrjetit neural, krahasuar
me modelin tradicional „më të mirë‟ për parashikimin e kursit mujorë EUR/USD. Gjithsej
janë shqyrtuar 144 struktura të ndryshme të rrjetit neural të cilat ndryshojnë nga njëra-tjetra,
jo vetëm nga numri i vonesave kohore të vetë variablit të varur por dhe nga numri i njësive
shtesë përpunuese të informacionit.
Duke përmendur që modeli tradicional i marrë në shqyrtim për t‟u krahasuar me rrjetat neural
është përzgjedhur në bazë të literaturës së shqyrtuar dhe përformancës së tij në parashikimin
jashtë-periudhe. Kriteret e vlerësimit të performancës parashikuese janë RMSE dhe MAE.
Modeli tradicional më i mirë rezultoi ARIMA(7,1,48) me RMSE 0,0181 dhe MAE 0.0159.
Nga 144 strukturat e ndryshme të rrjetit neural të shqyrtuar, në analizën krahasuese të kryer,
rezultojnë që 143 rrjeta neural performojnë më mirë në parashikimin jashtë–periudhe ose po
aq mirë sa model i tradicional ARIMA. Vetëm struktura e rrjetit neural (1-9-1) tregon një
performancë më të dobët parashikuese me RMSE 0.0192 dhe MAE 0.0149.
Pra, mund të themi se në lidhje me këto rezultate rrjetat neurale kanë aftësi shumë të mira për
të mësuar nga seritë me një ndryshore. Ndërkaq, evidentojmë se hipoteza e parë mbështetet
nga rezultatet e këtij studimi.
H2. Ndërmjet faktorëve që ndikojnë në performancën e rrjetit neural parashikues nuk
ka ndërveprim dhe tiparet e tyre mund të përcaktohen në mënyrë të pavarur.
Ky pohim vlerësohet dhe evidentohet nëse faktorët përbërës të strukturës së rrjetit neural
mund të trajtohen si entitete të veçanta që nuk influencojnë në performancën e ndonjë faktori
tjetër apo ndërmjet tyre duhet vendosur një ekuilibër për të arritur maksimizimin e
performancës. Vërtetësia e kësaj hipoteze është bërë nëpërmjet studimit dhe analizës së
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
109
literaturës shkencore si dhe rezultateve empirike për parashikimin e kursit EUR/USD.
Fillimisht janë nxjerrë se faktorët të cilët ndikojnë në parashikimin e serisë kohore me një
ndryshore janë:
Sasia e vlerave të serisë kohore, që rrjeti neural përdorur për të mësuar në çdo etapë të ciklit
trajnues. Rritja ose zvogëlimi i tij ndikon në ndryshimin e performancës. Në rezultatet e
përftuara në punën tonë eksperimentale shohim që me ndryshimin e sasisë së vlerave nuk
ekziston ndonjë varësi lineare e drejtpërdrejt me performancën.
Numri i njësive në shtresën e fshehtë në strukturën e rrjetit neural. Nyjet e shtresës së
mesme shërbejnë për të mësuar jo-linearitetin që ekziston në të dhënat e paraqitur të rrjetit.
Në shqyrtimin e literaturës rezulton se, për përcaktimin e numrit të tyre në lidhje me një
problem të caktuar, nuk ekzistojnë baza teorike të mjaftueshme. Në këtë rast procesi duhet
bërë nëpërmjet testimeve të drejtpërdrejt me të dhënat reale të problemit. Analiza empirike e
realizuar për parashikimin mujorë të kursit EUR/USD tregon që, edhe për këtë faktorë, nuk
mund të gjejmë ndonjë lidhje direkte me kahun e ndryshimit të numrit të njësive në shtresën e
fshehtë dhe cilësisë së aftësisë parashikuese.
Përpunimi i të dhënave është një tjetër faktorë që ndikon në cilësinë parashikuese. Sipas
literaturës së shqyrtuar theksohet se rrjetat neurale janë në gjendje të mësojnë nga të dhënat të
cilat përmbajnë sezonalitet, zhurma, trend etj. Megjithatë ekzistojnë disa punime të cilat
shohin parapërgatitjen e të dhënave si një faktorë të rëndësishëm në cilësinë e parashikimit, si
dhe në shpejtësinë e parashikimit.
Algoritmi i trajnimit i cili përcakton mënyrën se si rrjeti duhet të mësoj nga të dhënat që i
paraqiten atij në fazën e trajnimit. Problemi kryesorë që ndeshet përgjatë trajnimit të rrjetit
lidhet me ngecjen në minimume lokale të gabimit të parashikimit duke mos arritur atë që
është konfigurimi më i mirë i rrjetit. Ndërkohë që nuk duhet lënë jashtë fokusit dhe koha e
nevojshme për të kryer trajnimin, i cili shpesh mund të rezultojnë në një kohë shumë të gjatë.
Për të realizuar një analizë dhe dizenjim sa më të mirë për sistemin inteligjent parashikues
është parë e rëndësishme studimi i këtyre faktorë si dhe lidhjet që ekziston ndërmjet tyre në
rritjen e cilësisë së parashikimit. Ashtu siç është e sugjeruar në literaturën bashkëkohore por
edhe në analizën empirike të kryer në këtë disertacion shikojmë që këto elementë nuk duhen
vlerësuar në mënyrë të pavarur. Për të gjetur strukturën më të mirë të rrjetit neural duhet të
eksperimentohen dhe vlerësohen kombinime të ndryshme të sasive të vlerave të serisë kohore
me numra të ndryshëm të nyjeve në shtresën e fshehtë.
Gjithashtu dhe përzgjedhja e përpunimit për të dhënat ndikon në kohën që i duhet algoritmit
të trajnimit për të gjetur konfigurimin e rrjetit neural me cilësi parashikuese me të lartë.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
110
Rezultatet e arritura në analizën empirike të këtij disertacioni tregojnë që për të arritur cilësi
të larta në parashikim duhet të vlerësohen struktura të ndryshme të rrjetit neural që
ndryshojnë nga njëri-tjetri nga numri i nyjeve në shtresën e mesme si dhe sasia e vlerave të
serisë kohore.
Vlen të përmendim se për numërin e nyjeve në shtresën e fshehtë, nga 1 deri në 12 tregohet
që sasia e vlerave për strukturat e rrjetit neural të cilat prodhojnë aftësitë më të mira
parashikuese ndodhet në numrat 10 dhe 11 për 67% të rasteve të shqyrtuara. Pra, e thënë më
qartë kemi se parashikimi më i mirë për një hap jashtë periudhe mund të përcaktohet mirë
nisur nga 10 ose 11 vlerat e shkuara.
Këto të dhëna dalin për rastin kur seria kohore përbëhet nga kursin mujorë i EUR/USD të cilit
nuk i është bërë asnjë përpunim paraprak. Ky rezultat mund të tregoj se seria kohore mund të
jetë stacionare. Por, ky përfundim nuk mund ta përgjithësojmë pasi do të duhet të shqyrtohen
dhe analizohen më shumë seri të ndryshme. Nëse kjo gjë do të plotësohesh për disa raste
atëherë do të ndikonte në zvogëlimin e intervalit të strukturave të rrjetave neural që do të
duheshin për t‟u vlerësuar.
Pra, mund të themi se në lidhje me këto rezultate, faktorët që ndikojnë në cilësinë e
parashikimit të rrjetit neural kanë ndikim ndaj njëri-tjetrit. Prandaj, për të përcaktuar
strukturën e përshtatshme të rrjetit neural për parashikim duhen konsideruar në të njëjtën
kohë të gjithë këto faktorë.
Kështu evidentojmë se në lidhje me hipotezën e dytë, rezultatet e këtij studimi nuk e
mbështesin atë.
H3. Automatizimi i përzgjedhjes së strukturës së rrjetit neural përmirëson aftësitë
parashikuese të sistemit inteligjent për kursin e këmbimit kundrejt metoda
tradicionaleve.
Ndërtimi i strukturave të ndryshme të rrjetit neural në mënyrë manuale nga përdoruesit do të
kërkonte që ata të ishin të pajisur me njohuritë e nevojshme se si funksionojnë këto metoda
inteligjente. Për më tepër, do të kërkonin që përdoruesit të njihnin mirë elementët ndërtuese
të rrjetit neural si dhe tiparet e tyre. Ndërthurja e njohurive të përdorimit të këtyre modeleve
inteligjente me atë të fushës ekonomike do të rezultonte në rritjen e vështirësisë së përdorimit
të tyre.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
111
Integrimi i rezultateve të nxjerra nga struktura të ndryshme të rrjetave neurale dhe vlerësimi i
tyre në varësi të cilësisë parashikuese bazuar në kriteret e vlerësimit do të ishte një proces i
cili do të shoqërohej nga një probabilitet i konsiderueshëm gabimi. Faktorë tjetër i
rëndësishëm i cili duhet të konsiderohet është koha. Duke qenë se përzgjedhja e strukturës së
rrjetit neural për parashikim dhe konfigurimi i tij për të arritur aftësi më të mira parashikuese
është një proces i cili kërkon që të testohen dhe krahasohen një numër i madh strukturash.
Në analizën e realizuar, mbështetur njëkohësisht në literaturën bashkëkohore si dhe në punën
tonë në këtë disertacion është parë se ky proces i përgjithshëm mund të automatizohet duke
sjellë si avantazh që:
- përdoruesit të mos jetë i detyruar të ketë njohuri të thelluar në fushat e aplikimit,
- zvogëlon gabimet njerëzore përgjatë fazës së vlerësimit të strukturave,
- në rritjen e numrit të strukturave dhe faktorëve që merren në konsideratë,
- uljen e kohës së përpunimit dhe procesimit të veprimeve të nevojshme përgjatë fazës
së konfigurimit dhe vlerësimit të rrjetave.
Pra, shohim që në përgjithësi automatizimi është jo vetëm një alternativë por dhe një
domosdoshmëri për përdorimin e rrjetave neurale si mjete për parashikim.
Kështu, mund të themi se hipoteza e tretë mbështetet nga rezultatet e studimit.
H4. Për analizën dhe modelimin sistemi inteligjent parashikues (SIP) nëpërmjet rrjetit
neural, mund të përdoren mjetet dhe metodat standarde ekzistuese të disiplinës së
inxhinierimit të softuerëve.
Në studimin e bërë në këtë punim tregohet se çfarë tiparesh ndryshojnë në filozofinë e
ndërtimit të aplikimeve të cilat përdorin rrjetat neurale, prandaj është e nevojshme që
inxhinierimi i zgjedhur për to duhet ti përshtatet këtyre tipareve. Projektet që përdorin RN-le
ndryshojnë nga projektet softuerike tradicional në lidhje me disa aspekte si:
- Ato janë të drejtuar nga të dhënat, për këtë arsye mbledhja dhe analiza e të dhënave
duhet të jetë pjesë e procesit të modelimit dhe trajnimit të rrjetit.
- Nuk mund të përcaktohet zgjidhja e plotë që në fazën e dizenjimit. Për këtë ndërtohen
prototipa të cilët vlerësohen për të gjykuar mbi elementët e përfshirë në dizenjim.
- Performanca e rrjetit është më e rëndësishme se shpejtësia përllogaritëse. Kujdesi për
performancën tregohet që në fazën e analizës, dizenjimi dhe testimit.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
112
Për këtë ishte e nevojshme që zhvillimi i sistemit inteligjent parashikues të ndryshojë nga
zhvillimi i softuerëve tradicionale për t‟i adresuar sa më mirë aspektet e ndryshme. Një
çështje e rëndësishme e trajtuar në këtë punim është përdorimi i metodave të validimit dhe
verifikimit për rrjetat neural të zhvilluar si dhe vendosja e disa udhëzimeve që drejtojnë
përzgjedhjen e parametrave. Për këto elementë nuk ekzistojnë metoda standarde.
Si konkluzion që në ndërtimin e sistemit inteligjent parashikues mund të përdoren, për pjesë
të caktuara të këtij sistemit, mjetet apo metodat standarde që janë të njohura në inxhinierimin
e softuerëve tradicionalë. Por, nuk mund të gjejmë për çdo pjesë të sistemit tonë. Kjo për
shkak të tipareve që kanë ndërtimi i një rrjeti neural. Prandaj është e nevojshme të përdoren
teknika verifikimi dhe validimi që janë specifike për rrjetat neurale.
Nga çfarë ne përmendëm, mund të themi që hipoteza e katërt nuk mbështetet nga të dhënat e
arritura në studim.
H5. Procesimi i përllogaritjeve të kryera nga SIP mund të paralelizohen.
Si disavantazh i rëndësishëm i ndërtimit të rrjetit neural dhe trajnimit të tij është koha e gjatë
që kërkon ky proces në vetvete. Gjithashtu, sistemi inteligjent parashikues realizon
përpunimin e të dhënave, ndërtimin e strukturave të ndryshme dhe trajnimin të tyre si dhe
përdorimin e algoritmeve të ndryshme të trajnimit. Një nga zgjidhjet harduerike të cilat i
lehtësojnë implementimet e këtyre rrjetave, është përdorimi i paralelizimit.
Në këtë punimi është marrë në konsideratë si mund të përfitonim në kohë nëse do të
përdornim elementë të paralelizimit. Pasi është bërë analiza e sistemit dhe dizenjimi i tij janë
vlerësuar mundësitë e përdorimit të përpunimit të informacionit në paralel. Sistemi i plotë
nuk mund të ndahet në pjesë të veçanta të pavarura në procesim.
Megjithatë në këtë studim jemi fokusuar nëse pjesë të caktuara të përllogaritjeve të mund të
paralelizohen. Si rezultat, kemi përcaktuar pikat kyçe të cilat mund të paralelizohen:
(i) secila nga strukturat e rrjetit neural, për çdo lloj përpunimi të dhënash, mund të trajnohet
në mënyrë të pavarur.
(ii) Për çdo algoritëm trajnimi që merret në vlerësim ne mund të përdorim përllogaritje
paralele për trajnimet e ndryshme.
(iii) Gjithashtu dhe për çdo strukturë të rrjetit neural, që ka strukturë të tipit SHS, mund të
përdorim teknika të paralelizimit meqenëse baza koduese e tyre janë ciklet „for‟ që
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
113
mundësojnë shpërndarjen e blloqeve të njëjta të instruksioneve në njësi të veçanta
përpunuese.
Nga analiza e kryer mbi analizën dhe dizenjimin e sistemit inteligjent parashikues tregon se
ne mund të përdorimi teknika të paralelizimit në faza të ndryshme të përllogaritjeve. Pra, të
dhënat e studimit tonë mbështesin hipotezën 5 të ngritur në këtë disertacion.
Në përmbledhje, shtojmë se 3 hipoteza nga 5 mbështetet nga të dhënat e këtij disertacioni.
Duke ripërmendur që në metodologjinë e përzgjedhur për zhvillimin e këtij punimi roli i
hipotezave është që të drejtojnë procesin e analizës dhe modelimit të sistemit inteligjent
parashikues. Këto rezultate të arritura tregojnë se si duhet të analizohen dhe integrohen këto
teknika dhe elemente për të arritur qëllimin kryesorë që ka ky punim. Nëpërmjet vlerësimit të
këtyre hipotezave janë arritur të evidentohen se kush janë faktorët kryesorë që ndikojnë në
strukturën e rrjetit neural si dhe mënyrën se si ndërveprojnë ato me njëri-tjetrin, si duhen
inxhinieruar softuerët të cilët përdorin këto metoda inteligjent dhe si të zvogëlohet koha e
përllogaritjeve nëpërmjet teknikave të ndryshme të paralelizimit.
7.2 Rekomandime të studimit
Sistemi i analizuar dhe dizenjuar për parashikimin e serive kohore me një ndryshore, përbën
një kontribut të rëndësishëm në literaturën për ndërtimin e modeleve parashikuese të serive
kohore me një ndryshore. SIP është një instrument i cili lejon zhvilluesit të implementojnë në
mënyrë efikase dhe të shpejt programe për ndërtimin e modeleve parashikuese në çfarë do
platforme. Zhvillues të ndryshëm mund të zgjedhin të ripërdorin dhe pjesë të këtij sistemi
duke qenë se për modelimin e tij është bërë një ndarje në module e sistemit.
Megjithatë, sistemi i modeluar, duhet të konsiderohet si një instrument i cili kërkon të
përditësohet si rezultat i kërkimeve empirike shtesë që arrihen në punime të ndryshme. Një
tjetër tipar i rëndësishëm është se për çdo modul të sistemit, mund të ndryshohen dhe
pasurohen kërkesat në mënyrë që sistemi të mund të trajtojnë një numër më të gjerë
problemash. Gjithashtu, ndarja e sistemit në module, mundëson që ky sistem të mund të
zhvillohet duke shtuar veçori specifike nëpërmjet moduleve shtesë të krijuara.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
114
Rekomandime kryesore që dalin nga ky punim janë:
Të krijohen hapësirat dhe mundësitë që teknikat inteligjente të jenë një alternative e
krahasueshme me metodat tradicionale parashikuese, rezultati i të cilave të konsiderohet në
procesin e vendimmarrjeve në fusha të ndryshme.
Zhvillimi i moduleve mësimore, në fushën akademike, të cilat të ndërthurin metodat
inteligjente me analizën e serive kohore. Duke rritur numrin e individëve me njohuri të thella
në zhvillimin e sistemeve inteligjente që i përgjigjen kërkesave të kohës.
Nga pikëpamja e biznesit, ky punim i vjen në ndihmë sektorit privat, duke sugjeruar që të
zhvillojnë programe të cilët përdorin parashikime me anë të metodave inteligjente si një
alternativë e mirë përfitimi.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
115
8 REFERENCAT
AnkushKhere dhe MayurPatankar. (2012). Artificial Intelligence: Artificial Neural Network Simplified.
World Research Journal of Transactions on Algorithms, 1(1), 13-17.
Bacchetta, P., & Wincoop, E. v. (2006). Can information heterogeneity explain the exchange rate
determination puzzle? American Economic Review 96, 552-576.
Bang, A. L., et al. (2012). The Role of Hypothesis in Constructive Desing Research. Proceedings of the
Arts of Research Iv.
Bang, A. L., Krough, P., Ludvigsen, M., & Markussen, T. (2012). The Role of Hypothesis in Constructive
Design Research. . Proceedings of the Art of Research Iv.
Barnard, E. and Wessels, L. (1992). Extrapolation and Interpolation in Neural Network Classifiers.
IEEE Control Systems, 50-53.
Basheer I.A. dhe Hajmeer M,. (2000). Artificial Neural Networks: fundamentals, computing, design,
and application. Journal of Microbiological Methods, 43, 3-31.
Bengio Y. & LeCun Y. (2007). Scaling Learning Algorithms Towards AI. Large-Scale Kernel Machines, 1,
1-41.
Beverly, P. (2016). Designs, Methods and Practices for Research of Project Management. Burlington:
Gower Publishing Company.
Bishop, C. M. (2006). Pattern Recognition and Machine Learning. Singapore: Springer.
C. Kandilar, M.Simsek, C. H. Aladag. (2009). Forecasting The Exchange Rate Series With Ann: The
Case of Turkey. Istanbul Univ. Econometrics and Statistics e-Journal, 9(1), 17-29.
ChangI. Ch., Hwang H. G. (1998). Applying Neural Networks in Time Series Forecasting. Information
and Management Science, 9(3), 35-43.
Crone, S. F., Guajardo, F., & Weber, R. . (2006). The impact of preprocessing on support vector
regression and neural networks in time series prediction . DMIN, 37-44.
F., H. (2004). Elementë të njehsimit paralel. Tirana: SHBLU.
Fiesler, E. (1996). 'Neural Network Topologies' The Handbook of Neural Computation. Oxford
University Press and IOP Publishing.
Fu, L. (1994). Neural Networks in Computer Intelligence. New York: McGraw-Hill.
Giles, C. L., Lawrence, S. dhe Tsoi, A. C. (2001). Noisy time series prediction usign recurrent neural
networks and grammatical inference. . Machine Learning , 44(1-2), 161-183.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
116
Gonzaley, S. (2007). Neural Networks for Macroeconomic Forecasting: A Complementary Approach
to Linear Regression Models. Canada.
Gonzalez S. (2000). Neural networks for macroeconomic forecasting: a complementary approach to
linear regression models. Canada Economic and Fiscal Policy Branch.
Gonzalez, Steven; Canada Economic and Fiscal Policy Branch. (2000). Neural networks for
macroeconomic forecasting: a complementary approach to linear regression models.
Gupta J. N. D., Smith K. A. (2001). Neural Networks in Business: Techniques and Applications. London:
idea Group inc (IGI).
Hall, P. R. & Kibler, F. D. (1985). Differing Methodological Prespectives in Artificial Intelligence
Research. AI Magazine, AAAI, Vo 6, Nr 3, 166-179.
Haykin, S. (1999). Neural Networks and Learning machines. Ontario, Canada: Pearson.
Hines, J. W. (1996). A logarithmic neural network architecture for a PRA approxiation. American
Nuclear Society, International Topical Meeting on Nuclear Plant Instrumantation, Control
and Human-Machine Interface Tchnologjies, 235-241.
Indranarain, R. (2010). Artificial Intelligence: Neural Networks Simplified. International Research
Journal of Finance and Economics, 39.
Inoue, A., & Kilian, L. (2002). In-sample or out-of-sample tests of predicability: which one should we
use? European Central Bank, Working Paper no. 195.
Jain A. K., Mao J., Mohiuddin K. M. (1996). Artificial Neural Networks: A Tutorial. Computer, 29(3),
31-44.
Janil, A. K., & Mao, J. (1996). Artificial Neural Networks: A Tutorial. IEEE Transactions on Computer,
29(3 (March)), 31-44; doi:10.1109/2.485891.
JingTao, Y. A. O, & Tan, C. L. (2001). Guidelines for financial forecasting with neural networks. In
International Conference of Neural Information Processing.
Kaastra I. dhe Boyd M. . (1996). Designing a neural network for forecasting financial and economic
time series. Neurocomputing 10, 215-236.
Kaastra, I. dhe Boyd, M. (1996). Designing a Neural Network for Forecasting Financial and Economic
Times Series. . Neurocomputing, 10, 215-236.
Karsoliya, S. (2012). Approximating Number of Hidden Layer neurons in Multiple Hidden Layer BPNN
Architecture. International Journal of Engineering Trends and Technology, 31(6), 714-717.
Kilian, L., & Taylor, M. P. (2001). Why is it so difficult to beat the random walk forecast of exchange
rates?
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
117
Klaussen, K. L. dhe Uhrig, J. W. (1994). Cash soybean price prediction with neural networks.
Conference on Applied Comodity Analysis, Price, Forecasting and Market Risk Management
Proceedings, (fv. 56-65). Chicago.
Koskinen I., Zimmerman J. et al. (2011). Design Research through Practice. USA: Elsevier.
Krystyna, K., & Maciej, Z.,. (2011). Data pre-processing in the neural network identification of the
modified walls natural frequencies. Computer Methods in Mechanics, Ms12, 9-12.
L. Yu, Sh. Wang and K. K. Lai. (2007). Foreign-Exchange-Rate forecasting with Artificial Neural
Networks. New York: Springer.
Maier H. R.,Jain A., Dandy G. C. & Sudheer K. P. (2010). Methods used for the development of neural
networks for the prediciton of water resource variable in river systems: Current status and
future directions. Environmental Modelling & Software, 25(8), 891-909.
Mandic D. P. & Chambers J. A. (2001). Recurrent Neural Networks for Prediction. England: John Wiley
& Sons Ltd.
Martiri E., Tyxhari G. dhe Gorishti A. (2010). Parallel Computing: still missing in the Albanian reality.
Economic & Social Challenges and Problems at the Time of Crisis, FE, UT.
May R.,Dandy G., & Maier H. (2011). Review of input variable selection methods for artificial neural
networks. Artifcial neural networks - methodological advances and biomedical application,
Doi:10.16004.
McCulloch W. S., Pitts W. (1943). A Logical Calculus of Ideas Immanent in Nervous Activity. Bull.
Mathematical Biophysic, 5, 115-133.
McNelis, P. D. (2004). Neural Networks in Finance: Gaining Predictive Edge in the Market . Orlando,
FL: Academic Press.
Meylar, A., Kenny, G., & Quinn, T. (1998). Forecasting Irish inflation using ARIMA models. Munich
Personal RePEs Archive (MPRA) paper no 11359 (December).
Mitchell, T. M. (1997). Machine Learning. McGraw-Hill.
Moody J. (1995). Economic Forecasting: Challenges and Neural Network Solution. International
Symposium on Artificial Neural Network. Hsichu, Taivan.
Nawi, N. M., Atomi, W. H., & Rehman, M. Z. (2013). The effect of data pre-processing on optimized
training of artificial neural networks. Procedia Technology, 11, 32-39.
Nouir Z, Sayrac B, Fourestie B, Tabbara W, Brouaye F. (2007). Comparison of neural network learning
algorithms for prediction enhancement of a planning tool. In 13th European Wireless
Conference .
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
118
P. W. Ch. Prasad & Azam Beg. (2009). Investigating data preprocessing methods for circuit
complexity models. Expert Systems with Applications, 36(1), 519–526.
Palit A. K. dhe Popovic D. (2005). Computational Intelligence in Time Series Forecasting.
Panchal F., S. ; Panchal M. (2014). Review on Methods of Selecting Number of Hidden Nodes in ANN.
International Journal of Computer Science and Mobile Computing, 3(11), 455-464.
Përshtatur nga: Nunamaker, W., Chen, M., dhe Purdin, T. (1991). Systems development in
information systems research. Journal of Management Information Systems, 7(3) 89-106.
Philip, A., Taofiki, A., & Bidem, A. (2011). Artificial Neural Network Model for Forecasting Foreign
Exchange Rate. 1(No. 3), 110-118.
Portugal, M. S. (1995). Neural Network Versus Time Series: a Forecasting Exercise. Revista Brasileira
de Economia, 49(4) 611-629.
Roche, C. (2014, 08 13). Why economic and market forecasting matters to everyone. Gjetur 11 16,
2015, nga Pragmatic Capitalism: http://www.pragcap.com/why-economic-and-market-
forecasting-matters-to-everyone/
Rumelhart DE, Hinton GE, dhe Williams RJ. (1986). Learning internal representation by back-
propagation errors. Cambridge, MA: MIT Press.
Russell S. J. dhe Norvig P. (2009). Artificial Intelligence: A Modern Approach (Vëll. i III). Prentice Hall.
Sarno, L., & Taylor, M. P. (2002). The Economics of Exchange Rates. Cambridge University Press.
Seiffert U. (2002). Artificial Neural Networks on Massively Parallel Computer Hardware. European
Symposium on Artificial Neural Networks . Bruges (Belgium): ESANN'2002.
Seiffert, U. (2002). Artificial Neural Networks on Massively Parallel Computer Hardware. Europeab
Symposium on Artificial neural networks. Bruges (Belgium): Essann'2002 .
Shamsuddin, S. M., Sallehuddin, R., & Yusof, n. M. (2008). Artificial Neural Network time series
modeling for revenue forecasting. Chiang Mai J. Sci, 35(3), 411-426.
Singh, S.K.; Jain, S.K.;Bardassy, A. (2014). Training of artificial neural networks using information-rich
data. Hydrology, 1, 40-62.
Smith, S. W. (2013, Dhjetor 15). The Scientist and Enginner's Guide to Digital Signal Proccessing.
Gjetur në DspGuide: http://www.dspguide.com/ch26/2.htm
Stencl M. dhe Stastny J. (2011). Artificial Neural Network Numerical Forecasting Of Economic Time
Series. intech.
T. Hill, L. Marquey, M. O'Connor dhe W. Remus. (1994). Artificial Neural Network models for
Forecasting and Decision Making. International Journal of Forecasting , 10:5-15.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
119
T. Hill, L. Marquez, W. Remus. (1994). Artificial Neural Network models for forecasting and decision
making. Int. J. Forecast, 10, 5-15.
Tarassenko, L. (1998). Guide to Neural Computing Applications. New York: John Wiley & Sons Inc.
Taylor BJ, Darrah MA and Moats CD. (2003). Verification and validation of neural networks: a
sampling of research in progress. AeroSense; International Society for Optics and Photonics,
(fv. 8-16).
Touretzky D. S. & Pomerleau D. A. . (1989, August ). What's hidden in the hidden units? BYTE, f. 14:8.
Turan, P. D. (2011). Artificial Neural Network Application in Economics: A Survey of Emprical
Literature and its Using on Economic Studies. 1st International Symposium on Computing in
Informatics and Mathematics.
Vahidov, R. (2012). Design-Type Research in Information Systems: Findings and Practices. Canada:
IGI-Global.
Virili, F. & Freisleben, B. (2000). Nonstationary and data preprocessing for neural network prediction
of an economic time series. International Joint conference (fv. 129-134). IEEE-INNS-ENNS vol.
5.
Walczak, S. (1998). Neural Network Models for A Resource Allocation Problem . Transaction on
Systems, Man and Cybernetics, 276-284.
Walczak, S. dhe Cerpa, N. (1999). Heurisitic principles for the design of artificial neural networks.
Information and Software Technology(41(2)), 109-119.
Wang Lp, Fu Xj . (2005). Data Mining with Computational Intelligence. Berlin: Springer-Verlag.
Y, H. (2009). Advances in Artificial Neural Networks - Methodological development and application.
Algorithms, 2(3), 973-1007.
Yao, J. T. (2002). Towards a Better Forecasting Model for Economic Indices. International Conference
on Computer Science and Informatics, 6, fv. 299-303. Durham, USA.
Yonaba H., Anctil F., & Fortin V. (2010). Comparing sigmoid Transfer Function for NN multistep
Ahead Streamflow Forecasting. Hydrologic Engineerig, 15(4), 275-283.
Yu, L., Wang, S., & Lai, K. K. (2010). Foreign-Exchange-Rate Forecasting with artificial neural
networks. Springer Science and Business Media, 107.
Zhang G. P. (2004). Neural Networks in Business Forecasting. EUA: Idea Group Publishing.
Zhang G., Patuwo E. B., Hu M. (1998). Forecasting with artificial neural network: The state of the art.
International Journal of Forecasting(14), 35-62.
Zhang, G., & Hu, M. Y. (1998). Neural network forecasting of the British pound/US dollar exchange
rate. Omega 26.4, 495-506.
“Analiza dhe Dizenjimi i një Sistemi Inteligjent për Parashikim Nëpërmjet
Rrjetave Neurale “
Blerina VIKA
120
Zhang, G., Patuwo, B., & Hu, M. Y. (1998). Forecasting with artificial neural networks: The state of
the art. International Journal of Forecasting(14 (1)), 35-62.
Zhang, S., Zhang, C., Yang, Q. (2003). Data preparation for data mining. Applied Artificial Intelligence,
5-6(17), 375-381.
Zhang, Sh., Zhang, Ch. dhe Yang, Q. (2003). Data preparation for data mining. Applied Artificial
Itelligence: An International Journal, 17(5-6), 375-381.
Zheng, Z. (2006). Boosting and Bagging of Neural Networks with Applications to financial time series.
Working paper, Department of Statistics, University of Chicago, Tech. Rep.
Zimmerman, J., & Forlizzi, J. (2008). The Role fo Design Artifacts in Design Theory Construction.
Artifact, 2(1):41-45.