razvoj prediktivne metode odre Đivanja pogonske … · literaturi za proces u čenja metoda. za...
TRANSCRIPT
S V E U Č I L I Š T E U S P L I T U
FAKULTET ELEKTROTEHNIKE, STROJARSTVA I BRODOGRADNJE
Marko Šušnjar dipl. ing.
RAZVOJ PREDIKTIVNE METODE ODREĐIVANJA POGONSKE ČVRSTOĆE MATERIJALA
DOKTORSKA DISERTACIJA
Split, 2012.
Marko Šušnjar – Doktorska disertacija
ii
Doktorska disertacija je izrađena pri
Zavodu za strojarstvo i brodogradnju
Fakulteta elektrotehnike, strojarstva i brodogradnje
Sveučilišta u Splitu
Mentor:
dr. sc. Željko Domazet, red. prof.
Rad broj: 76
Marko Šušnjar – Doktorska disertacija
iii
Povjerenstvo za ocjenu doktorske disertacije:
1. dr. sc. Tonći Piršić, izv. prof. FESB Split 2. dr. sc. Željko Domazet, red. prof. FESB Split 3. dr. sc. Zlatan Kulenović, red. prof. Pomorski fakultet Split 4. dr. sc. Sven Gotovac, red. prof. FESB Split 5. dr. sc. Lovre Krstulović-Opara, red. prof. FESB Split
Povjerenstvo za obranu doktorske disertacije:
1. dr. sc. Tonći Piršić, izv. prof. FESB Split 2. dr. sc. Željko Domazet, red. prof. FESB Split 3. dr. sc. Zlatan Kulenović, red. prof. Pomorski fakultet Split 4. dr. sc. Sven Gotovac, red. prof. FESB Split 5. dr. sc. Lovre Krstulović-Opara, red. prof. FESB Split
Disertacija obranjena dana: 10. srpnja 2012.
Marko Šušnjar – Doktorska disertacija
iv
RAZVOJ PREDIKTIVNE METODE ODREĐIVANJA POGONSKE ČVRSTOĆE MATERIJALA
Sažetak:
Pogonska čvrstoća materijala u obliku Wöhlerovih S-N krivulja se dobiva složenim, dugotrajnim i skupim eksperimentalnim postupcima. Složenost postupka nameće potrebu razvijanja metode koja bi mogla predvidjeti S-N krivulju materijala numeričkim putem koristeći podatke dostupnih eksperimenata. Metode rudarenja podataka su u mogućnosti interpolirati višedimenzionalne probleme pogonske čvrstoće. U radu su razvijene i testirane metode s dva algoritma: neuralne mreže i stabla odlučivanja. Primijenjena je, i prilagođena za probleme pogonske čvrstoće, CRISP DM metodologija. Testiranja su obavljena numerički i eksperimentalno. Numerička provjera je pokazala visoku točnost metode neuralnih mreža. Eskperimentalna provjera je također potvrdila visoku točnost metode neuralnih mreža, dok su stabla odlučivanja pokazala vrlo ograničene mogućnosti primjene. U obje provjere su korišteni podaci testiranja dostupnih u literaturi za proces učenja metoda. Za eksperimentalnu provjeru su provedena vlastita ispitivanja na uzorcima od dvaju različitih materijala s različitim koeficijentima koncentracije naprezanja pod aksijalnim opterećenjem. Utvrđeno je da ni jedna razmatrana metoda ne može provesti ekstrapolaciju i da postoje ograničenja u rubnim uvjetima. Rubni uvjeti su ovisni o intervalima popunjenosti varijabli u setovima podatka za učenje metode. Pokazano je da se može postići veća točnost metode ako se S-N krivulja uzorkuje po prediktivnoj varijabli. U radu je kao prediktivna varijabla korišten broj ciklusa opterećenja N.
Ključne riječi:
pogonska čvrstoća, prediktivne metode, vijek trajanja, rudarenje podataka, Wöhlerove krivulje
Marko Šušnjar – Doktorska disertacija
v
DEVELOP OF PREDICTIVE METHOD FOR DETERMINATION OF MATERIAL FATIGUE LIFE
Abstract:
Fatigue failure of the material represented in Wohler S-N curves require complex, long running and expensive experiments. Complexity of the experiments requires developing of the numerical prediction method for generation S-N curves based on the existing experimental data. Data mining methods are able to make interpolation multidimensional problems of fatigue failure. In this work two methods are develop and tested: neural networks and decision trees. CRISP DM methodology are implemented and adopted for fatigue failure problems. Numerical and experimental tests have been provided. High precision of neural networks have been obtained in numerical tests. Experimental test has shown same high prediction accuracy of neural networks. Decision trees have shown very limited implementation possibility. In both, numerical and experimental tests, data from available literature have been used for method training purposes. Experimental tests have been provided on two different materials, several stress concentration facto and axial loading. Both methods cannot provide extrapolation of data and limitation in boundary conditions exists. Boundary conditions depend of data quality in training datasets. Higher prediction precision has achieved in case S-N curve sampling across predict variable. Number of load cycles (N) have been used as predict variable in modeling.
Keywords:
Fatigue failure, predictive methods, material lifecycle, data mining, Wöhler’s curve
Marko Šušnjar – Doktorska disertacija
vii
Sadržaj
1. Uvod ............................................................................................................... 1
1.1. O pogonskoj čvrstoći ............................................................................... 1
1.2. O metodama rudarenja podataka ............................................................ 2
1.3. Dosadašnja istraživanja ........................................................................... 5
1.4. Cilj istraživanja ......................................................................................... 7
2. Pogonska čvrstoća ......................................................................................... 8
2.1. Vrste opterećenja .................................................................................... 8
2.2. Konstrukcijski oblik .................................................................................. 9
2.3. Karakteristike materijala .......................................................................... 9
2.4. Uvjeti eksploatacije ................................................................................ 10
2.5. Eksperimentalna ispitivanja ................................................................... 10
3. Rudarenja podataka ..................................................................................... 12
3.1. Metodologija rudarenja podataka .......................................................... 12
3.1.1. Razumijevanje područja primjene ................................................... 13
3.1.2. Razumijevanje podataka ................................................................. 14
3.1.3. Priprema i pretprocesiranje podataka ............................................. 15
3.1.4. Modeliranje ..................................................................................... 17
3.1.5. Razvoj modela ................................................................................ 18
3.1.6. Problematika evaluacije i ocjene modela ........................................ 20
3.2. Metode rudarenja podataka ................................................................... 23
3.2.1. Struktura algoritama metoda rudarenja podataka ........................... 24
3.2.2. Stabla odlučivanja ........................................................................... 26
3.2.3. Neuralne mreže .............................................................................. 32
4. Metodologija primjene rudarenja podataka u pogonskoj čvrstoći ................. 36
4.1. Potencijalne varijable (atributi) ............................................................... 36
4.1.1. Vijek trajanja ................................................................................... 36
4.1.2. Kriterij otkaza .................................................................................. 36
4.1.3. Čvrstoća materijala ......................................................................... 37
4.1.4. Vrste opterećenja ............................................................................ 37
4.1.5. Naprezanje ...................................................................................... 38
4.1.6. Vrsta materijala ............................................................................... 39
Marko Šušnjar – Doktorska disertacija
viii
4.1.7. Termička i termokemijska obrada ................................................... 40
4.1.8. Strojna obrada ................................................................................ 40
4.1.9. Koncentracija naprezanja – oblik .................................................... 41
4.1.10. Apsolutne dimenzije ........................................................................ 42
4.1.11. Tvrdoća ........................................................................................... 42
4.1.12. Zračenje .......................................................................................... 43
4.1.13. Temperatura ................................................................................... 43
4.1.14. Mehanička obrada .......................................................................... 44
4.1.15. Zaostalo naprezanje........................................................................ 44
4.1.16. Atmosfera ........................................................................................ 45
4.1.17. Korozija ........................................................................................... 45
4.1.18. Međuzavisnost parametara ............................................................. 45
4.2. Razumijevanje podataka ....................................................................... 46
4.2.1. Geometrija i dimenzije uzorka ......................................................... 46
4.2.2. Tipovi pokusa u pogonskoj čvrstoći ................................................ 46
4.2.3. Rezultati pokusa ............................................................................. 46
4.2.4. Koncentratori naprezanja ................................................................ 47
4.2.5. Materijal uzorka .............................................................................. 47
4.2.6. Vrste opterećenja i naprezanje ....................................................... 47
4.3. Priprema i pretprocesiranje podataka .................................................... 51
4.3.1. Analiza varijabli ............................................................................... 51
4.3.2. Priprema uzorka .............................................................................. 52
4.3.3. Pretprocesiranje seta podataka za modeliranje .............................. 53
4.4. Modeliranje, razvoj modela i učenje ...................................................... 54
4.5. Ocjena modela ...................................................................................... 55
5. Razvoj prediktivne metode uz numeričku verifikaciju ................................... 56
5.1. Izvori i izbor podataka ............................................................................ 56
5.2. Priprema podataka ................................................................................ 62
5.3. Pretprocesiranje podataka ..................................................................... 66
5.4. Odabir prediktivnih metoda .................................................................... 69
5.4.1. Preliminarna istraživanja ................................................................. 69
5.4.2. Odabrane metode ........................................................................... 70
Marko Šušnjar – Doktorska disertacija
ix
5.4.3. Algoritam Neuralnih mreža .............................................................. 71
5.4.4. C&RT algoritam .............................................................................. 74
5.5. Modeliranje ............................................................................................ 77
5.5.1. Podjela ulaznih podataka ................................................................ 78
5.5.2. Parametriziranje metoda ................................................................. 81
5.6. Proces učenja ........................................................................................ 87
5.7. Analiza rezultata numeričkog modeliranja ............................................. 88
5.7.1. Naprezanje kao izlazna varijabla .................................................... 88
5.7.2. Broj ciklusa kao izlazna varijabla .................................................... 91
5.8. Diskusija o numeričkoj verifikaciji .......................................................... 95
6. Eksperimentalna verifikacija metode ............................................................ 97
6.1. Pregled uzoraka .................................................................................... 97
6.1.1. Materijal uzorka ............................................................................... 97
6.1.2. Oblik uzorka .................................................................................... 98
6.1.3. Koncentracija naprezanja na uzorcima za dinamičko ispitivanje ... 100
6.1.4. Određivanje koeficijenta koncentracije naprezanja ....................... 103
6.2. Eksperimentalno određivanje vijeka trajanja uzorka ............................ 107
6.2.1. Korištena oprema .......................................................................... 107
6.2.2. Postupak ispitivanja ...................................................................... 108
6.3. Rezultati ispitivanja .............................................................................. 110
6.3.1. Statičko ispitivanje ........................................................................ 110
6.3.2. Dinamičko ispitivanje..................................................................... 111
6.4. Primjena prediktivne metode na rezultate ispitivanja ........................... 118
6.4.1. Ulazni podaci ................................................................................ 118
6.4.2. Uzorkovanje Wöhlerove krivulje .................................................... 119
6.4.3. Rezultati predikcije ........................................................................ 119
6.4. Analiza rezultata predikcije .................................................................. 130
7. Zaključak .................................................................................................... 133
Marko Šušnjar – Doktorska disertacija
x
Popis tablica
Tablica 3.1 Matrica klasifikacije 20
Tablica 4.1 Primjer grupiranja varijabli iz preliminarnih ispitivanja 48
Tablica 5.1 Primjer digitaliziranih podataka iz literature 59
Tablica 5.2 Primjer digitaliziranih podataka iz literature 59
Tablica 5.3 Primjer digitaliziranih podataka iz literature 60
Tablica 5.4 Materijal uzoraka odabranih za numeričku verifikaciju
metoda
61
Tablica 5.5 Pregled strukture podataka 63
Tablica 5.6 Oznake toplinskih obrada 64
Tablica 5.7 Oznake oblika koncentracije naprezanja uzorka 65
Tablica 5.8 Oznake površina uzorka 65
Tablica 5.9 Statistička analiza ulaznih podataka 66
Tablica 5.10 Točke uzorkovanja na Wӧhlerovim pravcima 68
Tablica 5.11 Skupine modela 78
Tablica 5.12 Zajednički atributi validacijskog seta podataka 79
Tablica 5.13 S-N vrijednosti validacijskog seta 80
Tablica 5.14 Prikaz najnižih grešaka postignutih pojedinim skupinama
modela
94
Tablica 6.1 Kemijske karakteristike materijala prema deklaraciji proizvođača
98
Tablica 6.2 Mehaničke karakteristike materijala prema deklaraciji proizvođača
98
Tablica 6.3 Koeficijenti koncentracije naprezanja za uzorke 103
Tablica 6.4 Rezultati statičkog ispitivanja 111
Tablica 6.5 Označavanje uzoraka dinamičkog ispitivanja 112
Tablica 6.6 Rezultati dinamičkog ispitivanja za uzorak S35 R0 112
Tablica 6.7 Rezultati dinamičkog ispitivanja za uzorak S35 R04 113
Tablica 6.8 Rezultati dinamičkog ispitivanja za uzorak S35 R10 113
Marko Šušnjar – Doktorska disertacija
xi
Tablica 6.9 Rezultati dinamičkog ispitivanja za uzorak S45 R0 113
Tablica 6.10 Rezultati dinamičkog ispitivanja za uzorak S45 R04 114
Tablica 6.11 Rezultati dinamičkog ispitivanja za uzorak S45 R10 114
Tablica 6.12 Točke uzorkovanja ciklusa opterećenja Wöhlerovih pravaca
117
Tablica 6.13 Tablični pregled rezultata prediktivne metode za uzorak S35 R0
126
Tablica 6.14 Tablični pregled rezultata prediktivne metode za uzorak S35 R04
126
Tablica 6.15 Tablični pregled rezultata prediktivne metode za uzorak S35 R10
127
Tablica 6.16 Tablični pregled rezultata prediktivne metode za uzorak S45 R0
127
Tablica 6.17 Tablični pregled rezultata prediktivne metode za uzorak S45 R04
128
Tablica 6.18 Tablični pregled rezultata prediktivne metode za uzorak S45 R10
128
Tablica 6.19 Tablični pregled rezultata prediktivnih metoda za uzorak S35 R04
130
Marko Šušnjar – Doktorska disertacija
xii
Popis ilustracija
Slika 1.1 Rezultati isptivanja problema pogonske čvrstoće 1
Slika 2.1 Primjer Wöhlerovih krivulja 11
Slika 3.1 Shematski prikaz CRISP DM metodologije 12
Slika 3.2 Lift krivulja 22
Slika 3.3 Stabla odlučivanja 27
Slika 3.4 Neuron u neuralnim mrežama 32
Slika 3.5 Graf izlazne step funkcije 33
Slika 3.6 Topologija neuralne mreže 34
Slika 4.1 Dijagram promjenjivog opterećenja 37
Slika 4.2 Koeficijent asimetričnosti ciklusa 38
Slika 4.3 Tenzor naprezanja 39
Slika 4.4 Shema prediktivnog modeliranja prilagođena pogonskoj čvrstoći
55
Slika 5.1 Primjeri S-N dijagrama iz literature 57
Slika 5.2 Prikaz numeričkih podataka iz literature 58
Slika 5.3 Wӧhlerovi pravci s vjerojatnošću preživljavanja 67
Slika 5.4 Primjer interpolacije Wӧhlerovih pravaca na eksperimentalnim podacima
67
Slika 5.5 Wӧhlerov pravac validacijskog seta 80
Slika 5.6 Neuralne mreže s jednim skrivenim slojem 82
Slika 5.7 Neuralne mreže s dva skrivena sloja 83
Slika 5.8 Prikaz procesa učenja i propagacije uspješnosti kod neuralnih mreža
87
Slika 5.9 Prikaz razlike rezultata kod seta podataka za učenje i seta za testiranje
87
Slika 5.10 Odnos greške i broja neurona u skrivenom sloju 89
Slika 5.11 Odnos greške i brojeva neurona u 1. i 2. skrivenom sloju 89
Slika 5.12 Model C&RT metode za predikciju naprezanja 90
Slika 5.13 Odnos greške i broja neurona u skrivenom sloju 91
Marko Šušnjar – Doktorska disertacija
xiii
Slika 5.14 Odnos greške i broja neurona u 1. i 2. skrivenom sloju 92
Slika 5.15 Model C&RT metode za predikciju broja ciklusa opterećenja
93
Slika 5.16 Grafički prikaz rezultata predikcijskih modela 94
Slika 5.17 Distribucija broja ciklusa (Nf) u odnosu na opterećenje (Sa) u podacima za modeliranje
96
Slika 6.1 Uzorak za statičko ispitivanje 99
Slika 6.2 Oblik uzorka za statičko ispitivanje 99
Slika 6.3 Uzorak za dinamičko ispitivanje 100
Slika 6.4 Oblik uzorka za dinamičko isptivanje 100
Slika 6.5 Detalj uzorka sa utorom r = 0 mm 101
Slika 6.6 Detalj uzorka sa utorom r = 0,4 mm 101
Slika 6.7 Detalj uzorka sa utorom r = 1 mm 101
Slika 6.8 Utor uzorka nakon strojne obrade, r = 0 mm 102
Slika 6.9 Utor uzorka nakon strojne obrade, r = 0,4 mm 102
Slika 6.10 Utor uzorka nakon strojne obrade, r = 1 mm 102
Slika 6.11 Mreža konačnih elemenata za uzorak r = 0 mm 104
Slika 6.12 Koncetracija naprezanja za uzorak r = 0 mm dobijena metodom konačnih elemenata
104
Slika 6.13 Mreža konačnih elemenata za uzorak r = 0,4 mm 105
Slika 6.14 Koncetracija naprezanja za uzorak r = 0,4 mm dobijena metodom konačnih elemenata
105
Slika 6.15 Mreža konačnih elemenata za uzorak r = 1 mm 106
Slika 6.16 Koncetracija naprezanja za uzorak r = 1 mm dobijena metodom konačnih elemenata
106
Slika 6.17 Umaralica „Instron 8801“ Katedre za konstrukcije, FESB-a Split
107
Slika 6.18 Učvršćeni uzorak u čeljustima umaralice 108
Marko Šušnjar – Doktorska disertacija
xiv
Slika 6.19 Uzorak nakon statičkog isptivanja 108
Slika 6.20 Primjer izgleda loma uzorka nakon dinamičkog ispitivanja 109
Slika 6.21 Diagram sila-pomak statičkog ispitivanja 109
Slika 6.22 Wöhlerov pravac za uzorak S35 R0 115
Slika 6.23 Wöhlerov pravac za uzorak S35 R04 115
Slika 6.24 Wöhlerov pravac za uzorak S35 R10 116
Slika 6.25 Wöhlerov pravac za uzorak S45 R0 116
Slika 6.26 Wöhlerov pravac za uzorak S45 R04 117
Slika 6.27 Wöhlerov pravac za uzorak S45 R10 117
Slika 6.28 Rezultati prediktivne metode za uzorak S35 R0 120
Slika 6.29 Rezultati prediktivne metode za uzorak S35 R04 121
Slika 6.30 Rezultati prediktivne metode za uzorak S35 R10 122
Slika 6.31 Rezultati prediktivne metode za uzorak S45 R0 123
Slika 6.32 Rezultati prediktivne metode za uzorak S45 R04 124
Slika 6.33 Rezultati prediktivne metode za uzorak S45 R10 125
Slika 6.34 Rezultati prediktivnih metoda za uzorak S35 R04 129
Marko Šušnjar – Doktorska disertacija
1
1. Uvod
1.1. O pogonskoj čvrstoći
Potrebne spoznaje o pogonskoj čvrstoći materijala se dobivaju složenim,
dugotrajnim i skupim eksperimentalnim postupcima. Eksperimenti, pored svega
drugoga, zahtijevaju angažman specijalne opreme te znatan rad istraživača [1].
Na slici 1.1. prikazan je tipičan pregled ispitivanja problema pogonske čvrstoće
na zavarenom spoju.
Slika 1.1 Rezultati ispitivanja problema pogonske čvrstoće [1]
Pogonska čvrstoća, kada se odnosi na pojedinačni materijal, predstavlja broj
ciklusa promjene naprezanja koje materijal može izdržati prije loma. Pogonska
čvrstoća, kada se promatra kao grana znanosti, predstavlja složena istraživanja i
Marko Šušnjar – Doktorska disertacija
2
teorijska razmatranja usmjerena pronalaženju optimanih dimenzija svakog
pojedinog dijela konstrukcije. Poddimenzioniranje bilo kojeg dijela vodi njegovu
otkazu i ugrožavanju namjene konstrukcije. Otkaz konstrukcije nerijetko ima
katastrofalne posljedice [2], [3]. Predimenzioniranje, pak, poskupljuje konstrukciju
i izaziva dodatne probleme u smislu njenih gabarita i mase. Pogonska čvrstoća
traži i pronalazi optimalne konstrukcijske parametre.
Pogonska čvrtoća kao grana znanosti utemeljena je sredinom 19. stoljeća kada je
njemački inženjer August Wöhler istraživao lomove osovina na tadašnjim pruskim
željezničkim vozilima [4]. Iako postoje raniji radovi o istraživanju zamora, Wöhler
je prvi sistematski istraživao odnos naprezanja i ciklusa promjene naprezanja
koje materijal može izdržati prije otkaza. S-N krivulje su po njemu i dobile ime
Wöhlerove krivulje [5].
Daljnji razvoj Pogonske čvrstoće ide smjerovima teoretskog i eksperimentalnog
istraživanja. Teoretsko istraživanje se bavi mehanikom loma te ostalim
istraživanjima vezanim uz nastanak i propagaciju pukotine opterećenog
materijala. Eksperimentalna istraživanja idu smjerom standardizacije
karakteristika materijala u smislu pogonske čvrstoće. Definiraju se postupci i
preporuke za dimenzioniranje dinamički opterećenih konstrukcija koje sustavi
standardizacije uvode u svoju regulativu [1].
1.2. O metodama rudarenja podataka
Rudarenje podataka se kao pojam pojavilo prilikom realizacije ideje o
transformiranju podataka u informacije ili još bliže u znanje skriveno u podacima.
Pojam rudarenja podataka (eng. data mining) je danas najpoznatiji i
najprimjenjeniji. Pored njega postoje još vrlo uvriježeni pojmovi koji se mogu
susresti na engleskom govornom području: „knowledge discovery from data
(KDD)“, „knowlege exstraction“, „data/patern analysis“, itd [6].
Marko Šušnjar – Doktorska disertacija
3
U hrvatskom govornom području najbliži termin je „inteligentna analiza podataka“.
U daljnjem tekstu će se koristiti termin „rudarenja podataka“ zbog sličnosti s
uvriježenim engleskim originalnom.
Rudarenje podataka ne predstavlja samo naprednu analizu podataka već
predstavlja nove mogućnosti u vidu predikcije kroz višedimenzionalnu
interpolaciju i ekstrapolaciju koristeći mogućnosti naprednih prediktivnih metoda
[7].
Matematičke osnove o metodama, koje se danas koriste u nečemu što možemo
zvati tehnologijom rudarenja podataka, su postojale prije. Nedostajale su
mogućnosti za njihovu primjenu: dovoljna količina podataka dostupna za analizu
te dovoljno računarske snage da se zahtjevne obrade izvedu u realnom vremenu.
Razvoj rudarenja podataka je vrlo usko povezan s razvojem relacijskih sustava
baza podataka, (eng. Relational database management system RDBMS). Prvi
elemeti su se pojavili 60-ih godina prošlog stoljeća, kada su primitivni oblici
kolekcije podataka u datoteke dobili obrise sistema baza podataka. Godina 1968.
je značajna prekretnica kada tvrtka IBM objavljuje svoj IMS (Information
Management System) [6]. IMS je imao hijerarhijski model podataka gdje su
podaci bili međusobno hijerarhijski povezani. Ranih 70-ih godina prošlog stoljeća,
pojavljuje se IDMS (Integrated Database Nabagenebt System), sustav koji je
imao mrežni model strukture podataka [6], [8]. IMS i IDMS postali su komercijalne
osnove koje su omogućile razvoj sustava baza podataka koji se pojavljuju 80-ih
godina prošlog stoljeća, te njihove evolucije u relacijske sustave baza podataka.
Ocem RDBMS-a se smatra Frank Codd koji je objavom svojih čuvenih 12 pravila
postavio temelje RDBM sustava [8], [9]. Devedesetih godina prošlog stoljeća kao
i u ovom stoljeću, sustavi se neprestano razvijaju te koristeći ekspanziju
mikroprocesorske, te općenito, elektroničke industrije dosežu ogromne
mogućnosti spremanja i manipulacije podacima. Danas u uporabi dominiraju
veliki proizvođači RDBMS sustava koji ih neprestano usavršavaju i izdaju nove
verzije sve većih i većih mogućnosti. Oracle, IBM, Microsoft, Teradata te Sybase
danas dominiraju tržištem [10].
Razvoj RDBM sustava doveo je do mogućnosti procesiranja i spremanja golemih
količina podataka, a kao posljedica toga pojavila se ekspanzija količine
Marko Šušnjar – Doktorska disertacija
4
spremljenih podataka. Podaci koji su prije ispuštani i bili nezabilježeni zbog svoje
količine, sada se zadržavaju i spremaju u sve jeftinije i dostupne repozitorije.
Javlja se problem tzv. „data explosion“, dostupnosti ogromnih količina podataka
[8]. Klasični primjer je telekomunikacijska industrija koja u potpunosti digitalizira
svoje poslovanje te sprema i čuva sve podatke vezane uz komunikaciju njihovih
korisnika. Procesna i mjerna industrija digitalizacijom kontrole procesa te samom
digitalizacijom upravljanja dohvaća nevjerojatne količine podataka koje je sada u
stanju spremati i čuvati.
Upravo je pojava te tzv. eksplozije podataka prekretnica kada su se počeli
pojavljivati alati za iskorištavanje ogromnih količina podataka. Prvi su se pojavili
OLAP sustavi. Online analytical processing (OLAP) sustavi su se pojavili kao
posrednik između prve logičke primjene tako spremljenih podataka i njihovih
korisnika - izvještavanje. Korisnici podataka su htjeli imati sve složenije izvještaje
koji su zahtijevali dohvat i obradu mnogo podataka [11]. Pojavio se problem
vremena potrebnog za obradu koji je premošten OLAP sustavima. Oni u osnovi
unaprijed provode zahtjevne obrade podataka te su u stanju isporučiti izvještaje u
realnom vremenu. Mogućnosti iskorištavanja dostupnih podataka nadmašuju
klasično izvještavanje. Suvremeni procesi svih oblika zahtijevaju kvalitetno i
pravovremeno upravljanje. Klasično izvještavanje, koje u stvari predstavlja „post
mortem“ analizu, ne može udovoljiti zahtjevima. Korisnici postaju svjesni da u
podacima postoji skriveno znanje koje se analititičkim metodama može izvući i
iskoristiti. Otad u uporabu ulazi rudarenje podataka.
Rudarenje podataka se u početku pojavlio u obliku implementacije pojedinih
metoda u posebnim programskim rješenjima. Primjena u početku nije bila
generalizirana već usko specijalizirana. Svaki pojedinačni slučaj se rješavao
programski bez (ili s minimalnom) mogućnosti parametrizacije. Problem
nedostatka generalizacije su najprije prepoznali mali nezavisni proizvođači
softvera. Oni su proizveli su prve softverske proizvode koji su bili u mogućnosti
generalizirati primjenu rudarenja podataka. Obično su se ograničavali na jednu
metodu i njeno parametriziranje. Prva i najpopularnija metoda bile su neuralne
mreže. Veliki proizvođači statističkih analitičkih programskih rješenja i veliki
proizvođači RDBMS sustava uočavaju potencijale te objavljuju svoja rješenja.
Marko Šušnjar – Doktorska disertacija
5
RDBMS sustavi dobivaju integrirane alate za rudarenje podataka koji daju
zavidne performanse (Oracle, Microsoft). Tvrtke SAP i SPSS izdaju posebne
proizvode za rudarenje podataka sa zavidnim mogućnostima. Upravo će se
SPSS-ovo rješenje [12] koristiti u izradi ove doktorske disertacije.
1.3. Dosadašnja istraživanja
Numeričke metode predviđanja vijeka trajanja konstrukcija predmet su značajnog
broja znanstvenih istraživanja. Autori variraju materijale nad kojima rade
istraživanja, dok se kao metode većinom javljaju neuralne mreže sa svojim
varijacijama.
Dosadašnja istraživanja bi se mogla podijeliti u osnovne skupine predviđanja
životnog ciklusa kroz simulaciju S-N krivulje te u skupinu predviđanja ponašanja
materijala kroz propagaciju pukotine i mehaniku loma. Autori su radili s raznim
materijalima te u dosadašnjim istraživanjima dominiraju kompozitni materijali i
aluminijske slitine, kao dominantni materijali u suvremenim konstrukcijama.
Reprezentativan rad kao predstavnik prve skupine prezentirali su Mathur, Gope i
Sharma [13] koji modeliraju predviđanje vijeka trajanja kompozitnih materijala
neuralnim mrežama. Korišteni monotoni ulazni parametri su mehanička svojstva
materijala: vlačna, tlačna i lomna čvrstoća. Parametri opterećenja su kao
apsolutni maksimalno i minimalno naprezanje, te relativni omjer naprezanja.
Korišteni su još i statistički parametri kao što su vjerojatnost loma i statistički
parametri životnog vijeka. Korištene metode su neuralne mreže s dva skrivena
sloja od po 18 i 6 neurona u sloju. Podatke koje su imali su podijelili na način da
je 80% iskorišteno za učenje dok je 20% iskorišteno za test. Numerički rezultati
dobiveni predviđanjem su pokazali vrlo visoku točnost u velikom području, 92%
rezultata ima grešku ispod 5%. Očekivano lošija točnost predviđanja se pokazala
u slučajevima gdje je postojalo jako malo setova podataka za učenje metode.
Mohanty i ostali [14] u svom radu primijenjuju neuralne mreže u modeliranju
propterećenih nosača. Model su eksperimentalno verificirali na aluminijskim
Marko Šušnjar – Doktorska disertacija
6
uzorcima podvrgnutim opterećenju s konstantnim amplitudama. Koristili su vrlo
specifičnu 9 slojnu neuralnu mrežu i postigli točnost od +4% u usporedbi sa
eksperimentalnim rezultatima. Model je pokazao tendenciju precjenjivanja vijeka
trajanja.
Plenue i Chopra [15] su u svom radu modelirali posude pod tlakom od ugljičnog i
nisko legirananog čelika. Ispitivanja su obavljana pod temperaturnim
promjenama, vodenom okruženju s otopljenim kisikom i sumporom. Koristili su
relativno veliki set podataka od 1036 pokusa. Problem je modeliran sa šest
modela i svi su koristili algoritam neuralnih mreža. Rezultati su pokazali uspješno
modeliranje problematike vijeka trajanja materijala u agresivnoj eksploatacijskoj
okolini.
Freire i ostali [16] su u svom radu modelirali S-N krivulje uz varijaciju koeficijenta
asimetričnosti cilusa r. Ispitivanje su obavili na plastičnom materijalu ojačanom
staklenim vlaknima. Napravljeni su eksperimenti na identičnoj opremi na kojoj je
napravljeno ispitivanje ove disertacije. Obavili su ukupno 454 testa te na njihovim
rezultatima napravili modeliranje. Analizirane vrijednosti koeficijenta
asimetričnosti ciklusa su bile: 1.1, 1.43, 2, 10, -2,-1,-0.5,0.1,0.5,0.7,0.8 i 0.9.
Modeliranje su napravili neuralnim mrežama varirajući parametre mreže. Pokazali
su da je za modeliranje ovakvog praktički jednoparametarskog modela potrebno
reducirati broj neurona u skrivenom sloju kako bi se dobio zadovoljavajući
rezultat. Zaključili su da je moguće uspješno generirati S-N krivulje koristeći
metodu neuralnih mreža.
Sohn i Bae [17] su obrađivali točkasto zavarene spojeve. Neuralnim mrežama su
modelirali S-N krivulje točkasto zavarenih uzoraka promatrajući parametre tipa
spoja, maksimalnog opterećenja i uvjeta opterećenja. Specifičnost je u tome što
su uveli kriterije ekonomičnosti u izvedbi spojeva. Njihova metoda je pokazala
vrlo dobre rezultate u usporedbi s analizom metodom konačnih elemenata te
eksperimentalnim rezultatima.
Nekolicina drugih autora je uspješno primijenila neuralne mreže u drugim
područjima predviđanja vijeka trajanja. Li i Ray [18] u dinamici mehanike loma,
Marko Šušnjar – Doktorska disertacija
7
Venkatesh i Rack [19] u temperaturnim promjenama Ni slitina, te Mohanty i ostali
[20] u modeliranju propagacije pukotine, itd.
Dosadašnja istraživanja su se fokusirala na modeliranje problema s variranjem
relativno malog broja parametara u vrlo uskom području primjene. Karakteristika
im je orijentiranost na novije materijale kao što su kompoziti te lake materijale kao
što je aluminij. Bitna uočena karakteristika je fokusiranost istraživača na jednu
vrstu materijala po pojedinom istraživanju.
1.4. Cilj istraživanja
Suvremene numeričke prediktivne metode su u mogućnosti interpolirati
višedimenzionalne modele koje nije moguće opisati standardnim matematičkim
analitičkim metodama [21]. Pogonska čvrstoća materijala je, po svojim fizikalnim
karakteristikama, višedimenzionalan problem. Jedinstveni model međudjelovanja
utjecajnih parametara na materijal u pogonskoj čvrstoći još nije jasno definiran.
Pogonska čvrstoća, ima jasnu potrebu za pronalaženjem metode koja je u
mogućnosti predvidjeti karakteristike materijala numeričkim putem.
Primjenom suvremenih prediktivnih metoda moguće je modelirati problematiku
pogonske čvrstoće. Korištenjem rezultata provedenih pokusa moguće je dobiti
optimalne metode za predviđanje krivulja vijeka trajanja materijala i uzoraka nad
kojima nisu obavljeni pokusi s tim ulaznim parametrima. Na taj način moguće je
ostvariti predikciju odnosa opterećenja i vijeka trajanja materijala, što predstavlja
pogonsku čvrstoću materijala.
Cilj istraživanja je razviti i verificirati prediktivnu metodu koja će koristeći podatke
dostupnih eksperimentalnih ispitivanja na drugim materijalima biti u stanju odrediti
pogonsku čvrstoću materijala za koji nije obavljeno eksperimentalno ispitivanje.
Pored metode, cilj je postaviti i metodologiju modeliranja problematike pogonske
čvrstoće prediktivnom metodom.
Marko Šušnjar – Doktorska disertacija
8
2. Pogonska čvrstoća
Vijek trajanja komponenti je jedan od temeljnjih konstrukcijskih izazova. Cilj je
utvrditi ili predvidjeti koliko će konstrukcija ili njena komponenta izdržati prije nego
što dođe do njezina zamora i konačnog otkaza. Proračun vijeka trajanja se može
obaviti na nekoliko načina. Dva su osnovna pristupa prema Palmgren-Minerovoj
hipotezi [1]: koncept lokalnih naprezanja i lokalnih deformacija. Oba koncepta
traže poznavanje podataka o pogonskom opterećenju, konstrukcijskom obliku te
ostalim karakteristikama konstrukcijskog materijala.
2.1. Vrste opterećenja
Opterećenje je jedan od najutjecajnijih faktora na vijek trajanja konstrukcije.
Kompleksnost opterećenja predstavlja poseban problem jer je potrebno
aproksimirati stvarno pogonsko opterećenje u mjerljivom i ponovljivom obliku.
Tipovi opterećenja se opisuju prema sljedećoj podjeli [1], [5].
- Statičko opterećenje koje podrazumijeva konstantno, nepromjenjivo
opterećenje kojem je podvrgnut pojedini element konstrukcije.
- Dinamičko opterećenje koje ima osnovnu karakteristiku promjenu u
vremenu. Ovisno o karakteristikama eksploatacije ono može biti uniformno
u obliku jednoobraznih periodičnih promjena (ciklusa) ili kompleksnih
promjena (spektra opterećenja).
- Pogonsko opterećenje predstavlja stvarno opterećenje kojem je
podvrgnuta konstrukcija ili pojedini njeni elementi. Spada u grupu
kompleksnih dinamičkih opterećenja i u biti predstavlja složeni oblik
dinamičkog optrećenja. Pogonsko opterećenje se razlučuje na svoje
komponente osnovnog opterećenja i dodatnog opterećenja. Osnovno
opterećenje se sastoji od statičkog dijela kao što je težina same
konstrukcije i dio opterećenja koje ovisi o funkciji elementa konstrukcije
(promjena položaja uslijed rada...). Dodatno opterećenje ima dva osnovna
Marko Šušnjar – Doktorska disertacija
9
elementa. Predvidivo opterećenje koje nastaje kao slijed pojedinačnih
eksploatacijskih radnji (kočenje, manevri, ubrzanje, zakretanje...).
Nepredvidivo opterećenje predstavlja promjenjivo dinamičko opterećenje
uslijed nepredvidivih eksplatacijskih događaja (dinamički udari...).
Složenost opterećenja je potrebno uobličiti na neki način pogodan za
kategorizaciju i eksperimentalne uvjete. Razvijene su metode brojenja
opterećenja [1], [5]. Njihovom primjenom na stvarno opterećenje pomoću mjernih
uređaja dobiva se slika o stvarnim uvjetima pod kojima pojedini elementi
konstrukcija rade.
Metode brojenja su statističke u osnovi i temelje se na brojenju pojedinih
elemenata ciklusa. Broji se: vrijeme provedeno na pojedinom nivou opterećenja,
vrhovi između prolaza odabranog nivoa, parovi predjela, „rain flow“ metoda ...
Statističkom obradom podataka se iz rezultata brojenja dobivaju spektri
opterećenja koji vjerno prikazuju stvarno pogonsko opterećenje.
Detaljnije o opterećenju u konkretnoj primjeni opisano je u poglavlju 4.1.4.
2.2. Konstrukcijski oblik
Konstrukcijske karakteristike obuhvaćaju skupinu parametara vezanu uz oblik i
veličinu konstrukcije i elementa koji se analizira. Svaki od njih ima određeni
utjecaj na vijek trajanja. Grupirani su u kategorije: geometrija, dimenzije, kvaliteta
površine ili hrapavost, koncentracija naprezanja, itd.
Detaljnije su opisani u poglavlju 4.1.
2.3. Karakteristike materijala
Karakteristike materijala predstavljaju skupinu parametara koji potječu iz svojstva
samog materijala te njegove obrade i imaju utjecaj na vijek trajanja konstrukcije.
Marko Šušnjar – Doktorska disertacija
10
Kategorije su pored same vrste materijala, zaostala naprezanja, čvrstoća
materijala, itd.
Detaljnije su opisani u poglavlju 4.1.
2.4. Uvjeti eksploatacije
Uvjeti eksploatacije su opterećenje, okoliš, korozija, temperatura, itd.
Detaljnije su opisani u poglavlju 4.1.
2.5. Eksperimentalna ispitivanja
Utvrđivanje vrijednosti izdržljivosti materijala pod određenim naprezanjem može
se napraviti samo eksperimentalnim putem. Za svaki materijal, koji se koristi u
dinamički opterećenim konstrukcijama, potrebno je utvrditi odnos naprezanja i
broja ciklusa opterećenja. Ispitivanja se provode u kontroliranim uvjetima na
servo-hidrauličnim uređajima s numerički kontroliranim opterećenjima, poznatim
kao umaralice.
Ispitivanja se dijele na područja čvrstoće niskog broja elasto-plastičnih
deformacija (n < 5·104 ciklusa opterećenja), područja čvrstoće ograničenog vijeka
(5·104 ≤ n ≤ 2·106 ciklusa opterećenja) te područja trajne dinamičke čvrstoće (n >
2·106 ciklusa opterećenja) [5]. Elasto-plastična ispitivanja se provode s
konstantnim amplitudama i frekvencijom manjom od 5 Hz. Sva ostala ispitivanja
su u elastičnom području materijala i provode se sa spektrima opterećenja i
relativno visokim frekvencijama promjene opterećenja (5 – 50 Hz) radi
optimiziranja vremena trajanja pojedinog ispitivanja.
Svrha ispitivanja je dobivanje S-N (Wöhlerovih) krivulja. Krivulje se dobivaju
statističkom obradom rezultata. Prisutno je značajno rasipanje, stoga je potrebno
osigurati dovoljan broj ispitivanja za svaku razinu kako bi se dobio statistički
relevantan podatak. Eksperimentalno dobivanje Wöhlerovih krivulja je dugotrajan
i skup proces [1], [5]. Ovisno o njihovoj namjeni bira se i broj pokusa po razini
Marko Šušnjar – Doktorska disertacija
11
opterećenja. Za istraživačke svrhe se dopušta manji broj ispitivanja po razini dok
je za sve ostale svrhe potreban značajan broj od 12-24 ispitivanja za svaku
razinu [22 ]. Primjer krivulje koja prikazuje ovisnost vijeka trajanja o naprezanju u
polulogaritmičnom mjerilu dan je na slici 2.1. Na osi apscise je prikazan odnos
trajne dinamičke čvrstoće i naprezanja. Ordinata prikazuje broj ciklusa u
logaritamskom mjerilu.
Slika 2.1 Primjer Wöhlerovih krivulja [23]
Marko Šušnjar – Doktorska disertacija
12
3. Rudarenja podataka
3.1. Metodologija rudarenja podataka
Metodologija rudarenja podataka obuhvaća cjelokupan proces od analize
problema na koji će se primijeniti rudarenje podataka sve do primjene. U
suvremenoj primjeni se CRISP DM (Cross Industry Standard Process for Data
Mining) postavio kao de facto standardna metodologija za rudarenje podataka.
CRISP DM predstavlja prikaz svih bitnih procesa prilikom rješavanja određenog
problema [24].
Slika 3.1 Shematski prikaz CRISP DM metodologije [24]
Metodologija se sastoji od nekoliko definiranih cjelina ili postupaka koje je
potrebno obaviti za uspješno modeliranje problema. Rudarenje podataka je, zbog
svoje relativne mladosti u znanosti i području praktične primjene, prilično
nestandardizirano i šaroliko u načinima i procedurama svoje primjene. CRISP DM
Marko Šušnjar – Doktorska disertacija
13
je nastao kao posljedica referentno uspješnih primjena rudarenja podataka i
iskustva znanstvenika [24].
Metodologija sama po sebi ne predstavlja iskoristivi oblik rudarenja podataka za
konkretan problem. Metodologija predstavlja princip kako doći do uspješnog
modeliranja problema. Terminološki će se metodologija koristiti za opis principa
dok će se prediktivna metoda koristiti kao termin za iskoristivi oblik konkretne
primjene rudarenja podataka.
3.1.1. Razumijevanje područja primjene
Razumijevanje područja primjene podrazumijeva analizu problema koji se
modelira metodama rudarenja podataka [25]. Potrebno je ekspertno sagledati
problematiku te se upoznati sa svim raspoloživim atributima koji opisuju područje
primjene. Pritom problem treba razumjeti iz perspektive ograničenja u njegovu
rješavanju i cilja koji se želi postići.
U procesu razumijevanja problematike definiraju se svi raspoloživi atributi koji
mogu biti opisani raspoloživim podacima. Svaki atribut ima svoju važnost u
problematici, stoga je u ovom koraku bitno otkriti utjecajne atribute na konačni
rezultat modeliranja te ih posebno istaknuti kako bi se u daljnjim postupcima
ispravno tretirali.
Atributi se analiziraju, te se definira njihova uloga kako deskriptivna tako i
prediktivna. Ovisno o prirodi problema koji se modelira pojedini atribut se može
pojaviti u obje uloge.
U pogonskoj čvrstoći se kao primjer može uzeti broj ciklusa preživljavanja uzorka
pod određenim opterećenjem. Pri tome je opterećenje deskriptivni atribut, a broj
ciklusa prediktivni. Problem se može postaviti i drugačije tako da se predviđa koje
opterećenje može uzorak podnijeti uz uvjet da minimalno izdrži određeni broj
ciklusa. U ovom slučaju su uloge atributa obrnute, opterećenje postaje prediktivni
a broj ciklusa deskriptivni.
Pored same prirode atributa potrebno je poznavati i njihovu međuzavisnost. Ona
je nužna za pravilno interpretiranje rezultata, pogotovo ako se kao rezultat
Marko Šušnjar – Doktorska disertacija
14
rudarenja podataka očekuju pravila koje pojedine metode mogu dati. U postupku
razumijevanja problematike potrebno je definirati i kriterije uspješnosti. Pri čemu
kriterij može biti kvalitativni ili subjektivni. Kvalitativni kritetij se može postaviti u
apsolutnom i relativnom obliku. Subjektivni kriteriji uspješnosti su ekspertno
mišljenje i obično sadržavaju mogućnost nekog novog i korisnog uvida u odnose
atributa koji opisuju problem.
3.1.2. Razumijevanje podataka
Razumijevanje podataka predstavlja proces razumijevanja strukuture podatka te
njihovo povezivanje s atributima koji su definirani u procesu razumijevanja
područje primjene [25], [6]. Prvi korak je stvarno prikupljanje podataka i njihovo
dovođenje u formu koju je moguće iskoristiti. Podaci su obično smješteni u RDBM
sustavu koji se izvorno sastoji od tablica i njihovih relacija. U relacijskom načinu
organiziranja podataka opisi su obično raspršeni po tablicama, stoga se u
procesu razumijevanja podataka defninraju načini dohvata podataka. Dohvat
može biti uobličen u SQL („Structured Query Language“) programske naredbe, u
programske definicije uvjeta dohvata podataka („WHERE“ uvjet SQL
programskog jezika) ili tehnički opis u kojem se nalaze podaci koji opisuju pojedni
atribut.
Prilikom opisa podataka potrebno je utvrditi njihov volumen te identitet i značenje
pojednih atributa. Pored opisa podataka potrebno je definirati i njihove izvore.
Izvori su uobičajeno RDBM sustavi, međutim mogu biti i svi drugi oblici
spremanja digitalnih zapisa. Moguće je koristiti i tzv. streamove, odnosno
kontinuirane izvore podataka.
Pored navedenih postupaka u procesu razumijevanja podataka bitno je napraviti i
verifikaciju kvalitete podataka. Kontrolom kvalitete podataka definiraju se
poboljšanja i ispravci koji bitno utječu na kasniju kvalitetu rezultata pokusa
modeliranja. Pri tome je potrebno odrediti konzistentnost podataka s obzirom na
vrijednost i tip atributa. Najčešće pojave su primjeri s neodređenim vrijednostima
(„missing values“) pojedinih atributa te primjeri s vrijednostima pojedinih atributa
koje odskaču („outliers“) [25].
Marko Šušnjar – Doktorska disertacija
15
Šum u podacima je jako važna karakteristika koju je potrebno utvrditi u procesu
razumijevanja podataka. Pritom treba utvrditi karakteristiku šuma. Potrebno je
utvrditi je li šum predstavlja grešku u podacima ili rijedak fenomen. Neke od
tehnika modeliranja su vrlo osjetljive na pojavu šuma, nedostajućih i odskačućih
vrijednosti pa je poželjno takve primjere posebno tretirati prije samog procesa
modeliranja [26].
3.1.3. Priprema i pretprocesiranje podataka
Priprema i pretprocesiranje podataka je proces prilagodbe ulaznih podataka
procesu modeliranja [25], [26]. Tijekom ovog procesa se podaci obrađuju s ciljem
da se konsolidiraju te osiguraju poboljšanje i jednostavnost procesa rudarenja
podataka. Postupak sadrži i odabir podskupa podataka koji zadovoljavaju kriterije
kvalitete te tehnička ograničenja. Kvaliteta podataka podrazumijeva odabir setova
podataka koji su kompletni, ispravni sa što manje ili bez nedostajućih vrijednosti.
Pri tome se mogu i isključiti atributi koji imaju nedostajuće podatke u većem broju
setova. Tehnička ograničenja se uglavnom odnose na volumen podataka,
odnosno na eventualno ograničenje modeliranja u smislu mogućnosti
procesiranja velikog volumena podataka. Postupci pripreme podataka su sljedeći
[25], [26]:
- Sumarizacija podataka predstavlja koncizni opis karakteristika podataka u
elementarnoj ili agregatnoj formi koji daje pregled strukture podataka.
- Čišćenje podataka predstavlja procese pripreme podataka za samo
modeliranje. Sadržava mnogo tehnika i postupaka kao što su:
- Normalizacija podataka, radi kvalitetnijeg postupka modeliranja i
prilagodbe samim metodama rudarenja podataka vrijednosti atributa je ponekad
potrebno normalizirati. Primjeri su normalizacija na vrijednost standardne
devijacije pojedinog atributa ili postavljanje na interval vrijednosti.
- Zamjene vrijednosti, predstavlja tretman atributa s nedostajućim
vrijednostima („missing values“). Tretiraju se oni atributi koji moraju ostati u
procesu modeliranja. Postupak zamjene se može obaviti na nekoliko raznih
Marko Šušnjar – Doktorska disertacija
16
načina ali ni jedan nije u potpunosti korektan i predstavlja postupak koji se mora
nevoljko napraviti („nužno zlo“). Primjeri načina su sljedeći:
- zamjena vrijednosti sa srednjom vrijednosti atributa,
- zamjena vrijednosti sa srednjom vrijednosti te klase atributa,
- zamjena vrijednosti sa konstantnom, „reprezentativnom“ vrijednosti,
- interpolacija nekom od numeričkih interpolacijskih metoda.
Sve zamjene vrijednosti su u principu netočne te predstavljaju potencijalnu
opasnost da modeliranje odvedu u krivom smjeru, odnosno da setovi podataka
budu krivo usmjereni („biased“). Kao moguće kvalitetnije rješenje pojavljuje se
korištenje prediktivnih metoda za pronalaženje nedostajućih vrijednosti.
- Redukcija podataka predstavlja smanjivanje broja setova atributa koji će
se koristiti u procesu modeliranja. Razlozi za redukciju su preobimnost podataka
za modeliranje ili trajanje modeliranja. Problem metoda redukcije je njihova
nesavršenost i stalna opasnost degradacije kvalitete ulaznih podataka za
modeliranje. Najčešće su kandidati za redukciju atributi koji su u prethodnim
analizama pokazali neizražajnost, odnosno pokazali su se slabim prediktorom ili
su redundantni s nekim izražajnim atributom. Tehnike redukcije su uglavnom
bazirane na statističkim metodama:
- odabir na osnovi distribucijskih pokazatelja, kao što je srednja
vrijednost i standardna devijacija,
- korištenje metode analize osnovnih komponenti za odbacivanje
redundantnih atributa („principal component analysis“),
- spajanje više atributa u jedan uz transformacijske postupke
(linearne i nelinearne).
- Konstrukcija novih podataka predstavlja kombinacije postojećih atributa u
nove atribute. Kombinacijom se stvara njihova međuzavisnost, linearna ili
nelinearna, te je kao takvu treba i interpretirati u procesu modeliranja. Takvi novi
atributi se nazivaju izvedene ili derivirane varijable u procesu modeliranja.
Marko Šušnjar – Doktorska disertacija
17
Konstrukcija novih podataka se najčešće obavlja kombinacijom postojećih
atributa, stvaranjem novih primjera, transformacijom atributa, spajanjem
(„merging“) različitih entiteta, agregacijom atributa, statističkim izvedenicama, itd.
- Integracija i transformacija predstavljaju manipulaciju s podacima koja se
provodi nakon čišćenja podataka. Odnosi se na akcije koje se provode na
izvorima podataka u smislu konsolidacije na istu platformu. Primjer je učitavanje
podataka iz više pročišćenih izvora u jednu jedinstvenu platformu (obično
RDBMS). Prilikom integracije podaci se transformiraju u oblik pogodan za
modeliranje ili daljnju obradu (numerički tipovi, preciznost, karakter varijable u
numeričke, datumske u numeričke i sl. ).
- Diskretizacija, formatiranje i hijerarhijska organizacija podataka, glađenje
podataka, („data smoothing“) predstavlja skupinu postupaka koji prethode samom
modeliranju. Njihovo provođenje ovisi o metodi ili metodama koje će se koristiti.
Ukoliko metoda zahtijeva, atributi sa kontinuiranim vrijednostima se diskretiziraju i
stavljaju u razrede. Broj i širina razreda se određuje iskustveno ili
eksperimentalno. Setovi podataka se slažu u određene redoslijede ili pak u
potpunosti randomiziraju. Glađenje predstavlja jedan oblik diskretizacije pogotovo
za neke logičke metode. Ovi postupci su usko vezani sa samim modeliranjem te
su uvijek sastavni dio iteracija cijelog postupka. Promjena metode ili načina njene
parametrizacije neminovno uvjetuje provođenje ovih postupaka.
3.1.4. Modeliranje
Modeliranje predstavlja postupke odabira i primjene prediktivnih metoda [6], [25],
[26]. Kao ključni element se pojavljuje odabir predikcijske metode (ili metoda)
koje će se primijeniti na određeni problem. U današnje vrijeme je dostupno
mnogo kvalitetnih algoritama prediktivnih metoda. Algoritimi su primijenjeni u
mnogim gotovim programskim alatima, stoga je fokus problematike modeliranja
pomaknut sa samog programiranja algoritma u programski kôd, na problematiku
kvalitetnog odabira metode te njezina mapiranja na konkretan problem. Alati za
modeliranje su postali rapidni s dobrim korisničkim sučeljem koje omogućava
konkretno modeliranje s više metoda istodobno te usporedbu rezultata. Pored
Marko Šušnjar – Doktorska disertacija
18
toga moguće je i serijsko modeliranje primjenjujući više metoda uzastopno. Kao
najizazovniji pristup pojavljuje se i kombinacija paralelnog i serijskog modeliranja
[27].
Kod odabira metode (ili metoda) treba razlučititi karakteristiku problema koji se
modelira, radi li se o deskriptivnom ili prediktivnom modeliranju. Odabir metode
se zasniva na karakteristici problema.
Postoje metode koje mogu zadovoljiti i oba svojstva, predikcije i deskripcije, kao
što su stabla odlučivanja ili sistemi za indukciju pravila. Metode će biti detaljnije
opisane u sljedećim poglavljima.
- Predikcijske metode: Neuralne mreže, Metode regresije, Stabla odlučivanja,
Metoda najbližih susjeda.
- Deskripcijske metode objedinjuju više podskupina metoda.
- Klasifikacijske metode: Stabla odlučivanja, Neuralne mreže, Metode
induciranja pravila, Metoda najbližih susjeda, Rasuđivanja na bazi
prethodnih slučajeva.
- Analize međuovisnosti i otkrivanje veza: Regresijska analiza,
Korelacijska analiza, Asocijativna pravila, Bayesove mreže, Metoda
induktivnog logičkog programiranja.
- Segmentacijske metode: Cluster analiza, Neuralne mreže.
3.1.5. Razvoj modela
Prvi korak razvoja modela je podjela uzorka na testni i uzorak za treniranje
metode [6], [25], [26]. Set podataka namijenjen modeliranju je potrebno razdvojiti
na dva dijela. Prvi dio je set podataka namijenjen učenju modela ili „training set“,
dok je drugi dio namijenjen testiranju modela, odnosno provjeri točnosti. Ovom
prilikom se definira i procedura za testiranje i provjeru kvalitete i točnosti modela
koji će se generirati. Ocjena točnosti je vrlo osjetljivo područje koje često izaziva
probleme pri interpretaciji. Procjenu točnosti treba prilagoditi željenom cilju
modeliranja.
Marko Šušnjar – Doktorska disertacija
19
Prilikom podjele seta jako je važno da ona bude temeljena na slučajnom uzorku.
Ne smije postojati nikakva zavisnost između testnog seta i seta za učenje.
Slučajnost je bitna i prilikom uzorkovanja seta, ukoliko se reducira broj primjera.
Bilo kakav odabir „reprezentativnog seta“ predstavlja put u loše modeliranje te
pretpostavku postizanja velike greške modela.
Omjer podjele dostupnog seta je različit od slučaja do slučaja. Uobičajena
polazišna vrijednost je: 2/3 ukupnog seta se odvaja na set za učenje, dok se 1/3
odvaja u set za testiranje i provjeru pouzdanosti modela [26]. Ako je ostvaren
uvjet nezavisnosti onda testni set predstavlja simulaciju realne primjene.
Sljedeći korak u procesu modeliranja je generiranje modela [6], [25], [26].
Generiranje modela slijedi nakon odabrane metode (ili metoda) te nakon što je
set podataka podijeljen na testni i set za učenje. Metode predikcije su visoko
prametrizirane te je odabir pravilnih parametara jedan od ključnih elemenata
uspješnosti modeliranja, odnosno generiranja modela. Proces generiranja
modela je iterativni proces u kojem se traži optimalna kombinacija parametara
metode. Set podataka za učenje u kombinaciji sa setom za testiranje omogućava
proces iteracije te njegovu konvergenciju modelu s optimalnim setom
parametara.
Rezultat procesa generiranja modela mora biti pored optimalne parametrizacije i
njegov opis koji ovisi o tipu metode koja se koristila. Npr. neuralne mreže moraju
imati topologiju, broj skrivenih slojeva, broj neurona u svakom od slojeva itd.,
stabla odlučivanja u opisu sadrže i eventualno „rezanje“ grana itd.
Model se ocjenjuje u odnosu na prethodno definirane kritertije (najčešće je to
točnost modela). Rezultati se provjeravaju na setu za testiranje i tako se dobiva
tehnička provjera. Pored toga provjerava se smislenost modela, odnosno
objašnjava se odluka o konačnim parametrima metode. Ako model ne zadovolji
ocjenu, postupak se iterativno vraća na generiranje modela u blažem slučaju, dok
se u onom težem vraća na proces odabira metode. U procesu ocjene potrebno
je izbjeći česte greške modeliranja. Najčešća je „over fitting“ ili prekomjerna
specijalizacija modela. Model u tom slučaju jako dobro klasificira slučajeve iz seta
za učenje, dok loše klasificira slučajeve iz seta za testiranje.
Marko Šušnjar – Doktorska disertacija
20
3.1.6. Problematika evaluacije i ocjene modela
- Evaluacija klasifikacijskih modela
Kod klasifikacijskih tipova problema osnovna greška je pogrešna klasifikacija.
Model može set podataka klasificirati u pogrešnu klasu ciljnog atributa. Evaluacija
greške se obavlja stavljanjem u omjer pogrešnih klasifikacija u odnos s ukupnim
brojem slučajeva („error rate“). Ukoliko se radi o greškama iste težine tada se
slučaj može tretirati linearno tako da se promatraju omjeri grešaka i traže načini
za njihovu minimizaciju. Problem se javlja kod grešaka različitih težina kada treba
posebno tretirati greške koje imaju veći ponder [26]. Primjer je greška metode
koja klasificira manju izdržljivost uzorka, u odnosu na grešku koja precijeni
izdržljivost uzorka i klasificira veću izdržljivost od stvarne. U realnom svijetu ove
greške imaju značajno različitu interpretaciju i posljedice.
Usporedba rezultata klasifikacijskih metoda se vrši preko tzv. „matrice grešaka“.
[25] Matrica grešaka prikazuje odnos točno klasificiranih primjera i onih koji su
pogrešno klasificirani u neku od drugih klasa. Dijagonala matrice predstavlja
točno klasificirane primjere dok su svi oni izvan dijagonale pogrešni.
U praksi se klasifikacijske metode najviše koriste za klasifikaciju dvije klase.
Većina se klasifikacijskih metoda s više klasa može prikazati kao niz problema s
dvije klase. Primjer su razine opterećenja koje uzorak može izdržati. Klasifikacija
se može primijeniti na to da li će pojedini uzorak s određenim setom ulaznih
parametara (materijal, opterećenje, koncetracija naprezanja,...), izdržati određeni
broj ciklusa opterećenja, ili ne. Matrica klasifikacije prikazana je u tablici 3.1.
Tablica 3.1 Matrica klasifikacije
Klasa pozitivnih
primjera (C+)
Klasa negativnih
primjera (C-)
Pozitivna predikcija (R+) Stvarno pozitivni (TP) Lažno pozitivni (FP)
Negativna predikcija (R-) Lažno negativni (FN) Stvarno negativni
(TN)
Marko Šušnjar – Doktorska disertacija
21
U ovom slučaju moguća su dva tipa grešaka: lažno pozitivni (FP) i lažno negativni
primjeri (FN).
Klasična točnost kao mjera za evaluaciju modela nije dobra jer ima ključne
nedostatke u vidu zanemarivanja tipova grešaka jer jednako tretira pozitivne i
negativne greške. Pored toga točnost je zavisna distribuciji klasa u skupu
podataka a ne o karakteristikama primjera.
U pogonskoj čvrstoći u kojoj je bitan tip pogreške može se primijeniti metrika koja
razlikuje pozitivne i negativne greške.
Senzitivnost predstavlja točnost pozitivnih primjera dok specifičnost predstavlja
točnost negativnih primjera [28].
����������� = ���� + ��(3.1) ��������� = ���� + ��(3.2)
U slučaju kada je broj True Positive (TP) mali u odnosu na True Negative (TN),
koriste se mjere odziva („recall“) i preciznosti [28].
����� = ���� + ��(3.3) ��������� = ���� + ��(3.4)
- Lift krivulja
Lift krivulja predstavlja mjeru kvalitete modela koja je još kvalitetnija od
senzitivnosti i specifičnosti [26]. Mjera se u literaturi naziva i ROC analiza
(„Receiver Operating Characteristic“) [6], [25], [26], [27]. Primjenom ove mjere se
mogu uspoređivati dva ili više klasifikacijskih modela preko širokog spektra
pouzdanosti.
Marko Šušnjar – Doktorska disertacija
22
Slika 3.2 Lift krivulja
Model je pouzdaniji i kvalitetniji što je njegova krivulja bliža lijevoj i gornjoj osi.
Idealan model bi imao krivulju koja bi se poklapala s lijevom i gornjom osi
dijagrama. Na slici 3.2 je prikazana lift krivulja iz konkretne primjene neuralnih
mreža na autorovim projektima.
Krivulje točnosti pokazuju koliki bi trebao biti uzorak iz ukupnog seta podataka da
bi se dobio određeni postotak ciljanog seta podataka. Statistički je to 50% bez
ikakve primjene metode (plava linija na slici 3.2). Na konkretnom primjeru sa slike
3.2, metode daju rezultate koji su jako uspješni u prvom dijelu dijagrama. Vidljivo
je da bi za dobivanje 60% ciljnog seta bilo potrebno uzeti samo nekoliko
postotaka iz sveukunog seta, naravno onih koje metoda predvidi.
- Procjena težine greške
Tipična analiza broja grešaka FP i FN nije dovoljna već je potrebno i ponderirati
svaki tip grešaka. Sumiranjem ponderiranih grešaka dobiva se tzv. trošak
klasifikacije („misclassification cost“) [26]. Ponderiranje u pogonskoj čvrstoći se
može pokazati na primjeru precjenjivanja vijeka trajanja koji zasigurno ima puno
veći ponder ili „težinu“ greške nego podcjenjivanje vijeka trajanja. Precjenjivanje
izaziva katastrofalne posljedice u vidu šteta dok podcjenjivanje izaziva uglavnom
ekonomske štete u smislu povećanja troškova proizvodnje.
Marko Šušnjar – Doktorska disertacija
23
Kod klasifikacije sustava sa n klasa ukupan trošak klasifikacije se može prikazati
kao [28]:
��� = !"#�"#$
#%&
$
"%&(3.5)
Gdje je E broj grešaka po ij, a C ponder vezan uz grešku tipa ij.
Kod procjene težine greške uzima se u obzir i eventualni „dobitak“ koje donosi
točna klasifikacija. Dobici, također, imaju svoj pozitivan ponder. Sumiranjem
rezultata točnih klasifikacija s pozitivnim ponderima i grešaka s njenim negativnim
ponderima dobiva se ukupna „vrijednost“ modela. Ovakav način obrade
vrijednosti modela se koristi u ekonomskim teorijama korisnosti kod kalkulacije
rizika. Postupak nije primjenjiv na problematiku pogonske čvrstoće. Stoga će se u
daljnjem radu koristiti isključivo penalizacija grešaka bez računanja pozitivnih
pondera točnih klasifikacija.
3.2. Metode rudarenja podataka
U današnje vrijeme deseci algoritama su uobličeni u komercijalno upotrebljive
metode rudarenja podataka. Još više ih ima koji se koriste u istraživačke svrhe.
Svima im je zajedničko da su u stanju napraviti mapiranje „znanja“ skrivenog u
podacima u nekakav oblik funkcijskog preslikavanja [25].
Dvije skupine metoda koje po prirodi svojih algoritama imaju najviše perspektive
za uporabu u Pogonskoj čvrstoći su neuralne mreže i stabla odlučivanja.
Neuralne mreže su skupina metoda koja je najviše korištena u dostupnoj
literaturi. Karakteristika im je da jako dobro modeliraju probleme Pogonske
čvrstoće s vrlo velikom točnošću. Nedostatak metode je da nije u stanju dati
nikakava pravila, odnosno iz gotovih modela nije moguće izvući znanje već čisto
preslikavanje u obliku predikcije.
Marko Šušnjar – Doktorska disertacija
24
Stabla odlučivanja su odabrana zbog svoje karakteristike da se mogu izvući
pravila iz generaliziranog modela. Za samu Pogonsku čvrstoću pravila su od
izuzetne važnosti, stoga bi upotreba stabala odlučivanja bila korisna.
Obje metode koriste učenje s nadgledanjem („supervising learning“) [25], [26], te
se metodama s drugim tipovima učenja u pogonskoj čvrstoći ovaj rad neće baviti.
Klasifikacija i predikcija su načini na koji metode mapiraju rezultate modeliranja.
Klasifikacija daje izlazne rezultate u diskretiziranom obliku. Prema tome, izlazne
varijable kod klasifikacije mogu biti numeričke i opisne varijable. Predikcija kao
izlazne rezultate daje kontinuirane vrijednosti, stoga je vrlo interesantna za
pogonsku čvrstoću u smislu predviđanja broja ciklusa opterećenja konstrukcije.
Problem je u točnosti predikcije koja je u problematici s malim brojem primjera
upitna. Problemi u ovom radu bit će modelirani na oba načina kako bi se
pokazala njihova primjena u metodologiji primjerenoj pognoskoj čvrstoći.
3.2.1. Struktura algoritama metoda rudarenja podataka
Metode koje se koriste za modeliranje svoje porijeklo vuku iz raznih područja
poput statistike, obrade signala, strojnog učenja, umjetne inteligencije,
evolucijskog programiranja, itd. [6], [25], [26]. Zajednička im je karakteristika da
automatski generiraju modele iz setova podataka. Struktura metoda je
međusobno prilično slična, te se može podijeliti na tri funkcionalno povezane
komponente [28]:
- Funkcionalni oblik modela
Funkcionalni oblik modela predstavlja matematički način reprezentacije
modela. Matematički se model može prikazati kao funkcija preslikavanja
y=f(x,P).
x predstavlja vrijednosti pojedinih atributa iz setova ulaznih podataka
P predstavlja parametre koji definiraju specifični model na koji se
preslikavanje odnosi
Karakteristike funkcionalnog oblika modela su:
Marko Šušnjar – Doktorska disertacija
25
o Utjecaj na format ulaznih podataka (logički, numerički, karakter,...)
o Razumljivost reprezentacije modela
o Aproksimacija linearnih i nelinearnih ovisnosti u podacima
o Konačni oblik modela
- Kriterij kvalitete aproksimacije
Kriterij kvalitete aproksimacije predstavlja interni kriterij kvalitete procjene
modela s obzirom na aproksimaciju odnosa među varijablama. Ovo nije
kriterij ocjene točnosti konačnog modela već ocjena kvalitete konstrukcija
različitih instanci funkcije preslikavanja y=f(x,P).
Karakteristike se bitno razlikuju od metode do metode i ovise o
funkcionalnom obliku modela i metoda pretraživanja, a mogu se
generalizirati na sljedeće:
o Osjetljivost i robusnost na dimenzionalnost problema (broj atributa i
setova podataka, te broj instanci funkcije preslikavanja f)
o Tip kriterija (probabilistički, logički)
- Metoda pretraživanja
Metoda pretraživanja predstavlja algoritam koji kontrolira pretraživanje n
dimenzionalnog prostora svih mogućih instanci funkcije preslikavanja f, uz
zadani funkcionalni oblik modela, koristeći se kriterijem kvalitete
aproksimacije. U osnovi tehnike modeliranja su optimizacijski algoritmi.
Karakteristike metoda pretraživanja su u biti iste kao kod optimizacijskih
algoritama:
o Osnovni način pretraživanja,
� heuristički,
� gradijentni,
� „greedy“ algoritmom.
Marko Šušnjar – Doktorska disertacija
26
o Kompleksnost pretraživanja ,
� optimizacija parametara P,
� dodatna petlja po različitim strukutrama modela.
o Kontrola procesa pretraživanja,
� Kriterij za zaustavljanje pretraživanja.
3.2.2. Stabla odlučivanja
Metode rudarenja podataka koje spadaju pod zajedničku skupinu stabla
odlučivanja omogućuju modeliranje i predikcijskih i klasifikacijskih problema [6],
[25], [26]. Vrlo su popularne i moćne metode. Karakteristika im je da se modeli
mogu interpretirati u razumljivom obliku. Iz modela je moguće izvući pravila koja
su potpuno razumljiva u smislu problematike koje model opisuje. Pravila je
moguće iskoristiti u ekspertnom ili istraživačkom smislu. Mogu se pak koristiti u
nekom od jezika za rad s bazama podataka (SQL), te integrirati u druge poslovne
ili istraživačke cjeline. Stabla odlučivanja se koriste obavezno u slučajevima kada
je potrebno da generirani modeli budu čitljivi ekspertima iz domene problema i
kada je potrebno izvući znanje sadržano u podacima. Mogućnost čitanja pravila
je dodana vrijednost pored same točnosti klasifikacije ili predikcije, stoga će se
stabla odlučivanja koristiti u modeliranju problema Pogonske čvrstoće u ovom
radu.
Na slici 3.3 je shematski prikazan algoritam stabla odlučivanja. Struktura
algoritma je stablasta otkuda i dolazi naziv metode. Čvorovi su međusobno
povezani granama, pri čemu se razlikuju dva tipa čvora.
Marko Šušnjar – Doktorska disertacija
27
Slika 3.3 Stabla odlučivanja
- Krajnji čvor („leaf node“) je onaj čvor kojim završava određena grana
stabla. Krajnji čvorovi predstavljaju klasu kojoj pripadaju setovi podataka
koji su zadovoljili uvjete na toj grani stabla
- Čvor odluke („branch node“) predstavlja čvorište u kojem se vrši grananje
na osnovi vrijednosti određenog atributa. Grane koje izlaze iz čvora odluke
predstavljaju usmjeravanje zadovoljenja uvjeta određene vrijednosti
atributa prema drugom čvoru.
Princip rada algoritma je da se kretanjem od prvog čvora prema krajnjima
primjer klasificira na osnovi vrijednosti njegovih atributa u određenu klasu
problema. Primjena stabla odlučivanja zahtijeva sljedeće [6], [28]:
- Set podataka mora sadržavati konačan broj parova atribut (varijabla) –
vrijednost
- Klasa (vrijednost ciljnog atributa) moraju biti konačnog broja i prethodno
definirana
Marko Šušnjar – Doktorska disertacija
28
- Klase moraju biti diskretne, znači da svaki primjer mora pripadati samo
jednoj od predefiniranih klasa
- Klasa mora biti znatno manje nego primjera
- Set podataka mora imati značajan broj primjera
Kao svaka druga metoda i stabla odlučivanja imaju svoj proces stvaranja i
korištenja za klasifikaciju i/ili predikciju.
- Stvaranje stabla odlučivanja
Osnovni algoritam stabla odlučivanja je ID3 algoritam razvijen od J. Ross
Quinlana [29] baziran na Concept Learning System (CLS) algoritmu [28].
Algoritam radi tako da pretražuje sve atribute seta podataka i pronalazi atribut
koji najbolje odvaja primjere određene klase. Ako pronađe zadovoljavajuće
razdvajanje zaustavlja se, ako ne, rekurzivno traži razdvajanje na
podskupovima. Pri tome podskupova može biti onoliko koliko ima mogućih
vrijednosti atributa. Traži „najbolje“ atribute za razdvajanje podskupova.
Alogiram je tzv. „greedy“ tipa, znači da nikad ne gleda unatrag radi provjere
ispravnosti izbora atributa, već traži trenutno najbolji atribut. Zato se mogu
dobiti pogrešne klasifikacije na primjerima za učenje.
Ključni dio algoritma je odabir atributa za stvaranje čvora odlučivanja, znači
atributa koji služi za grananje stabla. Potrebno je pronaći atribut koji je
najupotrebljiviji za tu svrhu. Za kriterij upotrebljivosti ili kvalitete atributa uzima
se statistička vrijednost zvana „information gain“ odnosno informacijski
dobitak. Informacijski dobitak se koristi za odabir najboljeg kandidata u
svakom grananju. Kao mjera informacijskog dobitka koristi se entropija koju
teorija informacija definira kao čistoću nekog skupa primjera.
!�����(() = ∑ −�"+�,-�".&%& (3.6)
Gdje je:
c broj vrijednosti koje poprima ciljni atribut
Marko Šušnjar – Doktorska disertacija
29
S – skup nad kojim se traži entropija
Pi – proporcija klase u skupu S
Entropija ima karakteristiku dosizanja maksimalne vrijednosti log2C.
Interpretacija entropije bi se mogla sažeti u tome da ona specificira minimalni
broj bitova informacija koji je potreban da se kodira klasifikacija iste [28].
Informacijski dobitak se sada može izračunati za atribut na osnovi njegove
entropije odnosno „nečistoće“. Dobitak se računa kao redukcija entropije
nakon razdvajanja primjera na osnovi tog atributa. Informacijski dobitak
atributa A u odnosu na skup primjera S, Gain (S,A) je definiran kao:
01��(�, 3) = !�����((�) − |�5||�|5∈789:;<(=)!�����((�5)(3.7)
Values(A) - skup svih mogućih vrijednosti atributa A
Sv - podskup od S za koji atribut A ima vrijednost v
Sv = {s, S | A(s) = v}
Entropy (S) – entropija originalnog skupa S
Drugi član jednadžbe je očekivana vrijednost entropije nakon razdvajanja skupa
S atributom A.
Za svaki čvor odlučivanja ponavlja se proces odabira novog atributa i razdvajanja
primjera te se pri tome koriste samo oni primjeri koji pripadaju čvoru za koji se
radi grananje. Svi primjeri korišteni prije tog čvora su isključeni iz daljnjeg
odabira. Iz navedenog je jasno da se primjeri mogu samo jednom pojaviti na
određenoj strani čvora. Grananje na nekom čvoru se zaustavlja ako je na
određenom čvoru zadovoljen jedan od kriterija:
- Svi atributi su već bili iskorišteni u toj grani stabla
- Svi primjeri koji pripadaju tom čvoru su u istoj klasi, te je entropija tog
primjera jednaka nuli
Marko Šušnjar – Doktorska disertacija
30
Problemi pri modeliranju metodama stabla odlučivanja
- „Over-fitting“ podataka
Algoritam stabla odlučivanja u stanju je točno generirati sve primjere iz seta
podataka za učenje. Podaci sami po sebi nisu savršeni te imaju u sebi „šum“ ili
njihov uzorak nije dovoljno velik da reprezentira ukupnu populaciju koja se
modelira. Algoritam u tom slučaju generira stablo koje pretjerano dobro („over-
fitting“) aproksimira odnose u podacima. „Over-fitting“ je velika poteškoća pri
primjeni stabala odlučivanja. Stoga su pronađena rješenja za izbjegavanje ovih
problema [6], [26]:
o Zaustavljanje procesa grananja prije nego što se postigne savršena
klasifikacija primjera iz seta za učenje
o „prunning“ ili rezanje grana prema prethodno definiranom kriteriju
nakon što se generira stablo koje savršeno klasificira primjere
Upravo ovaj drugi princip se u praksi pokazao uspješnijim te će se koristiti
prilikom generiranja modela za problematiku pogonske čvrstoće.
Korištenjem bilo koje od prethodne dvije tehnike, zaustavljanja grananja ili
rezanja stabla, potrebno je odrediti optimalnu kompleksnost stabla. Za tu
svrhu koriste se sljedeće tehnike [6],[26],[28]:
o Uspješnost skraćivanja stabla se verificira na posebnim
validacijskim primjerima koji nisu bili dio primjera kojima se gradilo
stablo
o Koristi se poseban statistički test na čvorovima koji su kandidati za
skraćivanje. Testovi pokazuju eventualnu uspješnost skraćivanja.
o „Minimum Description Lenght“ – eksplicitna mjera kompleksnosti,
koja zaustavlja rast stabla kada je taj kriterij zaustavljen.
Najčešća tehnika je pristup s validacijskim setom podataka.
Marko Šušnjar – Doktorska disertacija
31
- Kontinuirani atributi
Temeljni algoritam stabla odlučivanja ID3 je ograničen na atribute s diskretnim
vrijednostima. Proizilazi to iz postavki algoritma o konačnom ograničenom
broju klasa (kategorija), nadalje atributi koji se testiraju u čvorovima i računa
im se gain moraju imati diskretne vrijednosti [26].
Diskretizacija kontinuiranih atributa sama po sebi nije problem i nju je relativno
lako napraviti podjelom atributa u razrede. Problem je kako odrediti granice
razreda u koji se smještaju vrijednosti atributa. Problem je u određivanju
vrijednosti c koja će nam dati najveći informacijski dobitak (“Gain“). Postoji
metoda koja je zasnovana na dokazu da vrijednosti c koje maksimiziraju Gain
uvijek leže na granicama intervala koji se dobiju sortiranjem primjera prema
vrijednosti atributa te identificiranjem susjednih primjera koji pripadaju
različitim klasama ciljnog atributa. Tada se može generirati skup vrijednosti c
u sredini intervala vrijednosti atributa za svaka dva susjedna primjera.
Drugi način diskretizacije je ekspertna diskretizacija u kombinaciji s iterativnim
postupkom.
- Nedostajuće vrijednosti („missing values“)
Jedan od najčešćih problema je nedostatak pojedinih vrijednosti atributa u
primjerima. Postoje mnoge tehnike interpolacije. Niti jedna nije u potpunosti
ispravna i tretiraju se kako je već navedeno kao “nužno zlo“ [26].
Najučinkovitija metoda se pokazala nadomještanje nedostajućih vrijednosti
atributa s njegovom najfrekventnijom vrijednosti [26].
- Prednosti i nedostaci metoda Stabla odlučivanja
Prednosti metode:
o Jasno određuju važnost pojedinih atributa u svakom konkretnom
predikcijskom problemu.
o Mogu koristiti sve tipove atributa.
o Generiraju razumljive modele.
Marko Šušnjar – Doktorska disertacija
32
o Relativno mali zahtjevi prema resursima za računanje.
Nedostatci metode
o Griješe u višeklasnim problemima koji imaju manji broj primjera za
učenje.
o Problematika rezanja i sortiranje kandidata za testiranje u
čvorovima je zahtjevna.
o Nisu pogodne za klasifikaciju problema u kojima su razredi klasa
omeđeni nelinearnim krivuljama.
3.2.3. Neuralne mreže
Naziv im potječe iz medicinske inspiracije – mozga. Temeljene su na neuronu
kao osnovnom elementu mreže te njegovoj povezanosti s ostalim neuronima u
mreži, analogija je s građom ljudskog mozga s neuronima i sinapsama kao
vezama. Međusobno su povezani vezama tako da je izlaz iz jednog ujedno ulaz u
sljedeći neuron. Svaki neuron ima više ulaza i samo jedan izlaz.
- Neuron
Neuron predstavlja preslikavanje n ulaznih na jednu izlaznu vezu, prikazan
na slici 3.4.
Slika 3.4 Neuron u neuralnim mrežama
x 1
x 2
x 3
x n
w i1
w in
w i2
w i3
S a = S w xi ij j j
n
f
y = f (a ) i
Marko Šušnjar – Doktorska disertacija
33
Na ulaznom dijelu preslikavanja koje se dešava u neuronu su ulazne vrijednosti
x1,x2,...xn, a izlazna vrijednost je samo jedna y. Sve vrijednosti bilo one ulazne ili
izlazne su kontinuirane. Preslikavanje se sastoji iz dva dijela [28].
Prvi dio je sumiranje produkata težina svake veze te njene vrijednosti.
Drugi dio je sumiranje s vrijednošću praga („treshold“).
( = � ? @"A" − �$
"%&B(3.8)
wi – težinski faktori svake pojedine veze i
T – vrijednost praga
Izlazna funkcija neurona je sigmoidalna funkcija kao na slici 3.5
Slika 3.5 Graf izlazne step funkcije
Izlazna vrijednost iz svakog neurona predstavlja ulaznu u sljedeći, koji opet ima
svoj težinski faktor za tu vezu. Prilikom procesa učenja se vrijednosti težina wi
mijenja, te je konačan rezultat optimalan set težinskih faktora grana mreže i
vrijednosti praga T svakog neurona.
- Topologija
Postoji jako mnogo topologija Neuralnih mreža od kojih je višeslojni Percepton
najpoznatija i najviše u upotrebi [6]. U višeslojnim perceptonima su neuroni
grupirani u slojeve. Prvi sloj se ujedno naziva i ulazni sloj, prima ulazne
Marko Šušnjar – Doktorska disertacija
34
vrijednosti u mrežu. Broj neurona u ulaznom sloju jednak je broju ulaznih atributa
čije vrijednosti služe za klasifikaciju. Zadnji sloj se još naziva i izlazni sloj,
prezentira izlazne rezultate klasifikacije. Izlazni sloj ima onoliko neurona koliko se
klasificira izlaznih varijabli. Između ulaznog i izlaznog sloja se nalaze skriveni
slojevi neurona. Broj skrivenih slojeva, te broj neurona u njima, određuje se
prilikom samog procesa modeliranja te se unaprijed zadaje prije samog procesa
učenja.
Slika 3.6 Topologija neuralne mreže
- Učenje
Učenje neuralne mreže predstavlja optimizaciju težinskih faktora. Postoji više
metoda učenja, od kojih je metoda nadziranog učenja, najčešća [26].
U samom procesu učenja se primjeri iz seta podataka za učenje koriste jedan po
jedan. Za svaki primjer se računaju izlazne vrijednosti mreže te uspoređuju sa
željenom izlaznom vrijednosti. Zatim se težinski faktori wi i vrijednosti praga T
mijenjaju proporcionalno veličini greške koju su prouzročili u izlaznoj vrijednosti.
Marko Šušnjar – Doktorska disertacija
35
Back-propagation je metoda propagacije greške unatrag kojom se iterativno
greške šire na unutarnje slojeve mreže i u njima koriste za optimizaciju težinskih
faktora veza među neuronima [26].
- Primjena
Primijenjuju se kod težih problema na kojima ostale metode ne daju dobre
rezultate. U stanju su dobro klasificirati probleme s velikim brojem slučajeva.
Relativno se dobro nose sa problemima ostalih metoda kao što je „over fitting“ i
nedostajuće vrijednosti. Visoko su tolerantne na šum u podacima. Interesantne
su za modeliranje problema o kojima nema ili je jako malo ekspertno znanje.
Nedostatak metode je nemogućnost tumačenja pravila, pošto je sva
generalizacija skrivena u vrijednostima parametara težinskih funkcija. Proces
učenja je vrlo zahtjevan s pozicije računarskih resursa. U usporedbi sa stablima
odlučivanja odnos je 100 do 1000 puta više računskih operacija [26].
Marko Šušnjar – Doktorska disertacija
36
4. Metodologija primjene rudarenja podataka u pogonskoj čvrstoći
4.1. Potencijalne varijable (atributi)
Pokusi u Pogonskoj čvrstoći se provode standardnim postupkom tako da se za
određeni uzorak s određenom obradom od određenog materijala pod određenim
uvjetima i promjenjivim opterećenjem dobiju rezultati u obliku vijeka trajanja (broj
ciklusa opterećenja do loma). Svi unaprijed određeni atributi predstavljaju ulazni
set podataka koji se ispitivanjem preslikava na rezultate. Prilikom modeliranja
pokusa prediktivnim metodama svi ti atributi predstavljaju potencijalne varijable.
Kako su parametri heterogeni u smislu načina njihova definiranja, mogu biti opisni
(mehanička obrada, termokemijska obrada,...) ili numerički (vijek trajanja,
temperatura,...) [41]. Svaki atribut se posebno tretira te mu se način prikaza
prilagođava u trenutku kada postaje varijabla u procesu modeliranja prediktivnim
metodama.
4.1.1. Vijek trajanja
Vijek trajanja u laboratorijskim uvjetima predstavlja broj ciklusa koje uzorak izdrži
prije otkaza. Vijek trajanja je numerička varijabla u slučaju kada je kriterij otkaza
dosegnut pri isptivanju. Ispitivanja se za svaki primjer pojedinačno obavljaju dok
se ne dosegne jedan od dva kriterija: kriterij otkaza ili maksimalan broj ciklusa za
pojedino ispitivanje. Vijek trajanja kao varijabla je najčešće ona koja se klasificira
ili se na njoj radi predikcija pa je potrebno napraviti pažljivu prezentaciju
predikcijskim metodama. Diskretizacija odnosno svrstavanje u razrede daje veću
garanciju točnosti ali traži pažljiv izbor intervala ili razreda broja ciklusa.
4.1.2. Kriterij otkaza
Kriterij otkaza predstavlja stanje uzorka za koje se smatra da prestaje biti
funkcionalan. Najčešći i najjasniji kriterij otkaza je lom uzorka. Svi ostali tipovi
Marko Šušnjar – Doktorska disertacija
37
kriterija otkaza ovise o materijalu koji se ispituje. Kompozitni materijali, legure,
različiti ljevovi mogu imati različite kriterije otkaza.
4.1.3. Čvrstoća materijala
Karakteristike materijala pri statičkom vlačnom opterećenju su bitne varijable kod
modeliranja prediktivnim metodama. Pogotovo mogu biti korisne ako se problem
može modelirati s metodama koje omogućuju izvlačenje pravila. Najvažnije
potencijalne varijable su: vlačna čvrstoća, granica razvlačenja i Poissonov
koeficijent.
4.1.4. Vrste opterećenja
Promjenjivo opterećenje se parametrizira kako bi se parametri mogli upotrijebiti u
procesu modeliranja predikcijskim metodama.
Slika 4.1 Dijagram promjenjivog opterećenja
Pod promjenjivim opterećenjem podrazumijevamo uzastopno djelovanje vanjskih
sila promjenjive veličine i predznaka. Promjena intenziteta i predznaka sila se
aproksimira sinusoidom na kojoj se temelje sljedeći parametri, slika 4.1:
o Maksimalno naprezanje σmax
Marko Šušnjar – Doktorska disertacija
38
o Minimalno naprezanje σmin
o Srednje naprezanje ciklusa σE = FGHIJFGKL-
o Amplituda ciklusaσa = Nσmax+σmin2 N o Koeficijent asimetričnosti ciklusa� = ST��ST1A o Karakteristika ciklusa U = VWVX
Slika 4.2 Koeficijent asimetričnosti ciklusa
Pored promjenjivog opterećenja moguće je koristiti i konstantno opterećenje ili
statičko opterećenje ako se ono pojavljuje kao atribut. Konstantno statičko
opterećenje se smatra posebnim slučajem promjenjivog opterećenja
σmax = σmin = σm, r = +1.
4.1.5. Naprezanje
Naprezanje po svojoj definiciji predstavlja unutarnje sile otpora razdvajanja
materijala i uvijek je izraženo u obliku kontinuirane varijable [MPa].
Stanje naprezanja u točci opterećenog konstrukcijskog elementa se opisuje
tenzorom [23]
YS"#Z = [S\\ S\] S\^S]\ S]] S]^S^\ S^] S^^_ = [
S\ `\] `\^`]\ S] `]^`^\ `^] S^ _
Marko Šušnjar – Doktorska disertacija
39
Slika 4.3 Tenzor naprezanja
- Vrste opterećenja
o Osno ili aksijalno (vlačno ili tlačno)
o Smicanje
o Savijanje
o Uvijanje
o Izvijanje
4.1.6. Vrsta materijala
U suvremenoj praksi izgradnje konstrukcija koristi se mnogo materijala koji su
podvrgnuti dinamičkom opterećenju.
Najzastupljeniji je čelik različitih vrsta. Od najjeftinijih običnih ugljičnih čelika,
preko čelika za cementiranje pa sve do čelika za poboljšavanje koji se koristi za
dinamički jako napregnute elemente. Svaka od podvrsta čelika može biti legirana
ili ne.
Marko Šušnjar – Doktorska disertacija
40
Razne vrste lijevova se koriste za dinamički opterećene konstrukcije. Poglavito za
nosive elemente (kućišta, ležišta, postolja,...). Sivi lijev ima najlošiju dinamičku
izdržljivot. Temper lijev ima nešto višu dinamički izdržljivost, do čelični lijev ima
najvišu.
Slitine lakih metala Al i Mg dominiraju konstrukcijama koje zahtijevaju malu
specifičnu težinu. Pored njih u novije vrijeme značajnu ulogu imaju polimeri i
kompozitni materijali [1], [5].
Vrsta materijala je bitna varijabla pri predikcijskom modeliranju. Pri tome je
potrebno uključiti kemijski sastav kako bi se osiguralo da metoda „prepozna“
eventualno utjecajne parametre, pogotovo ako se koristi metoda koja omogućava
izvlačenje pravila.
4.1.7. Termička i termokemijska obrada
Stanje površina strojnih elemenata kao i uzoraka, ima značajnu ulogu u njihovoj
dinamičkoj izdržljivosti. Inicijalne pukotine kao početni stupanj umora materijala
najviše se registriraju upravo na njihovoj površini. Termičkim i termokemijskim
procesima se mijenjaju karakteristike površine i time utječe na pojavu inicijalnih
pukotina, a samim time i na dinamičku izdržljivost [2].
Najčešće tehnike obrade površine su nitriranje i cementiranje. Obje tehnike imaju
svoje parametre koji utječu na rezultat njihove primjene te ih je bitno uključiti u
proces modeliranja prediktivnim metodama.
Diskretizacija i apstrahiranje vrijednosti su u ovim slučajevima jako poželjni,
poglavito kada se radi o temperaturama obrade ili sastavu kupki u procesu
nitriranja.
4.1.8. Strojna obrada
Strojna obrada manifestriana kroz hrapavost površine je dokazano utjecajna na
dinamičku izdržljivost materijala. Mikro koncetracija naprezanja i zaostala tlačna
naprezanja izazivaju smanjenje, odnosno povećanje vijeka trajanja pod
Marko Šušnjar – Doktorska disertacija
41
dinamičkim opterećenjem [23]. Strojna obrada se može karakterizirati opisno kao
brušenje, tokarenje, glodanje... ili preko vrijednosti hrapavosti površine.
Hrapavost se uobičajno izražava prema vrijednostima srednje hrapavosti (Ra) i
najveće hrapavosti (Rmax), obje izražene u µm [23].
U konstrukcijskoj praksi se pad dinamičke izdržljivosti zbog hrapavosti izražava
faktorom kvalitete stanja površine ζ1 , pri čemu je ζ1 ≤ 1.
4.1.9. Koncentracija naprezanja – oblik
Dinamička čvrstoća materijala se smanjuje svakom promjenom oblika i površine
presjeka elementa. Koeficijent koncetracije naprezanja KF definira se kao [30]:.
Kb = σc8\σ$dc (4.1) gdje je σEef maksimalno naprezanje, a σghE nominalno naprezanje.
Koeficijent je u funkciji oblika, materijala, toplinske i mehaničke obrade,
površine...
Pored koeficijenta koncentracije naprezanja definiran je i teorijski koeficijent
koncentracije naprezanja KT. On opisuje odnos maskimalnog naprezanja prema
nazivnom naprezanju na mjestu diskonuiteta i uvjetovan je samo geometrijom
elementa. Dobiva se analitičkim, eksperimentalnim ili numeričkim putem.
ρ – predstavlja vezu između gornja dva koeficijenta prema Thumu [1], [5].
U = ij − 1ik − 1(4.2) Sa stajališta modeliranja potrebno je sve raspoložive varijable uzeti u obzir. Kako
je koncentracija naprezanja vrlo značajan element koji utječe na dinamičku
izdržjivost potrebno je sva tri parametra koristiti u modeliranju, naravno ukoliko je
njihova vrijednost poznata.
Marko Šušnjar – Doktorska disertacija
42
4.1.10. Apsolutne dimenzije
Apsolutne dimenzije imaju utjecaj na trajnu dinamičku čvrstoću materijala. Pristup
problematici njihovih uobličavanja u varijable pogodne za prezentaciju
predikcijskim metodama može biti klasičan preko koeficijenata. Primjer je
konstrukcijski koeficijent koji predstavlja omjer trajnih dinamičkih čvrstoća između
uzorka koji se promatra i standardnog laboratorijskog uzorka [31].
lm = Sn&,opSn&,o > 1(4.3) Gdje je :
Sn&,o– trajna dinamička čvrstoća pri simetričnom ciklusu za element promjera
d
σ-&,sp- trajna dinamička čvrstoća pri simetričnom ciklusu laboratorijskog
sličnog uzorka promjera do=7-10mm
Interpretacija koeficijentima je svakako dobar izbor. Kako postoji nelinearnost
između dimenzija, oblika i dinamičkih karakteristika materijala uputno je više
koeficijenata koristiti kao varijable u procesu modeliranja.
Pored prikazanog koeficijenta trajnje? dinamičke čvrstoće može se koristiti i
koeficijent dimenzija koji stavlja u omjer same dimenzije uzorka.
4.1.11. Tvrdoća
Tvrdoća je svojstvo materijala koji se protivi prodiranju stranog tijela u njegovu
strukturu ili površinu. Tvrdoća je statička varijabla koja može biti korisna pri
modeliranju ako se modelira više vrsta materijala unutar jednog seta podataka.
Sva četiri načina određivanja tvrdoće mogu biti prikazana kao vrijednosti varijabli
[23].
- Tvrdoća prema Vickersu (HV)
Marko Šušnjar – Doktorska disertacija
43
- Tvrdoća prema Rockwellu (HRc, HRb)
- Tvrdoća prema Brinellu (HB)
- Tvrdoća prema Shoru (HS)
4.1.12. Zračenje
Zračenje može biti raznih oblika. Od običnog sunčevog zračenja, preko termičkog
pa sve do nuklearnog. Ovisno o materijalu njegov utjecaj je različit. U pojedinim
kombinacijama može značajno utjecati na dinamička svojstva materijala.
Najjednostavniji je primjer plastičnih materijala pri termičkom zračenju.
Uzima li se u obzir zračenje pri modeliranju potrebno je svakako odvojiti tip
zračenja te njegov intezitet. Diskretizacija inteziteta zračenja je poželjna pri
modeliranju.
4.1.13. Temperatura
Sobna temperatura je osnovna temperatura na kojoj se mjeri izdržljivost
materijala. Ako se javlja kao varijabla bitno ju je staviti u korelaciju s materijalom
koji se ispituje.
Čelik se konkretno relativno jednolično ponaša do 3000 - 4000 C. Daljnjim rastom
temperature svojstva mu se snižavaju. Slično je i pri niskim temperaturama ispod
00 C. Snižavanjem temperature se čak i povećava dinamička izdržljivost dok
padaju druga svojstva kao što je žilavost te raste osjetljivost na koncentraciju
naprezanja [32].
Na samom primjeru čelika je jasno da temperatura može biti utjecajna varijabla te
je kao takvu treba uzeti u obradu. Vrijednosti temperature se mogu diskretizirati u
razrede ili uzimati u apsolutim veličinama. Provodi li se diskretizacija treba
poznavati svojstva materijala te paziti da se granice razreda odaberu s obzirom
na kritične temperature.
Marko Šušnjar – Doktorska disertacija
44
4.1.14. Mehanička obrada
Primjenom mehaničke obrade može se povećati čvrstoća materijala te granica
razvlačenja materijala. Nije zanemariv niti njen utjecaj na trajnu dinamičku
čvrstoću jer se plastičnom deformacijom materijala unose zaostala tlačna
naprezanja koja uzrokuju umanjenje ili čak poništavanje zaostalih vlačnih
naprezanja [1], [5]. Na taj način se smanjuje ukupno zaostalo naprezanje koje
utječe na dinamičku čvrstoću komponenti i konstrukcija.
Mehanička obrada je u ovakvim slučajevima hladno deformiranje kovanjem,
valjanjem, prešanjem, čekičanjem, sačmarenjem, rolanjem, protrnjivanjem, itd.
Pored same obrade promatraju se i dodatni parametri, kao štosu: njen intezitet,
vrijeme ili neka druga mjera njene primjene.
Uključivanje mehaničke obrade kao varijable u modeliranje problematike
potrebno je napraviti tako da se za svaki set podataka numerički definira
postojanje i tip mehaničke obrade.
4.1.15. Zaostalo naprezanje
Zaostalo naprezanje je značajan parametar stanja konstrukcije. Iz dosadašnjih
istraživanja je poznato da jako utječe na čvrstoću konstrukcija. Njegov utjecaj na
zavarene konstrukcije pod dinamičkim opeterećenjem može dosezati do 70%
razlike u dinamičkoj izdržljivosti [32].
Očito je da njegova veličina značajno utječe na procjenu vijeka trajanja
konstrukcije. Način na koji se zaostalo naprezanje može uključiti u modeliranje
ovisi isključivo o tome kako se ono interpretira. Rijetkost je da je poznata njegova
apsolutna vrijednost već se uglavnom iskazuje relativno unutar cijelog seta
ulaznih parametara za pokuse.
Apsolutno ili relativno iskazivanje zaostalog naprezanja za uzorke čiji se rezultati
ispitivanja koriste za modeliranje potrebno je svesti na numerički oblik koji je
jednoznačan za sve setove podataka jednog modeliranja.
Primjer je postotak zaostalog naprezanja u odnosu na trajnu dinamičku čvrstoću.
Marko Šušnjar – Doktorska disertacija
45
4.1.16. Atmosfera
Atmosfera pod kojom se vrši ispitivanje može biti različita. Najčešći oblici su zrak i
vakuum. Pored njih ispitivanja se izvode i u inertnoj atmosferi, kao što je
argonska te u atmosferama kao što su vodik i dušik.
Kompleksnost ispitivanja u različitim atmosferskim uvjetima obično se mijenja u
diskretnom obliku te se na takav način može i numerički prikazati.
4.1.17. Korozija
Neželjeno razaranje materijala uzrokovano kemijskim utejcajima okoline
predstavlja koroziju. Korozija utječe na dinamičku izdržljivost materijala. Intenzitet
utjecaja ovisi o agresivnosti korozije i vremenu njezina djelovanja [33].
Korozija se dijeli prema mehanizmu procesa na kemijsku koroziju (korozija u
neelektrolitima) te na elektrokemijsku koroziju (korozija u elektrolitima).
Prema geometrijskom obliku korozija može biti opća, lokalna, selektivna i
interkristalna.
Ovakve podjele se teško mogu jednoznačno odrediti te je pogodnija uvriježena
podjela na mehaničke faktore, faktore materijala te faktore okoline.
Ukoliko su neki od tih faktora poznati mogu se uključiti kao varijabla u modeliranju
koristeći diskretizaciju njihovih veličina.
4.1.18. Međuzavisnost parametara
Složenost ponašanja materijala u kontekstu konstrukcije i eksploatacije
neminovno dovodi do međuzavisnosti nekih od parametara iz opisanih skupina.
Međuzavisnosti su uglavnom poznate na teorijskoj osnovi, ali se njihovi odnosi ne
mogu jednostavno odrediti niti matematički opisati. Modeliranje prediktivnim
metodama ima prednost da međuzavisnosti nije potrebno poznavati za uspješno
modeliranjre. Metode u svojim algoritmima imaju ugrađeno indirektno
prepoznavanje zavisnosti. Stoga nije potrebno dodavati nove atribute koji bi
opisivali međuzavisnosti postojećih.
Marko Šušnjar – Doktorska disertacija
46
4.2. Razumijevanje podataka
Razmijevanje podataka kao dio prediktivne metodologije predstavlja procjenu
načina na koji se mogu postojeći rezultati pokusa iskoristiti za predikciju u
pogonskoj čvrstoći. Potrebno je za svaki poznati parametar pokusa procijeniti
upotrebljivost u prediktivnom procesu.
4.2.1. Geometrija i dimenzije uzorka
Ulazni podaci koji opisuju geometriju uzorka, kao što su apsolutne dimenzije,
imaju se smisla koristiti u prediktivnom modeliranju samo onda kada imamo više
geometrijski različitih uzoraka čiji su podaci testiranja dostupni. U tom slučaju
potrebno je dimenzije apstrahirati ovisno o tome što se modelom želi postići. Ako
se radi o klasifikaciji i kao prediktivna varijabla se koristi karakteristika oblika, tada
je potrebna razina apstrakcije u vezi s oblikom.
Primjer je modeliranje uzoraka različitih dužina i širina. Kao prediktivna varijabla
se odabire odnos dužine i širine.
4.2.2. Tipovi pokusa u pogonskoj čvrstoći
Načini provođenja pokusa i njihova namjena određuju strukutru podatatka. Pokusi
su zbog svoje složenosti često ograničeni nekim od parametara. Izvode se pokusi
s uzorcima od samo jednog materijala ili se izvode pokusi s određenim
opterećenjem ili tipom opterećenja i sl. Svako od tih ograničenja parametara
predstavlja eliminaciju cijelog seta varijabli iz procesa modeliranja. Konkretno,
kada se rade pokusi s uzorkom od samo jednog materijala sve potencijalne
varijable o materijalu postaju konstante i nemaju smisla biti uključene u proces
modeliranja.
4.2.3. Rezultati pokusa
Vijek trajanja iskazan u broju ciklusa je najčešći tip izlaznih podataka, odnosno
rezultata pokusa. Vijek trajanja stoga predstavlja najinteresantniju varijablu
Marko Šušnjar – Doktorska disertacija
47
klasifikacijskog i predikcijskog kandidata. Tipičan predikcijski scenarij je dobivanje
broja ciklusa koje bi uzorak izdržao u slučaju varijacije neke ulazne varijable za
koju nisu provedeni pokusi.
4.2.4. Koncentratori naprezanja
Ako se isti koncentratori naprezanja pojavljuju u svim uzorcima čiji se podaci
koriste za modeliranje, nije ih kao varijablu potrebno uzeti u obradu. Ako se, pak,
razlikuju među uzorcima, potrebno ih je uvrstiti u varijable modeliranja jer je
njihov značaj dokazano veliki. Apstrahiranje koncentratora je potrebno i može se
izvesti korištenjem standardnog koeficijenta koncentracije naprezanja postoji li
mnogo različitih koncentratora.
4.2.5. Materijal uzorka
Uzorak ima mehanička i kemijska svojstva koja se mogu koristiti kao varijable u
procesu modeliranja. Njihovo korištenje ima smisla samo ako u setu podataka
postoji više uzoraka različitih materijala. Radi li se o jednom materijalu, njihovo
korištenje nema smisla. U ovu skupinu spadaju podaci o kemijskom sastavu,
tvrdoći i čvrstoći materijala.
4.2.6. Vrste opterećenja i naprezanje
Opterećenje je najpromjenjivija varijabla u svakom setu podataka dostupnom za
modeliranje. Priroda eksperimenata u Pogonskoj čvrstoći je takva da se
variranjem opterećenja pronalaze granice izdržljivosti materijala. Prilikom
modeliranja potrebno je sve parametre opterećenja uzeti u obzir i prikazati ih kroz
varijable za svaki pojedini primjer. Naprezanje i opterećenje je samo po sebi
dovoljno jednoznačno tako da nije potrebno posebno apstrahiranje. Potrebna je
ujednačnost u redovima veličina koji se koriste dok se bezdimenzionalni podaci
koriste kakvi jesu. Primjeri su naprezanje σ u MPa i koeficijent asimetričnosti
ciklusa r.
Marko Šušnjar – Doktorska disertacija
48
Grupiranje varijabli iz primjera, te razumijevanje značenja svake od njih prikazani
su u tablici 4.1. Nazivi varijabli su korišteni u engleskom nazivlju sukladno
nazivima parametara iz literature [34], [35], [36].
Tablica 4.1 Primjer grupiranja varijabli iz preliminarnih ispitivanja
Varijabla Opis varijable
Series Administrativna oznaka serije pokusa
Podaci o materijalu, geometriji uzorka, trajna dinamička čvrstoća
Varijabla Opis varijable
Specimen_Type Oznaka oblika uzorka, valjak (šipka) ili prizma (plata)
Specimen_Diameter Promjer uzorka ako se radi o valjku
Specimen_Thikness Debljina uzorka ako se radi o prizmi
Specimen_Width Širina uzorka ako se radi o prizmi
Specimen_Inclusion Sadržaj uključen u materijalu uzorka
Specimen_Production Način na koji je materijal proizveden
Specimen_Fatigue_At_1E7_Cycles_Mpa Trajna dinamička čvrstoća
Rezultati testa
Varijabla Opis varijable
Test_Sa_MPa Naprezanje uzorka
Test_Nf_in_10E4 Broj ciklusa koje je uzorak izdržao
Test_Runout Flag koji označava da je uzorak izdržao više od 107 ciklusa, te je
pokus zaustavljen
Podaci o uzorku, strojnoj i toplinskoj obradi
Varijabla Opis varijable
Specimen_Direction Uzimanje uzorka iz materijala u odnosu na smjer valjanja
Specimen_Shape Stanje površine nakon strojne obrade
Specimen_Stress_Concetration_Factor Faktor koncentracije naprezanja
Specimen_Hole_Drilled Postojanje provrta u uzorku
Specimen_Surface Način na koji je obrađena površina nakon strojne obrade
Specimen_Roughness Hrapavost površine
Specimen_Temp Temperatura toplinske obrade uzorka
Specimen_Cooling_Time Vrijeme hlađenja nakon toplinske obrade uzorka
Marko Šušnjar – Doktorska disertacija
49
Specimen_Cooling_Atmosphere Atmosfera hlađenja nakon toplinske obrade uzorka
Specimen_Cooling Način hlađenja nakon toplinske obrade uzorka
Podaci o parametrima opterećenja pri provođenju pokusa
Varijabla Opis varijable
Test_Load Tip opterećenja uzorka
Test_Control Kontrola pri opterećenju uzorka pri testu
Test_Stress_Ratio Odnos naprezanja u testu
Test_Constant_Stress_MPa Konstantno naprezanje pri testu
Test_Frequency_Hz Frekvencija opterećenja pri testu
Test_Temperature Temperatura pri testu
Test_Atmosphere Atmosfera pri testu
Test_Failure_Definition Definicija otkaza uzorka
Test_Failure_Crack_Length Dužina pukotine na uzorku
Podaci o kemijskom sastavu materijala uzorka
Varijabla Opis varijable
Chemical_C Postotak sadržaja ugljika u materijalu uzorka
Chemical_Si Postotak sadržaja silicija u materijalu uzorka
Chemical_Mn Postotak sadržaja mangana u materijalu uzorka
Chemical_P Postotak sadržaja fosfora u materijalu uzorka
Chemical_S Postotak sadržaja sumpora u materijalu uzorka
Chemical_Ni Postotak sadržaja nikla u materijalu uzorka
Chemical_Cr Postotak sadržaja kroma u materijalu uzorka
Chemical_Mo Postotak sadržaja molibdena u materijalu uzorka
Chemical_V Postotak sadržaja vanadija u materijalu uzorka
Chemical_Cu Postotak sadržaja bakra u materijalu uzorka
Chemical_Al Postotak sadržaja aluminija u materijalu uzorka
Chemical_Ti Postotak sadržaja titana u materijalu uzorka
Podaci o vlačnom testu materijala te oblika uzorka koji je pri testu korišten
Varijabla Opis varijable
Tensile_Direction Uzimanje uzorka iz materijala u odnosu na smjer valjanja za
vlačni test
Tensile_Type Oznaka oblika uzorka, valjak (šipka) ili prizma (plata) za vlačni
test
Tensile_Diameter Promjer uzorka ako se radi o valjku za vlačni test
Marko Šušnjar – Doktorska disertacija
50
Tensile_Thikness Debljina uzorka ako se radi o prizmi za vlačni test
Tensile_Width Širina uzorka ako se radi o prizmi za vlačni test
Tensile_G_Length Dužina uzorka za vlačni test
Tensile_Sample_Size Broj uzoraka na kojima se radio vlačni test
Tensile_Yield_MPa Granica razvlačenja
Tensile_Strenght_MPa Vlačna čvrstoća
Tensile_Elongation_Persent Postotak produljenja uzorka pri vlačnom testu
Tensile_Area_Reduction_Persent Postotak suženja površine uzorka pri vlačnom testu
Podaci o testu žilavosti
Varijabla Opis varijable
Impact_Energy Apsorbirana energija pri testu žilavosti
Impact_Value Veličina žilavosti
Impact_CV Mjera žilavosti
Impact_Sample_Size Broj uzoraka na kojima je testirana žilavost
Podaci o toplinskoj obradi materijala prije izrade uzorka
Varijabla Opis varijable
Heat_Diameter Promjer materijala pri toplinskoj obradi
Heat_1_Temp Prva temperatura toplinske obrade
Heat_1_Time Vrijeme držanja na prvoj temperaturi pri toplinskoj obradi
Heat_1_Cooling Vrijeme hlađenja s prve temperature pri toplinskoj obradi
Heat_2_Temp Druga temperatura toplinske obrade
Heat_2_Time Vrijeme držanja na drugoj temperaturi pri toplinskoj obradi
Heat_2_Cooling Vrijeme hlađenja s druge temperature pri toplinskoj obradi
Podaci o tvrdoći uzorka
Varijabla Opis varijable
Hardness_By Tvrdoća po?
Hardness_Value Veličina tvrdoće
Marko Šušnjar – Doktorska disertacija
51
4.3. Priprema i pretprocesiranje podataka
4.3.1. Analiza varijabli
Kod pripremanja seta podataka koji će se koristiti u procesu modeliranja potrebno
je pojedinačno analizirati potencijalne varijable. Analizira se cijeli set podataka
prije podjele na testni i uzorak za učenje te se svaka pojedinačna varijabla
promatra preko svih primjera. Za svaku varijablu se inicijalno pronalazi tip
varijable, ekstremi, popunjenost te varijable u uzorku, broj nedostajućih
vrijednosti. Nakon inicijalne, radi se detaljna analiza. U Pogonskoj čvrstoći zbog
postojanja velikog ekspertnog znanja potrebno je dobro razraditi poznate
domininante varijable: materijal, opterećenje, koncentratori naprezanja, trajna
dinamička čvrstoća, te rezultati pokusa.
Tip varijable predstavlja karakteristiku varijable u smislu je li diskretna ili
kontinuirana. Za diskretne se utvrđuje tip, radi li se o numeričkoj, varijabli koja
sadrži slovne oznake ili logičkoj varijabli.
Ekstremi predstavljaju minimum i maksimum kod numeričkih varijabli. Pored
utvrđivanja ekstrema potrebno je utvrditi i broj primjera podataka koji imaju
ekstreme za svaku pojedinu varijablu.
Popunjenost varijable predstavlja broj primjera u uzorku koji ima popunjenu
varijablu koja se analizira. Popunjenost predstavlja vrijednost varijable u uzorku
koja je poznata. Bitno je napomenuti da 0 (nula) obično ne predstavlja
nepopunjenu varijablu, već vrijednost. U sustavima baza podataka nepostojeća
numerička ili karakter vrijednost je „null“ vrijednost [26]. Za karakter varijable ili
za logičke varijable sadržaj varijable je prazan ili popunjen vrijednošću koja
predstavlja besmislen podatak.
Nedostajuće vrijednosti (missing values) predstavljaju upravo one vrijednosti
koje nisu smislene u odnosu na problem koji se opisuje.
Potrebno je izračunati osnovne statističke veličine: maksimum, minimum,
standardnu devijaciju, srednju vrijednost te asimetriju distribucije.
Marko Šušnjar – Doktorska disertacija
52
4.3.2. Priprema uzorka
Uzorak, odnosno set svih primjera koji će se koristiti za modeliranje, potrebno je
pripremiti za sam proces modeliranja. Za svaku varijablu potrebno je donijeti
odluku na koji će se način koristiti u modeliranju.
Prvi korak je određivanje tipa varijable koji će se koristiti u modeliranju.
Karakter varijable se mogu po potrebi transformirati u numeričke ili logičke.
Transformacija karakter varijabli u numeričke ima uvijek smisla. Koriste li se
napredni alati za modeliranje, oni sami interno rade transformaciju. Ako se
karakter varijabla pojavljuje samo u dva stanja, transformacija u logičku ili
numeričku sa samo dvije vrijednosti dobar je izbor.
Numeričke kontinuirane varijable je potrebno diskretizirati. Pri tom se javlja već
opisani problem određivanja intervala. Napredni alati za modeliranje
diskretiziranje varijabli uspješno obavljaju na transparentan način. U ovom
slučaju dobra je i ekspertna podjela koja se temelji na poznavanju problematike.
U Pogonskoj čvrstoći kao najvažnija kontinuirana varijabla pojavljuje se broj
ciklusa koje je uzorak izdržao prije otkaza. Pri tome se javlja slučaj da uzorak
izdrži maksimalno planirani broj ciklusa. Broj i veličina intervala se određuju
prema karakteristikama Wöhlerove krivulje, znači da je izbor intervala u
logaritamskom mjerilu dobar izbor za interpolaciju ili ekstrapolaciju krivulje.
Odluka o načinu tretiranja nedostajućih vrijednosti ovisi o ekspertnoj procjeni
važnosti varijable i koliko će eventualni nadomjestak nedostajućih vrijednosti
utjecati na točnost modela. Varijabla za koju teorija kaže da nema veliki utjecaj u
konkretnom slučaju može se eliminirati iz modeliranja bez da se nadopunjuju
nedostajuće vrijednosti u pojedinim slučajevima.
Varijable za koje se ekspertno zna da imaju veliki utjecaj su problematične u
smislu nadopune nedostajućih vrijednosti. Radi li se o prediktivnim varijablama
(one koje se klasificiraju ili predviđaju) njih nema smisla nadopunjavati jer se time
narušava cijeli smisao modeliranja. Takvi primjeri s nedostajućim vrijednostima u
prediktivnim varijablama se eliminiraju iz daljnjeg procesa modeliranja. Varijable
koje su relativno uniformne mogu se nadopuniti u primjerima gdje nedostaju s
nekim od postupaka interpolacije. Zamjena srednjom vrijednosti susjednih
Marko Šušnjar – Doktorska disertacija
53
primjera (ukoliko su primjeri složeni nekim logičkim redoslijedom) je dobar izbor
za primjere Pogonske čvrstoće. Postoji mnogo načina nadopunjavanja
nedostajućih vrijednosti, pa odluka o tome koji će se primijeniti uglavnom ovisi o
iskustvu te interaktivnom? postupku pokušaja i dobivanja onoga s najvećom
točnosti.
Outlieri ili ekstremi koji značajno odstupaju od ostalih podataka su sljedeći
problem koji je potrebno riješiti. Rješavanje ovih problema u Pogonskoj čvrstoći
značajno ovisi o eksperntoj procjeni. Prvi korak je eliminacija eventualne greške u
mjerenju ili interpretaciji rezultata. Ostali ekstremi se tretiraju tako da se u
potpunosti eliminiraju iz procesa modeliranja ili da se na neki način “ublaže“
vrijednosti ekstrema. Najčešći primjer je već opisan, kada uzorak izdrži
maksimalno planirani broj ciklusa opterećenja u tom pokusu.
Derivirane varijable su poseban način poboljšavanja pripreme podataka za
modeliranje. Pod ovim varijablama se smatraju one koje ne postoje u inicijalnom
setu podataka, već se dobivaju iz postojećih varijabli. Način na koji se dobivaju
ovise o iskustvu i ekspertnom znanju. Moguće je napraviti kombinaciju postojećih
varijabli koristeći matematičke postupke. Najčešći je oblik kombinacija sa
statističkim vrijednostima. Derivirane varijable imaju smisla samo kad nisu u
direktnoj linearnoj ili nelinearnoj zavisnosti s već postojećim varijablama.
Najčešće se koriste kada se njihovim kombinacijama nadoknađuju nedostajuće
vrijednosti, odnosno korištenje nove varijable koja kompenzira nedostajuće
vrijednosti neke druge koja se u tom slučaju ne koristi u modeliranju.
4.3.3. Pretprocesiranje seta podataka za modeliranje
Na osnovi odluka koje su donijete u procesu pripreme uzorka, provodi se
pretprocesiranje podataka. Pretprocesiranje kao postupak, vezano je uz samu
manipulaciju podacima. Sva ekspertna znanja su primarno iskorištena u
prethodnom koraku. Izrađuju se procedure za transformaciju i prilagodbu
podataka prethodnim definicijama. Za samo pretprocesiranje podataka najbolje je
iskoristiti prednosti relacijskih baza podataka i SQL programski jezik. Ako
okruženje podržava manipulaciju podacima onda se izrađuju makro naredbe koje
Marko Šušnjar – Doktorska disertacija
54
će provesti transformaciju. Pored pripreme podataka na osnovi odluka u pripremi,
potrebno je provesti normalizaciju i „glađenje“ podataka tamo gdje je potrebno.
Postupak pretprocesiranja će detaljnije biti prikazan na primjerima.
4.4. Modeliranje, razvoj modela i učenje
Odabir metode za modeliranje u Pogonskoj čvrstoći zasniva se na karakteristici
ulaznih podataka i načinu na koji su pripremljeni. U dostupnoj literaturi
dominantan izbor je bio na neuralnim mrežama [13],-[20]. Preliminarna
istraživanja u ovoj disertaciji su pokazala da se i druge skupine metoda moraju
uzeti u obzir pri evaluaciji za izbor. Neuralne mreže će zasigurno dati jako dobru
generalizaciju problema, međutim karakteristike drugih metoda daju dodatnu
vrijednost koja se može iskoristiti. Stabla odlučivanja, regresijski modeli pa i
klasterizacija, mogu biti metode izbora za pogonsku čvrstoću.
Shema prediktivnog modeliranja je prikazana na slici 4.4.
Statistička analiza ulaznih i prediktivnih varijabli daje smjernice o izboru metoda.
Ako najjače prediktivne varijable imaju dobru distribuciju prema ciljnoj varijabli
većina metoda će moći dati relativno dobre rezultate, a ako je distribucija loša,
Neuralne mreže su metoda izbora.
Modeliranje problema pogonske čvrstoće traži kvalitetnu pripremu podataka jer
podaci u izvornom obliku ne mogu dati dobre prediktivne modele. Razlog je
rasipanje eksperimentalnih rezultata, što je inače problem pogonske čvrstoće.
Izbor je modeliranje Wöhlerovih krivulja ili drugih već statistički obrađenih
podataka. Takvo modeliranje rješava u startu problem šuma na koje su
prediktivne metode osjetljive.
Postupci podjele raspoloživog seta podataka na setove za modeliranje,
parametriziranje metoda i učenje, prikazani su na konkretnom modeliranju
problema u poglavlju 5.
Marko Šušnjar – Doktorska disertacija
55
Slika 4.4 Shema prediktivnog modeliranja prilagođena pogonskoj čvrstoći
4.5. Ocjena modela
Dvije su osnovne evaluacije točnosti.
Evaluacija točnosti modela je točnost koju model postiže pri pogađanju setova
podataka koji su mu prezentirani kao set za provjeru učenja. Ova točnost je
preduvjet ali ne i mjerilo točnosti jer uvijek postoji opasnost od preučavanja
metode, „overtraninig“, kako je opisano u 3.2.
Evaluacija točnosti predikcije je najvažnija za probleme Pogonske čvrstoće.
Predikcijom se utvrđuje kojom točnošću metoda pogađa rezultate za setove
podataka koji nisu korišteni u modeliranju. Detaljnije o evaluaciji točnosti u
poglavlju 5.7.
Marko Šušnjar – Doktorska disertacija
56
5. Razvoj prediktivne metode uz numeričku verifikaciju
5.1. Izvori i izbor podataka
Bilo koja prediktivna metoda traži kvalitetne ulazne podatke na kojima bi se radila
obrada. Za numeričke eksperimente u ovoj disertaciji, kao izvor podataka,
koristila se literatura [34], [35], [36]. Radi se o referentom izvoru podataka
izdanom od „The Society of Materials Science, Japan“ (JSIS). U tri sveska se
nalaze rezultati istraživanja JSIS u periodu od 1961. do 1992. godine. Literatura
je dostupna samo u tiskanom izdanju tako da je sve trebalo prebaciti u digitalni
oblik. Nije se koristila nikakva automatska digitalizacija (OCR optical character
recognition i sl.) već se svaki podatak „ručno“ prenosio u digitalni oblik uz
višestruku provjeru. Literatura pored detaljnih numeričkih podataka o ispitivanju
sadrži i skice uzoraka te dijagrame opterećenja u odnosu na broj ciklusa (S-N).
Skice i dijagrami su služili kao dodatni elementi prilikom kategoriziranja i odabira
podataka za modeliranje.
Na slici 5.1 su prikazani primjeri S-N dijagrama iz literature. Svaki pokus ima svoj
odgovarajući S-N dijagram s odgovarajućim brojem točaka koje predstavljaju
obavljene pokuse i registrirane u literaturi [34], [35], [36]. Dijagrami su iskorišteni
za provedbu eliminacijskih kriterija opisanih dalje u ovom poglavlju.
Prikazani dijagrami iz literature su korišteni samo orijentacijski, a ne za
konstruiranje Wöhlerovih krivulja. Za tu svrhu korišteni su točni numerički podaci
dobiveni digitalizacijom. Na slici 5.2 je prikazan primjer numeričkih podataka u
literaturi. Slika prikazuje podatke za pokuse nad jednim tipom uzorka pod
originalnom oznakom 292-002. S-N dijagram za taj pokus iz literaure je vidljiv na
slici 5.1.
Marko Šušnjar – Doktorska disertacija
58
Slika 5.2 Prikaz numeričkih podataka iz literature
Sama digitalizacija podataka iz literature je obavljena nad oblikom zapisa kakav
je prikazan na slici 5.2.
Prikaz digitaliziranog oblika primjera sa slike 5.2 prikazan je u tablicama 5.1, 5.2 i
5.3. Karakteristika setova podataka je da vrijednosti varijabla za pojedini pokus
imaju određen skup jedinstvenih vrijednosti koje se ne mijenjaju za sve točke
pokusa. Varijable s jednakim vrijednostima za sve točke pokusa iz primjera sa
slike 5.2 prikazane su u tablicama 5.2 i 5.3.
Marko Šušnjar – Doktorska disertacija
59
Tablica 5.1 Primjer digitaliziranih podataka iz literature
Tablica 5.2 Primjer digitaliziranih podataka iz literature
Chemical C
Chemical Si
Chemical Mn
Chemical P
Chemical S
Chemical Cu
Tensile Yield MPa
Tensile Strenght MPa
1.-26. 0.15 0.25 0.4 0.015 0.02 0.03 310 386
Series
Specimen Fatigue At 1E7 Cycles MPa Test Sa MPa Test Nf in 10E4
Specimen Stress Concetration Factor
Test Stress Ratio Sigma m
1. 292-002 164 292 0.7 1 -1 0
2. 292-002 164 275 0.9 1 -1 0
3. 292-002 164 265 1.4 1 -1 0
4. 292-002 164 226 4.4 1 -1 0
5. 292-002 164 216 6.9 1 -1 0
6. 292-002 164 196 8.4 1 -1 0
7. 292-002 164 196 8.7 1 -1 0
8. 292-002 164 196 17.8 1 -1 0
9. 292-002 164 177 70.8 1 -1 0
10. 292-002 164 167 30.5 1 -1 0
11. 292-002 164 162 1000 1 -1 0
12. 292-002 164 235 2.5 1 -1 0
13. 292-002 164 235 2.6 1 -1 0
14. 292-002 164 235 3 1 -1 0
15. 292-002 164 235 3.4 1 -1 0
16. 292-002 164 235 3.4 1 -1 0
17. 292-002 164 235 3.6 1 -1 0
18. 292-002 164 235 3.6 1 -1 0
19. 292-002 164 235 3.7 1 -1 0
20. 292-002 164 235 3.8 1 -1 0
21. 292-002 164 235 3.8 1 -1 0
22. 292-002 164 235 3.9 1 -1 0
23. 292-002 164 235 3.9 1 -1 0
24. 292-002 164 235 4.2 1 -1 0
25. 292-002 164 235 4.3 1 -1 0
26. 292-002 164 235 4.5 1 -1 0
Marko Šušnjar – Doktorska disertacija
60
Tablica 5.3 Primjer digitaliziranih podataka iz literature
Specimen_Shape Specimen_Hole_Drilled Speciman_Surface Post_Heat_Tretman Heat_Tretman
1.-26. 3 0 3 21 0
Cilj modeliranja je razviti prediktivnu metodlogiju i metodu primjenjivu na
problematiku Pogonske čvrstoće. Potreba za eksperimentalnom verifikacijom
primjenjivosti metode postavila je određena ograničenja pri izboru podataka iz
literature. Ograničenja se i u ovom slučaju odnose na mogućnosti dostupne
opreme za eksperimentalnu verifikaciju.
Aksijalno opterećenje pri provođenju pokusa je prvi ograničavajući kriterij izbora
pokusa iz literature. Ovo ograničenje ni u čemu ne sužava potencijano područje
primjene metode jer je primjenjiva i za savijanje, rotacijsko savijanje, rotacijsko
savijanje s nadvjesom i sl. Ograničenje se odnosi samo na eksperimentalnu
verifikaciju u ovom radu.
Sobna temperatura i standardna atmosfera pri provođenju pokusa su sljedeći
ograničavajući kriterij. Kao i kod aksijalnog opterećenja odnosi se samo na
mogućnosti eksperimentalne verifikacije a ne na mogućnosti primjene same
metode. Materijal od kojeg su izrađeni uzorci je također bio kriterij izbora. Čelik je
uzet kao materijal na kojem će se vršiti modeliranje i eksperimentalno
verificiranje. Odabrani čelici su prikazani u tablici 5.4.
Marko Šušnjar – Doktorska disertacija
61
Tablica 5.4 Materijal uzoraka odabranih za numeričku verifikaciju metoda
DIN JIS ISO ASTM
C10 Ck10
S10C C10 1010
C15 S15C C15E4 C15M2
1015
C22 S20C ---- 1020
C25
S25C C25 C25E4 C25M2
1025
C30
S30C C30 C30E4 C30M2
1030
C35
S35C C35 C35E4 C35M2
1035
C40
S40C C40 C40E4 C40M2
1040
C45
S45C C45 C45E4 C45M2
1045
St44-2 SS400 SS41
---- 283 Grade D
Sljedeći kriterij izbora je bila kvaliteta provedenih pokusa. Izbor se zasnivao na
preporuci literature [22] o broju potrebnih pokusa s istim ulaznim parametrima za
generiranje S-N krivulje. Pri tome se testovi smatraju kao istraživanje i razvoj te
se promatraju niži kriteriji dovoljni za tu svrhu, dok se viši kriteriji primjenjuju u
konstruiranju.
Sljedeći kriterij je bio oblik uzorka. Uzeti su u promatranje uzorci u obliku šipke.
Takve uzroke je moguće ispitati, te metodu eksperimentalno verificirati, na
dostupnoj opremi.
Sva ograničenja kriterija izbora imaju zajedničku već iskazanu karakteristiku,
postavljena su samo zbog eksperimentalne verifikacije i ne predstavljaju
ograničenje za primjenjivost metode.
Podaci su preneseni u digitalni format te spremljeni u odgovorajuću podatkovnu
strukturu. Za ovu svrhu nije rađena optimizacija podatkovne strukture te su oni
organizirani u tablični oblik, bez svođenja na optimalne oblike zadovoljavanja 3.
Marko Šušnjar – Doktorska disertacija
62
normalne fome ili sl. Tablice su međusobno vezane relacijskim ključevima koji se
prvenstveno koriste za identifikaciju, a ne za relacijsku algebru.
5.2. Priprema podataka
Podaci su prebačeni u digitalni oblik sa svim pripadajućim i dostupnim atributima
iz literature. Ukupno je digitalizirano više od 3000 setova podataka. Selekcijskim
postupkom te postupkom pripreme podataka broj setova podataka reduciran je
na 1129 verificiranih podataka koji zadovoljavaju kriterije ulaznih podataka za
proces modeliranja prediktivnim metodama.
Struktura sirovih podataka prije pripreme prikazana je u tablicama 5.5 - 5.8. U
preliminarnim istraživanjima iz istih izvora podataka [34], [35], [36] korišteno je
više različitih atributa, kako je to prikazano u tablici 4.2. Razlog redukcije leži u
analizi kvalitete dostupnih podataka. Svi eliminirani atributi su imali glavni
problem nedostatka vrijednosti („missing values“), toliko da se nije mogao pronaći
pouzdan način nadomjestka za te podatke.
Marko Šušnjar – Doktorska disertacija
63
Tablica 5.5 Pregled strukture podataka
Atribut Oznaka u podatkovnoj
strukturi
Primjer, objašnjenje
Oznaka materijala Materijal po JIS-u S10C,
S35C,S45C,SS400,...
Jedinstvena identifikacijska oznaka
pokusa i serije podataka
Series 155-062, 135-015, 201-
010,...
Trajna dinamička čvrstoća Specimen_Fatigue_At_1E7_
Cycles_MPa
Brojčana vrijednost
Opterećenje pojedinog ispitivanja Test_Sa_MPa Brojčana vrijednost
Broj ciklusa koje je uzorak izdržao
pri tom opterećenju, izražen u 104
Test_Nf_in_10E4 Brojčana vrijednost
Faktor koncentracije naprezanja,
geometrijska karakteristika uzorka
Specimen_Stress_Concetrac
ion_Factor
Brojčana vrijednost
Koeficijent asimetričnosti ciklusa, r Test_Stress_Ratio Brojčana vrijednost
Srednje naprezanje ciklusa Sigma_m Brojčana vrijednost
Kemijski sastav, sadržaj ugljika Chemical_C %
Kemijski sastav, sadržaj silicija Chemical_Si %
Kemijski sastav, sadržaj mangana Chemical_Mn %
Kemijski sastav, sadržaj fosfora Chemical_P %
Kemijski sastav, sadržaj sumpora Chemical_S %
Kemijski sastav, sadržaj bakra Chemical_Cu %
Granica razvlačenja [MPa] Tensile_Yield_MPa Brojčana vrijednost
Prekidna čvrstoća [MPa] Tensile_Strenght_MPa Brojčana vrijednost
Oblik uzorka Specimen_Shape Oznaka iz tablice oblika
uzoraka
Površina uzorka Specimen_Surface Oznaka iz tablice
površina uzoraka
Toplinska obrada Heat_Treatman Oznaka iz tablice
toplinskih obrada
Poslije toplinska obrada, odnosno
sekundarna toplinska obrada
Post_Heat_Treatman Oznaka iz tablice
toplinskih obrada
Marko Šušnjar – Doktorska disertacija
64
Tablica 5.6 Oznake toplinskih obrada
Oznaka Temp oC Vrijeme hađenja ( h)
Atmosfera hlađenja
Mjesto hlađenja
Ostalo
1 650 1 vacuum Furnace 2 600 1 vacuum Furnace 3 900 3,5 air Furnace 4 1075 3,5 air Furnace 5 1300 3,5 air Furnace 6 920
700 1 1
air water
7 870 - 880 1 air Furnace 8 900 - 920 1 air Furnace 9 390 1 water 10 550 1 water 11 650 1 water 12 700 1 water 13 920
350 1 3
air air
Furnace Furnace
14 700 1 vacuum Furnace 15 685 2 vacuum Furnace 16 920
780 1 1
Furnace Furnace
17 685 2 air 18 700 1 vacuum Furnace + 15% prednaprezanja
prije 2. Topl. obrade 19 1200 1 Furnace 20 685 2 air Water 21 930 1 vacuum Furnace 22 750 1 vacuum Funace 23 880 1.6 Furnace 24 900, 1100 1, 1 air Furnace 25 900, 1300,
650 1 2
air air
Furnace
26 860 4 Furnace 27 870 0,5 vacuum Furnace 28 870 0,5 air 29 650 0,5 vacuum Furnace 30 880 1,2 air 31 850
600 water
air
32 830 5 Furnace 33 830
600 5 5
water air
34 830 3 air 35 830 4 air 36 830
600 4 3,5
water air
37 830 600
4 3,5
water air
+ prednaprezanje od 572,3 MPa
38 870 845 550
0,5 0,5 1
air water water
Marko Šušnjar – Doktorska disertacija
65
Tablica 5.7 Oznake oblika koncentracije naprezanja uzorka
Oznaka Opis
1 Okrugli utor
2 Pjeskareni uzorak
3 Glatki uzorak (bez koncentratora naprezanja)
4 Dvostrani utor
5 Izrezani uzorak
Tablica 5.8 Oznake površina uzorka
Oznaka Opis
0 Bez obrade
1 Brušeno
2 Elektro polirano
3 Rezano
4 Polirano
Atributi toplinske obrade su prikazani u posebnoj tablici te je za njihovu
identifikaciju korišten jedinstveni ključ. Analizom podataka utvđeno je ukupno 38
različitih vrsta toplinskih obrada korištenih u odabranim ispitivanjima iz literature
[34], [35], [36]. Prediktivne metode kojima se modelira problem ne poznaju
fizikalna svojstva materijala niti fizikalne parametre pokusa stoga je
najučinkovitije predstaviti atribute u relativnim odnosima kao što je napravljeno
kroz njihove identifikatore. Identičan je pristup napravljen za atribute oznake
površina i oblika uzorka. Njih je pronađeno značajno manje. Ukupno ima 5
različitih oblika, te 5 različitih površinskih obrada.
Provedena je analiza radi pronalaženja nedostajućih vrijednosti („missing
values“). U određenim setovima podataka ispitivanja nedostajale su vrijednosti
kemijskog sadržaja. Nadopunjene su podacima iz literature [37].
U pojedinim setovima podataka pronađen je nedostatak vrijednosti granice
razvlačenja. Ovaj podatak se ne može pouzdano dobiti iz literature jer ovisi o
raznim parametrima vezanim za svaki pojedini materijal te njegovu tehnološku
Marko Šušnjar – Doktorska disertacija
66
obradu. Nadopuna je napravljena detaljnom analizom podataka iz literature s
originalnim podacima [34], [35], [36] gdje je uočeno da uzorci s istim početnim
oznakama serija te identičnim kemijskim sastavom i identičnom toplinskom
obradom imaju istu prekidnu čvrstoću. Pretragom podataka pronađene su
vrijednosti prekidne čvrstoće koje odgovaraju, te su ti podaci nadomješteni.
Tablica 5.9 Statistička analiza ulaznih podataka [42]
Varijabla
Min
Max
Arit.
sredina
Std.
Dev
Asimetrija
distr.
frekvencija
Specimen_Fatigue_At_1E7_Cycles_MPa 85 358 171.783 53.668 0.919
Specimen_Stress_Concetration_Factor 1 3.98 1.675 1.12 1.218
Test_Stress_Ratio -1 0.1 -0.574 0.512 0.392
Sigma_m 0 291.4 35.506 79.435 1.927
Chemical_C 0.08 0.46 0.333 0.118 -0.359
Chemical_Si 0.11 0.48 0.253 0.045 2.117
Chemical_Mn 0.37 0.8 0.634 0.126 -0.346
Chemical_P 0.007 0.035 0.017 0.006 0.391
Chemical_S 0.005 0.08 0.023 0.019 2.317
Chemical_Cu 0 0.2 0.045 0.06 1.785
Tensile_Yield_MPa 202 766 365.37 102.834 2.37
Tensile_Strenght_MPa 378 871 603.435 137.555 -0.133
Specimen_Shape 1 6 2.609 1.094 0.422
Speciman_Surface 1 5 1.652 1.147 1.491
Heat_Tretman 0 38 19.13 14.673 -0.305
Post_Heat_Tretman 0 27 1.761 5.769 3.562
Sa_Mpa 0.341 397.29 153.569 56.317 0.651
5.3. Pretprocesiranje podataka
Podaci nisu pogodni za modeliranje u obliku kako su prikupljeni iz literature [34],
[35], [36]. Osnovni razlog je velika količina šuma, odnosno rasipanja, koji je
standardna osobina svih pokusa pogonske čvrstoće [42].
Podatke je potrebno uobličiti u oblik pogodan za modeliranje koji je dovoljno
reprezentativan za modeliranje problematike Pogonske čvrstoće. Za tu primjenu
je odabran standardni način prikaza vijeka trajanja kroz Wӧhlerove krivulje,
odnosno pravce u logaritamskom mjerilu broja ciklusa naprezanja.
Marko Šušnjar – Doktorska disertacija
67
Slika 5.3 Wӧhlerovi pravci s vjerojatnošću preživljavanja
Za svaki set podataka napravljena je interpolacija Wӧhlerova pravca u
normalnom mjerilu naprezanja S i logaritamskom mjerilu vijeka trajanja N.
Interpolacija je napravljena linearnom regresijom, te je za svaki Wӧhlerov pravac
dobiven njegov algebarski oblik u formiy = βx ϵ . Primjer određivanja Wӧhlerova pravca je prikazan na slici 5.4.
Slika 5.4 Primjer interpolacije Wӧhlerovih pravaca na eksperimentalnim
podacima
Svaki Wӧhlerov pravac je još jednom prošao provjeru te se napravila eliminacija
onih koji su imali preveliko rasipanje te nisu davali podatke pouzdane za
modeliranje.
Marko Šušnjar – Doktorska disertacija
68
Sljedeći korak u pripremi podataka je generiranje S vrijednosti Wӧhlerovih
pravaca za odabrane vrijednosti N. Vrijednosti N su odabrane jednoobrazno za
sve Wӧhlerove pravce i sastoje se od 12 točaka kako je prikazano u tablici 5.10.
Odabrano je područje broja ciklusa opterećenja od 104 do 2·106 ciklusa. Cilj je
modelirati dio Wӧhlerova pravca prije područja trajne dinamičke čvrstoće.
Odabrano područje se po literaturi [1] smatra područjem promjenjive dinamičke
čvrstoće i tom području Wӧhlerov pravac ima nagib u logaritamskom mjerilu.
Tablica 5.10 Točke uzorkovanja na Wӧhlerovim pravcima
N u 103 Log N
1 10 4
2 100 5
3 200 5.301
4 400 5.602
5 600 5.778
6 800 5.903
7 1000 6
8 1200 6.079
9 1400 6.146
10 1600 6.204
11 1800 6.255
12 2000 6.301
Generirani su novi setovi podataka za svaki pojedini Wӧhlerov pravac dobiven u
prethodnoj obradi tako da se za svaki pokus i za svaki N prema tablici 5.10 dobila
odgovarajuća vrijednost naprezanja S.
U sljedećem koraku je svakom paru S-N dodijeljen pripadajući skup ostalih
atributa koji su poznati iz literature [34], [35], [36] za taj pokus.
Izračunati podaci se tretiraju kao sredina distribucije, te se smatra da izračunati
Wӧhlerovi pravci imaju vjerojatnost preživljavanja uzorka od 50%.
Marko Šušnjar – Doktorska disertacija
69
5.4. Odabir prediktivnih metoda
5.4.1. Preliminarna istraživanja
U pripremi numeričkog modeliranja napravljeno je testiranje na svim dostupnim
prediktivnim metodama. Svrha je pronaći metode koje su najprimjerenije za
modeliranje Wӧhlerovih pravaca. Karakteristike svake od metoda dostupne iz
literature, te svojstva koja proizilaze iz osnovnog algoritma nisu bila dovoljne kao
kriterij za izbor. Potrebno je napraviti numeričke eksperimente da bi se dobile
metode s najboljim karakteristikama za odabrani slučaj.
- Pregled metoda na kojima su obavljena preliminarna istraživanja [27]:
o Neuralne mreže
Metoda je odabrana za daljnje istraživanje.
o C&RT metoda
Metoda je odabrana za daljnje istraživanje.
o QUEST metoda
Metoda je relativno nova, 1997. godine su je predstavili Loh i Shih.
Predstavlja binarno statističko stablo. Princip rada je takav da
promatra točku grananja na više načina te odabire najpovoljniju.
Pruža manje mogućnosti nego C&RT metoda te traži diskretiziranu
ciljnu varijablu. Izuzeta je iz daljnjeg razmatranja budući da je C&RT
bolji izbor kao metoda iz stabala odlučivanja.
o CHAID metoda
Chi-squared Automatic Interaction Detector (CHAID) je metoda iz
skupine stabala odlučivanja, koju je 1980. godine predstavio Kass.
Radi na principu utvrđivanja homogenosti vrijednosti odabranog
polja slično kao druga stabla odlučivanja. Kao mjeru homogenosti
koristi chi-kvadrat test.
Metoda daje lošije rezultate od C&RT metode i manje mogućnosti
parametriziranja, stoga nije uzeta u daljnje razmatranje.
Marko Šušnjar – Doktorska disertacija
70
o Regresijske metode
Istraživane metode:
GenLin – generalizirani linearni modeli
Logistička regresija
Cox – proporcionalni hazard modeli.
Sve metode iz ove skupine su isključene iz daljnjeg razmatranja
zbog svoje algoritamske karakteristike. Radi se o statističkim
metodama koje nisu predmet ove disertacije. Korištene su u
preliminarnim istraživanjima da bi se dobila slika o njihovoj točnosti i
eventualnoj primjenjivosti. Točnost na verifikacijskom modelu je bila
nedovoljna za daljnja istraživanja.
Regresijske metode imaju svoju primjenu u popunjavanju
nedostajućih vrijednosti.
o SVM metoda
Suport Vector Machine (SVN), metoda koja za mapiranje ulaznih
podataka na izlazne koristi klasifikacijske i regresijske funkcije.
Metoda dobro generira model s malom greškom na testnom setu, a
problem je kod validacije, gdje je radila relativno veliku grešku.
Izuzeta je iz daljnjih istraživanja.
o Klasterizacijske metode
Obavljeno je preliminarno istraživanje s metodom najbližih susjeda
(Nearest Neighbor Analysis). Metoda je zbog svoje algoritamske
karakteristike neprikladna za primjenu u konkretnom modeliranju.
5.4.2. Odabrane metode
Kao metode s najboljim karakteristikama u preliminarnim istraživanjima odabrane
su neuralne mreže i C&RT metoda.
Marko Šušnjar – Doktorska disertacija
71
Neuralne mreže su preliminarno spomenute u 3. poglavlju ove disertacije. Za
konkretno modeliranje u radu je korišten algoritam baziran na tzv „feed-forward“
neuralnim mrežama, poznatim još kao višeslojni perceptoni. Mrežna topologija je
posložena tako da ulazni sloj ima 17 neurona, po jedan za svaki atribut ulaznog
seta podataka. Izlazni sloj ima samo jedan neuron jer je model tako organiziran
da ima samo jednu izlaznu varijablu. Modeliranje Wӧhlerova pravca je moguće
napraviti iz dva smjera, predviđati broj ciklusa koje će uzorak izdržati uz
pretpostavljeno opterećenje i obrnuto, predviđati opterećenje koje će uzorak
izdržati za odabrani broj ciklusa. U oba slučaja imamo samo po jedan izlazni
atribut te je jedan neuron u izlaznom sloju bio dovoljan.
C&RT predstavlja Clasification and Regression Trees, prvobitno je
predstavljen 1984. [38]. Temelji se na particioniranju seta podataka u dva
podseta i to tako da su podaci u podsetovima više homogeni nego prije
particioniranja. Proces je rekurzivan, svaki se od tih podsetova dijeli ponovo te
se proces nastavlja dok se ne dosegne kritetij homogenosti ili neki drugi kriterij
grananja. I kod C&RT modeliranja se koristi isti odnos od 17 ulaznih i jednog
izlaznog atributa.
5.4.3. Algoritam Neuralnih mreža
- Ulazni podaci. Tijek podataka definiran algoritmom počinje
prilagodbom ulaznih podataka, točnije njihovom normalizacijom.
o Normalizacija atributa s kontinuiranim vrijednostima se obavlja
svođenjem na interval Transformacija je oblika
A"w A" * Ac"$Ac8\ * Ac"$ �5.1� o Simbolički, diskretni, binarni (flag) atributi se svode na
indikatorske numeričke vrijednosti binarnog oblika čiji oblik ovisi
o broju kombinacija. Vrijednosti normaliziranih atributa uvijek
ostaju u intervalu [0 - 1]
Marko Šušnjar – Doktorska disertacija
72
- Proces učenja višeslojnog perceptona se zasniva na povratnoj
propagaciji greške (back propagation) koja se temelji na
generaliziranom delta pravilu [39]. Princip je da se za svaki zapis
prezentiran mreži tijekom procesa učenja informacije teče kroz mrežu
prema naprijed (feeds forward) radi generiranja predikcije u izlaznom
sloju. Predikcija se uspoređuje s poznatom točnom vrijednošću te se
razlika između nje i trenutne predikcije propagira natrag kroz mrežu. U
procesu povratne propagacije korigiraju se težinske funkcije kako bi se
poboljšala predikcija. Procese se iterativno ponavlja dok se ne dobije
rezultat koji zadovoljava predefinirane kriterije.
- Feed-forward računanje višeslojnog perceptona
Ulazni neuroni primaju normalizirane vrijednosti odgovarajućih atributa.
Aktivacija svakog neurona u sljedećem sloju se računa prema
1" S x @"#�## y�5.2)
Gdje je 1" aktivacija neurona � , z je set neurona prethodnog sloja, @"# je težina veze između neurona � i neurona z, �# je izlazna vrijednost
neurona z. S�A� je step funkcija slijedećeg oblika:
S�A� 11 + �n\ (5.3)
- Povratno uvrštavanje greške (back-propagation)
Inicijalne vrijednosti težinskih funkcija su randomizirane u intervalu
*0,5 ≤ @"# ≤ 0,5 Setovi podataka predviđeni za treniranje se randomizirano prezentiraju
mreži u ciklusima. Upravo zbog randomizacije u svakom pojedinom
ciklusu se pojedini zapis može pojaviti više puta. Za svaki pojedni zapis
se računa odgovor mreže s trenutnim težinskim vrijednostima. Dobiveni
Marko Šušnjar – Doktorska disertacija
73
rezultat se uspoređuje s poznatim točnim rezultatom te se računa
promjena težinskih vrijednosti kako slijedi
∆@"#�� 1� ~��#��" l∆@"#����5.4� Gdje su η parametar učenja, propagirana greška, izlazna vrijednost
neurona i za zapis p,α momentum parametar, ∆w�� promjena težine
prethodnog ciklusa. Vrijednost momentuma α je konstantna duž cijelog
procesa učenja, dok se vrijednost η mijenja. Započinje s vrijednošću
inicijalne η te se logaritamski mijenja k predefiniranoj najnižoj
vrijednosti, zatim se dalje tijekom procesa učenja podiže na
preddefiniranu najveću vrijednost η te opet spušta. Izraz za računanje
η je sljedeći (d je preddefinara vrijednost):
~��� ~�� * 1��A� x+�, x ~9d�~�"��y /�y�5.5� Propagirana greška se određuje ovisno o poziciji veze u mreži. Za vezu
prema izlaznim neuronima se računa prema sljedećem izrazu:
��# ���# * ��#���#�1 * ��#��5.6� Za veze koje nisu prema izlaznom sloju propagirana greška se računa
prema izrazu ( je set neurona na koji je neuron vezan):
��# ��#�1 * ��#� ���@�#� �5.7� Težinske vrijednosti veza se prema opisanom principu mijenjaju
automatski čim se pojedini set podataka prezentira mreži.
Prikazan je osnovni algoritam mreže. Parametriziranje u stvarnoj
primjeni će biti opisano u daljnjem prikazu modeliranja problema.
Marko Šušnjar – Doktorska disertacija
74
5.4.4. C&RT algoritam
C&RT algoritam pripada skupini algoritama stabla odlučivanja. Općenito su
prikazana u 3. poglavlju ove disertacije. Ovdje će biti prikazan njegov konkretni
oblik i specifičnosti.
- Ulazni podaci
o Setovi podataka s atributima, predstavljaju zapise uobličene u
redove od kojih svaki predstavlja jednu kombinaciju
frekvencijskih pojava.
o Definicija ciljne varijable i definicija svih ulaznih varijabli ili
atributa.
o Frekvencija polja se koriste za smanjivanje veličine skupa
podataka. Označavaju ukupan broj pojavljivanja koje predstavlja
pojedini zapis. U modeliranju konkretnog zadatka ove disertacije
nisu korištena frekventna polja jer je svaki zapis predstavljao
jednu frekvencijsku vrijednost.
o Težinska polja, identično kao frekvencijska, se koriste za
smanjivanje veličine skupa podataka. Predstavljaju težinske
vrijednosti pojedinog zapisa. Nisu korištena u modeliranju
konkretnog zadatka. Pretpostavljena težinska vrijednost svakog
zapisa seta podataka bila je jednaka.
- Princip rada algoritma [27]
o Podjela čvora na dva nova čvora (dijete-čvor) i to tako da novi
čvorovi imaju manju vrijednost entropije nego čvor iz kojeg
nastaju. Entropija predstavlja sličnost vrijednosti ciljne varijable.
U potpuno „čistom“ čvoru, odnosno čvoru bez entropije, svi
setovi imaju istu vrijednost ciljne varijable. Algoritam mjeri
entropiju čvora, koji dijeli na dva nova, koristeći mjeru entropije.
� Za svako polje po kojem se dijeli algortiam radi sljedeće:
Marko Šušnjar – Doktorska disertacija
75
• Za kontinuirana polja slaže zapise po vrijednosti
polja u čvoru od najmanjeg k najvećem. Bira svaku
točku kao moguću točku podjele. Za svaku točku
računa mjeru entropije te bira onu s najmanjom
vrijednosti.
• Za simbolička i diskretizirana polja traži
kombinaciju svaka moguća dva podseta. Zatim
računa entropiju svakog od njih. Na kraju bira
kombinaciju koja ima najmanju apsolutnu
vrijednost.
� Kada pronađe polje s najvećim smanjenjem entropije bira
ga kao polje za podjelu.
� Provjerava uvjete zaustavljanja, ako nisu zadovoljeni za
svaki novonastali čvor ponavlja algoritamsku proceduru.
o Mjera entropije se provodi na sljedeća tri načina:
� Gini
Gini index ,��� je definiran kao
,��� 1 −∑ �-(z|�)# (5.8). Gdje je j kategorija ciljne varijable, a
�(�) = �(z, �)#
(5.9)
Kada su zapisi u čvoru eventualno distribuirani preko
kategorija Gini index doseže maksimum vrijednosti 1 − 1/� gdje je � broj kategorija ciljane varijable. Kada svi zapisi u
čvoru pripadaju istoj kategoriji Gini index je = 0.
Gini korekcijska funkcija �(, �) za podjelu u čvoru � je
definirana kao:
Marko Šušnjar – Doktorska disertacija
76
��, �� ,��� *��,���� *��,�����5.10) Gdje su �� dio zapisa koji idu u lijevi novi čvor, a ��dio zapisa
koji idu u desni novi čvor. Podjela se bira tako da
maksimizira vrijednost ��, �� � Twoing
Twoing index je baziran na podjeli ciljne varijable u dvije
superklase i traženju najbolje podjele. Klase oznake �&i �- su
definirane na način:
�& �z: ��z|��� ≥ ��z|�����5.11) �- � * �&
Twoing kriterijska funkcija za podjelu u čvoru � izgleda
ovako:
��, �� ���� � |��z|��� * ��z|���|# �-�5.12)
gdje su �� i ��čvorovi kreirani podjelom . Podjela se bira kao
ona koja ima maksimalnu vrijednost kriterija.
� Least Squared Deviation (LSD)
Koristi se za kontinuirane varijable, stoga će kao mjera biti
interesantna za primjenu u pogonskoj čvrstoći. LSD mjera je
definirana kao:
���� 1��(�) @"�""∈�((" − ((�))-(5.13)
gdje je ��(�) težinski broj zapisa u čvoru �, @"�" su težinske
odnosno frekventne vrijednosti u čvoru i.
Kriterijska funkcija je definirana kao:
��, �� ���� * ������� * ��������5.14)
Marko Šušnjar – Doktorska disertacija
77
podjela se bira tako da maximizira vrijednosti kriterijske
funkcije.
Odabir načina računanja mjere entropije ovisi o tipu ciljne varijable. Za
varijable koje imaju simboličke ili diskretne vrijednosti odabiru se Gini ili
Twoing mjere, dok se za kontinuirane ciljne varijable odabire Least
Squared Deviation mjera.
o Kriteriji za zaustavljanje daljnje podjele (grananja):
� svi zapisi u čvoru imaju istu vrijednost ciljne varijable,
čvor je čist;
� svi zapisi u čvoru imaju iste vrijednosti za sve ostale
atribute;
� dubina stabla (broj slojeva, odnosno grananja) je
dosegnula preddefiniranu vrijednost;
� broj zapisa u čvoru je manji od preddefiniranog
minimalnog broja zapisa za pojedini čvor;
� najbolja podjela je manja od preddefinirane vrijednosti
minimalne promjene nečistoće.
Iz prikaza algoritma je vidljivo da pored klasične stablaste strukture
karakteristične za sva stabla odlučivanja ima i mogućnosti parametriziranja. U
daljnjem opisu će biti prikazano parametriziranje pogodno za modeliranje
problematike pogonske čvrstoće.
5.5. Modeliranje
Modeliranje je obavljeno sa četiri osnovne skupine modela. Za svaku od dvije
odabrane metode predviđanja (neuralne mreže i C&RT) su razvijani modeli koji
predviđaju naprezanje (Sa) koje uzorak može izdržati pri zadanom broju ciklusa
Marko Šušnjar – Doktorska disertacija
78
(Nf) i modeli koji predviđaju broj ciklusa koje pojedini uzorak može izdržati pri
zadanom opterećenju.
Tablica 5.11 Skupine modela
Neuralne mreže (NN) Klasifikacijska i regresijska
stabla odlučivanja (C&RT)
Predikcija naprezanja (Sa) I skupina modela II skupina modela
Predikcija broja ciklusa (Nf) III skupina modela IV skupina modela
Svaka od skupina modela je modelirana nezavisno te su na kraju rezultati
predikcije međusobno uspoređeni.
5.5.1. Podjela ulaznih podataka
Ulazni podaci su za svaku od skupina pripremljeni na jednak način. Raspoloživi
set ulaznih podataka je podijeljen na tri dijela.
- Set za učenje (training data set)
- Set za testiranje (testing set)
- Verifikacijski set (validation set)
Za sve četri skupine modela odabran je jedinstveni validacijski set. Kako bi se
osigurala mogućnost međusobne usporedbe rezultata validacijski set je u
potpunosti izostavljen iz podataka koji su se prezentirali metodama, te je korišten
za krajnju verifikaciju točnosti metoda.
Kao validacijski set je korišten cjelokupan set podataka pokusa pod oznakom
155-052 iz literature [34], [35], [36]. Materijal pokusa je JIS S30C. U tablici 5.12
su prikazani parametri pokusa iz literature koji ujedno predstavljaju zajedničke
atribute za sve ulazne validacijske podatke.
Marko Šušnjar – Doktorska disertacija
79
Tablica 5.12 Zajednički atributi validacijskog seta podataka
Series Specimen Fatigue
At 1E7 Cycles MPa
Specimen Stress
Concetration Factor
Test Stress
Ratio
Sigma m
S30C 155-052 120 2.26 -1 0
Chemical
C
Chemical
Si
Chemical
Mn
Chemical
P
Chemical
S
Chemical Cu
S30C 155-052 0.31 0.48 0.7 0.02 0.019 0.1
Tensile
Yield
MPa
Tensile
Strenght
MPa
Specimen
Shape
Speciman
Surface
Heat
Tretman
Post Heat
Tretman
S30C 155-052 333 518 1 3 0 0
Validacijski set ima ukupno 12 zapisa diskretiziranih iz njegova Wӧhlerovog
pravca (slika 5.5) u procesu pripreme podataka. Set podataka je prikazan u
tablici 5.13.
Marko Šušnjar – Doktorska disertacija
80
Tablica 5.13 S-N vrijednosti validacijskog seta
Slika 5.5 Wӧhlerov pravac validacijskog seta
Set podataka prezentiran metodama u procesu modeliranja i učenja podijeljen je
na set za učenje i set za testiranje u odnosu 80:20. Znači da je 80% podataka
označeno kao set podataka za učenje, dok je 20% podataka kao set podataka za
Nf u [103] Sa [MPa]
10 200.415
100 157.962
200 145.182
400 132.402
600 124.927
800 119.623
1000 115.509
1200 112.147
1400 109.305
1600 106.843
1800 104.671
2000 102.729
Marko Šušnjar – Doktorska disertacija
81
testiranje u procesu učenja. Podjela je obavljena u potpunosti randomizirano bez
ikakvih pravila. Ista podjela je korištena u sve četiri skupine modela.
5.5.2. Parametriziranje metoda
Parametrizacija metoda je bitna i jako utječe na točnost rezultata predikcije. U
literaturi ne postoji egzaktno pravilo kako parametrizirati metode već samo
smjernice ovisno o karakteristici ulaznih podataka. U pripremi rezultata
napravljeno je mnogo modela te su dobiveni optimalni parametri pogodni za
modeliranje problema Pogonske čvrstoće.
- Parametriziranje metode neuralnih mreža
Postoje dvije osnovne skupine parametara koji su raspoloživi za podešavanje
Neuralnih mreža.
Prva skupina je topologija mreže, a odnosi se na broj neurona i broj slojeva.
Dva preddefinirana sloja kod modeliranja su ulazni i izlazni sloj. Pri
modeliranju ulazni sloj je jednak broju ulaznih varijabli. U konkretnom slučaju
ove numeričke verifikacije, ulazni sloj ima 17 neurona. Izlazni sloj sadrži samo
jedan neuron pošto se u oba slučaja traži samo jedna izlazna varijabla.
Sljedeće što je potrebno definirati u topologiji mreže je broj skrivenih slojeva
(hidden layer) te broj neurona u svakom od njih. Problemu određivanja broja
slojeva i broja neurona se može pristupiti na način da se eksperimentalno
utvrdi najbolje rješenje za svaki pojedini slučaj modeliranja ili da se koristi
poseban algoritam koji utvrđuje optimalan broj neurona u sloju.
U disertaciji je korišten eksperimentalni način tako da su razvijani modeli s
raznim kombinacijama te su testirani na validacijskom setu. Algoritam za
pronalaženje optimalnog broja neurona je korišten u pripremi, međutim, nije
dao dovoljno dobre rezultate.
Algoritam radi tako da pronalazi optimalan broj neurona u skrivenom sloju u
odnosu na set ulaznih podataka namijenjen za testiranje, što nije dovoljno za
kriterij točnosti korišten u ovoj disertaciji. On radi tako da u početnim ciklusima
Marko Šušnjar – Doktorska disertacija
82
propagacije podataka kroz mrežu koristi veliki broj neurona u skrivenom sloju
te ih postupno smanjuje tako što reducira one s malim vrijednostima težina
veza. Kada dosegne kriterij zaustavljanja procesa učenja, prezentira
optimalan broj neurona u skrivenom sloju.
Pri modeliranju I. i III. skupine modela korištene su neuralne mreže s jednim i
dva skrivena sloja te su varirane kombinacije neurona dok s nije pronašla
kombinacija s minimalnom apsolutnom greškom. U pripremnim istraživanjima
pri modeliranju su korištena i tri skrivena sloja. Neuralne mreže s tri sloja su
relativno zadovoljavale kriterije točnosti modeliranja, međutim rezultati
provjere na verifikacijskom sloju nisu bili zadovoljavajući.
Slika 5.6 Neuralne mreže s jednim skrivenim slojem
Marko Šušnjar – Doktorska disertacija
83
Slika 5.7 Neuralne mreže s dva skrivena sloja
Druga skupina su numerički parametri mrežnog algoritma. Parametri su
teorijski opisani u dijelu 5.4.1. disertacije. Njihova primjena i podešavanje u
praktičnom procesu modeliranja izgledaju ovako:
o Način zaustavljanja pocesiranja
Proces učenja se odvija u ciklusima, pri čemu se na kraju
svakog ciklusa provjerava je li dosegnut kriterij zaustavljanja
učenja. Standardno se koriste tri kritetija učenja
� Postignuta točnost
� Ukupan broj ciklusa učenja
� Ukupno vrijeme učenja
Kod svih modeliranja je korišten kriterij postignute točnosti. Važno je
napomenuti da algoritam pod točnosti podrazumijeva računanje
greške predikcije u odnosu na testni set a ne validacijski.
Validacijska provjera se radila naknadno i služila je za međusobnu
usporedbu algoritama. Kriterij postignute točnosti služi isključivo za
zaustavljanje procesa učenja.
Marko Šušnjar – Doktorska disertacija
84
Vrijednost kriterija je postavljena na 92% točnosti. U procesima
modeliranja korištene su i veće vrijednosti ali se uočilo da u
slučajevima kada se ova vrsta točnosti postavlja na višu razinu
opada točnost predikcije na validacijskom setu što je nepoželjno za
konačan rezultat modela. Vrijednost od 92% se pokazala
optimalnom.
o Prevencija preučavanja (overtraining) mreže
Parametar koji dodatno dijeli set za učenje na particije kako bi
dodatno randomizirao redoslijed prikaza podataka mreži. Svrha
dodatnog particioniranja je izbjegavanje stanja kada mreža jako
dobro mapira podatke za učenje a nije u stanju mapirati ostale
setove podataka.
Vrijednost parametra prevencije preučavanja je uspješno
postavljena na 50%.
o Randomizacija inicijalnih mrežnih težina
Parametar koji randomizira inicijalne težine veza među
neuronima kod svakog novog procesa učenja mreže. Ovaj
parametar nije korišten pri modeliranju u disertaciji jer bi narušio
mogućnost međusobne usporedbe modela. Bez njega su modeli
svaki put startali s istim inicijalnim vrijednostima težina veza te
su njihovi rezultati bili međusobno usporedivi.
o Parametar kontrole učenja mreže
� Persistencija mreže
Parametar koji definira broj ciklusa koje će mreža nastaviti
obrađivati u procesu učenja bez da se dogodi poboljšanje u
točnosti. Ovaj parametar osigurava „preskakanje“ lokalnih
minimuma.
Vrijednost parametra koji je korišten je 200 ciklusa sukladno
preporuci literature [27].
Marko Šušnjar – Doktorska disertacija
85
� Momentum učenja (α)
Korištena je veličina 0.9 po preporuci literature [27], koja je
dala najbrži gradijent učenja mreže.
� Parametar učenja (η) se mijenja tijekom učenja kako je
opisano u 5.4.1. Proces učenja započinje s inicijalnom
vrijednošću zatim se logaritamski mijenja prema donjoj te
se opet postavlja na gornju te pada prema donjoj
vrijednosti u procesu učenja. Korak mijenjanja je definiran
kao d u 5.4.1.
Vrijednosti koje su postigle najbrži proces učenja su
sljedeće:
• Inicijalni η = 0.3
• Gornji η = 0.1
• Donji η = 0.01
• Korak d = 30
- Parametriziranje C&RT metode
CR&T metoda spada u skupinu stabala odlučivanja koja po svojoj
algoritamskoj karakteristici imaju kao osnovni parametar način
grananja odnosno stvaranja novih slojeva. Algoritmi podržavaju dva
osnovna načina grananja
o Automatsko generiranje novih slojeva
Algoritam automatski generira nove čvorove prema kriterijima i na
način kako je to teorijski opisano u 5.4.2.
o Ručno utjecanje na grananje (eng. „prunning“)
Marko Šušnjar – Doktorska disertacija
86
Iteraktivni rad u procesu modeliranja gdje ekspert može zaustaviti
grananje u bilo kojem čvoru te donositi odluke o daljnjem grananju
na osnovi ekspertnog znanja i iskustva.
Pri modeliranju C&RT metodom u disertaciji je korišteno automatsko
grananje. Cilj je dobiti generaliziranu metodu koja modelira probleme u
Pogonskoj čvrstoći. Korištenje ekspertnog znanja u numeričkom dijelu bi
usko specijaliziralo metodu i učinilo je ovisnom o parametrima koji se ne
mogu generalizirati (znanje, iskustvo i sposobnost eksperta). To su razlozi
zbog kojih nije korištena mogućnost ručnog utjecanja na proces grananja
modela.
o Skupina parametara vezana uz mjeru nečistoće je opisana u
teorijskom prikazu algoritma, dio 5.4.2. Tri indeksa koja se
koriste u izračunu mjere nečistoće:
• Gini
• Twoing
• Least Squared Deviation
Po svojim algebarskim karakteristikama Last Square Deviation
index je najprimjereniji u modeliranju diskontinuiranih varijabli,
stoga je on i primijenjen u modeliranju.
o Parametar minimalne promjene nečistoće definira graničan
slučaj nakon čega se provodi dijeljenje na dva nova čvora. Pri
modeliranju je korištena vrijednost ovog parametra 0.0001.
o Parametar dubine grananja
Označava broj razina grananja ispod prvog čvora.
Eskperimentiranjem je pronađena optimalna brojka od 8 slojeva
za ovo konkretno modeliranje sa 17 ulaznih varijabli i 1
izlaznom.
Marko Šušnjar – Doktorska disertacija
87
5.6. Proces učenja
Proces učenja se sastoji od prezentiranja seta podataka za učenje i korekcije
greške utvrđene na setu podataka za testiranje. Proces učenja je po algoritmu
svake od metoda i potpuno je automatiziran.
Na slikama 5.8 i 5.9 je prikazana grafička mogućnost praćenja procesa učenja
kod metode Neuralnih mreža. Slika 5.8 prikazuje trenutnu postignutu točnost
(crvena linija) u odnosu na najbolju postignutu točnost (plava linija). Slika 5.9
pokazuje točnost predikcije na setu podataka za učenje (zelena linija) i točnost na
setu podataka za testiranje (ljubičasta linija).
Slika 5.8 Prikaz procesa učenja i propagacije uspješnosti kod neuralnih
mreža
Slika 5.9 Prikaz razlike rezultata kod seta podataka za učenje i seta za
testiranje
Marko Šušnjar – Doktorska disertacija
88
5.7. Analiza rezultata numeričkog modeliranja
Analiza točnosti predstavlja utvrđivanje točnosti s kojom model može
generalizirati slučajeve koju su mu predstavljeni u setu za provjeru, na osnovi
učenja na setu podataka particioniranom za učenje. Točnost modela je u sve
četiri skupine postavljena u području više od 91%. Znači da je model nakon
procesa učenja u stanju pogoditi više od 91% slučajeva iz seta podataka za
provjeru. U procesu modeliranja pojedini modeli su imali mogućnost postizanja
točnosti i preko 98%, međutim pokazalo se da su takvi modeli „pretrenirani“ te su
lošije predviđali rezultate seta za verifikaciju.
Analiza predviđanja predstavlja utvrđivanje s kolikom točnošću model može
predvidjeti izlazne vrijednosti seta podataka za verifikaciju. Predviđanje će biti
objašnjeno za svaku skupinu modela.
Mjerilo greške je definirano kao prosječna greška po apsolutnom iznosu za
jednu predikciju. Računa se kao:
� ∑ 1�����"�$"%& � �5.15� Gdje je broj slučajeva u setu za verifikaciju, a greška svakog pojedinog
slučaja.
5.7.1. Naprezanje kao izlazna varijabla
- Modeliranje metodom Neuralnih mreža
o Mreža s jednim skrivenim slojem
Modeliranje je obavljeno na više modela s različitim brojem neurona
u skrivenom sloju. Rezultati su prikazani na slici 5.10. Najbolji
rezultat je postignut s modelom koji je imao 18 neurona u skrivenom
sloju. Najmanja dobivena greška je 7,2%.
Marko Šušnjar – Doktorska disertacija
89
Slika 5.10 Odnos greške i broja neurona u skrivenom sloju
o Mreža s dva skrivena sloja
Za ovaj tip mreže napravljeno je nekoliko modela s različitim
kombinacijama neurona u svakom od skrivenih slojeva. Optimalnim
se pokazala kombinacija s 38 neurona u prvom skrivenom sloju i 8
neurona u drugom skrivenom sloju. Najmanja dobivena greška je
6,88%
Slika 5.11 Odnos greške i brojeva neurona u 1. i 2. skrivenom sloju
- Modeliranje metodom C&RT
Metoda C&RT nije imala opcije modeliranja koje bi utjecale na grešku kao
kod NN metode. Rezultat modeliranja je stablo odlučivanja prikazano na
slici 5.12. Prosječna greška koju je metoda postigla u ovoj skupini
modeliranja je 17,866%.
Marko Šušnjar – Doktorska disertacija
91
5.7.2. Broj ciklusa kao izlazna varijabla
- Modeliranje metodom Neuralnih mreža
o Mreža s jednim skrivenim slojem
Modeliranje je obavljeno, kao u prethodnom slučaju, na više modela
s različitim brojem neurona u skrivenom sloju. Rezultati su prikazani
na slici 5.13. Najbolji rezultat je postignut s modelom koji je imao 36
neurona u skrivenom sloju. Najmanja dobivena greška je 1,41%.
Slika 5.13 Odnos greške i broja neurona u skrivenom sloju
o Mreža s dva skrivena sloja
Napravljeno je nekoliko modela s različitim kombinacijama neurona
u svakom od skrivenih slojeva. Kombinacija s 34 neurona u prvom
skrivenom sloju i 7 neurona u drugom skrivenom sloju se pokazala
optimalnom. Najmanja dobivena greška je 1,01%.
Marko Šušnjar – Doktorska disertacija
92
Slika 5.14 Odnos greške i broja neurona u 1. i 2. skrivenom sloju
- Modeliranje metodom C&RT
Stablo odlučivanja dobiveno kao rezultat modeliranja C&RT metodom i Nf
kao ciljnom varijablom prikazano je na slici 5.15. Prosječna greška
postignuta ovom metodom je 4,55%.
Marko Šušnjar – Doktorska disertacija
93
Slika 5.15 Model C&RT metode za predikciju broja ciklusa opterećenja
Marko Šušnjar – Doktorska disertacija
94
- Analiza točnosti predikcije
Slika 5.16 Grafički prikaz rezultata predikcijskih modela
Tablica 5.14 Prikaz najnižih grešaka postignutih pojedinim skupinama
modela
Neuralne mreže C&RT
Ciljna varijabla:
naprezanje (Sa)
1 HL 18 neurona 7,2%
17,866% 2 HL 38/8 neurona 6,88%
Ciljna varijabla:
broj ciklusa (Nf)
1 HL 36 neurona 1,41%
4,55% 2 HL 34/7 neurona 1,01%
Skupni rezultati numeričkog modeliranja prikazani su u tablici 5.14.
Najbolje rezultati su postignuti korištenjem neuralnih mreža kao prediktivne
metode. Topologija koja je dominirala u točnosti predikcije je ona s dva
Marko Šušnjar – Doktorska disertacija
95
skrivena sloja u kombinaciji od 34 neurona u prvom skrivenom sloju te 7
neurona u drugom skrivenom sloju.
5.8. Diskusija o numeričkoj verifikaciji
Numerička verifikacija ima cilj pronaći optimalnu kombinaciju metoda predikcija te
njenih parametara za modeliranje. Pored toga potrebno je pronaći i način te
optimalnu strukturu ulaznih parametara za uspješno modeliranje problema
pogonske čvrstoće.
Metoda neuralnih mreža je dala najbolje rezultate. Dosadašnja istraživanja su
upućivala na to jer je upravo ova metoda najzastupljenija u literaturi. Metoda vrlo
uspješno generalizira problem i daje vrlo upotrebljive modele.
Metoda stabala odlučivanja, C&RT, je očekivano dala lošije rezultate nego
metoda Neuralnih mreža.
Kompenzacija koju C&RT metoda nudi nije zanemariva, njeni modeli su čitljivi i
nisu skriveni iza kombancija težina veza kao kod neuralnih mreža. Vidljivo je iz
slika 5.12 i 5.15. Nadalje C&RT ostavlja široko područje za unapređivanje jer ima
mogućnost ekspertnog utjecaja na sam proces učenja, koji Neuralne mreže ne
nude. Rezultat najbolje greške koja je postignuta C&RT metodom od 4,55% je
vrlo ohrabrujući i ostavlja prostora za unapređivanja.
Ulazni parametri te odabir ciljne varijable imaju jako veliki utjecaj na točnost
predikcije. Istraživanje je pokazalo značajnu razliku u točnosti predikcije broja
ciklusa koje će uzorak izdržati za poznato naprezanje u odnosu na točnost
predikcije naprezanja koje će uzorak izdržati za poznati broj ciklusa.
Neuralne mreže su točnije u predikciji broja ciklusa u odnosu na predikciju
naprezanja i to u omjerima od 510% veće točnosti za mreže s jednim skrivenim
slojem te 680% veće točnosti za mreže s dva skrivena sloja.
C&RT ima sličnu razliku točnosti u predikciji broja ciklusa u odnosu na predikciju
naprezanja i to veće za 397%.
Marko Šušnjar – Doktorska disertacija
96
Sukladno opisanom istraživanju broj ciklusa je ciljna varijabla izbora kod
modeliranja Wӧhlerovih pravaca u Pogonskoj čvrstoći.
Razlog tolike razlike se pronalazi u distribuciji varijable u setovima podataka za
učenje i testiranje, zbog načina uniformnog uzorkovanja podataka iz Wӧhlerovih
pravaca. Slika 5.17 prikazuje razliku uniformnosti distribucije Nf kao ciljne
varijable. Uočljivo je da je Nf popunjen po svakoj od svojih odabranih
diksretiziranih vrijednosti.
Slika 5.17 Distribucija broja ciklusa (Nf) u odnosu na opterećenje (Sa) u
podacima za modeliranje
Uspjeh modeliranja i točnosti pogađanja broja ciklusa leži u uniformnosti
diskretizacije po Nf osi. Metode uspješno pogađaju jer su uspjele mnogo bolje
generalizirati problem. Ukoliko bi se pokušala raditi predikcija za bilo koju drugu
vrijednost Nf koja nije u setu prikazanom u tablici 5.9, rezultati bi bili u potpunosti
nezadovoljavajući. Za uspješnost ove metode to nije ni bitno jer je cilj pronaći
Wӧhlerov pravac za novi materijal koju ova metoda numerički može odrediti sa
zadovoljavajućom greškom.
Marko Šušnjar – Doktorska disertacija
97
6. Eksperimentalna verifikacija metode
Eksperimentalna verifikacija metode se temelji na usporedbi rezultata predikcije
vijeka trajanja koje daje metoda i stvarnih rezultata vijeka trajanja dobivenih
eksperimentima na testnoj opremi. Odabrana su dva materijala za uzorke te po tri
različita koncetratora naprezanja na svakom materijalu. Dobiveno je ukupno 6
uzoraka s odgovarajućim setovima rezultata eksperimenata, te isto toliko
Wöhlerovih krivulja.
Verifikacija je napravljena na svih 6 Wöhlerovih krivulja, kako je opisano dalje u
poglavlju.
6.1. Pregled uzoraka
Odabir uzorka za eksperimentalnu verifikaciju metode se temeljio na tehničkim
mogućnostima dostupne opreme. Oprema ima ograničenja u gabaritima prihvata
uzorka, sili koju može narinuti u postupku ispitivanja, te frekvenciji koju može
postići.
Verifikacijski uzorak ima analogiju s uzorcima iz literature na kojima je napravljen
prediktivni model. Analogija se odnosi na parametre iz literature koji se neće
varirati u postupku ispitivanja. Parametri koji su zajednički s ispitivanjem iz
literature su:
- temperatura na kojoj se provode pokusi (sobna temperatura ≈20oC) ,
- atmosfera u kojoj se provode pokusi (zrak),
- uzorak u obliku okrugle šipke,
- aksijalno opterećenje vlak-tlak.
6.1.1. Materijal uzorka
Odabrane su dvije vrste materijala za uzorke. Radi se o čeliku po proizvođačkim
oznakama S355J2+C klasifikacijskog standarda EN 10277-5 i čeliku C45E+C
Marko Šušnjar – Doktorska disertacija
98
klasifikacijskog standarda EN 10277-2. Ekvivalentne oznake po Hrvatskom
zavodu za norme (HRN) su Č 1430 i Č 1530.
Karakteristike materijala su prikazane u tablicama 6.1 i 6.2.
Tablica 6.1 Kemijske karakteristike materijala prema deklaraciji proizvođača
C
(%)
Mn
(%)
Si
(%)
P
(%)
S
(%)
Cu
(%)
Cr
(%)
Ni
(%)
Al
(%)
Mo
(%)
V
(%)
S355J2C+C 0,19 1,33 0,29 0,015 0,016 0,05 0,08 0,03 0,032 0,005 0,004
S45E+C 0,43 0,56 0,24 0,02 0,019 - 0,07 0,03 - 0,01 -
Tablica 6.2 Mehaničke karakteristike materijala prema deklaraciji proizvođača
Granica razvlačenja
(MPa)
Prekidna čvrstoća
(MPa)
Produljenje
(%)
S355J2C+C 582 652 19
S45E+C 711 852 13
Materijal je pribavljen u obliku hladno vučenih okruglih šipki promjera 12mm.
Potrebna strojna obrada isjecanja rezanjem te tokarenjem sa propisanim
režimima je napravljena u laboratoriju Zavoda za strojarsku tehnologiju FESB-a
Split.
6.1.2. Oblik uzorka
Uzorci su napravljeni izrezivanjem iz osnovnog materijala tako da su zadržali
promjer od 12 mm. Dužina uzorka ovisi o pokusu koji je na njemu rađen.
Obavljene su dvije osnovne skupine pokusa: statičko i dinamičko.
Marko Šušnjar – Doktorska disertacija
99
- Oblik uzorka za statičko ispitivanje
Oblik uzorka za statičko ispitivanje je prikazan na slici 6.1.
Slika 6.1 Uzorak za statičko ispitivanje
Uzorak za statičko ispitivanje je strojno obrađen tako da mu je promjer
smanjen na 6 mm. Radi smanjivanja koncentracije naprezanja
napravljeni su blagi prijelazi s nazivnog promjera (12 mm) na testni
promjer (6 mm). Izračun minimalne potrebne dužine L0 napravljen je
prema:
�� ��o��� (6.1)
Kako je k = 5.85 [23], te je L0 ≈ 31mm
Izrađeni uzorak prikazan je na slici 6.2.
Slika 6.2 Oblik uzorka za statičko ispitivanje
- Oblik uzorka za dinamičko ispitivanje
Skica uzorka za dinamičko ispitivanje prikazana je na slici 6.3.
Marko Šušnjar – Doktorska disertacija
100
Slika 6.3 Uzorak za dinamičko ispitivanje
Svi uzorci su istih vanjskih dimenzija. Varijacije koje su rađene radi
postizanja različitih koeficijenata naprezanja su u izvedbi utora. Utori te
koncentracije naprezanja će biti opisane u sljedećem poglavlju.
Slika 6.4 Oblik uzorka za dinamičko ispitivanje
6.1.3. Koncentracija naprezanja na uzorcima za dinamičko ispitivanje
Geometrijske karakteristike utora na uzorcima su takve da daju tri različita
koeficijenta koncentracije naprezanja. Koeficijenti koncentracije naprezanja su
izračunati numerički te preuzeti iz literature [30].
Na slikama 6.5, 6.6, 6.7 su prikazana sva tri utora koji su izvedeni na uzorcima za
eksperimente.
Marko Šušnjar – Doktorska disertacija
101
Slika 6.5 Detalj uzorka s utorom r = 0 mm
Slika 6.6 Detalj uzorka s utorom r = 0,4 mm
Slika 6.7 Detalj uzorka s utorom r = 1 mm
Marko Šušnjar – Doktorska disertacija
102
Izvedba utora uzoraka nakon strojne obrade je prikazana na slikama 6.8, 6.9,
6.10.
Slika 6.8 Utor uzorka nakon strojne obrade, r = 0 mm
Slika 6.9 Utor uzorka nakon strojne obrade, r = 0,4 mm
Slika 6.10 Utor uzorka nakon strojne obrade, r = 1 mm
Marko Šušnjar – Doktorska disertacija
103
6.1.4. Određivanje koeficijenta koncentracije naprezanja
Koeficijent koncentracije naprezanja za sva tri tipa uzorka određen je iz literature
[30].
Napravljena je i dodatna provjera metodom konačnih elemenata. Za proračun je
korišten programski paket za FEM analizu CATIA [40]. Modelirana su sva tri utora
te verificirani faktori koncentracija naprezanja. Modeli su prikazani na slikama
6.11 – 6.16.
Koeficijenti koncentracije naprezanja su prikazani u tablici 6.3. U daljnjem
proračunu su se koristili koeficijenti dobiveni iz literature. Razlog odabira je
referenciranje na koeficijente koncentracije naprezanja koji su se koristili u
procesu učenja metoda. Izvorni podaci iz literature [34], [35], [36] su nastali u
dugom vremenskom razdoblju i neki datiraju iz '70-ih godina prošlog stoljeća
kada metoda konačnih elemenata nije bila u široj uporabi kao danas.
Tablica 6.3 Koeficijenti koncentracije naprezanja za uzorke
Uzorak Koeficijent koncentracije naprezanja
Metoda konačnih elemenata Literatura
S35 R0 8.6 5.2
S45 R0
S35 R04 4.77 2.94
S45 R04
S35 R10 3.16 2.34
S45 R10
Marko Šušnjar – Doktorska disertacija
104
Slika 6.11 Mreža konačnih elemenata za uzorak r = 0 mm
Slika 6.12 Koncentracija naprezanja za uzorak r = 0 mm dobivena metodom
konačnih elemenata
Marko Šušnjar – Doktorska disertacija
105
Slika 6.13 Mreža konačnih elemenata za uzorak r = 0,4 mm
Slika 6.14 Koncentracija naprezanja za uzorak r = 0,4 mm dobivena metodom
konačnih elemenata
Marko Šušnjar – Doktorska disertacija
106
Slika 6.15 Mreža konačnih elemenata za uzorak r = 1 mm
Slika 6.16 Koncentracija naprezanja za uzorak r = 1 mm dobivena metodom
konačnih elemenata
Marko Šušnjar – Doktorska disertacija
107
6.2. Eksperimentalno određivanje vijeka trajanja uzorka
6.2.1. Korištena oprema
Eksperimenti su provedeni na opremi „Instron 8801“. Radi se o servohidrauličkoj
umaralici s mogućnošću dinamičkog i statičkog aksijalnog opterećenja do 100 kN.
Umaralica je opremljena računalnim kontrolnim modulom tako da je cijeli
postupak ispitvanja svakog pojedinog uzorka popraćen digitalnim zapisima
svakog pojedinog parametra.
Slika 6.17 Umaralica „Instron 8801“ Katedre za konstrukcije, FESB-a Split
Marko Šušnjar – Doktorska disertacija
108
Slika 6.18 Učvršćeni uzorak u čeljustima umaralice
6.2.2. Postupak ispitivanja
- Statičko ispitivanje
Statičko ispitivanje je obavljeno na uzorcima opisanim u poglavlju
6.1.2. Oba materijala su testirana na po tri uzorka. Svaki uzorak je
podvrgnut vlačnom opterećenju te su snimani dijagrami F-δ (sila-
pomak) i σ–ε (naprezanje-deformacija). Cilj je bio odrediti vlačnu
čvrstoću i tehničku granicu tečenja. Rezultati statičkog ispitivanja su
prikazani u poglavlju 6.3.
Slika 6.19 Izgled loma uzorka nakon statičkog ispitivanja
Marko Šušnjar – Doktorska disertacija
109
- Dinamičko ispitivanje
Dinamičko ispitivanje je napravljeno na ukupno 55 uzoraka svrstanih u
šest skupina. Za svaki materijal po tri, s različitim koeficijentima
koncentracije naprezanja. Uzorci su opterećivani promjenjivim vlak-tlak
opterećenjem. Frekvencija promjene opterećenja na svim ispitivanjima
je bila 10 Hz. Kriterij otkaza je bio lom uzorka. Tijekom ispitivanja se
snimao broj ciklusa opterećenja do loma za svaki pojedini uzorak.
Rezultati dinamičkog ispitivanja su prikazani u poglavlju 6.3.
Slika 6.20 Primjer izgleda loma uzorka nakon dinamičkog ispitivanja
Marko Šušnjar – Doktorska disertacija
110
6.3. Rezultati ispitivanja
6.3.1. Statičko ispitivanje
Rezultati statičkog ispitivanja u obliku odnosa sila-pomak su prikazani na slici
6.21.
Slika 6.21 Dijagram sila-pomak statičkog ispitivanja
Statičko ispitivanje je obavljeno na po 3 uzorka od svakog materijala. Rezultati
prikazani u tablici 6.4 su pokazali određeno odstupanje od deklariranih
proizvođačkih vrijednosti.
Marko Šušnjar – Doktorska disertacija
111
Tablica 6.4 Rezultati statičkog ispitivanja
Statičko ispitivanje pokazalo je razlike u vrijednostima dobivenih pokusima i
deklaracije proizvođača. Srednje vrijednosti dobivene ispitivanjem će se koristiti u
analizi, zaokružene na cijeli broj [MPa]. Deklariranje proizvođačke vrijednosti
statičke vlačne čvrstoće i tehničke granice tečenja će biti zanemarene u ovom
istraživanju.
6.3.2. Dinamičko ispitivanje
Dinamičkim ispitivanjem ukupno je obuhvaćeno 55 uzoraka. Uzorci su podijeljeni
u 6 grupa ovisno o materijalu i koncentraciji naprezanja. Označavanje uzoraka je
prikazano u tablici 6.5.
Materijal
Eksperimentalni rezultati Vrijednosti iz
proizvođačke deklaracije
Statička
vlačna
čvrstoća
[MPa]
Srednja
vrijednost
[MPa]
Tehnička
granica
tečenja
[MPa]
Srednja
vrijednost
[MPa]
Statička
vlačna
čvrstoća
[MPa]
Tehnička
granica
tečenja
[MPa]
S355J2C+C
1. 699
705.3
524
513.6
652
582 2. 714 512
3. 703 505
S45E+C
1. 871
867.7
759
741.7
825
711 2. 883 764
3. 849 702
Marko Šušnjar – Doktorska disertacija
112
Tablica 6.5 Označavanje uzoraka dinamičkog ispitivanja
Materijal
uzorka
Oznaka
uzorka
Opis Broj provedenih ispitivanja po
pojedinom uzorku
S355J2C+C
S35 R0 Utor na uzorku r = 0 mm 10
S35 R04 Utor na uzorku r = 0.4 mm 7
S35 R10 Utor na uzorku r = 1 mm 8
S45E+C
S45 R0 Utor na uzorku r = 0 mm 7
S45 R04 Utor na uzorku r = 0.4 mm 10
S45 R10 Utor na uzorku r = 1 mm 13
Rezultati ispitivanja prikazani su u tablicama: 6.6 - 6.11.
Tablica 6.6 Rezultati dinamičkog ispitivanja za uzorak S35 R0
S35 R0
Naprezanje
(MPa)
Broj
ciklusa do
loma
445.64 21368
445.64 18696
445.64 14998
381.98 50849
381.98 38854
318.31 80302
318.31 68828
318.31 76111
254.65 180336
190.99 >106
Marko Šušnjar – Doktorska disertacija
113
Tablica 6.7 Rezultati dinamičkog ispitivanja za uzorak S35 R04
S35 R04
Naprezanje
(MPa)
Broj
ciklusa do
loma
445.64 26414
445.64 31861
381.98 51645
381.98 49992
318.31 114464
318.31 129981
254.65 755929
Tablica 6.8 Rezultati dinamičkog ispitivanja za uzorak S35 R10
S35 R10
Naprezanje
(MPa)
Broj
ciklusa do
loma
509.30 24737
509.30 22562
445.64 65045
445.64 50163
381.98 161257
381.98 112236
318.31 >1.4∙106
254.65 >106
Tablica 6.9 Rezultati dinamičkog ispitivanja za uzorak S45 R0
S45 R0
Naprezanje
(MPa)
Broj
ciklusa do
loma
445.64 16120
445.64 17399
381.98 29622
318.31 41381
318.31 59847
254.65 127287
190.99 751320
Marko Šušnjar – Doktorska disertacija
114
Tablica 6.10 Rezultati dinamičkog ispitivanja za uzorak S45 R04
Tablica 6.11 Rezultati dinamičkog ispitivanja za uzorak S45 R10
Wöhlerove krivulje su konstruirane za svaki uzorak na osnovi rezultata ispitivanja,
korištenjem linearne regresije. Napravljena je interpolacija pravcima u
logaritamskom mjerilu te je za svaki pravac dobivena odgovarajuća algebarska
jednadžba pravca.
S45 R04
Naprezanje
(MPa)
Broj
ciklusa do
loma
445.64 21559
445.64 20590
445.64 20103
381.98 49596
381.98 45622
381.98 30731
318.31 121495
318.31 91190
318.31 115320
254.65 279926
S45 R10
Naprezanje
(MPa)
Broj
ciklusa do
loma
509.30 3414
509.30 26742
509.30 24488
445.64 52850
445.64 52440
445.64 59503
381.98 213271
381.98 132345
381.98 147338
318.31 296908
318.31 > 1.4∙106
318.31 > 1.5∙106
254.65 > 3∙106
Marko Šušnjar – Doktorska disertacija
115
Wöhlerovi pravci za sve uzorke su prikazani na sljedećim slikama:
Slika 6.22 Wöhlerov pravac za uzorak S35 R0
Slika 6.23 Wöhlerov pravac za uzorak S35 R04
Marko Šušnjar – Doktorska disertacija
116
Slika 6.24 Wöhlerov pravac za uzorak S35 R10
Slika 6.25 Wöhlerov pravac za uzorak S45 R0
Marko Šušnjar – Doktorska disertacija
117
Slika 6.26 Wöhlerov pravac za uzorak S45 R04
Slika 6.27 Wöhlerov pravac za uzorak S45 R10
Marko Šušnjar – Doktorska disertacija
118
6.4. Primjena prediktivne metode na rezultate ispitivanja
Rezultati dobiveni eksperimentalnim ispitivanjem su iskorišteni za verifikaciju
prediktivnih metoda razvijenih u radu na ovoj disertaciji. Metode su opisane u
poglavlju 5. Verifikacija je obavljena na istoj podatkovnoj strukturi kao što je
opisano u poglavlju 5.2. Izuzetak su razredi uzorkovanja Wöhlerovih pravaca, koji
su napravljeni u drugačijim intervalima u odnosu na one iz poglavlja 5.3.
Prediktivne metode su reprocesirane tako da budu prilagođene uzorkovanju
primjenjenom na rezultate ispitivanja.
Prediktivne metode su odabrane za verifikaciju selekcijom na osnovi rezultata
numeričkog verificiranja. Odabrana je metoda neuralnih mreža s dva skrivena
sloja. Metoda stabala odlučivanja C&RT je primijenjena selektivno na određenim
primjerima s ciljem provjere mogućnosti njene primjene za ovakve slučajeve.
Odabir je napravljen na temelju rezultata prikazanih u tablici 5.11.
Neuralne mreže su odabrane u konfiguraciji s dva skrivena sloja. U prvom
skrivenom sloju su 34 neurona dok ih je u drugom 7, sukladno najboljem
postignutom rezultatu.
Stabla odlučivanja su odabrana u C&RT inačici s 8 slojeva grananja ispod prvog
sloja.
Ciljna prediktivna varijabla je odabran broj ciklusa sukladno najboljim rezultatima
numeričke verifikacije.
6.4.1. Ulazni podaci
Struktura ulaznih podataka je opisana u tablicama 5.5 - 5.8. Uzorci korišteni u
eksperimentalnom ispitivanju nisu bili toplinski obrađivani nakon tvorničke
isporuke te nije korišten ni jedan zapis iz tablice 5.6. Površinska obrada svih
uzoraka je bila ista, te su zapisi iz tablice 5.8 za sve uzorke bili isti (bez
površinske obrade). Svi su uzorci imali jednak oblik koncetratora naprezanja s
utorom, tako da je za sve korišten isti zapis iz tablice 5.7.
Marko Šušnjar – Doktorska disertacija
119
6.4.2. Uzorkovanje Wöhlerove krivulje
Wöhlerova krivulja, odnosno pravac u logaritamskom mjerilu, je uzorkovana s
drugačijim intervalima nego što je to bilo u poglavlju 5.3., radi područja na kojem
je obavljeno isptivanje u smislu broja ciklusa. Ispitivanje je obavljeno na višim
razinama opterećenja tako da su rezultati loma pozicionirani u nižim
vrijednostima ciklusa promjene opterećenja. Uzorkovanje je obavljeno s većom
gustoćom u području nižih ciklusa opterećenja. Broj točaka na kojima je
uzorkovan Wöhlerov pravac svakog pojedinog uzorka je 12 kao i u poglavlju 5.3.
Tablica 6.12 Točke uzorkovanja ciklusa opterećenja Wöhlerovih pravaca
N u 103 Log N
1 20 4.301
2 40 4.602
3 60 4.778
4 80 4.903
5 100 5
6 120 5.079
7 150 5.176
8 200 5.301
9 400 5.602
10 600 5.778
11 800 5.903
12 1000 6
6.4.3. Rezultati predikcije
Usporedni rezultati predikcije metodama neuralnih mreža odlučivanja su
prikazani na sljedećim slikama i tablicama.
Marko Šušnjar – Doktorska disertacija
126
Tablica 6.13 Tablični pregled rezultata prediktivne metode za uzorak S35 R0
Tablica 6.14 Tablični pregled rezultata prediktivne metode za uzorak S35 R04
Naprezanje (MPa)
Nazivne vrijednosti ciljne varijable (log
broja ciklusa) Predikcija
neuralnih mreža Greška
(%)
438.67 4.301 4.371 -1.62
371.04 4.602 4.525 1.67
331.48 4.778 4.731 0.99
303.42 4.903 4.879 0.49
281.65 5 4.987 0.25
263.86 5.079 5.072 0.13
242.09 5.176 5.176 -0.01
214.02 5.301 5.327 -0.50
146.39 5.602 5.957 -6.34
106.83 5.778 5.996 -3.79
78.77 5.903 5.997 -1.60
57 6 5.997 0.04
Prosječna apsolutna greška na 12 točaka: 1.45
Naprezanje (MPa)
Nazivne vrijednosti ciljne varijable (log
broja ciklusa) Predikcija
neuralnih mreža Greška
(%)
446.93 4.301 4.568 -6.22
406.00 4.602 4.634 -0.71
382.06 4.778 4.812 -0.73
365.07 4.903 4.970 -1.38
351.90 5 5.104 -2.09
341.13 5.079 5.216 -2.69
327.95 5.176 5.349 -3.3
310.97 5.301 5.505 -3.86
270.04 5.602 5.776 -3.11
246.10 5.778 5.868 -1.57
229.12 5.903 5.913 -0.17
215.94 6 5.937 1.03
Prosječna apsolutna greška na 12 točaka: 2.24
Marko Šušnjar – Doktorska disertacija
127
Tablica 6.15 Tablični pregled rezultata prediktivne metode za uzorak S35 R10
Tablica 6.16 Tablični pregled rezultata prediktivne metode za uzorak S45 R0
Naprezanje (MPa)
Nazivne vrijednosti ciljne varijable (log
broja ciklusa) Predikcija
neuralnih mreža Greška
(%)
504.76 4.301 4.445 -3.36
466.69 4.602 4.445 3.40
444.41 4.778 4.445 6.96
428.61 4.903 4.445 9.33
416.35 5 4.451 10.97
406.33 5.079 4.511 11.18
394.08 5.176 4.605 11.02
378.27 5.301 4.763 10.15
340.19 5.602 5.275 5.83
317.92 5.778 5.592 3.21
302.11 5.903 5.767 2.31
289.86 6 5.859 2.34
Prosječna apsolutna greška na 12 točaka: 6.67
Naprezanje (MPa)
Nazivne vrijednosti ciljne varijable (log
broja ciklusa) Predikcija
neuralnih mreža Greška
(%)
407.48 4.301 4.301 0.00
360.57 4.602 4.303 6.48
333.12 4.778 4.482 6.19
313.65 4.903 4.668 4.78
298.55 5 4.748 5.02
286.21 5.079 4.805 5.40
271.11 5.176 4.878 5.75
251.63 5.301 4.994 5.78
204.72 5.602 5.418 3.28
177.27 5.778 5.764 0.24
157.80 5.903 5.986 -1.42
142.70 6 5.999 0.01
Prosječna apsolutna greška na 12 točaka: 3.70
Marko Šušnjar – Doktorska disertacija
128
Tablica 6.17 Tablični pregled rezultata prediktivne metode za uzorak S45 R04
Tablica 6.18 Tablični pregled rezultata prediktivne metode za uzorak S45 R10
Na slikama 6.28 – 6.33 su prikazani grafovi usporedbe rezultata prediktivnih
metoda sa stvarnim rezultatima pokusa. Promatrani su dijelovi Wöhlerovih
pravaca prije nastanka trajne dinamičke čvrstoće. Područje trajne dinamičke
čvrstoće nije bilo predmet istraživanja ove doktorske disertacije.
Naprezanje (MPa)
Nazivne vrijednosti ciljne varijable (log
broja ciklusa) Predikcija
neuralnih mreža Greška
(%)
440.84 4.301 4.389 -2.05
391.12 4.602 4.603 -0.04
362.04 4.778 4.950 -3.61
341.40 4.903 5.252 -5.07
325.40 5 5.293 -5.87
312.32 5.079 5.422 -6.75
296.32 5.176 5.624 -8.47
275.68 5.301 5.871 -10.76
225.96 5.602 5.998 -7.07
196.88 5.778 5.999 -3.83
176.24 5.903 5.999 -1.63
160.24 6 5.999 0.01
Prosječna apsolutna greška na 12 točaka: 4.60
Naprezanje (MPa)
Nazivne vrijednosti ciljne varijable (log
broja ciklusa) Predikcija
neuralnih mreža Greška
(%)
479.32 4.301 4.399 -2.29
450.51 4.602 4.399 4.40
433.65 4.778 4.399 7.93
421.69 4.903 4.399 10.27
412.42 5 4.411 11.79
404.84 5.079 4.430 12.78
395.56 5.176 4.458 13.87
383.61 5.301 4.503 15.05
354.79 5.602 4.662 16.77
337.94 5.778 4.800 16.92
325.98 5.903 4.921 16.63
316.71 6 5.026 16.23
Prosječna apsolutna greška na 12 točaka: 12.08
Marko Šušnjar – Doktorska disertacija
129
Tablice 6.13 – 6.18 sadrže numerički prikaz prediktivnih rezultata u usporedbi sa
stvarnim vrijednostima S-N Wöhlerovih pravaca za pojedini uzorak.
CR&T metoda je uspješno primijenjena na primjeru S35 R04. Svrha je otvaranje
mogućnosti primjene stabala odlučivanja u pogonskoj čvrstoći, što do sada nije
bio slučaj. Rezultati su prikazani na slici 6.34 i numerički prikaz u tablici 6.19.
Slika 6.34 Rezultati prediktivnih metoda za uzorak S35 R04
Marko Šušnjar – Doktorska disertacija
130
Tablica 6.19 Tablični pregled rezultata prediktivnih metoda za uzorak S35 R04
6.4. Analiza rezultata predikcije
Primjena prediktivnih metoda na rezultate eksperimentalnih istraživanja je
pokazala njihovu točnost i područja iskoristivosti. Metoda neuralnih mreža je,
očekivano, pokazala bolje rezultate od stabla odlučivanja. Sličan odnos je uočen i
pri numeričkoj verifikaciji metode. Točnost metode se računala u postotnom
prikazu. Zbog logaritamske karakteristike prikaza ciklusa opterećenja tolerantnim
se smatra greška < 5% [43].
Primjena prediktivnih metoda na pokus S35 R0 je pokazala visoku točnost
predikcije neuralnih mreža. Greška od 1.45% je uzrokovana nešto većom
greškom metode kod predikcije opterećenja u području od 4·105 - 6·105, dok je u
ostalim točkama metoda pogađala s točnošću < 1%. Slika 6.28 pokazuje točnost
grafički tamo gdje se Wöhlerovi pravci dobiveni eksperimentima i predikcijom
neuralnih mreža podudaraju.
Predikcija pokusa S35 R04 je pokazala dobru točnost metode. Slika 6.29 grafički
pokazuje podudarnost Wöhlerovih pravaca dobivenih eksperimentom i
predikcijom metodom. Točnost metode je 2.24%. U ovom slučaju se primjećuje
gomilanje predikcijskih točaka oko rubnih uvjeta, što predstavlja karakteristiku
Naprezanje (MPa)
Nazivne vrijednosti ciljne varijable (log
broja ciklusa) Predikcija
neuralnih mreža Greška
(%)
Predikcija C&RT
metode Greška
(%)
446.93 4.301 4.568 -6.22 4.607 -7.13
406.00 4.602 4.634 -0.71 4.607 -0.12
382.06 4.778 4.812 -0.73 4.607 3.57
365.07 4.903 4.970 -1.38 4.607 6.02
351.90 5 5.104 -2.09 4.607 7.84
341.13 5.079 5.216 -2.69 5.136 -1.14
327.95 5.176 5.349 -3.3 5.136 0.76
310.97 5.301 5.505 -3.86 5.136 3.10
270.04 5.602 5.776 -3.11 5.860 -4.61
246.10 5.778 5.868 -1.57 5.860 -1.42
229.12 5.903 5.913 -0.17 5.860 0.72
215.94 6 5.937 1.03 5.860 2.33
Prosječna apsolutna greška na 12 točaka: 2.24 3.23
Marko Šušnjar – Doktorska disertacija
131
metode (asimptotsko približavanje rubnim uvjetima). Uočava se da se tri točke na
desnoj strani dijagrama na slici 6.29 približavaju vrijednosti od 106 ciklusa
opterećenja.
Rezultat predikcije pokusa S35 R10 su pokazali nisku predikciju neuralnih mreža
od 6.67%. Razlog tomu je reakcija metode na rubne uvjete s lijeve strane
dijagrama. Primjetno je kako se čak 5 točaka dijagrama asimptotski grupiraju oko
logaritamske vrijednosti 4.4.
Predikcija nad drugim materijalom (S45E+C) iz eksperimentalnog ispitivanja je
pokazala dobre rezultate nad uzorkom S45 R0. Metoda je dala relativno dobre
rezultate s greškom od 3.7%.
Uzorak S45 R04 je imao dobre rezultate predikcije. Neuralne mreže opet imaju
reakciju na rubne uvjete te se 4 točke asimptotski približavaju vrijednosti 106.
Najlošije predviđanje se pokazalo u slučaju uzorka S45 R10 u kojem metoda
intenzivno reagira na rubne uvjete, te se 50% točaka grupira oko logaritamske
vrijednosti 4.4.
Analizom rezultata dolazi se do zaključka da metoda jako dobro pogađa u
područjima u kojima je imala testnih primjera za proces učenja. Uočljivo je
griješenje metode u području < 104 ciklusa te u području ≥ 106. Razlog ovih
grešaka leži u tome što metoda nije imala primjera u pocesu modeliranja s tim
brojem ciklusa. Pri tome je bitno primijetiti da se rubni uvjeti intezivno očituju na
prediktivnoj varijabli. Za bilo kakvu primjenu je potrebno naznačiti rubne uvjete i
greške koje nastaju grupiranjem oko njih. Asimptotsko grupiranje rezultata
predikcije oko rubnih uvjeta uzrokuje pogrešku linearne regresije te promjenu
koeficijenata nagiba Wöhlerova pravca. Grešku rubnih uvjeta je moguće
kompenzirati izbacivanjem iz daljnje obrade grupiranih prediktivnih vrijednosti oko
rubnih granica.
Rezultati su u potpunosti u skladu s teorijskim postavkama iz literature [6], [15].
Metode jako dobro obavlja predikciju u domenama varijabli koje su ograničene
vrijednostima iz primjera korištenih u učenju. Za područja izvan domena varijabli
Marko Šušnjar – Doktorska disertacija
132
metoda daje loše rezultate. Drugim riječima metoda dobro radi interpolaciju dok u
ekstrapolaciji griješi.
Neuralne mreže su se pokazale kao metode izbora, te daju jako dobre rezultate u
uvjetima relativno malog broja primjera za učenje. Ovaj rad je numerički i
eksperimentalno pokazao da neuralne mreže mogu jako dobro modelirati
Wöhlerove pravce.
Stabla odlučivanja su obrađena kao poseban slučaj i na primjeru S35 R04 su
pokazala mogućnost primjene u predikciji Wöhlerovih krivulja. Klasifikacijska
karakteristika stabala odlučivanja je kompenzirana pravilnim izborom uzorkovanja
prediktivne varijable (ciklusa opterećenja). Primjer S35 R04 pokazuje da je stabla
odlučivanja moguće uspješno primijeniti u modeliranju problema pogonske
čvrstoće. Njihova prednost u mogućnosti da jasno prikažu ekspertni model (slike
5.12 i 5.15) daje im potencijalnu ulogu u modeliranju Wöhlerovih pravaca,
pogotovo u slučajevima s više utjecajnih varijabli čija međusobna interakcija nije
u potpunosti jasna i objašnjena.
Marko Šušnjar – Doktorska disertacija
133
7. Zaključak
Cilj istraživanja u disertaciji bio je razviti i verificirati prediktivnu metodu
određivanja pogonske čvrstoće materijala. Pored metode cilj je bio i postaviti
metodologiju modeliranja problematike pogonske čvrstoće prediktivnim
metodama.
Razvijene su i verificirane dvije prediktivne metode. Jedna, koja za matematičku
osnovu koristi algoritam neuralnih mreža, i druga, koja koristi stabla odlučivanja u
inačici C&RT algoritma. Primijenjena je CRISP DM metodologija kod razvoja
prediktivnih metoda te je prilagođena problematici pogonske čvrstoće.
Napravljene su dvije verifikacije metoda. Jedna numerička, koristeći podatke iz
literature, i druga eksperimentalna, gdje su metode verificirane nad
eksperimentalnim podacima. U postupku eksperimentalne verifikacije proveden je
ukupno 61 eksperiment (6 statičkih i 55 dinamičkih).
Prediktivne metode su uspješno verificirane i pokazano je da su u stanju dobro
predvidjeti pogonsku čvrstoću materijala prikazanu kroz Wöhlerove krivulje (S-N).
Postignuta je visoka razina točnosti, kako u numeričkoj tako i u eksperimentalnoj
verifikaciji. Metoda koja je koristila algoritam neuralnih mreža postigla je najveću
točnost od 1.01% u numeričkoj, te 1.45% u eksperimentalnoj verifikaciji.
Neuralne mreže su i do sada u literaturi korištene za predviđanje različite
problematike pogonske čvrstoće, međutim, stabla odlučivanja su bila odbacivana
kao metoda izbora. U disertaciji je pokazano da stabla odlučivanja mogu biti
uspješna u predikciji problematike pogonske čvrstoće. Njihova upotreba ima
potencijalno veliku vrijednost jer su u stanju prikazati čitljivi i razumljivi ekspertni
model.
Pokazano je i područje izvan kojeg metode nisu u stanju kvalitetno napraviti
predikciju. Za svaku primjenu potrebno je definirati rubne uvjete koji slijede iz
područja definicije ciljne varijable. Područje se određuje na osnovi ekstremnih
vrijednosti ciljne varijabe iz seta podataka za učenje. Metoda će uspješno davati
predikciju za sve vrijednosti ciljne varijabe koje se nalaze unutar područja
definicije. Sve vrijednosti predikcije na samim rubnim uvjetima te izvan njih, bit će
Marko Šušnjar – Doktorska disertacija
134
pogrešne. Drugim riječima, ekstrapolacijsko područje u kojem nije bilo primjera
prilikom procesa učenja metoda, područje je u kojem metode nisu u stanju dati
kvalitetno predviđanje.
Pokazan je i način postizanja visoke točnosti pogađanja kroz uzorkovanje
Wöhlerovih krivulja primjera i ciljne varijable. Uzorkovanje je ujedno uvjet za ciljnu
varijablu te je potrebno postaviti upravo onu po kojoj se uzorkuje Wöhlerova
krivulja. U disertaciji se koristilo uzorkovanje po brojevima ciklusa, te se upravo
broj ciklusa koristio kao ciljna varijabla.
Na temelju izloženih istraživanja u ovoj disertaciji postignut je mogući znanstveni
doprinos:
- Određivanje pogonske čvrstoće materijala koja nije poznata, koristeći
prediktivne metode i rezultate postojećih eksperimenata.
- Algoritam neuralnih mreža se može koristiti u prediktivnim metodama
namijenjenim pogonskoj čvrstoći materijala uz ograničenja jasno
definiranih rubnih uvjeta. Neuralne mreže daju visoku točnost u
području definicije ciljne varijable.
- Algoritam stabala odlučivanja moguće je koristiti u predikciji pogonske
čvrstoće materijala uz ograničenja dovoljne gustoće uzorkovanja
klasifikacijske varijable.
- Wöhlerova krivulja se može koristiti kao osnova za modeliranje
problematike pogonske čvrstoće prediktivnim metodama.
- Uzorkovanje Wöhlerove krivulje po osi prediktivne varijable značajno
povisuje točnost predikcije.
- Prediktivne metode nisu pogodne za ekstrapolaciju rezultata
predviđanja pogonske čvrstoće materijala.
Marko Šušnjar – Doktorska disertacija
135
Prijedlozi za buduća istraživanja [44]:
- Područje pripreme podataka te jasno definiranje domene točnosti
metoda bi očekivano pridonijelo primjenjivosti prediktivne metodologije
u pogonskoj čvrstoći.
- Važan doprinos bi bio i razvoj generaliziranog modela koji bi tipski
prihvaćao podatke istraživanja te bio u stanju procesom samoučenja
konstantno unapređivati kvalitetu predikcije.
- Primjena metoda za druge materijale te prilagodbe njihovim
specifičnostima.
- Razrada procesa automatske verifikacije mogućnosti predviđanja
očekivano bi unaprijedila pouzdanost metoda.
Marko Šušnjar – Doktorska disertacija
136
Literatura:
[1] V. Grubišić, Pogonska čvrstoća, FESB Split, Split, 2004.
[2] Ž. Domazet, Metode zaustavljanja širenja pukotina, disertacija, Zagreb 1993.
[3] http://www.enotes.com/topic/South_African_Airways_Flight_201, South African
Airways Flight 201, 01.11.2011.
[4] http://www.trueknowledge.com/q/facts_about__august_wohler, August Wöhler,
01.11.2011.
[5] V. Grubišić, Ž. Domazet, Pogonska čvrstoća - materijali uz predavanja, FESB Split,
Split, 1995.
[6] J. Han, M. Kamber, Data Mining Concept and Techniques, Elsevier, Morgan
Kaufmann Publishers, 2006.
[7] M. Berry, G. Linoff, Mastering Data Mining, Wiley, John Wiley & Sons, 2000.
[8] P. O’Neil, E. O’Neil, Database Principles, programming and performance, Morgan
Kaufmann Publishers, 2001.
[9] http://www.cse.ohio-state.edu/~sgomori/570/coddsrules.html, Dr. E. F. Codd's 12
rules, 12.11.2011.
[10] http://www.ehow.com/facts_6849444_introduction-relational-database-management-
systems.html, An Introduction to Relational Database Management Systems,
21.11.2011.
[11] http://searchdatamanagement.techtarget.com/definition/OLAP, OLAP (online
analytical processing), 21.11.2011.
[12] http://www-01.ibm.com/software/analytics/spss/, SPSS software, 06.10.2011.
[13] S. Mathur, P. C. Gope and J. K. Sharma, Prediction of Fatigue Lives of Composites
Material by Artifical Neural network, Proc. Of the Society for Experimental Mechanic
2007 Annual Conference and Exposition, Springfield, Massachusetts, USA, June 4-6,
2007.paper 260.
[14] J. R. Mohanty, B. B. Verma, P. K. Ray, D. R. K. Parhi: Application of artificial neural
network for fatigue life prediction under interspersed mode-I spike overload, Journal of
Testing and Evaluation, Vol.38, No.2, Paper ID JTE101907
Marko Šušnjar – Doktorska disertacija
137
[15] T. T. Pleune, O. K. Chopra: Artificial Neural Networks and Effects of Loading
Conditions on Fatigue Life of Carbon and Low-Alloy Steels, ASME Pressure Vessels and
Piping Conference, July 27-31 1997, Orlando, USA
[16] R. C. S. Freire, A. D. D. Neto, E. M. Freire, Building of constant life diagrams of
fatigue using artificial neural networks, International Journal of Fatique, 27 (2005) 746-
751
[17] I. Sohn, D. Bae: A study on the Fatigue Life Prediction Method of the Spot-welded
Lap Joint, Seoul 2000 FISTIA World Automotive Congres, June 12-15, 2000, Seoul,
Korea
[18] Cheng-Jung Li, Asok Ray: Neural network representation of fatigue damage
dynamics, Smart Material Structure, vol 4 (1995) 126-133.
[19] V. Venkatesh, H. J. Rack, A neural network approach to elevated temperature
creep–fatigue life prediction, International Journal of Fatigue, Volume 21, Issue 3, March
1999, Pages 225–234
[20] J. R. Mohanty, B. B. Verma, D. R. K. Parhi, P. K. Ray: Application of artifical neural
network for predicting fatigue crack propagation life of aluminium alloys, Computation
Materials science and Surface Engineering, 2009. Volume I, Issue 3. P. 133.-138.
[21] D. T. Larose, Discovering Knowledge in Data An Introduction to Data Mining, Wiley-
Interscience, 2005.
[22] Y. Lee, J. Pan, R. Hathaway,M.Barkey, Fatigue testing and analysis, Elsevier, 2005.
[23] I. Alfirević, i ostali, Inženjerski priručnik IP1, Školska knjiga, Zagreb, 1996.
[24] P. Champman, i ostali, CRISP-DM1.0, SPSS documentation, SPSS, 2000.
[25] R. Nisbet, J. Elder, G. Miner, Handbook of Statistical Analsys and Data Mining
Applications, Elsevier, 2009.
[26] I. Witten, E. Frank, Data Mining Practical Machine Learning Tools and Techniques,
Elsevier, 2005.
[27] SPSS Inc, PASW Modeler 13 Documentation, Integral Solution Limited, 2009.
[28] D. Gamberger and T. Šmuc , {DMS} Poslužitelj za analizu podataka, dms.irb.hr,
Institut Ruđer Bošković
[29] J. R. Quinlan, Machine Learning vol1, Morgan Kaufnamm, 1975.
[30] W. D. Pilkey, Peterson's Stress Concetration Factors, John Wiley & Sons, 1997.
Marko Šušnjar – Doktorska disertacija
138
[31] S. Perše, Osnove strojarstva, FPZ, Zagreb, 1993.
[32] M. Franz, Utjecaj zaostalih naprezanja na dinamičku izdržljivost nitriranog čelika,
disertacija, FSB, Zagreb, 1991.
[33] T. Matić, Dinamička izdržljivost zavarenih aluminjskih konstrukcija izloženih utjecaju
korozije, magistarski rad, FS, Zagreb, 1995.
[34] Databook on fatigue strength of metallic materials, The Society of Materials Science,
Japan, Volume 1, 1996.
[35] Databook on fatigue strength of metallic materials, The Society of Materials Science,
Japan, Volume 2, 1996.
[36] Databook on fatigue strength of metallic materials, The Society of Materials Science,
Japan, Volume 3, 1996.
[37] B. Kraut, Strojarski priručnik, Tehnička knjiga, Zagreb, 1982.
[38] L. Breiman, J. H. Friedman, R.A.Olshen, and C.J.Stone, Clasification and
Regression Trees, Chapman & Hall/CRC, 1984.
[39] D. E. Rumelhart, J. L. McClelland and the PDP Research Group, Parallel Distributed
Processing: Explorations in the Microstructure of Cognition. Volume 1: Foundations,
Cambridge, MA: MIT Press, 1986.
[40] http://www.3ds.com/products/catia/, 3DS Catia, 01.11.2011.
[41] John M. Barsom, Stanley T. Rolfe, Fracture and Fatigue Control in Strucutres:
Application of Fracture Mechanic, Butterworth-Heinemann, 1999.
[42] I. Pavlić, Statistička teorija i primjena, Tehnička knjiga Zagreb, 1985.
[43] F. Beer, Jr. E. Russell Johnston, J. DeWolf, D. Mazurek, Mechanic of Materials,
McGraw-Hill, 2006.
[44] D. Taboršak, Metodologija izrade znanstveno-istraživačkog rada, Fakultet strojarstva
i brodogradnje, Zagreb
ŽIVOTOPIS
Marko Šušnjar rođen je 24.05.1966. u Splitu. Nakon završene osnovne i srednje škole upisuje strojarstvo pri Fakultetu elektrotehnike strojarstva i brodogradnje u Splitu. Diplomira ga u veljači 1991.
Iste godine se zapošljava kao znanstveni novak pri FESB-u Split, te na tom radnom mjestu ostaje do lipnja 1995. godine. U srpnju 1995. kreće poduzetničkim putem te suosniva tvrtku Bit-art consulting u kojoj radi do svibnja 1999. godine. Tvrtku Bit-art informatika osniva u lipnju 1999. u kojoj i danas radi na mjestu direktora.
Znanstveno usavršavanje počinje upisom na poslijediplomski studij strojarstva pri Fakultetu strojarstva i brodogradnje u Zagrebu 1992. godine. 2001. godine nastavlja poslijediplomski studij prelaskom na FESB Split.
Doktorira 2012. na FESB-u Split sa temom „Razvoj prediktivne metode određivanja pogonske čvrstoće materijala“.
Od 1991. Učestvuje u slijedećim znanstvenim projektima:
Pogonska čvrstoća materijala i konstrukcija (023-0231744-1745), glavnog istraživača prof. dr. Željka Domazeta
Istraživanje utjecajnih parametara na pogonsku čvrstoću (023031), glavnog istraživača prof. dr. Željka Domazeta
Pogonska čvrstoća konstrukcija sa i bez zamornih pukotina (2-08-197), glavnog istraživača prof. dr. Vatroslava Grubišića
Od 2003. radi kao vanjski suradnik pri Fakultetu elektrotehnike strojarstva i brodogradnje u Splitu. Sudjeluje u predavanjima i izvođenju vježbi na slijedećim kolegijima:
„Uvod u baze podataka“, na studiju Računarstva, školske godine 2003./2004.
„Uvod u informacijske sustave“, na studiju Industrijskog inženjerstva, školske godine 2003./2004.
„Baze podataka II“, na studiju Računarstva, školskih godina 2004. – 2008.
„Distribuirane baze podataka“, na studiju Računarstva, školskih godina 2004. – 2010.
„Poslovna Inteligencija“, na studiju Računarstva, školskih godina 2009. – 2010.
Sve vrijeme suradnje pri FESB-u mentor je pri izradi studentskim stručnim i diplomskim radovima.
Stalni je pozvani predavač na stručnim Microsofotvim konferencijama te aktivan član raznih strukovnih udruženja.
BIOGRAPHY Marko Šušnjar was born on 24.05.1966. in Split, Croatia. After elementary and high-school he attended the mechanical engineering at the University of Split – Faculty of electrical engineering, mechanical engineering and naval architecture, which he graduaded in February 1991. In 1991. Marko Šušnjar was employed as junior researcher at the University of Split – Faculty of electrical engineering, mechanical engineering and naval architecture where he worked until June 1995. In July 1995. he started with the entrepreneurship in a form of coownership of Bit-art consulting company where he worked until July 1999. In the same year (1999.) Marko Šušnjar established Bit-Art Informatics Ltd. where he works as a CEO now days. Marko Šušnjar started his scientific specialization as postgraduate study at the University of Zagreb – Faculty of mechanical engineering and naval architecture in 1992. The postgraduate study was continued in 2001. with transfer to University of Split - Faculty of electrical engineering, mechanical engineering and naval architecture where he successfully finished his doctoral dissertation in year 2012. From 1991. Marko Šušnjar worked on the following scientific projects: Fatigue strength of material and construnction (023-0231744-1745), main researcher Ph. D. Professor Željko Domazet Researching the influential parameters of the fatigue strength (023031), main researcher Ph. D. Professor Željko Domazet Fatigue strength of construction with and without fatigue cracks (2-08-197), main researcher Ph. D. Professor Vatroslav Grubišić Since 2003. Marko Šušnjar worked as an external associate at the University of Split - Faculty of electrical engineering, mechanical engineering and naval architecture where he conducted lectures and excercises for the following courses: ''Databases introduction'', Computer Science study (2003./2004.) ''Information system introduction'', Industrial Engineering study (2003./2004.) ''Databases II'', Computer Science study (2004.-2008.) ''Distributed databases'', Computer Science study (2004.-2010.) ''Business Intelligence'', Computer Science study (2009.-2010.) At the same time, while cooperating with University of Split - Faculty of electrical engineering, mechanical engineering and naval architecture, Marko Šušnjar was also mentoring the students in terms of their practical papers and thesis. Marko Šušnjar is also a regular guest speaker and lecturer on the Microsoft conferences, as well as the active member of different professional associations.