razvoj prediktivne metode odre Đivanja pogonske … · literaturi za proces u čenja metoda. za...

154
S V E U Č I L I Š T E U S P L I T U FAKULTET ELEKTROTEHNIKE, STROJARSTVA I BRODOGRADNJE Marko Šušnjar dipl. ing. RAZVOJ PREDIKTIVNE METODE ODREĐIVANJA POGONSKE ČVRSTOĆE MATERIJALA DOKTORSKA DISERTACIJA Split, 2012.

Upload: hacong

Post on 03-Apr-2019

225 views

Category:

Documents


0 download

TRANSCRIPT

S V E U Č I L I Š T E U S P L I T U

FAKULTET ELEKTROTEHNIKE, STROJARSTVA I BRODOGRADNJE

Marko Šušnjar dipl. ing.

RAZVOJ PREDIKTIVNE METODE ODREĐIVANJA POGONSKE ČVRSTOĆE MATERIJALA

DOKTORSKA DISERTACIJA

Split, 2012.

Marko Šušnjar – Doktorska disertacija

ii

Doktorska disertacija je izrađena pri

Zavodu za strojarstvo i brodogradnju

Fakulteta elektrotehnike, strojarstva i brodogradnje

Sveučilišta u Splitu

Mentor:

dr. sc. Željko Domazet, red. prof.

Rad broj: 76

Marko Šušnjar – Doktorska disertacija

iii

Povjerenstvo za ocjenu doktorske disertacije:

1. dr. sc. Tonći Piršić, izv. prof. FESB Split 2. dr. sc. Željko Domazet, red. prof. FESB Split 3. dr. sc. Zlatan Kulenović, red. prof. Pomorski fakultet Split 4. dr. sc. Sven Gotovac, red. prof. FESB Split 5. dr. sc. Lovre Krstulović-Opara, red. prof. FESB Split

Povjerenstvo za obranu doktorske disertacije:

1. dr. sc. Tonći Piršić, izv. prof. FESB Split 2. dr. sc. Željko Domazet, red. prof. FESB Split 3. dr. sc. Zlatan Kulenović, red. prof. Pomorski fakultet Split 4. dr. sc. Sven Gotovac, red. prof. FESB Split 5. dr. sc. Lovre Krstulović-Opara, red. prof. FESB Split

Disertacija obranjena dana: 10. srpnja 2012.

Marko Šušnjar – Doktorska disertacija

iv

RAZVOJ PREDIKTIVNE METODE ODREĐIVANJA POGONSKE ČVRSTOĆE MATERIJALA

Sažetak:

Pogonska čvrstoća materijala u obliku Wöhlerovih S-N krivulja se dobiva složenim, dugotrajnim i skupim eksperimentalnim postupcima. Složenost postupka nameće potrebu razvijanja metode koja bi mogla predvidjeti S-N krivulju materijala numeričkim putem koristeći podatke dostupnih eksperimenata. Metode rudarenja podataka su u mogućnosti interpolirati višedimenzionalne probleme pogonske čvrstoće. U radu su razvijene i testirane metode s dva algoritma: neuralne mreže i stabla odlučivanja. Primijenjena je, i prilagođena za probleme pogonske čvrstoće, CRISP DM metodologija. Testiranja su obavljena numerički i eksperimentalno. Numerička provjera je pokazala visoku točnost metode neuralnih mreža. Eskperimentalna provjera je također potvrdila visoku točnost metode neuralnih mreža, dok su stabla odlučivanja pokazala vrlo ograničene mogućnosti primjene. U obje provjere su korišteni podaci testiranja dostupnih u literaturi za proces učenja metoda. Za eksperimentalnu provjeru su provedena vlastita ispitivanja na uzorcima od dvaju različitih materijala s različitim koeficijentima koncentracije naprezanja pod aksijalnim opterećenjem. Utvrđeno je da ni jedna razmatrana metoda ne može provesti ekstrapolaciju i da postoje ograničenja u rubnim uvjetima. Rubni uvjeti su ovisni o intervalima popunjenosti varijabli u setovima podatka za učenje metode. Pokazano je da se može postići veća točnost metode ako se S-N krivulja uzorkuje po prediktivnoj varijabli. U radu je kao prediktivna varijabla korišten broj ciklusa opterećenja N.

Ključne riječi:

pogonska čvrstoća, prediktivne metode, vijek trajanja, rudarenje podataka, Wöhlerove krivulje

Marko Šušnjar – Doktorska disertacija

v

DEVELOP OF PREDICTIVE METHOD FOR DETERMINATION OF MATERIAL FATIGUE LIFE

Abstract:

Fatigue failure of the material represented in Wohler S-N curves require complex, long running and expensive experiments. Complexity of the experiments requires developing of the numerical prediction method for generation S-N curves based on the existing experimental data. Data mining methods are able to make interpolation multidimensional problems of fatigue failure. In this work two methods are develop and tested: neural networks and decision trees. CRISP DM methodology are implemented and adopted for fatigue failure problems. Numerical and experimental tests have been provided. High precision of neural networks have been obtained in numerical tests. Experimental test has shown same high prediction accuracy of neural networks. Decision trees have shown very limited implementation possibility. In both, numerical and experimental tests, data from available literature have been used for method training purposes. Experimental tests have been provided on two different materials, several stress concentration facto and axial loading. Both methods cannot provide extrapolation of data and limitation in boundary conditions exists. Boundary conditions depend of data quality in training datasets. Higher prediction precision has achieved in case S-N curve sampling across predict variable. Number of load cycles (N) have been used as predict variable in modeling.

Keywords:

Fatigue failure, predictive methods, material lifecycle, data mining, Wöhler’s curve

Marko Šušnjar – Doktorska disertacija

vi

Marko Šušnjar – Doktorska disertacija

vii

Sadržaj

1. Uvod ............................................................................................................... 1

1.1. O pogonskoj čvrstoći ............................................................................... 1

1.2. O metodama rudarenja podataka ............................................................ 2

1.3. Dosadašnja istraživanja ........................................................................... 5

1.4. Cilj istraživanja ......................................................................................... 7

2. Pogonska čvrstoća ......................................................................................... 8

2.1. Vrste opterećenja .................................................................................... 8

2.2. Konstrukcijski oblik .................................................................................. 9

2.3. Karakteristike materijala .......................................................................... 9

2.4. Uvjeti eksploatacije ................................................................................ 10

2.5. Eksperimentalna ispitivanja ................................................................... 10

3. Rudarenja podataka ..................................................................................... 12

3.1. Metodologija rudarenja podataka .......................................................... 12

3.1.1. Razumijevanje područja primjene ................................................... 13

3.1.2. Razumijevanje podataka ................................................................. 14

3.1.3. Priprema i pretprocesiranje podataka ............................................. 15

3.1.4. Modeliranje ..................................................................................... 17

3.1.5. Razvoj modela ................................................................................ 18

3.1.6. Problematika evaluacije i ocjene modela ........................................ 20

3.2. Metode rudarenja podataka ................................................................... 23

3.2.1. Struktura algoritama metoda rudarenja podataka ........................... 24

3.2.2. Stabla odlučivanja ........................................................................... 26

3.2.3. Neuralne mreže .............................................................................. 32

4. Metodologija primjene rudarenja podataka u pogonskoj čvrstoći ................. 36

4.1. Potencijalne varijable (atributi) ............................................................... 36

4.1.1. Vijek trajanja ................................................................................... 36

4.1.2. Kriterij otkaza .................................................................................. 36

4.1.3. Čvrstoća materijala ......................................................................... 37

4.1.4. Vrste opterećenja ............................................................................ 37

4.1.5. Naprezanje ...................................................................................... 38

4.1.6. Vrsta materijala ............................................................................... 39

Marko Šušnjar – Doktorska disertacija

viii

4.1.7. Termička i termokemijska obrada ................................................... 40

4.1.8. Strojna obrada ................................................................................ 40

4.1.9. Koncentracija naprezanja – oblik .................................................... 41

4.1.10. Apsolutne dimenzije ........................................................................ 42

4.1.11. Tvrdoća ........................................................................................... 42

4.1.12. Zračenje .......................................................................................... 43

4.1.13. Temperatura ................................................................................... 43

4.1.14. Mehanička obrada .......................................................................... 44

4.1.15. Zaostalo naprezanje........................................................................ 44

4.1.16. Atmosfera ........................................................................................ 45

4.1.17. Korozija ........................................................................................... 45

4.1.18. Međuzavisnost parametara ............................................................. 45

4.2. Razumijevanje podataka ....................................................................... 46

4.2.1. Geometrija i dimenzije uzorka ......................................................... 46

4.2.2. Tipovi pokusa u pogonskoj čvrstoći ................................................ 46

4.2.3. Rezultati pokusa ............................................................................. 46

4.2.4. Koncentratori naprezanja ................................................................ 47

4.2.5. Materijal uzorka .............................................................................. 47

4.2.6. Vrste opterećenja i naprezanje ....................................................... 47

4.3. Priprema i pretprocesiranje podataka .................................................... 51

4.3.1. Analiza varijabli ............................................................................... 51

4.3.2. Priprema uzorka .............................................................................. 52

4.3.3. Pretprocesiranje seta podataka za modeliranje .............................. 53

4.4. Modeliranje, razvoj modela i učenje ...................................................... 54

4.5. Ocjena modela ...................................................................................... 55

5. Razvoj prediktivne metode uz numeričku verifikaciju ................................... 56

5.1. Izvori i izbor podataka ............................................................................ 56

5.2. Priprema podataka ................................................................................ 62

5.3. Pretprocesiranje podataka ..................................................................... 66

5.4. Odabir prediktivnih metoda .................................................................... 69

5.4.1. Preliminarna istraživanja ................................................................. 69

5.4.2. Odabrane metode ........................................................................... 70

Marko Šušnjar – Doktorska disertacija

ix

5.4.3. Algoritam Neuralnih mreža .............................................................. 71

5.4.4. C&RT algoritam .............................................................................. 74

5.5. Modeliranje ............................................................................................ 77

5.5.1. Podjela ulaznih podataka ................................................................ 78

5.5.2. Parametriziranje metoda ................................................................. 81

5.6. Proces učenja ........................................................................................ 87

5.7. Analiza rezultata numeričkog modeliranja ............................................. 88

5.7.1. Naprezanje kao izlazna varijabla .................................................... 88

5.7.2. Broj ciklusa kao izlazna varijabla .................................................... 91

5.8. Diskusija o numeričkoj verifikaciji .......................................................... 95

6. Eksperimentalna verifikacija metode ............................................................ 97

6.1. Pregled uzoraka .................................................................................... 97

6.1.1. Materijal uzorka ............................................................................... 97

6.1.2. Oblik uzorka .................................................................................... 98

6.1.3. Koncentracija naprezanja na uzorcima za dinamičko ispitivanje ... 100

6.1.4. Određivanje koeficijenta koncentracije naprezanja ....................... 103

6.2. Eksperimentalno određivanje vijeka trajanja uzorka ............................ 107

6.2.1. Korištena oprema .......................................................................... 107

6.2.2. Postupak ispitivanja ...................................................................... 108

6.3. Rezultati ispitivanja .............................................................................. 110

6.3.1. Statičko ispitivanje ........................................................................ 110

6.3.2. Dinamičko ispitivanje..................................................................... 111

6.4. Primjena prediktivne metode na rezultate ispitivanja ........................... 118

6.4.1. Ulazni podaci ................................................................................ 118

6.4.2. Uzorkovanje Wöhlerove krivulje .................................................... 119

6.4.3. Rezultati predikcije ........................................................................ 119

6.4. Analiza rezultata predikcije .................................................................. 130

7. Zaključak .................................................................................................... 133

Marko Šušnjar – Doktorska disertacija

x

Popis tablica

Tablica 3.1 Matrica klasifikacije 20

Tablica 4.1 Primjer grupiranja varijabli iz preliminarnih ispitivanja 48

Tablica 5.1 Primjer digitaliziranih podataka iz literature 59

Tablica 5.2 Primjer digitaliziranih podataka iz literature 59

Tablica 5.3 Primjer digitaliziranih podataka iz literature 60

Tablica 5.4 Materijal uzoraka odabranih za numeričku verifikaciju

metoda

61

Tablica 5.5 Pregled strukture podataka 63

Tablica 5.6 Oznake toplinskih obrada 64

Tablica 5.7 Oznake oblika koncentracije naprezanja uzorka 65

Tablica 5.8 Oznake površina uzorka 65

Tablica 5.9 Statistička analiza ulaznih podataka 66

Tablica 5.10 Točke uzorkovanja na Wӧhlerovim pravcima 68

Tablica 5.11 Skupine modela 78

Tablica 5.12 Zajednički atributi validacijskog seta podataka 79

Tablica 5.13 S-N vrijednosti validacijskog seta 80

Tablica 5.14 Prikaz najnižih grešaka postignutih pojedinim skupinama

modela

94

Tablica 6.1 Kemijske karakteristike materijala prema deklaraciji proizvođača

98

Tablica 6.2 Mehaničke karakteristike materijala prema deklaraciji proizvođača

98

Tablica 6.3 Koeficijenti koncentracije naprezanja za uzorke 103

Tablica 6.4 Rezultati statičkog ispitivanja 111

Tablica 6.5 Označavanje uzoraka dinamičkog ispitivanja 112

Tablica 6.6 Rezultati dinamičkog ispitivanja za uzorak S35 R0 112

Tablica 6.7 Rezultati dinamičkog ispitivanja za uzorak S35 R04 113

Tablica 6.8 Rezultati dinamičkog ispitivanja za uzorak S35 R10 113

Marko Šušnjar – Doktorska disertacija

xi

Tablica 6.9 Rezultati dinamičkog ispitivanja za uzorak S45 R0 113

Tablica 6.10 Rezultati dinamičkog ispitivanja za uzorak S45 R04 114

Tablica 6.11 Rezultati dinamičkog ispitivanja za uzorak S45 R10 114

Tablica 6.12 Točke uzorkovanja ciklusa opterećenja Wöhlerovih pravaca

117

Tablica 6.13 Tablični pregled rezultata prediktivne metode za uzorak S35 R0

126

Tablica 6.14 Tablični pregled rezultata prediktivne metode za uzorak S35 R04

126

Tablica 6.15 Tablični pregled rezultata prediktivne metode za uzorak S35 R10

127

Tablica 6.16 Tablični pregled rezultata prediktivne metode za uzorak S45 R0

127

Tablica 6.17 Tablični pregled rezultata prediktivne metode za uzorak S45 R04

128

Tablica 6.18 Tablični pregled rezultata prediktivne metode za uzorak S45 R10

128

Tablica 6.19 Tablični pregled rezultata prediktivnih metoda za uzorak S35 R04

130

Marko Šušnjar – Doktorska disertacija

xii

Popis ilustracija

Slika 1.1 Rezultati isptivanja problema pogonske čvrstoće 1

Slika 2.1 Primjer Wöhlerovih krivulja 11

Slika 3.1 Shematski prikaz CRISP DM metodologije 12

Slika 3.2 Lift krivulja 22

Slika 3.3 Stabla odlučivanja 27

Slika 3.4 Neuron u neuralnim mrežama 32

Slika 3.5 Graf izlazne step funkcije 33

Slika 3.6 Topologija neuralne mreže 34

Slika 4.1 Dijagram promjenjivog opterećenja 37

Slika 4.2 Koeficijent asimetričnosti ciklusa 38

Slika 4.3 Tenzor naprezanja 39

Slika 4.4 Shema prediktivnog modeliranja prilagođena pogonskoj čvrstoći

55

Slika 5.1 Primjeri S-N dijagrama iz literature 57

Slika 5.2 Prikaz numeričkih podataka iz literature 58

Slika 5.3 Wӧhlerovi pravci s vjerojatnošću preživljavanja 67

Slika 5.4 Primjer interpolacije Wӧhlerovih pravaca na eksperimentalnim podacima

67

Slika 5.5 Wӧhlerov pravac validacijskog seta 80

Slika 5.6 Neuralne mreže s jednim skrivenim slojem 82

Slika 5.7 Neuralne mreže s dva skrivena sloja 83

Slika 5.8 Prikaz procesa učenja i propagacije uspješnosti kod neuralnih mreža

87

Slika 5.9 Prikaz razlike rezultata kod seta podataka za učenje i seta za testiranje

87

Slika 5.10 Odnos greške i broja neurona u skrivenom sloju 89

Slika 5.11 Odnos greške i brojeva neurona u 1. i 2. skrivenom sloju 89

Slika 5.12 Model C&RT metode za predikciju naprezanja 90

Slika 5.13 Odnos greške i broja neurona u skrivenom sloju 91

Marko Šušnjar – Doktorska disertacija

xiii

Slika 5.14 Odnos greške i broja neurona u 1. i 2. skrivenom sloju 92

Slika 5.15 Model C&RT metode za predikciju broja ciklusa opterećenja

93

Slika 5.16 Grafički prikaz rezultata predikcijskih modela 94

Slika 5.17 Distribucija broja ciklusa (Nf) u odnosu na opterećenje (Sa) u podacima za modeliranje

96

Slika 6.1 Uzorak za statičko ispitivanje 99

Slika 6.2 Oblik uzorka za statičko ispitivanje 99

Slika 6.3 Uzorak za dinamičko ispitivanje 100

Slika 6.4 Oblik uzorka za dinamičko isptivanje 100

Slika 6.5 Detalj uzorka sa utorom r = 0 mm 101

Slika 6.6 Detalj uzorka sa utorom r = 0,4 mm 101

Slika 6.7 Detalj uzorka sa utorom r = 1 mm 101

Slika 6.8 Utor uzorka nakon strojne obrade, r = 0 mm 102

Slika 6.9 Utor uzorka nakon strojne obrade, r = 0,4 mm 102

Slika 6.10 Utor uzorka nakon strojne obrade, r = 1 mm 102

Slika 6.11 Mreža konačnih elemenata za uzorak r = 0 mm 104

Slika 6.12 Koncetracija naprezanja za uzorak r = 0 mm dobijena metodom konačnih elemenata

104

Slika 6.13 Mreža konačnih elemenata za uzorak r = 0,4 mm 105

Slika 6.14 Koncetracija naprezanja za uzorak r = 0,4 mm dobijena metodom konačnih elemenata

105

Slika 6.15 Mreža konačnih elemenata za uzorak r = 1 mm 106

Slika 6.16 Koncetracija naprezanja za uzorak r = 1 mm dobijena metodom konačnih elemenata

106

Slika 6.17 Umaralica „Instron 8801“ Katedre za konstrukcije, FESB-a Split

107

Slika 6.18 Učvršćeni uzorak u čeljustima umaralice 108

Marko Šušnjar – Doktorska disertacija

xiv

Slika 6.19 Uzorak nakon statičkog isptivanja 108

Slika 6.20 Primjer izgleda loma uzorka nakon dinamičkog ispitivanja 109

Slika 6.21 Diagram sila-pomak statičkog ispitivanja 109

Slika 6.22 Wöhlerov pravac za uzorak S35 R0 115

Slika 6.23 Wöhlerov pravac za uzorak S35 R04 115

Slika 6.24 Wöhlerov pravac za uzorak S35 R10 116

Slika 6.25 Wöhlerov pravac za uzorak S45 R0 116

Slika 6.26 Wöhlerov pravac za uzorak S45 R04 117

Slika 6.27 Wöhlerov pravac za uzorak S45 R10 117

Slika 6.28 Rezultati prediktivne metode za uzorak S35 R0 120

Slika 6.29 Rezultati prediktivne metode za uzorak S35 R04 121

Slika 6.30 Rezultati prediktivne metode za uzorak S35 R10 122

Slika 6.31 Rezultati prediktivne metode za uzorak S45 R0 123

Slika 6.32 Rezultati prediktivne metode za uzorak S45 R04 124

Slika 6.33 Rezultati prediktivne metode za uzorak S45 R10 125

Slika 6.34 Rezultati prediktivnih metoda za uzorak S35 R04 129

Marko Šušnjar – Doktorska disertacija

1

1. Uvod

1.1. O pogonskoj čvrstoći

Potrebne spoznaje o pogonskoj čvrstoći materijala se dobivaju složenim,

dugotrajnim i skupim eksperimentalnim postupcima. Eksperimenti, pored svega

drugoga, zahtijevaju angažman specijalne opreme te znatan rad istraživača [1].

Na slici 1.1. prikazan je tipičan pregled ispitivanja problema pogonske čvrstoće

na zavarenom spoju.

Slika 1.1 Rezultati ispitivanja problema pogonske čvrstoće [1]

Pogonska čvrstoća, kada se odnosi na pojedinačni materijal, predstavlja broj

ciklusa promjene naprezanja koje materijal može izdržati prije loma. Pogonska

čvrstoća, kada se promatra kao grana znanosti, predstavlja složena istraživanja i

Marko Šušnjar – Doktorska disertacija

2

teorijska razmatranja usmjerena pronalaženju optimanih dimenzija svakog

pojedinog dijela konstrukcije. Poddimenzioniranje bilo kojeg dijela vodi njegovu

otkazu i ugrožavanju namjene konstrukcije. Otkaz konstrukcije nerijetko ima

katastrofalne posljedice [2], [3]. Predimenzioniranje, pak, poskupljuje konstrukciju

i izaziva dodatne probleme u smislu njenih gabarita i mase. Pogonska čvrstoća

traži i pronalazi optimalne konstrukcijske parametre.

Pogonska čvrtoća kao grana znanosti utemeljena je sredinom 19. stoljeća kada je

njemački inženjer August Wöhler istraživao lomove osovina na tadašnjim pruskim

željezničkim vozilima [4]. Iako postoje raniji radovi o istraživanju zamora, Wöhler

je prvi sistematski istraživao odnos naprezanja i ciklusa promjene naprezanja

koje materijal može izdržati prije otkaza. S-N krivulje su po njemu i dobile ime

Wöhlerove krivulje [5].

Daljnji razvoj Pogonske čvrstoće ide smjerovima teoretskog i eksperimentalnog

istraživanja. Teoretsko istraživanje se bavi mehanikom loma te ostalim

istraživanjima vezanim uz nastanak i propagaciju pukotine opterećenog

materijala. Eksperimentalna istraživanja idu smjerom standardizacije

karakteristika materijala u smislu pogonske čvrstoće. Definiraju se postupci i

preporuke za dimenzioniranje dinamički opterećenih konstrukcija koje sustavi

standardizacije uvode u svoju regulativu [1].

1.2. O metodama rudarenja podataka

Rudarenje podataka se kao pojam pojavilo prilikom realizacije ideje o

transformiranju podataka u informacije ili još bliže u znanje skriveno u podacima.

Pojam rudarenja podataka (eng. data mining) je danas najpoznatiji i

najprimjenjeniji. Pored njega postoje još vrlo uvriježeni pojmovi koji se mogu

susresti na engleskom govornom području: „knowledge discovery from data

(KDD)“, „knowlege exstraction“, „data/patern analysis“, itd [6].

Marko Šušnjar – Doktorska disertacija

3

U hrvatskom govornom području najbliži termin je „inteligentna analiza podataka“.

U daljnjem tekstu će se koristiti termin „rudarenja podataka“ zbog sličnosti s

uvriježenim engleskim originalnom.

Rudarenje podataka ne predstavlja samo naprednu analizu podataka već

predstavlja nove mogućnosti u vidu predikcije kroz višedimenzionalnu

interpolaciju i ekstrapolaciju koristeći mogućnosti naprednih prediktivnih metoda

[7].

Matematičke osnove o metodama, koje se danas koriste u nečemu što možemo

zvati tehnologijom rudarenja podataka, su postojale prije. Nedostajale su

mogućnosti za njihovu primjenu: dovoljna količina podataka dostupna za analizu

te dovoljno računarske snage da se zahtjevne obrade izvedu u realnom vremenu.

Razvoj rudarenja podataka je vrlo usko povezan s razvojem relacijskih sustava

baza podataka, (eng. Relational database management system RDBMS). Prvi

elemeti su se pojavili 60-ih godina prošlog stoljeća, kada su primitivni oblici

kolekcije podataka u datoteke dobili obrise sistema baza podataka. Godina 1968.

je značajna prekretnica kada tvrtka IBM objavljuje svoj IMS (Information

Management System) [6]. IMS je imao hijerarhijski model podataka gdje su

podaci bili međusobno hijerarhijski povezani. Ranih 70-ih godina prošlog stoljeća,

pojavljuje se IDMS (Integrated Database Nabagenebt System), sustav koji je

imao mrežni model strukture podataka [6], [8]. IMS i IDMS postali su komercijalne

osnove koje su omogućile razvoj sustava baza podataka koji se pojavljuju 80-ih

godina prošlog stoljeća, te njihove evolucije u relacijske sustave baza podataka.

Ocem RDBMS-a se smatra Frank Codd koji je objavom svojih čuvenih 12 pravila

postavio temelje RDBM sustava [8], [9]. Devedesetih godina prošlog stoljeća kao

i u ovom stoljeću, sustavi se neprestano razvijaju te koristeći ekspanziju

mikroprocesorske, te općenito, elektroničke industrije dosežu ogromne

mogućnosti spremanja i manipulacije podacima. Danas u uporabi dominiraju

veliki proizvođači RDBMS sustava koji ih neprestano usavršavaju i izdaju nove

verzije sve većih i većih mogućnosti. Oracle, IBM, Microsoft, Teradata te Sybase

danas dominiraju tržištem [10].

Razvoj RDBM sustava doveo je do mogućnosti procesiranja i spremanja golemih

količina podataka, a kao posljedica toga pojavila se ekspanzija količine

Marko Šušnjar – Doktorska disertacija

4

spremljenih podataka. Podaci koji su prije ispuštani i bili nezabilježeni zbog svoje

količine, sada se zadržavaju i spremaju u sve jeftinije i dostupne repozitorije.

Javlja se problem tzv. „data explosion“, dostupnosti ogromnih količina podataka

[8]. Klasični primjer je telekomunikacijska industrija koja u potpunosti digitalizira

svoje poslovanje te sprema i čuva sve podatke vezane uz komunikaciju njihovih

korisnika. Procesna i mjerna industrija digitalizacijom kontrole procesa te samom

digitalizacijom upravljanja dohvaća nevjerojatne količine podataka koje je sada u

stanju spremati i čuvati.

Upravo je pojava te tzv. eksplozije podataka prekretnica kada su se počeli

pojavljivati alati za iskorištavanje ogromnih količina podataka. Prvi su se pojavili

OLAP sustavi. Online analytical processing (OLAP) sustavi su se pojavili kao

posrednik između prve logičke primjene tako spremljenih podataka i njihovih

korisnika - izvještavanje. Korisnici podataka su htjeli imati sve složenije izvještaje

koji su zahtijevali dohvat i obradu mnogo podataka [11]. Pojavio se problem

vremena potrebnog za obradu koji je premošten OLAP sustavima. Oni u osnovi

unaprijed provode zahtjevne obrade podataka te su u stanju isporučiti izvještaje u

realnom vremenu. Mogućnosti iskorištavanja dostupnih podataka nadmašuju

klasično izvještavanje. Suvremeni procesi svih oblika zahtijevaju kvalitetno i

pravovremeno upravljanje. Klasično izvještavanje, koje u stvari predstavlja „post

mortem“ analizu, ne može udovoljiti zahtjevima. Korisnici postaju svjesni da u

podacima postoji skriveno znanje koje se analititičkim metodama može izvući i

iskoristiti. Otad u uporabu ulazi rudarenje podataka.

Rudarenje podataka se u početku pojavlio u obliku implementacije pojedinih

metoda u posebnim programskim rješenjima. Primjena u početku nije bila

generalizirana već usko specijalizirana. Svaki pojedinačni slučaj se rješavao

programski bez (ili s minimalnom) mogućnosti parametrizacije. Problem

nedostatka generalizacije su najprije prepoznali mali nezavisni proizvođači

softvera. Oni su proizveli su prve softverske proizvode koji su bili u mogućnosti

generalizirati primjenu rudarenja podataka. Obično su se ograničavali na jednu

metodu i njeno parametriziranje. Prva i najpopularnija metoda bile su neuralne

mreže. Veliki proizvođači statističkih analitičkih programskih rješenja i veliki

proizvođači RDBMS sustava uočavaju potencijale te objavljuju svoja rješenja.

Marko Šušnjar – Doktorska disertacija

5

RDBMS sustavi dobivaju integrirane alate za rudarenje podataka koji daju

zavidne performanse (Oracle, Microsoft). Tvrtke SAP i SPSS izdaju posebne

proizvode za rudarenje podataka sa zavidnim mogućnostima. Upravo će se

SPSS-ovo rješenje [12] koristiti u izradi ove doktorske disertacije.

1.3. Dosadašnja istraživanja

Numeričke metode predviđanja vijeka trajanja konstrukcija predmet su značajnog

broja znanstvenih istraživanja. Autori variraju materijale nad kojima rade

istraživanja, dok se kao metode većinom javljaju neuralne mreže sa svojim

varijacijama.

Dosadašnja istraživanja bi se mogla podijeliti u osnovne skupine predviđanja

životnog ciklusa kroz simulaciju S-N krivulje te u skupinu predviđanja ponašanja

materijala kroz propagaciju pukotine i mehaniku loma. Autori su radili s raznim

materijalima te u dosadašnjim istraživanjima dominiraju kompozitni materijali i

aluminijske slitine, kao dominantni materijali u suvremenim konstrukcijama.

Reprezentativan rad kao predstavnik prve skupine prezentirali su Mathur, Gope i

Sharma [13] koji modeliraju predviđanje vijeka trajanja kompozitnih materijala

neuralnim mrežama. Korišteni monotoni ulazni parametri su mehanička svojstva

materijala: vlačna, tlačna i lomna čvrstoća. Parametri opterećenja su kao

apsolutni maksimalno i minimalno naprezanje, te relativni omjer naprezanja.

Korišteni su još i statistički parametri kao što su vjerojatnost loma i statistički

parametri životnog vijeka. Korištene metode su neuralne mreže s dva skrivena

sloja od po 18 i 6 neurona u sloju. Podatke koje su imali su podijelili na način da

je 80% iskorišteno za učenje dok je 20% iskorišteno za test. Numerički rezultati

dobiveni predviđanjem su pokazali vrlo visoku točnost u velikom području, 92%

rezultata ima grešku ispod 5%. Očekivano lošija točnost predviđanja se pokazala

u slučajevima gdje je postojalo jako malo setova podataka za učenje metode.

Mohanty i ostali [14] u svom radu primijenjuju neuralne mreže u modeliranju

propterećenih nosača. Model su eksperimentalno verificirali na aluminijskim

Marko Šušnjar – Doktorska disertacija

6

uzorcima podvrgnutim opterećenju s konstantnim amplitudama. Koristili su vrlo

specifičnu 9 slojnu neuralnu mrežu i postigli točnost od +4% u usporedbi sa

eksperimentalnim rezultatima. Model je pokazao tendenciju precjenjivanja vijeka

trajanja.

Plenue i Chopra [15] su u svom radu modelirali posude pod tlakom od ugljičnog i

nisko legirananog čelika. Ispitivanja su obavljana pod temperaturnim

promjenama, vodenom okruženju s otopljenim kisikom i sumporom. Koristili su

relativno veliki set podataka od 1036 pokusa. Problem je modeliran sa šest

modela i svi su koristili algoritam neuralnih mreža. Rezultati su pokazali uspješno

modeliranje problematike vijeka trajanja materijala u agresivnoj eksploatacijskoj

okolini.

Freire i ostali [16] su u svom radu modelirali S-N krivulje uz varijaciju koeficijenta

asimetričnosti cilusa r. Ispitivanje su obavili na plastičnom materijalu ojačanom

staklenim vlaknima. Napravljeni su eksperimenti na identičnoj opremi na kojoj je

napravljeno ispitivanje ove disertacije. Obavili su ukupno 454 testa te na njihovim

rezultatima napravili modeliranje. Analizirane vrijednosti koeficijenta

asimetričnosti ciklusa su bile: 1.1, 1.43, 2, 10, -2,-1,-0.5,0.1,0.5,0.7,0.8 i 0.9.

Modeliranje su napravili neuralnim mrežama varirajući parametre mreže. Pokazali

su da je za modeliranje ovakvog praktički jednoparametarskog modela potrebno

reducirati broj neurona u skrivenom sloju kako bi se dobio zadovoljavajući

rezultat. Zaključili su da je moguće uspješno generirati S-N krivulje koristeći

metodu neuralnih mreža.

Sohn i Bae [17] su obrađivali točkasto zavarene spojeve. Neuralnim mrežama su

modelirali S-N krivulje točkasto zavarenih uzoraka promatrajući parametre tipa

spoja, maksimalnog opterećenja i uvjeta opterećenja. Specifičnost je u tome što

su uveli kriterije ekonomičnosti u izvedbi spojeva. Njihova metoda je pokazala

vrlo dobre rezultate u usporedbi s analizom metodom konačnih elemenata te

eksperimentalnim rezultatima.

Nekolicina drugih autora je uspješno primijenila neuralne mreže u drugim

područjima predviđanja vijeka trajanja. Li i Ray [18] u dinamici mehanike loma,

Marko Šušnjar – Doktorska disertacija

7

Venkatesh i Rack [19] u temperaturnim promjenama Ni slitina, te Mohanty i ostali

[20] u modeliranju propagacije pukotine, itd.

Dosadašnja istraživanja su se fokusirala na modeliranje problema s variranjem

relativno malog broja parametara u vrlo uskom području primjene. Karakteristika

im je orijentiranost na novije materijale kao što su kompoziti te lake materijale kao

što je aluminij. Bitna uočena karakteristika je fokusiranost istraživača na jednu

vrstu materijala po pojedinom istraživanju.

1.4. Cilj istraživanja

Suvremene numeričke prediktivne metode su u mogućnosti interpolirati

višedimenzionalne modele koje nije moguće opisati standardnim matematičkim

analitičkim metodama [21]. Pogonska čvrstoća materijala je, po svojim fizikalnim

karakteristikama, višedimenzionalan problem. Jedinstveni model međudjelovanja

utjecajnih parametara na materijal u pogonskoj čvrstoći još nije jasno definiran.

Pogonska čvrstoća, ima jasnu potrebu za pronalaženjem metode koja je u

mogućnosti predvidjeti karakteristike materijala numeričkim putem.

Primjenom suvremenih prediktivnih metoda moguće je modelirati problematiku

pogonske čvrstoće. Korištenjem rezultata provedenih pokusa moguće je dobiti

optimalne metode za predviđanje krivulja vijeka trajanja materijala i uzoraka nad

kojima nisu obavljeni pokusi s tim ulaznim parametrima. Na taj način moguće je

ostvariti predikciju odnosa opterećenja i vijeka trajanja materijala, što predstavlja

pogonsku čvrstoću materijala.

Cilj istraživanja je razviti i verificirati prediktivnu metodu koja će koristeći podatke

dostupnih eksperimentalnih ispitivanja na drugim materijalima biti u stanju odrediti

pogonsku čvrstoću materijala za koji nije obavljeno eksperimentalno ispitivanje.

Pored metode, cilj je postaviti i metodologiju modeliranja problematike pogonske

čvrstoće prediktivnom metodom.

Marko Šušnjar – Doktorska disertacija

8

2. Pogonska čvrstoća

Vijek trajanja komponenti je jedan od temeljnjih konstrukcijskih izazova. Cilj je

utvrditi ili predvidjeti koliko će konstrukcija ili njena komponenta izdržati prije nego

što dođe do njezina zamora i konačnog otkaza. Proračun vijeka trajanja se može

obaviti na nekoliko načina. Dva su osnovna pristupa prema Palmgren-Minerovoj

hipotezi [1]: koncept lokalnih naprezanja i lokalnih deformacija. Oba koncepta

traže poznavanje podataka o pogonskom opterećenju, konstrukcijskom obliku te

ostalim karakteristikama konstrukcijskog materijala.

2.1. Vrste opterećenja

Opterećenje je jedan od najutjecajnijih faktora na vijek trajanja konstrukcije.

Kompleksnost opterećenja predstavlja poseban problem jer je potrebno

aproksimirati stvarno pogonsko opterećenje u mjerljivom i ponovljivom obliku.

Tipovi opterećenja se opisuju prema sljedećoj podjeli [1], [5].

- Statičko opterećenje koje podrazumijeva konstantno, nepromjenjivo

opterećenje kojem je podvrgnut pojedini element konstrukcije.

- Dinamičko opterećenje koje ima osnovnu karakteristiku promjenu u

vremenu. Ovisno o karakteristikama eksploatacije ono može biti uniformno

u obliku jednoobraznih periodičnih promjena (ciklusa) ili kompleksnih

promjena (spektra opterećenja).

- Pogonsko opterećenje predstavlja stvarno opterećenje kojem je

podvrgnuta konstrukcija ili pojedini njeni elementi. Spada u grupu

kompleksnih dinamičkih opterećenja i u biti predstavlja složeni oblik

dinamičkog optrećenja. Pogonsko opterećenje se razlučuje na svoje

komponente osnovnog opterećenja i dodatnog opterećenja. Osnovno

opterećenje se sastoji od statičkog dijela kao što je težina same

konstrukcije i dio opterećenja koje ovisi o funkciji elementa konstrukcije

(promjena položaja uslijed rada...). Dodatno opterećenje ima dva osnovna

Marko Šušnjar – Doktorska disertacija

9

elementa. Predvidivo opterećenje koje nastaje kao slijed pojedinačnih

eksploatacijskih radnji (kočenje, manevri, ubrzanje, zakretanje...).

Nepredvidivo opterećenje predstavlja promjenjivo dinamičko opterećenje

uslijed nepredvidivih eksplatacijskih događaja (dinamički udari...).

Složenost opterećenja je potrebno uobličiti na neki način pogodan za

kategorizaciju i eksperimentalne uvjete. Razvijene su metode brojenja

opterećenja [1], [5]. Njihovom primjenom na stvarno opterećenje pomoću mjernih

uređaja dobiva se slika o stvarnim uvjetima pod kojima pojedini elementi

konstrukcija rade.

Metode brojenja su statističke u osnovi i temelje se na brojenju pojedinih

elemenata ciklusa. Broji se: vrijeme provedeno na pojedinom nivou opterećenja,

vrhovi između prolaza odabranog nivoa, parovi predjela, „rain flow“ metoda ...

Statističkom obradom podataka se iz rezultata brojenja dobivaju spektri

opterećenja koji vjerno prikazuju stvarno pogonsko opterećenje.

Detaljnije o opterećenju u konkretnoj primjeni opisano je u poglavlju 4.1.4.

2.2. Konstrukcijski oblik

Konstrukcijske karakteristike obuhvaćaju skupinu parametara vezanu uz oblik i

veličinu konstrukcije i elementa koji se analizira. Svaki od njih ima određeni

utjecaj na vijek trajanja. Grupirani su u kategorije: geometrija, dimenzije, kvaliteta

površine ili hrapavost, koncentracija naprezanja, itd.

Detaljnije su opisani u poglavlju 4.1.

2.3. Karakteristike materijala

Karakteristike materijala predstavljaju skupinu parametara koji potječu iz svojstva

samog materijala te njegove obrade i imaju utjecaj na vijek trajanja konstrukcije.

Marko Šušnjar – Doktorska disertacija

10

Kategorije su pored same vrste materijala, zaostala naprezanja, čvrstoća

materijala, itd.

Detaljnije su opisani u poglavlju 4.1.

2.4. Uvjeti eksploatacije

Uvjeti eksploatacije su opterećenje, okoliš, korozija, temperatura, itd.

Detaljnije su opisani u poglavlju 4.1.

2.5. Eksperimentalna ispitivanja

Utvrđivanje vrijednosti izdržljivosti materijala pod određenim naprezanjem može

se napraviti samo eksperimentalnim putem. Za svaki materijal, koji se koristi u

dinamički opterećenim konstrukcijama, potrebno je utvrditi odnos naprezanja i

broja ciklusa opterećenja. Ispitivanja se provode u kontroliranim uvjetima na

servo-hidrauličnim uređajima s numerički kontroliranim opterećenjima, poznatim

kao umaralice.

Ispitivanja se dijele na područja čvrstoće niskog broja elasto-plastičnih

deformacija (n < 5·104 ciklusa opterećenja), područja čvrstoće ograničenog vijeka

(5·104 ≤ n ≤ 2·106 ciklusa opterećenja) te područja trajne dinamičke čvrstoće (n >

2·106 ciklusa opterećenja) [5]. Elasto-plastična ispitivanja se provode s

konstantnim amplitudama i frekvencijom manjom od 5 Hz. Sva ostala ispitivanja

su u elastičnom području materijala i provode se sa spektrima opterećenja i

relativno visokim frekvencijama promjene opterećenja (5 – 50 Hz) radi

optimiziranja vremena trajanja pojedinog ispitivanja.

Svrha ispitivanja je dobivanje S-N (Wöhlerovih) krivulja. Krivulje se dobivaju

statističkom obradom rezultata. Prisutno je značajno rasipanje, stoga je potrebno

osigurati dovoljan broj ispitivanja za svaku razinu kako bi se dobio statistički

relevantan podatak. Eksperimentalno dobivanje Wöhlerovih krivulja je dugotrajan

i skup proces [1], [5]. Ovisno o njihovoj namjeni bira se i broj pokusa po razini

Marko Šušnjar – Doktorska disertacija

11

opterećenja. Za istraživačke svrhe se dopušta manji broj ispitivanja po razini dok

je za sve ostale svrhe potreban značajan broj od 12-24 ispitivanja za svaku

razinu [22 ]. Primjer krivulje koja prikazuje ovisnost vijeka trajanja o naprezanju u

polulogaritmičnom mjerilu dan je na slici 2.1. Na osi apscise je prikazan odnos

trajne dinamičke čvrstoće i naprezanja. Ordinata prikazuje broj ciklusa u

logaritamskom mjerilu.

Slika 2.1 Primjer Wöhlerovih krivulja [23]

Marko Šušnjar – Doktorska disertacija

12

3. Rudarenja podataka

3.1. Metodologija rudarenja podataka

Metodologija rudarenja podataka obuhvaća cjelokupan proces od analize

problema na koji će se primijeniti rudarenje podataka sve do primjene. U

suvremenoj primjeni se CRISP DM (Cross Industry Standard Process for Data

Mining) postavio kao de facto standardna metodologija za rudarenje podataka.

CRISP DM predstavlja prikaz svih bitnih procesa prilikom rješavanja određenog

problema [24].

Slika 3.1 Shematski prikaz CRISP DM metodologije [24]

Metodologija se sastoji od nekoliko definiranih cjelina ili postupaka koje je

potrebno obaviti za uspješno modeliranje problema. Rudarenje podataka je, zbog

svoje relativne mladosti u znanosti i području praktične primjene, prilično

nestandardizirano i šaroliko u načinima i procedurama svoje primjene. CRISP DM

Marko Šušnjar – Doktorska disertacija

13

je nastao kao posljedica referentno uspješnih primjena rudarenja podataka i

iskustva znanstvenika [24].

Metodologija sama po sebi ne predstavlja iskoristivi oblik rudarenja podataka za

konkretan problem. Metodologija predstavlja princip kako doći do uspješnog

modeliranja problema. Terminološki će se metodologija koristiti za opis principa

dok će se prediktivna metoda koristiti kao termin za iskoristivi oblik konkretne

primjene rudarenja podataka.

3.1.1. Razumijevanje područja primjene

Razumijevanje područja primjene podrazumijeva analizu problema koji se

modelira metodama rudarenja podataka [25]. Potrebno je ekspertno sagledati

problematiku te se upoznati sa svim raspoloživim atributima koji opisuju područje

primjene. Pritom problem treba razumjeti iz perspektive ograničenja u njegovu

rješavanju i cilja koji se želi postići.

U procesu razumijevanja problematike definiraju se svi raspoloživi atributi koji

mogu biti opisani raspoloživim podacima. Svaki atribut ima svoju važnost u

problematici, stoga je u ovom koraku bitno otkriti utjecajne atribute na konačni

rezultat modeliranja te ih posebno istaknuti kako bi se u daljnjim postupcima

ispravno tretirali.

Atributi se analiziraju, te se definira njihova uloga kako deskriptivna tako i

prediktivna. Ovisno o prirodi problema koji se modelira pojedini atribut se može

pojaviti u obje uloge.

U pogonskoj čvrstoći se kao primjer može uzeti broj ciklusa preživljavanja uzorka

pod određenim opterećenjem. Pri tome je opterećenje deskriptivni atribut, a broj

ciklusa prediktivni. Problem se može postaviti i drugačije tako da se predviđa koje

opterećenje može uzorak podnijeti uz uvjet da minimalno izdrži određeni broj

ciklusa. U ovom slučaju su uloge atributa obrnute, opterećenje postaje prediktivni

a broj ciklusa deskriptivni.

Pored same prirode atributa potrebno je poznavati i njihovu međuzavisnost. Ona

je nužna za pravilno interpretiranje rezultata, pogotovo ako se kao rezultat

Marko Šušnjar – Doktorska disertacija

14

rudarenja podataka očekuju pravila koje pojedine metode mogu dati. U postupku

razumijevanja problematike potrebno je definirati i kriterije uspješnosti. Pri čemu

kriterij može biti kvalitativni ili subjektivni. Kvalitativni kritetij se može postaviti u

apsolutnom i relativnom obliku. Subjektivni kriteriji uspješnosti su ekspertno

mišljenje i obično sadržavaju mogućnost nekog novog i korisnog uvida u odnose

atributa koji opisuju problem.

3.1.2. Razumijevanje podataka

Razumijevanje podataka predstavlja proces razumijevanja strukuture podatka te

njihovo povezivanje s atributima koji su definirani u procesu razumijevanja

područje primjene [25], [6]. Prvi korak je stvarno prikupljanje podataka i njihovo

dovođenje u formu koju je moguće iskoristiti. Podaci su obično smješteni u RDBM

sustavu koji se izvorno sastoji od tablica i njihovih relacija. U relacijskom načinu

organiziranja podataka opisi su obično raspršeni po tablicama, stoga se u

procesu razumijevanja podataka defninraju načini dohvata podataka. Dohvat

može biti uobličen u SQL („Structured Query Language“) programske naredbe, u

programske definicije uvjeta dohvata podataka („WHERE“ uvjet SQL

programskog jezika) ili tehnički opis u kojem se nalaze podaci koji opisuju pojedni

atribut.

Prilikom opisa podataka potrebno je utvrditi njihov volumen te identitet i značenje

pojednih atributa. Pored opisa podataka potrebno je definirati i njihove izvore.

Izvori su uobičajeno RDBM sustavi, međutim mogu biti i svi drugi oblici

spremanja digitalnih zapisa. Moguće je koristiti i tzv. streamove, odnosno

kontinuirane izvore podataka.

Pored navedenih postupaka u procesu razumijevanja podataka bitno je napraviti i

verifikaciju kvalitete podataka. Kontrolom kvalitete podataka definiraju se

poboljšanja i ispravci koji bitno utječu na kasniju kvalitetu rezultata pokusa

modeliranja. Pri tome je potrebno odrediti konzistentnost podataka s obzirom na

vrijednost i tip atributa. Najčešće pojave su primjeri s neodređenim vrijednostima

(„missing values“) pojedinih atributa te primjeri s vrijednostima pojedinih atributa

koje odskaču („outliers“) [25].

Marko Šušnjar – Doktorska disertacija

15

Šum u podacima je jako važna karakteristika koju je potrebno utvrditi u procesu

razumijevanja podataka. Pritom treba utvrditi karakteristiku šuma. Potrebno je

utvrditi je li šum predstavlja grešku u podacima ili rijedak fenomen. Neke od

tehnika modeliranja su vrlo osjetljive na pojavu šuma, nedostajućih i odskačućih

vrijednosti pa je poželjno takve primjere posebno tretirati prije samog procesa

modeliranja [26].

3.1.3. Priprema i pretprocesiranje podataka

Priprema i pretprocesiranje podataka je proces prilagodbe ulaznih podataka

procesu modeliranja [25], [26]. Tijekom ovog procesa se podaci obrađuju s ciljem

da se konsolidiraju te osiguraju poboljšanje i jednostavnost procesa rudarenja

podataka. Postupak sadrži i odabir podskupa podataka koji zadovoljavaju kriterije

kvalitete te tehnička ograničenja. Kvaliteta podataka podrazumijeva odabir setova

podataka koji su kompletni, ispravni sa što manje ili bez nedostajućih vrijednosti.

Pri tome se mogu i isključiti atributi koji imaju nedostajuće podatke u većem broju

setova. Tehnička ograničenja se uglavnom odnose na volumen podataka,

odnosno na eventualno ograničenje modeliranja u smislu mogućnosti

procesiranja velikog volumena podataka. Postupci pripreme podataka su sljedeći

[25], [26]:

- Sumarizacija podataka predstavlja koncizni opis karakteristika podataka u

elementarnoj ili agregatnoj formi koji daje pregled strukture podataka.

- Čišćenje podataka predstavlja procese pripreme podataka za samo

modeliranje. Sadržava mnogo tehnika i postupaka kao što su:

- Normalizacija podataka, radi kvalitetnijeg postupka modeliranja i

prilagodbe samim metodama rudarenja podataka vrijednosti atributa je ponekad

potrebno normalizirati. Primjeri su normalizacija na vrijednost standardne

devijacije pojedinog atributa ili postavljanje na interval vrijednosti.

- Zamjene vrijednosti, predstavlja tretman atributa s nedostajućim

vrijednostima („missing values“). Tretiraju se oni atributi koji moraju ostati u

procesu modeliranja. Postupak zamjene se može obaviti na nekoliko raznih

Marko Šušnjar – Doktorska disertacija

16

načina ali ni jedan nije u potpunosti korektan i predstavlja postupak koji se mora

nevoljko napraviti („nužno zlo“). Primjeri načina su sljedeći:

- zamjena vrijednosti sa srednjom vrijednosti atributa,

- zamjena vrijednosti sa srednjom vrijednosti te klase atributa,

- zamjena vrijednosti sa konstantnom, „reprezentativnom“ vrijednosti,

- interpolacija nekom od numeričkih interpolacijskih metoda.

Sve zamjene vrijednosti su u principu netočne te predstavljaju potencijalnu

opasnost da modeliranje odvedu u krivom smjeru, odnosno da setovi podataka

budu krivo usmjereni („biased“). Kao moguće kvalitetnije rješenje pojavljuje se

korištenje prediktivnih metoda za pronalaženje nedostajućih vrijednosti.

- Redukcija podataka predstavlja smanjivanje broja setova atributa koji će

se koristiti u procesu modeliranja. Razlozi za redukciju su preobimnost podataka

za modeliranje ili trajanje modeliranja. Problem metoda redukcije je njihova

nesavršenost i stalna opasnost degradacije kvalitete ulaznih podataka za

modeliranje. Najčešće su kandidati za redukciju atributi koji su u prethodnim

analizama pokazali neizražajnost, odnosno pokazali su se slabim prediktorom ili

su redundantni s nekim izražajnim atributom. Tehnike redukcije su uglavnom

bazirane na statističkim metodama:

- odabir na osnovi distribucijskih pokazatelja, kao što je srednja

vrijednost i standardna devijacija,

- korištenje metode analize osnovnih komponenti za odbacivanje

redundantnih atributa („principal component analysis“),

- spajanje više atributa u jedan uz transformacijske postupke

(linearne i nelinearne).

- Konstrukcija novih podataka predstavlja kombinacije postojećih atributa u

nove atribute. Kombinacijom se stvara njihova međuzavisnost, linearna ili

nelinearna, te je kao takvu treba i interpretirati u procesu modeliranja. Takvi novi

atributi se nazivaju izvedene ili derivirane varijable u procesu modeliranja.

Marko Šušnjar – Doktorska disertacija

17

Konstrukcija novih podataka se najčešće obavlja kombinacijom postojećih

atributa, stvaranjem novih primjera, transformacijom atributa, spajanjem

(„merging“) različitih entiteta, agregacijom atributa, statističkim izvedenicama, itd.

- Integracija i transformacija predstavljaju manipulaciju s podacima koja se

provodi nakon čišćenja podataka. Odnosi se na akcije koje se provode na

izvorima podataka u smislu konsolidacije na istu platformu. Primjer je učitavanje

podataka iz više pročišćenih izvora u jednu jedinstvenu platformu (obično

RDBMS). Prilikom integracije podaci se transformiraju u oblik pogodan za

modeliranje ili daljnju obradu (numerički tipovi, preciznost, karakter varijable u

numeričke, datumske u numeričke i sl. ).

- Diskretizacija, formatiranje i hijerarhijska organizacija podataka, glađenje

podataka, („data smoothing“) predstavlja skupinu postupaka koji prethode samom

modeliranju. Njihovo provođenje ovisi o metodi ili metodama koje će se koristiti.

Ukoliko metoda zahtijeva, atributi sa kontinuiranim vrijednostima se diskretiziraju i

stavljaju u razrede. Broj i širina razreda se određuje iskustveno ili

eksperimentalno. Setovi podataka se slažu u određene redoslijede ili pak u

potpunosti randomiziraju. Glađenje predstavlja jedan oblik diskretizacije pogotovo

za neke logičke metode. Ovi postupci su usko vezani sa samim modeliranjem te

su uvijek sastavni dio iteracija cijelog postupka. Promjena metode ili načina njene

parametrizacije neminovno uvjetuje provođenje ovih postupaka.

3.1.4. Modeliranje

Modeliranje predstavlja postupke odabira i primjene prediktivnih metoda [6], [25],

[26]. Kao ključni element se pojavljuje odabir predikcijske metode (ili metoda)

koje će se primijeniti na određeni problem. U današnje vrijeme je dostupno

mnogo kvalitetnih algoritama prediktivnih metoda. Algoritimi su primijenjeni u

mnogim gotovim programskim alatima, stoga je fokus problematike modeliranja

pomaknut sa samog programiranja algoritma u programski kôd, na problematiku

kvalitetnog odabira metode te njezina mapiranja na konkretan problem. Alati za

modeliranje su postali rapidni s dobrim korisničkim sučeljem koje omogućava

konkretno modeliranje s više metoda istodobno te usporedbu rezultata. Pored

Marko Šušnjar – Doktorska disertacija

18

toga moguće je i serijsko modeliranje primjenjujući više metoda uzastopno. Kao

najizazovniji pristup pojavljuje se i kombinacija paralelnog i serijskog modeliranja

[27].

Kod odabira metode (ili metoda) treba razlučititi karakteristiku problema koji se

modelira, radi li se o deskriptivnom ili prediktivnom modeliranju. Odabir metode

se zasniva na karakteristici problema.

Postoje metode koje mogu zadovoljiti i oba svojstva, predikcije i deskripcije, kao

što su stabla odlučivanja ili sistemi za indukciju pravila. Metode će biti detaljnije

opisane u sljedećim poglavljima.

- Predikcijske metode: Neuralne mreže, Metode regresije, Stabla odlučivanja,

Metoda najbližih susjeda.

- Deskripcijske metode objedinjuju više podskupina metoda.

- Klasifikacijske metode: Stabla odlučivanja, Neuralne mreže, Metode

induciranja pravila, Metoda najbližih susjeda, Rasuđivanja na bazi

prethodnih slučajeva.

- Analize međuovisnosti i otkrivanje veza: Regresijska analiza,

Korelacijska analiza, Asocijativna pravila, Bayesove mreže, Metoda

induktivnog logičkog programiranja.

- Segmentacijske metode: Cluster analiza, Neuralne mreže.

3.1.5. Razvoj modela

Prvi korak razvoja modela je podjela uzorka na testni i uzorak za treniranje

metode [6], [25], [26]. Set podataka namijenjen modeliranju je potrebno razdvojiti

na dva dijela. Prvi dio je set podataka namijenjen učenju modela ili „training set“,

dok je drugi dio namijenjen testiranju modela, odnosno provjeri točnosti. Ovom

prilikom se definira i procedura za testiranje i provjeru kvalitete i točnosti modela

koji će se generirati. Ocjena točnosti je vrlo osjetljivo područje koje često izaziva

probleme pri interpretaciji. Procjenu točnosti treba prilagoditi željenom cilju

modeliranja.

Marko Šušnjar – Doktorska disertacija

19

Prilikom podjele seta jako je važno da ona bude temeljena na slučajnom uzorku.

Ne smije postojati nikakva zavisnost između testnog seta i seta za učenje.

Slučajnost je bitna i prilikom uzorkovanja seta, ukoliko se reducira broj primjera.

Bilo kakav odabir „reprezentativnog seta“ predstavlja put u loše modeliranje te

pretpostavku postizanja velike greške modela.

Omjer podjele dostupnog seta je različit od slučaja do slučaja. Uobičajena

polazišna vrijednost je: 2/3 ukupnog seta se odvaja na set za učenje, dok se 1/3

odvaja u set za testiranje i provjeru pouzdanosti modela [26]. Ako je ostvaren

uvjet nezavisnosti onda testni set predstavlja simulaciju realne primjene.

Sljedeći korak u procesu modeliranja je generiranje modela [6], [25], [26].

Generiranje modela slijedi nakon odabrane metode (ili metoda) te nakon što je

set podataka podijeljen na testni i set za učenje. Metode predikcije su visoko

prametrizirane te je odabir pravilnih parametara jedan od ključnih elemenata

uspješnosti modeliranja, odnosno generiranja modela. Proces generiranja

modela je iterativni proces u kojem se traži optimalna kombinacija parametara

metode. Set podataka za učenje u kombinaciji sa setom za testiranje omogućava

proces iteracije te njegovu konvergenciju modelu s optimalnim setom

parametara.

Rezultat procesa generiranja modela mora biti pored optimalne parametrizacije i

njegov opis koji ovisi o tipu metode koja se koristila. Npr. neuralne mreže moraju

imati topologiju, broj skrivenih slojeva, broj neurona u svakom od slojeva itd.,

stabla odlučivanja u opisu sadrže i eventualno „rezanje“ grana itd.

Model se ocjenjuje u odnosu na prethodno definirane kritertije (najčešće je to

točnost modela). Rezultati se provjeravaju na setu za testiranje i tako se dobiva

tehnička provjera. Pored toga provjerava se smislenost modela, odnosno

objašnjava se odluka o konačnim parametrima metode. Ako model ne zadovolji

ocjenu, postupak se iterativno vraća na generiranje modela u blažem slučaju, dok

se u onom težem vraća na proces odabira metode. U procesu ocjene potrebno

je izbjeći česte greške modeliranja. Najčešća je „over fitting“ ili prekomjerna

specijalizacija modela. Model u tom slučaju jako dobro klasificira slučajeve iz seta

za učenje, dok loše klasificira slučajeve iz seta za testiranje.

Marko Šušnjar – Doktorska disertacija

20

3.1.6. Problematika evaluacije i ocjene modela

- Evaluacija klasifikacijskih modela

Kod klasifikacijskih tipova problema osnovna greška je pogrešna klasifikacija.

Model može set podataka klasificirati u pogrešnu klasu ciljnog atributa. Evaluacija

greške se obavlja stavljanjem u omjer pogrešnih klasifikacija u odnos s ukupnim

brojem slučajeva („error rate“). Ukoliko se radi o greškama iste težine tada se

slučaj može tretirati linearno tako da se promatraju omjeri grešaka i traže načini

za njihovu minimizaciju. Problem se javlja kod grešaka različitih težina kada treba

posebno tretirati greške koje imaju veći ponder [26]. Primjer je greška metode

koja klasificira manju izdržljivost uzorka, u odnosu na grešku koja precijeni

izdržljivost uzorka i klasificira veću izdržljivost od stvarne. U realnom svijetu ove

greške imaju značajno različitu interpretaciju i posljedice.

Usporedba rezultata klasifikacijskih metoda se vrši preko tzv. „matrice grešaka“.

[25] Matrica grešaka prikazuje odnos točno klasificiranih primjera i onih koji su

pogrešno klasificirani u neku od drugih klasa. Dijagonala matrice predstavlja

točno klasificirane primjere dok su svi oni izvan dijagonale pogrešni.

U praksi se klasifikacijske metode najviše koriste za klasifikaciju dvije klase.

Većina se klasifikacijskih metoda s više klasa može prikazati kao niz problema s

dvije klase. Primjer su razine opterećenja koje uzorak može izdržati. Klasifikacija

se može primijeniti na to da li će pojedini uzorak s određenim setom ulaznih

parametara (materijal, opterećenje, koncetracija naprezanja,...), izdržati određeni

broj ciklusa opterećenja, ili ne. Matrica klasifikacije prikazana je u tablici 3.1.

Tablica 3.1 Matrica klasifikacije

Klasa pozitivnih

primjera (C+)

Klasa negativnih

primjera (C-)

Pozitivna predikcija (R+) Stvarno pozitivni (TP) Lažno pozitivni (FP)

Negativna predikcija (R-) Lažno negativni (FN) Stvarno negativni

(TN)

Marko Šušnjar – Doktorska disertacija

21

U ovom slučaju moguća su dva tipa grešaka: lažno pozitivni (FP) i lažno negativni

primjeri (FN).

Klasična točnost kao mjera za evaluaciju modela nije dobra jer ima ključne

nedostatke u vidu zanemarivanja tipova grešaka jer jednako tretira pozitivne i

negativne greške. Pored toga točnost je zavisna distribuciji klasa u skupu

podataka a ne o karakteristikama primjera.

U pogonskoj čvrstoći u kojoj je bitan tip pogreške može se primijeniti metrika koja

razlikuje pozitivne i negativne greške.

Senzitivnost predstavlja točnost pozitivnih primjera dok specifičnost predstavlja

točnost negativnih primjera [28].

����������� = ���� + ��(3.1) ��������� = ���� + ��(3.2)

U slučaju kada je broj True Positive (TP) mali u odnosu na True Negative (TN),

koriste se mjere odziva („recall“) i preciznosti [28].

����� = ���� + ��(3.3) ��������� = ���� + ��(3.4)

- Lift krivulja

Lift krivulja predstavlja mjeru kvalitete modela koja je još kvalitetnija od

senzitivnosti i specifičnosti [26]. Mjera se u literaturi naziva i ROC analiza

(„Receiver Operating Characteristic“) [6], [25], [26], [27]. Primjenom ove mjere se

mogu uspoređivati dva ili više klasifikacijskih modela preko širokog spektra

pouzdanosti.

Marko Šušnjar – Doktorska disertacija

22

Slika 3.2 Lift krivulja

Model je pouzdaniji i kvalitetniji što je njegova krivulja bliža lijevoj i gornjoj osi.

Idealan model bi imao krivulju koja bi se poklapala s lijevom i gornjom osi

dijagrama. Na slici 3.2 je prikazana lift krivulja iz konkretne primjene neuralnih

mreža na autorovim projektima.

Krivulje točnosti pokazuju koliki bi trebao biti uzorak iz ukupnog seta podataka da

bi se dobio određeni postotak ciljanog seta podataka. Statistički je to 50% bez

ikakve primjene metode (plava linija na slici 3.2). Na konkretnom primjeru sa slike

3.2, metode daju rezultate koji su jako uspješni u prvom dijelu dijagrama. Vidljivo

je da bi za dobivanje 60% ciljnog seta bilo potrebno uzeti samo nekoliko

postotaka iz sveukunog seta, naravno onih koje metoda predvidi.

- Procjena težine greške

Tipična analiza broja grešaka FP i FN nije dovoljna već je potrebno i ponderirati

svaki tip grešaka. Sumiranjem ponderiranih grešaka dobiva se tzv. trošak

klasifikacije („misclassification cost“) [26]. Ponderiranje u pogonskoj čvrstoći se

može pokazati na primjeru precjenjivanja vijeka trajanja koji zasigurno ima puno

veći ponder ili „težinu“ greške nego podcjenjivanje vijeka trajanja. Precjenjivanje

izaziva katastrofalne posljedice u vidu šteta dok podcjenjivanje izaziva uglavnom

ekonomske štete u smislu povećanja troškova proizvodnje.

Marko Šušnjar – Doktorska disertacija

23

Kod klasifikacije sustava sa n klasa ukupan trošak klasifikacije se može prikazati

kao [28]:

��� = !"#�"#$

#%&

$

"%&(3.5)

Gdje je E broj grešaka po ij, a C ponder vezan uz grešku tipa ij.

Kod procjene težine greške uzima se u obzir i eventualni „dobitak“ koje donosi

točna klasifikacija. Dobici, također, imaju svoj pozitivan ponder. Sumiranjem

rezultata točnih klasifikacija s pozitivnim ponderima i grešaka s njenim negativnim

ponderima dobiva se ukupna „vrijednost“ modela. Ovakav način obrade

vrijednosti modela se koristi u ekonomskim teorijama korisnosti kod kalkulacije

rizika. Postupak nije primjenjiv na problematiku pogonske čvrstoće. Stoga će se u

daljnjem radu koristiti isključivo penalizacija grešaka bez računanja pozitivnih

pondera točnih klasifikacija.

3.2. Metode rudarenja podataka

U današnje vrijeme deseci algoritama su uobličeni u komercijalno upotrebljive

metode rudarenja podataka. Još više ih ima koji se koriste u istraživačke svrhe.

Svima im je zajedničko da su u stanju napraviti mapiranje „znanja“ skrivenog u

podacima u nekakav oblik funkcijskog preslikavanja [25].

Dvije skupine metoda koje po prirodi svojih algoritama imaju najviše perspektive

za uporabu u Pogonskoj čvrstoći su neuralne mreže i stabla odlučivanja.

Neuralne mreže su skupina metoda koja je najviše korištena u dostupnoj

literaturi. Karakteristika im je da jako dobro modeliraju probleme Pogonske

čvrstoće s vrlo velikom točnošću. Nedostatak metode je da nije u stanju dati

nikakava pravila, odnosno iz gotovih modela nije moguće izvući znanje već čisto

preslikavanje u obliku predikcije.

Marko Šušnjar – Doktorska disertacija

24

Stabla odlučivanja su odabrana zbog svoje karakteristike da se mogu izvući

pravila iz generaliziranog modela. Za samu Pogonsku čvrstoću pravila su od

izuzetne važnosti, stoga bi upotreba stabala odlučivanja bila korisna.

Obje metode koriste učenje s nadgledanjem („supervising learning“) [25], [26], te

se metodama s drugim tipovima učenja u pogonskoj čvrstoći ovaj rad neće baviti.

Klasifikacija i predikcija su načini na koji metode mapiraju rezultate modeliranja.

Klasifikacija daje izlazne rezultate u diskretiziranom obliku. Prema tome, izlazne

varijable kod klasifikacije mogu biti numeričke i opisne varijable. Predikcija kao

izlazne rezultate daje kontinuirane vrijednosti, stoga je vrlo interesantna za

pogonsku čvrstoću u smislu predviđanja broja ciklusa opterećenja konstrukcije.

Problem je u točnosti predikcije koja je u problematici s malim brojem primjera

upitna. Problemi u ovom radu bit će modelirani na oba načina kako bi se

pokazala njihova primjena u metodologiji primjerenoj pognoskoj čvrstoći.

3.2.1. Struktura algoritama metoda rudarenja podataka

Metode koje se koriste za modeliranje svoje porijeklo vuku iz raznih područja

poput statistike, obrade signala, strojnog učenja, umjetne inteligencije,

evolucijskog programiranja, itd. [6], [25], [26]. Zajednička im je karakteristika da

automatski generiraju modele iz setova podataka. Struktura metoda je

međusobno prilično slična, te se može podijeliti na tri funkcionalno povezane

komponente [28]:

- Funkcionalni oblik modela

Funkcionalni oblik modela predstavlja matematički način reprezentacije

modela. Matematički se model može prikazati kao funkcija preslikavanja

y=f(x,P).

x predstavlja vrijednosti pojedinih atributa iz setova ulaznih podataka

P predstavlja parametre koji definiraju specifični model na koji se

preslikavanje odnosi

Karakteristike funkcionalnog oblika modela su:

Marko Šušnjar – Doktorska disertacija

25

o Utjecaj na format ulaznih podataka (logički, numerički, karakter,...)

o Razumljivost reprezentacije modela

o Aproksimacija linearnih i nelinearnih ovisnosti u podacima

o Konačni oblik modela

- Kriterij kvalitete aproksimacije

Kriterij kvalitete aproksimacije predstavlja interni kriterij kvalitete procjene

modela s obzirom na aproksimaciju odnosa među varijablama. Ovo nije

kriterij ocjene točnosti konačnog modela već ocjena kvalitete konstrukcija

različitih instanci funkcije preslikavanja y=f(x,P).

Karakteristike se bitno razlikuju od metode do metode i ovise o

funkcionalnom obliku modela i metoda pretraživanja, a mogu se

generalizirati na sljedeće:

o Osjetljivost i robusnost na dimenzionalnost problema (broj atributa i

setova podataka, te broj instanci funkcije preslikavanja f)

o Tip kriterija (probabilistički, logički)

- Metoda pretraživanja

Metoda pretraživanja predstavlja algoritam koji kontrolira pretraživanje n

dimenzionalnog prostora svih mogućih instanci funkcije preslikavanja f, uz

zadani funkcionalni oblik modela, koristeći se kriterijem kvalitete

aproksimacije. U osnovi tehnike modeliranja su optimizacijski algoritmi.

Karakteristike metoda pretraživanja su u biti iste kao kod optimizacijskih

algoritama:

o Osnovni način pretraživanja,

� heuristički,

� gradijentni,

� „greedy“ algoritmom.

Marko Šušnjar – Doktorska disertacija

26

o Kompleksnost pretraživanja ,

� optimizacija parametara P,

� dodatna petlja po različitim strukutrama modela.

o Kontrola procesa pretraživanja,

� Kriterij za zaustavljanje pretraživanja.

3.2.2. Stabla odlučivanja

Metode rudarenja podataka koje spadaju pod zajedničku skupinu stabla

odlučivanja omogućuju modeliranje i predikcijskih i klasifikacijskih problema [6],

[25], [26]. Vrlo su popularne i moćne metode. Karakteristika im je da se modeli

mogu interpretirati u razumljivom obliku. Iz modela je moguće izvući pravila koja

su potpuno razumljiva u smislu problematike koje model opisuje. Pravila je

moguće iskoristiti u ekspertnom ili istraživačkom smislu. Mogu se pak koristiti u

nekom od jezika za rad s bazama podataka (SQL), te integrirati u druge poslovne

ili istraživačke cjeline. Stabla odlučivanja se koriste obavezno u slučajevima kada

je potrebno da generirani modeli budu čitljivi ekspertima iz domene problema i

kada je potrebno izvući znanje sadržano u podacima. Mogućnost čitanja pravila

je dodana vrijednost pored same točnosti klasifikacije ili predikcije, stoga će se

stabla odlučivanja koristiti u modeliranju problema Pogonske čvrstoće u ovom

radu.

Na slici 3.3 je shematski prikazan algoritam stabla odlučivanja. Struktura

algoritma je stablasta otkuda i dolazi naziv metode. Čvorovi su međusobno

povezani granama, pri čemu se razlikuju dva tipa čvora.

Marko Šušnjar – Doktorska disertacija

27

Slika 3.3 Stabla odlučivanja

- Krajnji čvor („leaf node“) je onaj čvor kojim završava određena grana

stabla. Krajnji čvorovi predstavljaju klasu kojoj pripadaju setovi podataka

koji su zadovoljili uvjete na toj grani stabla

- Čvor odluke („branch node“) predstavlja čvorište u kojem se vrši grananje

na osnovi vrijednosti određenog atributa. Grane koje izlaze iz čvora odluke

predstavljaju usmjeravanje zadovoljenja uvjeta određene vrijednosti

atributa prema drugom čvoru.

Princip rada algoritma je da se kretanjem od prvog čvora prema krajnjima

primjer klasificira na osnovi vrijednosti njegovih atributa u određenu klasu

problema. Primjena stabla odlučivanja zahtijeva sljedeće [6], [28]:

- Set podataka mora sadržavati konačan broj parova atribut (varijabla) –

vrijednost

- Klasa (vrijednost ciljnog atributa) moraju biti konačnog broja i prethodno

definirana

Marko Šušnjar – Doktorska disertacija

28

- Klase moraju biti diskretne, znači da svaki primjer mora pripadati samo

jednoj od predefiniranih klasa

- Klasa mora biti znatno manje nego primjera

- Set podataka mora imati značajan broj primjera

Kao svaka druga metoda i stabla odlučivanja imaju svoj proces stvaranja i

korištenja za klasifikaciju i/ili predikciju.

- Stvaranje stabla odlučivanja

Osnovni algoritam stabla odlučivanja je ID3 algoritam razvijen od J. Ross

Quinlana [29] baziran na Concept Learning System (CLS) algoritmu [28].

Algoritam radi tako da pretražuje sve atribute seta podataka i pronalazi atribut

koji najbolje odvaja primjere određene klase. Ako pronađe zadovoljavajuće

razdvajanje zaustavlja se, ako ne, rekurzivno traži razdvajanje na

podskupovima. Pri tome podskupova može biti onoliko koliko ima mogućih

vrijednosti atributa. Traži „najbolje“ atribute za razdvajanje podskupova.

Alogiram je tzv. „greedy“ tipa, znači da nikad ne gleda unatrag radi provjere

ispravnosti izbora atributa, već traži trenutno najbolji atribut. Zato se mogu

dobiti pogrešne klasifikacije na primjerima za učenje.

Ključni dio algoritma je odabir atributa za stvaranje čvora odlučivanja, znači

atributa koji služi za grananje stabla. Potrebno je pronaći atribut koji je

najupotrebljiviji za tu svrhu. Za kriterij upotrebljivosti ili kvalitete atributa uzima

se statistička vrijednost zvana „information gain“ odnosno informacijski

dobitak. Informacijski dobitak se koristi za odabir najboljeg kandidata u

svakom grananju. Kao mjera informacijskog dobitka koristi se entropija koju

teorija informacija definira kao čistoću nekog skupa primjera.

!�����(() = ∑ −�"+�,-�".&%& (3.6)

Gdje je:

c broj vrijednosti koje poprima ciljni atribut

Marko Šušnjar – Doktorska disertacija

29

S – skup nad kojim se traži entropija

Pi – proporcija klase u skupu S

Entropija ima karakteristiku dosizanja maksimalne vrijednosti log2C.

Interpretacija entropije bi se mogla sažeti u tome da ona specificira minimalni

broj bitova informacija koji je potreban da se kodira klasifikacija iste [28].

Informacijski dobitak se sada može izračunati za atribut na osnovi njegove

entropije odnosno „nečistoće“. Dobitak se računa kao redukcija entropije

nakon razdvajanja primjera na osnovi tog atributa. Informacijski dobitak

atributa A u odnosu na skup primjera S, Gain (S,A) je definiran kao:

01��(�, 3) = !�����((�) − |�5||�|5∈789:;<(=)!�����((�5)(3.7)

Values(A) - skup svih mogućih vrijednosti atributa A

Sv - podskup od S za koji atribut A ima vrijednost v

Sv = {s, S | A(s) = v}

Entropy (S) – entropija originalnog skupa S

Drugi član jednadžbe je očekivana vrijednost entropije nakon razdvajanja skupa

S atributom A.

Za svaki čvor odlučivanja ponavlja se proces odabira novog atributa i razdvajanja

primjera te se pri tome koriste samo oni primjeri koji pripadaju čvoru za koji se

radi grananje. Svi primjeri korišteni prije tog čvora su isključeni iz daljnjeg

odabira. Iz navedenog je jasno da se primjeri mogu samo jednom pojaviti na

određenoj strani čvora. Grananje na nekom čvoru se zaustavlja ako je na

određenom čvoru zadovoljen jedan od kriterija:

- Svi atributi su već bili iskorišteni u toj grani stabla

- Svi primjeri koji pripadaju tom čvoru su u istoj klasi, te je entropija tog

primjera jednaka nuli

Marko Šušnjar – Doktorska disertacija

30

Problemi pri modeliranju metodama stabla odlučivanja

- „Over-fitting“ podataka

Algoritam stabla odlučivanja u stanju je točno generirati sve primjere iz seta

podataka za učenje. Podaci sami po sebi nisu savršeni te imaju u sebi „šum“ ili

njihov uzorak nije dovoljno velik da reprezentira ukupnu populaciju koja se

modelira. Algoritam u tom slučaju generira stablo koje pretjerano dobro („over-

fitting“) aproksimira odnose u podacima. „Over-fitting“ je velika poteškoća pri

primjeni stabala odlučivanja. Stoga su pronađena rješenja za izbjegavanje ovih

problema [6], [26]:

o Zaustavljanje procesa grananja prije nego što se postigne savršena

klasifikacija primjera iz seta za učenje

o „prunning“ ili rezanje grana prema prethodno definiranom kriteriju

nakon što se generira stablo koje savršeno klasificira primjere

Upravo ovaj drugi princip se u praksi pokazao uspješnijim te će se koristiti

prilikom generiranja modela za problematiku pogonske čvrstoće.

Korištenjem bilo koje od prethodne dvije tehnike, zaustavljanja grananja ili

rezanja stabla, potrebno je odrediti optimalnu kompleksnost stabla. Za tu

svrhu koriste se sljedeće tehnike [6],[26],[28]:

o Uspješnost skraćivanja stabla se verificira na posebnim

validacijskim primjerima koji nisu bili dio primjera kojima se gradilo

stablo

o Koristi se poseban statistički test na čvorovima koji su kandidati za

skraćivanje. Testovi pokazuju eventualnu uspješnost skraćivanja.

o „Minimum Description Lenght“ – eksplicitna mjera kompleksnosti,

koja zaustavlja rast stabla kada je taj kriterij zaustavljen.

Najčešća tehnika je pristup s validacijskim setom podataka.

Marko Šušnjar – Doktorska disertacija

31

- Kontinuirani atributi

Temeljni algoritam stabla odlučivanja ID3 je ograničen na atribute s diskretnim

vrijednostima. Proizilazi to iz postavki algoritma o konačnom ograničenom

broju klasa (kategorija), nadalje atributi koji se testiraju u čvorovima i računa

im se gain moraju imati diskretne vrijednosti [26].

Diskretizacija kontinuiranih atributa sama po sebi nije problem i nju je relativno

lako napraviti podjelom atributa u razrede. Problem je kako odrediti granice

razreda u koji se smještaju vrijednosti atributa. Problem je u određivanju

vrijednosti c koja će nam dati najveći informacijski dobitak (“Gain“). Postoji

metoda koja je zasnovana na dokazu da vrijednosti c koje maksimiziraju Gain

uvijek leže na granicama intervala koji se dobiju sortiranjem primjera prema

vrijednosti atributa te identificiranjem susjednih primjera koji pripadaju

različitim klasama ciljnog atributa. Tada se može generirati skup vrijednosti c

u sredini intervala vrijednosti atributa za svaka dva susjedna primjera.

Drugi način diskretizacije je ekspertna diskretizacija u kombinaciji s iterativnim

postupkom.

- Nedostajuće vrijednosti („missing values“)

Jedan od najčešćih problema je nedostatak pojedinih vrijednosti atributa u

primjerima. Postoje mnoge tehnike interpolacije. Niti jedna nije u potpunosti

ispravna i tretiraju se kako je već navedeno kao “nužno zlo“ [26].

Najučinkovitija metoda se pokazala nadomještanje nedostajućih vrijednosti

atributa s njegovom najfrekventnijom vrijednosti [26].

- Prednosti i nedostaci metoda Stabla odlučivanja

Prednosti metode:

o Jasno određuju važnost pojedinih atributa u svakom konkretnom

predikcijskom problemu.

o Mogu koristiti sve tipove atributa.

o Generiraju razumljive modele.

Marko Šušnjar – Doktorska disertacija

32

o Relativno mali zahtjevi prema resursima za računanje.

Nedostatci metode

o Griješe u višeklasnim problemima koji imaju manji broj primjera za

učenje.

o Problematika rezanja i sortiranje kandidata za testiranje u

čvorovima je zahtjevna.

o Nisu pogodne za klasifikaciju problema u kojima su razredi klasa

omeđeni nelinearnim krivuljama.

3.2.3. Neuralne mreže

Naziv im potječe iz medicinske inspiracije – mozga. Temeljene su na neuronu

kao osnovnom elementu mreže te njegovoj povezanosti s ostalim neuronima u

mreži, analogija je s građom ljudskog mozga s neuronima i sinapsama kao

vezama. Međusobno su povezani vezama tako da je izlaz iz jednog ujedno ulaz u

sljedeći neuron. Svaki neuron ima više ulaza i samo jedan izlaz.

- Neuron

Neuron predstavlja preslikavanje n ulaznih na jednu izlaznu vezu, prikazan

na slici 3.4.

Slika 3.4 Neuron u neuralnim mrežama

x 1

x 2

x 3

x n

w i1

w in

w i2

w i3

S a = S w xi ij j j

n

f

y = f (a ) i

Marko Šušnjar – Doktorska disertacija

33

Na ulaznom dijelu preslikavanja koje se dešava u neuronu su ulazne vrijednosti

x1,x2,...xn, a izlazna vrijednost je samo jedna y. Sve vrijednosti bilo one ulazne ili

izlazne su kontinuirane. Preslikavanje se sastoji iz dva dijela [28].

Prvi dio je sumiranje produkata težina svake veze te njene vrijednosti.

Drugi dio je sumiranje s vrijednošću praga („treshold“).

( = � ? @"A" − �$

"%&B(3.8)

wi – težinski faktori svake pojedine veze i

T – vrijednost praga

Izlazna funkcija neurona je sigmoidalna funkcija kao na slici 3.5

Slika 3.5 Graf izlazne step funkcije

Izlazna vrijednost iz svakog neurona predstavlja ulaznu u sljedeći, koji opet ima

svoj težinski faktor za tu vezu. Prilikom procesa učenja se vrijednosti težina wi

mijenja, te je konačan rezultat optimalan set težinskih faktora grana mreže i

vrijednosti praga T svakog neurona.

- Topologija

Postoji jako mnogo topologija Neuralnih mreža od kojih je višeslojni Percepton

najpoznatija i najviše u upotrebi [6]. U višeslojnim perceptonima su neuroni

grupirani u slojeve. Prvi sloj se ujedno naziva i ulazni sloj, prima ulazne

Marko Šušnjar – Doktorska disertacija

34

vrijednosti u mrežu. Broj neurona u ulaznom sloju jednak je broju ulaznih atributa

čije vrijednosti služe za klasifikaciju. Zadnji sloj se još naziva i izlazni sloj,

prezentira izlazne rezultate klasifikacije. Izlazni sloj ima onoliko neurona koliko se

klasificira izlaznih varijabli. Između ulaznog i izlaznog sloja se nalaze skriveni

slojevi neurona. Broj skrivenih slojeva, te broj neurona u njima, određuje se

prilikom samog procesa modeliranja te se unaprijed zadaje prije samog procesa

učenja.

Slika 3.6 Topologija neuralne mreže

- Učenje

Učenje neuralne mreže predstavlja optimizaciju težinskih faktora. Postoji više

metoda učenja, od kojih je metoda nadziranog učenja, najčešća [26].

U samom procesu učenja se primjeri iz seta podataka za učenje koriste jedan po

jedan. Za svaki primjer se računaju izlazne vrijednosti mreže te uspoređuju sa

željenom izlaznom vrijednosti. Zatim se težinski faktori wi i vrijednosti praga T

mijenjaju proporcionalno veličini greške koju su prouzročili u izlaznoj vrijednosti.

Marko Šušnjar – Doktorska disertacija

35

Back-propagation je metoda propagacije greške unatrag kojom se iterativno

greške šire na unutarnje slojeve mreže i u njima koriste za optimizaciju težinskih

faktora veza među neuronima [26].

- Primjena

Primijenjuju se kod težih problema na kojima ostale metode ne daju dobre

rezultate. U stanju su dobro klasificirati probleme s velikim brojem slučajeva.

Relativno se dobro nose sa problemima ostalih metoda kao što je „over fitting“ i

nedostajuće vrijednosti. Visoko su tolerantne na šum u podacima. Interesantne

su za modeliranje problema o kojima nema ili je jako malo ekspertno znanje.

Nedostatak metode je nemogućnost tumačenja pravila, pošto je sva

generalizacija skrivena u vrijednostima parametara težinskih funkcija. Proces

učenja je vrlo zahtjevan s pozicije računarskih resursa. U usporedbi sa stablima

odlučivanja odnos je 100 do 1000 puta više računskih operacija [26].

Marko Šušnjar – Doktorska disertacija

36

4. Metodologija primjene rudarenja podataka u pogonskoj čvrstoći

4.1. Potencijalne varijable (atributi)

Pokusi u Pogonskoj čvrstoći se provode standardnim postupkom tako da se za

određeni uzorak s određenom obradom od određenog materijala pod određenim

uvjetima i promjenjivim opterećenjem dobiju rezultati u obliku vijeka trajanja (broj

ciklusa opterećenja do loma). Svi unaprijed određeni atributi predstavljaju ulazni

set podataka koji se ispitivanjem preslikava na rezultate. Prilikom modeliranja

pokusa prediktivnim metodama svi ti atributi predstavljaju potencijalne varijable.

Kako su parametri heterogeni u smislu načina njihova definiranja, mogu biti opisni

(mehanička obrada, termokemijska obrada,...) ili numerički (vijek trajanja,

temperatura,...) [41]. Svaki atribut se posebno tretira te mu se način prikaza

prilagođava u trenutku kada postaje varijabla u procesu modeliranja prediktivnim

metodama.

4.1.1. Vijek trajanja

Vijek trajanja u laboratorijskim uvjetima predstavlja broj ciklusa koje uzorak izdrži

prije otkaza. Vijek trajanja je numerička varijabla u slučaju kada je kriterij otkaza

dosegnut pri isptivanju. Ispitivanja se za svaki primjer pojedinačno obavljaju dok

se ne dosegne jedan od dva kriterija: kriterij otkaza ili maksimalan broj ciklusa za

pojedino ispitivanje. Vijek trajanja kao varijabla je najčešće ona koja se klasificira

ili se na njoj radi predikcija pa je potrebno napraviti pažljivu prezentaciju

predikcijskim metodama. Diskretizacija odnosno svrstavanje u razrede daje veću

garanciju točnosti ali traži pažljiv izbor intervala ili razreda broja ciklusa.

4.1.2. Kriterij otkaza

Kriterij otkaza predstavlja stanje uzorka za koje se smatra da prestaje biti

funkcionalan. Najčešći i najjasniji kriterij otkaza je lom uzorka. Svi ostali tipovi

Marko Šušnjar – Doktorska disertacija

37

kriterija otkaza ovise o materijalu koji se ispituje. Kompozitni materijali, legure,

različiti ljevovi mogu imati različite kriterije otkaza.

4.1.3. Čvrstoća materijala

Karakteristike materijala pri statičkom vlačnom opterećenju su bitne varijable kod

modeliranja prediktivnim metodama. Pogotovo mogu biti korisne ako se problem

može modelirati s metodama koje omogućuju izvlačenje pravila. Najvažnije

potencijalne varijable su: vlačna čvrstoća, granica razvlačenja i Poissonov

koeficijent.

4.1.4. Vrste opterećenja

Promjenjivo opterećenje se parametrizira kako bi se parametri mogli upotrijebiti u

procesu modeliranja predikcijskim metodama.

Slika 4.1 Dijagram promjenjivog opterećenja

Pod promjenjivim opterećenjem podrazumijevamo uzastopno djelovanje vanjskih

sila promjenjive veličine i predznaka. Promjena intenziteta i predznaka sila se

aproksimira sinusoidom na kojoj se temelje sljedeći parametri, slika 4.1:

o Maksimalno naprezanje σmax

Marko Šušnjar – Doktorska disertacija

38

o Minimalno naprezanje σmin

o Srednje naprezanje ciklusa σE = FGHIJFGKL-

o Amplituda ciklusaσa = Nσmax+σmin2 N o Koeficijent asimetričnosti ciklusa� = ST��ST1A o Karakteristika ciklusa U = VWVX

Slika 4.2 Koeficijent asimetričnosti ciklusa

Pored promjenjivog opterećenja moguće je koristiti i konstantno opterećenje ili

statičko opterećenje ako se ono pojavljuje kao atribut. Konstantno statičko

opterećenje se smatra posebnim slučajem promjenjivog opterećenja

σmax = σmin = σm, r = +1.

4.1.5. Naprezanje

Naprezanje po svojoj definiciji predstavlja unutarnje sile otpora razdvajanja

materijala i uvijek je izraženo u obliku kontinuirane varijable [MPa].

Stanje naprezanja u točci opterećenog konstrukcijskog elementa se opisuje

tenzorom [23]

YS"#Z = [S\\ S\] S\^S]\ S]] S]^S^\ S^] S^^_ = [

S\ `\] `\^`]\ S] `]^`^\ `^] S^ _

Marko Šušnjar – Doktorska disertacija

39

Slika 4.3 Tenzor naprezanja

- Vrste opterećenja

o Osno ili aksijalno (vlačno ili tlačno)

o Smicanje

o Savijanje

o Uvijanje

o Izvijanje

4.1.6. Vrsta materijala

U suvremenoj praksi izgradnje konstrukcija koristi se mnogo materijala koji su

podvrgnuti dinamičkom opterećenju.

Najzastupljeniji je čelik različitih vrsta. Od najjeftinijih običnih ugljičnih čelika,

preko čelika za cementiranje pa sve do čelika za poboljšavanje koji se koristi za

dinamički jako napregnute elemente. Svaka od podvrsta čelika može biti legirana

ili ne.

Marko Šušnjar – Doktorska disertacija

40

Razne vrste lijevova se koriste za dinamički opterećene konstrukcije. Poglavito za

nosive elemente (kućišta, ležišta, postolja,...). Sivi lijev ima najlošiju dinamičku

izdržljivot. Temper lijev ima nešto višu dinamički izdržljivost, do čelični lijev ima

najvišu.

Slitine lakih metala Al i Mg dominiraju konstrukcijama koje zahtijevaju malu

specifičnu težinu. Pored njih u novije vrijeme značajnu ulogu imaju polimeri i

kompozitni materijali [1], [5].

Vrsta materijala je bitna varijabla pri predikcijskom modeliranju. Pri tome je

potrebno uključiti kemijski sastav kako bi se osiguralo da metoda „prepozna“

eventualno utjecajne parametre, pogotovo ako se koristi metoda koja omogućava

izvlačenje pravila.

4.1.7. Termička i termokemijska obrada

Stanje površina strojnih elemenata kao i uzoraka, ima značajnu ulogu u njihovoj

dinamičkoj izdržljivosti. Inicijalne pukotine kao početni stupanj umora materijala

najviše se registriraju upravo na njihovoj površini. Termičkim i termokemijskim

procesima se mijenjaju karakteristike površine i time utječe na pojavu inicijalnih

pukotina, a samim time i na dinamičku izdržljivost [2].

Najčešće tehnike obrade površine su nitriranje i cementiranje. Obje tehnike imaju

svoje parametre koji utječu na rezultat njihove primjene te ih je bitno uključiti u

proces modeliranja prediktivnim metodama.

Diskretizacija i apstrahiranje vrijednosti su u ovim slučajevima jako poželjni,

poglavito kada se radi o temperaturama obrade ili sastavu kupki u procesu

nitriranja.

4.1.8. Strojna obrada

Strojna obrada manifestriana kroz hrapavost površine je dokazano utjecajna na

dinamičku izdržljivost materijala. Mikro koncetracija naprezanja i zaostala tlačna

naprezanja izazivaju smanjenje, odnosno povećanje vijeka trajanja pod

Marko Šušnjar – Doktorska disertacija

41

dinamičkim opterećenjem [23]. Strojna obrada se može karakterizirati opisno kao

brušenje, tokarenje, glodanje... ili preko vrijednosti hrapavosti površine.

Hrapavost se uobičajno izražava prema vrijednostima srednje hrapavosti (Ra) i

najveće hrapavosti (Rmax), obje izražene u µm [23].

U konstrukcijskoj praksi se pad dinamičke izdržljivosti zbog hrapavosti izražava

faktorom kvalitete stanja površine ζ1 , pri čemu je ζ1 ≤ 1.

4.1.9. Koncentracija naprezanja – oblik

Dinamička čvrstoća materijala se smanjuje svakom promjenom oblika i površine

presjeka elementa. Koeficijent koncetracije naprezanja KF definira se kao [30]:.

Kb = σc8\σ$dc (4.1) gdje je σEef maksimalno naprezanje, a σghE nominalno naprezanje.

Koeficijent je u funkciji oblika, materijala, toplinske i mehaničke obrade,

površine...

Pored koeficijenta koncentracije naprezanja definiran je i teorijski koeficijent

koncentracije naprezanja KT. On opisuje odnos maskimalnog naprezanja prema

nazivnom naprezanju na mjestu diskonuiteta i uvjetovan je samo geometrijom

elementa. Dobiva se analitičkim, eksperimentalnim ili numeričkim putem.

ρ – predstavlja vezu između gornja dva koeficijenta prema Thumu [1], [5].

U = ij − 1ik − 1(4.2) Sa stajališta modeliranja potrebno je sve raspoložive varijable uzeti u obzir. Kako

je koncentracija naprezanja vrlo značajan element koji utječe na dinamičku

izdržjivost potrebno je sva tri parametra koristiti u modeliranju, naravno ukoliko je

njihova vrijednost poznata.

Marko Šušnjar – Doktorska disertacija

42

4.1.10. Apsolutne dimenzije

Apsolutne dimenzije imaju utjecaj na trajnu dinamičku čvrstoću materijala. Pristup

problematici njihovih uobličavanja u varijable pogodne za prezentaciju

predikcijskim metodama može biti klasičan preko koeficijenata. Primjer je

konstrukcijski koeficijent koji predstavlja omjer trajnih dinamičkih čvrstoća između

uzorka koji se promatra i standardnog laboratorijskog uzorka [31].

lm = Sn&,opSn&,o > 1(4.3) Gdje je :

Sn&,o– trajna dinamička čvrstoća pri simetričnom ciklusu za element promjera

d

σ-&,sp- trajna dinamička čvrstoća pri simetričnom ciklusu laboratorijskog

sličnog uzorka promjera do=7-10mm

Interpretacija koeficijentima je svakako dobar izbor. Kako postoji nelinearnost

između dimenzija, oblika i dinamičkih karakteristika materijala uputno je više

koeficijenata koristiti kao varijable u procesu modeliranja.

Pored prikazanog koeficijenta trajnje? dinamičke čvrstoće može se koristiti i

koeficijent dimenzija koji stavlja u omjer same dimenzije uzorka.

4.1.11. Tvrdoća

Tvrdoća je svojstvo materijala koji se protivi prodiranju stranog tijela u njegovu

strukturu ili površinu. Tvrdoća je statička varijabla koja može biti korisna pri

modeliranju ako se modelira više vrsta materijala unutar jednog seta podataka.

Sva četiri načina određivanja tvrdoće mogu biti prikazana kao vrijednosti varijabli

[23].

- Tvrdoća prema Vickersu (HV)

Marko Šušnjar – Doktorska disertacija

43

- Tvrdoća prema Rockwellu (HRc, HRb)

- Tvrdoća prema Brinellu (HB)

- Tvrdoća prema Shoru (HS)

4.1.12. Zračenje

Zračenje može biti raznih oblika. Od običnog sunčevog zračenja, preko termičkog

pa sve do nuklearnog. Ovisno o materijalu njegov utjecaj je različit. U pojedinim

kombinacijama može značajno utjecati na dinamička svojstva materijala.

Najjednostavniji je primjer plastičnih materijala pri termičkom zračenju.

Uzima li se u obzir zračenje pri modeliranju potrebno je svakako odvojiti tip

zračenja te njegov intezitet. Diskretizacija inteziteta zračenja je poželjna pri

modeliranju.

4.1.13. Temperatura

Sobna temperatura je osnovna temperatura na kojoj se mjeri izdržljivost

materijala. Ako se javlja kao varijabla bitno ju je staviti u korelaciju s materijalom

koji se ispituje.

Čelik se konkretno relativno jednolično ponaša do 3000 - 4000 C. Daljnjim rastom

temperature svojstva mu se snižavaju. Slično je i pri niskim temperaturama ispod

00 C. Snižavanjem temperature se čak i povećava dinamička izdržljivost dok

padaju druga svojstva kao što je žilavost te raste osjetljivost na koncentraciju

naprezanja [32].

Na samom primjeru čelika je jasno da temperatura može biti utjecajna varijabla te

je kao takvu treba uzeti u obradu. Vrijednosti temperature se mogu diskretizirati u

razrede ili uzimati u apsolutim veličinama. Provodi li se diskretizacija treba

poznavati svojstva materijala te paziti da se granice razreda odaberu s obzirom

na kritične temperature.

Marko Šušnjar – Doktorska disertacija

44

4.1.14. Mehanička obrada

Primjenom mehaničke obrade može se povećati čvrstoća materijala te granica

razvlačenja materijala. Nije zanemariv niti njen utjecaj na trajnu dinamičku

čvrstoću jer se plastičnom deformacijom materijala unose zaostala tlačna

naprezanja koja uzrokuju umanjenje ili čak poništavanje zaostalih vlačnih

naprezanja [1], [5]. Na taj način se smanjuje ukupno zaostalo naprezanje koje

utječe na dinamičku čvrstoću komponenti i konstrukcija.

Mehanička obrada je u ovakvim slučajevima hladno deformiranje kovanjem,

valjanjem, prešanjem, čekičanjem, sačmarenjem, rolanjem, protrnjivanjem, itd.

Pored same obrade promatraju se i dodatni parametri, kao štosu: njen intezitet,

vrijeme ili neka druga mjera njene primjene.

Uključivanje mehaničke obrade kao varijable u modeliranje problematike

potrebno je napraviti tako da se za svaki set podataka numerički definira

postojanje i tip mehaničke obrade.

4.1.15. Zaostalo naprezanje

Zaostalo naprezanje je značajan parametar stanja konstrukcije. Iz dosadašnjih

istraživanja je poznato da jako utječe na čvrstoću konstrukcija. Njegov utjecaj na

zavarene konstrukcije pod dinamičkim opeterećenjem može dosezati do 70%

razlike u dinamičkoj izdržljivosti [32].

Očito je da njegova veličina značajno utječe na procjenu vijeka trajanja

konstrukcije. Način na koji se zaostalo naprezanje može uključiti u modeliranje

ovisi isključivo o tome kako se ono interpretira. Rijetkost je da je poznata njegova

apsolutna vrijednost već se uglavnom iskazuje relativno unutar cijelog seta

ulaznih parametara za pokuse.

Apsolutno ili relativno iskazivanje zaostalog naprezanja za uzorke čiji se rezultati

ispitivanja koriste za modeliranje potrebno je svesti na numerički oblik koji je

jednoznačan za sve setove podataka jednog modeliranja.

Primjer je postotak zaostalog naprezanja u odnosu na trajnu dinamičku čvrstoću.

Marko Šušnjar – Doktorska disertacija

45

4.1.16. Atmosfera

Atmosfera pod kojom se vrši ispitivanje može biti različita. Najčešći oblici su zrak i

vakuum. Pored njih ispitivanja se izvode i u inertnoj atmosferi, kao što je

argonska te u atmosferama kao što su vodik i dušik.

Kompleksnost ispitivanja u različitim atmosferskim uvjetima obično se mijenja u

diskretnom obliku te se na takav način može i numerički prikazati.

4.1.17. Korozija

Neželjeno razaranje materijala uzrokovano kemijskim utejcajima okoline

predstavlja koroziju. Korozija utječe na dinamičku izdržljivost materijala. Intenzitet

utjecaja ovisi o agresivnosti korozije i vremenu njezina djelovanja [33].

Korozija se dijeli prema mehanizmu procesa na kemijsku koroziju (korozija u

neelektrolitima) te na elektrokemijsku koroziju (korozija u elektrolitima).

Prema geometrijskom obliku korozija može biti opća, lokalna, selektivna i

interkristalna.

Ovakve podjele se teško mogu jednoznačno odrediti te je pogodnija uvriježena

podjela na mehaničke faktore, faktore materijala te faktore okoline.

Ukoliko su neki od tih faktora poznati mogu se uključiti kao varijabla u modeliranju

koristeći diskretizaciju njihovih veličina.

4.1.18. Međuzavisnost parametara

Složenost ponašanja materijala u kontekstu konstrukcije i eksploatacije

neminovno dovodi do međuzavisnosti nekih od parametara iz opisanih skupina.

Međuzavisnosti su uglavnom poznate na teorijskoj osnovi, ali se njihovi odnosi ne

mogu jednostavno odrediti niti matematički opisati. Modeliranje prediktivnim

metodama ima prednost da međuzavisnosti nije potrebno poznavati za uspješno

modeliranjre. Metode u svojim algoritmima imaju ugrađeno indirektno

prepoznavanje zavisnosti. Stoga nije potrebno dodavati nove atribute koji bi

opisivali međuzavisnosti postojećih.

Marko Šušnjar – Doktorska disertacija

46

4.2. Razumijevanje podataka

Razmijevanje podataka kao dio prediktivne metodologije predstavlja procjenu

načina na koji se mogu postojeći rezultati pokusa iskoristiti za predikciju u

pogonskoj čvrstoći. Potrebno je za svaki poznati parametar pokusa procijeniti

upotrebljivost u prediktivnom procesu.

4.2.1. Geometrija i dimenzije uzorka

Ulazni podaci koji opisuju geometriju uzorka, kao što su apsolutne dimenzije,

imaju se smisla koristiti u prediktivnom modeliranju samo onda kada imamo više

geometrijski različitih uzoraka čiji su podaci testiranja dostupni. U tom slučaju

potrebno je dimenzije apstrahirati ovisno o tome što se modelom želi postići. Ako

se radi o klasifikaciji i kao prediktivna varijabla se koristi karakteristika oblika, tada

je potrebna razina apstrakcije u vezi s oblikom.

Primjer je modeliranje uzoraka različitih dužina i širina. Kao prediktivna varijabla

se odabire odnos dužine i širine.

4.2.2. Tipovi pokusa u pogonskoj čvrstoći

Načini provođenja pokusa i njihova namjena određuju strukutru podatatka. Pokusi

su zbog svoje složenosti često ograničeni nekim od parametara. Izvode se pokusi

s uzorcima od samo jednog materijala ili se izvode pokusi s određenim

opterećenjem ili tipom opterećenja i sl. Svako od tih ograničenja parametara

predstavlja eliminaciju cijelog seta varijabli iz procesa modeliranja. Konkretno,

kada se rade pokusi s uzorkom od samo jednog materijala sve potencijalne

varijable o materijalu postaju konstante i nemaju smisla biti uključene u proces

modeliranja.

4.2.3. Rezultati pokusa

Vijek trajanja iskazan u broju ciklusa je najčešći tip izlaznih podataka, odnosno

rezultata pokusa. Vijek trajanja stoga predstavlja najinteresantniju varijablu

Marko Šušnjar – Doktorska disertacija

47

klasifikacijskog i predikcijskog kandidata. Tipičan predikcijski scenarij je dobivanje

broja ciklusa koje bi uzorak izdržao u slučaju varijacije neke ulazne varijable za

koju nisu provedeni pokusi.

4.2.4. Koncentratori naprezanja

Ako se isti koncentratori naprezanja pojavljuju u svim uzorcima čiji se podaci

koriste za modeliranje, nije ih kao varijablu potrebno uzeti u obradu. Ako se, pak,

razlikuju među uzorcima, potrebno ih je uvrstiti u varijable modeliranja jer je

njihov značaj dokazano veliki. Apstrahiranje koncentratora je potrebno i može se

izvesti korištenjem standardnog koeficijenta koncentracije naprezanja postoji li

mnogo različitih koncentratora.

4.2.5. Materijal uzorka

Uzorak ima mehanička i kemijska svojstva koja se mogu koristiti kao varijable u

procesu modeliranja. Njihovo korištenje ima smisla samo ako u setu podataka

postoji više uzoraka različitih materijala. Radi li se o jednom materijalu, njihovo

korištenje nema smisla. U ovu skupinu spadaju podaci o kemijskom sastavu,

tvrdoći i čvrstoći materijala.

4.2.6. Vrste opterećenja i naprezanje

Opterećenje je najpromjenjivija varijabla u svakom setu podataka dostupnom za

modeliranje. Priroda eksperimenata u Pogonskoj čvrstoći je takva da se

variranjem opterećenja pronalaze granice izdržljivosti materijala. Prilikom

modeliranja potrebno je sve parametre opterećenja uzeti u obzir i prikazati ih kroz

varijable za svaki pojedini primjer. Naprezanje i opterećenje je samo po sebi

dovoljno jednoznačno tako da nije potrebno posebno apstrahiranje. Potrebna je

ujednačnost u redovima veličina koji se koriste dok se bezdimenzionalni podaci

koriste kakvi jesu. Primjeri su naprezanje σ u MPa i koeficijent asimetričnosti

ciklusa r.

Marko Šušnjar – Doktorska disertacija

48

Grupiranje varijabli iz primjera, te razumijevanje značenja svake od njih prikazani

su u tablici 4.1. Nazivi varijabli su korišteni u engleskom nazivlju sukladno

nazivima parametara iz literature [34], [35], [36].

Tablica 4.1 Primjer grupiranja varijabli iz preliminarnih ispitivanja

Varijabla Opis varijable

Series Administrativna oznaka serije pokusa

Podaci o materijalu, geometriji uzorka, trajna dinamička čvrstoća

Varijabla Opis varijable

Specimen_Type Oznaka oblika uzorka, valjak (šipka) ili prizma (plata)

Specimen_Diameter Promjer uzorka ako se radi o valjku

Specimen_Thikness Debljina uzorka ako se radi o prizmi

Specimen_Width Širina uzorka ako se radi o prizmi

Specimen_Inclusion Sadržaj uključen u materijalu uzorka

Specimen_Production Način na koji je materijal proizveden

Specimen_Fatigue_At_1E7_Cycles_Mpa Trajna dinamička čvrstoća

Rezultati testa

Varijabla Opis varijable

Test_Sa_MPa Naprezanje uzorka

Test_Nf_in_10E4 Broj ciklusa koje je uzorak izdržao

Test_Runout Flag koji označava da je uzorak izdržao više od 107 ciklusa, te je

pokus zaustavljen

Podaci o uzorku, strojnoj i toplinskoj obradi

Varijabla Opis varijable

Specimen_Direction Uzimanje uzorka iz materijala u odnosu na smjer valjanja

Specimen_Shape Stanje površine nakon strojne obrade

Specimen_Stress_Concetration_Factor Faktor koncentracije naprezanja

Specimen_Hole_Drilled Postojanje provrta u uzorku

Specimen_Surface Način na koji je obrađena površina nakon strojne obrade

Specimen_Roughness Hrapavost površine

Specimen_Temp Temperatura toplinske obrade uzorka

Specimen_Cooling_Time Vrijeme hlađenja nakon toplinske obrade uzorka

Marko Šušnjar – Doktorska disertacija

49

Specimen_Cooling_Atmosphere Atmosfera hlađenja nakon toplinske obrade uzorka

Specimen_Cooling Način hlađenja nakon toplinske obrade uzorka

Podaci o parametrima opterećenja pri provođenju pokusa

Varijabla Opis varijable

Test_Load Tip opterećenja uzorka

Test_Control Kontrola pri opterećenju uzorka pri testu

Test_Stress_Ratio Odnos naprezanja u testu

Test_Constant_Stress_MPa Konstantno naprezanje pri testu

Test_Frequency_Hz Frekvencija opterećenja pri testu

Test_Temperature Temperatura pri testu

Test_Atmosphere Atmosfera pri testu

Test_Failure_Definition Definicija otkaza uzorka

Test_Failure_Crack_Length Dužina pukotine na uzorku

Podaci o kemijskom sastavu materijala uzorka

Varijabla Opis varijable

Chemical_C Postotak sadržaja ugljika u materijalu uzorka

Chemical_Si Postotak sadržaja silicija u materijalu uzorka

Chemical_Mn Postotak sadržaja mangana u materijalu uzorka

Chemical_P Postotak sadržaja fosfora u materijalu uzorka

Chemical_S Postotak sadržaja sumpora u materijalu uzorka

Chemical_Ni Postotak sadržaja nikla u materijalu uzorka

Chemical_Cr Postotak sadržaja kroma u materijalu uzorka

Chemical_Mo Postotak sadržaja molibdena u materijalu uzorka

Chemical_V Postotak sadržaja vanadija u materijalu uzorka

Chemical_Cu Postotak sadržaja bakra u materijalu uzorka

Chemical_Al Postotak sadržaja aluminija u materijalu uzorka

Chemical_Ti Postotak sadržaja titana u materijalu uzorka

Podaci o vlačnom testu materijala te oblika uzorka koji je pri testu korišten

Varijabla Opis varijable

Tensile_Direction Uzimanje uzorka iz materijala u odnosu na smjer valjanja za

vlačni test

Tensile_Type Oznaka oblika uzorka, valjak (šipka) ili prizma (plata) za vlačni

test

Tensile_Diameter Promjer uzorka ako se radi o valjku za vlačni test

Marko Šušnjar – Doktorska disertacija

50

Tensile_Thikness Debljina uzorka ako se radi o prizmi za vlačni test

Tensile_Width Širina uzorka ako se radi o prizmi za vlačni test

Tensile_G_Length Dužina uzorka za vlačni test

Tensile_Sample_Size Broj uzoraka na kojima se radio vlačni test

Tensile_Yield_MPa Granica razvlačenja

Tensile_Strenght_MPa Vlačna čvrstoća

Tensile_Elongation_Persent Postotak produljenja uzorka pri vlačnom testu

Tensile_Area_Reduction_Persent Postotak suženja površine uzorka pri vlačnom testu

Podaci o testu žilavosti

Varijabla Opis varijable

Impact_Energy Apsorbirana energija pri testu žilavosti

Impact_Value Veličina žilavosti

Impact_CV Mjera žilavosti

Impact_Sample_Size Broj uzoraka na kojima je testirana žilavost

Podaci o toplinskoj obradi materijala prije izrade uzorka

Varijabla Opis varijable

Heat_Diameter Promjer materijala pri toplinskoj obradi

Heat_1_Temp Prva temperatura toplinske obrade

Heat_1_Time Vrijeme držanja na prvoj temperaturi pri toplinskoj obradi

Heat_1_Cooling Vrijeme hlađenja s prve temperature pri toplinskoj obradi

Heat_2_Temp Druga temperatura toplinske obrade

Heat_2_Time Vrijeme držanja na drugoj temperaturi pri toplinskoj obradi

Heat_2_Cooling Vrijeme hlađenja s druge temperature pri toplinskoj obradi

Podaci o tvrdoći uzorka

Varijabla Opis varijable

Hardness_By Tvrdoća po?

Hardness_Value Veličina tvrdoće

Marko Šušnjar – Doktorska disertacija

51

4.3. Priprema i pretprocesiranje podataka

4.3.1. Analiza varijabli

Kod pripremanja seta podataka koji će se koristiti u procesu modeliranja potrebno

je pojedinačno analizirati potencijalne varijable. Analizira se cijeli set podataka

prije podjele na testni i uzorak za učenje te se svaka pojedinačna varijabla

promatra preko svih primjera. Za svaku varijablu se inicijalno pronalazi tip

varijable, ekstremi, popunjenost te varijable u uzorku, broj nedostajućih

vrijednosti. Nakon inicijalne, radi se detaljna analiza. U Pogonskoj čvrstoći zbog

postojanja velikog ekspertnog znanja potrebno je dobro razraditi poznate

domininante varijable: materijal, opterećenje, koncentratori naprezanja, trajna

dinamička čvrstoća, te rezultati pokusa.

Tip varijable predstavlja karakteristiku varijable u smislu je li diskretna ili

kontinuirana. Za diskretne se utvrđuje tip, radi li se o numeričkoj, varijabli koja

sadrži slovne oznake ili logičkoj varijabli.

Ekstremi predstavljaju minimum i maksimum kod numeričkih varijabli. Pored

utvrđivanja ekstrema potrebno je utvrditi i broj primjera podataka koji imaju

ekstreme za svaku pojedinu varijablu.

Popunjenost varijable predstavlja broj primjera u uzorku koji ima popunjenu

varijablu koja se analizira. Popunjenost predstavlja vrijednost varijable u uzorku

koja je poznata. Bitno je napomenuti da 0 (nula) obično ne predstavlja

nepopunjenu varijablu, već vrijednost. U sustavima baza podataka nepostojeća

numerička ili karakter vrijednost je „null“ vrijednost [26]. Za karakter varijable ili

za logičke varijable sadržaj varijable je prazan ili popunjen vrijednošću koja

predstavlja besmislen podatak.

Nedostajuće vrijednosti (missing values) predstavljaju upravo one vrijednosti

koje nisu smislene u odnosu na problem koji se opisuje.

Potrebno je izračunati osnovne statističke veličine: maksimum, minimum,

standardnu devijaciju, srednju vrijednost te asimetriju distribucije.

Marko Šušnjar – Doktorska disertacija

52

4.3.2. Priprema uzorka

Uzorak, odnosno set svih primjera koji će se koristiti za modeliranje, potrebno je

pripremiti za sam proces modeliranja. Za svaku varijablu potrebno je donijeti

odluku na koji će se način koristiti u modeliranju.

Prvi korak je određivanje tipa varijable koji će se koristiti u modeliranju.

Karakter varijable se mogu po potrebi transformirati u numeričke ili logičke.

Transformacija karakter varijabli u numeričke ima uvijek smisla. Koriste li se

napredni alati za modeliranje, oni sami interno rade transformaciju. Ako se

karakter varijabla pojavljuje samo u dva stanja, transformacija u logičku ili

numeričku sa samo dvije vrijednosti dobar je izbor.

Numeričke kontinuirane varijable je potrebno diskretizirati. Pri tom se javlja već

opisani problem određivanja intervala. Napredni alati za modeliranje

diskretiziranje varijabli uspješno obavljaju na transparentan način. U ovom

slučaju dobra je i ekspertna podjela koja se temelji na poznavanju problematike.

U Pogonskoj čvrstoći kao najvažnija kontinuirana varijabla pojavljuje se broj

ciklusa koje je uzorak izdržao prije otkaza. Pri tome se javlja slučaj da uzorak

izdrži maksimalno planirani broj ciklusa. Broj i veličina intervala se određuju

prema karakteristikama Wöhlerove krivulje, znači da je izbor intervala u

logaritamskom mjerilu dobar izbor za interpolaciju ili ekstrapolaciju krivulje.

Odluka o načinu tretiranja nedostajućih vrijednosti ovisi o ekspertnoj procjeni

važnosti varijable i koliko će eventualni nadomjestak nedostajućih vrijednosti

utjecati na točnost modela. Varijabla za koju teorija kaže da nema veliki utjecaj u

konkretnom slučaju može se eliminirati iz modeliranja bez da se nadopunjuju

nedostajuće vrijednosti u pojedinim slučajevima.

Varijable za koje se ekspertno zna da imaju veliki utjecaj su problematične u

smislu nadopune nedostajućih vrijednosti. Radi li se o prediktivnim varijablama

(one koje se klasificiraju ili predviđaju) njih nema smisla nadopunjavati jer se time

narušava cijeli smisao modeliranja. Takvi primjeri s nedostajućim vrijednostima u

prediktivnim varijablama se eliminiraju iz daljnjeg procesa modeliranja. Varijable

koje su relativno uniformne mogu se nadopuniti u primjerima gdje nedostaju s

nekim od postupaka interpolacije. Zamjena srednjom vrijednosti susjednih

Marko Šušnjar – Doktorska disertacija

53

primjera (ukoliko su primjeri složeni nekim logičkim redoslijedom) je dobar izbor

za primjere Pogonske čvrstoće. Postoji mnogo načina nadopunjavanja

nedostajućih vrijednosti, pa odluka o tome koji će se primijeniti uglavnom ovisi o

iskustvu te interaktivnom? postupku pokušaja i dobivanja onoga s najvećom

točnosti.

Outlieri ili ekstremi koji značajno odstupaju od ostalih podataka su sljedeći

problem koji je potrebno riješiti. Rješavanje ovih problema u Pogonskoj čvrstoći

značajno ovisi o eksperntoj procjeni. Prvi korak je eliminacija eventualne greške u

mjerenju ili interpretaciji rezultata. Ostali ekstremi se tretiraju tako da se u

potpunosti eliminiraju iz procesa modeliranja ili da se na neki način “ublaže“

vrijednosti ekstrema. Najčešći primjer je već opisan, kada uzorak izdrži

maksimalno planirani broj ciklusa opterećenja u tom pokusu.

Derivirane varijable su poseban način poboljšavanja pripreme podataka za

modeliranje. Pod ovim varijablama se smatraju one koje ne postoje u inicijalnom

setu podataka, već se dobivaju iz postojećih varijabli. Način na koji se dobivaju

ovise o iskustvu i ekspertnom znanju. Moguće je napraviti kombinaciju postojećih

varijabli koristeći matematičke postupke. Najčešći je oblik kombinacija sa

statističkim vrijednostima. Derivirane varijable imaju smisla samo kad nisu u

direktnoj linearnoj ili nelinearnoj zavisnosti s već postojećim varijablama.

Najčešće se koriste kada se njihovim kombinacijama nadoknađuju nedostajuće

vrijednosti, odnosno korištenje nove varijable koja kompenzira nedostajuće

vrijednosti neke druge koja se u tom slučaju ne koristi u modeliranju.

4.3.3. Pretprocesiranje seta podataka za modeliranje

Na osnovi odluka koje su donijete u procesu pripreme uzorka, provodi se

pretprocesiranje podataka. Pretprocesiranje kao postupak, vezano je uz samu

manipulaciju podacima. Sva ekspertna znanja su primarno iskorištena u

prethodnom koraku. Izrađuju se procedure za transformaciju i prilagodbu

podataka prethodnim definicijama. Za samo pretprocesiranje podataka najbolje je

iskoristiti prednosti relacijskih baza podataka i SQL programski jezik. Ako

okruženje podržava manipulaciju podacima onda se izrađuju makro naredbe koje

Marko Šušnjar – Doktorska disertacija

54

će provesti transformaciju. Pored pripreme podataka na osnovi odluka u pripremi,

potrebno je provesti normalizaciju i „glađenje“ podataka tamo gdje je potrebno.

Postupak pretprocesiranja će detaljnije biti prikazan na primjerima.

4.4. Modeliranje, razvoj modela i učenje

Odabir metode za modeliranje u Pogonskoj čvrstoći zasniva se na karakteristici

ulaznih podataka i načinu na koji su pripremljeni. U dostupnoj literaturi

dominantan izbor je bio na neuralnim mrežama [13],-[20]. Preliminarna

istraživanja u ovoj disertaciji su pokazala da se i druge skupine metoda moraju

uzeti u obzir pri evaluaciji za izbor. Neuralne mreže će zasigurno dati jako dobru

generalizaciju problema, međutim karakteristike drugih metoda daju dodatnu

vrijednost koja se može iskoristiti. Stabla odlučivanja, regresijski modeli pa i

klasterizacija, mogu biti metode izbora za pogonsku čvrstoću.

Shema prediktivnog modeliranja je prikazana na slici 4.4.

Statistička analiza ulaznih i prediktivnih varijabli daje smjernice o izboru metoda.

Ako najjače prediktivne varijable imaju dobru distribuciju prema ciljnoj varijabli

većina metoda će moći dati relativno dobre rezultate, a ako je distribucija loša,

Neuralne mreže su metoda izbora.

Modeliranje problema pogonske čvrstoće traži kvalitetnu pripremu podataka jer

podaci u izvornom obliku ne mogu dati dobre prediktivne modele. Razlog je

rasipanje eksperimentalnih rezultata, što je inače problem pogonske čvrstoće.

Izbor je modeliranje Wöhlerovih krivulja ili drugih već statistički obrađenih

podataka. Takvo modeliranje rješava u startu problem šuma na koje su

prediktivne metode osjetljive.

Postupci podjele raspoloživog seta podataka na setove za modeliranje,

parametriziranje metoda i učenje, prikazani su na konkretnom modeliranju

problema u poglavlju 5.

Marko Šušnjar – Doktorska disertacija

55

Slika 4.4 Shema prediktivnog modeliranja prilagođena pogonskoj čvrstoći

4.5. Ocjena modela

Dvije su osnovne evaluacije točnosti.

Evaluacija točnosti modela je točnost koju model postiže pri pogađanju setova

podataka koji su mu prezentirani kao set za provjeru učenja. Ova točnost je

preduvjet ali ne i mjerilo točnosti jer uvijek postoji opasnost od preučavanja

metode, „overtraninig“, kako je opisano u 3.2.

Evaluacija točnosti predikcije je najvažnija za probleme Pogonske čvrstoće.

Predikcijom se utvrđuje kojom točnošću metoda pogađa rezultate za setove

podataka koji nisu korišteni u modeliranju. Detaljnije o evaluaciji točnosti u

poglavlju 5.7.

Marko Šušnjar – Doktorska disertacija

56

5. Razvoj prediktivne metode uz numeričku verifikaciju

5.1. Izvori i izbor podataka

Bilo koja prediktivna metoda traži kvalitetne ulazne podatke na kojima bi se radila

obrada. Za numeričke eksperimente u ovoj disertaciji, kao izvor podataka,

koristila se literatura [34], [35], [36]. Radi se o referentom izvoru podataka

izdanom od „The Society of Materials Science, Japan“ (JSIS). U tri sveska se

nalaze rezultati istraživanja JSIS u periodu od 1961. do 1992. godine. Literatura

je dostupna samo u tiskanom izdanju tako da je sve trebalo prebaciti u digitalni

oblik. Nije se koristila nikakva automatska digitalizacija (OCR optical character

recognition i sl.) već se svaki podatak „ručno“ prenosio u digitalni oblik uz

višestruku provjeru. Literatura pored detaljnih numeričkih podataka o ispitivanju

sadrži i skice uzoraka te dijagrame opterećenja u odnosu na broj ciklusa (S-N).

Skice i dijagrami su služili kao dodatni elementi prilikom kategoriziranja i odabira

podataka za modeliranje.

Na slici 5.1 su prikazani primjeri S-N dijagrama iz literature. Svaki pokus ima svoj

odgovarajući S-N dijagram s odgovarajućim brojem točaka koje predstavljaju

obavljene pokuse i registrirane u literaturi [34], [35], [36]. Dijagrami su iskorišteni

za provedbu eliminacijskih kriterija opisanih dalje u ovom poglavlju.

Prikazani dijagrami iz literature su korišteni samo orijentacijski, a ne za

konstruiranje Wöhlerovih krivulja. Za tu svrhu korišteni su točni numerički podaci

dobiveni digitalizacijom. Na slici 5.2 je prikazan primjer numeričkih podataka u

literaturi. Slika prikazuje podatke za pokuse nad jednim tipom uzorka pod

originalnom oznakom 292-002. S-N dijagram za taj pokus iz literaure je vidljiv na

slici 5.1.

Marko Šušnjar – Doktorska disertacija

57

Slika 5.1 Primjeri S-N dijagrama iz literature

Marko Šušnjar – Doktorska disertacija

58

Slika 5.2 Prikaz numeričkih podataka iz literature

Sama digitalizacija podataka iz literature je obavljena nad oblikom zapisa kakav

je prikazan na slici 5.2.

Prikaz digitaliziranog oblika primjera sa slike 5.2 prikazan je u tablicama 5.1, 5.2 i

5.3. Karakteristika setova podataka je da vrijednosti varijabla za pojedini pokus

imaju određen skup jedinstvenih vrijednosti koje se ne mijenjaju za sve točke

pokusa. Varijable s jednakim vrijednostima za sve točke pokusa iz primjera sa

slike 5.2 prikazane su u tablicama 5.2 i 5.3.

Marko Šušnjar – Doktorska disertacija

59

Tablica 5.1 Primjer digitaliziranih podataka iz literature

Tablica 5.2 Primjer digitaliziranih podataka iz literature

Chemical C

Chemical Si

Chemical Mn

Chemical P

Chemical S

Chemical Cu

Tensile Yield MPa

Tensile Strenght MPa

1.-26. 0.15 0.25 0.4 0.015 0.02 0.03 310 386

Series

Specimen Fatigue At 1E7 Cycles MPa Test Sa MPa Test Nf in 10E4

Specimen Stress Concetration Factor

Test Stress Ratio Sigma m

1. 292-002 164 292 0.7 1 -1 0

2. 292-002 164 275 0.9 1 -1 0

3. 292-002 164 265 1.4 1 -1 0

4. 292-002 164 226 4.4 1 -1 0

5. 292-002 164 216 6.9 1 -1 0

6. 292-002 164 196 8.4 1 -1 0

7. 292-002 164 196 8.7 1 -1 0

8. 292-002 164 196 17.8 1 -1 0

9. 292-002 164 177 70.8 1 -1 0

10. 292-002 164 167 30.5 1 -1 0

11. 292-002 164 162 1000 1 -1 0

12. 292-002 164 235 2.5 1 -1 0

13. 292-002 164 235 2.6 1 -1 0

14. 292-002 164 235 3 1 -1 0

15. 292-002 164 235 3.4 1 -1 0

16. 292-002 164 235 3.4 1 -1 0

17. 292-002 164 235 3.6 1 -1 0

18. 292-002 164 235 3.6 1 -1 0

19. 292-002 164 235 3.7 1 -1 0

20. 292-002 164 235 3.8 1 -1 0

21. 292-002 164 235 3.8 1 -1 0

22. 292-002 164 235 3.9 1 -1 0

23. 292-002 164 235 3.9 1 -1 0

24. 292-002 164 235 4.2 1 -1 0

25. 292-002 164 235 4.3 1 -1 0

26. 292-002 164 235 4.5 1 -1 0

Marko Šušnjar – Doktorska disertacija

60

Tablica 5.3 Primjer digitaliziranih podataka iz literature

Specimen_Shape Specimen_Hole_Drilled Speciman_Surface Post_Heat_Tretman Heat_Tretman

1.-26. 3 0 3 21 0

Cilj modeliranja je razviti prediktivnu metodlogiju i metodu primjenjivu na

problematiku Pogonske čvrstoće. Potreba za eksperimentalnom verifikacijom

primjenjivosti metode postavila je određena ograničenja pri izboru podataka iz

literature. Ograničenja se i u ovom slučaju odnose na mogućnosti dostupne

opreme za eksperimentalnu verifikaciju.

Aksijalno opterećenje pri provođenju pokusa je prvi ograničavajući kriterij izbora

pokusa iz literature. Ovo ograničenje ni u čemu ne sužava potencijano područje

primjene metode jer je primjenjiva i za savijanje, rotacijsko savijanje, rotacijsko

savijanje s nadvjesom i sl. Ograničenje se odnosi samo na eksperimentalnu

verifikaciju u ovom radu.

Sobna temperatura i standardna atmosfera pri provođenju pokusa su sljedeći

ograničavajući kriterij. Kao i kod aksijalnog opterećenja odnosi se samo na

mogućnosti eksperimentalne verifikacije a ne na mogućnosti primjene same

metode. Materijal od kojeg su izrađeni uzorci je također bio kriterij izbora. Čelik je

uzet kao materijal na kojem će se vršiti modeliranje i eksperimentalno

verificiranje. Odabrani čelici su prikazani u tablici 5.4.

Marko Šušnjar – Doktorska disertacija

61

Tablica 5.4 Materijal uzoraka odabranih za numeričku verifikaciju metoda

DIN JIS ISO ASTM

C10 Ck10

S10C C10 1010

C15 S15C C15E4 C15M2

1015

C22 S20C ---- 1020

C25

S25C C25 C25E4 C25M2

1025

C30

S30C C30 C30E4 C30M2

1030

C35

S35C C35 C35E4 C35M2

1035

C40

S40C C40 C40E4 C40M2

1040

C45

S45C C45 C45E4 C45M2

1045

St44-2 SS400 SS41

---- 283 Grade D

Sljedeći kriterij izbora je bila kvaliteta provedenih pokusa. Izbor se zasnivao na

preporuci literature [22] o broju potrebnih pokusa s istim ulaznim parametrima za

generiranje S-N krivulje. Pri tome se testovi smatraju kao istraživanje i razvoj te

se promatraju niži kriteriji dovoljni za tu svrhu, dok se viši kriteriji primjenjuju u

konstruiranju.

Sljedeći kriterij je bio oblik uzorka. Uzeti su u promatranje uzorci u obliku šipke.

Takve uzroke je moguće ispitati, te metodu eksperimentalno verificirati, na

dostupnoj opremi.

Sva ograničenja kriterija izbora imaju zajedničku već iskazanu karakteristiku,

postavljena su samo zbog eksperimentalne verifikacije i ne predstavljaju

ograničenje za primjenjivost metode.

Podaci su preneseni u digitalni format te spremljeni u odgovorajuću podatkovnu

strukturu. Za ovu svrhu nije rađena optimizacija podatkovne strukture te su oni

organizirani u tablični oblik, bez svođenja na optimalne oblike zadovoljavanja 3.

Marko Šušnjar – Doktorska disertacija

62

normalne fome ili sl. Tablice su međusobno vezane relacijskim ključevima koji se

prvenstveno koriste za identifikaciju, a ne za relacijsku algebru.

5.2. Priprema podataka

Podaci su prebačeni u digitalni oblik sa svim pripadajućim i dostupnim atributima

iz literature. Ukupno je digitalizirano više od 3000 setova podataka. Selekcijskim

postupkom te postupkom pripreme podataka broj setova podataka reduciran je

na 1129 verificiranih podataka koji zadovoljavaju kriterije ulaznih podataka za

proces modeliranja prediktivnim metodama.

Struktura sirovih podataka prije pripreme prikazana je u tablicama 5.5 - 5.8. U

preliminarnim istraživanjima iz istih izvora podataka [34], [35], [36] korišteno je

više različitih atributa, kako je to prikazano u tablici 4.2. Razlog redukcije leži u

analizi kvalitete dostupnih podataka. Svi eliminirani atributi su imali glavni

problem nedostatka vrijednosti („missing values“), toliko da se nije mogao pronaći

pouzdan način nadomjestka za te podatke.

Marko Šušnjar – Doktorska disertacija

63

Tablica 5.5 Pregled strukture podataka

Atribut Oznaka u podatkovnoj

strukturi

Primjer, objašnjenje

Oznaka materijala Materijal po JIS-u S10C,

S35C,S45C,SS400,...

Jedinstvena identifikacijska oznaka

pokusa i serije podataka

Series 155-062, 135-015, 201-

010,...

Trajna dinamička čvrstoća Specimen_Fatigue_At_1E7_

Cycles_MPa

Brojčana vrijednost

Opterećenje pojedinog ispitivanja Test_Sa_MPa Brojčana vrijednost

Broj ciklusa koje je uzorak izdržao

pri tom opterećenju, izražen u 104

Test_Nf_in_10E4 Brojčana vrijednost

Faktor koncentracije naprezanja,

geometrijska karakteristika uzorka

Specimen_Stress_Concetrac

ion_Factor

Brojčana vrijednost

Koeficijent asimetričnosti ciklusa, r Test_Stress_Ratio Brojčana vrijednost

Srednje naprezanje ciklusa Sigma_m Brojčana vrijednost

Kemijski sastav, sadržaj ugljika Chemical_C %

Kemijski sastav, sadržaj silicija Chemical_Si %

Kemijski sastav, sadržaj mangana Chemical_Mn %

Kemijski sastav, sadržaj fosfora Chemical_P %

Kemijski sastav, sadržaj sumpora Chemical_S %

Kemijski sastav, sadržaj bakra Chemical_Cu %

Granica razvlačenja [MPa] Tensile_Yield_MPa Brojčana vrijednost

Prekidna čvrstoća [MPa] Tensile_Strenght_MPa Brojčana vrijednost

Oblik uzorka Specimen_Shape Oznaka iz tablice oblika

uzoraka

Površina uzorka Specimen_Surface Oznaka iz tablice

površina uzoraka

Toplinska obrada Heat_Treatman Oznaka iz tablice

toplinskih obrada

Poslije toplinska obrada, odnosno

sekundarna toplinska obrada

Post_Heat_Treatman Oznaka iz tablice

toplinskih obrada

Marko Šušnjar – Doktorska disertacija

64

Tablica 5.6 Oznake toplinskih obrada

Oznaka Temp oC Vrijeme hađenja ( h)

Atmosfera hlađenja

Mjesto hlađenja

Ostalo

1 650 1 vacuum Furnace 2 600 1 vacuum Furnace 3 900 3,5 air Furnace 4 1075 3,5 air Furnace 5 1300 3,5 air Furnace 6 920

700 1 1

air water

7 870 - 880 1 air Furnace 8 900 - 920 1 air Furnace 9 390 1 water 10 550 1 water 11 650 1 water 12 700 1 water 13 920

350 1 3

air air

Furnace Furnace

14 700 1 vacuum Furnace 15 685 2 vacuum Furnace 16 920

780 1 1

Furnace Furnace

17 685 2 air 18 700 1 vacuum Furnace + 15% prednaprezanja

prije 2. Topl. obrade 19 1200 1 Furnace 20 685 2 air Water 21 930 1 vacuum Furnace 22 750 1 vacuum Funace 23 880 1.6 Furnace 24 900, 1100 1, 1 air Furnace 25 900, 1300,

650 1 2

air air

Furnace

26 860 4 Furnace 27 870 0,5 vacuum Furnace 28 870 0,5 air 29 650 0,5 vacuum Furnace 30 880 1,2 air 31 850

600 water

air

32 830 5 Furnace 33 830

600 5 5

water air

34 830 3 air 35 830 4 air 36 830

600 4 3,5

water air

37 830 600

4 3,5

water air

+ prednaprezanje od 572,3 MPa

38 870 845 550

0,5 0,5 1

air water water

Marko Šušnjar – Doktorska disertacija

65

Tablica 5.7 Oznake oblika koncentracije naprezanja uzorka

Oznaka Opis

1 Okrugli utor

2 Pjeskareni uzorak

3 Glatki uzorak (bez koncentratora naprezanja)

4 Dvostrani utor

5 Izrezani uzorak

Tablica 5.8 Oznake površina uzorka

Oznaka Opis

0 Bez obrade

1 Brušeno

2 Elektro polirano

3 Rezano

4 Polirano

Atributi toplinske obrade su prikazani u posebnoj tablici te je za njihovu

identifikaciju korišten jedinstveni ključ. Analizom podataka utvđeno je ukupno 38

različitih vrsta toplinskih obrada korištenih u odabranim ispitivanjima iz literature

[34], [35], [36]. Prediktivne metode kojima se modelira problem ne poznaju

fizikalna svojstva materijala niti fizikalne parametre pokusa stoga je

najučinkovitije predstaviti atribute u relativnim odnosima kao što je napravljeno

kroz njihove identifikatore. Identičan je pristup napravljen za atribute oznake

površina i oblika uzorka. Njih je pronađeno značajno manje. Ukupno ima 5

različitih oblika, te 5 različitih površinskih obrada.

Provedena je analiza radi pronalaženja nedostajućih vrijednosti („missing

values“). U određenim setovima podataka ispitivanja nedostajale su vrijednosti

kemijskog sadržaja. Nadopunjene su podacima iz literature [37].

U pojedinim setovima podataka pronađen je nedostatak vrijednosti granice

razvlačenja. Ovaj podatak se ne može pouzdano dobiti iz literature jer ovisi o

raznim parametrima vezanim za svaki pojedini materijal te njegovu tehnološku

Marko Šušnjar – Doktorska disertacija

66

obradu. Nadopuna je napravljena detaljnom analizom podataka iz literature s

originalnim podacima [34], [35], [36] gdje je uočeno da uzorci s istim početnim

oznakama serija te identičnim kemijskim sastavom i identičnom toplinskom

obradom imaju istu prekidnu čvrstoću. Pretragom podataka pronađene su

vrijednosti prekidne čvrstoće koje odgovaraju, te su ti podaci nadomješteni.

Tablica 5.9 Statistička analiza ulaznih podataka [42]

Varijabla

Min

Max

Arit.

sredina

Std.

Dev

Asimetrija

distr.

frekvencija

Specimen_Fatigue_At_1E7_Cycles_MPa 85 358 171.783 53.668 0.919

Specimen_Stress_Concetration_Factor 1 3.98 1.675 1.12 1.218

Test_Stress_Ratio -1 0.1 -0.574 0.512 0.392

Sigma_m 0 291.4 35.506 79.435 1.927

Chemical_C 0.08 0.46 0.333 0.118 -0.359

Chemical_Si 0.11 0.48 0.253 0.045 2.117

Chemical_Mn 0.37 0.8 0.634 0.126 -0.346

Chemical_P 0.007 0.035 0.017 0.006 0.391

Chemical_S 0.005 0.08 0.023 0.019 2.317

Chemical_Cu 0 0.2 0.045 0.06 1.785

Tensile_Yield_MPa 202 766 365.37 102.834 2.37

Tensile_Strenght_MPa 378 871 603.435 137.555 -0.133

Specimen_Shape 1 6 2.609 1.094 0.422

Speciman_Surface 1 5 1.652 1.147 1.491

Heat_Tretman 0 38 19.13 14.673 -0.305

Post_Heat_Tretman 0 27 1.761 5.769 3.562

Sa_Mpa 0.341 397.29 153.569 56.317 0.651

5.3. Pretprocesiranje podataka

Podaci nisu pogodni za modeliranje u obliku kako su prikupljeni iz literature [34],

[35], [36]. Osnovni razlog je velika količina šuma, odnosno rasipanja, koji je

standardna osobina svih pokusa pogonske čvrstoće [42].

Podatke je potrebno uobličiti u oblik pogodan za modeliranje koji je dovoljno

reprezentativan za modeliranje problematike Pogonske čvrstoće. Za tu primjenu

je odabran standardni način prikaza vijeka trajanja kroz Wӧhlerove krivulje,

odnosno pravce u logaritamskom mjerilu broja ciklusa naprezanja.

Marko Šušnjar – Doktorska disertacija

67

Slika 5.3 Wӧhlerovi pravci s vjerojatnošću preživljavanja

Za svaki set podataka napravljena je interpolacija Wӧhlerova pravca u

normalnom mjerilu naprezanja S i logaritamskom mjerilu vijeka trajanja N.

Interpolacija je napravljena linearnom regresijom, te je za svaki Wӧhlerov pravac

dobiven njegov algebarski oblik u formiy = βx ϵ . Primjer određivanja Wӧhlerova pravca je prikazan na slici 5.4.

Slika 5.4 Primjer interpolacije Wӧhlerovih pravaca na eksperimentalnim

podacima

Svaki Wӧhlerov pravac je još jednom prošao provjeru te se napravila eliminacija

onih koji su imali preveliko rasipanje te nisu davali podatke pouzdane za

modeliranje.

Marko Šušnjar – Doktorska disertacija

68

Sljedeći korak u pripremi podataka je generiranje S vrijednosti Wӧhlerovih

pravaca za odabrane vrijednosti N. Vrijednosti N su odabrane jednoobrazno za

sve Wӧhlerove pravce i sastoje se od 12 točaka kako je prikazano u tablici 5.10.

Odabrano je područje broja ciklusa opterećenja od 104 do 2·106 ciklusa. Cilj je

modelirati dio Wӧhlerova pravca prije područja trajne dinamičke čvrstoće.

Odabrano područje se po literaturi [1] smatra područjem promjenjive dinamičke

čvrstoće i tom području Wӧhlerov pravac ima nagib u logaritamskom mjerilu.

Tablica 5.10 Točke uzorkovanja na Wӧhlerovim pravcima

N u 103 Log N

1 10 4

2 100 5

3 200 5.301

4 400 5.602

5 600 5.778

6 800 5.903

7 1000 6

8 1200 6.079

9 1400 6.146

10 1600 6.204

11 1800 6.255

12 2000 6.301

Generirani su novi setovi podataka za svaki pojedini Wӧhlerov pravac dobiven u

prethodnoj obradi tako da se za svaki pokus i za svaki N prema tablici 5.10 dobila

odgovarajuća vrijednost naprezanja S.

U sljedećem koraku je svakom paru S-N dodijeljen pripadajući skup ostalih

atributa koji su poznati iz literature [34], [35], [36] za taj pokus.

Izračunati podaci se tretiraju kao sredina distribucije, te se smatra da izračunati

Wӧhlerovi pravci imaju vjerojatnost preživljavanja uzorka od 50%.

Marko Šušnjar – Doktorska disertacija

69

5.4. Odabir prediktivnih metoda

5.4.1. Preliminarna istraživanja

U pripremi numeričkog modeliranja napravljeno je testiranje na svim dostupnim

prediktivnim metodama. Svrha je pronaći metode koje su najprimjerenije za

modeliranje Wӧhlerovih pravaca. Karakteristike svake od metoda dostupne iz

literature, te svojstva koja proizilaze iz osnovnog algoritma nisu bila dovoljne kao

kriterij za izbor. Potrebno je napraviti numeričke eksperimente da bi se dobile

metode s najboljim karakteristikama za odabrani slučaj.

- Pregled metoda na kojima su obavljena preliminarna istraživanja [27]:

o Neuralne mreže

Metoda je odabrana za daljnje istraživanje.

o C&RT metoda

Metoda je odabrana za daljnje istraživanje.

o QUEST metoda

Metoda je relativno nova, 1997. godine su je predstavili Loh i Shih.

Predstavlja binarno statističko stablo. Princip rada je takav da

promatra točku grananja na više načina te odabire najpovoljniju.

Pruža manje mogućnosti nego C&RT metoda te traži diskretiziranu

ciljnu varijablu. Izuzeta je iz daljnjeg razmatranja budući da je C&RT

bolji izbor kao metoda iz stabala odlučivanja.

o CHAID metoda

Chi-squared Automatic Interaction Detector (CHAID) je metoda iz

skupine stabala odlučivanja, koju je 1980. godine predstavio Kass.

Radi na principu utvrđivanja homogenosti vrijednosti odabranog

polja slično kao druga stabla odlučivanja. Kao mjeru homogenosti

koristi chi-kvadrat test.

Metoda daje lošije rezultate od C&RT metode i manje mogućnosti

parametriziranja, stoga nije uzeta u daljnje razmatranje.

Marko Šušnjar – Doktorska disertacija

70

o Regresijske metode

Istraživane metode:

GenLin – generalizirani linearni modeli

Logistička regresija

Cox – proporcionalni hazard modeli.

Sve metode iz ove skupine su isključene iz daljnjeg razmatranja

zbog svoje algoritamske karakteristike. Radi se o statističkim

metodama koje nisu predmet ove disertacije. Korištene su u

preliminarnim istraživanjima da bi se dobila slika o njihovoj točnosti i

eventualnoj primjenjivosti. Točnost na verifikacijskom modelu je bila

nedovoljna za daljnja istraživanja.

Regresijske metode imaju svoju primjenu u popunjavanju

nedostajućih vrijednosti.

o SVM metoda

Suport Vector Machine (SVN), metoda koja za mapiranje ulaznih

podataka na izlazne koristi klasifikacijske i regresijske funkcije.

Metoda dobro generira model s malom greškom na testnom setu, a

problem je kod validacije, gdje je radila relativno veliku grešku.

Izuzeta je iz daljnjih istraživanja.

o Klasterizacijske metode

Obavljeno je preliminarno istraživanje s metodom najbližih susjeda

(Nearest Neighbor Analysis). Metoda je zbog svoje algoritamske

karakteristike neprikladna za primjenu u konkretnom modeliranju.

5.4.2. Odabrane metode

Kao metode s najboljim karakteristikama u preliminarnim istraživanjima odabrane

su neuralne mreže i C&RT metoda.

Marko Šušnjar – Doktorska disertacija

71

Neuralne mreže su preliminarno spomenute u 3. poglavlju ove disertacije. Za

konkretno modeliranje u radu je korišten algoritam baziran na tzv „feed-forward“

neuralnim mrežama, poznatim još kao višeslojni perceptoni. Mrežna topologija je

posložena tako da ulazni sloj ima 17 neurona, po jedan za svaki atribut ulaznog

seta podataka. Izlazni sloj ima samo jedan neuron jer je model tako organiziran

da ima samo jednu izlaznu varijablu. Modeliranje Wӧhlerova pravca je moguće

napraviti iz dva smjera, predviđati broj ciklusa koje će uzorak izdržati uz

pretpostavljeno opterećenje i obrnuto, predviđati opterećenje koje će uzorak

izdržati za odabrani broj ciklusa. U oba slučaja imamo samo po jedan izlazni

atribut te je jedan neuron u izlaznom sloju bio dovoljan.

C&RT predstavlja Clasification and Regression Trees, prvobitno je

predstavljen 1984. [38]. Temelji se na particioniranju seta podataka u dva

podseta i to tako da su podaci u podsetovima više homogeni nego prije

particioniranja. Proces je rekurzivan, svaki se od tih podsetova dijeli ponovo te

se proces nastavlja dok se ne dosegne kritetij homogenosti ili neki drugi kriterij

grananja. I kod C&RT modeliranja se koristi isti odnos od 17 ulaznih i jednog

izlaznog atributa.

5.4.3. Algoritam Neuralnih mreža

- Ulazni podaci. Tijek podataka definiran algoritmom počinje

prilagodbom ulaznih podataka, točnije njihovom normalizacijom.

o Normalizacija atributa s kontinuiranim vrijednostima se obavlja

svođenjem na interval Transformacija je oblika

A"w A" * Ac"$Ac8\ * Ac"$ �5.1� o Simbolički, diskretni, binarni (flag) atributi se svode na

indikatorske numeričke vrijednosti binarnog oblika čiji oblik ovisi

o broju kombinacija. Vrijednosti normaliziranih atributa uvijek

ostaju u intervalu [0 - 1]

Marko Šušnjar – Doktorska disertacija

72

- Proces učenja višeslojnog perceptona se zasniva na povratnoj

propagaciji greške (back propagation) koja se temelji na

generaliziranom delta pravilu [39]. Princip je da se za svaki zapis

prezentiran mreži tijekom procesa učenja informacije teče kroz mrežu

prema naprijed (feeds forward) radi generiranja predikcije u izlaznom

sloju. Predikcija se uspoređuje s poznatom točnom vrijednošću te se

razlika između nje i trenutne predikcije propagira natrag kroz mrežu. U

procesu povratne propagacije korigiraju se težinske funkcije kako bi se

poboljšala predikcija. Procese se iterativno ponavlja dok se ne dobije

rezultat koji zadovoljava predefinirane kriterije.

- Feed-forward računanje višeslojnog perceptona

Ulazni neuroni primaju normalizirane vrijednosti odgovarajućih atributa.

Aktivacija svakog neurona u sljedećem sloju se računa prema

1" S x @"#�## y�5.2)

Gdje je 1" aktivacija neurona � , z je set neurona prethodnog sloja, @"# je težina veze između neurona � i neurona z, �# je izlazna vrijednost

neurona z. S�A� je step funkcija slijedećeg oblika:

S�A� 11 + �n\ (5.3)

- Povratno uvrštavanje greške (back-propagation)

Inicijalne vrijednosti težinskih funkcija su randomizirane u intervalu

*0,5 ≤ @"# ≤ 0,5 Setovi podataka predviđeni za treniranje se randomizirano prezentiraju

mreži u ciklusima. Upravo zbog randomizacije u svakom pojedinom

ciklusu se pojedini zapis može pojaviti više puta. Za svaki pojedni zapis

se računa odgovor mreže s trenutnim težinskim vrijednostima. Dobiveni

Marko Šušnjar – Doktorska disertacija

73

rezultat se uspoređuje s poznatim točnim rezultatom te se računa

promjena težinskih vrijednosti kako slijedi

∆@"#�� 1� ~��#��" l∆@"#����5.4� Gdje su η parametar učenja, propagirana greška, izlazna vrijednost

neurona i za zapis p,α momentum parametar, ∆w�� promjena težine

prethodnog ciklusa. Vrijednost momentuma α je konstantna duž cijelog

procesa učenja, dok se vrijednost η mijenja. Započinje s vrijednošću

inicijalne η te se logaritamski mijenja k predefiniranoj najnižoj

vrijednosti, zatim se dalje tijekom procesa učenja podiže na

preddefiniranu najveću vrijednost η te opet spušta. Izraz za računanje

η je sljedeći (d je preddefinara vrijednost):

~��� ~�� * 1��A� x+�, x ~9d�~�"��y /�y�5.5� Propagirana greška se određuje ovisno o poziciji veze u mreži. Za vezu

prema izlaznim neuronima se računa prema sljedećem izrazu:

��# ���# * ��#���#�1 * ��#��5.6� Za veze koje nisu prema izlaznom sloju propagirana greška se računa

prema izrazu ( je set neurona na koji je neuron vezan):

��# ��#�1 * ��#� ���@�#� �5.7� Težinske vrijednosti veza se prema opisanom principu mijenjaju

automatski čim se pojedini set podataka prezentira mreži.

Prikazan je osnovni algoritam mreže. Parametriziranje u stvarnoj

primjeni će biti opisano u daljnjem prikazu modeliranja problema.

Marko Šušnjar – Doktorska disertacija

74

5.4.4. C&RT algoritam

C&RT algoritam pripada skupini algoritama stabla odlučivanja. Općenito su

prikazana u 3. poglavlju ove disertacije. Ovdje će biti prikazan njegov konkretni

oblik i specifičnosti.

- Ulazni podaci

o Setovi podataka s atributima, predstavljaju zapise uobličene u

redove od kojih svaki predstavlja jednu kombinaciju

frekvencijskih pojava.

o Definicija ciljne varijable i definicija svih ulaznih varijabli ili

atributa.

o Frekvencija polja se koriste za smanjivanje veličine skupa

podataka. Označavaju ukupan broj pojavljivanja koje predstavlja

pojedini zapis. U modeliranju konkretnog zadatka ove disertacije

nisu korištena frekventna polja jer je svaki zapis predstavljao

jednu frekvencijsku vrijednost.

o Težinska polja, identično kao frekvencijska, se koriste za

smanjivanje veličine skupa podataka. Predstavljaju težinske

vrijednosti pojedinog zapisa. Nisu korištena u modeliranju

konkretnog zadatka. Pretpostavljena težinska vrijednost svakog

zapisa seta podataka bila je jednaka.

- Princip rada algoritma [27]

o Podjela čvora na dva nova čvora (dijete-čvor) i to tako da novi

čvorovi imaju manju vrijednost entropije nego čvor iz kojeg

nastaju. Entropija predstavlja sličnost vrijednosti ciljne varijable.

U potpuno „čistom“ čvoru, odnosno čvoru bez entropije, svi

setovi imaju istu vrijednost ciljne varijable. Algoritam mjeri

entropiju čvora, koji dijeli na dva nova, koristeći mjeru entropije.

� Za svako polje po kojem se dijeli algortiam radi sljedeće:

Marko Šušnjar – Doktorska disertacija

75

• Za kontinuirana polja slaže zapise po vrijednosti

polja u čvoru od najmanjeg k najvećem. Bira svaku

točku kao moguću točku podjele. Za svaku točku

računa mjeru entropije te bira onu s najmanjom

vrijednosti.

• Za simbolička i diskretizirana polja traži

kombinaciju svaka moguća dva podseta. Zatim

računa entropiju svakog od njih. Na kraju bira

kombinaciju koja ima najmanju apsolutnu

vrijednost.

� Kada pronađe polje s najvećim smanjenjem entropije bira

ga kao polje za podjelu.

� Provjerava uvjete zaustavljanja, ako nisu zadovoljeni za

svaki novonastali čvor ponavlja algoritamsku proceduru.

o Mjera entropije se provodi na sljedeća tri načina:

� Gini

Gini index ,��� je definiran kao

,��� 1 −∑ �-(z|�)# (5.8). Gdje je j kategorija ciljne varijable, a

�(�) = �(z, �)#

(5.9)

Kada su zapisi u čvoru eventualno distribuirani preko

kategorija Gini index doseže maksimum vrijednosti 1 − 1/� gdje je � broj kategorija ciljane varijable. Kada svi zapisi u

čvoru pripadaju istoj kategoriji Gini index je = 0.

Gini korekcijska funkcija �(, �) za podjelu u čvoru � je

definirana kao:

Marko Šušnjar – Doktorska disertacija

76

��, �� ,��� *��,���� *��,�����5.10) Gdje su �� dio zapisa koji idu u lijevi novi čvor, a ��dio zapisa

koji idu u desni novi čvor. Podjela se bira tako da

maksimizira vrijednost ��, �� � Twoing

Twoing index je baziran na podjeli ciljne varijable u dvije

superklase i traženju najbolje podjele. Klase oznake �&i �- su

definirane na način:

�& �z: ��z|��� ≥ ��z|�����5.11) �- � * �&

Twoing kriterijska funkcija za podjelu u čvoru � izgleda

ovako:

��, �� ���� � |��z|��� * ��z|���|# �-�5.12)

gdje su �� i ��čvorovi kreirani podjelom . Podjela se bira kao

ona koja ima maksimalnu vrijednost kriterija.

� Least Squared Deviation (LSD)

Koristi se za kontinuirane varijable, stoga će kao mjera biti

interesantna za primjenu u pogonskoj čvrstoći. LSD mjera je

definirana kao:

���� 1��(�) @"�""∈�((" − ((�))-(5.13)

gdje je ��(�) težinski broj zapisa u čvoru �, @"�" su težinske

odnosno frekventne vrijednosti u čvoru i.

Kriterijska funkcija je definirana kao:

��, �� ���� * ������� * ��������5.14)

Marko Šušnjar – Doktorska disertacija

77

podjela se bira tako da maximizira vrijednosti kriterijske

funkcije.

Odabir načina računanja mjere entropije ovisi o tipu ciljne varijable. Za

varijable koje imaju simboličke ili diskretne vrijednosti odabiru se Gini ili

Twoing mjere, dok se za kontinuirane ciljne varijable odabire Least

Squared Deviation mjera.

o Kriteriji za zaustavljanje daljnje podjele (grananja):

� svi zapisi u čvoru imaju istu vrijednost ciljne varijable,

čvor je čist;

� svi zapisi u čvoru imaju iste vrijednosti za sve ostale

atribute;

� dubina stabla (broj slojeva, odnosno grananja) je

dosegnula preddefiniranu vrijednost;

� broj zapisa u čvoru je manji od preddefiniranog

minimalnog broja zapisa za pojedini čvor;

� najbolja podjela je manja od preddefinirane vrijednosti

minimalne promjene nečistoće.

Iz prikaza algoritma je vidljivo da pored klasične stablaste strukture

karakteristične za sva stabla odlučivanja ima i mogućnosti parametriziranja. U

daljnjem opisu će biti prikazano parametriziranje pogodno za modeliranje

problematike pogonske čvrstoće.

5.5. Modeliranje

Modeliranje je obavljeno sa četiri osnovne skupine modela. Za svaku od dvije

odabrane metode predviđanja (neuralne mreže i C&RT) su razvijani modeli koji

predviđaju naprezanje (Sa) koje uzorak može izdržati pri zadanom broju ciklusa

Marko Šušnjar – Doktorska disertacija

78

(Nf) i modeli koji predviđaju broj ciklusa koje pojedini uzorak može izdržati pri

zadanom opterećenju.

Tablica 5.11 Skupine modela

Neuralne mreže (NN) Klasifikacijska i regresijska

stabla odlučivanja (C&RT)

Predikcija naprezanja (Sa) I skupina modela II skupina modela

Predikcija broja ciklusa (Nf) III skupina modela IV skupina modela

Svaka od skupina modela je modelirana nezavisno te su na kraju rezultati

predikcije međusobno uspoređeni.

5.5.1. Podjela ulaznih podataka

Ulazni podaci su za svaku od skupina pripremljeni na jednak način. Raspoloživi

set ulaznih podataka je podijeljen na tri dijela.

- Set za učenje (training data set)

- Set za testiranje (testing set)

- Verifikacijski set (validation set)

Za sve četri skupine modela odabran je jedinstveni validacijski set. Kako bi se

osigurala mogućnost međusobne usporedbe rezultata validacijski set je u

potpunosti izostavljen iz podataka koji su se prezentirali metodama, te je korišten

za krajnju verifikaciju točnosti metoda.

Kao validacijski set je korišten cjelokupan set podataka pokusa pod oznakom

155-052 iz literature [34], [35], [36]. Materijal pokusa je JIS S30C. U tablici 5.12

su prikazani parametri pokusa iz literature koji ujedno predstavljaju zajedničke

atribute za sve ulazne validacijske podatke.

Marko Šušnjar – Doktorska disertacija

79

Tablica 5.12 Zajednički atributi validacijskog seta podataka

Series Specimen Fatigue

At 1E7 Cycles MPa

Specimen Stress

Concetration Factor

Test Stress

Ratio

Sigma m

S30C 155-052 120 2.26 -1 0

Chemical

C

Chemical

Si

Chemical

Mn

Chemical

P

Chemical

S

Chemical Cu

S30C 155-052 0.31 0.48 0.7 0.02 0.019 0.1

Tensile

Yield

MPa

Tensile

Strenght

MPa

Specimen

Shape

Speciman

Surface

Heat

Tretman

Post Heat

Tretman

S30C 155-052 333 518 1 3 0 0

Validacijski set ima ukupno 12 zapisa diskretiziranih iz njegova Wӧhlerovog

pravca (slika 5.5) u procesu pripreme podataka. Set podataka je prikazan u

tablici 5.13.

Marko Šušnjar – Doktorska disertacija

80

Tablica 5.13 S-N vrijednosti validacijskog seta

Slika 5.5 Wӧhlerov pravac validacijskog seta

Set podataka prezentiran metodama u procesu modeliranja i učenja podijeljen je

na set za učenje i set za testiranje u odnosu 80:20. Znači da je 80% podataka

označeno kao set podataka za učenje, dok je 20% podataka kao set podataka za

Nf u [103] Sa [MPa]

10 200.415

100 157.962

200 145.182

400 132.402

600 124.927

800 119.623

1000 115.509

1200 112.147

1400 109.305

1600 106.843

1800 104.671

2000 102.729

Marko Šušnjar – Doktorska disertacija

81

testiranje u procesu učenja. Podjela je obavljena u potpunosti randomizirano bez

ikakvih pravila. Ista podjela je korištena u sve četiri skupine modela.

5.5.2. Parametriziranje metoda

Parametrizacija metoda je bitna i jako utječe na točnost rezultata predikcije. U

literaturi ne postoji egzaktno pravilo kako parametrizirati metode već samo

smjernice ovisno o karakteristici ulaznih podataka. U pripremi rezultata

napravljeno je mnogo modela te su dobiveni optimalni parametri pogodni za

modeliranje problema Pogonske čvrstoće.

- Parametriziranje metode neuralnih mreža

Postoje dvije osnovne skupine parametara koji su raspoloživi za podešavanje

Neuralnih mreža.

Prva skupina je topologija mreže, a odnosi se na broj neurona i broj slojeva.

Dva preddefinirana sloja kod modeliranja su ulazni i izlazni sloj. Pri

modeliranju ulazni sloj je jednak broju ulaznih varijabli. U konkretnom slučaju

ove numeričke verifikacije, ulazni sloj ima 17 neurona. Izlazni sloj sadrži samo

jedan neuron pošto se u oba slučaja traži samo jedna izlazna varijabla.

Sljedeće što je potrebno definirati u topologiji mreže je broj skrivenih slojeva

(hidden layer) te broj neurona u svakom od njih. Problemu određivanja broja

slojeva i broja neurona se može pristupiti na način da se eksperimentalno

utvrdi najbolje rješenje za svaki pojedini slučaj modeliranja ili da se koristi

poseban algoritam koji utvrđuje optimalan broj neurona u sloju.

U disertaciji je korišten eksperimentalni način tako da su razvijani modeli s

raznim kombinacijama te su testirani na validacijskom setu. Algoritam za

pronalaženje optimalnog broja neurona je korišten u pripremi, međutim, nije

dao dovoljno dobre rezultate.

Algoritam radi tako da pronalazi optimalan broj neurona u skrivenom sloju u

odnosu na set ulaznih podataka namijenjen za testiranje, što nije dovoljno za

kriterij točnosti korišten u ovoj disertaciji. On radi tako da u početnim ciklusima

Marko Šušnjar – Doktorska disertacija

82

propagacije podataka kroz mrežu koristi veliki broj neurona u skrivenom sloju

te ih postupno smanjuje tako što reducira one s malim vrijednostima težina

veza. Kada dosegne kriterij zaustavljanja procesa učenja, prezentira

optimalan broj neurona u skrivenom sloju.

Pri modeliranju I. i III. skupine modela korištene su neuralne mreže s jednim i

dva skrivena sloja te su varirane kombinacije neurona dok s nije pronašla

kombinacija s minimalnom apsolutnom greškom. U pripremnim istraživanjima

pri modeliranju su korištena i tri skrivena sloja. Neuralne mreže s tri sloja su

relativno zadovoljavale kriterije točnosti modeliranja, međutim rezultati

provjere na verifikacijskom sloju nisu bili zadovoljavajući.

Slika 5.6 Neuralne mreže s jednim skrivenim slojem

Marko Šušnjar – Doktorska disertacija

83

Slika 5.7 Neuralne mreže s dva skrivena sloja

Druga skupina su numerički parametri mrežnog algoritma. Parametri su

teorijski opisani u dijelu 5.4.1. disertacije. Njihova primjena i podešavanje u

praktičnom procesu modeliranja izgledaju ovako:

o Način zaustavljanja pocesiranja

Proces učenja se odvija u ciklusima, pri čemu se na kraju

svakog ciklusa provjerava je li dosegnut kriterij zaustavljanja

učenja. Standardno se koriste tri kritetija učenja

� Postignuta točnost

� Ukupan broj ciklusa učenja

� Ukupno vrijeme učenja

Kod svih modeliranja je korišten kriterij postignute točnosti. Važno je

napomenuti da algoritam pod točnosti podrazumijeva računanje

greške predikcije u odnosu na testni set a ne validacijski.

Validacijska provjera se radila naknadno i služila je za međusobnu

usporedbu algoritama. Kriterij postignute točnosti služi isključivo za

zaustavljanje procesa učenja.

Marko Šušnjar – Doktorska disertacija

84

Vrijednost kriterija je postavljena na 92% točnosti. U procesima

modeliranja korištene su i veće vrijednosti ali se uočilo da u

slučajevima kada se ova vrsta točnosti postavlja na višu razinu

opada točnost predikcije na validacijskom setu što je nepoželjno za

konačan rezultat modela. Vrijednost od 92% se pokazala

optimalnom.

o Prevencija preučavanja (overtraining) mreže

Parametar koji dodatno dijeli set za učenje na particije kako bi

dodatno randomizirao redoslijed prikaza podataka mreži. Svrha

dodatnog particioniranja je izbjegavanje stanja kada mreža jako

dobro mapira podatke za učenje a nije u stanju mapirati ostale

setove podataka.

Vrijednost parametra prevencije preučavanja je uspješno

postavljena na 50%.

o Randomizacija inicijalnih mrežnih težina

Parametar koji randomizira inicijalne težine veza među

neuronima kod svakog novog procesa učenja mreže. Ovaj

parametar nije korišten pri modeliranju u disertaciji jer bi narušio

mogućnost međusobne usporedbe modela. Bez njega su modeli

svaki put startali s istim inicijalnim vrijednostima težina veza te

su njihovi rezultati bili međusobno usporedivi.

o Parametar kontrole učenja mreže

� Persistencija mreže

Parametar koji definira broj ciklusa koje će mreža nastaviti

obrađivati u procesu učenja bez da se dogodi poboljšanje u

točnosti. Ovaj parametar osigurava „preskakanje“ lokalnih

minimuma.

Vrijednost parametra koji je korišten je 200 ciklusa sukladno

preporuci literature [27].

Marko Šušnjar – Doktorska disertacija

85

� Momentum učenja (α)

Korištena je veličina 0.9 po preporuci literature [27], koja je

dala najbrži gradijent učenja mreže.

� Parametar učenja (η) se mijenja tijekom učenja kako je

opisano u 5.4.1. Proces učenja započinje s inicijalnom

vrijednošću zatim se logaritamski mijenja prema donjoj te

se opet postavlja na gornju te pada prema donjoj

vrijednosti u procesu učenja. Korak mijenjanja je definiran

kao d u 5.4.1.

Vrijednosti koje su postigle najbrži proces učenja su

sljedeće:

• Inicijalni η = 0.3

• Gornji η = 0.1

• Donji η = 0.01

• Korak d = 30

- Parametriziranje C&RT metode

CR&T metoda spada u skupinu stabala odlučivanja koja po svojoj

algoritamskoj karakteristici imaju kao osnovni parametar način

grananja odnosno stvaranja novih slojeva. Algoritmi podržavaju dva

osnovna načina grananja

o Automatsko generiranje novih slojeva

Algoritam automatski generira nove čvorove prema kriterijima i na

način kako je to teorijski opisano u 5.4.2.

o Ručno utjecanje na grananje (eng. „prunning“)

Marko Šušnjar – Doktorska disertacija

86

Iteraktivni rad u procesu modeliranja gdje ekspert može zaustaviti

grananje u bilo kojem čvoru te donositi odluke o daljnjem grananju

na osnovi ekspertnog znanja i iskustva.

Pri modeliranju C&RT metodom u disertaciji je korišteno automatsko

grananje. Cilj je dobiti generaliziranu metodu koja modelira probleme u

Pogonskoj čvrstoći. Korištenje ekspertnog znanja u numeričkom dijelu bi

usko specijaliziralo metodu i učinilo je ovisnom o parametrima koji se ne

mogu generalizirati (znanje, iskustvo i sposobnost eksperta). To su razlozi

zbog kojih nije korištena mogućnost ručnog utjecanja na proces grananja

modela.

o Skupina parametara vezana uz mjeru nečistoće je opisana u

teorijskom prikazu algoritma, dio 5.4.2. Tri indeksa koja se

koriste u izračunu mjere nečistoće:

• Gini

• Twoing

• Least Squared Deviation

Po svojim algebarskim karakteristikama Last Square Deviation

index je najprimjereniji u modeliranju diskontinuiranih varijabli,

stoga je on i primijenjen u modeliranju.

o Parametar minimalne promjene nečistoće definira graničan

slučaj nakon čega se provodi dijeljenje na dva nova čvora. Pri

modeliranju je korištena vrijednost ovog parametra 0.0001.

o Parametar dubine grananja

Označava broj razina grananja ispod prvog čvora.

Eskperimentiranjem je pronađena optimalna brojka od 8 slojeva

za ovo konkretno modeliranje sa 17 ulaznih varijabli i 1

izlaznom.

Marko Šušnjar – Doktorska disertacija

87

5.6. Proces učenja

Proces učenja se sastoji od prezentiranja seta podataka za učenje i korekcije

greške utvrđene na setu podataka za testiranje. Proces učenja je po algoritmu

svake od metoda i potpuno je automatiziran.

Na slikama 5.8 i 5.9 je prikazana grafička mogućnost praćenja procesa učenja

kod metode Neuralnih mreža. Slika 5.8 prikazuje trenutnu postignutu točnost

(crvena linija) u odnosu na najbolju postignutu točnost (plava linija). Slika 5.9

pokazuje točnost predikcije na setu podataka za učenje (zelena linija) i točnost na

setu podataka za testiranje (ljubičasta linija).

Slika 5.8 Prikaz procesa učenja i propagacije uspješnosti kod neuralnih

mreža

Slika 5.9 Prikaz razlike rezultata kod seta podataka za učenje i seta za

testiranje

Marko Šušnjar – Doktorska disertacija

88

5.7. Analiza rezultata numeričkog modeliranja

Analiza točnosti predstavlja utvrđivanje točnosti s kojom model može

generalizirati slučajeve koju su mu predstavljeni u setu za provjeru, na osnovi

učenja na setu podataka particioniranom za učenje. Točnost modela je u sve

četiri skupine postavljena u području više od 91%. Znači da je model nakon

procesa učenja u stanju pogoditi više od 91% slučajeva iz seta podataka za

provjeru. U procesu modeliranja pojedini modeli su imali mogućnost postizanja

točnosti i preko 98%, međutim pokazalo se da su takvi modeli „pretrenirani“ te su

lošije predviđali rezultate seta za verifikaciju.

Analiza predviđanja predstavlja utvrđivanje s kolikom točnošću model može

predvidjeti izlazne vrijednosti seta podataka za verifikaciju. Predviđanje će biti

objašnjeno za svaku skupinu modela.

Mjerilo greške je definirano kao prosječna greška po apsolutnom iznosu za

jednu predikciju. Računa se kao:

� ∑ 1�����"�$"%& � �5.15� Gdje je broj slučajeva u setu za verifikaciju, a greška svakog pojedinog

slučaja.

5.7.1. Naprezanje kao izlazna varijabla

- Modeliranje metodom Neuralnih mreža

o Mreža s jednim skrivenim slojem

Modeliranje je obavljeno na više modela s različitim brojem neurona

u skrivenom sloju. Rezultati su prikazani na slici 5.10. Najbolji

rezultat je postignut s modelom koji je imao 18 neurona u skrivenom

sloju. Najmanja dobivena greška je 7,2%.

Marko Šušnjar – Doktorska disertacija

89

Slika 5.10 Odnos greške i broja neurona u skrivenom sloju

o Mreža s dva skrivena sloja

Za ovaj tip mreže napravljeno je nekoliko modela s različitim

kombinacijama neurona u svakom od skrivenih slojeva. Optimalnim

se pokazala kombinacija s 38 neurona u prvom skrivenom sloju i 8

neurona u drugom skrivenom sloju. Najmanja dobivena greška je

6,88%

Slika 5.11 Odnos greške i brojeva neurona u 1. i 2. skrivenom sloju

- Modeliranje metodom C&RT

Metoda C&RT nije imala opcije modeliranja koje bi utjecale na grešku kao

kod NN metode. Rezultat modeliranja je stablo odlučivanja prikazano na

slici 5.12. Prosječna greška koju je metoda postigla u ovoj skupini

modeliranja je 17,866%.

Marko Šušnjar – Doktorska disertacija

90

Slika 5.12 Model C&RT metode za predikciju naprezanja

Marko Šušnjar – Doktorska disertacija

91

5.7.2. Broj ciklusa kao izlazna varijabla

- Modeliranje metodom Neuralnih mreža

o Mreža s jednim skrivenim slojem

Modeliranje je obavljeno, kao u prethodnom slučaju, na više modela

s različitim brojem neurona u skrivenom sloju. Rezultati su prikazani

na slici 5.13. Najbolji rezultat je postignut s modelom koji je imao 36

neurona u skrivenom sloju. Najmanja dobivena greška je 1,41%.

Slika 5.13 Odnos greške i broja neurona u skrivenom sloju

o Mreža s dva skrivena sloja

Napravljeno je nekoliko modela s različitim kombinacijama neurona

u svakom od skrivenih slojeva. Kombinacija s 34 neurona u prvom

skrivenom sloju i 7 neurona u drugom skrivenom sloju se pokazala

optimalnom. Najmanja dobivena greška je 1,01%.

Marko Šušnjar – Doktorska disertacija

92

Slika 5.14 Odnos greške i broja neurona u 1. i 2. skrivenom sloju

- Modeliranje metodom C&RT

Stablo odlučivanja dobiveno kao rezultat modeliranja C&RT metodom i Nf

kao ciljnom varijablom prikazano je na slici 5.15. Prosječna greška

postignuta ovom metodom je 4,55%.

Marko Šušnjar – Doktorska disertacija

93

Slika 5.15 Model C&RT metode za predikciju broja ciklusa opterećenja

Marko Šušnjar – Doktorska disertacija

94

- Analiza točnosti predikcije

Slika 5.16 Grafički prikaz rezultata predikcijskih modela

Tablica 5.14 Prikaz najnižih grešaka postignutih pojedinim skupinama

modela

Neuralne mreže C&RT

Ciljna varijabla:

naprezanje (Sa)

1 HL 18 neurona 7,2%

17,866% 2 HL 38/8 neurona 6,88%

Ciljna varijabla:

broj ciklusa (Nf)

1 HL 36 neurona 1,41%

4,55% 2 HL 34/7 neurona 1,01%

Skupni rezultati numeričkog modeliranja prikazani su u tablici 5.14.

Najbolje rezultati su postignuti korištenjem neuralnih mreža kao prediktivne

metode. Topologija koja je dominirala u točnosti predikcije je ona s dva

Marko Šušnjar – Doktorska disertacija

95

skrivena sloja u kombinaciji od 34 neurona u prvom skrivenom sloju te 7

neurona u drugom skrivenom sloju.

5.8. Diskusija o numeričkoj verifikaciji

Numerička verifikacija ima cilj pronaći optimalnu kombinaciju metoda predikcija te

njenih parametara za modeliranje. Pored toga potrebno je pronaći i način te

optimalnu strukturu ulaznih parametara za uspješno modeliranje problema

pogonske čvrstoće.

Metoda neuralnih mreža je dala najbolje rezultate. Dosadašnja istraživanja su

upućivala na to jer je upravo ova metoda najzastupljenija u literaturi. Metoda vrlo

uspješno generalizira problem i daje vrlo upotrebljive modele.

Metoda stabala odlučivanja, C&RT, je očekivano dala lošije rezultate nego

metoda Neuralnih mreža.

Kompenzacija koju C&RT metoda nudi nije zanemariva, njeni modeli su čitljivi i

nisu skriveni iza kombancija težina veza kao kod neuralnih mreža. Vidljivo je iz

slika 5.12 i 5.15. Nadalje C&RT ostavlja široko područje za unapređivanje jer ima

mogućnost ekspertnog utjecaja na sam proces učenja, koji Neuralne mreže ne

nude. Rezultat najbolje greške koja je postignuta C&RT metodom od 4,55% je

vrlo ohrabrujući i ostavlja prostora za unapređivanja.

Ulazni parametri te odabir ciljne varijable imaju jako veliki utjecaj na točnost

predikcije. Istraživanje je pokazalo značajnu razliku u točnosti predikcije broja

ciklusa koje će uzorak izdržati za poznato naprezanje u odnosu na točnost

predikcije naprezanja koje će uzorak izdržati za poznati broj ciklusa.

Neuralne mreže su točnije u predikciji broja ciklusa u odnosu na predikciju

naprezanja i to u omjerima od 510% veće točnosti za mreže s jednim skrivenim

slojem te 680% veće točnosti za mreže s dva skrivena sloja.

C&RT ima sličnu razliku točnosti u predikciji broja ciklusa u odnosu na predikciju

naprezanja i to veće za 397%.

Marko Šušnjar – Doktorska disertacija

96

Sukladno opisanom istraživanju broj ciklusa je ciljna varijabla izbora kod

modeliranja Wӧhlerovih pravaca u Pogonskoj čvrstoći.

Razlog tolike razlike se pronalazi u distribuciji varijable u setovima podataka za

učenje i testiranje, zbog načina uniformnog uzorkovanja podataka iz Wӧhlerovih

pravaca. Slika 5.17 prikazuje razliku uniformnosti distribucije Nf kao ciljne

varijable. Uočljivo je da je Nf popunjen po svakoj od svojih odabranih

diksretiziranih vrijednosti.

Slika 5.17 Distribucija broja ciklusa (Nf) u odnosu na opterećenje (Sa) u

podacima za modeliranje

Uspjeh modeliranja i točnosti pogađanja broja ciklusa leži u uniformnosti

diskretizacije po Nf osi. Metode uspješno pogađaju jer su uspjele mnogo bolje

generalizirati problem. Ukoliko bi se pokušala raditi predikcija za bilo koju drugu

vrijednost Nf koja nije u setu prikazanom u tablici 5.9, rezultati bi bili u potpunosti

nezadovoljavajući. Za uspješnost ove metode to nije ni bitno jer je cilj pronaći

Wӧhlerov pravac za novi materijal koju ova metoda numerički može odrediti sa

zadovoljavajućom greškom.

Marko Šušnjar – Doktorska disertacija

97

6. Eksperimentalna verifikacija metode

Eksperimentalna verifikacija metode se temelji na usporedbi rezultata predikcije

vijeka trajanja koje daje metoda i stvarnih rezultata vijeka trajanja dobivenih

eksperimentima na testnoj opremi. Odabrana su dva materijala za uzorke te po tri

različita koncetratora naprezanja na svakom materijalu. Dobiveno je ukupno 6

uzoraka s odgovarajućim setovima rezultata eksperimenata, te isto toliko

Wöhlerovih krivulja.

Verifikacija je napravljena na svih 6 Wöhlerovih krivulja, kako je opisano dalje u

poglavlju.

6.1. Pregled uzoraka

Odabir uzorka za eksperimentalnu verifikaciju metode se temeljio na tehničkim

mogućnostima dostupne opreme. Oprema ima ograničenja u gabaritima prihvata

uzorka, sili koju može narinuti u postupku ispitivanja, te frekvenciji koju može

postići.

Verifikacijski uzorak ima analogiju s uzorcima iz literature na kojima je napravljen

prediktivni model. Analogija se odnosi na parametre iz literature koji se neće

varirati u postupku ispitivanja. Parametri koji su zajednički s ispitivanjem iz

literature su:

- temperatura na kojoj se provode pokusi (sobna temperatura ≈20oC) ,

- atmosfera u kojoj se provode pokusi (zrak),

- uzorak u obliku okrugle šipke,

- aksijalno opterećenje vlak-tlak.

6.1.1. Materijal uzorka

Odabrane su dvije vrste materijala za uzorke. Radi se o čeliku po proizvođačkim

oznakama S355J2+C klasifikacijskog standarda EN 10277-5 i čeliku C45E+C

Marko Šušnjar – Doktorska disertacija

98

klasifikacijskog standarda EN 10277-2. Ekvivalentne oznake po Hrvatskom

zavodu za norme (HRN) su Č 1430 i Č 1530.

Karakteristike materijala su prikazane u tablicama 6.1 i 6.2.

Tablica 6.1 Kemijske karakteristike materijala prema deklaraciji proizvođača

C

(%)

Mn

(%)

Si

(%)

P

(%)

S

(%)

Cu

(%)

Cr

(%)

Ni

(%)

Al

(%)

Mo

(%)

V

(%)

S355J2C+C 0,19 1,33 0,29 0,015 0,016 0,05 0,08 0,03 0,032 0,005 0,004

S45E+C 0,43 0,56 0,24 0,02 0,019 - 0,07 0,03 - 0,01 -

Tablica 6.2 Mehaničke karakteristike materijala prema deklaraciji proizvođača

Granica razvlačenja

(MPa)

Prekidna čvrstoća

(MPa)

Produljenje

(%)

S355J2C+C 582 652 19

S45E+C 711 852 13

Materijal je pribavljen u obliku hladno vučenih okruglih šipki promjera 12mm.

Potrebna strojna obrada isjecanja rezanjem te tokarenjem sa propisanim

režimima je napravljena u laboratoriju Zavoda za strojarsku tehnologiju FESB-a

Split.

6.1.2. Oblik uzorka

Uzorci su napravljeni izrezivanjem iz osnovnog materijala tako da su zadržali

promjer od 12 mm. Dužina uzorka ovisi o pokusu koji je na njemu rađen.

Obavljene su dvije osnovne skupine pokusa: statičko i dinamičko.

Marko Šušnjar – Doktorska disertacija

99

- Oblik uzorka za statičko ispitivanje

Oblik uzorka za statičko ispitivanje je prikazan na slici 6.1.

Slika 6.1 Uzorak za statičko ispitivanje

Uzorak za statičko ispitivanje je strojno obrađen tako da mu je promjer

smanjen na 6 mm. Radi smanjivanja koncentracije naprezanja

napravljeni su blagi prijelazi s nazivnog promjera (12 mm) na testni

promjer (6 mm). Izračun minimalne potrebne dužine L0 napravljen je

prema:

�� ��o��� (6.1)

Kako je k = 5.85 [23], te je L0 ≈ 31mm

Izrađeni uzorak prikazan je na slici 6.2.

Slika 6.2 Oblik uzorka za statičko ispitivanje

- Oblik uzorka za dinamičko ispitivanje

Skica uzorka za dinamičko ispitivanje prikazana je na slici 6.3.

Marko Šušnjar – Doktorska disertacija

100

Slika 6.3 Uzorak za dinamičko ispitivanje

Svi uzorci su istih vanjskih dimenzija. Varijacije koje su rađene radi

postizanja različitih koeficijenata naprezanja su u izvedbi utora. Utori te

koncentracije naprezanja će biti opisane u sljedećem poglavlju.

Slika 6.4 Oblik uzorka za dinamičko ispitivanje

6.1.3. Koncentracija naprezanja na uzorcima za dinamičko ispitivanje

Geometrijske karakteristike utora na uzorcima su takve da daju tri različita

koeficijenta koncentracije naprezanja. Koeficijenti koncentracije naprezanja su

izračunati numerički te preuzeti iz literature [30].

Na slikama 6.5, 6.6, 6.7 su prikazana sva tri utora koji su izvedeni na uzorcima za

eksperimente.

Marko Šušnjar – Doktorska disertacija

101

Slika 6.5 Detalj uzorka s utorom r = 0 mm

Slika 6.6 Detalj uzorka s utorom r = 0,4 mm

Slika 6.7 Detalj uzorka s utorom r = 1 mm

Marko Šušnjar – Doktorska disertacija

102

Izvedba utora uzoraka nakon strojne obrade je prikazana na slikama 6.8, 6.9,

6.10.

Slika 6.8 Utor uzorka nakon strojne obrade, r = 0 mm

Slika 6.9 Utor uzorka nakon strojne obrade, r = 0,4 mm

Slika 6.10 Utor uzorka nakon strojne obrade, r = 1 mm

Marko Šušnjar – Doktorska disertacija

103

6.1.4. Određivanje koeficijenta koncentracije naprezanja

Koeficijent koncentracije naprezanja za sva tri tipa uzorka određen je iz literature

[30].

Napravljena je i dodatna provjera metodom konačnih elemenata. Za proračun je

korišten programski paket za FEM analizu CATIA [40]. Modelirana su sva tri utora

te verificirani faktori koncentracija naprezanja. Modeli su prikazani na slikama

6.11 – 6.16.

Koeficijenti koncentracije naprezanja su prikazani u tablici 6.3. U daljnjem

proračunu su se koristili koeficijenti dobiveni iz literature. Razlog odabira je

referenciranje na koeficijente koncentracije naprezanja koji su se koristili u

procesu učenja metoda. Izvorni podaci iz literature [34], [35], [36] su nastali u

dugom vremenskom razdoblju i neki datiraju iz '70-ih godina prošlog stoljeća

kada metoda konačnih elemenata nije bila u široj uporabi kao danas.

Tablica 6.3 Koeficijenti koncentracije naprezanja za uzorke

Uzorak Koeficijent koncentracije naprezanja

Metoda konačnih elemenata Literatura

S35 R0 8.6 5.2

S45 R0

S35 R04 4.77 2.94

S45 R04

S35 R10 3.16 2.34

S45 R10

Marko Šušnjar – Doktorska disertacija

104

Slika 6.11 Mreža konačnih elemenata za uzorak r = 0 mm

Slika 6.12 Koncentracija naprezanja za uzorak r = 0 mm dobivena metodom

konačnih elemenata

Marko Šušnjar – Doktorska disertacija

105

Slika 6.13 Mreža konačnih elemenata za uzorak r = 0,4 mm

Slika 6.14 Koncentracija naprezanja za uzorak r = 0,4 mm dobivena metodom

konačnih elemenata

Marko Šušnjar – Doktorska disertacija

106

Slika 6.15 Mreža konačnih elemenata za uzorak r = 1 mm

Slika 6.16 Koncentracija naprezanja za uzorak r = 1 mm dobivena metodom

konačnih elemenata

Marko Šušnjar – Doktorska disertacija

107

6.2. Eksperimentalno određivanje vijeka trajanja uzorka

6.2.1. Korištena oprema

Eksperimenti su provedeni na opremi „Instron 8801“. Radi se o servohidrauličkoj

umaralici s mogućnošću dinamičkog i statičkog aksijalnog opterećenja do 100 kN.

Umaralica je opremljena računalnim kontrolnim modulom tako da je cijeli

postupak ispitvanja svakog pojedinog uzorka popraćen digitalnim zapisima

svakog pojedinog parametra.

Slika 6.17 Umaralica „Instron 8801“ Katedre za konstrukcije, FESB-a Split

Marko Šušnjar – Doktorska disertacija

108

Slika 6.18 Učvršćeni uzorak u čeljustima umaralice

6.2.2. Postupak ispitivanja

- Statičko ispitivanje

Statičko ispitivanje je obavljeno na uzorcima opisanim u poglavlju

6.1.2. Oba materijala su testirana na po tri uzorka. Svaki uzorak je

podvrgnut vlačnom opterećenju te su snimani dijagrami F-δ (sila-

pomak) i σ–ε (naprezanje-deformacija). Cilj je bio odrediti vlačnu

čvrstoću i tehničku granicu tečenja. Rezultati statičkog ispitivanja su

prikazani u poglavlju 6.3.

Slika 6.19 Izgled loma uzorka nakon statičkog ispitivanja

Marko Šušnjar – Doktorska disertacija

109

- Dinamičko ispitivanje

Dinamičko ispitivanje je napravljeno na ukupno 55 uzoraka svrstanih u

šest skupina. Za svaki materijal po tri, s različitim koeficijentima

koncentracije naprezanja. Uzorci su opterećivani promjenjivim vlak-tlak

opterećenjem. Frekvencija promjene opterećenja na svim ispitivanjima

je bila 10 Hz. Kriterij otkaza je bio lom uzorka. Tijekom ispitivanja se

snimao broj ciklusa opterećenja do loma za svaki pojedini uzorak.

Rezultati dinamičkog ispitivanja su prikazani u poglavlju 6.3.

Slika 6.20 Primjer izgleda loma uzorka nakon dinamičkog ispitivanja

Marko Šušnjar – Doktorska disertacija

110

6.3. Rezultati ispitivanja

6.3.1. Statičko ispitivanje

Rezultati statičkog ispitivanja u obliku odnosa sila-pomak su prikazani na slici

6.21.

Slika 6.21 Dijagram sila-pomak statičkog ispitivanja

Statičko ispitivanje je obavljeno na po 3 uzorka od svakog materijala. Rezultati

prikazani u tablici 6.4 su pokazali određeno odstupanje od deklariranih

proizvođačkih vrijednosti.

Marko Šušnjar – Doktorska disertacija

111

Tablica 6.4 Rezultati statičkog ispitivanja

Statičko ispitivanje pokazalo je razlike u vrijednostima dobivenih pokusima i

deklaracije proizvođača. Srednje vrijednosti dobivene ispitivanjem će se koristiti u

analizi, zaokružene na cijeli broj [MPa]. Deklariranje proizvođačke vrijednosti

statičke vlačne čvrstoće i tehničke granice tečenja će biti zanemarene u ovom

istraživanju.

6.3.2. Dinamičko ispitivanje

Dinamičkim ispitivanjem ukupno je obuhvaćeno 55 uzoraka. Uzorci su podijeljeni

u 6 grupa ovisno o materijalu i koncentraciji naprezanja. Označavanje uzoraka je

prikazano u tablici 6.5.

Materijal

Eksperimentalni rezultati Vrijednosti iz

proizvođačke deklaracije

Statička

vlačna

čvrstoća

[MPa]

Srednja

vrijednost

[MPa]

Tehnička

granica

tečenja

[MPa]

Srednja

vrijednost

[MPa]

Statička

vlačna

čvrstoća

[MPa]

Tehnička

granica

tečenja

[MPa]

S355J2C+C

1. 699

705.3

524

513.6

652

582 2. 714 512

3. 703 505

S45E+C

1. 871

867.7

759

741.7

825

711 2. 883 764

3. 849 702

Marko Šušnjar – Doktorska disertacija

112

Tablica 6.5 Označavanje uzoraka dinamičkog ispitivanja

Materijal

uzorka

Oznaka

uzorka

Opis Broj provedenih ispitivanja po

pojedinom uzorku

S355J2C+C

S35 R0 Utor na uzorku r = 0 mm 10

S35 R04 Utor na uzorku r = 0.4 mm 7

S35 R10 Utor na uzorku r = 1 mm 8

S45E+C

S45 R0 Utor na uzorku r = 0 mm 7

S45 R04 Utor na uzorku r = 0.4 mm 10

S45 R10 Utor na uzorku r = 1 mm 13

Rezultati ispitivanja prikazani su u tablicama: 6.6 - 6.11.

Tablica 6.6 Rezultati dinamičkog ispitivanja za uzorak S35 R0

S35 R0

Naprezanje

(MPa)

Broj

ciklusa do

loma

445.64 21368

445.64 18696

445.64 14998

381.98 50849

381.98 38854

318.31 80302

318.31 68828

318.31 76111

254.65 180336

190.99 >106

Marko Šušnjar – Doktorska disertacija

113

Tablica 6.7 Rezultati dinamičkog ispitivanja za uzorak S35 R04

S35 R04

Naprezanje

(MPa)

Broj

ciklusa do

loma

445.64 26414

445.64 31861

381.98 51645

381.98 49992

318.31 114464

318.31 129981

254.65 755929

Tablica 6.8 Rezultati dinamičkog ispitivanja za uzorak S35 R10

S35 R10

Naprezanje

(MPa)

Broj

ciklusa do

loma

509.30 24737

509.30 22562

445.64 65045

445.64 50163

381.98 161257

381.98 112236

318.31 >1.4∙106

254.65 >106

Tablica 6.9 Rezultati dinamičkog ispitivanja za uzorak S45 R0

S45 R0

Naprezanje

(MPa)

Broj

ciklusa do

loma

445.64 16120

445.64 17399

381.98 29622

318.31 41381

318.31 59847

254.65 127287

190.99 751320

Marko Šušnjar – Doktorska disertacija

114

Tablica 6.10 Rezultati dinamičkog ispitivanja za uzorak S45 R04

Tablica 6.11 Rezultati dinamičkog ispitivanja za uzorak S45 R10

Wöhlerove krivulje su konstruirane za svaki uzorak na osnovi rezultata ispitivanja,

korištenjem linearne regresije. Napravljena je interpolacija pravcima u

logaritamskom mjerilu te je za svaki pravac dobivena odgovarajuća algebarska

jednadžba pravca.

S45 R04

Naprezanje

(MPa)

Broj

ciklusa do

loma

445.64 21559

445.64 20590

445.64 20103

381.98 49596

381.98 45622

381.98 30731

318.31 121495

318.31 91190

318.31 115320

254.65 279926

S45 R10

Naprezanje

(MPa)

Broj

ciklusa do

loma

509.30 3414

509.30 26742

509.30 24488

445.64 52850

445.64 52440

445.64 59503

381.98 213271

381.98 132345

381.98 147338

318.31 296908

318.31 > 1.4∙106

318.31 > 1.5∙106

254.65 > 3∙106

Marko Šušnjar – Doktorska disertacija

115

Wöhlerovi pravci za sve uzorke su prikazani na sljedećim slikama:

Slika 6.22 Wöhlerov pravac za uzorak S35 R0

Slika 6.23 Wöhlerov pravac za uzorak S35 R04

Marko Šušnjar – Doktorska disertacija

116

Slika 6.24 Wöhlerov pravac za uzorak S35 R10

Slika 6.25 Wöhlerov pravac za uzorak S45 R0

Marko Šušnjar – Doktorska disertacija

117

Slika 6.26 Wöhlerov pravac za uzorak S45 R04

Slika 6.27 Wöhlerov pravac za uzorak S45 R10

Marko Šušnjar – Doktorska disertacija

118

6.4. Primjena prediktivne metode na rezultate ispitivanja

Rezultati dobiveni eksperimentalnim ispitivanjem su iskorišteni za verifikaciju

prediktivnih metoda razvijenih u radu na ovoj disertaciji. Metode su opisane u

poglavlju 5. Verifikacija je obavljena na istoj podatkovnoj strukturi kao što je

opisano u poglavlju 5.2. Izuzetak su razredi uzorkovanja Wöhlerovih pravaca, koji

su napravljeni u drugačijim intervalima u odnosu na one iz poglavlja 5.3.

Prediktivne metode su reprocesirane tako da budu prilagođene uzorkovanju

primjenjenom na rezultate ispitivanja.

Prediktivne metode su odabrane za verifikaciju selekcijom na osnovi rezultata

numeričkog verificiranja. Odabrana je metoda neuralnih mreža s dva skrivena

sloja. Metoda stabala odlučivanja C&RT je primijenjena selektivno na određenim

primjerima s ciljem provjere mogućnosti njene primjene za ovakve slučajeve.

Odabir je napravljen na temelju rezultata prikazanih u tablici 5.11.

Neuralne mreže su odabrane u konfiguraciji s dva skrivena sloja. U prvom

skrivenom sloju su 34 neurona dok ih je u drugom 7, sukladno najboljem

postignutom rezultatu.

Stabla odlučivanja su odabrana u C&RT inačici s 8 slojeva grananja ispod prvog

sloja.

Ciljna prediktivna varijabla je odabran broj ciklusa sukladno najboljim rezultatima

numeričke verifikacije.

6.4.1. Ulazni podaci

Struktura ulaznih podataka je opisana u tablicama 5.5 - 5.8. Uzorci korišteni u

eksperimentalnom ispitivanju nisu bili toplinski obrađivani nakon tvorničke

isporuke te nije korišten ni jedan zapis iz tablice 5.6. Površinska obrada svih

uzoraka je bila ista, te su zapisi iz tablice 5.8 za sve uzorke bili isti (bez

površinske obrade). Svi su uzorci imali jednak oblik koncetratora naprezanja s

utorom, tako da je za sve korišten isti zapis iz tablice 5.7.

Marko Šušnjar – Doktorska disertacija

119

6.4.2. Uzorkovanje Wöhlerove krivulje

Wöhlerova krivulja, odnosno pravac u logaritamskom mjerilu, je uzorkovana s

drugačijim intervalima nego što je to bilo u poglavlju 5.3., radi područja na kojem

je obavljeno isptivanje u smislu broja ciklusa. Ispitivanje je obavljeno na višim

razinama opterećenja tako da su rezultati loma pozicionirani u nižim

vrijednostima ciklusa promjene opterećenja. Uzorkovanje je obavljeno s većom

gustoćom u području nižih ciklusa opterećenja. Broj točaka na kojima je

uzorkovan Wöhlerov pravac svakog pojedinog uzorka je 12 kao i u poglavlju 5.3.

Tablica 6.12 Točke uzorkovanja ciklusa opterećenja Wöhlerovih pravaca

N u 103 Log N

1 20 4.301

2 40 4.602

3 60 4.778

4 80 4.903

5 100 5

6 120 5.079

7 150 5.176

8 200 5.301

9 400 5.602

10 600 5.778

11 800 5.903

12 1000 6

6.4.3. Rezultati predikcije

Usporedni rezultati predikcije metodama neuralnih mreža odlučivanja su

prikazani na sljedećim slikama i tablicama.

Marko Šušnjar – Doktorska disertacija

120

Slika 6.28 Rezultati prediktivne metode za uzorak S35 R0

Marko Šušnjar – Doktorska disertacija

121

Slika 6.29 Rezultati prediktivne metode za uzorak S35 R04

Marko Šušnjar – Doktorska disertacija

122

Slika 6.30 Rezultati prediktivne metode za uzorak S35 R10

Marko Šušnjar – Doktorska disertacija

123

Slika 6.31 Rezultati prediktivne metode za uzorak S45 R0

Marko Šušnjar – Doktorska disertacija

124

Slika 6.32 Rezultati prediktivne metode za uzorak S45 R04

Marko Šušnjar – Doktorska disertacija

125

Slika 6.33 Rezultati prediktivne metode za uzorak S45 R10

Marko Šušnjar – Doktorska disertacija

126

Tablica 6.13 Tablični pregled rezultata prediktivne metode za uzorak S35 R0

Tablica 6.14 Tablični pregled rezultata prediktivne metode za uzorak S35 R04

Naprezanje (MPa)

Nazivne vrijednosti ciljne varijable (log

broja ciklusa) Predikcija

neuralnih mreža Greška

(%)

438.67 4.301 4.371 -1.62

371.04 4.602 4.525 1.67

331.48 4.778 4.731 0.99

303.42 4.903 4.879 0.49

281.65 5 4.987 0.25

263.86 5.079 5.072 0.13

242.09 5.176 5.176 -0.01

214.02 5.301 5.327 -0.50

146.39 5.602 5.957 -6.34

106.83 5.778 5.996 -3.79

78.77 5.903 5.997 -1.60

57 6 5.997 0.04

Prosječna apsolutna greška na 12 točaka: 1.45

Naprezanje (MPa)

Nazivne vrijednosti ciljne varijable (log

broja ciklusa) Predikcija

neuralnih mreža Greška

(%)

446.93 4.301 4.568 -6.22

406.00 4.602 4.634 -0.71

382.06 4.778 4.812 -0.73

365.07 4.903 4.970 -1.38

351.90 5 5.104 -2.09

341.13 5.079 5.216 -2.69

327.95 5.176 5.349 -3.3

310.97 5.301 5.505 -3.86

270.04 5.602 5.776 -3.11

246.10 5.778 5.868 -1.57

229.12 5.903 5.913 -0.17

215.94 6 5.937 1.03

Prosječna apsolutna greška na 12 točaka: 2.24

Marko Šušnjar – Doktorska disertacija

127

Tablica 6.15 Tablični pregled rezultata prediktivne metode za uzorak S35 R10

Tablica 6.16 Tablični pregled rezultata prediktivne metode za uzorak S45 R0

Naprezanje (MPa)

Nazivne vrijednosti ciljne varijable (log

broja ciklusa) Predikcija

neuralnih mreža Greška

(%)

504.76 4.301 4.445 -3.36

466.69 4.602 4.445 3.40

444.41 4.778 4.445 6.96

428.61 4.903 4.445 9.33

416.35 5 4.451 10.97

406.33 5.079 4.511 11.18

394.08 5.176 4.605 11.02

378.27 5.301 4.763 10.15

340.19 5.602 5.275 5.83

317.92 5.778 5.592 3.21

302.11 5.903 5.767 2.31

289.86 6 5.859 2.34

Prosječna apsolutna greška na 12 točaka: 6.67

Naprezanje (MPa)

Nazivne vrijednosti ciljne varijable (log

broja ciklusa) Predikcija

neuralnih mreža Greška

(%)

407.48 4.301 4.301 0.00

360.57 4.602 4.303 6.48

333.12 4.778 4.482 6.19

313.65 4.903 4.668 4.78

298.55 5 4.748 5.02

286.21 5.079 4.805 5.40

271.11 5.176 4.878 5.75

251.63 5.301 4.994 5.78

204.72 5.602 5.418 3.28

177.27 5.778 5.764 0.24

157.80 5.903 5.986 -1.42

142.70 6 5.999 0.01

Prosječna apsolutna greška na 12 točaka: 3.70

Marko Šušnjar – Doktorska disertacija

128

Tablica 6.17 Tablični pregled rezultata prediktivne metode za uzorak S45 R04

Tablica 6.18 Tablični pregled rezultata prediktivne metode za uzorak S45 R10

Na slikama 6.28 – 6.33 su prikazani grafovi usporedbe rezultata prediktivnih

metoda sa stvarnim rezultatima pokusa. Promatrani su dijelovi Wöhlerovih

pravaca prije nastanka trajne dinamičke čvrstoće. Područje trajne dinamičke

čvrstoće nije bilo predmet istraživanja ove doktorske disertacije.

Naprezanje (MPa)

Nazivne vrijednosti ciljne varijable (log

broja ciklusa) Predikcija

neuralnih mreža Greška

(%)

440.84 4.301 4.389 -2.05

391.12 4.602 4.603 -0.04

362.04 4.778 4.950 -3.61

341.40 4.903 5.252 -5.07

325.40 5 5.293 -5.87

312.32 5.079 5.422 -6.75

296.32 5.176 5.624 -8.47

275.68 5.301 5.871 -10.76

225.96 5.602 5.998 -7.07

196.88 5.778 5.999 -3.83

176.24 5.903 5.999 -1.63

160.24 6 5.999 0.01

Prosječna apsolutna greška na 12 točaka: 4.60

Naprezanje (MPa)

Nazivne vrijednosti ciljne varijable (log

broja ciklusa) Predikcija

neuralnih mreža Greška

(%)

479.32 4.301 4.399 -2.29

450.51 4.602 4.399 4.40

433.65 4.778 4.399 7.93

421.69 4.903 4.399 10.27

412.42 5 4.411 11.79

404.84 5.079 4.430 12.78

395.56 5.176 4.458 13.87

383.61 5.301 4.503 15.05

354.79 5.602 4.662 16.77

337.94 5.778 4.800 16.92

325.98 5.903 4.921 16.63

316.71 6 5.026 16.23

Prosječna apsolutna greška na 12 točaka: 12.08

Marko Šušnjar – Doktorska disertacija

129

Tablice 6.13 – 6.18 sadrže numerički prikaz prediktivnih rezultata u usporedbi sa

stvarnim vrijednostima S-N Wöhlerovih pravaca za pojedini uzorak.

CR&T metoda je uspješno primijenjena na primjeru S35 R04. Svrha je otvaranje

mogućnosti primjene stabala odlučivanja u pogonskoj čvrstoći, što do sada nije

bio slučaj. Rezultati su prikazani na slici 6.34 i numerički prikaz u tablici 6.19.

Slika 6.34 Rezultati prediktivnih metoda za uzorak S35 R04

Marko Šušnjar – Doktorska disertacija

130

Tablica 6.19 Tablični pregled rezultata prediktivnih metoda za uzorak S35 R04

6.4. Analiza rezultata predikcije

Primjena prediktivnih metoda na rezultate eksperimentalnih istraživanja je

pokazala njihovu točnost i područja iskoristivosti. Metoda neuralnih mreža je,

očekivano, pokazala bolje rezultate od stabla odlučivanja. Sličan odnos je uočen i

pri numeričkoj verifikaciji metode. Točnost metode se računala u postotnom

prikazu. Zbog logaritamske karakteristike prikaza ciklusa opterećenja tolerantnim

se smatra greška < 5% [43].

Primjena prediktivnih metoda na pokus S35 R0 je pokazala visoku točnost

predikcije neuralnih mreža. Greška od 1.45% je uzrokovana nešto većom

greškom metode kod predikcije opterećenja u području od 4·105 - 6·105, dok je u

ostalim točkama metoda pogađala s točnošću < 1%. Slika 6.28 pokazuje točnost

grafički tamo gdje se Wöhlerovi pravci dobiveni eksperimentima i predikcijom

neuralnih mreža podudaraju.

Predikcija pokusa S35 R04 je pokazala dobru točnost metode. Slika 6.29 grafički

pokazuje podudarnost Wöhlerovih pravaca dobivenih eksperimentom i

predikcijom metodom. Točnost metode je 2.24%. U ovom slučaju se primjećuje

gomilanje predikcijskih točaka oko rubnih uvjeta, što predstavlja karakteristiku

Naprezanje (MPa)

Nazivne vrijednosti ciljne varijable (log

broja ciklusa) Predikcija

neuralnih mreža Greška

(%)

Predikcija C&RT

metode Greška

(%)

446.93 4.301 4.568 -6.22 4.607 -7.13

406.00 4.602 4.634 -0.71 4.607 -0.12

382.06 4.778 4.812 -0.73 4.607 3.57

365.07 4.903 4.970 -1.38 4.607 6.02

351.90 5 5.104 -2.09 4.607 7.84

341.13 5.079 5.216 -2.69 5.136 -1.14

327.95 5.176 5.349 -3.3 5.136 0.76

310.97 5.301 5.505 -3.86 5.136 3.10

270.04 5.602 5.776 -3.11 5.860 -4.61

246.10 5.778 5.868 -1.57 5.860 -1.42

229.12 5.903 5.913 -0.17 5.860 0.72

215.94 6 5.937 1.03 5.860 2.33

Prosječna apsolutna greška na 12 točaka: 2.24 3.23

Marko Šušnjar – Doktorska disertacija

131

metode (asimptotsko približavanje rubnim uvjetima). Uočava se da se tri točke na

desnoj strani dijagrama na slici 6.29 približavaju vrijednosti od 106 ciklusa

opterećenja.

Rezultat predikcije pokusa S35 R10 su pokazali nisku predikciju neuralnih mreža

od 6.67%. Razlog tomu je reakcija metode na rubne uvjete s lijeve strane

dijagrama. Primjetno je kako se čak 5 točaka dijagrama asimptotski grupiraju oko

logaritamske vrijednosti 4.4.

Predikcija nad drugim materijalom (S45E+C) iz eksperimentalnog ispitivanja je

pokazala dobre rezultate nad uzorkom S45 R0. Metoda je dala relativno dobre

rezultate s greškom od 3.7%.

Uzorak S45 R04 je imao dobre rezultate predikcije. Neuralne mreže opet imaju

reakciju na rubne uvjete te se 4 točke asimptotski približavaju vrijednosti 106.

Najlošije predviđanje se pokazalo u slučaju uzorka S45 R10 u kojem metoda

intenzivno reagira na rubne uvjete, te se 50% točaka grupira oko logaritamske

vrijednosti 4.4.

Analizom rezultata dolazi se do zaključka da metoda jako dobro pogađa u

područjima u kojima je imala testnih primjera za proces učenja. Uočljivo je

griješenje metode u području < 104 ciklusa te u području ≥ 106. Razlog ovih

grešaka leži u tome što metoda nije imala primjera u pocesu modeliranja s tim

brojem ciklusa. Pri tome je bitno primijetiti da se rubni uvjeti intezivno očituju na

prediktivnoj varijabli. Za bilo kakvu primjenu je potrebno naznačiti rubne uvjete i

greške koje nastaju grupiranjem oko njih. Asimptotsko grupiranje rezultata

predikcije oko rubnih uvjeta uzrokuje pogrešku linearne regresije te promjenu

koeficijenata nagiba Wöhlerova pravca. Grešku rubnih uvjeta je moguće

kompenzirati izbacivanjem iz daljnje obrade grupiranih prediktivnih vrijednosti oko

rubnih granica.

Rezultati su u potpunosti u skladu s teorijskim postavkama iz literature [6], [15].

Metode jako dobro obavlja predikciju u domenama varijabli koje su ograničene

vrijednostima iz primjera korištenih u učenju. Za područja izvan domena varijabli

Marko Šušnjar – Doktorska disertacija

132

metoda daje loše rezultate. Drugim riječima metoda dobro radi interpolaciju dok u

ekstrapolaciji griješi.

Neuralne mreže su se pokazale kao metode izbora, te daju jako dobre rezultate u

uvjetima relativno malog broja primjera za učenje. Ovaj rad je numerički i

eksperimentalno pokazao da neuralne mreže mogu jako dobro modelirati

Wöhlerove pravce.

Stabla odlučivanja su obrađena kao poseban slučaj i na primjeru S35 R04 su

pokazala mogućnost primjene u predikciji Wöhlerovih krivulja. Klasifikacijska

karakteristika stabala odlučivanja je kompenzirana pravilnim izborom uzorkovanja

prediktivne varijable (ciklusa opterećenja). Primjer S35 R04 pokazuje da je stabla

odlučivanja moguće uspješno primijeniti u modeliranju problema pogonske

čvrstoće. Njihova prednost u mogućnosti da jasno prikažu ekspertni model (slike

5.12 i 5.15) daje im potencijalnu ulogu u modeliranju Wöhlerovih pravaca,

pogotovo u slučajevima s više utjecajnih varijabli čija međusobna interakcija nije

u potpunosti jasna i objašnjena.

Marko Šušnjar – Doktorska disertacija

133

7. Zaključak

Cilj istraživanja u disertaciji bio je razviti i verificirati prediktivnu metodu

određivanja pogonske čvrstoće materijala. Pored metode cilj je bio i postaviti

metodologiju modeliranja problematike pogonske čvrstoće prediktivnim

metodama.

Razvijene su i verificirane dvije prediktivne metode. Jedna, koja za matematičku

osnovu koristi algoritam neuralnih mreža, i druga, koja koristi stabla odlučivanja u

inačici C&RT algoritma. Primijenjena je CRISP DM metodologija kod razvoja

prediktivnih metoda te je prilagođena problematici pogonske čvrstoće.

Napravljene su dvije verifikacije metoda. Jedna numerička, koristeći podatke iz

literature, i druga eksperimentalna, gdje su metode verificirane nad

eksperimentalnim podacima. U postupku eksperimentalne verifikacije proveden je

ukupno 61 eksperiment (6 statičkih i 55 dinamičkih).

Prediktivne metode su uspješno verificirane i pokazano je da su u stanju dobro

predvidjeti pogonsku čvrstoću materijala prikazanu kroz Wöhlerove krivulje (S-N).

Postignuta je visoka razina točnosti, kako u numeričkoj tako i u eksperimentalnoj

verifikaciji. Metoda koja je koristila algoritam neuralnih mreža postigla je najveću

točnost od 1.01% u numeričkoj, te 1.45% u eksperimentalnoj verifikaciji.

Neuralne mreže su i do sada u literaturi korištene za predviđanje različite

problematike pogonske čvrstoće, međutim, stabla odlučivanja su bila odbacivana

kao metoda izbora. U disertaciji je pokazano da stabla odlučivanja mogu biti

uspješna u predikciji problematike pogonske čvrstoće. Njihova upotreba ima

potencijalno veliku vrijednost jer su u stanju prikazati čitljivi i razumljivi ekspertni

model.

Pokazano je i područje izvan kojeg metode nisu u stanju kvalitetno napraviti

predikciju. Za svaku primjenu potrebno je definirati rubne uvjete koji slijede iz

područja definicije ciljne varijable. Područje se određuje na osnovi ekstremnih

vrijednosti ciljne varijabe iz seta podataka za učenje. Metoda će uspješno davati

predikciju za sve vrijednosti ciljne varijabe koje se nalaze unutar područja

definicije. Sve vrijednosti predikcije na samim rubnim uvjetima te izvan njih, bit će

Marko Šušnjar – Doktorska disertacija

134

pogrešne. Drugim riječima, ekstrapolacijsko područje u kojem nije bilo primjera

prilikom procesa učenja metoda, područje je u kojem metode nisu u stanju dati

kvalitetno predviđanje.

Pokazan je i način postizanja visoke točnosti pogađanja kroz uzorkovanje

Wöhlerovih krivulja primjera i ciljne varijable. Uzorkovanje je ujedno uvjet za ciljnu

varijablu te je potrebno postaviti upravo onu po kojoj se uzorkuje Wöhlerova

krivulja. U disertaciji se koristilo uzorkovanje po brojevima ciklusa, te se upravo

broj ciklusa koristio kao ciljna varijabla.

Na temelju izloženih istraživanja u ovoj disertaciji postignut je mogući znanstveni

doprinos:

- Određivanje pogonske čvrstoće materijala koja nije poznata, koristeći

prediktivne metode i rezultate postojećih eksperimenata.

- Algoritam neuralnih mreža se može koristiti u prediktivnim metodama

namijenjenim pogonskoj čvrstoći materijala uz ograničenja jasno

definiranih rubnih uvjeta. Neuralne mreže daju visoku točnost u

području definicije ciljne varijable.

- Algoritam stabala odlučivanja moguće je koristiti u predikciji pogonske

čvrstoće materijala uz ograničenja dovoljne gustoće uzorkovanja

klasifikacijske varijable.

- Wöhlerova krivulja se može koristiti kao osnova za modeliranje

problematike pogonske čvrstoće prediktivnim metodama.

- Uzorkovanje Wöhlerove krivulje po osi prediktivne varijable značajno

povisuje točnost predikcije.

- Prediktivne metode nisu pogodne za ekstrapolaciju rezultata

predviđanja pogonske čvrstoće materijala.

Marko Šušnjar – Doktorska disertacija

135

Prijedlozi za buduća istraživanja [44]:

- Područje pripreme podataka te jasno definiranje domene točnosti

metoda bi očekivano pridonijelo primjenjivosti prediktivne metodologije

u pogonskoj čvrstoći.

- Važan doprinos bi bio i razvoj generaliziranog modela koji bi tipski

prihvaćao podatke istraživanja te bio u stanju procesom samoučenja

konstantno unapređivati kvalitetu predikcije.

- Primjena metoda za druge materijale te prilagodbe njihovim

specifičnostima.

- Razrada procesa automatske verifikacije mogućnosti predviđanja

očekivano bi unaprijedila pouzdanost metoda.

Marko Šušnjar – Doktorska disertacija

136

Literatura:

[1] V. Grubišić, Pogonska čvrstoća, FESB Split, Split, 2004.

[2] Ž. Domazet, Metode zaustavljanja širenja pukotina, disertacija, Zagreb 1993.

[3] http://www.enotes.com/topic/South_African_Airways_Flight_201, South African

Airways Flight 201, 01.11.2011.

[4] http://www.trueknowledge.com/q/facts_about__august_wohler, August Wöhler,

01.11.2011.

[5] V. Grubišić, Ž. Domazet, Pogonska čvrstoća - materijali uz predavanja, FESB Split,

Split, 1995.

[6] J. Han, M. Kamber, Data Mining Concept and Techniques, Elsevier, Morgan

Kaufmann Publishers, 2006.

[7] M. Berry, G. Linoff, Mastering Data Mining, Wiley, John Wiley & Sons, 2000.

[8] P. O’Neil, E. O’Neil, Database Principles, programming and performance, Morgan

Kaufmann Publishers, 2001.

[9] http://www.cse.ohio-state.edu/~sgomori/570/coddsrules.html, Dr. E. F. Codd's 12

rules, 12.11.2011.

[10] http://www.ehow.com/facts_6849444_introduction-relational-database-management-

systems.html, An Introduction to Relational Database Management Systems,

21.11.2011.

[11] http://searchdatamanagement.techtarget.com/definition/OLAP, OLAP (online

analytical processing), 21.11.2011.

[12] http://www-01.ibm.com/software/analytics/spss/, SPSS software, 06.10.2011.

[13] S. Mathur, P. C. Gope and J. K. Sharma, Prediction of Fatigue Lives of Composites

Material by Artifical Neural network, Proc. Of the Society for Experimental Mechanic

2007 Annual Conference and Exposition, Springfield, Massachusetts, USA, June 4-6,

2007.paper 260.

[14] J. R. Mohanty, B. B. Verma, P. K. Ray, D. R. K. Parhi: Application of artificial neural

network for fatigue life prediction under interspersed mode-I spike overload, Journal of

Testing and Evaluation, Vol.38, No.2, Paper ID JTE101907

Marko Šušnjar – Doktorska disertacija

137

[15] T. T. Pleune, O. K. Chopra: Artificial Neural Networks and Effects of Loading

Conditions on Fatigue Life of Carbon and Low-Alloy Steels, ASME Pressure Vessels and

Piping Conference, July 27-31 1997, Orlando, USA

[16] R. C. S. Freire, A. D. D. Neto, E. M. Freire, Building of constant life diagrams of

fatigue using artificial neural networks, International Journal of Fatique, 27 (2005) 746-

751

[17] I. Sohn, D. Bae: A study on the Fatigue Life Prediction Method of the Spot-welded

Lap Joint, Seoul 2000 FISTIA World Automotive Congres, June 12-15, 2000, Seoul,

Korea

[18] Cheng-Jung Li, Asok Ray: Neural network representation of fatigue damage

dynamics, Smart Material Structure, vol 4 (1995) 126-133.

[19] V. Venkatesh, H. J. Rack, A neural network approach to elevated temperature

creep–fatigue life prediction, International Journal of Fatigue, Volume 21, Issue 3, March

1999, Pages 225–234

[20] J. R. Mohanty, B. B. Verma, D. R. K. Parhi, P. K. Ray: Application of artifical neural

network for predicting fatigue crack propagation life of aluminium alloys, Computation

Materials science and Surface Engineering, 2009. Volume I, Issue 3. P. 133.-138.

[21] D. T. Larose, Discovering Knowledge in Data An Introduction to Data Mining, Wiley-

Interscience, 2005.

[22] Y. Lee, J. Pan, R. Hathaway,M.Barkey, Fatigue testing and analysis, Elsevier, 2005.

[23] I. Alfirević, i ostali, Inženjerski priručnik IP1, Školska knjiga, Zagreb, 1996.

[24] P. Champman, i ostali, CRISP-DM1.0, SPSS documentation, SPSS, 2000.

[25] R. Nisbet, J. Elder, G. Miner, Handbook of Statistical Analsys and Data Mining

Applications, Elsevier, 2009.

[26] I. Witten, E. Frank, Data Mining Practical Machine Learning Tools and Techniques,

Elsevier, 2005.

[27] SPSS Inc, PASW Modeler 13 Documentation, Integral Solution Limited, 2009.

[28] D. Gamberger and T. Šmuc , {DMS} Poslužitelj za analizu podataka, dms.irb.hr,

Institut Ruđer Bošković

[29] J. R. Quinlan, Machine Learning vol1, Morgan Kaufnamm, 1975.

[30] W. D. Pilkey, Peterson's Stress Concetration Factors, John Wiley & Sons, 1997.

Marko Šušnjar – Doktorska disertacija

138

[31] S. Perše, Osnove strojarstva, FPZ, Zagreb, 1993.

[32] M. Franz, Utjecaj zaostalih naprezanja na dinamičku izdržljivost nitriranog čelika,

disertacija, FSB, Zagreb, 1991.

[33] T. Matić, Dinamička izdržljivost zavarenih aluminjskih konstrukcija izloženih utjecaju

korozije, magistarski rad, FS, Zagreb, 1995.

[34] Databook on fatigue strength of metallic materials, The Society of Materials Science,

Japan, Volume 1, 1996.

[35] Databook on fatigue strength of metallic materials, The Society of Materials Science,

Japan, Volume 2, 1996.

[36] Databook on fatigue strength of metallic materials, The Society of Materials Science,

Japan, Volume 3, 1996.

[37] B. Kraut, Strojarski priručnik, Tehnička knjiga, Zagreb, 1982.

[38] L. Breiman, J. H. Friedman, R.A.Olshen, and C.J.Stone, Clasification and

Regression Trees, Chapman & Hall/CRC, 1984.

[39] D. E. Rumelhart, J. L. McClelland and the PDP Research Group, Parallel Distributed

Processing: Explorations in the Microstructure of Cognition. Volume 1: Foundations,

Cambridge, MA: MIT Press, 1986.

[40] http://www.3ds.com/products/catia/, 3DS Catia, 01.11.2011.

[41] John M. Barsom, Stanley T. Rolfe, Fracture and Fatigue Control in Strucutres:

Application of Fracture Mechanic, Butterworth-Heinemann, 1999.

[42] I. Pavlić, Statistička teorija i primjena, Tehnička knjiga Zagreb, 1985.

[43] F. Beer, Jr. E. Russell Johnston, J. DeWolf, D. Mazurek, Mechanic of Materials,

McGraw-Hill, 2006.

[44] D. Taboršak, Metodologija izrade znanstveno-istraživačkog rada, Fakultet strojarstva

i brodogradnje, Zagreb

ŽIVOTOPIS

Marko Šušnjar rođen je 24.05.1966. u Splitu. Nakon završene osnovne i srednje škole upisuje strojarstvo pri Fakultetu elektrotehnike strojarstva i brodogradnje u Splitu. Diplomira ga u veljači 1991.

Iste godine se zapošljava kao znanstveni novak pri FESB-u Split, te na tom radnom mjestu ostaje do lipnja 1995. godine. U srpnju 1995. kreće poduzetničkim putem te suosniva tvrtku Bit-art consulting u kojoj radi do svibnja 1999. godine. Tvrtku Bit-art informatika osniva u lipnju 1999. u kojoj i danas radi na mjestu direktora.

Znanstveno usavršavanje počinje upisom na poslijediplomski studij strojarstva pri Fakultetu strojarstva i brodogradnje u Zagrebu 1992. godine. 2001. godine nastavlja poslijediplomski studij prelaskom na FESB Split.

Doktorira 2012. na FESB-u Split sa temom „Razvoj prediktivne metode određivanja pogonske čvrstoće materijala“.

Od 1991. Učestvuje u slijedećim znanstvenim projektima:

Pogonska čvrstoća materijala i konstrukcija (023-0231744-1745), glavnog istraživača prof. dr. Željka Domazeta

Istraživanje utjecajnih parametara na pogonsku čvrstoću (023031), glavnog istraživača prof. dr. Željka Domazeta

Pogonska čvrstoća konstrukcija sa i bez zamornih pukotina (2-08-197), glavnog istraživača prof. dr. Vatroslava Grubišića

Od 2003. radi kao vanjski suradnik pri Fakultetu elektrotehnike strojarstva i brodogradnje u Splitu. Sudjeluje u predavanjima i izvođenju vježbi na slijedećim kolegijima:

„Uvod u baze podataka“, na studiju Računarstva, školske godine 2003./2004.

„Uvod u informacijske sustave“, na studiju Industrijskog inženjerstva, školske godine 2003./2004.

„Baze podataka II“, na studiju Računarstva, školskih godina 2004. – 2008.

„Distribuirane baze podataka“, na studiju Računarstva, školskih godina 2004. – 2010.

„Poslovna Inteligencija“, na studiju Računarstva, školskih godina 2009. – 2010.

Sve vrijeme suradnje pri FESB-u mentor je pri izradi studentskim stručnim i diplomskim radovima.

Stalni je pozvani predavač na stručnim Microsofotvim konferencijama te aktivan član raznih strukovnih udruženja.

BIOGRAPHY Marko Šušnjar was born on 24.05.1966. in Split, Croatia. After elementary and high-school he attended the mechanical engineering at the University of Split – Faculty of electrical engineering, mechanical engineering and naval architecture, which he graduaded in February 1991. In 1991. Marko Šušnjar was employed as junior researcher at the University of Split – Faculty of electrical engineering, mechanical engineering and naval architecture where he worked until June 1995. In July 1995. he started with the entrepreneurship in a form of coownership of Bit-art consulting company where he worked until July 1999. In the same year (1999.) Marko Šušnjar established Bit-Art Informatics Ltd. where he works as a CEO now days. Marko Šušnjar started his scientific specialization as postgraduate study at the University of Zagreb – Faculty of mechanical engineering and naval architecture in 1992. The postgraduate study was continued in 2001. with transfer to University of Split - Faculty of electrical engineering, mechanical engineering and naval architecture where he successfully finished his doctoral dissertation in year 2012. From 1991. Marko Šušnjar worked on the following scientific projects: Fatigue strength of material and construnction (023-0231744-1745), main researcher Ph. D. Professor Željko Domazet Researching the influential parameters of the fatigue strength (023031), main researcher Ph. D. Professor Željko Domazet Fatigue strength of construction with and without fatigue cracks (2-08-197), main researcher Ph. D. Professor Vatroslav Grubišić Since 2003. Marko Šušnjar worked as an external associate at the University of Split - Faculty of electrical engineering, mechanical engineering and naval architecture where he conducted lectures and excercises for the following courses: ''Databases introduction'', Computer Science study (2003./2004.) ''Information system introduction'', Industrial Engineering study (2003./2004.) ''Databases II'', Computer Science study (2004.-2008.) ''Distributed databases'', Computer Science study (2004.-2010.) ''Business Intelligence'', Computer Science study (2009.-2010.) At the same time, while cooperating with University of Split - Faculty of electrical engineering, mechanical engineering and naval architecture, Marko Šušnjar was also mentoring the students in terms of their practical papers and thesis. Marko Šušnjar is also a regular guest speaker and lecturer on the Microsoft conferences, as well as the active member of different professional associations.