klasifikacija v wekikt.ijs.si/petrakralj/ungknowledgediscovery/... · – naivni bayesov...
Post on 23-Oct-2020
2 Views
Preview:
TRANSCRIPT
-
Petra.Kralj@ijs.si
Klasifikacija v WEKI16.3.2007
Petra KraljPetra.Kralj@ijs.si
-
Petra.Kralj@ijs.si
Vaje z Weko• Ponovimo primer s kontaktnimi lečami z
algoritmom ID3, testiranje:– Z ločeno testno množico
• Klasifikacija na CAR dataset– Priprava in branje podatkov– Gradnja odločitvenih dreves– Naivni Bayesov klasifikator– Razumevanje rezultatov
-
Petra.Kralj@ijs.si
Naloga
• V Weki z algoritmom ID3 zgradi odločitveno drevo na učni množici in izračunaj njegovo klasifikacijsko točnost na testni množici
• Podatki– LeceBinUcna.arff– LeceBinTestna.arff
• Primerjaj z rezultati, ki smo jih dobili pri ročnem računanju
-
Petra.Kralj@ijs.si
Program WEKA
download
Prosto dostopen program za rudarjenje podatkov http://www.cs.waikato.ac.nz/ml/weka/
-
Petra.Kralj@ijs.si
Zagon programa Weka
Izberemo Explorer
-
Petra.Kralj@ijs.si
Okno za branje podatkov
-
Petra.Kralj@ijs.si
Naložimo datoteko
LeceBinUcna.arff
-
Petra.Kralj@ijs.si
Pokažejo se nam podatki
Ciljna spremenljivka
Izberemo
zavihek
“Classify”
-
Petra.Kralj@ijs.si
Izberemo algoritem
-
Petra.Kralj@ijs.si
trees
Id3
-
Petra.Kralj@ijs.si
LeceBinTestna.arff
1 2
3
4
5
-
Petra.Kralj@ijs.si
Odločitveno drevo
-
Petra.Kralj@ijs.si
Klasifikacijska točnost
Kontingenčna tabela
-
Petra.Kralj@ijs.si
CAR dataset
• 1728 primerov• 6 atributov
– 6 nominalnih– 0 numeričnih
• Nominalna ciljna spremenljivka– 4 vrednosti: unacc, acc, good, v-good– Distribucija vrednosti
• unacc (70%), acc (22%), good (4%), v-good (4%)• Brez manjkajočih vrednosti
-
Petra.Kralj@ijs.si
Priprava podatkov za WEKO - 1
Podatki v tabeli (npr. MS Excel)
- Vrstice so primeri- Stolpci so atributi- Zadnji stolpec je ciljna
spremenljivka
-
Petra.Kralj@ijs.si
Priprava podatkov za WEKO - 2
Shrani kot “.csv”- Pazljivo s pikami,
vejicami in podpičji!
-
Petra.Kralj@ijs.si
Load the data
Ciljna spremenljivka
Car.csv
-
Petra.Kralj@ijs.si
Izberemo algoritem J48
-
Petra.Kralj@ijs.si
Gradnja in evalvacija drevesa
-
Petra.Kralj@ijs.si
Napoved modela
Resnične vrednosti
Klasifikacijska točnost
-
Petra.Kralj@ijs.si
Desni klik na miški
-
Petra.Kralj@ijs.si
Rezanje dreves
Nastavimo minimalno število primerov v
listu na 15
Parametri algoritma (desni
klik na miški)
-
Petra.Kralj@ijs.si
Število vozlišč in listov je manjše
Lažja interpretacija,
manjša klasifikacijska
točnost
-
Petra.Kralj@ijs.si
-
Petra.Kralj@ijs.si
Naivni Bayesov klasifikator
-
Petra.Kralj@ijs.si
-
Petra.Kralj@ijs.si
-
Petra.Kralj@ijs.si
Za doma
Na datoteki • LeceBin.csvZgradite odločitveno drevo z ID3 algoritmom
in J48 algoritmom, za evalvacijo uporabite prečno preverjanje.
Klasifikacija v WEKI �16.3.2007Vaje z WekoNalogaProgram WEKA Zagon programa WekaOkno za branje podatkovNaložimo datotekoPokažejo se nam podatkiIzberemo algoritemCAR datasetPriprava podatkov za WEKO - 1Priprava podatkov za WEKO - 2Load the dataIzberemo algoritem J48Gradnja in evalvacija drevesaRezanje drevesNaivni Bayesov klasifikatorZa doma
top related