habib firdausi-algoritma c4.5.pptx

Upload: habib

Post on 25-Feb-2018

258 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/25/2019 Habib Firdausi-Algoritma c4.5.pptx

    1/20

    Algoritma C4.5

  • 7/25/2019 Habib Firdausi-Algoritma c4.5.pptx

    2/20

    Defnisi Algoritma C4.5

    Beberapa pengertian C4.5 menurut:

    a) Max Bremer, 2007 Metode yangdigunakan untuk membangun pohon keputusan

    dengan menggunakan seperangkat aturan padasebuah dataset.

    b) Xindong Wu and Vipin Kumar, 2008!"angkaian dari algoritma untuk masalah

    klasifkasi dalam ma#hine learning dan datamining.

  • 7/25/2019 Habib Firdausi-Algoritma c4.5.pptx

    3/20

    Defnisi Algoritma C4.5

    AlgoritmaC4.merupakanalgoritmapembentuk pohon keputusan

    $de#ision tree) untuk mengklarifkasidata yang besar men%adi lebih ke#ilhingga tiap bagian terdiri dari data

    yang berasl dari kelas yang sama.

  • 7/25/2019 Habib Firdausi-Algoritma c4.5.pptx

    4/20

    &elebihan C4.5

    '. Daerah pengambilan keputusan dapat diubahmen%adi lebih spesifk

    (. anya mengu%i sample atau kelas tertentu

    sehingga perhitungan yang tidak diperlukanbisa dihilangkan

    *. +leksibel memilih ftur yang akan membedakansuatu kriteria dalam node yang sama

    4. Menggunakan kriteria yang %umlahnya lebihsedikit pada setiap#abang tanpa mengurangikualitas keputusan yang dihasilkan

  • 7/25/2019 Habib Firdausi-Algoritma c4.5.pptx

    5/20

    &ekurangan C4.5

    '. ,er%adi o-erlapping terutama ketika kelaskelasdan kriteria yang digunakan %umlahnya sangatbanyak

    (. /engakumulasian %umlah kesalahan dari setiaptingkat dalam sebuah pohon keputusan yang

    *. &esulitan dalam mendesain pohon keputusanyang optimal

    4. asil kualitas keputusan yang didapatkan darimetode pohon keputusan sangat tergantungpada bagaimana pohon tersebut didesain

  • 7/25/2019 Habib Firdausi-Algoritma c4.5.pptx

    6/20

    ,ahapan Algoritma

    '. Memilih atributsebagai akar

    (. Membuat #abanguntuk tiaptiap nilai

    didalam akar tersebut

    *. Membagi atributdalam #abang.

    4. 0langi proses untuk

    setiap #abang sampaisemua atribut pada#abang memiliki kelasyang sama.

    '.'1utlook

    2es

    igh 3ormal

    2es31

    '.'.(indy

    unny Cloudy

    "ainy

    'umidity

    3o 2es

    ,rue +alse

  • 7/25/2019 Habib Firdausi-Algoritma c4.5.pptx

    7/20

    Contoh:&eputusan Bermain6ol7

    !""#$%""

    K$&M'&(A$

    #(&)#M*+*$

    W*!+ '%A

    ' unny ot igh +A89 3o

    ( unny ot igh ,"09 3o

    * Cloudy ot igh +A89 2es

    4 "ainy Mild igh +A89 2es

    5 "ainy Cool 3ormal +A89 2es

    "ainy Cool 3ormal ,"09 2es

    ; Cloudy Cool 3ormal ,"09 2es

    < unny Mild igh +A89 3o

    = unny Cool 3ormal +A89 2es

    '> "ainy Mild 3ormal +A89 2es

    '' unny Mild 3ormal ,"09 2es

    '( Cloudy Mild igh ,"09 2es

    '* Cloudy ot 3ormal +A89 2es

    '4 "ainy Mild igh ,"09 3o

  • 7/25/2019 Habib Firdausi-Algoritma c4.5.pptx

    8/20

    Atribut dan 8abel

    - Atributatributnya adalah 1utlook?,emperature? umidity? dan ind

    - edangkan 8abelnya ada padakolom /lay

    - Dataset tersebut memiliki '4 kasusyang terdiri = !2es dan 5 !3o padakolom /lay

  • 7/25/2019 Habib Firdausi-Algoritma c4.5.pptx

    9/20

    Calon #abang pohon keputusan

    ' 1utlook unny 1utlook Cloudy 1utlook "ainy( ,emperatur

    ot,emperatureMild ,emperature Cool

    *

    umidity ighumidity3ormal

    4 indy +alse indy ,rue

  • 7/25/2019 Habib Firdausi-Algoritma c4.5.pptx

    10/20

    '. Memilih Atribut ebagaiAkar

    Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi dari

    atribut-atribut yang ada. Untuk menghitung gain digunakan rumus seperti

    tertera dalam Rumus 1

    S : Himpunan kasus

    A : Atribut

    n : Jumlah atribut A

    lSil: Jumlah kasus pada partisi ke i

    lSl : Jumlah kasus dalam S

  • 7/25/2019 Habib Firdausi-Algoritma c4.5.pptx

    11/20

    3ilai 9ntropi

    penghitungan nilai entropi dapatdilihat pada persamaan :

    : adalah himpunan $dataset) kasus

    n: adalah banyaknya partisi

    pi: adalah probabilitas yang di dapatdari um$2es) dibagi ,otal &asus

  • 7/25/2019 Habib Firdausi-Algoritma c4.5.pptx

    12/20

    3ilai 9ntropy

    Menghitung 7rek@ensi hasil play yangmun#ul berikut proporsinya sertaentropynya.

    )a-il re/ pi %og2pi pi.log2pi

    e- '> >.;' >.4= >.*5

    !o 4 >.(= '.

  • 7/25/2019 Habib Firdausi-Algoritma c4.5.pptx

    13/20

    Menghitung 6ain

    Menghitung 6ain dari masing masing kriteriauntuk men#ari gain tertinggi yang akan di%adikan#abang keputusan.

    2es 3o /$2es)/$3o

    )/$2es) . 816(

    /$2es)/$3o) . 816( /$3o) ,otal

    p$outlook...)

    ,otal.p$outlook...)

    $,otal.p$outlook...))gain

    1utlook unny ( * >.4> >.> >.5* >.44 >.=; >.* >.*5 >.>>.(

    Cloud

    y4 > '.>> >.>> >.>> >.>> >.>> >.(= >.>>

    "ainy 4 ' >. >.(> >.( >.4 >.;( >.* >.(

    ,emperature

    ot ( ( >.5> >.5> >.5> >.5> '.>> >.(= >.(= >..'.; >.** >.*= >.5* >.=( >.4* >.*=

    Cool 4 > '.>> >.>> >.>> >.>> >.>> >.(= >.>>

    umidity igh * 4 >.4* >.5; >.5( >.4 >.== >.5> >.4= >.4=>.*;

    3ormal

    ; > '.>> >.>> >.>> >.>> >.>> >.5> >.>>

    indy +A89 ( >.;5 >.(5 >.*' >.5> >.

  • 7/25/2019 Habib Firdausi-Algoritma c4.5.pptx

    14/20

    (. Membuat Cabang 0ntuk ,iaptiap3ilai Didalam Akar ,ersebut

    Atribut dengan gain tertinggi adalahumidity yaitu sebesar >?*;.

    '

    umidity

    '.' 2es

    igh 3ormal

  • 7/25/2019 Habib Firdausi-Algoritma c4.5.pptx

    15/20

    *. Membagi &asus Dalam Cabang

    3ilai atribut umidity3ormal

    sudah mengklasifkasikan kasus

    men%adi ' yaitu 2es $2es;? 3o>) 3ilai atribut umidity igh

    masih perlu dilakukan

    perhitungan lagi

    '

    umidity

    '.' 2es

    igh 3ormal

  • 7/25/2019 Habib Firdausi-Algoritma c4.5.pptx

    16/20

    3ode '.' e- !o 'e-5 '!o5 'e-5 X %"62'e-5'!o5 X %"62

    '!o5$otal

    &ntrop

    poutloo/...5

    $otal.poutloo/...5

    $otal.poutloo/...55

    gain

    umidity igh * 4 >.4* >.5; >.5( >.4 >.== >.>>

    outlookunn

    y> * >.>> '.>> >.>> >.>> >.>> >.4* >.>> >.(= >.;>

    Cloudy

    ( > '.>> >.>> >.>> >.>> >.>> >.(= >.>>

    "ainy

    ' ' >.5> >.5> >.5> >.5> '.>> >.(= >.(=

    ,emperature ot ' ( >.** >.; >.5* >.*= >.=( >.4* >.*= >.= >.>(

    Mild ( ( >.5> >.5> >.5> >.5> '.>> >.5; >.5;

    Cool > > >.>> >.>> >.>> >.>> >.>> >.>> >.>>

    indy +A89

    ( ( >.5> >.5> >.5> >.5> '.>> >.5; >.5; >.= >.>(

    ,"09 ' ( >.** >.; >.5* >.*= >.=( >.4* >.*=

    4. #langi pro-e- untu/ -etiap a9ang -ampai-emua atri9ut pada a9ang memili/i /ela-ang -ama.

    /enghitungan 9ntropy 3ode'.'

  • 7/25/2019 Habib Firdausi-Algoritma c4.5.pptx

    17/20

    /ohon &eputusan 3ode '.'

    Atribut dengan gain tertinggi adalah 1utlookyaitu sebesar >?;>

    3ilai atribut 1utlookunny sudah meng

    klasifkasikan atribut men%adi 'yaitu 3o $2es> 3o*)

    Demikian pula pada atribut

    1utlookCloudy? yaitu 2es

    $2es( 3o>)

    3ilai Atribut 1utlook"ainy

    Masih perlu dilakukan perhitungan lagi

    'umidi

    ty

    '.'1utloo

    k

    2es

    igh3ormal

    2es31

    '.'.(

    unny Cloudy"ainy

  • 7/25/2019 Habib Firdausi-Algoritma c4.5.pptx

    18/20

    /enghitungan 9ntropy 3ode'.'.(

    2es 3o /$2es) /$3o)/$2es) . 816(

    /$2es)/$3o) . 816(

    /$3o),otal

    9ntropyp$outlook...)

    ,otal.p$outlook...)

    $,otal.p$outlook...)) gain

    umidity ighdan 1utlook

    "ainy' ' >.5> >.5> >.5> >.5> '.>>

    ,emperature

    ot > > >.>> >.>> >.>> >.>> >.>> >.>> >.>> '.>> >.>>

    Mild ' ' >.5> >.5> >.5> >.5> '.>> '.>> '.>>

    Cool > > >.>> >.>> >.>> >.>> >.>> >.>> >.>>

    indy +A89 ' > '.>> >.>> >.>> >.>> >.>> >.5> >.>> >.>> '.>>

    ,"09 > ' >.>> '.>> >.>> >.>> >.>> >.5> >.>>

  • 7/25/2019 Habib Firdausi-Algoritma c4.5.pptx

    19/20

    /ohon &eputusan 3ode'.'.(

    Atribut dengan gain tertinggi adalah

    indy yaitu sebesar '

    3ilai atribut indy,rue

    sudah mengklasifkasikan

    kasus men%adi '

    yaitu 3o $2es> 3o')

    Demikian pula pada atributindy+alse? yaitu

    2es $2es' 3o>)

    'umidi

    ty

    '.'1utloo

    k

    2es

    igh 3ormal

    2es31

    '.'.(indy

    unny Cloudy"ainy

    3o 2es

    ,rue +alse

  • 7/25/2019 Habib Firdausi-Algoritma c4.5.pptx

    20/20

    /ohon &eputusan ,erakhir

    "utput (ule5

    "'. 7 umidity 3ormal then /lay 2es

    "(. 7 umidity igh and 1utlook Cloudy

    then /lay 2es"*. 7 umidity igh and 1utlook unny

    then /lay 3o

    "4. 7 umidity igh and 1utlook "ainy

    and indy ,rue then /lay 3o"5. 7 umidity igh and 1utlook "ainy

    and indy +alse then /lay 2es

    '.'1utloo

    k

    2es

    igh 3ormal

    2es31

    '.'.(indy

    unny Cloudy"ainy

    'umidi

    ty

    3o 2es

    ,rue +alse