tgs klpk 2.pptx
TRANSCRIPT
-
8/18/2019 tgs klpk 2.pptx
1/44
-ALGORITHMCLUSTERING
MATA KULIAH TEKNOLOGI DATABASE
Dosen :Dr. Sarjon Defit,M.Ko, M.S!
MAGISTER KOM"UTERUNI#ERSITAS "UTRA INDONESIA $%"TK$ "ADANG
KELOMPOK II
1. SEPSA NUR RAHMAN2. SARI LANOVHA
3. KHAIRUL MUTTAQIN4. NIKO BERLIAN5. M. IBRAHIM NASUTION
6. TOMI TAMARA
-
8/18/2019 tgs klpk 2.pptx
2/44
K-MEANSSecara Umum K-means clustering merupakan
salah satu metode data clustering non-hirarki
yang mengelompokan data dalam entuk satuatau leih cluster!kelompok
Algoritma K-means clustering merupakansalah satu metode data clustering non-
hirarki yang mengelompokan data dalam entuksatu atau leih Cluster!Kelompok"
-
8/18/2019 tgs klpk 2.pptx
3/44
KLASIFIKASI
Clustering algoritma dapat diklasi#ikasikan
seagai erikut$1. Exclusive Clustering
2. Overlapping Clustering
3. Hierarchical Clustering
4. Probabilistic Clustering
-
8/18/2019 tgs klpk 2.pptx
4/44
APLIKASI
&'(sterin) a')orita *a+at *itera+an*a'a era)ai i*an),isa'na:
%" &isnis
'" &iologi
(" In#ormasi
)" *ultimedia+" ,ll
-
8/18/2019 tgs klpk 2.pptx
5/44
KELEMAHAN/. 0('a1 !'(ster, seana K, 1ar(s *itent(an
see'( *i'a(an +er1it(n)an.
2. Bi'a j('a1 *ata ti*a ter'a'( ana, (*a1 (nt(enent(an !'(ster a3a'.
4. Ti*a +erna1 en)eta1(i rea' !'(ster *en)an
en))(naan *ata an) saa, na(n jia *ias(an
*en)an !ara an) ere*a (n)in *a+at e+ro*(si
!'(ster an) ere*a jia j('a1 *atana se*iit.
5. Ti*a ta1( ontri(si *ari atri(t *a'a +roses
+en)e'o+oan arena *ian))a+ a13a setia+ atri(t
ei'ii oot an) saa
-
8/18/2019 tgs klpk 2.pptx
6/44
KELE&I.N
A*a eera+a e'ei1an +a*a a')orita-eans, ait(.
/. M(*a1 (nt( *ii+'eentasian *an*ija'anan
2. 6at( an) *i(t(1an (nt(+ee'ajaran ini re'atif !e+at
4. M(*a1 (nt( *ia*a+tasi
5. U( *i)(naan
-
8/18/2019 tgs klpk 2.pptx
7/44
Langkah-langkah dalam .logritmaK-*eans Clustering
/. Menent(an j('a1 K ClusterBanana cluster 1ar(s 'ei1 e!i'*ari +a*a anaa *ata 7 8 n9
2. Menent(an ni'ai !entroi*
Da'a enent(an ni'ai !entroi* isa*i'a(an *en)an era)ai !ara. Na(nan) +a'in) serin) *i'a(an a*a'a1*en)an !ara ran*o ata( a!a.
4. Men)1it(n) jara antara titi !entroi*
*en)an titi tia+ oje
Unt( en)((r jara antara *ata *en)an+(sat !'(ster *i)(naan E(!'i*ian*istan!e Sea)ai eri(t :
-
8/18/2019 tgs klpk 2.pptx
8/44
Keterangan $d / titik dokumen0 / data centroid
y / data record5. Ke'o+oan *ata ses(ai *en)an
!'(ster-na, ait( *ata an) ei'ijara ter+en*e
. Kea'i e ta1a+ 2, 'a(an+er('an)an 1in))a ni'ai !entroi*an) *i1asi'an teta+ *an an))ota!'(ster ti*a er+in*a1 e!'(ster
Fl h K M
-
8/18/2019 tgs klpk 2.pptx
9/44
Flowchart K-MeansClustering
Start
Jumlahcluster K
Tentukan centroid
Hitung jarak objekdata ke centroid
Kelompokkan objekdata berdasarkan
jarak minimum kecentroid
Adaobjekang
berpindah
kelompok!
"nd
-
8/18/2019 tgs klpk 2.pptx
10/44
TransforasiData
Meto*e K-Means &'(sterin) 1ana isaen)o'a1 *ata *a'a ent( an)a, aa(nt( *ata an) erent( noina'1ar(s *i Inisia'isasian ter'ei1*a1('( *a'a ent( an)a. Lan)a1naa*a'a1 :
Ur(tan *ata er*asaran fre(ensi
e(n!('anna. Inisia'isasian *ataterse(t ('ai *ari *ata tertin))i*en)an ni'ai /, e(*ian *atase'anj(tna 2, 4 *an Seter(sna.
-
8/18/2019 tgs klpk 2.pptx
11/44
-
8/18/2019 tgs klpk 2.pptx
12/44
STU,I K.SUS
,ierikan data nilai dari 1 2esertaTest 2olri seagai &erikut $
-
8/18/2019 tgs klpk 2.pptx
13/44
N3 N3C.SIS
N.*.C.SIS
TESTKESE.T.N
TEST2SI4.K,*K
T3T.L
% '5%6-555%
Sepsa N"R 15 7% %6%
' '5%6-555'
8hela S 66 7' %'7
( '5%6-555(
Sari L"9 +6 ++ %(%
) '5%6-
555)
Risa E 16 16 %75
6 '5%6-5556
:hodi "K +5 7( %((
+ '5%6-555+
.ri# S"L 77 7% %)1
7 '5%6-5557
Itok 2 )6 +% %5+
Tae'-/ "eserta Test "o'ri
-
8/18/2019 tgs klpk 2.pptx
14/44
Penyelesaan !
/. Menent(an titi +(sat !'(ster*en)an !ara ran*o
2enentuan 2usat .
-
8/18/2019 tgs klpk 2.pptx
15/44
2. "er1it(n)an jara +(sat !'(ster
a9 "er1it(n)an jara *ari *ata e ; /ter1a*a+ +(sat !'(ster
"1 # $%5&%'()*$%5&+1()*$1+'&151()
"1 # 24.1246+6
"2 # $+5&%'()*$-5&+1()*$1+'&151()
"2 # 31.'16124
-
8/18/2019 tgs klpk 2.pptx
16/44
( Pe/0nan a/a a/ aa e 7 2 e/0aa88sa lse/
"1 # $%5&55()*$%5&+2()*$1+'&12+()
"1 # 54.'1%515
"2 # $+5&55()*$-5&+2()*$1+'&12+()
"2 # 52.+'6+35
-
8/18/2019 tgs klpk 2.pptx
17/44
9( Pe/0nan a/a a/ aa e 7 3 e/0aa88sa lse/
"1 # $%5&65()*$%5&66()*$1+'&131()
"1 # 4+.++'2%4
"2 # $+5&65()*$-5&66()*$1+'&131()
"2 # 4-.61%545
-
8/18/2019 tgs klpk 2.pptx
18/44
9( Pe/0nan a/a a/ aa e 7 5
e/0aa8 8sa lse/
"1 # $%5&6'()*$%5&+3()*$1+'&133()
"1 # 46.23%512
"2 # $+5&6'()*$-5&+3()*$1+'&133()
"1 # 45.5%5'%5
-
8/18/2019 tgs klpk 2.pptx
19/44
9( Pe/0nan a/a a/ aa e 7 6
e/0aa8 8sa lse/
"1 # $%5&++()*$%5&+1()*$1+'&14%()
"1 # 2+.2+6363
"2 # $+5&++()*$-5&+1()*$1+'&14%()
"1 # 32.61-'13
-
8/18/2019 tgs klpk 2.pptx
20/44
9( Pe/0nan a/a a/ aa e 7 +
e/0aa8 8sa lse/
"1 # $%5&45()*$%5&61()*$1+'&1'6()
"1 # +-.1-5-5-
"2 # $+5&45()*$-5&61()*$1+'&1'6()
"1 # +%.4346%6
-
8/18/2019 tgs klpk 2.pptx
21/44
Perhitungan dilakukan terus sampai data ke – 8terhadap pusat cluster Setelah dilakukan pr!ses
perhitungan maka akan didapatkan dataselengkapn"a adalah #
Ta9el 2. Hasl 8e/0nan a/a sea8 aa e "lse/
N$ N$ %ASIS NAMA %ASIS %& %'
& '5%6-555% Sepsa N"R '(&'()*) +&,&)&'(' '5%6-555' 8hela S (,&8& '*,)*+
+ '5%6-555( Sari L"9 (***,'8( (.)&8(( '5%6-555) Risa E , &(8)),* '5%6-5556 :hodi "K ()'+8&' (8,8) '5%6-555+ .ri# S"L '*'*)+)+ +')&.,&+* '5%6-5557 Itok 2 *.&... *8(+()8)8 '5%6-5551 Ika T &(8)),* ,
4 " ' D t
-
8/18/2019 tgs klpk 2.pptx
22/44
4. "en)e'o+oan Data
N$ N$
%ASIS
NAMA
%ASIS
%& %' /A0AK
%&
/A0AK
%'
& '5%6-555% Sepsa N"R '(&'()*) +&,&)&'( & ,' '5%6-555' 8hela S (,&8& '*,)*+ , &+ '5%6-555( Sari L"9 (***,'8( (.)&8( & ,( '5%6-555) Risa E +(8+.)+') (&*+*'*+ & , '5%6-5556 :hodi "K ()'+8&' (8,8 , &) '5%6-555+ .ri# S"L '*'*)+)+ +')&.,&+ & ,
* '5%6-5557 Itok 2 *.&... *8(+()8) , &8 '5%6-5551 Ika T (&*+*'*+ +(8+.)+') , &
Ta9el 3. P:ss "lse/ 8aa e/as 8e/a;a
3 Penenan Psa "lse/
-
8/18/2019 tgs klpk 2.pptx
23/44
3. Penenan Psa "lse/Ba/
Kemudian kita tentukan lagi pusat cluster daridata "ang 1aru2 caran"a dengan men3umlahkannilai semua 4akultas "ang merupakan angg!ta daricluster dan di1agi t!tal 3umlah angg!ta cluster
"lse/ 8e/a;a 8nya 4 aaya aa e !
! 1< 3< 4< 6
"lse/ ea 8nya 6 aaya aa e ! ! 2< 5< +< %
-
8/18/2019 tgs klpk 2.pptx
24/44
Pe/0nan Psa "lse/ Ba/
N$ N$
%ASIS
NAMA
%ASIS
56K 5I7 5KP
% '5%6-555% Sepsa N"R 15 7% %6%
( '5%6-555( Sari L"9 +6 ++ %(%
) '5%6-555) Risa E 16 16 %75
+ '5%6-555+ .ri# S"L 77 7% %)1
(80+65+85+77) / 4 = 76.75
(71+66+85+71) / 4 = 73.25
(151+131+170+148) / 4 = 150
"1 #
"1 +6.5 +3.25 15'
-
8/18/2019 tgs klpk 2.pptx
25/44
Pe/0nan Psa "lse/ Ba/
(55+60+45+75) / 4 = 58.75
(72+73+61+95) / 4 = 75.25
(127+133+106+170) / 4 = 134
"2 #
"2 5%.+5 +5.25 134
N$ N$
%ASIS
NAMA
%ASIS
56K 5I7 5KP
' '5%6-555'
8hela S 66 7' %'7
6 '5%6-5556
:hodi "K +5 7( %((
7 '5%6-5557
Itok 2 )6 +% %5+
1 '5%6-5551
Ika T 76 ;6 %75
-
8/18/2019 tgs klpk 2.pptx
26/44
. "en)('an)an 'an)a1 e 2 1in))a+osisi *ata ti*a en)a'ai
+er(a1an
Pusat %luster &
%& +6.5 +3.25 15'
Pusat %luster '
%'5%.+5 +5.25 134
-
8/18/2019 tgs klpk 2.pptx
27/44
a( Pe/0nan a/a a/ aa e 7 1 e/0aa88sa lse/
"1 # $+6.5&%'()*$+3.25&+1()*$15'&151()
"1 # 4
-
8/18/2019 tgs klpk 2.pptx
28/44
kelompok ! " #uhammad Ikhlas $ #u%iaSani%a $ Re&i 'usri&a $ Rizalina $ Romi
(i)a*a
-
8/18/2019 tgs klpk 2.pptx
29/44
kelompok ! " #uhammad Ikhlas $ #u%iaSani%a $ Re&i 'usri&a $ Rizalina $ Romi
(i)a*a
-
8/18/2019 tgs klpk 2.pptx
30/44
9( Pe/0nan a/a a/ aa e 7 2 e/0aa88sa lse/
"1 # $+6.5&55()*$+3.25&+2()*$15'&12+()
"1 # 31.5'%-3
"2 # $5%.+5&55()*$+5.25&+2()*$134&12+()
"2 # %.5'33+
-
8/18/2019 tgs klpk 2.pptx
31/44
( Pe/0nan a/a a/ aa e 7 3 e/0aa88sa lse/
"1 # $+6.5&65()*$+3.25&66()*$15'&131()
"1 # 2'.65-44
"2 # $5%.+5&65()*$+5.25&66()*$134&131()
"2 # 11.55-63
-
8/18/2019 tgs klpk 2.pptx
32/44
Perhitungan dilakukan terus sampai data ke – &, terhadap pusat clusterSetelah dilakukan pr!ses perhitungan maka akan didapatkan dataselengkapn"a adalah #
Ta9el 4. Hasl 8e/0nan a/a sea8 aa e "lse/
NONO
"ASISNAMA"ASIS
%& %'
& '5%6-555% Sepsa N"R (2'*.+& (()&)('
' '5%6-555' 8hela S +&,8.+ 8,++*+ '5%6-555( Sari L"9 ',).(( &&.)+( '5%6-555) Risa E '(*,(, +,((8*+ '5%6-5556 :hodi "K '+).',+ '*)&') '5%6-555+ .ri# S"L +&,'(+ '++.,*,
* '5%6-5557 Itok 2 ,.* '8.*,8.8 '5%6-5551 Ika T '8.*,8. ((&),''
-
8/18/2019 tgs klpk 2.pptx
33/44
6. Penel:;8:an Data
Ta9el 5. P:ss "lse/ 8aa e/as Kea
NO NO"ASIS
NAMA "1 "2 /A0AK %& /A0AK %'
& '5%6-555%
SepsaN"R
',)+.**
(2'*.+& & ,
' '5%6-555' 8hela S+&,8.+
8,++* , &
+ '5%6-555(
Sari L"9 ',).((
&&.)+ , &
( '5%6-555)
Risa E '(*,(,
+,((8*+ & , '5%6-5556
:hodi"K
'+).',+
'*)&' , &
) '5%6-555+
.ri# S"L +&,'(+
'++.,*, & ,
* '5%6-
5557
Itok 2 ,.*
'8.*,8. , &
-
8/18/2019 tgs klpk 2.pptx
34/44
+. Penenan Psa "lse/ Ba/
Kemudian kita tentukan lagi pusat cluster daridata "ang 1aru2 caran"a dengan men3umlahkannilai semua 4akultas "ang merupakan angg!ta daricluster dan di1agi t!tal 3umlah angg!ta cluster
"lse/ 8e/a;a 8nya 4 aaya aa e !
! 2< 3< 5< +
"lse/ ea 8nya 6 aa
ya aa e !
! 1< 4< 6< %
-
8/18/2019 tgs klpk 2.pptx
35/44
Pe/0nan Psa "lse/ Ba/
(55+65+60+45) / 4 = 56.25
(72+66+73+61) / 4 = 68
(127+131+133+106) / 4 = 124.25"1 #
"1 56.25 6% 124.25
NONO
"ASIS
NAMA
"ASIS
KESEHAT
AN
PSI=AK>
MK
TOTAL
' '5%6-555' 8hela S 66 7' %'7
( '5%6-555( Sari L"9 +6 ++ %(%
6 '5%6-5556 :hodi "K +5 7( %((
7 '5%6-5557 Itok 2 )6 +% %5+
Pe/0nan Psa "lse/ Ba/
-
8/18/2019 tgs klpk 2.pptx
36/44
Pe/0nan Psa "lse/ Ba/
(80+85+77+75) / 4 = 79.25
(71+85+71+95) / 4 = 80.5
(151+170+148+170) / 4 = 159.75"2 #
"2 +-.25 %'.5 15-.+5
NO NO TEST"PNS NAMA"ASIS KESEHAT AN PSI=AK>MK TOTAL
% '5%6-555% Sepsa N"R 15 7% %6%
) '5%6-555) Risa E 16 16 %75
+ '5%6-555+ .ri# S"L 77 7% %)1
1 '5%6-5551 Ika T 76 ;6 %75
-
8/18/2019 tgs klpk 2.pptx
37/44
%. Penlanan lana0 e 2 0na 8:ss aaa ;enala; 8e/9a0an
Pusat %luster &
%& 56.25 6% 124.25
Pusat %luster '
%'+-.25 %'.5 15-.+5
-
8/18/2019 tgs klpk 2.pptx
38/44
-
8/18/2019 tgs klpk 2.pptx
39/44
9( Pe/0nan a/a a/ aa e 7 2 e/0aa88sa lse/
"1 # $56.25&55()*$6%&+2()*$124.25&12+()
"1 # 5.'124%
"2 # $+-.25&55()*$%'.5&+2()*$15-.+5&12+()
"2 # 41.62+%1
-
8/18/2019 tgs klpk 2.pptx
40/44
( Pe/0nan a/a a/ aa e 7 3 e/0aa88sa lse/
"1 # $56.25&65()*$6%&66()*$124.25&131()
"1 # 11.23'54
"2 # $+-.25&65()*$%'.5&66()*$15-.+5&131()
"2 # 35.211%6
-
8/18/2019 tgs klpk 2.pptx
41/44
Perhitungan dilakukan terus sampai data ke – &, terhadap pusat clusterSetelah dilakukan pr!ses perhitungan maka akan didapatkan dataselengkapn"a adalah #
Ta9el 6. Hasl 8e/0nan a/a sea8 aa e "lse/
NONO
"ASISNAMA"ASIS
%& %'
& '5%6-555% Sepsa N"R +8.*(' 8*
' '5%6-555' 8hela S ,&'(8 (&)'*8&+ '5%6-555( Sari L"9 &&'+,( +'&&8)
( '5%6-555) Risa E ))((*' &'.()(
'5%6-5556 :hodi "K &,*(88( ++*..,(
) '5%6-555+ .ri# S"L +&*,* '(,(('+
*'5%6-5557 Itok 2
'''* )))&&(
8 '5%6-5551 Ika T )++(.+ &8'8)
-
8/18/2019 tgs klpk 2.pptx
42/44
-. Penel:;8:an Data
Ta9el +. P:ss "lse/ 8aa e/as Kea
NO NO"ASIS
NAMA"ASIS
"1 "2 /A0AK %& /A0AK%'
& '5%6-555%SepsaN"R
+8.*(' 8*
+
' '5%6-555'8hela S ,&'(8 (&)'*8& ++ '5%6-555(Sari L"9 &&'+,( +'&&8) +( '5%6-555)Risa E &'.()( ))((*' + '5%6-5556:hodi
"K
&,*(88( ++*..,(
+
) '5%6-555+.ri# S"L +&*,* '(,(('+ + * '5%6-5557Itok 2 '''* )))&&( +8 '5%6-5551Ika T )++(.+ &8'8) +
-
8/18/2019 tgs klpk 2.pptx
43/44
&, Karena %& 9 %' dimana angg!ta "ang sama2 makatidak perlu dilakukan iterasi : perulangan lagi ;ansampai disini hasil %lustering sudah mencapaista1il dan K!n
-
8/18/2019 tgs klpk 2.pptx
44/44
HASIL PEN?ELOMPOKAN "LUSTER
I5E0ASI & I5E0ASI ' I5E0ASI +
/A0AK A /A0AK = /A0AK %
%& %' %& %' %& %'
& , & , +
, & , & +& , , & +
& , & , +
, & , & +
& , & , +
, & , & +
, & & , +