analisis cluster dan analisis deskriminan

7/21/2019 Analisis Cluster Dan Analisis Deskriminan

http://slidepdf.com/reader/full/analisis-cluster-dan-analisis-deskriminan 1/8

1

ANALISIS KELOMPOK DAN ANALISIS DISKRIMINAN UNTUK

MENGGOLONGKAN TINGKAT PENGANGGURAN DI PROVINSI

JAWATIMUR BERDASARKAN PENDIDIKAN TERAKHIR YANG

DITEMPUH

Pratiwi, Y; Rahardjo, S dan Susiswo Jurusan Matematika

Fakultas MIPA Universitas Negeri Malang

ABSTRAK: Pengangguran adalah salah satu isu penting yang perlu

menjadi perhatian dalam pembangunan ekonomi daerah. Dalam

pembangunan dan kegiatan berproduksi, peranan tenaga manusia

banyak ditentukan oleh jumlah dan kualitas tenaga kerja yang

tersedia di berbagai bidang kegiatan. Berbagai bidang dalam

pembangunan sumber daya manusia mencakup bidang kesehatan,

perbaikan gizi, pendidikan dan latihan serta penyediaan lapangan

kerja, sehingga kualitas manusia dapat ditingkatkan.. Oleh karena

itu, indikator pengangguran dalam penelitian ini berdasarkan

pendidikan terakhir yang ditamatkan dan angka buta huruf. Langkah

pertama yang dilakukan adalah menggolongkan kabupaten dan kota

yang ada di jawa timur menggunakan analisis kelompok metode K-

Mean. Langkah kedua menggunakan analisis diskriminan untuk

menentukan persamaan diskriminan dan mengetahui keakuratan

fungsi diskriminan yang terbentuk. Berdasarkan analisis kelompok

didapatkan kelompok 1 beranggotakan 24 dan kelompok 2

beranggotakan 14. berdasarkan analisis diskriminan diperoleh fungsidiskriminan sebagai berikut.

Kata kunci: analisis kelompok, analisis diskriminan,

pengangguran, K-Mean .

ABSTRACT: Unemployments is an important issue that need a

special attention in a regional economic development. In the

development and production activity, most of the human labor are

determined by the total and the quality of the labor itself in any fieldsof activity. There are some fields in the human source development

which cover health, nutritional improvement, education and training,

and providing jobs. By those fields, the quality of human source can

be improved. Therefore, the unemployment indicators in this

research are built upon the final attained education and illiteracy rate.

The first step that should be done is classifying the counties

and cities in East Java by using the cluster analysis of K-Mean. The

second step is using the discriminant analysis to determine the

discriminant equation and detecting the accuracy of discriminant

function that has been made. Based on the cluster analysis, there is

one group consists of 24 counties/cities dan the group two consists of



2

14 counties/cities. The discriminant analysis we get the discriminant

function as follows,

Keywords: cluster analysis, discriminant analysis, unemployment,

K-Mean.

Di tahun 2013 Kamar Dagang dan Industri Indonesia (Kadin) menilai angka

pengangguran di Indonesia sudah cukup tinggi akibat kesenjangan antara

pertumbuhan angkatan kerja dan lapangan pekerjaan. Pertumbuhan tenaga kerja

yang kurang diimbangi dengan pertumbuhan lapangan kerja akan menyebabkan

tingkat kesempatan kerja cenderung menurun.

International Labour Organization (ILO) mendefinisikan beberapa faktor

yang berpengaruh terhadap TPT diantaranya yaitu kependudukan, pendidikan,

upah tenaga kerja, PDRB, banyaknya pekerja di sektor formal dan informal,infrastruktur, serta sarana dan prasarana yang tersedia di suatu wilayah. Indikator

TPT ini berguna sebagai acuan pemerintah untuk dibukanya lapangan kerja baru

(BPS 2007).

Selama ini hampir semua orang berpendapat, pendidikan diharapkan mampu

mengubah manusia, dari tidak bisa menjadi bisa, dari tidak mampu menjadi

mampu, dari tidak berbudaya menjadi berbudaya. Ekspektasi terhadap dunia

pendidikan di atas tentu bertolak belakang dengan realita pengangguran yang ada

di negara kita. Artinya, terdapat jutaan intelektual dan kaum terdidik yang menjadi

pengangguran terbuka.

Berdasarkan permasalahan di atas supaya diketahui pengangguran di

kota/kab di jawa timur berada pada tingkat pengangguran rendah atau tinggi maka

perlu adanya pengelompokan, sehingga penyuluhan tentang pentingnya

pendidikan demi masa depan yang diharapkan sesuai dengan tingkat

pengelompokkan Kab/Kota. Analisis kelompok adalah termasuk yang sesuai

untuk melakukan pengelompokan dalam kelompok-kelompok berdasarkan

pendidikan terakhir yang ditamatkan. Untuk lebih mempermudah membedakan

antar kelompok maka pengangguran dikelompokkan menjadi 2 yaitu tingkat

pengangguran tinggi dan tingkat pengangguran rendah maka dalam permasalahan

ini digunakan analisis kelompok metode k-mean. Analisis Kelompok dengan

metode K-Mean adalah statistik yang berguna untuk mengelompokkan sejumlah

objek dalam jumlah kelompok yang sudah ditentukan di mana karakteristik objekhanya dikelompokkan berdasarkan variabel tertentu, tetapi karakteristik latar

belakang objek belum diketahui pasti (Sofyan Yamin dan Heri Kurniawan,

2011:196). Analisis diskriminan merupakan teknik yang akurat untuk

memprediksi seseorang termasuk ke dalam kategori apa, dengan catatan data-data

yang dilibatkan terjamin akurasinya (Bilson Simamora, 2005:143).

METODE PENELITIANData yang digunakan dalam penelitian ini adalah data sekunder yaitu data

yang telah dikumpulkan terlebih dahulu oleh pihak-pihak lain selain peneliti.

Dalam penelitian ini data sekunder diperoleh dari BPS Jawa Timur.



3

Data

Teknik analisis yang digunakan dalam penelitian ini yaitu analisis kelompok

metode k-mean dan analisis diskriminan.

Adapun hubungan antar variabel penelitian adalah sebagai berikut.

Variabel Bebas (X) atau variabel prediktor yang diamati adalah sebagai berikut.

1.

X1 = Jumlah penduduk yang tidak atau belum pernah sekolah.2. X2 = Jumlah penduduk yang tidak tamat Sekolah Dasar (SD).

3. X3 = Jumlah penduduk yang tamat Sekolah Dasar (SD).

4. X4 = Jumlah penduduk yang tamat Sekolah Menengah Pertama(SMP).

5. X5 = Jumlah penduduk yang tamat Sekolah Menengah Atas(SMA).

6. X6 = Jumlah penduduk yang tamat Perguruan Tinggi (PT).

7.

X7 = Jumlah penduduk yang Buta Huruf.

Populasi dalam penelitian ini adalah masyarakat pengangguran di kota/kab di

Jawa Timur tahun 2010 yang tercantum dalam hasil Survey Sosial Ekomomi

Nasional. Data pengangguran ini didapat dari BPS Provinsi Jawa Timur.

Sampel dalam penelitian ini adalah masyarakat yang menganggur di kota Malang

tahun 2010. Teknik dalam pengumpulan data yang menunjang dalam penelitian ini

dilakukan sebagai berikut.

1. Peneliti mengambil data BPS Provinsi Jawa Timur melalui web

www.bps.go.id.

2. Data yang digunakan pada penelitian ini adalah data sekunder. Data

tersebut diperoleh dari pihak yang berwenang di BPS Jawa Timur.

Analisis data dalam penelitian ini menggunakan metode analisis kelompok

dan analisis diskriminan yang dilakukan dengan bantuan program minitab dan

SPSS. Adapun langkah-langkahnya adalah sebagai berikut.

Proses Pengelusteran dengan metode k-means

Menentukan profil setiap kelompok

ya

Analisis diskriminan

tidak

Uji

asumsi

ya

tidak

Uji

Validasi



4

Langkah pertama yang dilakukan pada analisis kelompok adalah uji kenormalan

multivariat. Langkah kedua adalah uji multikolinieritas. Multikolinieritas adalah

suatu keadaan dimana terdapat dua variabel atau lebih, saling berkorelasi. Dan

langkah ketiga adalah Dalam analisis kelompok, pengelompokan data atau

permasalahan dibutuhkan suatu ukuran yang dapat menerangkan kedekatan antaradata. Dimana ukuran jarak yang biasa digunakan adalah ukuran jarak Euclidean.

Setelah itu mulai melakukan analisis kelompok.

Analisis kelompok atau biasa dikenal sebagai cluster analysis adalah salah

satu teknik statistik yang bertujuan untuk mengelompokkan objek ke dalam suatu

kelompok sedemikian sehingga objek yang berada dalam satu kelompok akan

memiliki kesamaan yang tinggi dibandingkan dengan objek yang berada di

kelompok lain (Sharma, 1996:185). Langkah pengelompokkan dalam analisis

kelompok terdiri dari 3 langkah yaitu Mengukur kesamaan jarak, membentuk

kelompok secara K-Means, menentukan jumlah kelompok.

Dengan melakukan uji normal multivariat, uji homogen, dan uji

multikolinieritas, kita dapat melakukan analisis diskriminan. Heteroskedastisitasakan mengakibatkan penaksiran koefisien-koefisien regresi menjadi tidak efisien.

Hasil penaksiran akan menjadi kurang dari semestinya. Asumsi homoekedastisitas

berarti sama(homo) dan sebaran memiliki varian yang sama (Imam

Ghozali,2009:35). Jika nilai Thitung < Tα/2(n-k-1) atau Thitung > Tα/2(n-k-1)

dan nilai signifikan >0.05 maka mengindikasi bahwa sisaaan tersebut tidak

mengalami heteroskedastisitas (nilai tersebut homogen).

Analisis diskriminn merupakan salah satu metode analisis multivariat yang

digunakan untuk mengetahui variabel-variabel ciri yang membedakan tiap-tiap

kelompok yang terbentuk dan bertujuan untuk mengklasifikasikan beberapa

kelompok data yang sudah terkelompokkan dengan cara membentuk kombinasi

linier fungsi diskriminan.

Menurut Dillon (1984) dalam analisis diskriminan dengan p variabel yang

diukur terdapat asumsi-asumsi yang harus dipenuhi untuk mendapatkan

kombinasi linier fungsi diskriminan yang optimal dengan kesalahan klasifikasi

terkecil adalah sebagai berikut:

a. Data berdistribusi normal multivariate

b. Matriks varian kovarians antar kelompok homogen.

Setelah Fungsi diskriminan terbentuk, langkah selanjutnya adalah menilai

validitas analisis diskriminan. Hasil klasifikasi dapat didasarkan pada analisis

sampel ataupun validitas sampel dapat dilakukan dengan cara sebagai berikut.

a.

Menghitung diskriminan scoreSetelah dibentuk fungsi liniernya, maka dapat dihitung skor diskriminan

untuk tiap observasi dengan memasukkan nilai-nilai variabel penjelasnya.

b. Menghitung cutting score

Cutting score (m) dapat dihitung dengan rumus sebagai berikut :

Keterangan :

: Cutting score

: jumlah anggota grup A

: jumlah anggota grup B

: centroid grup A



5

: centroid grup Bc. Hit Ratio

Setelah semua observasi diprediksi keanggotaannya, kita dapat

menghitung hit ratio. Hit Ratio merupakan nilai yang dapat menjawab:

“Berapa persen objek yang dapat diklasifikasi secara tepat dari jumlahtotal objek?” Hit Ratio adalah persentase kasus atau responden yang

kelompoknya dapat diprediksi secara tepat. Rumus hit ratio yang

digunakan adalah:

Dimana:

n = jumlah kasus yang dapat diklasifikasi secara tepat

N = jumlah sampel

Kriteria hit ratio yang baik adalah kalau sama atau melebihi kesempatan

klasifikasi ditambah seperempatnya (Hair et. al., op. cit., hlm. 269-270).

Kalau kesempatan klasifikasi adalah 50%, batas minimal hit ratio adalah0,50 + (0,25) (0,50) = 0,625 atau 62,5%. Kalau kita memiliki 4 grup,

kesempatan klasifikasi adalah 25%. Dengan cara yang sama, batas

minimal hit ratio adalah 31,25%.

d. Akurasi statistik

Klasifikasi yang dilakukan dengan fungsi diskriminan dapat diuji

keakuratannya dengan menggunakan Press’s Q Statistik . Ukuran

sederhana ini membandingkan jumlah kasus yang diklasifikasikan secara

tepat dengan ukuran sampel dan jumlah grup. Nilai yang diperoleh dari

perhitungan kemudian dibandingkan dengan nilai kritis (critical value).

Press’s Q Statistik dapat ditulis dengan rumus :

[ ]

N : ukuran sampel

n : jumlah kasus yang diklasifikasi secara tepat

K : jumlah grup

HASIL ANALISIS DAN PEMBAHASAN

Uji Kenormalan MultivariatPengujian kenormalan ini dengan melihat gambar hasil QQ plot yang

terdapat di dalam software Macro Minitab 16. Hasil dari gambar plot

menunjukkan titik mendekati garis lurus dan hasil dari macro minitab diperoleh t= 0,736842, hal ini membuktikan bahwa sampel dapat diasumsikan berasal dari

populasi normal multivariat.

Uji Multikolinieritas Tabel nilai koefisien korelasi sederhana (simple correlation) antar sesama

variabel bebas tidak ada yang melebihi maka data tersebut menunjukkan tidak

terjadinya gejala multikolinieritas.

Jarak Euclidean

Langkah pertama yang digunakan dalam analisis cluster adalah menghitung

jarak Euclidean.



6

Analisis Kelompok (Cluster Analysis ) Setelah menghitung jarak Euclidean. Proses selanjutya adalah melakukan

analisis kelompok dengan menggunakan metode K-Mean. Diperoleh jumlah

anggota pada kelompok 1 dalah 24 dan jumlah anggota pada kelompok 2 adalah

14.Analisis Diskriminan

Analisis diskriminan bertujuan untuk menghitung fungsi diskriminan yang

dapat digunakan sebagai pembeda kelompok.

1. Uji Normal Multivariat

Uji normal multivariat pada analisis diskriminan sama yaitu dengan melihat

gambar hasil QQ plot pada software Macro Minitab 16. bahwa plot menunjukkan

titik mendekati garis lurus dan hasil dari macro minitab t = 0,74752, hal ini

membuktikan bahwa sampel dapat diasumsikan berasal dari populasi normal

multivariat.

2. Uji Homogenitas

Tahap selanjutnya adalah pengujian kehomogenan suatu data dengan melihatnilai t hitung lebih besar dari t tabel.

Daerah kritisnya adalah Thitung < Tα/2(n-k-1) = atau Thitung < Tα/2(n-k-1) =

.

karena nilai Thitung dari seluruh variabel penjelasan tidak terletak pada daerah

kritis, maka H0 diterima dan nilai signifikan dari seluruh variabel penjelas >

maka model ini homogen.

3. Uji Multikolinieritas

Untuk menguji multikolinieritas pada analisis diskriminan pada dasarnya

sama dengan analisis kelompok yaitu dapat dilihat dengan menghitung koefisien

korelasi sederhana ( simple correlation) antara sesama variabel bebas.

Diperoleh nilai koefisien korelasi sederhana (simple correlation) antar

sesama variabel bebas tidak ada yang melebihi maka data tersebut

menunjukkan tidak terjadinya gejala multikolinieritas.

4.

Proses Diskriminan

Dengan metode fisher diperoleh model diskriminan yang terbentuk, yaitu:

5. Validasi

a. Cutting score determination

Diperoleh nilai pembatasnya adalah 0,014. Jika di bawah 0,014 masuk grup 1

(tingkat pengangguran tinggi) dan jika di atas 0,014 masuk grup 2 (tingkat pengangguran rendah).

b. Hit ratio

Karena hit ratio > batas minimal hit ratio, yaitu 100% > 62,5 %. Sehingga

dapat disimpulkan bahwa model diskiminan yang terbentuk mempunyai tingkat

validasi yang tinggi, yaitu 100%, sehingga dapat disimpulkan bahwa fungsi

diskriminan mampu memprediksi keanggotaan semua Kab/Kota.

c. Akurasi statistik

[ ]

Dengan α=0,05 dan df=1, nilai X2 tabel adalah 3,841. Karena Nilai

sehingga dapat disimpulkan bahwa fungsi diskriminan akurat.



7

PENUTUP

KesimpulanBerdasarkan hasil analisis data dan pembahasan yang telah dilakukan, maka

kesimpulan yang dapat diambil adalah sebagai berikut.

1.

Berdasarkan analisis kelompok, pengelompokkan 38 kabupaten dan kota di provinsi Jawa Timur menggunakan metode K-mean dapat dibentuk 2

kelompok, dengan kelompok 1 (tingkat pengangguran tinggi) beranggotakan

24 kab/kota yaitu Pacitan, Ponorogo, Trenggalek, Blitar, Kediri, Malang,

Lumajang, Jember, Banyuwangi, Bondowoso, Situbondo, Probolinggo,

Pasuruan, Nganjuk, Madiun, Magetan, Ngawi, Bojonegoro, Tuban,

Lamongan, Bangkalan, Sampang, Pamekasan, Sumenep. Sedangkan

kelompok 2 beranggotakan 14 kab/kota yaitu Tulungagung, Sidoarjo,

Mojokerto, Jombang, Gresik, Kota Kediri, Kota Blitar, Kota Malang, Kota

Probolinggo, Kota Pasuruan, Kota Mojokerto, Kota Madiun, Kota Surabaya,

Kota Batu.

2.

Berdasarkan analisis diskriminan diperoleh fungsi diskriminan sebagai berikut.

Sehingga dapat disimpulkan jika penambahan angka pada variabel dan ,maka angka pengangguran di kabupaten dan kota di jawa timur akan

menurun. Tetapi, jika penambahan angka pada variabel , dan

, maka angka pengangguran di kabupaten dan kota di jawa timur akan

meningkat. Dan juga fungsi diskriminan yang diperoleh dari data

pengelompokan memiliki tingkat validasi 100% dengan kata lain Kab/kota

pada kelompok tingkat pengangguran rendah dan tingkat pengangguran

tinggi yang dihasilkan dari analisis kelompok memiliki tingkat akurasi

tinggi.

SaranBerdasarkan uraian diatas, maka saran yang diajukan dirumuskan sebagai

berikut. Bagi pemerintah di Jawa Timur diharapkan setelah adanya penelitian ini

bisa lebih memperhatikan pendidikan masyarakatnya. Bagi peneliti lain untuk

kasus pengangguran diharapkan menambahkan variabel-varibel yang lebih

bervariasi. Analisis kelompok dan analisis diskriminan dapat digunakan pada

kasus lain seperti: kesehatan, pendidikan, pemilihan operator, dll.

DAFTAR PUSTAKAAnwar, Desy. 2003. Kamus Lengkap Bahasa Indonesia. Surabaya: Amelia

Ghozali, Imam. 2009. Aplikasi Analisis Multivariate Dengan Program SPSS ,

Cetakan IV, Badan Penerbit Universitas Diponegoro, Semarang.

Manurung, Mandala dan Prathama Rahardja, 2004. Uang, Perbankan, dan

Ekonomi Moneter . Jakarta: Penerbit Salemba.

Sadono, Sukirno. 2008. Makroekonomi Teori Peng antar. Jakarta: Rajawali

Grafindo.

Sharma, Subhas. 1996. Applied Multivariate Techniques. New York: John Wiley

and Sons, Inc.



8

Soemartini. 2008. Principal Component Analysis (PCA) Sebagai Salah Satu

Metode Untuk Mengatasi Masalah Multikolinearitas. Jatinangor :

Universitas Padjajaran.

Sofyan Yamin & Heri Kurniawan. (2011). Generasi Baru Mengolah Data

Penelitian dengan Partial Least Square Path Modeling : Aplikasi denganSoftware XLSTAT, SmartPLS, dan Visual PLS . Jakarta : Salemba Infotek

Subri, Mulyadi. 2003. Ekonomi Sumberdaya Manusia: Jakarta: Raja Graindo

Persada.

Suryanto. 1988. Metode Statistika Multivariat . Jakarta: Departemen Pendidikan

dan kebudayaan.

analisis cluster dan analisis deskriminan

Documents