bagian inti+akhir

47
Analisis Multivariat II BAB I PENDAHULUAN 1.1 Latar Belakang Indonesia memiliki penduduk yang sangat beragam. Berbagai macam ras, kebudayaan dan adat istiadat ada dalam negara Indonesia. Akan tetapi hal yang terpenting adalah Indonesia memiliki penduduk yang beragam dari berbagai macam suku yang tentunya memiliki berbagai macam perbedaan. Kebiasaan penduduk Indonesia pun sangat beragam sehingga pemerintah tentu saja harus memahami bagaimana kebiasaan dari setiap penduduk. Menurut Badan Pusat Statistik, penduduk di Indonesai mencapai 245 juta jiwa. Semakin lama, penduduk di Indonesia semakin meningkat. Pertumbuhan penduduk di Indonesia ini disebabakan oleh banyaknya kelahiran dan sedikitnya angka kematian. Menurut Badan Pusat Statistik, setiap tahun penduduk di Indonesia memiliki pertumbuhan sebesar 4 juta jiwa setiap tahunnya. Angka yang cukup banyak untuk pertumbuhan di negara berkembang. Dari 245 juta penduduk Indonesia tahun 2010, 24 juta diantaranya adalah penduduk lanjut usia. Dari jumlah penduduk di Indonesia, terdapat pengelompokan menurut usia. Hal ini diperlukan karena setiap kelompok usia memilki kebutuhan dan kebiasaan yang berbeda-beda. Misalnya saja Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 1

Upload: gidutch

Post on 02-Aug-2015

60 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: Bagian Inti+Akhir

Analisis Multivariat II

BAB I

PENDAHULUAN

1.1 Latar Belakang

Indonesia memiliki penduduk yang sangat beragam. Berbagai macam ras,

kebudayaan dan adat istiadat ada dalam negara Indonesia. Akan tetapi hal yang terpenting

adalah Indonesia memiliki penduduk yang beragam dari berbagai macam suku yang

tentunya memiliki berbagai macam perbedaan. Kebiasaan penduduk Indonesia pun sangat

beragam sehingga pemerintah tentu saja harus memahami bagaimana kebiasaan dari setiap

penduduk. Menurut Badan Pusat Statistik, penduduk di Indonesai mencapai 245 juta jiwa.

Semakin lama, penduduk di Indonesia semakin meningkat. Pertumbuhan penduduk

di Indonesia ini disebabakan oleh banyaknya kelahiran dan sedikitnya angka kematian.

Menurut Badan Pusat Statistik, setiap tahun penduduk di Indonesia memiliki pertumbuhan

sebesar 4 juta jiwa setiap tahunnya. Angka yang cukup banyak untuk pertumbuhan di

negara berkembang.

Dari 245 juta penduduk Indonesia tahun 2010, 24 juta diantaranya adalah

penduduk lanjut usia. Dari jumlah penduduk di Indonesia, terdapat pengelompokan

menurut usia. Hal ini diperlukan karena setiap kelompok usia memilki kebutuhan dan

kebiasaan yang berbeda-beda. Misalnya saja untuk kelompok lanjut usia yang harus

diperhatikan lebih oleh pemerintah.

Penduduk yang termasuk lanjut usia adalah penduduk yang telah berumur 60

tahun. Mengingat penduduk lansia semakin lama semakin banyak, didasarkan perkiraan

BPS pada tahun 2005 penduduk lansia cenderung bertambah atau ada perubahan struktur

dari struktur penduduk muda ke struktur penduduk tua. Indonesia sendiri menduduki

ranking keempat di dunia dengan jumlah lansia 24 tahun jiwa yang belum terlalu

mendapat perhatian. Tidak hanya menghadapi angka kelahiran yang semakin meningkat,

Indonesia juga menghadapi beban ganda dengan kenaikan jumlah penduduk lanjut usia

(60 tahun keatas) karena usia harapan hidup yang makin panjang bisa mencapai 77 tahun.

Dengan jumlah penduduk lanjut usia yang semakin besar, perlu adanya perhatian

ekstra dari pihak pemerintah untuk permasalahan ini. Masalah penduduk lanjut usia ini

dapat menjadi masalah besar atau peluang yang tidak kalah besarnya. Pertambahan jumlah

penduduk lanjut usia akan menyebabkan perubahan berbagai sendi kehidupan, ekonomi,

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 1

Page 2: Bagian Inti+Akhir

Analisis Multivariat II

sosial kemasyarakatan, seperti kebutuhan hidup, makanan dan minuman. Untuk itu, perlu

adanya stategi persiapan dan pemberdayaan atau pembinaan bagi penduduk lanjut usia

agar dapat tetap aktif dan berkarya. Diperkirakan sekarang hanya ada 20% lansia yang

sakit-sakitan, sedangkan sisanya 80% adalah lansia potensial yang masih bisa

diberdayakan.

Untuk dapat mengatasi hal tersebut dan agar lansia tetap produktif, pemerintah

harus melakukan pembinaan terhadap provinsi-provinsi di Indonesia yang memiliki cukup

banyak lansia. Pembentukan wilayah pembinaan untuk permasalahan lansia perlu

dilakukan agar pemerintah dapat mengetahui wilayah mana saja yang harus mendapatkan

pembinaan terdahulu berdasarkan karakteristik dari keterlantaran penduduk lanjut usia.

Hal ini dilakukan agar penduduk lanjut usia tetap produktif.

1.2 Identifikasi Masalah

Berdasarkan latar belakang penelitian di atas, maka masalah-masalah yang ingin

diteliti dalam penelitian ini adalah sebagai berikut:

1. Provinsi mana sajakah yang memiliki kesamaan karakteristik dalam penanganan

masalah penduduk lanjut usia?

2. Provinsi mana sajakah yang harus lebih diperhatikan oleh pemerintah?

3. Bagaimana karakteristik objek pada setiap kelompok ?

1.3 Tujuan Penelitian

Tujuan dari pembuatan makalah ini adalah sebagai berikut:

1. Membagi atau mempartisi provinsi-provinsi di Indonesia menjadi dua kelompok yaitu

kelompok lanjut usia yang diperhatikan dan kelompok lanjut usia yang tidak

diperhatikan.

2. Mengidentifikasi provinsi-provinsi mana saja yang memiliki kesamaan karakteristik

dalam hal ini mengenai kelompok penduduk lanjut usia

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 2

Page 3: Bagian Inti+Akhir

Analisis Multivariat II

1.4 Manfaat Penelitian

Manfaat yang dapat di ambil dari penelitian ini adalah sebagai berikut :

Untuk Pemerintah

1. Dapat mengetahui provinsi-provinsi mana saja yang perlu mendapat perhatian ekstra

dari pemerintah.

2. Pemerintah dapat memilih langkah yang lebih baik untuk penanganan penduduk lanjut

usia.

Untuk penulis

1. Penulis dapat mengaplikasikan ilmu-ilmu yang telah dipelajari ke dalam kasus nyata.

2. Penulis dapat ikut serta dalam menangani masalah penduduk lanjut usia.

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 3

Page 4: Bagian Inti+Akhir

Analisis Multivariat II

BAB II

TINJAUAN PUSTAKA

2.1 Sejarah Analisa Multivariat

Analisis data multivariat telah berkembang pesat sejak munculnya komputer

modern. Langkah pertama dimulai pada sekitar tahun 1870 dalam paper berjudul Singular

Value Decomposition oleh Eugenio Beltrami dan regresi linear oleh Sir Francis Galton.

Selanjutnya, Karl Pearson, yang dikenal sebagai kontributor yang cukup besar untuk

analisis statistik, menemukan Principal Component Analysis.

Sejak saat itu, banyak penemuan penting yang mendukung penemuan analisa

multivariat, salah satunya adalah Hotelling Transform oleh Harold Hotelling pada tahun

1933. Pada tahun 196,, ekonom dan statistik Herman Wold menemukan Nonlinear

Iterative Partial Least Squares algorithm, atau NIPALS. Konsep ini tidak sepenuhnya

baru, sebab temuan serupa telah diterbitkan pada tahun 1923 oleh Fischer et al. Akan

tetapi, orisinalitas dalam karya Wold ’s H merupakan interpretasi dari partial least squares

dan memiliki kemampuan untuk mencari nilai yang hilang. Selama tahun-tahun

berikutnya, Wold mengembangkan algoritma NIPALS ke metode Partial Least Squares

regression (PLS) yang menjadi bagian inti dari software Umetric saat ini. Svante Wold

menyederhanakan algoritma PLS dan ditambah ke dalam interpretasi diagnostik pada

tahun 1980. Pekerjaan ini kemudian telah mengalami perubahan metode ke dalam alat

analisis data umum ilmiah.

Banyak sekali tokoh-tokoh statistik yang berperan dalam perkembangan ilmu

analisa multivariat. Diantaranya adalah  pada awal abad 19, Robert Adrian mulai

mempertimbangkan  distribusi normal bivariat dan Karl Pearson menemukan korelasi

berganda, dan analisis regresi. Terdapat pula Francis Galton yang memahami sifat korelasi

dan kedekatan pada akhir abad 19. Kemudian, GU Natal dan lain-lain mempertimbangkan

ukuran dari asosiasi dalam tabel kontingensi, dan dari sinilah data multivariate mulai

dihitung. J. Wishart menurunkan distribusi gabungan dari sampel varians dan covariances

untuk sampel kecil yang bersifat normal multivariat.

Harold Hotelling mengeneralisasi tabel t-statistik dan t-distribusi untuk masalah

multivariat. SS Wilks menemukan prosedur untuk tes hipotesis tambahan pada rata-rata,

variasi, dan covariances. Hotelling dan Maurice Bartlett membuat studi awal korelasi

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 4

Page 5: Bagian Inti+Akhir

Analisis Multivariat II

kanonik, intercorrelations antara dua kelompok variat. Penelitian lebih baru oleh SN Roy,

PL Hsu, Meyer Girshick, DN Nanda, dan lain-lain menangani root distribution dan

karakteristik tertentu yang berkaitan dengan masalah multivariat, terutama untuk korelasi

kanonik dan analisis varians multivariat. Banyak perhatian juga telah diberikan kepada

pengurangan data multivariat dan interpretasi melalui studi tentang analisis faktor dan

komponen utama.

Analisis multivariat dalam statistik dikhususkan untuk summarization,

representasi, dan interpretasi data ketika lebih dari satu karakteristik dari setiap unit

sampel diukur. Hampir semua proses pengumpulan data menghasilkan data multivariat.

Suatu masalah menggunakan analisa multivariat ketika terdapat banyak data, dimana data-

data tersebut saling berhubungan dan memepengaruhi satu sama lain. Sifat keterkaitan

tersebut dapat digunakan dalam prediksi, estimasi, dan metode klasifikasi. 

2.2 Analisis Multivariat

Tahap analisis data pada umumnya dapat dibagi menjadi tiga tahap. Ketiga tahap

tersebut adalah deskriptif, analisis bivariat, dan analisis multivariat. Deskriftif berbicara

mengenai gambaran suatu variabel, analisis bivariat berbicara tentang hubungan antara

dua variabel, sementara multivariat berbicara tentang hubungan antara banyak variabel

bebas dengan suatu variabel terikat. Disini kita akan lebih jauh berbicara mengenai apa itu

analisis multivariate.

Analisis multivariat merupakan salah satu teknik statistik yang digunakan untuk

memahami struktur data dalam dimensi tinggi. Disebut dimensi tinggi karena melibatkan

lebih dari satu variabel. Variabel-variabel itu saling terkait (berkorelasi) satu sama lain.

Disinilah letak perbedaan antara multivariabel dan multivariat. Multivariat pasti

melibatkan multivariabel tetapi tidak sebaliknya. Multivariabel yang saling berkorelasilah

yang dikatakan multivariat.

Pendapat lain mengatakan multivariat merupakan objek kajian pada statistika yang

mempelajari perilaku dan hubungan antara dua atau lebih variabel. Dasar dari kajian ini

adalah analisis korelasi dan analisis regresi untuk dua variabel. Prinsip yang sama

kemudian dikembangkan untuk lebih dari dua variabel. Kompleksitas yang muncul akibat

penambahan variabel dan tipenya (nominal, ordinal, atau rasional), serta teknik

penyaringan informasi yang bisa diambil menjadi kajian pembahasannya.(Wikipedia)

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 5

Page 6: Bagian Inti+Akhir

Analisis Multivariat II

Dari kedua pendapat diatas, dan digabungkan dengan apa yang telah kami pelajari

maka kami simpulkan bahwa Analisis statistik multivariat merupakan metode statistik

yang memungkinkan kita melakukan penelitian terhadap lebih dari dua variable secara

bersamaan dengan banyak variable bebas dan suatu variable terikat. Dengan menggunakan

teknik analisis ini maka kita dapat menganalisis pengaruh beberapa variable terhadap

variable-variabel lainnya dalam waktu yang bersamaan. Contoh kita dapat menganalisis

pengaruh variable kualitas produk, harga dan saluran distribusi terhadap kepuasan

pelanggan. Contoh yang  lain, misalnya pengaruh kecepatan layanan, keramahan petugas

dan kejelasan memberikan informasi terhadap kepuasan dan loyalitas pelanggan. Analisis

multivariat digunakan karena pada kenyataannnya masalah yang terjadi tidak dapat

diselesaikan dengan hanya menghubung-hubungkan dua variable atau melihat pengaruh

satu variable terhadap variable lainnya. Sebagaimana contoh di atas, variable kepuasan

pelanggan dipengaruhi tidak hanya oleh kualitas produk tetapi juga oleh harga dan saluran

distribusi produk tersebut.

Teknik analisis multivariat secara dasar diklasifikasi menjadi dua, yaitu analisis

dependensi dan analisis interdependensi. Analisis dependensi berfungsi untuk

menerangkan atau memprediski variable – variable tergantung dengan menggunakan dua

atau lebih variable bebas. Yang termasuk dalam klasifikasi ini ialah analisis regresi linear

berganda, analisis diskriminan, analisis varian multivariate (MANOVA), dan analisis

korelasi kanonik.

2.3 Analisis Cluster

2.3.1 Definisi Analisis Cluster

Analisis cluster merupakan teknik multivariat yang mempunyai tujuan utama

untuk mengelompokkan objek-objek berdasarkan karakteristik yang dimilikinya.

Analisis cluster mengklasifikasi objek sehingga setiap objek yang paling dekat

kesamaannya dengan objek lain berada dalam cluster yang sama. Cluster-cluster

yang terbentuk memiliki homogenitas internal yang tinggi dan heterogenitas

eksternal yang tinggi. Berbeda dengan teknik multivariat lainnya, analisis ini tidak

mengestimasi set vaiabel secara empiris sebaliknya menggunakan setvariabel yang

ditentukan oleh peneliti itu sendiri. Fokus dari analisis cluster adlah

membandingkan objek berdasarkan set variabel, hal inilah yang menyebabkan para

ahli mendefinisikan set variabel sebagai tahap kritis dalam analisis cluster. Set

variabel cluster adalah suatu set variabel yang merpresentasikan karakteristik yang

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 6

Page 7: Bagian Inti+Akhir

Analisis Multivariat II

dipakai objek-objek. Bedanya dengan analisis faktor adalah bahwa analisis cluster

terfokus pada pengelompokan objek sedangkan analisis faktor terfokus pada

kelompok variabel.

Solusi analisis cluster bersifat tidak unik, anggota cluster untuk tiap

penyelesaian/solusi tergantung pada beberapa elemen prosedur dan beberapa solusi

yang berbeda dapat diperoleh dengan mengubah satu elemen atau lebih. Solusi

cluster secara keseluruhan bergantung pada variabel-variaabel yang digunakan

sebagai dasar untuk menilai kesamaan. Penambahan atau pengurangan variabel-

variabel yang relevan dapat mempengaruhi substansi hasi analisisi cluster.

2.3.2 Cara Kerja Analisis Cluster

Secara garis besar ada tiga hal yang harus terjawab dalam proses kerja analisis

cluster, yaitu :

1. Bagaimana mengukur kesamaan ?

Ada tiga ukuran untuk mengukur kesamaaan antar objek, yaitu ukuran korelasi,

ukuran jarak, dan ukuran asosiasi.

2. Bagaimana membentuk cluster ?

Prosedur yang diterapkan harus dapat mengelompokkan objek-objek yang

memiliki kesamaan yang tinggi ke dalam sutau cluster yang sama.

3. Berapa banyak cluster/kelompok yang akan dibentuk ?

Pada prinsipnya jika jumlah cluster berkurang maka homogenitas alam cluster

secra otomatis akan menurun.

2.3.3 Proses Analisis Cluster

Sebagaimana teknik multivariat lain proses analisis cluster dapat dijelaskan

dalam enam tahap sebagai berikut :

Tahap Pertama : Tujuan Analisis Cluster

Tujuan utama analisis cluster adalah mempartisi suatu set objek menjadi dua

kelompok atau lebih berdasarkan kesamaan karakteristik khusus yang dimilikinya.

Dalam pembentukan kelompok/cluster dapat dicapai tiga tujuan, yaitu :

A. Deskripsi klasifikasi (taxonomy description)

Penerapan anallisis cluster secara tradisisonal bertujuan mengeksplorasi dan

membentuk suatu klasisfikasi/taksonomi secara empiris. Karena kemampuan

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 7

Page 8: Bagian Inti+Akhir

Analisis Multivariat II

partisinya analisis cluster dapat diterapkan secara luas. Meskipun secara empiris

merupakan teknik eksplorasi analisis cluster dapat pula digunakan untuk tujuan

konfirmasi.

a. Penyederhanaan Data

Penyederhanaan data merupakan bagian dari suatu taksonomi. Dengan struktur

yang terbatas observasi/objek dapat dikelompokkan untuk analisis selanjutnya.

b. Identifikasi Hubungan (Relationship Identification)

Hubungan antar objek diidentifikasi secara empiris. Struktur analisis cluster

yang sederhana dapat menggambarkan adanya hubungan atau kesamaan dan

perbedaan yang tidak dinyatakan sebelumnya.

B. Pemilihan pada Pengelompokan Variabel

Tujuan analisis cluster tidak dapat dipisahkan dengan pemilihan variabel yang

digunakan untuk menggolongkan objek ke dalam clucter-cluster. Cluster yang

terbentuk merefleksikan struktur yang melekat pada data seperti yang didefinisikan

oleh variabel-variabel. Pemilihan variabel harus sesuai dengan teori dan konsep

yang umum digunakan dan harus rasional. Rasionalitas ini didasarkan pada teori-

teori eksplisit atau penelitian sebelumnya. Variabel-variabel yang dipilih hanyalah

variabel yang dapat mencirikan objek yang akan dikelompokkan dan secara

spesifik harus sesuai dengan tujuan analisis cluster.

Tahap Kedua : Desain Penelitian dalam Analisis Cluster

Tiga hal penting dalam tahap ini adalah pendeteksian outlier, mengukur kesamaan,

dan standarisasi data.

A. Pendeteksian Outlier

Outlier adalah suatu objek yang sangat berbeda dengan objek lainnya. Outlier

dapat digambarkan sebagai observasi yang secara nyata kebiasaan, tidak mewakili

populasi umum, dan adanya undersampling dapat pula memunculkan outlier.

Outlier menyebabkan menyebabkan struktur yang tidak benar dan cluster yang

terbentuk menjadi tidak representatif.

B. Mengukur Kesamaan antar Objek

Konsep kesamaan adalah hal yang fundamental dalam analisis cluster. Kesamaan

antar objek merupakan ukuran korespondensi antar objek. Ada tiga metode yang

dapat diterapkan, yaitu ukuran korelasi, ukuran jarak, dan ukuran asosiasi.

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 8

Page 9: Bagian Inti+Akhir

Analisis Multivariat II

a. Ukuran Korelasi

Ukuran ini dapat diterapkan pada data dengan skala metrik, namun jarang

digunakan karena titik bertnya pada nilai suatu pola tertentu, padahal tisik

berat analisis cluster adalah besarnya objek. Kesamaan antar objek dapat

dilihat dari koefisien korelasi antar pasangan objek yang diukur dengan

beberapa variabel.

b. Ukuran Jarak

Merupakan ukuran yang paling sering digunakan. Diterapkan untuk data

berskala metrik. Sebenarnya merupakan ukuran ketidakmiripan, dimana jarak

yang besar menunjukkan sedikit kesamaan sebaliknya jarak yang pendek/kesil

menunjukkan bahwa suatu objek makin mirip dengan objek lain. Bedanya

dengan ukuran korelasi adalah bnahwa ukuran jarak fokusnya pada besarnya

nilai. Cluster berdasarkan ukuran korelasi bisa saja tidak memiliki kesamaan

nilai tapi memiliki kesamaan pola, sedangkan cluster dberdasrkan ukuran jarak

lebih memiliki kesamaan nilai meskipun polanya berbeda.

Ada beberapa tipe ukuran jarak antara lain jarak Euklidian, jarak city-Box, dan

jarak Mahalanobis. Ukuran yang paling sering digunakan adalah jarak

Euklidian. Jarak Euklidian adalah besarnya jarak suatu garis lurus yang

menghubungkan antar objek.

c. Ukuran Asosiasi

Ukuran asosiasi dipakai untuk mengukur data berskala nonmetrik (nominal

atau ordinal).

C. Standarisasi Data

a. Standarisasi Variabel

Bentuk paling umum dalam standarisasi variabel adalah konversi setiap variabel

terhadap skor atandar ( dikenal dengan Z score) dengan melakukan substraksi

nilai tengan dan membaginyadengan standar deviasi tiap variabel.

b. Standarisasi Data

Berbeda dengan standarisasi variabel, standarisasi ndata dilakukan terhadap

observasi/objek yang akan dikelompokkan.

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 9

Page 10: Bagian Inti+Akhir

Analisis Multivariat II

Tahap Ketiga : Asumsi-asumsi dalam Analisis Cluster

Seperti hal teknik analisis lain,analisis cluster juga menetapkan adanya suatu

asumsi. Ada dua asumsi dalam analisis cluster, yaitu :

A. Kecukupan Sampel untuk merepresentasikan/mewakili Populasi

Biasanya suatu penelitian dilakukan terhadap populasi diwakili oleh

sekelompok sampel. Sampel yang digunakan dalam analisis ckuster harus

dapat mewakili populasi yang ingin dijelaskan, karena analisis ini baik jika

sampel representatif. Jumlah sampel yang diambil tergantung penelitinya,

seorang peneliti harus yakin bahwa sampil yang diambil representatif terhadap

populasi.

B Pengaruh Multukolinieritas

Ada atau tidaknya multikolinieritas antar variabel sangat diperhatikan

dalam analisis cluster karena hal itu berpengaruh, sehingga variabel-variabel

yang bersifat multikolinieritas secara eksplisit dipertimbangkan dengan lebih

seksama.

Multikolinieritas adalah adanya korelasi antara variabel bebas dengan

variabel bebas lainnya. Jika sebuah model terdapat multikolinieritas apabila R2

nya tinggi namun hanya sedikit atau bahkan tidak ada variabel bebasnya yang

signifikasn pada pengujian t-statistik.

Multikolinieritas juga dapat dilihat melalui matriks korelasi antar

variabelnya. Menurut gujarati, multikolinieritas terjadi jika korelasi antar

variabelnya lebih besar dari 0,8.

Tahap Keempat : Proses Mendapatkan Cluster dan Menilai kelayakan secara

keseluruhan

Ada dua proses penting yaitu algoritma cluster dalam pembentukan cluster dan

menentukan jumlah cluster yang akan dibentuk. Keduanya mempunyai implikasi

substansial tidak hanya pada hasil yang diperoleh tetapi juga pada interpretasi yang

akan dilakukan terhadap hasil tersebut.

Algoritma Cluster

Algoritma cluster harus dapat memaksimalkan perbedaan relatif cluster

terhadap variasi dalam cluster. Dua metode paling umum dalam algoritma cluster

adalahmetode hirarkhi dan metode non hirarkhi. Penentuan metode mana yag akan

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 10

Page 11: Bagian Inti+Akhir

Analisis Multivariat II

dipakai tergantung kepada peneliti dan konteks penelitian dengan tidak

mengabaikan substansi, teori dan konsep yang berlaku. Keduanya memiliki

kelebihan sendiri-sendiri. Keuntungan metode hirarkhi adalah cepat dalam proses

pengolahan sehingga menghemat waktu, namun kelemahannya metode ini dapat

menimbulkan kesalahan. Selain itu tidak baik diterapkan untuk menganalisis

sampel dengan ukuran besar. Metode Non Hirarkhi memiliki keuntungan lebih

daripada metode hirarkhi. Hasilnya memiliki sedikit kelemahan pada data outlier,

ukuran jarak yang digunakan, dan termasuk variabel tak relevan atau variabel yang

tidak tepat. Keuntungannya hanya dengan menggunakan titik bakal nonrandom,

penggunaan metode non hirarkhi untuk titik bakal random secara nyata lebih

buruk dari pada metode hirarkhi.

Alternatif lain adalah dengan mengkombinasikan kedua metode ini.

Pertama gunakan metode hirarkhi kemudian dilanjutkan dengan metode non

hirarkhi.

A. Metode Hirarkhi

Tipe dasar dalam metode ni adalah aglomerasi dan pemecahan. Dalam

metode aglomerasi tiap observasi pada mulanya dianggap sebagai cluster

tersendiri sehingga terdapat cluster sebyak jumlah observasi. Kemudian dua

cluster yang terdekat kesamaannya digabung menjadi suatu cluster babru,

sehingga jumlah cluster berkurang satu pada tiap tahap. Sebaliknya pada

metode pemecahan dimulai dari satu cluster besar yang mengandung seluruh

observasi, selanjutnya observasi-observasi yang paling tidak sama dipisah dan

dibentuk cluster-cluster yang lebih kecil. Proses ini dilakukan hingga tiap

observasi menjadi cluster sendiri-sendiri.

Hal penting dalam metode hirarkhi adalah bahwa hasil pada tahap sebelumnya

selalu bersarang di dalam hasil pada tahap berikutnya, membentuk sebuah

pohon.

Ada lima metode aglomerasi dalam pembentukan cluster, yatiu :

a. Pautan Tunggal (Single Linkage)

Metode ini didasarkan pada jarak minimum. Dimulai dengan dua

objek yang dipisahkan dengan jarak paling pendek maka keduanya akan

ditempatkan pada cluster pertama, dan seterusnya. Metode ini dikenal

pula dengan nama pendekatan tetangga terdekat.

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 11

Page 12: Bagian Inti+Akhir

Analisis Multivariat II

b. Pautan Lengkap (Complete Linkage)

Disebut juga pendekatan tetangga terjauh. Dasarnya adalah jarak

maksimum. Dalam metode ini seluruh objek dalam suatu cluster

dikaitkan satu sama lain pada suatu jarak maksimuma atau dengan

kesamaan minimum.

c. Pautan Rata-rata (Average Linkage)

Dasarnya adalah jarak rata-rata antar observasi. pengelompokan

dimulai dari tengan atau pasangan observasi dengan jarak paling

mendekati jarak rata-rata.

d. Metode Ward (Ward’s Method)

Dalam metode ini jarak antara dua cluster adalah jumlah kuadrat

antara dua cluster untuk seluruh variabel. Metode ini cenderung

digunakan untuk mengkombinasi cluster-cluster dengan jumlah kecil.

e. Metode Centroid

Jarak antara dua cluster adalah jarak antar centroid cluster

tersebut. Centroid cluster adalah nilai tengah observasi pada variabel

dalam suatu set variabel cluster. Keuntungannya adalah outlier hanya

sedikit berpengaruh jika dibandingkan dengan metode lain.

B. Metode Non Hirarkhi

Masalah utama dalam metoda non hirarkhi adalah bagaimana

memilih bakal cluster. Harus disadari pengaruh pemilihan bakal cluster

terhadap hasil akhir analisis cluster. Bakal cluster pertama adalah observasi

pertama dalam set data tanpa missing value. Bakal kedua adalah observasi

lengkap berikutnya (tanpa missing data) yang dipisahkan dari bakal pertama

oleh jarak minimum khusus.

Ada tiga prosedur dalam metode non hirarkhi, yaitu :

a. Sequential threshold

Metode ini dimulai dengan memilih bakal cluster dan menyertakan

seluruh objek dalam jarak tertentu. Jika seluruh objek dalam jarak

tersebut disertakan, bakal cluster kedua terpilih, kemudian proses terus

berlangsung seperti sebelumnya.

b. Parallel Threshold

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 12

Page 13: Bagian Inti+Akhir

Analisis Multivariat II

Metode ini memilih beberapa bakal cluster secara simultan pada

permulaannya dan menandai objek-objek dengan jarak permulaan ke

bakal terdekat.

c. Optimalisasi

Metode ketiga ini mirip dengan kedua metode sebelumnya kecuali pada

penandaan ulang terhadap objek-objek.

Hal penting lain dalam tahap keempat adalah menentukan jumlah cluster yang akan

dibentuk.Sebenarnya tidak ada standar,prosedur pemilihan tujuan eksis. Karena

tidak ada kriteria statistik internal digunakan untuk inferensia, seperti tes

signifikansipada teknik multivariat lainnya, para peneliti telah mengembangkan

beberapa kriteria dan petunjuk sebagai pendekatan terhadap permasalahan ini

dengan memperhatikan substansi dan aspek konseptual.

Tahap Kelima : Interpretasi terhadap Cluster

Tahap interpretasi meliputi pengujian tiap cluster dalam term untuk menamai

dan menandai dengan suatu label yang secara akurat dapat menjelaskan kealamian

cluster. Proes ini dimulai dengan suatu ukuran yang sering digunakan yaitu

centroid cluster.

Membuat profil dan interpretasi cluster tidak hanya tidak hanya untuk memoeroleh

suatu gambaran saja melainkan pertama, menyediakan suatu rata-rata untuk

menilai korespondensi pada cluster yang terbentuk, kedua, profil cluster

memberikan araha bagi penilainan terhadap signifikansi praktis.

Tahap Keenam: Proses Validasi dan Pembuatan Profil (PROFILING) Cluster

A. Proses validasi solusi cluster

Proses validasi bertujuan menjamin bahwa solusi yang dihasilkan dari

analisis cluster dapat mewakili populasi dan dapat digeneralisasi untuk objek

lain. Pendekatan ini membandingkan solusi cluster dan menilai korespondensi

hasil. Terkadang tidak dapat dipraktekkan karena adanya kendala waktu dan

biaya atau ketidaktersediaan ibjek untuk analisis cluster ganda.

B. Pembuatan Profil ( PROFILING)Solusi Cluster

Tahap ini menggambarkan karakteristik tiap cluster untuk menjelaskan

cluster-cluster tersebut dapat dapat berbeda pada dimensi yang relevan. Titik

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 13

Page 14: Bagian Inti+Akhir

Analisis Multivariat II

beratnta pada karakteristik yang secara signifikan berbeda antar clustre dan

memprediksi anggota dalam suatu cluster khusus.

Secara keseluruhan proses analisis cluster berakhir setelah keenam tahap

ini dilalui. Hasil analisis cluster dapat digunakan untuk berbagai kepentingan

sesuai dengan materi yang dianalisis.

2.4 Penduduk Lanjut Usia (Lansia)

2.4.1 Definisi Lansia

Menua atau menjadi tua adalah suatu keadaaan yang terjadi didalam

kehidupan manusia. Proses menua merupakan proses sepanjang hidup, tidak

hanya dimulai dari suatu waktu tertentu, tetapi dimulai sejak permulaan

kehidupan. Menjadi tua merupakan proses alamiah, yang berarti seseorang

telah melalui tiga tahap kehidupannya, yaitu anak, dewasa dan tua. Tiga tahap

ini berbeda, baik secara biologis maupun psikologis. Memasuki usia tua

berarti mengalami kemunduran, misalnya kemunduran fisik yang ditandai dengan

kulit yang mengendur, rambut memutih, gigi mulai ompong, pendengaran kurang

jelas, pengelihatan semakin memburuk, gerakan lambat dan figur tubuh yang tidak

proporsional (Nugroho, 2006).

WHO dan Undang-Undang Nomor 13 Tahun 1998 tentang kesejahteraan

lanjut usia pada Bab 1 Pasal 1 Ayat 2 menyebutkan bahwa usia 60 tahun

adalah usia permulaan tua. Menua bukanlah suatu penyakit, tetapi

merupakan proses yang berangsur-angsur mengakibatkan perubahan

kumulatif, merupakan proses menurunnya daya tahan tubuh dalam menghadapi

rangsangan dari dalam dan luar tubuh.

2.4.2 Fisiologi Lansia

Proses penuaan adalah normal, berlangsung secara terus

menerus secara alamiah. Dimulai sejak manusia lahir bahkan sebelumnya dan

umunya dialami seluruh makhluk hidup. Menua merupakan proses penurunan

fungsi struktural tubuh yang diikuti penurunan daya tahan tubuh. Setiap orang

akan mengalami masa tua, akan tetapi penuaan pada tiap seseorang berbeda-

beda tergantung pada berbagai faktor yang mempengaruhinya. Faktor-faktor

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 14

Page 15: Bagian Inti+Akhir

Analisis Multivariat II

tersebut dapat berupa faktor herediter, nutrisi, stress, status kesehatan dan lain-

lain (Stanley, 2006)

2.4.3 Batasan Lansia

WHO (1999) menggolongkan lanjut usia berdasarkan usia

kronologis/biologis menjadi 4 kelompok yaitu usia pertengahan

(middle age) antara usia 45 sampai 59, lanjut usia (elderly) berusia antara

60 dan 74 tahun, lanjut usia tua (old) 75 – 90 tahun, dan usia sangat tua (Very

old) di atas 90 tahun. Sedangkan Nugroho (2000) menyimpulkan

pembagian umur berdasarkan pendapat beberapa ahli, bahwa yang disebut

lanjut usia adalah orang yang telah berumur 65 tahun ke atas.

Menurut Prof. Dr. Koesmanto Setyonegoro, lanjut usia dikelompokkan

menjadi usia dewasa muda (elderly adulthood), 18 atau 29 – 25 tahun,

usia dewasa penuh (middle years) atau maturitas,25 – 60 tahun atau 65 tahun,

lanjut usia (geriatric age) lebih dari 65 tahun atau 70 tahun yang dibagi lagi

dengan 70 – 75 tahun (young old), 75 – 80 tahun (old), lebih dari 80 (very

old).

Menurut Undang-Undang No. 4 Tahun 1965 Pasal 1 seseorang dapat

dinyatakan sebagai seorang jompo atau lanjut usia setelah bersangkutan

mencapai umur 55 tahun, tidak mempunyai atau tidak berdaya mencari nafkah

sendiri untuk keperluan hidupnya sehari-hari dan menerima nafkah dari orang

lain. Undang-Undang No. 13 Tahun1998 tentang kesejahteraan lansia bahwa

lansia adalah seseorang yang mencapai usia 60 tahun keatas.

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 15

Page 16: Bagian Inti+Akhir

Analisis Multivariat II

BAB III

METODOLOGI PENELITIAN

3.1 Populasi

Populasi pada penelitian ini yaitu semua lansia yang terdapat pada masing-masing provinsi

di Indonesia.

3.2 Sumber Data

Data yang kami gunakan pada penelitian ini bersumber dari BPS pada laporan Sosial

Indonesia dari Supas dan Sakernas 1995.

3.3 Variabel Penelitian

Variabel-variabel yang digunakan dalam penelitian ini adalah sebagai berikut:

X1 : Persentase lansia yang tidak pernah sekolah/tamat SD di masing-masing provinsi

X2 : Persentase lansia yang makan makanan pokok kurang dari 21 kali dalam seminggu di

masing-masing provinsi

X3 : Persentase lansia yang makan lauk pauk berprotein tinggi kurang dari 4 kali dalam

seminggu di masing-masing provinsi

X4 : Persentase lansia yang memiliki pakaian kurang dari 4 pasang di masing-masing

provinsi

X5 : Persentase lansia yang tidak mempunyai tempat tetap untuk tidur di masing-masing

provinsi

X6 : Persentase lansia yang bila sakit tidak siabati di masing-masing provinsi

3.4 Langkah-Langkah Penyelesaian Masalah

Analisis data dibutuhkan untuk menjawab permasalahan dalam penelitian ini.

Langkah-langkah yang dilakukan adalah sebagai berikut:

1. Standarisasi Data

2. Uji asumsi : seberapa besar sampel mewakili populasi (representativeness) dan

ada tidaknya multicollinearity.

3. Uji K-Means Cluster

a. Tentukan jumlah K cluster

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 16

Page 17: Bagian Inti+Akhir

Analisis Multivariat II

b. Inisialisasi K pusat cluster, dapat diperoleh secara acak.

c. Cari data yang lebih dekat dengan pusat cluster dan tandai titik data tersebut

di pusat cluster yang terdekat dan posisi pusat cluster dihitung kembali

dengan rata-rata anggota dari setiap cluster.

d. Cek semua data sekali lagi dan taruh setiap data yang terdekat dengan pusat

cluster (pusat cluster tidak dihitung lagi). Jika anggota dari tiap pusat cluster

tidak berubah, berhenti dan jika masih berubah kembali ke langkah c.

4. Interpretasi output

5. Kesimpulan

Pada kasus ini, langkah-langkah analisis di atas akan dilakukan dengan bantuan

software SPSS. Selengkapnya akan disajikan di bab IV.

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 17

Page 18: Bagian Inti+Akhir

Analisis Multivariat II

BAB IV

HASIL DAN PEMBAHASAN

4.1 Data

Berikut ini adalah data yang akan diolah menjadi cluster-cluster.

PROVINSI X1 X2 X3 X4 X5 X6SUMATERA UTARA 63.13 38.67 35.7 16.79 2.48 3.33SUMATERA BARAT 57.48 48.23 17.48 20.6 0.9 4.05

RIAU 67.72 50.59 18.43 9.95 1.58 3.34JAMBI 75.99 44.1 29.77 27.94 1.76 2.55

SUMATERA SELATAN 65.69 58.39 27.9 24.67 5.57 5.18BENGKULU 71.37 52.02 35.6 30.64 2.17 4.29LAMPUNG 80.64 35.59 41.56 34.15 1.48 2.78DKI JAKARTA 37.8 56.38 12.28 87.24 1.45 6.78JAWA BARAT 70.84 70.48 31.37 17.17 1.82 5.32

JAWA TENGAH 79.3 35.99 16.25 19.36 1.89 3.97D.I. YOGYAKARTA 76.05 46.27 11.35 17.45 1.17 4.72JAWA TIMUR 82.76 30.86 15.13 30.77 2.01 3.55

BALI 77.96 42.28 6.28 25.74 0.34 4.87NUSA TENGGARA BARAT 86.92 33.09 23.48 48.28 3.2 4.64NUSA TENGGARA TIMUR 87.36 56.75 58.67 49.77 1.42 9.31

KALIMANTAN BARAT 83.48 54.34 38.6 29.46 3.87 7.51KALIMANTAN TIMUR 60.37 50.29 18.78 28.13 6.69 2.68

KALIMANTAN SELATAN 76.93 38.72 16.65 29.37 2.77 7.07KALIMANTAN TENGAH 73.43 52.45 18.18 12.72 1.11 1.01

SULAWESI UTARA 51.3 58.14 25.58 11.08 1.84 2.89SULAWESI TENGAH 66.01 54.47 16.29 32.81 2.47 8.66SULAWESI SELATAN 77.62 58.74 10.93 24.03 3.7 6.89

SULAWESI TENGGARA 74.65 72.91 3.19 17.78 1.07 8.78

Sumber : BPS pada laporan Sosial Indonesia dari Supas dan Sakernas 1995.

4.2 Asumsi Analisis Cluster

4.2.1 Sample Representativ

Dalam kasus ini, yang digunakan adalah populasi. Sehingga dapat dikatakan

bahwa sample representatif.

4.2.2 Multikolinieritas

Untuk melihat ada atau tidaknya multikolinieritas antar variabel, digunakan

korelasi antar variabel. Berikut in adalah korelasi antar variabel menggunakan

software SPSS.

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 18

Page 19: Bagian Inti+Akhir

Analisis Multivariat II

Correlations

x1 x2 x3 x4 x5 x6x1 Pearson Correlation 1 -,401 ,192 -,138 -,207 -,169

Sig. (2-tailed) ,052 ,368 ,520 ,332 ,430N 24 24 24 24 24 24

x2 Pearson Correlation -,401 1 ,023 -,126 ,222 ,538(**)Sig. (2-tailed) ,052 ,915 ,557 ,296 ,007N 24 24 24 24 24 24

x3 Pearson Correlation ,192 ,023 1 ,116 ,156 ,106Sig. (2-tailed) ,368 ,915 ,589 ,466 ,622N 24 24 24 24 24 24

x4 Pearson Correlation -,138 -,126 ,116 1 -,048 ,124Sig. (2-tailed) ,520 ,557 ,589 ,823 ,565N 24 24 24 24 24 24

x5 Pearson Correlation -,207 ,222 ,156 -,048 1 ,409(*)Sig. (2-tailed) ,332 ,296 ,466 ,823 ,047N 24 24 24 24 24 24

x6 Pearson Correlation -,169 ,538(**) ,106 ,124 ,409(*) 1

Sig. (2-tailed) ,430 ,007 ,622 ,565 ,047N 24 24 24 24 24 24

** Correlation is significant at the 0.01 level (2-tailed).* Correlation is significant at the 0.05 level (2-tailed).

Menurut gujarati, multikolinieritas terjadi jika korelasi antar variabelnya lebih

besar dari 0,8. Dari tabel diatas, dapat dilihat bahwa nilai korelasi di bawah 0.8,

artinya tidak ada multikolinieritas.

Kedua asumsi analisis cluster telah dipenuhi, artinya untuk pengujian selanjutnya dapat

digunakan analisis Cluster. Untuk pengujian analisis Cluster ini, digunakan software SPSS

yang bertujuan untuk mempermudah melakukan analisis.

4.3 Analisis Cluster

Analisis Cluster digunakan untuk mengelompokkan objek-objek yang memiliki

kesamaan karakteristik. Dalam kasus ini, provinsi di Indonesia akan dikelompokkan

berdasarkan 6 kriteria keterlantaran lansia. Dalam kasus ini, akan digunakan analisis cluster

non-hierarki. Berikut ini adalah langkah-langkah untuk analisis cluster dalam software

SPSS.

Setelah data distandardisasi, proses dilanjutkan dengan memilih metode pembentukan

klaster, yakni metode Non-Hierarchical Cluster

LANGKAH

- Analyze Classify K-Means Cluster

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 19

Page 20: Bagian Inti+Akhir

Analisis Multivariat II

Pengisian:

a. Variables. Sesuai kasus, masukkan semua variable dengan awalan z, yakni zX1, zX2,

zX3, zX4, zX5, dan zX6.

b. Label Cases By, masukkan variabel provinsi

c. Number of cluster atau jumlah cluster yang akan dibentuk adalah 2.

d. Kemudian klik mouse pada kotak saves

Kotak dialog saves memungkinkan hasil cluster disimpan dalam bentukvariabel baru

di SPSS Data Editor. Hal ini berguna untuk proses profiling cluster, yang akan

dilakukan pada tahapan akhir analisis cluster.

Untuk itu, aktifkan kotak cluster membership dan distance from cluster center,

kemudian tekan tombol continue untuk kembali ke menu utama.

e. Klik mouse pada kotak Options

Kotak dialog Options berisi berbagai pilihan (option) untuk proses analisis cluster

yang bukan merupakan proses inti clustering. Ada dua option, yakni statistic yang

berhubungan dengan hasil cluster, dan perlakuan terhadap data yang missing (tidak

lengkap).

Pengisian options:

• Untuk Statistics, biarkan kotak initial cluster center tetap aktif, dan aktifkan kotak

Anova Table.

• Untuk Missing Values, karena semua data lengkap terisi, abaikan pilihan tersebut.

f. Lalu tekan tombol Continue untuk kembali ke menu utama.

Dari tampilan menu utama cluster, abaikan juga bagian yang lain, dan tekan OK untuk

proses data.

OUTPUT

Dari proses clustering, karena pengaktifan pilihan cluster membership, maka ada

dua output yang dihasilkan:

a. Output berupa tambahan dua variabel, yakni variabel qcl_1, yang berisis nomor

cluster untuk setiap kasus, dan variabel qcl_2 yang berisi jarak antara kasus

tertentu dengan pusat cluster (cluster center)

Variabel QCL_1 dan QCL_2 akan digunakan untuk pembuatan tabulasi silang

(crosstab) dan grafik yang relevan.

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 20

Page 21: Bagian Inti+Akhir

Analisis Multivariat II

Provinsi QCL_1 QCL_2SUMATERA UTARA 1 1.59339SUMATERA BARAT 1 1.35413

RIAU 1 1.30903JAMBI 1 0.87971

SUMATERA SELATAN 2 1.46873BENGKULU 1 1.32573LAMPUNG 1 1.99123DKI JAKARTA 1 4.76754JAWA BARAT 2 1.74154

JAWA TENGAH 1 1.21852D.I. YOGYAKARTA 1 1.21046JAWA TIMUR 1 1.62329

BALI 1 1.61146NUSA TENGGARA BARAT 1 2.24267NUSA TENGGARA TIMUR 2 3.50827

KALIMANTAN BARAT 2 1.53812KALIMANTAN TIMUR 2 2.7096

KALIMANTAN SELATAN 1 1.32904KALIMANTAN TENGAH 1 1.53975

SULAWESI UTARA 1 2.2856SULAWESI TENGAH 2 1.31682SULAWESI SELATAN 2 1.3847

SULAWESI TENGGARA 2 2.67673

Hasil Output akan ditampilkan satu per satu dengan dilengkapi analisis pada

pembahasan berikut ini.

ANALISIS OUTPUT CLUSTER

Proses awal clustering

Quick Cluster

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 21

Page 22: Bagian Inti+Akhir

Analisis Multivariat II

Output ini adalah tampilan pertama (initial) proses clustering data sebelum

dilakukan iterasi. Karena nanti akan dihasilkan proses clustering sesudah iterasi yang

justru adalah hasil akhir cluster, maka output ini tidak dianalisis.

PROSES ITERASI

Tampilan ini adalah proses iterasi yang mencoba mengubah-ubah cluster yang

ada sebelumnya (initial) sehingga menjadi lebih tepat dalam mengelompokkan 24

kasus tersebut. Setelah terjadi tiga tahapan iterasi (proses pengulangan dengan

ketepatan lebih tinggi dari sebelumnya), didapat hasil final cluster berikut ini.

Hasil akhir proses clustering

Output ini adalah akhir dari proses clustering, dengan analisis:

ARTI ANGKA:

Angka di atas terkait dengan proses standardisasi data sebelumnya, yang mengacu pada

angka z, dengan ketentuan:

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 22

Page 23: Bagian Inti+Akhir

Analisis Multivariat II

- Angka negative berarti data di bawah rata-rata total

- Angka positif berarti data di atas rata-rata total

Sebagai contoh, angka -0,01048 pada variabel Z(X1) menyatakan rata-rata banyaknya

lansia yang tidak pernah sekolah/tamat SD pada cluster 1 adalah:

Dengan :

X= rata-rata sampel (dalam hal ini rata-rata variabel pada cluster tertentu)

= rata-rata populasi

= standar deviasi

Z = nilai standardisasi yang didapat pada SPSS

Jika diterapkan pada variabel tidak pernah sekolah/tamat SD:

Rata-rata banyaknya lansia yang tidak pernah sekolah/tamat SD pada provinsi-

provinsi di Cluster 1:

(rata-rata banyaknya lansia tidak pernah sekolah/tamat SD pada seluruh

provinsi) + (-0,01048 x standar deviasi rata-rata banyaknya lansia tidak pernah

sekolah/tamat SD pada seluruh provinsi).

Sedangkan angka 0,01746 pada variabel Z(X1) menyatakan rata-rata

banyaknya lansia yang tidak pernah sekolah/tamat SD pada cluster 2, adalah:

(rata-rata banyaknya lansia yang tidak pernah sekolah/tamat SD pada seluruh

provinsi) +( 0,01746 x standar deviasi rata-rata banyaknya lansia yang tidak

pernah sekolah/tamat SD pada seluruh provinsi).

Dengan demikian seterusnya untuk tafsiran data yang lain, tentunya

dengan mengacu rata-rata dan standar deviasi variabel yang bersangkutan,

seperti angka untuk variabel Z(X2) dikaitkan dengan rata-rata banyaknya lansia

yang makan makanan pokok < 21X dalam seminggu dan standar deviasinya.

Contoh Tafsiran Angka Pada Cluster:

Dari proses cluster, terjadi 2 cluster atau 2 kelompok provinsi yang masing-masing

kelompok tentunya mempunyai ciri yang berbeda satu dengan yang lain. Perbedaan

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 23

Page 24: Bagian Inti+Akhir

Analisis Multivariat II

bisa ditelusuri per variabel, dengan dasar interpretasi berdasarkan tanda + dan – serta

besaran angka itu sendiri.

Sebelum menafsir isi setiap cluster, terlebih dahulu diperlihatkan contoh penafsiran

sebuah variabel, yakni variabel Z(X1) atau variable tidak pernah sekolah/tamat SD .

Karena pada cluster 1, angka adalah negatif, sedangkan di cluster 2 angka positif, maka

bisa dikatakan:

Rata-rata banyaknya lansia yang tidak pernah sekolah/tamat SD pada cluster 1

lebih rendah dibandingkan rata-rata banyaknya lansia yang tidak pernah sekolah/tamat

SD keseluruhan.

Untuk menghitung rata-rata banyaknya lansia yang tidak pernah sekolah/tamat SD

pada setiap cluster, bisa dilakukan dengan rumus di atas dan berdasar pada output

Descriptives Statistics, di mana terlihat:

- Mean (Rata-rata) banyaknya lansia yang tidak pernah sekolah/tamat SD pada

seluruh provinsi adalah 70,7133

- Standar Deviasi banyaknya lansia yang tidak pernah sekolah/tamat SD pada

seluruh provinsi adalah 12,217

Dengan demikian:

- Rata-rata banyaknya lansia yang tidak pernah sekolah/tamat SD pada cluster 1 =

70,7133+(-0,01048 x 12,217) = 70,585

- Rata-rata banyaknya lansia yang tidak pernah sekolah/tamat SD pada cluster 2 =

70,7133+(0,01746 x 12,217) = 70,926

Demikian seterusnya bisa dilanjutkan dengan variabel Z(X2) untuk mengetahui

rata-rata banyaknya lansia yang memakan makan-makanan pokok < 21X dalam seminggu

di setiap cluster, kemudian rata-rata banyaknya lansia yang makan lauk pauk berprotein

tinggi<4X dalam seminggu di setiap cluster, dan variabel yang lainnya.

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 24

Page 25: Bagian Inti+Akhir

Analisis Multivariat II

Walaupun bisa diuraikan secara rinci satu demi satu variabel, namun untuk

penafsiran umum, sudah memadai jika dikatakan ‘lebih dari rata-rata’ atau ‘kurang dari

rata-rata’, seperti yang akan dilakukan pada bagian berikut untuk menggambarkan isi

setiap cluster yang terbentuk.

4.3.1 Karakteristik Setiap Cluster

a. Cluster 1

Cluster 1 berisi provinsi yang memiliki karakteristik sebagai berikut:

Banyaknya lansia yang tidak pernah sekolah/tamat SD lebih sedikit

dibandingkan dengan provinsi lain.

Banyaknya lansia yang memakan makanan pokok <21 kali dalam seminggu

lebih sedikit dibandingkan dengan provinsi lain.

Banyaknya lansia yang makan lauk-pauk berprotein tinggi <4 kali dalam

seminggu lebih sedikit dibandingkan dengan provinsi lain.

Banyaknya lansia yang memiliki pakaian <4 stel lebih banyak

dibandingkan dengan provinsi lain.

Banyaknya lansia yang tidak mempunyai tempat tetap untuk tidur lebih

sedikit dibandingkan dengan provinsi lain.

Banyaknya lansia yang bila sakit tidak lebih sedikit dibandingkan dengan

provinsi lain.

b. Cluster 2

Cluster 2 berisi provinsi yang memiliki karakteristik sebagai berikut:

Banyaknya lansia yang tidak pernah sekolah/tamat SD lebih banyak

dibandingkan dengan provinsi lain.

Banyaknya lansia yang memakan makanan pokok <21 kali dalam seminggu

lebih banyak dibandingkan dengan provinsi lain.

Banyaknya lansia yang makan lauk-pauk berprotein tinggi <4 kali dalam

seminggu lebih banyak dibandingkan dengan provinsi lain.

Banyaknya lansia yang memiliki pakaian <4 stel lebih sedikit dibandingkan

dengan provinsi lain.

Banyaknya lansia yang tidak mempunyai tempat tetap untuk tidur lebih

banyak dibandingkan dengan provinsi lain.

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 25

Page 26: Bagian Inti+Akhir

Analisis Multivariat II

Banyaknya lansia yang bila sakit tidak lebih banyak dibandingkan dengan

provinsi lain.

Dari ciri-ciri kedua cluster di atas, cluster 1 berisikan provinsi-provinsi yang

lansianya tidak terlantar sedangkan cluster 2 berisikan provinsi-provinsi yang lansianya

terlantar, yang akan disajikan dalam table berikut:

Cluster 1 Cluster 2Lansia Tidak Terlantar Lansia Terlantar

Sumatera Utara Lampung Bali Sumatera Selatan Sulawesi TengahSumatera Barat DKI Jakarta Nusa Tenggara Barat Jawa Barat Sulawesi Selatan

Riau Jawa Tengah Kalimantan Selatan Nusa Tenggara Timur Sulawesi TenggaraJambi D.I. Yogyakarta Kalimantan Tengah Kalimantan Barat Irian Jaya

Bengkulu Jawa Timur Sulawesi Utara Kalimantan Timur

Namun sekali lagi, penamaan cluster maupun penarikan kesimpulan dari isi

cluster pada dasarnya bersifat subyektif dan tergantung tujuan penelitian.

4.3.2 Melihat Perbedaan Variabel Pada Cluster Yang Terbentuk

Setelah terbentuk 2 cluster, langkah berikut adalah melihat apakah variabel-

variabel yang telah membentuk cluster tersebut mempunyai perbedaan pada tiap

cluster. Hal itu dilakukan dengan melihat outpu ANOVA berikut.

Kolom cluster menunjukkan besaran between cluster mean, sedangkan kolom error

menunjukkan besaran within cluster mean, sehingga kolom F adalah

Interpretasi angka F dan signifikan:

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 26

Page 27: Bagian Inti+Akhir

Analisis Multivariat II

Pada prinsipnya, semakin besar angka F suatu variabel, dan angka signifikannya adalah

di bawah 0,05 maka semakin besar pula perbedaan variabel tersebut pada kedua cluster

yang terbentuk.

Interpretasi Output :

a. Pada variable X1 atau variable tidak pernah sekolah/tamat SD nilai F adalah 0,004

dengan nilai signifikansi adalah 0,949, yang berarti signifikansi adalah tidak nyata. Hal

ini berarti banyaknya lansia yang tidak pernah sekolah/tamat SD tidak berbeda antara

kedua cluster yang terbentuk. Atau bisa juga dikatakan, banyaknya lansia yang tidak

pernah sekolah/tamat SD di kedua cluster yang terbentuk adalah sama.

b. Pada variable X2 atau variable makan makanan poko <21 kali dalam seminggu nilai F

adalah 21,224 dengan nilai signifikansi adalah 0,000, yang berarti signifikansi adalah

nyata. Hal ini berarti banyaknya lansia yang makan makanan pokok <21 kali dalam

seminggu sangat membedakan karakteristik kedua cluster. Atau bisa juga dikatakan,

banyaknya lansia yang makan makanan pokok <21 kali dalam seminggu di kedua

cluster yang terbentuk adalah sangat berbeda.

c. Pada variable X3 atau variable makan lauk-pauk berprotein tinggi <4 kali dalam

seminggu nilai F adalah 0,742 dengan nilai signifikansi adalah 0,398, yang berarti

signifikansi adalah tidak nyata. Hal ini berarti banyaknya lansia yang makan lauk-pauk

berprotein tinggi <4 kali dalam seminggu tidak berbeda antara kedua cluster yang

terbentuk. Atau bisa juga dikatakan, banyaknya lansia yang makan lauk-pauk

berprotein tinggi <4X dalam seminggu di kedua cluster yang terbentuk adalah sama.

d. Pada variable X4 atau variable memiliki pakaian <4 stel nilai F adalah 0,04 dengan nilai

signifikansi adalah 0,843, yang berarti signifikansi adalah tidak nyata. Hal ini berarti

banyaknya lansia yang memiliki pakaian <4 stel tidak berbeda antara kedua cluster

yang terbentuk. Atau bisa juga dikatakan, banyaknya lansia yang memiliki pakaian <4

stel di kedua cluster yang terbentuk adalah sama.

e. Pada variable X5 atau variable tidak mempunyai tempat tetap untuk tidur nilai F adalah

10,279 dengan nilai signifikansi adalah 0,004, yang berarti signifikansi adalah nyata.

Hal ini berarti banyaknya lansia yang tidak mempunyai tempat tetap untuk tidur sangat

membedakan karakteristik kedua cluster. Atau bisa juga dikatakan, banyaknya lansia

yang tidak mempunyai tempat tetap untuk tidur di kedua cluster yang terbentuk adalah

sangat berbeda.

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 27

Page 28: Bagian Inti+Akhir

Analisis Multivariat II

f. Pada variable X6 atau variable bila sakit tidak diobati nilai F adalah 10,801 dengan nilai

signifikansi adalah 0,003, yang berarti signifikansi adalah nyata. Hal ini berarti

banyaknya lansia yang bila sakit tidak diobati sangat membedakan karakteristik kedua

cluster. Atau bisa juga dikatakan, banyaknya lansia yang bila sakit tidak diobati di

kedua cluster yang terbentuk adalah sangat berbeda.

Perhatikan bahwa semakin besar angka F semakin menunjukkan perbedaan yang

tajam antar-cluster, sebaliknya makin kecil angka F makin kecil perbedaan tersebut, hingga

sampai angka tertentu, perbedaan itu bahkan sudah tidak ada lagi (angka Sig sudah di atas

0,05). Namun demikian, di sini tidak berarti variabel yang tidak signifikan akan

dikeluarkan. Analisis hanya ingin mengetahui mana variabel yang signifikan perbedaannya,

dan mana yang tidak.

4.3.3 Jumlah Anggota Di Setiap Cluster

Dari table di atas terlihat bahwa provinsi terbanyak ada di cluster 1, sedangkan

provinsi paling sedikit ada di cluster 2, dengan tidak ada variabel yang hilang

(missing). Dengan demikian, semua kasus, sejumlah 24 provinsi, lengkap terpeta pada

kedua cluster.

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 28

Page 29: Bagian Inti+Akhir

Analisis Multivariat II

BAB V

KESIMPULAN DAN SARAN

5.1 Kesimpulan

Untuk menangani masalah penduduk di Indonesia, pemerintah perlu mendahulukan

daerah-daerah mana saja yang perlu mendapatkan perhatian khusus. Untuk itu, di bagi 2

cluster yang berisi wilayah yang dengan lansia tidak terlantar dan wilayah yang memiliki

penduduk lansia terlantar. Untuk cluster 1 adalah wilayah yang memiliki penduduk lansia

tidak terlantar dan cluster 2 adalah wilayah yang memiliki penduduk lansia yang terlantar.

Tabel di bawah ini berisikan wilayah-wilayah yang masuk pada cluster 1 dan cluster 2.

Cluster 1 Cluster 2Lansia Tidak Terlantar Lansia Terlantar

Sumatera Utara Lampung Bali Sumatera Selatan Sulawesi TengahSumatera Barat DKI Jakarta Nusa Tenggara Barat Jawa Barat Sulawesi Selatan

Riau Jawa Tengah Kalimantan Selatan Nusa Tenggara Timur Sulawesi TenggaraJambi D.I. Yogyakarta Kalimantan Tengah Kalimantan Barat Irian Jaya

Bengkulu Jawa Timur Sulawesi Utara Kalimantan Timur

Karakteristik pada cluster 1 adalah banyaknya lansia yang tidak pernah

sekolah/tamat SD lebih sedikit dibandingkan dengan provinsi lain, banyaknya lansia yang

memakan makanan pokok <21 X dalam seminggu lebih sedikit dibandingkan dengan

provinsi lain, banyaknya lansia yang makan lauk-pauk berprotein tinggi <4 X dalam

seminggu lebih sedikit dibandingkan dengan provinsi lain, banyaknya lansia yang

memiliki pakaian <4 stel lebih banyak dibandingkan dengan provinsi lain, banyaknya

lansia yang tidak mempunyai tempat tetap untuk tidur lebih sedikit dibandingkan dengan

provinsi lain, banyaknya lansia yang bila sakit tidak lebih sedikit dibandingkan dengan

provinsi lain.

Sedangkan karakteristik cluster 2 adalah banyaknya lansia yang tidak pernah

sekolah/tamat SD lebih banyak dibandingkan dengan provinsi lain, banyaknya lansia yang

memakan makanan pokok <21 X dalam seminggu lebih banyak dibandingkan dengan

provinsi lain, banyaknya lansia yang makan lauk-pauk berprotein tinggi <4 X dalam

seminggu lebih banyak dibandingkan dengan provinsi lain, banyaknya lansia yang

memiliki pakaian <4 stel lebih sedikit dibandingkan dengan provinsi lain, banyaknya

lansia yang tidak mempunyai tempat tetap untuk tidur lebih banyak dibandingkan dengan

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 29

Page 30: Bagian Inti+Akhir

Analisis Multivariat II

provinsi lain, banyaknya lansia yang bila sakit tidak lebih banyak dibandingkan dengan

provinsi lain.

5.2 Saran

Untuk pemerintah, provinsi-provinsi pada cluster 2 perlu lebih mendapatkan perhatian

yang ekstra agar memiliki penduduk lanjut usia yang produktif. Provinsi-provinsi yang

masuk pada cluster 2 adalah Sumatera Selatan, Jawa Barat, Nusa Tenggara Timur,

Kalimantan Timur, Kalimantan Barat, Sulawesi Tengah, Sulawesi Selatan, Sulawesi

Tenggara dan Irian Jaya.

Untuk penulis, agar lebih bisa mengeksplor dan mengaplikasikan ilmu-ilmu statistika

dalam berbagai bidang.

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 30

Page 31: Bagian Inti+Akhir

Analisis Multivariat II

DAFTAR PUSTAKA

Santoso,singgih. 2002.Buku Latihan SPSS Statistik Multivariat.Elex Media

Komputindo:Jakarta.

http://digilib.its.ac.id/public/ITS-Undergraduate-17290-1309105013-Paper.pdf

http://www.digilib.unipdu.ac.id/downlot.php?file=BAB%20II%207305003.pdf

http://lecturer.eepis-its.edu/~iwanarif/kuliah/dm/5Clustering.pdf

http://prayudho.wordpress.com/2008/12/30/analisis-cluster/

http://statistikaterapan.files.wordpress.com/2008/10/analisis-cluster.doc

Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 31