PRESENTASI TUGAS AKHIRJUM’AT, 13 JUNI 2014
VISUALISASI KUALITAS UDARA UNTUK MENENTUKAN TITIK RAWAN POLUSI
MENGGUNAKAN ALGORITMA SELF-ORGANIZING MAP DAN K-MEANS STUDI KASUS KOTA SURABAYA
OLEH:REZA CLAUDIA ISTANTO 5210100103
OUTLINES▪ Latar Belakang
▪ Rumusan Masalah
▪ Batasan Masalah
▪ Tujuan
▪ Manfaat
▪ Tinjauan Pustaka
▪ Metode Penelitian
▪ Pengolahan Data dan Implementasi
▪ Uji Coba dan Analisis Hasil
▪ Kesimpulan dan Saran
LATAR BELAKANGPolusi atau pencemaran udara menurut UU Republik Indonesia nomor 23 tahun 1997:
Masuk atau di masukkannya zat, energi, makhluk hidup dan atau komponen lain kedalam suatu lingkungan yangdilakukan oleh manusia sehingga kualitas dari lingkungan tersebut turun sampai pada tingkat tertentu yangmenyebabkan lingkungan tidak bisa digunakan sebagaimana mestinya.
Sumber Pencemaran Utama:
Polutan Pencemar Utama:
Perubahan komposisi dari zat udara sehingga kualitas dari zat tersebut menjadiberkurang atau tidak bisa lagi diperuntukkan sesuai fungsinya.
Pengendalian Pencemaran Utama:
Metode pemodelan terhadappengukuran kualitas udara.
1. Teknik dan pengukuran2. Pengoptimalan atau pembatasan terhadap polutan3. Pemodelan dengan pengklasteran daerah kedalam
kelas tertentu
1. Algoritma K-means2. Self-Organizing Maps
Output
Mempresentasikan kondisipolusi udara dan titik rawanpolusi di wilayah kota Surabaya
RUMUSAN MASALAHBagaimana membuat suatu clustering kualitas udara berdasarkan parameter-
parameter tertentu berdasarkan lokasi stasiun pemantau kualitas udara ambien,
sehingga dapat diketahui lokasi titik rawan polusi di wilayah kota Surabaya.
BATASAN MASALAH1. Data yang digunakan adalah data yang didapatkan dari Badan Lingkungan Hidup
Kota Surabaya dan Unit Pelaksana Teknis Badan Laboratorium Lingkungan Hidup
Surabaya
2. Sistem yang digunakan untuk menggunakan aplikasi Matlab
3. Keluaran yang dihasilkan pada visualisasi ini adalah pemodelan terhadap kualitas
udara pada kota Surabaya
TUJUAN1. Memperoleh hasil dan solusi dari analisis desain pemodelan terhadap kualitas udara yang
ada daerah di kota Surabaya
2. Mengetahui tingkat akurasi algoritma dan clustering dalam desain pemodelan terhadap
kualitas udara
3. Hasil visualisasi kualitas udara ini mampu menentukan titik rawan polusi di bagian wilayah
kota Surabaya
MANFAATMembantu Pemerintah Kota Surabaya khususnya lembaga Badan Lingkungan Hidup Surabaya
dan Unit Pelaksana Teknis Badan Laboratorium Lingkungan Hidup Surabaya untuk melakukan
evaluasi dalam rangka terciptanya udara yang bersih dan sehat yang memenuhi baku mutu
kualitas udara
TINJAUAN PUSTAKA
Visualisasi kualitas udara
▪ Visualisasi merupakan rekayasa dalam pembuatan gambar atau diagram untuk menampilkan suatuinformasi
▪ Dalam penelitian ini, Kohonen’s SOFM merupakan tool atau alat untuk memvisualisasikan data dalamdimensional tinggi
Kohonen’s self-organizing feature maps (KSOFM)
▪ Kohonen’s self-organizing feature maps (KSOFM), merupakan salah satu model unsupervised neural network yang paling popular dimana nilai dari data space sekaligus melakukan topologi untukmendapatkan proyeksi dari data space menjadi dua bentuk dimensi (Kohonen, 1997)
▪ Jaringan ini memiliki kemampuan visualisasi dalam memberikan gambar informatif data space dan dalammengeksplorasi vektor data atau seluruh data set yang ada.
TINJAUAN PUSTAKA (CONT’D)
Clustering Kualitas udara
▪ Proses mengelompokkan objek berdasarkan informasi yang diperoleh dari data yang menjelaskan hubungan antar objek dengan prinsip untuk memaksimalkan kesamaan antar anggota satu kelas dan meminimumkan kesamaan antar kelas/cluster
K-Means Algorithm
TINJAUAN PUSTAKA (CONT’D) Air Quality Management Kota Surabaya
▪ Status kualitas udara saat ini telah disajikan di Indonesia khususnya di kota-kota tertentu yang tercakup dalam Air QualityManagement System (AQMS)
▪ AQMS di Indonesia meliputi 10 kota di Indonesia, yaitu Jakarta, Bandung, Semarang, Surabaya, Denpasar, Medan,Pekanbaru, Palangka Raya, Jambi, dan Pontianak
▪ Setiap kota dilengkapi dengan stasiun tetap monitoring, stasiun pemantauan ponsel, pusat regional dan pusat kalibrasiregional
▪ Adapun stasiun pemantauan udara ambient secara permanen di Kota Surabaya diletakkan pada:
1. The Yard of Prestasi Park, Ketabang Kali Street (represents Urban Center area, Settlement area, Office area-Central Surabaya)
2. The Yard of Sub-district Office of East Perak, Selangor Street (represents Office area, nearby Industry area,Warehousing area- North Surabaya)
3. The Yard of Mayor’s Assistant Office in West Surabaya, Sukomannungal Streets (represent Settlement area, UrbanPeriphery- West Surabaya)
4. The Yard of Gayungan District, Gayungan Street (represents Settlement area-nearby Surabaya-Gempol Toll-SouthSurabaya).
5. The Yard of Convention Hall, Arif Rahman Hakim Street (represents Settlement area, Campus area, Office area-East Surabaya)
TINJAUAN PUSTAKA (CONT’D)
Public Display Data ditempatkan di
1. Di depan Monumen Kapal Selam , Gubeng Pojok Jalan (Central Surabaya)
2. Di depan BAPPEDA Provinsi Jawa Timur , Jalan Pahlawan (Surabaya Utara)
3. Ring Road, Mayjend Sungkono Jalan (Surabaya Barat)
4. Perempatan Dharmawangsa Street dan Kertajaya Jalan (Surabaya Timur)
5. Di depan BNI Graha Pangeran , A. Yani (Surabaya Selatan)
Parameter yang Diukur
Parameter yang diukur dalam stasiun pemanatau kualitas udara di KotaSurabaya ada 16 (enam belas) parameter, yang terdiri dari:
5 (lima) parameter kunci: PM10, SO2, O3, NO2, CO.
11 (sebelas) parameter pendukung dan meteorologi: NO, NOx,kecepatan angin (FF), kecepatan hembusan angina (FF Boe), arah angina(DD), arah hembusan angina (DD Boe), kelembaban udara ambien,kelembaban udara ambien, kelembaban udara container, suhu udaraambien, suhu container dan global radiasi
No
.
Parameter Waktu Pengukuran
1 Partikulat (PM10) 24 Jam (periode pengukuran rata-
rata)
2 Sulfur Dioksida (SO2) 24 Jam (periode pengukuran rata-
rata)
3 Carbon Monoksida
(CO)
8 Jam (periode pengukuran rata-
rata)
4 Ozon (O3) 1 Jam (periode pengukuran rata-
rata)
5 Nitrogen Dioksida
(NO2)
1 Jam (periode pengukuran rata-
rata)
TINJAUAN PUSTAKA (CONT’D)
Verifikasi Sistem
• Quantization Error
Quantization Error (QE) merupakan salah satu bentuk pengukuran untuk vektor kuantisasi dan clustering
algorithms. Komputasi untuk QE ini adalah menentukan rata- rata jarak dari contoh vector pada cluster
centroids yang merepresentasikan hasil clustering. Dengan cara melakukan perbandingan hasil QE dengan
data set lainnya juga merupakan salah satu cara pengukuran.
• Topography Error
Topography Error merupakan metode pengukuran topology preservation yang cukup sederhana. Komputasi
yang dilakukan adalah menentukan masing- masing nilai terbaik dan kedua terbaik pada matching units. Jika
tidak berdekatan ataupun berbatasan pada map, maka dipertimbangkan sebagai sebuah kesalahan
Validasi
• RMSSTD
Root mean square standard deviation (RMSSTD) merupakan metode evaluasi yang
digunakan untuk mengukur kualitas dari clustering algorithm. Semakin kecil nilai dari
RMSSTD, maka semakin baik pembagian dari bentuk cluster.
𝑅𝑀𝑆𝑆𝑇𝐷 = 𝑗=1..𝑝𝑖=1..𝑘
𝑎=1
𝑛𝑖𝑗(𝑥𝑎 − 𝑥𝑖𝑗)2
𝑗=1..𝑝𝑖=1..𝑘(𝑛𝑖𝑗 − 1)
• R-Squared
R-squared value (RS) digunakan untuk menentukan apakah terdapat perbedaan yang
signifikan pada objek di grup yang berbeda dan pada objek di sama grup yang memiliki
kesamaan yang tinggi Dengan kata lain, semakin besar nilai RS, maka diindikasi semakin
bagus cluster yang dihasilkan.
𝑅𝑆 =𝑆𝑆𝑡 − 𝑆𝑆𝑤𝑆𝑆𝑡
, 𝑆𝑆𝑡 =
𝑗=1
𝑝
𝑎=1
𝑛𝑗
(𝑥𝑎 − 𝑥𝑗)2 , 𝑆𝑆𝑤 =
𝑗=1
𝑖=1..𝑘
𝑎=1
𝑛𝑖𝑗
(𝑥𝑎 − 𝑥𝑖𝑗)2
TINJAUAN PUSTAKA (CONT’D)
• Entropy
Entropy adalah clustering validation berdasarkan kriteria eksternal untuk K-means clustering.
Sebagai kriteria eksternal entropy menggunakan informasi eksternal yaitu class label. Semakin
banyak jumlah clustering validation, maka nilai entropy semakin meningkat. Entropy sering
disebut sebagai “biased effect” dari pengukuran entropy
• Davies Bouldin Index
Davies- Boulding Index (DBI) merupakan salah satu teknik mengukur tingkat validitas hasil klaster
dengan cara membentuk matrix untuk mengevaluasi algoritma clustering.
𝐷𝐵 =1
𝑛𝑐
𝑖=1
𝑛𝑐
𝑚𝑎𝑥𝑙 ≠𝑚𝑆𝑐 𝑄𝑘 + 𝑆𝑐 𝑄𝑙𝑆𝑐𝑐 𝑄𝑘, 𝑄𝑙
TINJAUAN PUSTAKA (CONT’D)
METODE PENELITIAN
Identifikasi permasalahan
•Wawancara untukmengetahuibagaimanapengelolaanterhadappencemaran udara
•MelakukanObservasi danpengamatan padatitik stasiunpemantauan udarauntuk mengetahuikondisi udara.
Studi Literatur
•Pembelajaranliteratur terkaitdengan konsepserta metode yang digunakan untukmenyelesaikanpermasalahan
Pengumpulan Data
• Instansi terkait: Badan LingkunganHidup dan Unit Pelaksana TeknisBadanLaboratoriumLingkungan Kota SUrabaya
•Desain parameter
Praprocessing Data
•Tujuan dari proses iniadalah menghilangkannoise, memperjelasfitur data, memperkecil/ memperbesar ukurandata, danmengkonversi data asliagar diperoleh data yang sesuai kebutuhan
Tahap Pelaksanaan Algoritma
Daily Reports terhadap Udara Surabaya
Pengambilan dan pembersihan Data
Self Organizing Maps (SOM) cluster
Hasil cluster yang didapat
K-means cluster
Hasil cluster K-means
Clustering Validation
Apakah hasil telah valid?
Melakukan uji verifikasi
Melakukan Analisa Data
Hasil Analisa
YA
TIDAK
PENGOLAHAN DATA DAN IMPLEMENTASI
Pengumpulan Data
1. Parameter yang diukurNo. Parameter1 Nilai ISPU2 Partikulat (PM10)3 Sulfur Dioksida (SO2)4 Carbon Monoksida (CO)
5 Ozon (O3)6 Nitrogen Dioksida (NO2)
2. Pemantauan Kualitas Udara OtomatisStasiun
Lokasi Pemantauan Wilayah
SUF1 Halaman Taman Prestasi, Jl.KetabangKali
Surabaya Pusat
SUF2 Halaman Kantor Kelurahan PerakTimur, Jl.Selangor
Surabaya Utara
SUF3 Halaman Kantor Pembantu WalikotaSurabaya Barat, Jl.Sukomanunggal
Surabaya Barat
SUF4 Halaman Kecamatan Gayungan,Jl.Gayungan
SurabayaSelatan
SUF5 Halaman Convention Hall, Jl.ArifRahman Hakim
SurabayaTimur
Proses Penyeleksian dan Pembersihan Data
1. Identifikasi Atribut
Equation Penjelasan
Stasiun yang dilakukan
pemantauan pada waktu
t
Nilai parameter sampai
urutan ke k pada waktu t
Nilai j menunjukkan
penempatan kelas
berdasarkan nilai
P Pattern atau pola
Nama Atribut KeteranganNilai Konsentrasi Nilai konsentrasi yang didapatkan dengan cara
pengukuran otomatis pada masing- masing unsurStasiun Lokasi pengukuran yang telah ditempatkan di
bagian- bagian Kota SurabayaBulan Pengukuran nilai konsentrasi berdasarkan waktu
setiap bulannya
PENGOLAHAN DATA DAN IMPLEMENTASI
Proses Penyeleksian dan Pembersihan Data
(Lanjutan)
2. Merubah Nilai Atribut 3. Standarisasi Niai
)𝑆 = 𝑆𝑇𝐴𝑁𝐷𝐴𝑅𝐷𝐼𝑍𝐸(𝑥;𝑚𝑒𝑎𝑛; 𝑠𝑡𝑎𝑛𝑑𝑑𝑒𝑣
PENGOLAHAN DATA DAN IMPLEMENTASI
Pengerjaan Algoritma
1. Inisialisasi Klaster
2. Tahapan Algoritma SOM
Memasukkan data hasil praprocessing
Inisialisasi Weight
Penentuan klaster berdasarkan inputandari data weight terakhir
Didapatkan weight dengan nilai paling optimal, dan didapatkan pula hasilklustering
3. Validasi Algoritma SOM
Validasi ini digunakan untuk membandingkan nilai klaster
mana yang memiliki tingkat kesalahan paling kecil
menggunakan metode Root Median Square Standart
Deviation (RMSSTD)
Nama Klaster
Jumlah Klaster Inisialisasi
Kluster 1 2 klaster yang terbentuk Klaster a bKluster 2 3 klaster yang terbentuk Klaster c d eKluster 3 4 klaster yang terbentuk Klaster f g h i
Klaster Nama Klaster Nilai RMSSTD
Klaster 1 Klaster a b 1.009044Klaster 2 Klaster c d e 1.00178Klaster 3 Klaster f g h i 1.072923
0.95
1
1.05
1.1
1.009043919 1.001779758
1.072923305
RMSSTD
Kluster c Kluster d Kluster e
PENGOLAHAN DATA DAN IMPLEMENTASI
Pengerjaan Algoritma (Lanjutan)
4. Tahapan Algoritma SOM
Menentukan koordinat titik tengahsetiap kluster yang didapatkan dari hasilAlgoritma SOM yang telah tervalidasi
Menentukan jarak setiap obyekterhadap koordinat titik tengah
Mengelompokkan obyek- obyekberdasarkan pada jarak minimumnya.
PENGOLAHAN DATA DAN IMPLEMENTASI
Visualisasi Hasil
1. Matlab Network Clustering Tool
Mengetikkan
fungsi nctool
Muncul jendela Neural
Network Clustering Tool
Memasukkan data yang
telah dibuat, dan dilakukan
proses import data menjadi
format yang ditentukan oleh
matlab
Menentukan jumlah baris dan kolom
dalam satu grid atau kotak.
Untuk baris dan kolom terdapat
sampai baris ke 10 (default dari
matlab), sedangkan total neuron
berjumlah 100.
Muncul jendela Train
Network dan klik Train
untuk mendapatkan hasil
proses algoritma SOM Proses run telah berjalan
maksimal dengan
dilakukan 200 iteration
dan untuk mengetahui
hasil klaster dapat meng-
klik Plot yang ada.
PENGOLAHAN DATA DAN IMPLEMENTASI
Visualisasi Hasil (Lanjutan)
2. Matlab Somtoolbox
a. Construction of data
sets
Mengubah data dari Ms. excel agar sesuai dengan format
Matlab untuk dilakukan fungsi menggunakan Somtoolbox
Tahap untuk melakukan
transformasi atau normalisasi,
pemilihan data untuk dihilangkan
atau nilai mengandung kesalahan
menggunakan fungsi
sD = som_normalize(sD,'var');
Fungsi som_make pada somtoolboxmerupakan salah satu caar untukmelakukan inisialisasi dan trainingpada SOM.sM=som_make (sD);
Dilakukan visualisasi terhadap hasil SOM
menggunakan som_show pemetaan
menggunakan som_show_add
sM = som_autolabel(sM,sD, 'vote');som_show(sM, 'umat','all','comp',1:5, 'empty','Labels','norm','d');som_show_add('label',sM,'subplot',7);
b. Data preprocessing
c. Initialization and Training
d. Visualization and analysis
PENGOLAHAN DATA DAN IMPLEMENTASI
3. Peltarion Synapse
Halaman awal
Peltarion Synapse
Melakukan proses import
data menggunakan CSV
File.
Melakukan Browse filename
yang digunakan untuk
dilakukan pengolahan
Tampilan data dengan
hanya dipisahkan oleh
koma
Memilih SOMView untuk
selanjutkan akan didapatkan
hasil visualisasi SOM
Mengubah format file
yang hanya dipisahkan
oleh koma menjadi field
untuk memudahkan pada
langkah selanjutnya
Visualisasi Hasil (Lanjutan)
PENGOLAHAN DATA DAN IMPLEMENTASI
4. StatPlanet
a. Layer Peta
Memasukan peta ke dalam peta template
(map.fla) sesuai dengan peta yang telah dibuat
Visualisasi Hasil (Lanjutan)
b. Layer Batas
Memasukan batas peta ke dalam map.fla
c. Membuat link peta pada StatPlanet Data EditorPada StatPlanet_data_editor.xlsm, pertama masukan ‘nama asli’ petaregional, dan kemudian ‘instance name’ atau kode yang digunakan dalamfile peta (map.fla) sesuai dengan nama wilayah yang ditentukan.
Daftar kode yang digunakan adalah Surabaya Barat menjadi SB, SurabayaTimur menjadi ST, Surabaya Pusat menjadi SP, Surabaya Selatan menjadiSS, dan Surabaya Utara menjadi SU.
d. Memasukkan data pada StatPlanet Data EditorSheet ‘Import’ dan masukan data pada peta. Jugabisa dilakukan dengan menggunakan tombol‘Import data’ untuk mengimpor data secaraotomatis.
UJI COBA DAN ANALISIS HASIL
Uji Verifikasi Sistem
Verifikasi sistem dilakukan dengan cara memasukkan
data selain penelitian untuk menguji ketepatan sistem
yang telah dibangun. Data yang digunakan merupakan
data iris
Uji Verifikasi Kluster
Uji verifikasi terhadap kluster yang dihasilkan dengan menggunakan som
toolbox. Dimana memiliki kemampuan untuk mengukur kebenaran
terhadap pemetaan data penelitian dengan proyeksi yang optimal yang
termasuk didalamnya adalah rata- rata dari quantization errors (QE) dan
beberapa topographic errors (TE)
Dari hasil perbandingan pada tabel diatas menunjukkan bahwa denganmenggunakan kombinasi metode SOM dan k-mean hasil klasifikasi yangdidapatkan memiliki tingkat kesalahan lebih kecil dibandingkan denganmetode SOM saja
Membandingkan hasil dengan menggunakan data template yaitu data iris. Berdasarkan tabel yang didapatkan, perbedaan hasil yang didapatkan tidakmemiliki nilai yang terlampau jauh dengan data Iris yang merupakan data telah teruji
Algoritma QE TESOM kombinasi K-Means 0.285 0.016SOM 0.401 0.042K-Means 0.486 0.068
Algoritma QE TEIris 0.418 0.013Data analisis (nilai ISPU) 0.285 0.016
UJI COBA DAN ANALISIS HASIL
Uji Validasi
Dalam penelitian yang dilakukan uji validasi dalam menentukan apakah hasil
klaster telah sesuai dan optimal. Hasil kluster akan diukur menggunakan beberapa
teknik clustering validation. Pada tabel diatas, penulis akan memperlihatkan
validasi untuk masing- masing metode clustering yang digunakan.
Metode Metode ValidasiSelf Organizing Maps Pengukuran menggunakan RMSSTD, yang
telah dijelaskan pada bab 4K-means Pengukuran dilakukan dengan
menggunakan nilai entropy denganmembandingkan jumlah klustering yangditentukan yaitu klaster 1 sampai klaster 3
Self Organizing Maps kombinasi dengan K-means
Pengukuran validitas yang dilakukan dariawal sampai akhir dari penelitian ini.
PENGOLAHAN DATA DAN IMPLEMENTASI
1. Deskripsi Klasifikasi (Taxonomi Description)
a. Penyederhanaan Data
Menetapkan struktur sesuai dengan hasil
observasi dan kemudian dikompokkan untuk
analisis selanjutnya. Berikut ini adalah hasil
penyederhanaan data
Analisis Interaksi terhadap Data
b. Identifikasi HubunganHubungan antar atribut diidentifikasi secaraempiris. Struktur analisis cluster yangsederhana mampu menggambarkan adanyahubungan atau kesamaan dan perbedaansesuai dengan kebutuhan untuk memenuhitujuanNama Tabel (Sebelum) Nama Tabel (Sesudah)
Tanggal Nilai KonsentrasiBulan StasiunTahun BulanMinimumStasiunMaksimumStasiunRata- rata
NamaAtribut/
TabelKeterangan
NilaiKonsentrasi
Nilai konsentrasi yang didapatkandengan cara pengukuran otomatispada masing- masing unsur
Stasiun Lokasi pengukuran yang telahditempatkan di bagian- bagian KotaSurabaya
Bulan Pengukuran nilai konsentrasiberdasarkan waktu setiap bulannya
PENGOLAHAN DATA DAN IMPLEMENTASI
2. Desain terhadap Penelitian dalam Analisis Cluster
a. Standarisasi Data
Standarisasi terhadap data dilakukan dengan
melakukan substraksi nilai rata- rata dan
membagi dengan standar deviasi masing-
masing variabel
Analisis Interaksi terhadap Data
b. Mengukur Kesamaan DataMetode RMSSTD merupakan salah satumetode untuk mengukur kesamaan data atauproses evaluasi yang digunakan untukmengukur kualitas dari clustering algorithm.Semakin kecil nilai dari RMSSTD, maka semakinbaik pembagian dari bentuk cluster
Berdasarkan nilai yang dihasilkan menggunakan metodeRMSSTD didapatkan dua unsur yang nilainya berbedadengan unsur lainnya yang diteliti yaitu Unsur O3 dan unsurSO2. Dengan nilai RMSSTD berada pada rekomendasi keduayaitu dilakukan dengan dilakukan pembagian klustersebanyak 4 untuk SO2 dan pembagian kluster sebanyak 2untuk O3. Sedangkan unsur lainnya menunjukkan nilaiRMSSTD dengan rekomendasi pertama yaitu pembagiankluster sebanyak 3.
Adanya hasil yang menyimpang tersebut maka dilakukandua tindakan yaitu menganalisis apakah dua unsur tersebutmemiliki bobot yang berbeda dengan unsur- unsur yanglainnya ataukah bobot dari seluruh unsur yang ditetitiadalah setara. (Berdasarkan Laporan Pemeliharaan StasiunMonitoring Udara Ambient Tahun 2008 ( Kep-107/KABAPEDAL/11/1997))
Unsur Nama Klaster Nilai RMSSTD
ISPU (Nilai Keseluruhan)
Klaster a b 1.009043919Klaster c d e 1.001779758Klaster f g h i 1.072923305
COKlaster a b 1.142621036Klaster c d e 0.653672873Klaster f g h i 1.371552774
NO2
Klaster a b 0.908545706Klaster c d e 0.609021788Klaster f g h i 1.605771531
O3
Klaster a b 1.214145746Klaster c d e 1.600474716Klaster f g h i 1.633340841
PM10
Klaster a b 1.173978921Klaster c d e 1.065903541Klaster f g h i 1.439794084
SO2
Klaster a b 1.457786539Klaster c d e 1.287995208Klaster f g h i 1.140740332
PENGOLAHAN DATA DAN IMPLEMENTASI
2. Desain terhadap Penelitian dalam Analisis Cluster
d. Mendeteksi outlier
Outlier merupakan variabel yang memiliki nilai
berbeda dengan nilai variabel yang lainnya
atau nilai variabel yang menyimpang.
Entropy merupakan salah satu teknik validitas
proses clustering yang digunakan untuk
mengukur biased effect yaitu tingkat
penyimpangan hasil clustering yang dihasilkan
Analisis Interaksi terhadap Data
Dengan hasil yang didapatkan berdasarkan tabel diatasmaka untuk clustering dengan pembagian klaster sebanyak3 memiliki nilai entropy terkecil dibandingkan jumlahklaster lainnya, namun terdapat satu unsur yang memilikinilai entropy terbaik tidak pada pembagian klastersebanyak 3 yaitu unsur O3. Namun perbedaan nilai entropyyang dihasilkan oleh unsur tersebut tidak terlalu jauhdibandingkan pembagian klaster sebanyak 3 (berada padaurutan kedua) sehingga dapat dilakukan kesimpulan untuknilai entropy ini bahwa nilai entropy terbaik dihasilkan daripembagian sebanyak 3 klaster.
Unsur Nama Klaster Nilai Entropy
ISPU (Nilai Keseluruhan)
Klaster a b 3.139779Klaster c d e 2.802700Klaster f g h i 2.943659
COKlaster a b 2.931186773Klaster c d e 2.850489174Klaster f g h i 2.955864321
NO2
Klaster a b 2.891321871Klaster c d e 2.767884304Klaster f g h i 2.800278179
O3
Klaster a b 2.261340741Klaster c d e 2.5197744Klaster f g h i 2.583771184
PM10
Klaster a b 2.808577447Klaster c d e 2.448691154Klaster f g h i 2.805158311
SO2
Klaster a b 2.033748463Klaster c d e 2.033158459Klaster f g h i 2.574259793
PENGOLAHAN DATA DAN IMPLEMENTASI
3. Proses Validasi dan Verifikasi Solusi Cluster
Tiga metode yang dilakukan dalam melakukan proses validasi dan verifikasi adalah dengan Davies Bouldin Index (DBI), dan
Quantization Error (QE) serta Topography Error (TE)
Analisis Interaksi terhadap Data
Semakin rendah nilai dari DBI, maka semakin baik pembagian dari bentuk cluster.Sehingga dari tabel tersebut ditarik kesimpulan bahwa Kombinasi SOM dan K-means memiliki nilai DBI yang lebih rendah dibandingkan dengan hanya SOMsaja, dengan begitu pengklasteran sebanyak 3 menunjukkan nilai paling optimal
Unsur Metode Klaster Nilai DBI
ISPU (Nilai Keseluruhan)SOM 2.463220372Kombinasi SOM dan K-means 1.853457002
COSOM 3.636903914Kombinasi SOM dan K-means 2.561812478
NO2SOM 2.110417482Kombinasi SOM dan K-means 0.885502047
O3SOM 2.135225472Kombinasi SOM dan K-means 0.831734887
PM10SOM 3.502232842Kombinasi SOM dan K-means 0.623986571
SO2SOM 3.143125006Kombinasi SOM dan K-means 0.551741086
PENGOLAHAN DATA DAN IMPLEMENTASI
4. Pembuatan Profil terhadap Solusi Cluster
Analisis Interaksi terhadap Data
Proses ini merupakan proses untuk menggambarkan karakteristik tiapklsster yang dihasilkan. Pendeskripsian yang berbeda untuk tiap klasterdan memprediksi anggota dalam suatu klaster khusus
Menggambarkan karakteristik tiap klaster yang dibentuk sertamelakukan pendeskripsian terhadap atribut yang dianalisis. Berikut iniadalah karakteristik untuk kondisi kualitas udara Surabaya
Nilai ISPU (Keseluruhan)
Klaster Karakteristik Hasil
Klaster c
Jumlah Anggota Jumlah untuk kluster c adalah sebanyak353 (32.2%)
Nilai Minimum 7Nilai Maksimum 96Rata- Rata Nilai Rata- rata nilai ISPU untuk kluster c
adalah 51Stasiun Anggota lebih banyak dari stasiun 1, 4,
dan 5
Klaster d
Jumlah Anggota Jumlah untuk kluster d adalah sebanyak334 (30.4%)
Nilai Minimum 52Nilai Maksimum 131Rata- Rata Nilai Rata- rata nilai ISPU untuk kluster 2
adalah 84Stasiun Anggota lebih banyak dari stasiun 3 dan
4
Klaster e
Jumlah Anggota Jumlah untuk kluster e adalah sebanyak409 (37.3%)
Nilai Minimum 87Nilai Maksimum 189Rata- Rata Nilai Rata- rata nilai ISPU untuk kluster e
adalah 101Stasiun Anggota lebih banyak dari stasiun 1, 4,
dan 5
PENGOLAHAN DATA DAN IMPLEMENTASI
4. Pembuatan Profil terhadap Solusi Cluster (lanjutan)
Analisis Interaksi terhadap Data
Unsur CO Unsur NO2
Klaster Karakteristik Hasil
Klaster c
Jumlah Anggota Jumlah untuk kluster c adalahsebanyak 288 (26.25%)
Nilai Minimum 0,51Nilai Maksimum 7,02Rata- Rata Nilai Rata- rata nilai CO untuk kluster
c adalah 1,59Stasiun Anggota lebih banyak dari
stasiun 5
Klaster d
Jumlah Anggota Jumlah untuk kluster d adalahsebanyak 596 (54.3%)
Nilai Minimum 0,34Nilai Maksimum 8,61Rata- Rata Nilai Rata- rata nilai ISPU untuk
kluster 2 adalah 1,83
Stasiun Anggota lebih banyak daristasiun 4
Klaster e
Jumlah Anggota Jumlah untuk kluster e adalahsebanyak 18,5 (37.3%)
Nilai Minimum 1,29Nilai Maksimum 8,43Rata- Rata Nilai Rata- rata nilai ISPU untuk
kluster e adalah 101Stasiun Anggota lebih banyak dari
stasiun 4 dan 5
Klaster Karakteristik Hasil
Klaster c
Jumlah Anggota Jumlah untuk kluster c adalahsebanyak 334 (30.4%)
Nilai Minimum 0,094Nilai Maksimum 212,14Rata- Rata Nilai Rata- rata nilai ISPU untuk
kluster c adalah 48,2428Stasiun Anggota lebih banyak dari
stasiun 4
Klaster d
Jumlah Anggota Jumlah untuk kluster d adalahsebanyak 353 (32.2%)
Nilai Minimum 0.01566Nilai Maksimum 176,2Rata- Rata Nilai Rata- rata nilai ISPU untuk
kluster 2 adalah 50.7345Stasiun Anggota lebih banyak dari
stasiun 3 dan 4
Klaster e
Jumlah Anggota Jumlah untuk kluster e adalahsebanyak 409 (37.1%)
Nilai Minimum 0.01566Nilai Maksimum 192,57Rata- Rata Nilai Rata- rata nilai ISPU untuk
kluster e adalah 54,5822Stasiun Anggota lebih banyak dari
stasiun 5
PENGOLAHAN DATA DAN IMPLEMENTASI
4. Pembuatan Profil terhadap Solusi Cluster (lanjutan)
Analisis Interaksi terhadap Data
Unsur O3 Unsur PM10
Klaster Karakteristik Hasil
Klaster c
Jumlah Anggota Jumlah untuk kluster c adalahsebanyak 298 (27.1%)
Nilai Minimum 43,757Nilai Maksimum 694,34Rata- Rata Nilai Rata- rata nilai ISPU untuk
kluster c adalah 124,383Stasiun Anggota lebih banyak dari
stasiun 1 dan 5
Klaster d
Jumlah Anggota Jumlah untuk kluster d adalahsebanyak 89 (8.1%)
Nilai Minimum 21,446Nilai Maksimum 176,07Rata- Rata Nilai Rata- rata nilai ISPU untuk
kluster 2 adalah 129,297Stasiun Anggota lebih banyak dari
stasiun 1
Klaster e
Jumlah Anggota Jumlah untuk kluster e adalahsebanyak 709 (64.6%)
Nilai Minimum 52,038Nilai Maksimum 374,08Rata- Rata Nilai Rata- rata nilai ISPU untuk
kluster e adalah 141Stasiun Anggota lebih banyak dari
stasiun 1
Klaster Karakteristik Hasil
Klaster c
Jumlah Anggota Jumlah untuk kluster c adalahsebanyak 353 (32.2%)
Nilai Minimum 7Nilai Maksimum 96Rata- Rata Nilai Rata- rata nilai ISPU untuk
kluster c adalah 51Stasiun Anggota lebih banyak dari
stasiun 1, 4, dan 5
Klaster d
Jumlah Anggota Jumlah untuk kluster d adalahsebanyak 334 (30.4%)
Nilai Minimum 52Nilai Maksimum 131Rata- Rata Nilai Rata- rata nilai ISPU untuk
kluster 2 adalah 84Stasiun Anggota lebih banyak dari
stasiun 3 dan 4
Klaster e
Jumlah Anggota Jumlah untuk kluster e adalahsebanyak 409 (37.3%)
Nilai Minimum 87Nilai Maksimum 189Rata- Rata Nilai Rata- rata nilai ISPU untuk
kluster e adalah 101Stasiun Anggota lebih banyak dari
stasiun 1, 4, dan 5
PENGOLAHAN DATA DAN IMPLEMENTASI
4. Pembuatan Profil terhadap Solusi Cluster (lanjutan)
Analisis Interaksi terhadap Data
Unsur SO2
Klaster Karakteristik Hasil
Klaster c
Jumlah Anggota Jumlah untuk kluster c adalahsebanyak 541 (49.3%)
Nilai Minimum 72,727Nilai Maksimum 1101Rata- Rata Nilai Rata- rata nilai ISPU untuk
kluster c adalah 303,5597Stasiun Anggota lebih banyak dari
stasiun 1, 4, dan 5
Klaster d
Jumlah Anggota Jumlah untuk kluster d adalahsebanyak 331 (30.1%)
Nilai Minimum 203Nilai Maksimum 1393Rata- Rata Nilai Rata- rata nilai ISPU untuk
kluster 2 adalah 622,0237Stasiun Anggota lebih banyak dari
stasiun 1 dan 5
Klaster e
Jumlah Anggota Jumlah untuk kluster e adalahsebanyak 224 (20.4%)
Nilai Minimum 0,15283Nilai Maksimum 2095,7Rata- Rata Nilai Rata- rata nilai ISPU untuk
kluster e adalah 372,8715Stasiun Anggota lebih banyak dari
stasiun 1, 2, dan 5
PENGOLAHAN DATA DAN IMPLEMENTASI
4. Pembuatan Profil terhadap Solusi Cluster (lanjutan)
Analisis Interaksi terhadap Data
Mengelompokkan dengan menggunakan kategori yang menunjukkan kondisikualitas udara yang ada di Surabaya berdasarkan hasil yang didapatkan.Dengan menggunakan beberapa asumsi dan berdasarkan LaporanPemeliharaan Stasiun Monitoring Udara Ambient Tahun 2008 ( Kep-107/KABAPEDAL/11/1997) (KABAPEDAL, 2008) maka penulis melakukanpembagian kategori dan pengaruhnya yang ditunjukkan pada tabel
Kategor
i
CO NO2 O3 SO2 PM10
Baik Tidak ada efek Sedikit berbau Luka pada
beberapa spesies
tumbuhan
akibat kombinasi
SO2 (selama 4
jam)
Luka pada
beberapa spisies
tumbuhan
akibat
kombinasi
O3 (selama 4
jam)
Tidak ada
efek
Sedang Perubahan
kimia
Darah tetapi
tidak terdeteksi
Berbau Luka pada
beberapa spesies
tumbuhan
Luka pada
beberapa spesies
tumbuhan
Terjadi
penurunan
pada jarak
pandang
Tidak
Sehat
Peningkatan
pada
kardiovaskular
pada perokok
yang sakit
jantung
Berbaudan
kehilangan
warna,
peningkatan
reaktivitas
pembuluh
tenggorokan
pada
penderita
asma
Penurunan
kemampuan
pada atlit yang
berlatih keras
Berbau
Meningkatnya
kerusakan
tanaman
Jarak pandang
turun dan
terjadi
pengotoran
oleh debu
Sangat
Tidak
Sehat
Meningkat
kardiovaskular
pada perokok
yang sakit
jantung, dan
tampak
beberapa
kelemahan
yang
terlihat nyata
Meningkat
sensitivitas
pada pasien
yang
berpenyakit
asma dan
bronchitis
Olahraga
ringan
mengakibatkan
pengaruh
pernapasan pada
pasien yang
berpenyakit paru-
paru kronis
Meningkat
sensitivitas pada
pasien yang
berpenyakit
asma dan
bronchitis
Meningkat
sensitivitas
pada pasien
yang
berpenyakit
asma dan
bronchitis
Berbaha
ya
Tingkat yang berbahaya bagi semua populasi yang terpapar
Klaster Kategori Index PenjelasanKlaster c Baik 0 – 50 Tingkat kualitas udara yang tidak memberikan efek
bagi kesehatan manusia atau hewan dan tidakberpengaruh pada tumbuhan, bangunan ataupun nilaiestetika
Klaster d Sedang 51 – 100 Tingkat kualitas udara yang tidak berpengaruh padakesehatan manusia atau hewan dan tidak berpengaruhpada tumbuhan yang sensitif, dan nilai estetika
Klaster e Tidak Sehat 101 – 199 Tingkat kualitas udara yang bersifat merugikan padamanusia ataupun kelompok hewan yang sensitif ataubisa menimbulkan kerusakan pada tumbuhan ataupunnilai estetika
PENGOLAHAN DATA DAN IMPLEMENTASI
5.Penentuan Titik Rawan Polusi
Analisis Interaksi terhadap Data
Berikut ini adalah analisis untuk menentukan titik rawan polusi. Penulis mendeskripsikan bahwarawan polusi dapat diketahui dari hasil clustering yang terbentuk pada cluster dengan predikatSangat Tidak Sehat (Kluster 4) dan Berbahaya (Kluster 5).
Kondisi Tidak SehatBulan Terjadi Setiap bulan pada tiga tahun
penelitianLokasi SUF 1 (Surabaya Pusat) berjumlah
144SUF 4 (Surabaya Selatan)berjumlah 130SUF 5 (Surabaya Timur) berjumlah101
17
8
13
0
10
1
S U R A B A Y A P U S A T S U R A B A Y A S E L A T A N
S U R A B A Y A T I M U R
LOKASI TITIK RAWAN POLUSI BERDASARKAN KONDISI
UDARA TIDAK SEHAT
Total
JumlahLokasiTItikRawanPolusi
PENGOLAHAN DATA DAN IMPLEMENTASI
1. Matlab Network Clustering Tool
1. Plot SOM Neighbor Distances
Analisis Interaksi terhadap Visualisasi
2. Plot SOM Weight PlanesGrafik ini menunjukkan weight planeuntuk setiap elemen dari input vector(terdapat 5 input yang dilakukan olehpeneliti). Grafik ini menunjukkanvisualisasi dari weight setiap inputpada masing- masing neuron. Warnacerah mewakili lebih besar dan warnagelap mewakili lebih kecil bobotmasing- masing
Jenis Penjelasan
Indikator -1 sampai 8 Jumlah kolom
Indikator 0 sampai 10 Jumlah baris
Segienam biru Mewakili neuron
Garis merah Menghubungkan antar
neuron
Warna- warna di
daerah yang berisi
garis- garis merah
Jarak antar neuron
Warna- warna gelap Menunjukkan jarak yang
lebih besar, atau data
yang memiliki perbedaan
jauh
Warna- warna cerah Menunjukkan jarak yang
lebih dekat, atau data
saling berkorelasi
3. Plot SOM Sample HitsGrafik ini menunjukkan berapa titikdata yang terkait dengan setiapneuron. Data yang terbaik adalahjika grafik menunjukkan jumlah datayang cukup merata disetiap neuron.
4. Plot SOM Weight PositionsGrafik yang ditunjukkan pada SOMWeight Planes digunakan untukmenunjukkan lokasi dari titik datadan weight vector (vector berat).Pada hasil yang ditunjukkanmerupakan hasil dari 200 kali iterasidari algoritma batch yang telahdilakukan pada keseluruhan data.
PENGOLAHAN DATA DAN IMPLEMENTASI
1. Matlab Network Clustering Tool (Lanjutan)
1. Plot SOM Neighbor Distances
Analisis Interaksi terhadap Visualisasi
2. Plot SOM Weight Planes
3. Plot SOM Sample Hits
4. Plot SOM Weight Positions
Nilai ISPU (Keseluruhan)
ISPU
Plot SOM Neighbor
Distances
Plot didominasi dengan warna cerah yaitu kuning dan
oranye yang menunjukkan jarak yang lebih dekat dan
data terlihat berkorelasi tinggi, namun hanya terlihat
sedikit warna gelap. Sehingga konvergensi terhadap
hasil clustering terlihat cukup tinggi
Plot SOM Weight
Planes
Grafik ini menunjukkan visualisasi dari weight setiap
input pada masing- masing neuron. Untuk Input 1 yang
menunjukkan nilai ISPU, lebih didominasi dengan
warna cerah dengan bobot lebih kecil, namun untuk
input yang lainnya nilai cerah dan gelap cukup merata.
Plot SOM Sample
Hits
Grafik ini menunjukkan berapa titik data yang terkait
dengan setiap neuron. Data yang terbaik adalah jika
grafik menunjukkan jumlah data yang cukup merata
disetiap neuron
Plot SOM Weight
Positions
Lokasi dari titik data dan weight vector (vector berat).
Pada hasil yang ditunjukkan merupakan hasil dari 200
kali iterasi dari algoritma batch yang telah dilakukan
pada keseluruhan data.
PENGOLAHAN DATA DAN IMPLEMENTASI
1. Matlab Network Clustering Tool (Lanjutan)
1. Plot SOM Neighbor Distances
Analisis Interaksi terhadap Visualisasi
2. Plot SOM Weight Planes
3. Plot SOM Sample Hits
4. Plot SOM Weight Positions
Unsur CO
CO
Plot SOM Neighbor
Distances
Plot didominasi dengan warna cerah yaitu kuning dan oranye
yang menunjukkan jarak yang lebih dekat dan data terlihat
berkorelasi tinggi, namun hanya terlihat sedikit warna gelap.
Sehingga konvergensi terhadap hasil clustering terlihat cukup
tinggi
Plot SOM Weight Planes Grafik ini menunjukkan visualisasi dari weight setiap input
pada masing- masing neuron. Untuk keseluruhan input
menunjukkan weight dari nilai ISPU, lebih didominasi dengan
warna gelap dengan bobot yang cukup besar.
Plot SOM Sample Hits Grafik ini menunjukkan berapa titik data yang terkait dengan
setiap neuron. Data yang terbaik adalah jika grafik
menunjukkan jumlah data yang merata dengan baik disetiap
neuron
Plot SOM Weight
Positions
Lokasi dari titik data dan weight vector (vector berat). Pada
hasil yang ditunjukkan merupakan hasil dari 200 kali iterasi
dari algoritma batch yang telah dilakukan pada keseluruhan
data.
PENGOLAHAN DATA DAN IMPLEMENTASI
1. Matlab Network Clustering Tool (Lanjutan)
1. Plot SOM Neighbor Distances
Analisis Interaksi terhadap Visualisasi
2. Plot SOM Weight Planes
3. Plot SOM Sample Hits
4. Plot SOM Weight Positions
Unsur NO2
NO2
Plot SOM Neighbor
Distances
Plot didominasi dengan warna cerah yaitu kuning dan oranye
yang menunjukkan jarak yang lebih dekat dan data terlihat
berkorelasi tinggi, namun hanya terlihat sedikit warna gelap.
Sehingga konvergensi terhadap hasil clustering terlihat cukup
tinggi
Plot SOM Weight Planes Grafik ini menunjukkan visualisasi dari weight setiap input
pada masing- masing neuron. Untuk keseluruhan input
menunjukkan weight dari nilai ISPU, lebih didominasi
dengan warna gelap dengan bobot yang cukup besar.
Plot SOM Sample Hits Grafik ini menunjukkan berapa titik data yang terkait dengan
setiap neuron. Data yang terbaik adalah jika grafik
menunjukkan jumlah data yang cukup merata disetiap neuron
Plot SOM Weight Positions Lokasi dari titik data dan weight vector (vector berat). Pada
hasil yang ditunjukkan merupakan hasil dari 200 kali iterasi
dari algoritma batch yang telah dilakukan pada keseluruhan
data.
PENGOLAHAN DATA DAN IMPLEMENTASI
1. Matlab Network Clustering Tool (Lanjutan)
1. Plot SOM Neighbor Distances
Analisis Interaksi terhadap Visualisasi
2. Plot SOM Weight Planes
3. Plot SOM Sample Hits
4. Plot SOM Weight Positions
Unsur O3
O3
Plot SOM Neighbor
Distances
Plot didominasi dengan warna cerah yaitu kuning dan
oranye yang menunjukkan jarak yang lebih dekat dan
data terlihat berkorelasi tinggi, namun hanya terlihat
sedikit warna gelap. Sehingga konvergensi terhadap hasil
clustering terlihat cukup tinggi
Plot SOM Weight
Planes
Grafik ini menunjukkan visualisasi dari weight setiap
input pada masing- masing neuron. Untuk keseluruhan
input menunjukkan weight dari nilai ISPU, lebih
didominasi dengan warna gelap dengan bobot yang
cukup besar.
Plot SOM Sample Hits Grafik ini menunjukkan berapa titik data yang terkait
dengan setiap neuron. Data yang terbaik adalah jika
grafik menunjukkan jumlah data yang cukup merata
disetiap neuron
Plot SOM Weight
Positions
Lokasi dari titik data dan weight vector (vector berat).
Pada hasil yang ditunjukkan merupakan hasil dari 200
kali iterasi dari algoritma batch yang telah dilakukan
pada keseluruhan data. Terdapat nilai weight yang cukup
jauh dengan yang lainnya karena terdapat data yang
memiliki jarak cukup jauh
PENGOLAHAN DATA DAN IMPLEMENTASI
1. Matlab Network Clustering Tool (Lanjutan)
1. Plot SOM Neighbor Distances
Analisis Interaksi terhadap Visualisasi
2. Plot SOM Weight Planes
3. Plot SOM Sample Hits
4. Plot SOM Weight Positions
PM10
PM10
Plot SOM Neighbor
Distances
Plot didominasi dengan warna cerah yaitu kuning dan
oranye yang menunjukkan jarak yang lebih dekat dan
data terlihat berkorelasi tinggi, namun hanya terlihat
sedikit warna gelap. Sehingga konvergensi terhadap hasil
clustering terlihat cukup tinggi
Plot SOM Weight
Planes
Grafik ini menunjukkan visualisasi dari weight setiap
input pada masing- masing neuron. Untuk keseluruhan
input menunjukkan weight dari nilai ISPU, lebih
didominasi dengan warna gelap dengan bobot yang
cukup besar.
Plot SOM Sample Hits Grafik ini menunjukkan berapa titik data yang terkait
dengan setiap neuron. Data yang terbaik adalah jika
grafik menunjukkan jumlah data yang merata dengan
baik disetiap neuron
Plot SOM Weight
Positions
Lokasi dari titik data dan weight vector (vector berat).
Pada hasil yang ditunjukkan merupakan hasil dari 200
kali iterasi dari algoritma batch yang telah dilakukan
pada keseluruhan data.
PENGOLAHAN DATA DAN IMPLEMENTASI
1. Matlab Network Clustering Tool (Lanjutan)
1. Plot SOM Neighbor Distances
Analisis Interaksi terhadap Visualisasi
2. Plot SOM Weight Planes
3. Plot SOM Sample Hits
4. Plot SOM Weight Positions
SO2
SO2
Plot SOM Neighbor
Distances
Plot didominasi dengan warna cerah yaitu kuning dan
oranye yang menunjukkan jarak yang lebih dekat dan
data terlihat berkorelasi tinggi, namun hanya terlihat
sedikit warna gelap. Sehingga konvergensi terhadap
hasil clustering terlihat cukup tinggi
Plot SOM Weight Planes Grafik ini menunjukkan visualisasi dari weight setiap
input pada masing- masing neuron. Untuk keseluruhan
input menunjukkan weight dari nilai ISPU, lebih
didominasi dengan warna gelap dengan bobot yang
cukup besar.
Plot SOM Sample Hits Grafik ini menunjukkan berapa titik data yang terkait
dengan setiap neuron. Data yang terbaik adalah jika
grafik menunjukkan jumlah data yang cukup merata
disetiap neuron
Plot SOM Weight
Positions
Lokasi dari titik data dan weight vector (vector berat).
Pada hasil yang ditunjukkan merupakan hasil dari 200
kali iterasi dari algoritma batch yang telah dilakukan
pada keseluruhan data. Terdapat nilai weight yang
cukup jauh dengan yang lainnya karena terdapat data
yang memiliki jarak cukup jauh.
PENGOLAHAN DATA DAN IMPLEMENTASI
2. Matlab Som Toolbox
Nilai ISPU (Keseluruhan)
Analisis Interaksi terhadap Visualisasi
Berikut ini adalah hasil dari analisis yang dilakukan olehpenulis terhadap data yang telah diolah sehinggamenghasilkan visualisasi yang ditampilkan untuk mengetahuihasil clustering terhadap lokasi pada map SOM dan porsinya.Keterangan mengenai kluster dijelaskan di bab PembuatanProfil Terhadap Solusi Cluster pada tabel Pembagian kategoriberdasarkan klaster yang terbentuk.
Unsur SO2 Unsur PM10
Unsur O3 Unsur NO2 Unsur CO
PENGOLAHAN DATA DAN IMPLEMENTASI
3. Peltarion Synapse
Nilai ISPU (Keseluruhan)
Analisis Interaksi terhadap Visualisasi
Unsur SO2
Unsur PM10Unsur O3
Unsur NO2 Unsur CO
Nama Bagian Penjelasan
Maplets
Cluster: Menunjukkan jumlah klaster
yang dibentuk
Unified distance matrix Menunjukkan rata- rata jarak
antar nodes pada SOM
Maplets lainnya Merepresentasikan fitur- fitur
yang ada pada data. Setiap fitur
terdapat satu maplets.
Maplet GUI
interaction
1. Nama Maplet
2. SOM node (many data
points)
3. SOM node no data points)
4. Maplet spectrum
Hasil dari analisis yang dilakukan oleh penulis terhadap data yangtelah diolah menghasilkan visualisasi yang ditampilkan masing-masing sesuai dengan atribut (unsur) masing- masing sebagaiberikut
PENGOLAHAN DATA DAN IMPLEMENTASI
Analisis Interaksi terhadap Peta
Berikut ini adalah hasil dari dari visualisasi menggunakan peta. Seperti telah dijelaskan diatasbahwa penulis juga melakukan analisis menggunakan peta menggunakan aplikasi bantuanStatsilk. Terlihat seperti dibawah ini
Dengan hasil pada gambar diatas, maka hasil cluster terlihat dari perbedaan warna yangdidapatkan menunjukkan kondisi dari kualitas udara. Terdapat pilihan terhadap wilayah, terhadapwaktu, dan pilihan berdasarkan parameter tertentu. Pilihan- pilihan tersebut akan mempengaruhihasil peta yang ada ditengah- tengah visualisasi
KESIMPULAN▪ Dalam proses clustering terhadap kualitas udara,
diperlukan nilai ISPU, CO, NO2, O3, PM10, dan SO2untuk dilakukan pengolahan menggunakanalgoritma Self-Organizing Maps dan K-means
▪ Dimulai dari preprocessing data, pelaksanaanmetode Self-Organizing Maps dan K-means yangdilanjutkan dengan proses validasi dan verifikasi danproses visualisasi terhadap hasil jumlah dan bentukklaster
▪ Berdasarkan data yang di praproses kemudiandiklasterisasi dengan algoritma SOM yang telahtervalidasi sehingga didapatkan jumlah klastersebanyak 3 dengan nama Klaster c, d, dan e yangmerupakan bentuk clustering paling optimal. Dandilanjutkan dengan K-means untuk mendapatkanhasil clustering yang presisi dan stabil.
▪ Tingkat akurasi terhadap hasil clustering menggunakan DaviesBouldin Index, Quantization Error dan Topography Errordengan hasil yang paling rendah. Hasil clustering yang didapatsudah sesuai karena nilai DBI terhadap clustering SOM dan K-means lebih rendah daripada menggunakan metodeclustering k-means. Hasil DBI untuk SOM dan K-means adalah1.853457 sedangkan SOM sebesar 2.46322. Hasil QE dan TEuntuk SOM dan K-means adalah 0.285 dan 0.016 sedangkanSOM saja sebesar 0.401 dan 0.042 dan untuk K-means sajasebesar 0.486 dan 0.068.
▪ Pada pembentukan karakteristik yang didapatkan hasildimana hasil clustering kualitas udara pada tahun 2010sampai 2013 tersebut mampu mengetahui lokasi titik rawanpolusi wilayah kota Surabaya. Stasiun pemantau yangmenunjukkan nilai ISPU dengan Predikat Tidak Sehat yangsering terjadi pada Stasiun Pemantau 1 (Surabaya Pusat), 4(Surabaya Selatan), dan 5 (Surabaya Timur). Kondisi rawanpolusi dengan predikat Tidak Sehat sering terjadi disetiapbulannya pada tiga tahun penelitian.
SARAN
▪ Sebaiknya tujuan dari penelitian yangberhubungan dengan kualitas udaradapat dikembangkan lagi tidak hanyauntuk Surabaya saja, namun untukkeseluruhan kota di Indonesia
▪ Sebaiknya atribut yang dilakukanpenelitian tidak hanya atribut utamasaja yaitu unsur atau substansi yangberbahaya, namun atribut yangberhubungan dengan meteorologicaljuga turut disertakan dalam penelitian.
▪ Penelitian ini mempelajari tentang bagaimana memvisualisasikan kondisi kualitasudara di kota Surabaya dengan menggunakan data hasil monitoring yang dilakukanmenggunakan data statis yaitu pada tahun 2010- 2012. Oleh karena itu untukpenelitian selanjutnya terdapat beberapa usulan yaitu
▪ Data yang digunakan bersifat dinamis dengan tidak hanya menggunakan datapada waktu tertentu
▪ Perlunya prediksi kedepan untuk visualisasi titik rawan polusi denganmemperhatikan faktor- faktor yang sudah ditentukan pada penelitian ini dansebelumnya.
TERIMAKASIH