prediksi numerik
TRANSCRIPT
PREDIKSI Metode Data Mining
1 Data Warehouse & Data Mining
oleh
Aty Rachmawati
Aini Hanifa
Ridwan Effendi
Outline
Metode Prediksi
◦ Analisis Regresi
◦ CART
Penerapan di BI
Implementasi Tools
2 Data Warehouse & Data Mining
Klasifikasi vs Prediksi
KLASIFIKASI PREDIKSI
Memprediksi label
kategorik (diskrit & tak
terurut)
Prediksi Kategorik
Memprediksi label
numerik (kontinu &
terurut)
Prediksi Numerik
3 Data Warehouse & Data Mining
Baik/Buruk
Tipe A/B/C
Aman/Berisiko
Seberapa aman?
Seberapa berisiko?
Berapa jumlah
pendapatan?
Prediksi Numerik
Prediksikan
berapa besar
penghasilan yang akan
diterima karyawan
dengan masa kerja 15
tahun
Data Warehouse & Data Mining 4
Contoh:
Diberikan data berikut
Regresi Linear
Regresi Nonlinear
Model berbasis regresi lainnya
◦ CART (Classification and Regression Tree)
Metode Prediksi Numerik
5 Data Warehouse & Data Mining
Regresi Linear
Regresi Nonlinear
Model berbasis regresi lainnya
• CART(Classification and Regression Tree)
Analisis Regresi
Memodelkan hubungan antara satu atau
lebih variabel prediktor (independent var.)
dan sebuah variabel respons (dependent
var.)
• Regresi Linear Sederhana
• Regresi Linear Multivariabel
• Regresi Nonlinear
6 Data Warehouse & Data Mining
Contoh Regresi Linear
Data Warehouse & Data Mining 7
Tujuan: mencari persamaan linier (garis lurus) terbaik yang
menggambarkan data di atas.
Metode Least Square
Data Warehouse & Data Mining 8
}𝒆𝒏
} 𝒆𝟒 } 𝒆𝟑 } 𝒆𝟐
} 𝒆𝟏
𝑦 = 𝑤1𝑥 + 𝑤0 Metode untuk
meminimalkan
error titik data
terhadap model
regresi
Luaran:
Koefisien
regresi
Regresi Nonlinear
Menerapkan transformasi pada variabel-
variabel menjadi model regresi linear
Contoh:
𝑌 = 𝑒𝑤1𝑥+𝑤0
ln(𝑌) = 𝑤1𝑥 + 𝑤0
9 Data Warehouse & Data Mining
CART
Classification Tree Regression Tree
Data Warehouse & Data Mining 10
Penerapan di BI (lanj)
Memprediksi gaji lulusan perguruan tinggi
dengan x tahun pengalaman kerja
11 Data Warehouse & Data Mining
Penerapan di BI (lanj)
12
Memprediksi berapa lama waktu yang
diperlukan untuk mengantarkan pesanan
berikutnya dengan jarak sekian kilometer
Jarak
(km)
Waktu
(menit)
0,5 9,95
1,1 24,45
1,2 31,75
5,5 35
2,95 25,02
2 16,86
3,75 14,38Data Warehouse & Data Mining
Penerapan di BI (lanj)
Memprediksi kemajuan syaraf motorik
dan skor total dari orang yang mengalami
penyakit parkinson stadium awal dengan
pengukuran suara biomedis
13 Data Warehouse & Data Mining
Deskripsi Data
Data kriminalitas US 1995 (FBI)
Variabel Respon :total number of violent crimes per 100K popuation
Data Warehouse & Data Mining 14
Model Prediksi
Why?
CART dapat melakukan model prediksi
yang memiliki variable respon kontinu
Sederhana, mudah dipahami
Variable prediktor kategorik dan kontinu
Data Warehouse & Data Mining 15
Pra Prosesing Data
Seleksi atribut
Missing value
Data Warehouse & Data Mining 16
Hasil Prediksi
Root Mean Square Error=
480.706823727564
Mean Absolute Error= 315.266224317104
Relative Absolute Error=
0.796029235366585
Data Warehouse & Data Mining 17