..::Data Mining::..Prediksi
Data Mining-Prediksi-Adam AB
Prediksi
Mata Kuliah
Data warehouse
Univ. Darma Persada
Oleh:
Adam Arif Budiman
2012
Prediksi
• Dalam estimasi kita memperkirakan suatu hal misalnya rata-rata populasi dari sampel.
• Estimasi dilakukan berdasarkan sampel
Data Mining-Prediksi-Adam AB 2
• Estimasi dilakukan berdasarkan sampel yang ada di tangan kita
• Prediksi?
Prediksi (lanj)
• Dalam prediksi kita menggunakan data
yang ada di tangan kita untuk memprediksi
hasil dari satu hal baru yang akan muncul
selanjutnya.
• Jadi estimasi dilakukan untuk
Data Mining-Prediksi-Adam AB 3
• Jadi estimasi dilakukan untuk
memperkirakan hal yang tidak kita ketahui
(rata-rata populasi, varians populasi)
• Prediksi memperkirakan hasil dari hal yang
belum terjadi. Kita dapat menunggu hingga
hal tersebut terjadi untuk membuktikan
seberapa tepat prediksi kita.
Prediksi (lanj)
• Dalam statistika dikenal dua cara untuk memprediksi yaitu dengan cara regresi linear dan regresi linear berganda
Data Mining-Prediksi-Adam AB 4
Regresi linear
• Bila diketahui data sbb:
• Berapa lama waktu yang diperlukan untuk mengantarkan pesanan yang ke 26 dengan jarak
Data Mining-Prediksi-Adam AB 5
yang ke 26 dengan jarak sekian kilometer?
Regresi Linear (lanj)
• Terdapat dua jenis regresi yaitu:
1. Regresi linear sederhana � hanya melibatkan satu variabel pemberi pengaruh
Data Mining-Prediksi-Adam AB 6
pengaruh
2. Regresi linear berganda � melibatkan lebih dari satu variabel pemberi pengaruh
Regresi (lanj)
• Variabel: besaran yang berubah nilainya
• Variabel �variabel pemberi pengaruh (sebab)
• � variabel terpengaruh
Data Mining-Prediksi-Adam AB 7
• � variabel terpengaruh (akibat)
• Contoh: jarak toko dan waktu tempuh
� jarak sebagai sebab, waktu yang
diperlukan sebagai akibat.
Regresi Linear Sederhana (lanj)
• Grafik pada data pada slide 5 bila digambarkan akan seperti di bawah ini.
• Bagaimana kecenderungan titik di grafik tersebut?
jarak vs waktu
80
Data Mining-Prediksi-Adam AB 8
0
10
20
30
40
50
60
70
80
0 2 4 6 8
jarak
wak
tu
Regresi linear sederhana (lanj)
jarak vs waktu
50
60
70
80w
ak
tu
Data Mining-Prediksi-Adam AB 9
0
10
20
30
40
0 2 4 6 8
jarak
wak
tu
Regresi linear sederhana (lanj)
• Regresi linear sederhana merupakan yang menggunakan garis lurus untuk menggambarkan hubungan diantara dua variabel atau lebih.
Data Mining-Prediksi-Adam AB 10
dua variabel atau lebih.
• Dari kasus ini variabel tersebut adalah jarak dan waktu, dengan jarak sebagai sumbu x (dalam km), waktu
sebagai sumbu y (dalam menit)
Regresi linear sederhana (lanj)
• Kita mencari garis yang mendekati titik-titik sehingga garis tersebut dapat dijadikan acuan untuk prediksi titik berikutnya
• Secara umum garis tersebut dapat
Data Mining-Prediksi-Adam AB 11
• Secara umum garis tersebut dapat dituliskan dalam bentuk persamaan garis
� Y = β0
+ β1X
Regresi linear Sederhana (lanj)
• Y = variabel terpengaruh
• β0
= konstanta
• β1
= gradient garis
• X = variabel pemberi pengaruh
Data Mining-Prediksi-Adam AB 12
• X = variabel pemberi pengaruh
Regresi linear sederhana (lanj)
• Bagaimana cara mencari garis regresi yang paling baik?
• Menghitung konstanta (β0) dan gradient
(β1) dengan rumus:
Data Mining-Prediksi-Adam AB 13
jarak vs waktu
0
10
20
30
40
50
60
70
80
0 2 4 6 8
jarak
waktu
Regresi linear sederhana (lanj)
• Dengan rumus
di atas, maka
hasil
perhitungan
pada tabel
jarak dan
Data Mining-Prediksi-Adam AB 14
jarak dan
waktu
menjadi:
Regresi linear sederhana (lanj)
β1 =
2745.81- (752.42) (82.94)
25
353.18 - (82.94)2
25
= 4.35
Data Mining-Prediksi-Adam AB 15
β0 = 29.02 – 4.35 (3.32) = 14.58
• Sehingga persamaan regresinya adalah :
Y = 14.58 + 4.35x
Regresi linear sederhana (lanj)
• Pengetahuan apa yang bisa diperoleh dari pengolahan data di atas?
�Kita bisa memprediksikan waktu tempuh pengiriman pesanan sama dengan 14.58 menit ditambah 4.35 kali jarak rumah
Data Mining-Prediksi-Adam AB 16
menit ditambah 4.35 kali jarak rumah pelanggan
�Misal, pelanggan ke 26 berjarak 1.5 km maka waktu tempuh adalah
Y = 14.58 + (4.35) (1.5)
= 21.1 (menit)
Regresi linear berganda
• Bagaimana bila variabel masukan/pemberi pengaruh lebih dari satu?
• � k buah variabel
• Y = β0
+ β1X1 + β
2X2 + … + β
kXk
Data Mining-Prediksi-Adam AB 17
• Y = β0
+ β1X1 + β
2X2 + … + β
kXk
• Bila kita memiliki (k+1) buah persamaan sementara variabel yang tidak kita ketahui juga sebanyak (k+1) maka persamaan di atas bisa menjadi ….
Regresi linear berganda (lanj)
Data Mining-Prediksi-Adam AB 18
Regresi linear berganda (lanj)
• Y = β0
+ β1X1 + β
2X2 + … + β
kXk
• Bila kita isikan data pada tabel di atas makaakan diperoleh persamaan
• 25β0
+ β1(206) + β
2(82.94) = 725.42
• β0(206) + β
1(2396) + β
2(771.77) = 8001.67
Data Mining-Prediksi-Adam AB 19
• β0(206) + β
1(2396) + β
2(771.77) = 8001.67
• β0(82.94) + β
1(771.77) + β
2(353.18) = 2745.81
• Ketiga persamaan di atas diselesaikansehingga diperoleh nilai β0 = 2.31, β1 = 2.74, β2 = 1.24
Regresi linear berganda (lanj)
• Sehingga persamaan umum model di atas
adalah :
Y = 2.31 + 2.74X1 + 1.24X2
• Pengetahuan apa yang bisa diperoleh?
Data Mining-Prediksi-Adam AB 20
• Pengetahuan apa yang bisa diperoleh?
• Kita bisa memprediksi bahwa bila kita
mengantarkan pesanan maka akan diperoleh
waktu sama dengan 2.31 menit ditambah 2.74
kali banyaknya lampu merah yang ditemui dan
ditambah 1.24 kali jarak rumah pelanggan
Regresi linear berganda (lanj)
• Bila jarak rumah pelanggan ke – 26 adalah 1.5 dari restoran dan akan melewati lampu merah 1 buah maka waktu hantar adalah 6.91 menit
Data Mining-Prediksi-Adam AB 21
Lampiran 1 menyelesai
kan persamaan
regresi
Data Mining-Prediksi-Adam AB 22
Data Mining-Prediksi-Adam AB 23
Data Mining-Prediksi-Adam AB 24
latihan• Buatlah
persamaan regresi dan simpulkan pengetahuan yang
Data Mining-Prediksi-Adam AB 25
yang diperoleh
referensi
Data Mining-Prediksi-Adam AB 26