estimasi parameter copula dan aplikasinya pada...
TRANSCRIPT
Estimasi Parameter CopulaDan Aplikasinya Pada Klimatologi
1
Irwan Syahrir (1309 201 001)
Dosen Pembimbing:Dr. Ismaini Zaini, M.SiDr.rer.pol. Heri Kuswanto, M.Si
Latar belakang
2
1. PENDAHULUAN
Analisis Statistik Distribusi Normal
- Masalah lebih mudah dan sederhana- Mudah perhitungan estimasi
Analisis hubunganantara 2 (dua)
variabel
pengukuran dependensi antara variabel
Pearson
Korelasi
Asumsi
-Spearman - Kendall
Kasus distribusitidak normal
3
Latar belakang (lanjutan)
Pendekatan “Copula” Mengapa?
- Mampu mengatasi dependensi variabel yang berdistribusi tak normal- Informasi struktur dependen lebih banyak- Lebih fleksibel : distribusi marginal dari variabel dependen dapat
dibedakan atau bahkan dapat mengetahui distribusi variabel yang tidakdiketahui. (Schölzel ,2008)
Kasus Multivariat kompleks
Penelitian- Biostatistic- Risk management
- insurance/actuaria- Climatology/meteorology, etc
Ketidaknormalan diabaikan dalam perhitungan korelasi
Struktur dependensiStruktur probabilitas fungsi densitas
4
Latar belakang (lanjutan)
hidrology : Favre et al. (2004) dan Genest et al. (2007).
Keuangan dan asuransi : Cherubini et al. (2004) dan Mcneil et al. (2005)
Ekonometrika dan time series: Patton (2002;2009).
Klimatologi : Schölzel (2008).
Schölzel (2008), menjelaskan pola distribusi dan fungsi densitas dari variabelrandom multivariat pada data temperatur, curah hujan dan kecepatan angin.
Penelitian dengan pendekatan Copula :
Sklar (1959)
Theorema Sklar’s Suatu cara untuk menjelaskan struktur dependensi vektor random
Estimasi copula menyatakan bahwa setiap distribusi marginal harus dihitung dan dimasukkan ke dalam estimasi distribusi multivariat
Copula
5
Metode Maximum Likelihood Estimation (MLE).(Choroś et al. ,2010)
EstimasiParameter Copula
Pendekatan model parametrik, semiparametrik dan non parametrik
(Charpentier et.al.,2006)
Kasus Klimatologi
Copula Archimedean
Gumbel Clayton
Aplikasi Geoscience(Embrechts et al.,2001)
6
• Tujuan Penelitian
1. Menentukan estimasi parameter copula archimedean2. Mengaplikasikan pada data klimatologi
Manfaat Penelitian
1. Memperkenalkan metode alternatif yaitu pendekatan copulakhususnya keluarga archimedean, yang dapat diaplikasikan padadata iklim yang distribusinya tidak normal.
• Batasan Masalah
1. Estimasi parameter copula dg pendekatan Kendall’s Tau 2. Parameter Copula gumbel dan Clayton3. Variabel yang dilibatkan hanya dibatasi 2 (dua) variabel atau
bivariat, yaitu data kecepatan angin rata-rata dengan tekananudara diatas permukaan air laut dan kecepatan angin dengan temperatur udara
7
2. Teori Copula
1,.....,
mX XF F
dengan domain
Suatu m dimensi vektor random X dengan fungsi distribusikumulatif marginal (Marginal Cumulative DistributionFunction)
Variabel random multivariat
Asumsi
1( ) 0XF −∞ =
joint distribusi dari vektor random dapatditulis sebagai fungsi dari distribusimarginalnya.
1( ) 1XF ∞ =
1 1( ) ( ( ),...., ( )mX X X X mF x C F x F x=
ℜ Theorema Sklar’s(1959)
fungsi yang menghubungkan margin univariat menjadidistribusi multivariat, dimana fungsi tersebut merupakan fungsidistribusi bersama dari variabel random uniform standarnormal. (Nelsen ,1999)
copula
fungsi distribusi bersama daritransformasi variabel random
( )jj X jU F X= j=1,…,m
1
1 1 10 0
( ,..., ) ... ( ,..., ) ...muu
X m X m mC u u c u u du u= ∫ ∫Distribusi fungsi copula
1 1( ) ( ( ),...., ( )mX X X X mF x C F x F x=
[ ] [ ] [ ]: 0,1 ... 0,1 0,1XC x x →
Uj memiliki distribusi marginal yguniform. Jika distribusi marginalnyakontinu, maka fungsi copula adalah unik(nelsen,2006)
8
( )jj X ju F x=
setiap probabilitas densitas bersama dapatdituliskan sebagai hasil dari probabilitasdensitas marginal dan densitas copula.
1 1 1( ) ( )... ( ). ( ,..., )mX x X m X mf x f x f x c u u=
Fungsi distribusi multivariat dengan marginal uniform standar
Fungsi copula
9
Teorema Sklar’s
Keluarga Copula
Copula Students t
Fungsi densitas copula normal :
10
a. Copula Ellip
b. Copula Archimedian
( )( ) ( )
1 2
1 1, , 1 2
1 2 1 11 2
( ), ( )( , )
( ) ( )X X u u
c u uu u
ρρ
ϕ
ϕ ϕ
− −
− −
Φ Φ=
Φ Φ
Copula ellip Copula normal
( )1 11 2 1 2( , ) ( ), ( )C u u u uρ ρ
− −= Φ Φ ΦFungsi copula normal :
1 2
2 2, , 1 2 1 2 1 222
1 1( , ) exp [ 2 ]2(1 )2 1
X X x x x x x xρϕ ρρπ ρ
= − + − −−
dimana
Fungsi distribusi kumulatif bivariat standar normal dengan korelasi ρ (sklar,1959)
1
2
Karakteristik Copula student’s t
11
Copula Students t
Dalam kasus bivariat copula t dapat dituliskan sebagai berikut:
1 11( ) ( )
1 22
22 2 21 1 2 2
1 22
22( , , , )(1 )
2
2 x 1(1 )
v v dt u t utv
v
v
C u u vv v
x x x x dx dxv
ρπ ρ
ρρ
− −
−∞ −∞
+−
+ Γ =
Γ −
− ++ −
∫ ∫1
v
v
tt
−
dimana ρ adalah koefisien korelasi, ν adalah jumlah derajat bebas.
Contoh pdf dari t-Copula dengan ρ=0,865
dan v = ∞, 5, 2.5 (dari kiri ke kanan).
Copula Archimedian
(i) Clayton (ii) Frank (iii) Gumbel
1X 1 1C ( ,..., ) ( ( ) ... ( ))m mu u u uφ φ φ−= + +Fungsi copula archimedian
fungsi disebut fungsi generator dari copula (Nelsen ,2006)
( ) 1 (Clayton)
1( ) log (Frank)1
( ) ( log ) (Gumbel)
C
F
F
G
C
u
F
G
u u
eue
u u
θ
θ
θ
θ
φ
φ
φ
−= −
−= − = −
φ
12
1X 1 2 1 2C ( , ) ( ( ) ( ))u u u uφ φ φ−= +
Kasus bivariat
3. Estimasi Copula
13
Estimasi parameter copula dapat diperoleh dengan metode MaximumLikelihood Estimation (MLE) (Mikosch ,2006). Dengan mendeskripsikanparameter yang diberikan copula dan distribusi marginal, estimasi ML diperolehdengan memaksimumkan fungsi log likelihood.
1 2 1 1 2 21
( , ,..., ) ( ( ), ( ),..., ( ) ( )d
d d d i ii
f x x x c F x F x F x f x=
= ∏
1 21 2
1 2
( , ,..., )( , ,..., ),...,
dd
d
C u u uc u u uu u u
∂=
∂ ∂ ∂densitas dari
d-dimensi copula 1 2( , ,..., ; )dC u u u θ
1 2 1 1 2 2 1 1 2 2ln ( , ; , ) ln ( ( ; ), ( ; ); ) ln ( ; ) ln ( ; )f x x c F x F x f x f xθ ρ θ θ ρ θ θ= + +
model fungsi likelihood Copula
Menurut Genest dan rivest (1993) untuk mengkonstruksiestimasi parameter COPULA dapat menggunakan observasinilai Kendall’s tau
1
0
( )1 4( )u duu
φτφ
= +′∫
4. Estimasi Parameter Copula Archimedean
Cφ Fungsi generator Copula Archimedean
- Cuaca (weather) - Iklim (climate) besaran unsur fisika atmosfer
unsur cuaca atauunsur iklim
- penerimaan radiasimatahari
- suhu udara- kelembaban udara- tekanan udara- Kecepatan angin
- arah angin- penutupan awan- presipitasi (embun, hujan, salju) - evaporasi.
Cuaca keadaan udara pada saat tertentu dan di wilayah tertentu yang relatif sempit dan pada jangka waktu yang singkat.
Iklim keadaan cuaca rata-rata dalam waktu satu tahun yang dilakukandalam waktu yang lama dan meliputi wilayah yang luas.
Pengertian Cuaca dan Iklim
15
Tekanan udara adalah suatu gaya yang timbul akibat adanya berat dari lapisan udara.Besarnya tekanan udara di setiap tempat pada suatu saat berubah-ubah. Makin tinggisuatu tempat dari permukaan laut, makin rendah tekanan udaranya. Besarnya tekananudara diukur dengan barometer dan dinyatakan dengan milibar (mbar).
Angin adalah udara yang bergerak dari daerah bertekanan udara tinggi ke daerahbertekanan udara rendah. Kecepatan angin dapat diukur dengan suatu alat yangdisebut Anemometer
Temperatur Udara adalah tingkat atau derajat panas dari kegiatan molekul dalamatmosfer yang dinyatakan dengan skala Celcius, Fahrenheit, atau skala Reamur.
16
Dari pengertian diatas dapat diketahui bahwa antara tekananudara,kecepatan angin dan temperatur udara saling berhubungan.Perbedaan tekanan udara di suatu daerah akan mengakibatkanadanya pergerakan angin dari daerah yang bertekanan tinggi kedaerah yang bertekanan rendah.
17
5. Metodology
Data klimatologi
Kecepatan angin rata-rata (km/jam)
Tekanan udara diatas permukaan air laut (mbar)
Sumber data
Stasiun Surabaya/Perak Data observasi harian
Tahun 2005-2009Sampel : 1691 pengamatan
Aplikasi data
Temperatur udara ( C)0
τ
τ
Variabel penelitian:Kajian teori
18
A. Tujuan pertama
• Mendefinisikan fungsi distribusi bersama variabel random.
• Menentukan fungsi distribusi Copula untuk kasus bivariat.
• Menentukan fungsi likelihood Copula
• Mengestimasi parameter fungsi Copula dengan metode Maximum Likelihood Estimation (MLE).
• Mengestimasi parameter Copula Archimedean untuk keluarga Gumbel dan Clayton dengan pendekatan
Kendall’s Tau
B. Tujuan kedua:• Membuat scatter plot antara kedua variabel yaitu :
i. Kecepatan angin rata-rata dan tekanan udara
ii. Kecepatan angin rata-rata dan temperatur udara
• Menguji ketaknomalan data dengan menggunakan histogram dan uji Kolmogorov-Smirnov
• Menghitung parameter dependensi antara kedua variabel dengan observasi nilai Kendall’s Tau
• Menghitung parameter pada Copula Archimedean khususnya Copula Gumbel dan Copula Clayton .
• Menentukan estimasi fungsi Copula Archimedean pada keluarga Clayton dan Gumbel.
Metodology (lanjutan)
19
5. Hasil dan Pembahasan
1 2 1 1 2 2( , ) { ( ), ( )}F x x C F x F x=
Nelsen (2006)
Fungsi distribusi bivariat
1 11 2 1 1 2 2 1 2( , ) { ( ), ( )}, , [0,1]C u u F F u F u u u− −= ∈
Transformasi
Fungsi copula
21 2
1 2 1 21 2
( , )( , ) , , [0,1]C u uc u u u uu u
∂= ∈
∂ ∂
Fungsi densitas copulabivariat1 2 1 1 2 2 1 1 2 2 1 2( , ) { ( ), ( )} ( ) ( ) , , f x x c F x F x f x f x x x= ∈
Copula untuk Kasus Bivariat
20
1 2 1 1 2 2 1 1 2 21{ ( ), ( )} ( ) ( )
n
u uiL c F x F x f x f x
== Π
1 2 1 1 2 2 1 1 2 2ln ( , ; , ) ln ( ( ; ), ( ; ); ) ln ( ; ) ln ( ; )f x x c F x F x f x f xθ ρ θ θ ρ θ θ= + +
no closed form
Fungsi likelihood Copula
numerik
Observasi Kendall’s Tau.Estimasi
parameter copulaNelsen (2006)
MLE
21
Hasil dan Pembahasan
21
1
0
( )1 4'( )Cu duu
φτφ
= + ∫
Estimasi Parameter Copula Archimedean
( )uφ Fungsi generator copula
21
1
0
1
10
( )1 4( )
( 1) / =1+42
C
C
c C
C
u duu
u duu
θ
θ
φτφ
θ θθ
−
− −
= +′
−=
− +
∫
∫
1
0
1
10
( )1 4( )
1( log ) =1+4( log( )) /
G
G
G
G G
u duu
u duu u
θ
θ
φτφ
θθ θ−
= +′
−−=
− −
∫
∫
Gumbel: Clayton :
1(1 )Gθ τ
=−
21Cτθτ
=−
22
Family Copula (Cθ)Parameter range
Clayton
Gumbel
1
1 2 1 2( , ) ( 1)ClC u u u uθ θ θθ
− −= + − [ ] { }1, \ 0θ ∈ − ∞
( )1
1 2 1 2( , ) exp (log ) (log )GuC u u u uθ θ θθ
= − +
[ ]1,θ ∈ ∞
Fungsi Copula Keluarga Archimedean Versi Bivariat
Sumber : Schmidt (2006)
23
5. Hasil dan Pembahasan (lanjutan)
Aplikasi Copula
. Plot-plot yang terkonsentrasi dalam satu area menunjukkan adanya korelasi yangberdekatan. Sedangkan plot-plot yang outlier menunjukkan hubungan yang sangatjauh antar kedua variabel. Hubungan dependensi antar kedua variabel tidak dapathanya dideskripsikan dengan korelasi pearson karena banyaknya outlier padascatter plot. Untuk mengatasi hal tersebut maka struktur dependensi dapatdijelaskan dengan korelasi yang berbasis pada rank yaitu korelasi kendall tau atauspearman.
Scatter plot wind ave vs SLPScatter plot wind ave vs T mean
VariabelKolmogorov-Smirnov
Statistic df Sig.Wind_ave 0,064 1691 0,000SLP 0,046 1691 0,000T mean 0.037 1691 0,029
Histogram Wind Ave (kecepatan angin, km/jam) Histogram SLP(Tekanan udara, Mbar)
24
Uji Kenormalan
25
b. Temperatur udara (T mean- 0C)
Histogram T mean (Temperatur udara, 0C)
26
Grafik distribusi bivariat antara kecepatan angin dan tekanan udara
27
Grafik distribusi bivariat antara kecepatan angin dan temperatur udara
kedua variabel adalah dependen, meskipun tingkat dependensinya kecil. Plot antarkeduanya menunjukkan terkonsentrasi pada beberapa ruang interval yaitu pada ujungscatter, tetapi pada bagian interval tertentu diantara keduanya plot tidak jelas. Bagianplot yang tidak jelas mengindikasikan tail dependence. Dari sini dapat didefinisikanbeberapa copula yang memiliki karakteristik bentuk tail dependence.
28
Scatter plot rank antara Wind_ave dengan SLP pada transformasi uniform [0,1]
Scatter plot rank antara Wind_ave dengan T_mean pada transformasi uniform [0,1]
Transformasi ke distribusi marginal uniform pada domain [0,1]
29
Scatter plot rank bivariat sampel randomdari keluarga Gumbel dan Clayton
dengan θ = 2
Gumbel Copula Clayton Copula
Copula Gumbel Copula Clayton
Scatter plot rank bivariat sampel random dari keluarga Gumbel dan
Clayton dengan θ =4
30
Gumbel Copula Clayton Copula
Gumbel CopulaClayton Copula
Scatter plot rank bivariat sampel random dari keluarga Gumbel
dan Clayton dengan θ =10
Scatter plot rank bivariat sampel random dari keluarga Gumbel
dan Clayton dengan θ = 6
Pearson Kendall Spearman
Correlation 0,1397741 0,1281978 0,1838372
p-value 7,84 x 10-9 7,772 x 10-15 2,554 x 10-14
31
Sebelum melakukani fitting model copula maka terlebih dulu mengestimasi koefisienkorelasi dari kedua variabel tersebut dengan 3 metode, yaitu Pearson, Spearman danKendall.
α <0,05
Tabel pengukuran korelasi wind_ave vs SLP
Pearson Kendall Spearman
Korelasi 0,2069568 0,1474547 0,2120737
p-value 2,2 x 10-16 2,2 x 10-16 2,2 x 10-16
Tabel pengukuran korelasi wind_ave vs T mean
32
2= 12(0,1281978) 1 0,1281978
= 0,294098
cτθτ−
=−
11
1 = 1 0,1281978
= 1,147049
Gθ τ=
−
−
Perhitungan parameter copula berbasis Kendall’s Tau
Kecepatan angin vs tekanan udara
Kecepatan angin vs temperatur udara
2= 12(0,1474547) 1 0,1474547
= 0,345213
cτθτ−
=−
11
1 = 1 0,1474547
= 1,172958
Gθ τ=
−
−
Parameter copula clayton Parameter copula gumbel
Parameter copula clayton Parameter copula gumbel
33
• Copula Clayton
1
1 2 1 21
0,294098 0,294098 0,2940981 2 1 2
( , ) ( 1)
( , ) ( 1)
Cl
Cl
C u u u u
C u u u u
θ θ θθ
θ
− −
− −
= + −
= + −
A. Kecepatan angin dan tekanan udara B. Kecepatan angin dan tekanan udara
• Copula Gumbel
( )1
1 2 1 2( , ) exp (log ) (log )GuC u u u uθ θ θθ
= − +
( )1
1,147049 1,147049 1,1470491 2 1 2( , ) exp (log ) (log )GuC u u u uθ
= − +
• Copula Clayton
• Copula Gumbel
1
1 2 1 2( , ) ( 1)ClC u u u uθ θ θθ
− −= + −
10,345213 0,345213 0,345213
1 2 1 2( , ) ( 1)ClC u u u uθ− −= + −
( )1
1 2 1 2( , ) exp (log ) (log )GuC u u u uθ θ θθ
= − +
( )1
1,172958 1,172958 1,1729581 2 1 2( , ) exp (log ) (log )GuC u u u uθ
= − +
Fungsi Copula
34
Estimasi parameter θ dan nilai loglikelihood dihitung untukmengetahui model struktur dependensi yang terbaik pada copula
Copula Estimate Std. error Z Log likelihood
Gumbel 1.112993 0.01904045 58.45411 22.87724
Clayton 0.1703254 0.03308843 5.147582 15.99025
Tabel Model Fitting Untuk Copula Archimedean Untuk Kecepatan Angin Dan Tekanan Udara
Copula Estimate Std. error Z Log likelihood
Gumbel 1,138937 0.01967057 57,90054 32.83936
Clayton 0.2613921 0.03432309 7.615633 37.29556
Tabel Model Fitting Untuk Copula Archimedean Untuk Kecepatan Angin Dan Temperatur Udara
Modelterbaik
Modelterbaik
35
A. Kecepatan angin dan tekanan udara
B. Kecepatan angin dan tekanan udara
Copula Gumbel( )
1
1 2 1 2( , ) exp (log ) (log )GuC u u u uθ θ θθ
= − +
( )1
1,147049 1,147049 1,1470491 2 1 2( , ) exp (log ) (log )GuC u u u uθ
= − +
Copula Clayton
1
1 2 1 2( , ) ( 1)ClC u u u uθ θ θθ
− −= + −1
0,345213 0,345213 0,3452131 2 1 2( , ) ( 1)ClC u u u uθ
− −= + −
Fungsi Copula Model terbaik
36
Scatter plot rank dari Copula Gumbel untuk variabel random
dengan parameter θ = 1,147049
Scatter plot rank antara Wind_ave dengan SLP pada transformasi
uniform [0,1]
37
Scatter plot rank dari Copula Clayton untuk variabel random
dengan parameter θ = 0,345213
Scatter plot rank antara Wind_ave dengan T_mean
pada transformasi uniform [0,1]
Kesimpulan
38
1. Variabel kecepatan angin rata-rata (wind_ave) dan tekanan udara diatas
permukaan air laut (SLP) memiliki distribusi yang tidak normal.
2. Copula archimedean dapat digunakan untuk menjelaskan struktur
dependensi kedua variabel iklim tersebut.
3. Copula Archimedean dari keluarga Gumbel merupakan model terbaik
untuk menjelaskan struktur dependensi antara variabel kecepatan angin
rata-rata dan tekanan udara diatas permukaan air laut.
4. Copula Clayton merupakan model terbaik untuk variabel kecepatan angin
rata-rata temperatur udara
39
Saran
1. Dalam penelitian ini peneliti menghitung estimasi parameter Copula
Archimedean dengan pendekatan parametrik, padahal seringkali
kasus yang muncul dalam analisis data adalah pola distribusi data
termasuk katagori non parametrik. Oleh karena itu perlu adanya
perhitungan estimasi dengan pendekatan non parametrik.
2. Perlu juga adanya penelitian pembanding dalam perhitungan estimasi
dengan menggunakan keluarga Copula yang lain, misal: Copula Ellip
yang meliputi Copula Normal dan Copula Student’s t.
3. Pada penelitian ini struktur dependensi antara kedua variabel dalam
bentuk scatter plor rank tidak terlalu kelihatan dengan jelas karena
dimungkinkan jumlah sampel data hanya pada observasi selama 5
tahun. Oleh karena itu pada penelitian berikutnya perlu ditambah
sampel penelitian hingga 10 tahun atau lebih.
Terima Kasih
40