sigorta sektöründe tahmin modellemesi uygulama alan örnekleri
TRANSCRIPT
Sigorta Sektöründe
Tahmin Modellemesi
Uygulama Alan Örnekleri
BALKIR DEMİRKAN – ARALIK 2012
İçerik
Tahmin Modellemesi Nedir ?
Modelleme Neden Önemlidir ?
Model Geliştirme Metodları
GLM
Karar Ağacı
Logistic Regresyon
Bu Metodu Hayata geçirmek ne tip riskler içerir ?
Modellerin Basitleştirilmiş yaşam döngüsü ve önemli noktalar.
Uygulamacılar Tahmin Modellemesi Nasıl Uygulayabilirler ?
Tahmin Modellemesi Nedir ?
Tahmin modellemesi özetle data mining’in bir
şeklidir. Data mining ise gözlemlenebilir data
setlerinin fark edilmeyen ilişkilerini bulan ve açık bir biçimde ifade edilebilen datalar haline getiren bir
çalışmadır. Tahmin modellemesi ise bu ilişkileri alan
ve geleceğe yönelik olarak görselleştiren
modellerdir.
Tahmin Modellemesi Nedir ?
Data analizlerine dayalı olarak muhtemellikleri ve
trendler ile ilgili alanları tanımlama olarak ifade
edilebilir.
Tahmin Modellemesi, gelecekteki davranış ve
sonuçlara dayalı olarak, bir dizi değişken ve
öncülerin bulunmasıdır.
Konu benzeri uygulamalara, Bankalardaki kredi
skorlaması, IT’deki spam maillerin otomatik tespiti,
CRM uygulamaları verilebilir.
Tahmin Modellemesi Nedir ?
Sigortacılık için tahmin modellemesi ise riske uygun
fiyatlama yapılabilmesidir.
Tahmin modellemesinden beklenen en büyük çıktı ya da en büyük fayda beklentisi,
organizasyondaki tüm birimlerin harmonize
biçimde çalışması ile mümkündür.
Tahmin modellemesi, sigorta şirketleri için bir
arabadaki otomatik vites’e benzetilebilir.
Modelleme Neden Önemlidir ?
Mevcut ilişkili fiyatlama yapısını genişletmesi ve
desteklemesi nedeni ile,
Baz fiyat ayarlamalarının tutarlı bir biçimde uygulanabilmesi sebebi ile,
Risk bazında fiyatlamanın ince ayarının yapılması
esnekliğini sağlanması sebebi ile,
Operasyonlardaki en iyi sonucu verebilecek
çıktıların değerlendirilmesindeki desteği sebebi ile,
Sigortacılığın Hangi Ana
Konularında Modelleme
Kullanılabilir ?
Fiyatlama Modellemesi,
Manuel fiyat optimizasyonlaması,
Risk skorlamasına göre fiyatlama,
Yenileme analizi,
Tarife sınırlamasının teyidi,
Hedef Pazar Analizi,
Sigortacılığın Hangi Ana
Konularında Modelleme
Kullanılabilir ? Hasar Yönetimi ve Rezervleme,
- Rezervleme metotlarının genişletilmesi, bölgesel,
zaman bazlı, sebep bazlı rezervleme modelleri,
- Modele dayalı hasar durdurma analizleri,
- Eksper atama, ilk hasar rezerv tahmini modelleri,
teminat dışı durum önerme modellemesi,
Sahte Hasar ve Yönetimi,
Model Geliştirme
İşlem yapılacak dataya göre uygulanabilecek bir
çok model mevcuttur. Ancak en uygun model
kullanılacak program ve dataya bağlıdır. Günümüzde en yaygın ve en çok kullanılan
modelleme tekniği GLM (Generalized Linear
Modeling)’tir.
Diğer yaygın modelleme yöntemleri Karar Ağacı
Yöntemleri ve Lojistik Regresyondur. En çok bilinen
yöntemler bunlar olmakla birlikte yegane
modelleme yöntemi değildirler.
GLM
Genel Doğrusallaştırılmış Modelleme olarak Türkçe
karşılığı olan bu yöntem ile büyük bir data kitlesini
aynı ölçütler ile yaşam süreleri, hasar bilgileri,muallak bilgileri ile analiz yapılacak ve tarifede
kullanılabilecek diğer boyutların eklenmesi ile
analizi yapılır. Olası ilişkili olabilecek tarife boyutları
datalar (class’lar) hazırlanır iken data setlerinde
yer almalıdır. Daha sonra çıktıları etkileyecek olan
boyutların ilişki kuvvetleri, sapmaları, dağılımları ve
homojenlikleri test edilerek dataların doğruluğu,
çıktıların gerçek sonuçları ile karşılaştırılır.
GLM
Modeli doğrusal hale getirecek değişkenlikler
temizlenir. Kuvvetli olamayan ilişkiler model sınırları
içerisinde göz ardı edilir. Sonuç itibarı ile bir datagrubu içerisindeki ilişkili olabilecek noktaların ilişki
kuvvetleri ölçülür ve model içerisindeki yeri ve
kuvveti tespit edilir. Daha sonra datayı ağırlıklı
olarak ilgili noktaların ağırlıklı merkezinde yer alan
noktaya göre ağırlıklı uzaklıklarına bakılarak
tarifedeki katsayıları ile alınması gerekli pure prim
yahut yüklemeli primler modelden alınır.
GLM – Fiyatlama Örneği
Değe
r Class
Sigortalı
Adedi Prim
Hasar
Adedi
Hasar
Maliyeti
3 1 2757520 159108 217151 63191
3 2 130535 7175 14506 4598
3 3 247424 15663 31964 9589
3 4 156871 7694 22884 7964
3 5 64130 3241 6560 1752
2 1 130706 7910 13792 4055
2 2 7233 431 1001 380
2 3 15868 1080 2695 701
2 4 17707 888 3054 983
2 5 4039 209 487 114
1 1 163544 9862 19346 5552
1 2 9726 572 1430 439
1 3 20369 1382 3546 1011
1 4 21089 1052 3618 1281
1 5 4869 250 613 178
0 1 273944 17226 37730 11809
0 2 21504 1207 3421 1088
0 3 37666 2502 7565 2383
0 4 56730 2756 11345 3971
0 5 8601 461 1291 382
Data Seti
Değişken Tanımı
Değer Sigorta Primini oluşturan etken
3 - Sürücü ehliyetli ve 3 yıldan
fazladır hasarsız
2 - ehliyetli ve 2 yıldan fazladır
hasarsız
1 - Ehliyetli ve 1 yıldan uzun süreli
hasarsız
0 - Diğer tümü
Class 1 - Şahsi kullanım, 25 yaş altı erkek
sürücü yok
2 - pleasure, non-principal male
operator under 25 Şahsi kullanım,
25 yaş altı erkek sürücü olabilir
3 - İş için kullanım
4 - Bekar sürücü yada 25 yaş altı
sürücü
5 - Evli sürücü yada 25 yaş altı
erkek olmayan sürücü
Sigortalı Kazanılmış araç yaşı
Prim Kazanılmış prim ( 000 USD)
Hasar Hasar Adedi
Hasar Maliyeti Toplam Hasar maliyeti ( 000 USD)
GLM – Fiyatlama Örneği
Analiz için hasar adetleri için Poisson regresyonu
kullanılarak ilişkilere bakıldığında;
Glm ( Formül= Hasarlar/Sigortalı ~ değer + Class, Aile = "poisson", Ağırlığı= sigortalı) dır.
Basitçe bir önceki slayttaki Class ve değerler
sigortalı ağırlığına göre poisson dağımına
bakılmalı, sonuçta class 1 ile hiç hasarsızlığı
olmayan 0 grubun ilişkisinin kuvveti görülmelidir.
1 2 3 4 5
0 10,256 - 6,093 - 3,374 - 1,079 - 2,776
1 5,376 - 1,656 - 2,625 - 7,064 - 2,886
2 0,886 - 0,669 0,749 - 1,496 - 1,668
3 - 5,981 3,807 2,344 1,163 2,675
GLM – Fiyatlama Örneği
Birden çok değişkenin ilişkileri ve ilişki kuvvetleri ile
ana model oluşturulur. Data havuzunun ağırlığını
teşkil eden; (3-1)
«3 - Sürücü ehliyetli ve 3 yıldan fazladır hasarsız ve 1 -
Şahsi kullanım, 25 yaş altı erkek sürücü yok» data
ağırlığının merkezi ise ve 100 değerinde ise;
( 3-2)noktasında ilişki kuvvetine göre % 2,3 ilave
hasar maliyeti gerekir sonucu çıkacaktır.
http://www.actuaries.org/LIBRARY/ASTIN/vol39no1/61.pdf
GLM – Rezervleme Örneği Rezervleme de kullanılan CL (AZMM) doğru bir
tahminleme yapıyor mu ?
http://www.statsoft.com/textbook/general-linear-models/
http://www.brainvoyager.com/bvqx/doc/UsersGuide/WebHelp/Conten
t/StatisticalAnalysis/The_General_Linear_Model.htm
GLM – Rezervleme Örneği
AZMM bir gelişim katsayısı gelişimine bakar iken,
GLM ise uzun süreli bir gözlem aralığının
Genelleştirilmiş bir lineer modelden uzaklığına bakarak analizini yapmakta.
log Y = X 𝛽 + e,
Regresyon analizi ile t = dosya sonlanmasındaki
operasyonel zaman, k = Dosyanın sonlandığı kaza
yılı ile ödeme yılını, i= kaza yılını, J = ödeme
çeyreğini gösterir.
log Yr= fonksiyon(ir,jr,kr,tr) + Standart Hata
GLM – Rezervleme Örneği
30 Eylül 2003 itibarı ile rezerv
Hasar Yılı Çeyreği GLM8 çeyreklik AZMM
Eyl 94 - Ara 98 283 200
Mar 99 - Mar 02 1,122 1,174
Oca.02 154 183
Eyl.02 159 199
Ara.02 160 201
Mar.03 173 206
Haz.03 179 192
Toplam 2,229 2,354
http://www.casact.org/pubs/dpp/dpp04/04dpp327.pdf
http://www.actuaries.org/LIBRARY/ASTIN/vol39no2/453.pdf
Karar Ağacı Metodu
Bu metoda “karar ağacı analizi” (decision treeanalysis) terimi yerine, “karar analizi” (decisionanalysis), “risk analizi” (risk analysis) gibi terimler dekullanılmaktadır. Karar ağacı analizi veya kararanalizi, risk analizine göre daha kapsamlıdır; zirakarar analizinde, yalnız tarafların gelecektekarşılaşma ihtimali olan riskler ve belirsizlikler değil,kendi iradeleriyle alabilecekleri kararlar dadeğerlendirilir. Karar analizi aynı zamanda, bilgitoplamak ve prim tekliflerini belirlemek için dekullanılır. Buna göre bir karar ağacında, verilecekbelirli bir kararın sonuçlarını inceleyen “karardüğümü” ile daha sonraki sonuçları etkileyecek“şans düğümleri” bulunur.
http://www.statsoft.com/textbook/classification-
trees/?button=1
Karar Ağacı Metodu için
Basit Örnek
Olay: Bir sigortalı ya da mağdurun açacağı
davanın kazanılması ya da en yüksek çıktı
faydasının sağlanması. Modelin geliştirilmesi:
Model: Hasar Maliyeti olarak en az maliyet üretebilecek biçimde olmalıdır.
Modelleme sürecini iyi belirlemek için zaman boyunca olası olayların sırasını gösteren bir karar ağacı oluşturulmalıdır.
Karar Ağacı Metodu –
Hukuk Yönetim Örneği
Karar Ağacı Metodu için
Hukuk Yönetim Örneği
Her bir karar düğümünün sırası ve istatistiki olarak
gerçekleşme olasılıkları çıkartılır,
Dava yolu ile talep edilen tazminat tutarı, hasar ve dava dosyasındaki niteliklere göre davaların
kazanılma ya da kaybedilme olasılıklarını büyük
ölçüde sağlamaktadır. Bu durumda sulh olmak
durumunda elde edilecek ekonomik fayda ile
davaya devam etmenin ekonomik faydaları
istatistiki olarak ölçümlenmelidir.
Karar Ağacı Metodu –
Rezervleme Örneği
Logistic Regresyon
• Bu modelleme yönteminde, Hasar, Poliçe yapısı ya
da fiyatlama ile ilgili bağımlı ve bağımsız değişkenler
tespit edilir. Bu değişkenler önceki modellerde de
olduğu gibi gruplara ayrılır. Modele girecek olan
örneğin tarife değişkenleri belirlenir.
• Modelin parametreleri Newton-Raphson metodu ile
tahmin edilir ve model test edilir.
• Daha sonra modeli oluşturan değişkenlerin
katsayılarının anlamlılıkları incelenir ve bağımlı
değişken üzerindeki etkilerine bakılır.
http://78.189.53.61/-/bs/ess/k_sumbuloglu.pdf
http://www.ekonometridernegi.org/bildiriler/o14s2.pdf
Logistic Regresyon
Oluşturulan model testleri, gözlem sayılarına göre
belirlendikten ve test edildikten sonra her bir birey için
sonuç olasılığı tahmin edilir.
Örneğin, Kırmızı, Mercedes, İstanbul Plaka, Nisan
Ayında düzenlenen bir poliçenin kaza yapma olasılığı
0,5’ten küçük ise iyi prim değilse yüksek prim çıkart
kuralı çalıştırılabilir.
http://78.189.53.61/-/bs/ess/k_sumbuloglu.pdf
http://www.ekonometridernegi.org/bildiriler/o14s2.pdf
Tahmin Modellemesinin
Geliştirilmesindeki Riskler
Nelerdir ? Hatalı amaç ve strateji geliştirebilmek,
Modellemeyi ve hesaplamayı doğru bilgi sahibi,
doğru yetkinlikte adamla yapılmaması,
Modellemeye ayrılacak kaynaktan, maliyetten
fazla çıktı edinilmesinden emin olunmalı,
Doğru beklentiler belirlenmeli,
Modelden etkilenecek acenteler, üretim birimleri
ve ürün sahipleri tam ve doğru bilgilendirilmeli,
Sigortalılar için hatalı negatif ayrımcılık yapılması,
Tahmin Modellemesinin
Geliştirilmesindeki Riskler Nelerdir ?
Amerika’da sigortalıların kredi borçlarına dayalı
olarak uygulanan kredi skorlaması sebebi ile iyi bir
sürücü olmasına karşın ve hatalı müşteri seçimi sorunları yaşanıyor.
Fiyatlama modeli ve parametrelerinin kamuya
daha açık yapılması zorunluluğunu da getirebilir.
Yada sadece yaş ve hasar ilişkilendirilmesi
yapıldığında, genç sürücüler kötü çıkabilir ancak
toplam popülasyondaki genç sürücü oranı da
dikkate alınmalıdır.
Modellerin Basitleştirilmiş
yaşam döngüsü ve önemli
noktalar Ön çalışma için 12 ile 24 aylık bir zaman/kaynak
ayrılması,
6 ila 18 aylık yürürlüğe alınma süresi,
6-18 aylık bir süreç ile uygulamaya alındıktan
sonra çalışmaların çıktılarının kontrol edilmesi,
tekrar kalibrasyonu,
Yeni model oluşturulması 12-24 ay,
Modellemeler hangi
program ve araçlarla
yapılabilir ? Microsoft data mining araçları,
SAS
SPSS,
Palisades,
Pretium,
Emblem,
ISO,
Ve diğer bir çok firmanın tahmin modellemesi
araçları
Kaynakça
http://www.statsci.org/data/general/carinsca.html
http://www.actuaries.org/LIBRARY/ASTIN/vol39no1/61.pdf
http://www.actuaries.org/LIBRARY/ASTIN/vol19no2/199.pdf
http://www.statsoft.com/textbook/general-linear-models/
http://www.brainvoyager.com/bvqx/doc/UsersGuide/WebHelp/Content/StatisticalAnalysis/The_General_Linear_Model.htm
http://www.casact.org/pubs/dpp/dpp04/04dpp327.pdf
http://www.actuaries.org/LIBRARY/ASTIN/vol39no2/453.pdf
• http://www.ekonometridernegi.org/bildiriler/o14s2.pdf
• http://78.189.53.61/-/bs/ess/k_sumbuloglu.pdf
• http://www.statsoft.com/textbook/classification-trees/?button=1
A Loss Reserving Model within the framework of Generalized Linear Models, Jun Zhou and Jos´e Garrido, Concordia University, Montreal, Canada, 2008,
LOSS RESERVING WITH GLMs : a case study, Taylor Fry Consultant Actuaries, RESEARCH PAPER NUMBER 113, Greg Taylor and Grainne McGuire, 2004
http://support.sas.com/documentation/onlinedoc/miner/casestudy_59123.pdf
http://support.sas.com/rnd/app/stat/papers/mixedglm.pdf