sıralı Örüntü madenciliği ile e- bankacılıkta kullanıcı davranışlarının modellenmesi

25
EREN BERK AYTAÇ YAZILIM MÜHENDİSİ KUVEYT TÜRK KATILIM BANKASI BİLGİ TEKNOLOJİLERİ AR-GE MERKEZİ YRD.DOÇ.DR TURGAY TUGAN BİLGİN MALTEPE ÜNİVERSİTESİ MÜH FAK.YAZILIM MÜH.BÖLÜMÜ Sıralı Örüntü Madenciliği ile e-Bankacılıkta Kullanıcı Davranışlarının Modellenmesi

Upload: amandla

Post on 29-Jan-2016

108 views

Category:

Documents


0 download

DESCRIPTION

Sıralı Örüntü Madenciliği ile e- Bankacılıkta Kullanıcı Davranışlarının Modellenmesi. Eren BERK AYTAç YAZILIM MÜHENDİSİ KUVEYT TÜRK KATILIM BANKASI BİLGİ TEKNOLOJİLERİ AR-GE MERKEZİ YRD.DOÇ.DR Turgay tugan bİlgİn Maltepe ÜNİVERSİTESİ MÜH FAK.YAZILIM MÜH.BÖLÜMÜ. Taslak. Giriş - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Sıralı Örüntü Madenciliği ile e- Bankacılıkta Kullanıcı Davranışlarının Modellenmesi

E R E N B E R K A Y T A ÇYA Z I L I M M Ü H E N D İ S İ

K U V E Y T T Ü R K K A T I L I M B A N K A S I B İ L G İ T E K N O L O J İ L E R İ A R - G E M E R K E Z İ

Y R D . D O Ç . D R T U R G A Y T U G A N B İ L G İ NM A LT E P E Ü N İ V E R S İ T E S İ

M Ü H FA K . YA Z I L I M M Ü H . B Ö L Ü M Ü

Sıralı Örüntü Madenciliği ile e-Bankacılıkta Kullanıcı

Davranışlarının Modellenmesi

Page 2: Sıralı Örüntü Madenciliği ile e- Bankacılıkta Kullanıcı Davranışlarının Modellenmesi

Taslak

GirişBirliktelik analizi ve sıralı örüntü madenciliği

nedir?Sıralı örüntü madeciliğinden bazı temel

kavramlar(Güven Değeri,Destek Değeri)Çalışmanın amacıVeri seti ve veri setine uygulanan veri

indirgemeleriYazılım ve veri setinin yazılıma uygulanışıSonuçlar & ÖnerilerSoru & Cevap

Page 3: Sıralı Örüntü Madenciliği ile e- Bankacılıkta Kullanıcı Davranışlarının Modellenmesi

Giriş

• Veri madenciliği; çığ gibi büyüyen sayısal veri ortamları arasından yararlı ve gerekli olan bilgiye ulaşmayı sağlamak ve bu bilgilerden faydalanmaktır.

• Normal veritabanı uygulamalarından farklı.• Örnek:• Adı Ahmet olan kredi kartı sahiplerini bul.• Riski az olan tüm kredi kartı başvurularını bul.• Pazarlama, banka ve e-ticaret gibi alanlarda market analizi,

müşteri profili çıkarma, risk analizi, sahtekârlık tespiti ve normal olmayan örüntülerin bulunması gibi birçok kullanım alanları vardır.

Bankacılıkta ise Risk Yönetimi,Müşteri İlişkileri Yönetimi,Müşteri Sürdürebilirlik,Pazarlama,Çapraz Satış,Sahtekarlık Tespiti gibi alanlarda kullanılır.

Page 4: Sıralı Örüntü Madenciliği ile e- Bankacılıkta Kullanıcı Davranışlarının Modellenmesi

Birliktelik Analizi

• Birliktelik analizi, bir işlem kaydında bir elemanın meydana gelme olasılığını, diğer elemanların meydana gelme olasılıklarından tahmin etmek için kurallar bulunmasıdır.

Hangi ürünler çoğunlukla birlikte satılıyor? Kişisel bilgisayar satın alan bir kişinin bir

sonraki satın alacağı ürün ne olabilir? Yeni bir ilaca duyarlı olan DNA tipleri

hangileridir? Web dokümanları otomatik olarak

sınıflandırılabilir mi?

Page 5: Sıralı Örüntü Madenciliği ile e- Bankacılıkta Kullanıcı Davranışlarının Modellenmesi

Birliktelik Analizi

{Çocuk Bezi} {Çikolata}{Süt, Ekmek} {Yumurta, Kola} {Çikolata, Ekmek} {Süt}

Page 6: Sıralı Örüntü Madenciliği ile e- Bankacılıkta Kullanıcı Davranışlarının Modellenmesi

Temel Kavramlar

Destek Sayısı (Support count (s)) Bir öğe setinin kaç defa meydana geldiğinin sayısıdır. Şekil 1 için Örnek: s({Süt, Ekmek, Çocuk Bezi}) = 2

Destek (Support) Bir öğe setini içeren işlemlerin oranıdır. {Süt,Çocuk Bezi} {Çikolata}

Sık Öğe Seti(Frequent Itemset):Bir öğe setinin destek değeri minsupport(en küçük destek değeri) eşik değerinden daha büyük ise sık öğe seti olarak bilinir.

4.05

2

|T|

)Çikolata,Ç,(

BeziocukSüts

Page 7: Sıralı Örüntü Madenciliği ile e- Bankacılıkta Kullanıcı Davranışlarının Modellenmesi

Temel Kavramlar

Güven Değeri(Confidence):X değerini içeren işlem kayıtları içerisinde X ve Y değerlerinin birlikte hangi sıklıkta ortaya çıktığının ölçümüdür.

{Süt,Çocuk Bezi} {Çikolata}

En Küçük Destek Değeri (Minumum Support) Birliktelik kuralının geçerli olması için gereken eşik değeridir. Belirtilen bir kural eğer bilgi verecekse bu bilginin en küçük destek değerine eşit veya büyük olmalıdır.

67.03

2

)BeziÇocuk ,Süt(

)ÇikolataBezi,Çocuk Süt,(

c

Page 8: Sıralı Örüntü Madenciliği ile e- Bankacılıkta Kullanıcı Davranışlarının Modellenmesi

Birliktelik Analizi Örnek

Bilgisayar alan bir müşterinin aynı zamanda antivirus yazılımı almasına ait ilişkilendirme kuralı:

bilgisayar antivirüs_yazılımı [support=%2,confidence=%60]

Support = Destek (müşterilerin %2’si bilgisayar ve antivirüs yazılımını beraber almışlar)

Confidence = Güven (bilgisayar alan müşterilerin %60’ı antivirüs yazılımı da almış)

Page 9: Sıralı Örüntü Madenciliği ile e- Bankacılıkta Kullanıcı Davranışlarının Modellenmesi

Sıralı Örüntü Madenciliği

Sıralı örüntü madenciliği, belirli bir sırayla gelen istatiksel olarak veri örnekleri arasındaki ilgili örüntüleri bulmaya çalışır.Sıralı veritabanı

SID sequences

10 <a(abc)(ac)d(cf)>

20 <(ad)c(bc)(ae)>

30 <(ef)(ab)(df)cb>

40 <eg(af)cbc>

Object Timestamp EventsA 1 1,2,4A 2 2,3A 3 5B 1 1,2B 2 2,3,4C 1 1, 2C 2 2,3,4C 3 2,4,5D 1 2D 2 3, 4D 3 4, 5E 1 1, 3E 2 2, 4, 5

Page 10: Sıralı Örüntü Madenciliği ile e- Bankacılıkta Kullanıcı Davranışlarının Modellenmesi

Sıralı Örüntü Madeciliği Uygulamaları

Müşteri alışveriş sıralaması -Müşterilerin 3 ay içerisinde mağazadan önce

bilgisayar sonra CD-ROM en son dijital kamera almaları

Doğal Afetler (Deprem)Web sitesindeki gezinme logları < {Anasayfa} {Elektronik} {Dijital

Kameralar} {Canon Digital Kameralar} {Alışveriş Sepeti} {Sipariş Onayı} {Alışverişe Geri Dön} >

DNA sıralaması ve gen yapısı

Page 11: Sıralı Örüntü Madenciliği ile e- Bankacılıkta Kullanıcı Davranışlarının Modellenmesi

Sıralı Örüntü Madenciliği KavramlarSequence ve Subsequnce

Data sequence Subsequence İçerir mi?

< {2,4} {3,5,6} {8} > < {2} {3,5} > Yes

< {1,2} {3,4} > < {1} {2} > No

< {2,4} {2,4} {2,5} > < {2} {4} > Yes

Page 12: Sıralı Örüntü Madenciliği ile e- Bankacılıkta Kullanıcı Davranışlarının Modellenmesi

Sıralı Örüntü Madenciliği

Veri kümesi içindeki yaygın örüntülerin, nesneleri oluşturan nitelikler arasındaki ilişkilerin bulunması.

SID sequence

10 <a(abc)(ac)d(cf)>

20 <(ad)c(bc)(ae)>

30 <(ef)(ab)(df)cb>

40 <eg(af)cbc>

<a(bc)dc>

<a(abc)(ac)d(cf)> ‘nin subsequence’dir.

min_sup =2, <(ab)c> sıralı örüntüdür.

Page 13: Sıralı Örüntü Madenciliği ile e- Bankacılıkta Kullanıcı Davranışlarının Modellenmesi

Çalışmanın Amacı

Bu çalışmada, özel bir banka müşterilerinin internet şubesinde yapmış olduğu işlemler veri seti olarak kullanılmıştır. Çalışmada sıralı örüntü madenciliği yöntemi kullanılarak müşterilerin davranışları havale, EFT ve fatura ödemelerini hangi adımlarla yapıldığının belirlenmesi ve oturum sırasında yapmış oldukları davranışlar hakkında çıkarımlar yaparak bunların modellenmesi amaçlanmaktadır.

Page 14: Sıralı Örüntü Madenciliği ile e- Bankacılıkta Kullanıcı Davranışlarının Modellenmesi

Çalışmada Kullanılan Veri Seti

Tablo 1. Internet Şubesinde Gerçekleştirilen Fatura ödeme işlemine ait kayıtlar

Kullanıcının ziyaret ettiği modüller tabloda “Modül Adı”, gerçekleştirdiği işlemler ise “İşlem” sütununda verilmiştir.

Page 15: Sıralı Örüntü Madenciliği ile e- Bankacılıkta Kullanıcı Davranışlarının Modellenmesi

Veri Önişleme

Tablo 2.Internet Şubesine ait Ham Veriler

Tablo 2’de Internet Şubesi’nde kullanılan veri setinin aslı bulunmaktadır. Veri setinin sütunları CustomerId (MüşteriNo) ControllerName (Modül Adı) , ActionName (İşlem) RequestType (İstek Tipi) , SessionId (Oturum No) SystemDate (Sistem Tarihi)ve MachineName (Makine Adı)’dir.

Page 16: Sıralı Örüntü Madenciliği ile e- Bankacılıkta Kullanıcı Davranışlarının Modellenmesi

Veri Önişleme

Tablo 3. Internet Şubesinde Gerçekleştirilen Fatura Ödeme İşlemine Ait Kayıtların Tekil Sayı(Id) Atanmış Hali

Veri madenciliği yazılımında kullanabilmek için her bir işlemin sayısal bir değer ile ifade edilmesi gerekmiştir. Bu sebeple veri setinde her işlemin ne anlama geldiğini belirtmek için, her modül adı ve işlem satırı için tekil bir sayı(Id) verilmiştir. Örneğin, Tablo 3 ‘te 54 Id numaralı satıra karşılık gelen Modül Adı BillPayment, İşlem ise Index’tir. Bu satırdan kullanıcının fatura ödeme sayfasını ziyaret ettiği anlaşılmaktadır.

Page 17: Sıralı Örüntü Madenciliği ile e- Bankacılıkta Kullanıcı Davranışlarının Modellenmesi

Çalışmada Kullanılan Yazılım

Veri madenciliğinde verileri anlamlı hale getiren böylelikle verilerin yorumlanmasını ve görselleşmesini sağlayan araçlar bulunmaktadır. Bu çalışmada kullanılan yazılım birçok algoritmayı içinde barındıran ve Java tabanlı bir yazılım olan Sequential Pattern Mining Framework(SPMF)

SPMF, sıralı örüntü madenciliği, ilişkisel veri madenciliği, sıralı veri madenciliği ve kümeleme için toplamda 52 adet veri madenciliği algoritması uygulamaları sunmaktadır. Sıralı örüntü madenciliği için PrefixSpan, SPAM, SPADE sıralı veri madenciliği için RuleGrowth TRuleGrowth, CMRules, kümeleme için K-Means gibi algoritmaları içerir.

Page 18: Sıralı Örüntü Madenciliği ile e- Bankacılıkta Kullanıcı Davranışlarının Modellenmesi

Çalışmada Kullanılan Yazılım

Şekil 1. Internet Şubesinde Gerçekleştirilen Fatura Ödeme İşleminin SPFM yazılımın kabul ettiği format

Şekil 2. Kullanıcı verilerinin SPMF formatındaki görünümü

Page 19: Sıralı Örüntü Madenciliği ile e- Bankacılıkta Kullanıcı Davranışlarının Modellenmesi

Çalışmada Kullanılan Yazılım

Şekil 3. Fatura ödemesi için elde edilen çıktı dosyası

Page 20: Sıralı Örüntü Madenciliği ile e- Bankacılıkta Kullanıcı Davranışlarının Modellenmesi

Sonuçlar

SPMF programı çeşitli en küçük destek parametreleriyle çalıştırılmıştır. Elde edilen çıktılar incelendiğinde uzun sıralı örüntülerde anlamlı sonuçlar elde edilememiştir. Ancak müşterilerin çoğunlukla yapmış olduğu gezme davranışları incelendiğinde şu sonuçlara ulaşılmıştır.

Havale işlemi için(minsup %50) elde edilen çıktı aşağıdadır.

• EFT işlemi için(minsup %50) elde edilen çıktı aşağıdadır.

• Havale işlemine için karşılık gelen gezme sırası aşağıda verilmiştir.

• EFT işlemine için karşılık gelen gezme sırası aşağıda verilmiştir.

Page 21: Sıralı Örüntü Madenciliği ile e- Bankacılıkta Kullanıcı Davranışlarının Modellenmesi

Sonuçlar

• Fatura ödeme işlemi için(minsup %50) elde edilen çıktı aşağıdadır.

• Fatura ödeme işlemine için karşılık gelen gezme sırası aşağıda verilmiştir.

Page 22: Sıralı Örüntü Madenciliği ile e- Bankacılıkta Kullanıcı Davranışlarının Modellenmesi

Sonuçlar

Ayrıca müşteri davranışıyla ilgili çıkan sonuçlar incelenerek

şu çıkarımlar yapılmıştır.• Oturumlarda genellikle tek işlem yapılıyor. • Genellikle yapılan işlem sonucu dekont incelenmiyor. • Ziyaretçiler bankacılık işlemlerini Ana sayfada sol

tarafta bulunan “Tüm İşlemler” butonuna tıklayarak açılan menüden veya bu işlemleri daha hızlı ve pratik yapmaları için kendi menülerini oluşturmaya yönelik akıllı menü uygulamasıyla yapabilmektedir. Sonuçlara göre;

• Ziyaretçiler işlemlerini minsup %50 oranında ana sayfada yer alan “Tüm İşlemler” butonuna tıklayarak açılan menüden, minsup %20 oranında akıllı menü uygulamasını kullanarak gerçekleştiriyor.

Page 23: Sıralı Örüntü Madenciliği ile e- Bankacılıkta Kullanıcı Davranışlarının Modellenmesi

Sonuçlar

Internet Şubesine Cep Mesajı, Cep Parolamatik veya Mobil İmza seçeneklerinden biriyle girişyapılmaktadır.• Ziyaretçilerin minsup %70 oranında cep

telefonlarına SMS ile gönderilen şifre ile giriş yapıyor.

• Ziyaretçiler minsup %30 oranında havale işlemi yapılıyor.

• Ziyaretçiler internet bankacılığı uygulamasından çıkış yaparken minsup %90 oranında “Güvenli Çıkış” butonu kullanılıyor.

Page 24: Sıralı Örüntü Madenciliği ile e- Bankacılıkta Kullanıcı Davranışlarının Modellenmesi

Değerlendirme ve Öneriler

SPMF yazılımı en küçük destek değer parametresine duyarlıdır. Bu parametreler uygun seçilmediğinde çok fazla sayıda anlamsız örüntü ortaya çıkmaktadır. Anlamlı örüntülerin bulunması için %50 ile %70 arasında çeşitli en küçük destek değerleri ile deneyler tekrarlanmıştır.

Bu çalışma sonucunda, Internet şubesini kullanan ziyaretçilerin bankanın sunmuş olduğu yeni teknolojilere karşı duyarlı olmadığı görülmüştür. Müşteriler genellikle bankacılık işlemlerini klasik ve uzun yöntemlerle yapmışlardır.

Internet şubede sunulan “Akıllı Menü” uygulamasıyla havale, EFT, Fatura Ödemesi gibi işlemler çok kısa bir sürede yapılması sağlanmaktadır. Kullanıcıların bu uygulamayı daha etkin kullanabilmesi ve ilgilerini çekmesi için Internet şubede anlık ipuçları verilmesi gereklidir.

Page 25: Sıralı Örüntü Madenciliği ile e- Bankacılıkta Kullanıcı Davranışlarının Modellenmesi

SORULAR?