korelasyon ve regresyon analİzİ

28
1 KORELASYON VE REGRESYON ANALİZİ

Upload: kadeem-head

Post on 01-Jan-2016

383 views

Category:

Documents


6 download

DESCRIPTION

KORELASYON VE REGRESYON ANALİZİ. “ Doğada hiçbir şey tek başına ve yalnız değildir. Doğada her şey; önündeki, ardındaki, üstündeki, altındaki, sağındaki, solundaki şeylerle bağlantılıdır ” Goethe. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: KORELASYON VE REGRESYON ANALİZİ

1

KORELASYON VE REGRESYON

ANALİZİ

Page 2: KORELASYON VE REGRESYON ANALİZİ

2

“ Doğada hiçbir şey tek başına ve yalnız değildir. Doğada her şey; önündeki, ardındaki, üstündeki, altındaki, sağındaki, solundaki şeylerle bağlantılıdır”

Goethe

Page 3: KORELASYON VE REGRESYON ANALİZİ

3

İki ya da daha çok değişken arasında ilişki olup olmadığını, ilişki varsa yönünü ve gücünü inceleyen “korelasyon analizi” ile değişkenlerden birisi belirli bir birim değiştiğinde diğerinin nasıl bir değişim

gösterdiğini inceleyen “regresyon analizi” sağlık bilimlerinde çok

kullanılan istatistiksel yöntemlerdir.

Page 4: KORELASYON VE REGRESYON ANALİZİ

4

*Hastalığın başlangıcıyla doktora başvurma arasında geçen süre ile iyileşme süresi arasındaki, yine ilacın dozu ile iyileşme süresi arasındaki ilişkilerden yararlanılarak tedaviye başlama, dozunu ayarlama ve tedaviyi bitirmeye karar verilir.

Korelasyon ve regresyon analizinin sağlık bilimlerinde kullanımına ilişkin

bazı örnekler:

Page 5: KORELASYON VE REGRESYON ANALİZİ

5

* Sigara içme ile koroner kalp hastalığına yakalanma arasında nedensel bir ilişki saptanırsa sigara içme önlenerek koroner kalp hastalığına yakalanma ortadan kaldırılabilir.

Page 6: KORELASYON VE REGRESYON ANALİZİ

6

• Değişkenler arasındaki ilişkilerden yararlanılarak geliştirilecek matematiksel modeller yardımıyla tahminler yapılabilir. Örneğin;

Yaş ile boy arasında bir model geliştirilebilirse bir çocuğun belirli yaşlarda boyunun kaç cm. olacağı,

Doğum sayısı ile hemoglobin düzeyi arasında bir model geliştirilebilirse belirli sayıda doğum yapacak bir kadının hemoglobin değerinin ne olacağı,

Belirli bir hastalıkta kullanılan bir ilacın dozu ile iyileşme süresi arasında bir model geliştirilebilirse verilen doza göre hastanın ne kadar sürede iyileşebileceği tahmin edilebilir.

Page 7: KORELASYON VE REGRESYON ANALİZİ

7

Saçılım grafikleri iki değişken arasındaki ilişki hakkında genel bir bilgi edinmemizi sağlar. Ancak, ilişkinin miktarı konusunda yorum yapabilmek için korelasyon katsayısı hesaplamamız gerekmektedir.

r= -1 r= 0 r= +1 Mükemmel İlişki yok Mükemmel negatif ilişki pozitif ilişki

Page 8: KORELASYON VE REGRESYON ANALİZİ

8

Korelasyon katsayısı (r), iki değişken arasındaki ilişkinin ölçüsüdür. Korelasyon katsayısı -1 ve +1 arasında değişim gösterir.

r=0; iki değişken arasında ilişki olmadığır=1; mükemmel pozitif doğrusal ilişki olduğu, r=-1; mükemmel negatif doğrusal ilişki olduğu

anlamına gelir.

KORELASYON KATSAYISI

Page 9: KORELASYON VE REGRESYON ANALİZİ

9

Korelasyonun katsayısının gücü ile ilgili olarak aşağıdaki tanımlamalar yapılabilir:

0.00 - 0.25 Çok zayıf ilişki0.26 - 0.49 Zayıf ilişki0.50 - 0.69 Orta ilişki0.70 - 0.89 Yüksek ilişki0.90 - 1.0 Çok yüksek ilişki

Korelasyon katsayısı, örneklem büyüklüğünden etkilenmektedir. Küçük hacimli örneklerde, elde edilen korelasyon katsayısı büyük bile olsa istatistiksel olarak önemli bir değer olmayabilir. Dolayısıyla, elde edilen değerin hipotez testinin yapılması gereklidir.

Page 10: KORELASYON VE REGRESYON ANALİZİ

10

Korelasyon katsayıları, aralarında ilişki

araştırılan değişkenlerin türlerine göre farklılık

gösterir.

Page 11: KORELASYON VE REGRESYON ANALİZİ

11

Sınıflanabilir nitel değişkenler arasındaki ilişkinin belirlenmesinde

kullanılan korelasyon katsayıları

•Phi Katsayısı

(Değişkenlerin her ikisi de 2 kategorili ise)

•Cramer V Katsayısı

•Olağanlık Katsayısı

•Lambda Katsayısı

Page 12: KORELASYON VE REGRESYON ANALİZİ

12

Sıralanabilir nitel değişkenler arasındaki ilişkinin belirlenmesinde

kullanılan korelasyon katsayıları

•Spearman Korelasyon Katsayısı

•Gamma Katsayısı

•Kendall’ın tau-b Katsayısı

•Kendall’ın tau-c Katsayısı

•Somer’in d Katsayısı

Page 13: KORELASYON VE REGRESYON ANALİZİ

13

Kesikli/Sürekli Nicel değişkenler arasındaki ilişkinin belirlenmesinde

kullanılan korelasyon katsayıları

Pearson Korelasyon Katsayısı (Değişkenlerin her ikisi de normal dağılım gösteriyorsa)

Spearman Korelasyon Katsayısı (Değişkenlerden en az birisi normal dağılım göstermiyorsa)

Page 14: KORELASYON VE REGRESYON ANALİZİ

14

Sınıflanabilir Nitel bir değişken ve Kesikli/Sürekli bir Nicel değişken arasındaki

ilişkinin belirlenmesinde kullanılan korelasyon katsayıları

Çift Serili Korelasyon Katsayısı Nokta Çift Serili Korelasyon Katsayısı

Sıralanabilir Nitel bir değişken ve Kesikli/Sürekli bir Nicel değişken

arasındaki ilişkinin belirlenmesinde kullanılan korelasyon katsayısı

Çoklu Serili Korelasyon Katsayısı

Page 15: KORELASYON VE REGRESYON ANALİZİ

15

Kısmi Korelasyon Katsayısı

Korelasyon katsayısı iki değişken arasındaki ilişkiyi gösterirken diğer değişkenlerin etkilerini dikkate almaz. Ancak, bazen geriye kalan değişkenlerin etkisi ortadan kaldırıldıktan sonra, iki değişken arasındaki ilişkinin miktarı incelenmek istenebilir. Diğer bir deyişle, ikincil ilişkilerin etkisi ortadan kaldırıldıktan sonra iki değişken arasındaki gerçek ilişki incelenmek istenebilir. Bu inceleme kısmi korelasyon katsayıları yardımı ile yapılır. Bu konuya ilişkin örnek olarak verilebilecek en önemli değişken bireylerin yaşıdır.

Page 16: KORELASYON VE REGRESYON ANALİZİ

16

Regresyon analizi, bilinen bulgulardan, bilinmeyen gelecekteki olaylarla ilgili tahminler yapılmasına izin verir. Regresyon, bağımlı ve bağımsız değişken(ler) arasındaki ilişkiyi ve doğrusal eğri kavramını kullanarak, bir tahmin eşitliği geliştirir. Değişkenler arasındaki ilişki belirlendikten sonra, bağımsız değişken(ler)in skoru bilindiğinde bağımlı değişkenin skoru tahmin edilebilir.

DOĞRUSAL REGRESYON

Page 17: KORELASYON VE REGRESYON ANALİZİ

17

Bağımlı Değişken (y)

Bağımlı değişken, regresyon modelinde açıklanan ya da tahmin edilen değişkendir. Bu değişkenin bağımsız değişken ile ilişkili olduğu varsayılır.

Bağımsız Değişken (x) Bağımsız değişken, regresyon

modelinde açıklayıcı değişken olup; bağımlı değişkenin değerini tahmin etmek için kullanılır.

Page 18: KORELASYON VE REGRESYON ANALİZİ

18

Değişkenler arasında doğrusal ilişki olabileceği gibi, doğrusal olmayan bir ilişki de olabilir. Bu nedenle, saçılım grafiği yapılmadan (ilişki yok/doğrusal ilişki var/doğrusal olmayan ilişki var) ve değişkenler arasında korelasyon varlığına rastlanmadan regresyon analizine karar verilmemesi gerekir.

Bu bilgiler doğrultusunda, tek/çok değişkenli doğrusal regresyon analizlerinin yanı sıra, tek/çok değişkenli doğrusal olmayan regresyon analizleri de mevcuttur.

Page 19: KORELASYON VE REGRESYON ANALİZİ

19

X

Y

(a) (+) yönlü Doğrusal İlişki

X

Y

(b) (-) yönlü Doğrusal İlişki

Page 20: KORELASYON VE REGRESYON ANALİZİ

20

X

Y

(c) Doğrusal Olmayan İlişki

X

Y

(d) İlişki Yok

Page 21: KORELASYON VE REGRESYON ANALİZİ

21

Bağımlı değişken ile bağımsız değişken arasındaki doğrusal ilişkiyi açıklayan tek değişkenli regresyon modeli aşağıdaki gibidir:

bxay y = Bağımlı değişkenin değeria = Regresyon doğrusunun kesişim değeri (Sabit değer)b = Regresyon doğrusunun eğimix = Bağımsız değişkenin değeri

Page 22: KORELASYON VE REGRESYON ANALİZİ

22

ÖRNEKKardiyoloji kliniğine başvuran erkek

hastalar üzerinde yapılan bir araştırmada, yaş ve kolesterol değişkeni arasındaki korelasyondan yola çıkılarak kurulan regresyon modeli aşağıdaki gibi elde edilmiştir:

0.326X3.42 Y Bu modele göre, yaştaki bir birimlik artışın, kolesterol değerinde 0.326 birimlik bir artışa neden olacağı, yeni doğan bir erkeğin (X=0) kolesterol değerinin ise 3.42

olacağı söylenebilir.

Page 23: KORELASYON VE REGRESYON ANALİZİ

23

Kurulan bu modele göre, 50 yaşında bir erkeğin kolesterol değerinin ne kadar olacağını tahmin edebiliriz

X=50 için :

52.19(50)*0.3263.42 Y

50 yaşında bir erkeğin kolesterol değerinin 19.52 olacağı söylenebilir.

Page 24: KORELASYON VE REGRESYON ANALİZİ

24

Belirtme katsayısı, doğrusal modelin uyum iyiliğinin en iyi ölçüsüdür. Söz konusu katsayı, bağımlı değişkendeki değişimin ne kadarının bağımsız değişken (ler) tarafından açıklandığını ifade eder. Bu durum, regresyon modelinin açıklayıcılık gücünün iyi bir göstergesidir.

Yukarıdaki örneğe göre, belirtme katsayısı %74.3 olarak bulunmuştur. Bunun anlamı, yaş değişkeni kolesterol değişkenindeki değişimin %74.3’ünü açıklamaktadır. Geriye kalan %25.7’lik değişim, modele katılacak başka değişkenler tarafından açıklanabilir.

BELİRTME KATSAYISI (R2)

Page 25: KORELASYON VE REGRESYON ANALİZİ

25

Doğrusal ve doğrusal olmayan regresyon modellerinin

dışında değişik regresyon analizleri de bulunmaktadır

Page 26: KORELASYON VE REGRESYON ANALİZİ

26

Kanonik Korelasyon

Birden fazla sayıda bağımlı değişken ile bir/daha fazla bağımsız değişken arasındaki ilişkinin incelenmesi için kullanılan bir yöntemdir.

Örneğin, HDL, LDL, Trigliserid değerlerini etkileyen değişkenlerin araştırılmasında kanonik korelasyon yönteminden yararlanılır.

Page 27: KORELASYON VE REGRESYON ANALİZİ

27

Lojistik Regresyon

Bağımlı değişken iki sonuçlu bir değişken (Var/Yok, Hasta/Sağlıklı vb.) olduğunda, bu sonucun birinin (Var veya Yok) ortaya çıkma olasılığı üzerinde etkili olduğu düşünülen faktör(ler)in araştırılması yöntemidir.

Örneğin; kanser riski (Kanser/Kanser değil) üzerinde etkili olan risk faktörlerinin araştırılmasında lojistik regresyon yönteminden yararlanılır.

Page 28: KORELASYON VE REGRESYON ANALİZİ

28

Cox Regresyon

Zaman içinde izlenmiş ve belli tip bir sonuca erişmiş/erişmemiş olguların (iki sonuçlu değişken) değerlendirildiği ve bu sonucu oluşturmada çeşitli değişkenlerin etkilerinin araştırıldığı çözümleme yöntemidir.

Örneğin, operasyon sonrası sağ kalım üzerinde etkili olan değişkenlerin araştırılmasında Cox regresyon yönteminden yararlanılır.