ortalamalar(fazlası için )

46
TANIMLAYICI İSTATİSTİKLER ---------------------- --------------- ORTALAMALAR

Upload: wwwtipfakultesi-org

Post on 05-Aug-2015

206 views

Category:

Documents


1 download

TRANSCRIPT

TANIMLAYICI İSTATİSTİKLER

------------------------------------- ORTALAMALAR

İstatistik bilim dalında ana bölümler

• Tanımlayıcı (descriptive) istatistik: Toplanan verilerin belirleyici özelliklerinin kantitatif istatistik terimlerle açıklamaktır. Çıkarımsal istatistik gibi bir tümevarım söz konusu değildir.

• Çıkarımsal (inferential) istatistik: İstatistiksel tümevarım olarak ta bilinmektedir. Seçilen rasgele bir örnekle tümevarımsal olarak popülasyon hakkında tahminlerin yapılmasıdır.

• Tahmin (Estimation): Tahminsel çıkarsama, önceki gözlemlere dayanarak ve olasılık kullanarak gelecek gözlemleri tahmin etme işidir.

• Hipotez testi (Hypothesis testing): Hipotez testleri deneysel veya gözlemsel veri kullanarak istatistiksel karar verme yöntemidir. Kanıtlayıcı veri analizi olarak ta bilinir.

• Nokta tahmin (Point estimation): Örnek veriler kullanarak popülasyon parametreleri için nokta tahmin edici istatistikler bulmaktır. Bir örnekten hesaplanan ortalama değer, popülasyon ortalama değerinin en iyi tahminleyicisi olarak hesaplanır.

• Aralık tahmin (Interval estimation): Örnek veriler kullanarak popülasyon parametreleri için olası aralık tahmin ediciler bulmaktır. Uygulamalarda en çok kullanılan aralık tahmin edici güven aralığıdır (Confidence Interval (CI)).

Ortalama• Yığın olay niteliği gösteren verileri tek bir değerle tanımlamada

kullanılan istatistik değerlerinin genel adıdır.

• Toplum birimlerine ilişkin olanlarına toplum ortalaması ya da toplum parametresi, örnekler için olanlara da örnek ortalamaları denir.

• Ortalamalar, toplum ve örnek verilerinin kümelendikleri yeri ya da onların dağılımlarının merkezlerini gösterdikleri için yer ölçüleri veya merkezi eğilim ölçüleri olarak da ad almaktadırlar.

• Ortalamalar, toplum ve örnek vasıflarını birbirleriyle karşılaştırmada kullanılan çok önemli istatistik değerleridir.

• En çok kullanılan ortalamalar – aritmetik ortalama, – ortanca değer, – tepe değeri, – ağırlıklı ortalama, – geometrik ortalama, – çeyrek, – ondalık – yüzdeliklerdir.

• Ortalamalar sayısal verilerden hesaplanırlar.

• Ortalamalar gibi sayısal verilerden hesaplanmayan, ancak grup içinde belirli bir özelliğe sahip birimlerin durumunu gösteren, toplum ve örnek gruplarının karşılaştırılmalarında kullanılan oranlar da toplumun bir parametresi ve örneğin bir istatistik değeri niteliğindedir.

Aritmetik Ortalama• Bir örnek içindeki birimlerin herhangi bir

vasfı için aritmetik ortalama değeri, o vasfa ait verilerin değerlerinin toplamının veri sayısına bölünmesiyle bulunan değerdir.

• Aritmetik ortalama örnekteki tüm verilerin katkısıyla hesaplandığından, uç kısımlarda bulunan değerlerce etkilenir.

• Verilerin aritmetik ortalamadan olan farkları toplamı daima sıfıra eşittir.

Örnek içindeki n tane verinin değeri x1, x2, x 3,......xn ise bunlara ait aritmetik ortalama,

xn

xii

n

1

1

Örnek 5.1: Bir deney grubunda yer alan 10 deney hayvanının ağırlıkları gram olarak, 120, 130, 125, 140, 120, 115, 125, 110, 140, 135 olsun. Bu ağırlıkların aritmetik ortalaması

12610

1260x

olarak bulunur.

Örnek 5.1: Bir deney grubunda yer alan 10 deney hayvanının ağırlıkları gram olarak, 120, 130, 125, 140, 120, 115, 125, 110, 140, 135 olsun. Bu ağırlıkların aritmetik ortalaması

x = 1260/ 10 = 126

olarak bulunur.

Örnek: Tablo 3.2’de 100 anneye ait yaş verilerinin aritmetik ortalamasını bulalım.

Σx=3029, n=100 x =3029 /100 =30.29

Sıralı Frekans Tablosunda Aritmetik Ortalama Hesabı• Sıralı frekans tablosu, örnekteki verilerden farklı olanlar ve

bunların tekrar sayısını gösteren frekanslardan oluşan tablodur.

• Aritmetik ortalama hesabında toplam bulunurken her farklı veri frekans değerleri ile çarpılıp toplanır.

• Toplamın n'ye bölünmesiyle de aritmetik ortalama bulunmuş olur.

• Farklı veriler x ve bunlara karşı gelen frekans değerleri de f ile gösterilirse aritmetik ortalama,

xn

fx 1

xn

fx 1

Örnek 5.2: Yukarıdaki sıralı frekans tablosundan 100 annenin yaşının aritmetik ortalamasını bulalım.

x = 3029/100= 30.29

Tablo 3.4: 100 Annenin Yaşlarının Sıralı Frekans Dağılımı

Sınıflandırılmış Frekans Tablosunda Aritmetik Ortalama Hesabı

• Sınıflandırılmış frekans tablosunda verilerin gerçek değerleri ortadan kalkar.

• Değer olarak sınıf değerleri önem kazanır.

• Her sınıfta bulunan veriler ortak bir değeri yani o sınıfın sınıf değerini alırlar.

A: herhangi bir sınıf değerini,

C: sınıf aralığı

U değeri , x=A değeri için sıfır, x>A için 1, 2, 3, ... ve x<A için -1, -2, -3, ...

A'ya herhangi bir sınıfın değeri verilebilir. A'nın değişik değerler alması, sonucu değiştirmez.

x Afu

nC

Ortanca Değer• Veriler değer bakımından sıraya dizildiklerinde, dizinin orta yerinde yer

alan verinin değeri ortanca değer olur.

• Uç kısımlarda bulunan verilerce etkilenmediği için bu durumdaki verilerde aritmetik ortalamaya alternatif olarak ortanca değer hesabı yapılır.

• Bir grup verinin ortanca değerini bulmak için önce veriler küçükten büyüğe doğru sıraya dizilirler.

• Veri sayısının bir fazlasının ikiye bölünmesiyle bulunan sayı ortanca değerin sıra numarasını belirler.

• Veri sayısı tek olduğunda ortanca değeri belirleyen sayı tam sayı, çift olduğunda ise bu sayı tam olmayıp iki sıra numarası arasına düşer.

• Ortanca değerden küçük ve büyük olan verilerin sayıları birbirine eşittir.

Örnek 5.5: Bir çalışmaya seçilen 9 hastanın yaşları aşağıdaki gibidir. Ortanca değer kaçtır?

10, 15, 24, 26, 28, 30, 32, 35, 40

ortanca değer olarak (9+1)/2=5. sırada bulunan 28 değeri alınır.

Örnek 5.5: Bir çalışmaya seçilen 10 hastanın yaşları aşağıdaki gibidir. Ortanca değer kaçtır?

10, 15, 24, 26, 28, 30, 32, 35, 40, 60

ortanca değer (10+1)/2=5.5. değer

5.5. değer, 5. değer olan 28 ile 6. değer olan 30'un ortalamasıdır. Sonuç olarak ortanca değer 29 olur.

Sınıflandırılmış Frekans Tablosunda Ortanca Değer Hesabı

• Sınıflandırılmış frekans tablosunda, n/2'inci değer ortanca değerdir.

• Önce, bu değerin sıra numarası saptandıktan sonra eklemeli frekanslar yardımıyla hangi sınıfın içinde bulunduğuna karar verilir.

• Sınıf belirlendikten sonra, sınıf içinde yer alan verilerin sıra ile küçükten büyüğe doğru eşit aralıklarla sıralandıkları varsayılarak n/2'inci değerin sınıfın neresine ve hangi veriye denk geleceği orantılı olarak hesaplanır.

O D Ln E

OCf

f

. ./

2

n: veri sayısıL: O.D.'in içinde bulunduğu sınıfın başlangıç değeri n/2: Ortanca değeri belirleyen sıra sayısıEf : O.D.'in içinde bulunduğu sınıftan önceki sınıfın eklemeli frekansı Of : O.D.'in içinde bulunduğu sınıfın frekansı

Örnek 5.6: frekans tablosundan O.D.'i hesaplayalım.

n/2= 100/2= 50. değer O.D. dir.

Bu sıra sayısının 56 eklemeli frekansı içinde bulunduğu ve 30 ile başlayan sınıfta yer alır,

n/2 =50, L =30, Of =13, Ef =43, C =2

O D Ln E

OCf

f

. ./

2

O D. . .

3050 43

132 31 1 bulunur.

Tepe Değeri• Bir örnek grubu içinde en çok tekrar eden veri, tepe

değeri olarak adlandırılır.

• Veriler tek tek ele alındığında, bir örnekte hiç tepe değeri olmadığı gibi çok sayıda tepe değeri de olabilir.

• Verilerin frekans dağılımı yapıldığı zaman, eğrinin tepe noktasının apsisi, tepe değerini verir.

• Tepe değeri frekans tablolarında ise en büyük frekansa sahip olan sınıfın içinde yer alır.

• T.D.'nin yeri histogram grafiğinden faydalanılarak da bulunabilir.

T D L Cf

f f. .

1

1 2

L : En büyük frekansa sahip bulunan sınıfın başlangıç değeri f1: En büyük frekans ile ondan önceki frekansın farkının mutlak değeri f2: En büyük frekans ile ondan sonraki frekansın farkının mutlak değeri C : Sınıf aralığı

•Tepe değeri kaba bir ortalamadır.•Çarpık eğrilerde daha çok kullanılır. •Çarpıklık derecesi az olan eğrilerde T.D., A.O., ve O.D. arasındaki ilişkiden yararlanarak da T.D. hesaplanabilir.

T D x x O D. . ( . .) 3

Tablodan görüldüğü gibi en büyük frekans 13'dür ve 30 ile başlayan sınıfa aittir.

f1=13-9=4, f2=13-10=3, L=30, C=2

T D. . .

304

4 32 31 1

T D L Cf

f f. .

1

1 2

L : En büyük frekansa sahip bulunan sınıfın başlangıç değeri f1: En büyük frekans ile ondan önceki frekansın farkının mutlak değeri f2: En büyük frekans ile ondan sonraki frekansın farkının mutlak değeri C : Sınıf aralığı

Örnek 5.8: Örnek 5.4’de verilen 100 annenin yaşları için ve O.D.= 31.1 olarak bulunmuştu. ve O.D.'e göre T.D.'ni hesaplayalım.

T.D. =30.26-3(30.26-31.1)=32.78

T D x x O D. . ( . .) 3

Ağırlıklı Ortalama:•Farklı birim sayılarındaki iki ve daha fazla araştırmanın sonuçlarını birleştirerek bulunan ortak ortalama, hız ya da orana Ağırlıklı Ortalama adı verilir.

•Farklı yer ve zamanda yapılmış araştırmaların verilerinden yararlanılarak daha geniş hacimli bir örnekte araştırma yapılmış gibi merkezi eğilim ölçüsü hesaplamak gerektiğinde uygulanan bir ortalama türüdür.

•Nicel veriler için , nitel veriler için sembolleri ile gösterilir.

•Her çalışmadan hesaplanan ortalama ya da oranın birim sayılarına göre ağırlıklandırılarak hesaplanan bir genellenmiş ortalamadır.

•Çok basit bir parametre tahmin yöntemidir. Ayrıntılı bilimsel çalışmalarda Meta Analizi yöntemleri ile parametre tahminleri yapılmalıdır.

WX WP

• Nicel ve nitel verilerde hesaplanma biçimleri aşağıdaki gibi verilebilir.

Nicel verilerde ağırlıklı

ortalama hesaplaması

Nitel verilerde ağırlıklı

ortalama hesaplaması

WX =

k

i ii=1

k

ii=1

n X

n WP =

k

i ii=1

k

ii=1

n p

n

Bu formüllerde;

k, araştırma sayısı; in , i. araştırmadaki birim sayısı; iX , i’nci araştırmanın ortalaması;

iP , i’nci araştırmanın oranıdır.

Örnek: 4 farklı Akut İshal tedavisinde kullanılan mayi miktarları ortalamaları ve tedavi edilen hasta sayıları tabloda verilmiştir. Tabloya göre akut ishal tedavisinde kullanılan ortalama mayi miktarını hesaplayınız.

Tablo - 4 Farklı klinikte Akut İshal tedavisi için mayi miktarları

Tedavi Kliniği Hasta Sayısı

in

Ortalama Mayi Miktarı (kg)

iX

A 88 4250 B 112 3500 C 56 4000 D 12 6250 Toplam 268 -

Tablo - 4 Farklı klinikte Akut İshal tedavisi için mayi miktarları

Tedavi Kliniği Hasta Sayısı

in

Ortalama Mayi Miktarı (kg)

iX in * iX

A 88 4250 374 B 112 3500 392 C 56 4000 224 D 12 6250 75 Toplam 268 - 1065

WX =

k

i ii=1

k

ii=1

n X

n=

1065

268=3.974 kg.

Örnek: 4 farklı klinikte X kanser tanısı konmuş tedavi edilen hastaların 3 yıl sonunda hayatta kalanlar yüzdesi tabloda verilmiştir.

Tablo - Dört Farklı klinikte tedavi edilen X hastalarının 3 yıl sonunda yaşama oranları

Deneme Yeri Hasta Sayısı

in Yaşama Oranı

ip

A 64 52.4 B 78 64.4 C 46 30.7 D 112 46.8 Toplam 300 -

WP =

k

i ii=1

k

ii=1

n p

n=

15030.6

300=50.1%

Tablo - Dört Farklı klinikte tedavi edilen X hastalarının 3 yıl sonunda yaşama oranları

Deneme Yeri Hasta Sayısı

in Yaşama Oranı

ip in * ip

A 64 52.4 3353.6 B 78 64.4 5023.2 C 46 30.7 1412.2 D 112 46.8 5241.6 Toplam 300 - 15030.6

Ağırlıklı ortalamanın literatürde kullanımı için bir örnek,

• Ağırlıklı ortalama depresyon tedavisinde kullanılan citalopram ve escitalopram için hesaplandı.

• (Comparative Effectiveness of Second- Ceneration Antidepressants in the Pharmacologic Treatment of Adult Depression, Prepared by RTI International University of North Carolina Evidence — based Practice Center, Comparative Effectiveness Review, 2007)

•  

Geometrik Ortalama • Veriler, bir önceki değerlerine göre birbirlerine bağlı olarak

geometrik artarak değer alıyorlarsa, bunlar için en uygun ortalama çeşidi geometrik bir artış göstermelerinden dolayı geometrik ortalamadır.

• Yıllara göre nüfus sayıları ve zamana göre mikroorganizmaların sayıları geometrik artış gösteren verilere birer örnektir.

• Geometrik ortalama, aritmetik ortalama kadar uçlardaki aşırı değerlerden etkilenmez.

• Geometrik ortalama değeri aşağı yukarı orta yere rastlayan veriye eşit olur

x1, x2, x3, ....xn şeklinde belirtilen n tane verinin geometrik ortalaması,

G O x x x xnn. . ( ...... ) / 1 2 3

1

Örnek 5.10: Bir bölgenin nüfusu sıra ile1988'de 5000, 1989'da 5200 ve 1990'da 5500 olsun. Bu nüfus verilerinin geometrik ortalaması nedir?

G O. . ( . . ) / 5000 5200 5500 52291 3

Harmonik Ortalama: •Veri setindeki değerler bir zaman serisi, eşit şartlarda yapılmamış k sayıda deneyin sonuçlarının bir araya getirilmesi ile elde edilmiş bir veri seti ya da birbirini izleyen sayılar bir dalgalanma gösteriyorsa (aylık, mevsimsel, yıllık, dalgalanmalar) verinin merkezi eğilim ölçüsü harmonik ortalama ile hesaplanır.

sembolü ile gösterilir. HX

• Zamana bağlı veri dizilerinde ay, mevsim ve yıl etkilerinden dolayı dalgalanma olabilir.

• Periyodik dalgalanma gösteren zaman serilerinin ortalaması harmonik ortalama ile gösterilmelidir.

• Bazı tıbbi denemelerde; sürekli ölçülen fizyolojik değişken verileri, deneğe verilen ilacın kana karışması metabolik etkilerinin zamana göre önce artan, belirli zamandan sonra hızlı ya da yavaş azalan bir eğilim göstermesi nedeniyle bu tür verilerin merkezi eğilim ölçüsü harmonik ortalama olmalıdır.

• Harmonik ortalama; setin birim sayısı, veri setindeki değerlerin ters değerler toplamına bölünerek hesaplanır.

HX =

n

ii=1

n

(1 / X )=

1 2 n

n1 1 1

+ + ... +X X X

Örnek: 1985-1999 yılları arasında Dahiliye Kliniğinde belirli bir hastalığından yatarak tedavi gören hasta sayıları verilmiştir. Onbeş yıllık verilere göre tedavi edilen ortalama hasta sayısını bulalım. İlgili hastalıktan yatan hasta sayısı: 14, 27, 41, 121, 36, 47, 105, 18, 19, 76, 99, 106, 56, 48, 78

Çözüm:•Veri seti bir zaman serisidir ve yıllara göre azalan, artan dalgalı bir görünümdedir. Dizi ve harmonik ortalaması aşağıdaki gibi hesaplanır.

HX =

15

ii=1

15

(1 / X )=

n1 1 1

+ + ... +14 27 78

=15

0.39209=38.25738 hasta/yıl

Çeyrekler (Kuartiller)

• Ortanca değere benzer bir ortalama çeşididir.

• Veriler küçükten büyüğe doğru sıralandıklarında, ilk dörtte birinci sırada yer alan verinin değeri birinci çeyrek olarak ad alır.

• İkinci ve üçüncü sıradaki değerler de ikinci ve üçüncü çeyrek değerleri olur.

• İkinci çeyrek değeri ortanca değere eşittir.

• 1. çeyrek değeri, sıraya dizilmiş verilerde (n+1)/4' üncü sıradaki değerdir.

• İkinci ve üçüncü değerler de (n+1)/4'ün 2 ve 3 ile çarpılmasından elde edilen sıralardaki verilerin değerleridir.

Örnek 5.11: 11 hastadan ölçülen kan basıncı değerleri mm/Hg olarak sırasıyla aşağıdaki gibi olsun,

60 65 70 72 75 80 85 90 100 110 115

1., 2. ve 3. çeyrek değerleri nedir?

1. Çeyrek (11+1)/4=3. değer 70,

2. Çeyrek 3x2=6. değer 80,

3. Çeyrek 3x3=9. değer 100’dür

• Çeyrek değerlerinin sınıflandırılmış frekans tablosundan hesaplanması da mümkün olabilmektedir.

• İşlem, ortanca değer hesabında yapılanın aynıdır.

Ç Li n E

ÇCi i

fi

fi

.( / )4

i : 1, 2, 3

Çi : i. çeyrek

Li : i. çeyreğin içinde bulunduğu sınıfın başlangıç değeri

E fi : i. çeyreğin içinde bulunduğu sınıftan bir önceki sınıfın eklemeli frekansı

Ç fi : i. çeyreğin içinde bulunduğu sınıfın frekansı

C : sınıf aralığı

Örnek-5.12: Sınıflandırılmış frekans tablosunda Ç1, Ç2 ve Ç3'ü hesaplayalım.

Çeyrek değerlerine karşı gelen sıra numaralarıÇ1 için 100/4=25Ç2 için 25x2=50Ç3 için 25x3=75

Ç Li n E

ÇCi i

fi

fi

.( / )4

i : 1, 2, 3

Çi : i. çeyrek

Li : i. çeyreğin içinde bulunduğu sınıfın başlangıç değeri

E fi : i. çeyreğin içinde bulunduğu sınıftan bir önceki sınıfın eklemeli frekansı

Ç fi : i. çeyreğin içinde bulunduğu sınıfın frekansı

C : sınıf aralığı

1 24100 4 19

72 25 7Ç

/. 2 30

2 100 4 43

132 31 1Ç

( / ).

3 343 100 4 66

92 36Ç

( / )

Ondalıklar (Desiller)• Değer bakımından sıraya dizilmiş verilerin her onda birinin değeri ondalık adını alır. • Bunlar diziyi on eşit parçaya bölerler. • 5. ondalık değeri aynı zamanda Ç2 ve O.D.'e eşit olur. • 9 tane ondalık değeri hesaplanabilir

O Li n E

OCi i

fi

fi

( / )10

i : 1, 2, 3, 4, 5, 6, 7, 8, 9

Oi : i. ondalık

iL : i. ondalığın içinde bulunduğu sınıfın başlangıç değeri

E fi : i. ondalığın içinde bulunduğu sınıftan önceki sınıfın eklemeli frekansı

O fi : i. ondalığın içinde bulunduğu sınıfın frekansı

C : sınıf aralığı

Örnek 5.13: Sınıflandırılmış frekans tablosunda, O1, O4 ve O8'i hesaplayalım

Sıra numaraları, O1 için 100/10=10O4 için 10x4 = 40O8 için 10x8=80

O Li n E

OCi i

fi

fi

( / )10

i : 1, 2, 3, 4, 5, 6, 7, 8, 9

Oi : i. ondalık

iL : i. ondalığın içinde bulunduğu sınıfın başlangıç değeri

E fi : i. ondalığın içinde bulunduğu sınıftan önceki sınıfın eklemeli frekansı

O fi : i. ondalığın içinde bulunduğu sınıfın frekansı

C : sınıf aralığı

1 201 100 10 8

52 20 8O

.( / ).

428

4 100 10 34

92 29 3O

.( / ). 8

368 100 10 75

82 37 25O

.( / ).

Yüzdelikler (Persantiller)

Yüzdelikler, sıralanmış verileri yüz eşit parçaya bölen değerlerdir.

Y10=O1, Y25=Ç1, Y50=O5, Y75=Ç3

Y Li n E

YCi i

fi

fi

( / )100

i : 1, 2, 3, 4,..............., 99

Li : i. yüzdeliğin içinde bulunduğu sınıfın başlangıç değeri

E fi : i. yüzdeliğin içinde bulunduğu sınıftan önceki sınıfın eklemeli frekansı

Yfi : i. yüzdeliğin içinde bulunduğu sınıfın frekansı

C : sınıf aralığı

Örnek: Sınıflandırılmış frekans tablosunda, Y8, Y30, Y90 değerlerini bulalım.

Y Li n E

YCi i

fi

fi

( / )100

Y8 'in sıra numarası 8.(100/100)=8Y30'un sıra numarası 30.(100/100)=30Y90'ın sıra numarası 90.(100/100)=90

i : 1, 2, 3, 4,..............., 99

Li : i. yüzdeliğin içinde bulunduğu sınıfın başlangıç değeri

E fi : i. yüzdeliğin içinde bulunduğu sınıftan önceki sınıfın eklemeli frekansı

Yfi : i. yüzdeliğin içinde bulunduğu sınıfın frekansı

C : sınıf aralığı

8

30

90

188 100 100 4

42 20

2630 100 100 26

82 27

3890 100 100 83

72 40

Y

Y

Y

.( / )

.( / )

.( / )