jeofİzİkte olasilik ve İstatİstİk dersİ notlarikisi.deu.edu.tr/petek.sindirgi/İstatİstİk...
TRANSCRIPT
JEOFİZİKTE OLASILIK VE İSTATİSTİK DERSİ NOTLARI
JEOFİZİKTE OLASILIK VE İSTATİSTİK DERSİ NOTLARI
Yard. Doç. Dr. Petek SINDIRGI
1.İstatistiğin Mühendislikteki Önemi
Doğada karşılaşılan problemlerin birçoğunda olaya ait değişkenlerin değerleri bilindiğinde kesin ve tek bir çözüm elde edilebilir. Örneğin bir cismin kütlesi ve cisme etkiyen kuvvet bilindiğinde cismin ivmesi hesaplanabilir. Bu gibi olaylarda yasalar deterministik (gerekirci: rastgele olaylara bağlı olmayan ve girdiye göre çıktısı tahmin edilebilen) anlamda bilinmektedir. Ancak bazı olayların da sonuçlarını önceden bilmek mümkün değildir. Ör: Zar atışı.
Mühendislikte doğal olaylardaki veya malzemelerdeki belirsizliklerden dolayı sonuç önceden kestirilemeyebilir. Aşağıda yerbilimlerinde sıkça karşılaşılan bu tür problemlere örnekler verilmektedir:
· Bir petrol bölgesinde daha önce açılmış olan kuyulardan %35 inin boş çıktığı bilinmektedir. Bu bölgede açılması düşünülen yeni 30 kuyudan en çok 8 tanesinin boş çıkma olasılığı nedir?
· Volkanik bir kayacın kimyasal analizinden elde edilen SiO2 değerlerinden yola çıkarak bu kayaç için SiO2 değerlerinin alt ve üst limitleri nelerdir?
· Bir kumtaşı örneğinden elde edilen porozite değerlerini kullanarak bu kumtaşı için ortalama porozitenin belirlenmesi.
Belirsizliklerin etkisiyle problemler alışılagelen yöntemlerle incelenemeyebilir. Bu durumda olasılık teorisi ve istatistik bilimine başvurulur. Jeofizikte araziden toplanan veriler zamanın ya da uzayın bir fonksiyonudur. Bu veriler, istatistiksel yöntemlerle incelenerek, ait oldukları topluluğa ait parametreleri daha sağlıklı bir biçimde saptanabilir.
2. Veri ve Veri Türleri
Veri, kısaca “araştırmacının ilgi alanına giren birimler topluluğu” olarak tanımlanabilir.
2.1. Tanımsal (Deterministic) Veriler:
Matematiksel bağıntılarla belirlenebilen veya deneysel olarak, yinelenerek üretilebilen verilerdir.
Örnek: Isıtılınca suyun sıcaklığının artması, bir sarkacın periyodu, serbest düşen bir cismin ivmesi.
Tanımsal veriler, periyodik (dönemsel) ve periyodik olmayan olarak sınıflandırılabilir.
Periyodik verilerin sinüsoidal ve karışık periyodik alt sınıfları vardır.
2.2 Rastgele (Gelişigüzel) (Random, Stochastic, Non-deterministic) Veriler:
Kesin bir matematiksel bağıntı ile verilemeyen ve deneysel olarak oluşturulamayan verilerdir. Her gözlenen değer birçok olasılığı olan gözlemlerden sadece biridir. Uygulamalı jeofizikte gözlemsel verilere katılarak yorumlarını güçleştiren bozucu ve istenmeyen gürültülerin birçoğu rastgele gürültü olarak modellenir. Rastgele veriler kesikli ve sürekli olmak üzere iki çeşittir:
2.2.1. Kesikli Rastgele Veriler: Örnek uzayındaki eleman sayısı sonludur ( Örn: Bir yıldaki yağışlı gün sayısı ).
2.2.2. Sürekli Rastgele Veriler: Örnek uzayındaki eleman sayısı sonsuzdur ( Örn: Bir noktadaki rüzgar hızı ). Mühendislikte karşılaşılan rastgele değişkenlerin çoğu süreklidir.
3. İstatistiksel Yöntemlere Giriş:
Uygulamalı bilimlerde gözlemler, bir büyüklüğün gerçek değerini bulmak için yapılır. Birçok etkenlerin katkısı nedeniyle, gözlemsel değerler gerçek değerlerden farklıdır. Gözlem sayısı arttıkça gerçek değere o kadar yaklaşılır. Gözlemlerden elde edilen verileri kullanarak bir araştırmacı kullandığı değerlerin gerçek değerlere ne kadar yakın olduğunu bilmek zorundadır. Bir gözlemde saptanmaya çalışılan gerçek bir büyüklük vardır ve gözlem sonucunda bu büyüklüğe en yakın değer aranır. Uygulamalı bilimlerde gözlem yolu ile elde edilen veriler genellikle çeşitli nedenlerle birbirinden çok az farklı değerler taşırlar. Bunlardan bir bölümü kişisel ve aletsel yanılgılardan ileri gelir. Gözlem değerleri bu durumda saçılma gösterebilir. Yerbilimlerinde veri saçılmasının en önemli etkilerinden biri ortamın tekdüze (homojen) ve yön bağımsız (izotrop) olmamasıdır. Nedeni ne olursa olsun, jeofizikte gözlemsel veriler tanımsal olmayan verilerdir. Tanımsal olmamaları nedeni ile ancak istatistikî özellikleri ile belirlenebilirler. Belirli güvenilirlik sınırları içinde olasılık dağılımları incelenebilir. İstatistik yöntemler sadece veri saçılmaları karşısında gerçeğe yakın sonuçlar aramak için kullanılmaz. İstatistik en çok büyüklükler arasındaki karşılıklı ilişkilerin türünü, bunlara ait yöntemleri aramakta kullanılır. Örneğin; olay zaman içinde inceleniyorsa onun zaman bağlı olarak nasıl değiştiği istatistik olarak incelenir. Bu amaca ulaşmak için gözlem sayılarından ve gözlemlerin sayısal değerlerinden yararlanarak histogramlar çizilir.
Şekil 3.1. MTA Genel Müdürlüğü Sondaj Çalışmaları (2004-2008) ile ilgili histogram (MTA Sondaj Dairesi Bşk, 2008)
3.1. Ortalamalar
Aynı olaya ait ölçümler farklı değerler veriyorsa olayı temsil edecek bir ortalama değerin bilinmesi gerekir. Farklı ortalama değer tanımları vardır bunlar:
· Aritmetik ortalama
· Geometrik ortalama
· Harmonik ortalama
· Karekök ortalamadır.
3.1.1. Aritmetik Ortalama
Gözlem verileri toplamının gözlem sayısına bölümüdür.
å
=
=
N
1
i
i
A
x
N
1
X
(1)
Burada , N : Gözlem sayısı, xi : Gözlem değerleridir.
Örnek 3.1:
Bir kayaca ait tabaka eğimleri 39, 12, 43, 81, 30, 9, 86, 20 şeklinde ölçülmüştür. Ortalama tabaka eğimini hesaplayınız.
A
X
= 320/8 = 40
Aritmetik Ortalamanın Özellikleri:
1.
A
X
tüm gözlem değerleri kullanılarak hesaplanır.
2. Her bir gözlem değerinin otalamadan sapmalarının toplamı sıfırdır.
A
i
i
X
x
X
ˆ
-
=
ise ;
å
=
=
N
1
i
i
0
X
ˆ
(2)
3. Bir toplamın ortalaması, ortalamalar toplamına eşittir. X=Y+Z ise,
A
A
A
A
A
i
i
i
i
i
A
Z
Y
X
Z
Y
N
z
N
y
N
)
z
y
(
N
x
X
+
=
+
=
+
=
+
=
=
å
å
å
å
(3)
4. Eğer, x1, x2, ....., xN değerleri küme içinde f1, f2, ....., fn sayısında yinelenmişse aritmetik ortalama;
N
2
1
N
N
2
2
1
1
A
f
......
f
f
x
f
.......
x
f
x
f
X
+
+
+
+
+
+
=
(4)
olarak da bulunabilir. Burada fi değerleri frekanstır.
Örnek 3.2: Aşağıdaki veri setinin aritmetik ortalamasını bulunuz.
54, 58, 63, 54, 65, 58, 54, 58, 67, 54
5
.
58
1
1
1
3
4
67
.
1
65
.
1
63
.
1
58
.
3
54
.
4
X
A
=
+
+
+
+
+
+
+
+
=
5. Gözlem değerleri önemlerine uygun olarak belirli ağırlık katsayıları ile çarpılırsa ağırlıklı ortalama elde edilir.
N
2
1
N
N
2
2
1
1
A
w
......
w
w
x
w
.......
x
w
x
w
X
+
+
+
+
+
+
=
(5)
Burada wi değerleri ağırlık katsayılarıdır.
Örnek 3.3:
Bir öğrencinin ödev değerlendirmesi 68, ara sınav 36 ve finali ise 48 dir. Sınıf geçmeye etki eden ağırlık katsayıları ise w1 = 2, w2 = 3, w3 = 5 dir. Öğrencinin sınıf notunun aritmetik ortalamasını bulunuz.
4
.
48
10
484
5
3
2
48
.
5
36
.
3
68
.
2
X
A
=
=
+
+
+
+
=
6. Aritmetik ortalama en büyük ve en küçük değerlerden büyük ölçüde etkilenir. Bu nedenle başka ortalamalar kullanılabildiği gibi iki uç değer atılabilinir.
Örnek 3.4:
Örnek 3.1’de bir kayaca ait tabaka eğimleri 39, 12, 43, 81, 30, 9, 86, 20 idi. En büyük ve en küçük değerleri atarak aritmetik ortalamayı yeniden hesaplayınız.
9 ve 86 veriden çıkarılarak;
5
.
37
6
225
X
A
=
=
3.1.2. Geometik Ortalama
Seriyi oluşturan verilerin çarpımının, veri sayısına eşit dereceden köküdür.
N
N
2
1
G
x
.....
x
.
x
X
=
(6)
N
N
1
i
i
G
x
X
Õ
=
=
(7)
Örnek 3.5: 2, 4, 9, 20, 36 serisinin geometrik ortalamasını hesaplayınız.
G
X
=
77
.
8
51840
36
.
20
.
9
.
4
.
2
5
5
=
=
Veri sayısının aşırı artması geometrik ortalamanın hesaplanmasını zorlaştırır. Bu durumda her iki tarafın logaritması alınır;
å
=
=
N
1
i
i
G
x
log
N
1
X
log
(8)
Ters logaritma alınarak geometrik ortalama bulunur.
Örnek 3.6: Örnek 3.5’deki verilerin geometrik ortalamasını logaritma alarak hesaplayınız.
G
X
log
=
942932
.
0
)
36
log
20
log
9
log
4
log
2
(log
5
1
=
+
+
+
+
G
X
=8.77
Geometrik Ortalamanın Özellikleri:
1.
G
X
tüm gözlem değerleri kullanılarak hesaplanır.
2. Seriyi oluşturan değerler içinde sıfır veya negatif değerin bulunması durumunda geometrik ortalama hesaplanamaz.
3. Geometrik ortalama her zaman aritmetik ortalamadan küçüktür.
4. Geometrik ortalama uç değerlerden aritmetik ortalama kadar etkilenmez.
3.1.3. Harmonik Ortalama
Seriyi oluşturan verilerin terslerinin aritmetik ortalamasının tersidir.
å
=
=
N
1
i
i
H
x
1
N
X
(9)
Örnek 3.7:
2, 4, 7, 8, 9 serisinin harmonik ortalamasını bulunuz.
H
X
=
9
1
8
1
7
1
4
1
2
1
5
+
+
+
+
= 4.5
Harmonik Ortalamanın Özellikleri:
1. Frekans dağılımlarında harmonik ortalama
å
å
=
+
+
+
+
+
+
=
i
i
i
N
N
2
2
1
1
N
2
1
H
f
x
1
f
f
x
1
...
f
x
1
f
x
1
f
......
f
f
X
(10)
bağıntısı ile hesaplanır.
2. Seriyi oluşturan değerlerden biri sıfır ise harmonik ortalama sıfıra eşit olur.
3. Eğer seride farklı işaretli değerler varsa harmonik ortalama anlamsız sonuçlar verir.
3.1.4. Karekök (Root Mean Square) Ortalama
Seriyi oluşturan değerlerin karelerinin ortalamasının kareköküdür.
N
x
X
2
i
K
å
=
(11)
olarak ifade edilir.
Örnek 3.8:
3, 5, 5, 7, 13 serisinin karekök (RMS) ortalamasını bulunuz.
K
X
=
44
.
7
4
.
55
5
13
7
5
5
3
2
2
2
2
2
=
=
+
+
+
+
Karekök Ortalamanın Özellikleri:
1. Frekans dağılımlarında karekök ortalama
å
å
=
=
+
+
+
+
+
+
=
i
N
1
i
2
i
i
N
2
1
2
N
N
2
2
2
2
1
1
K
f
x
f
f
......
f
f
x
f
......
x
f
x
f
X
(12)
bağıntısı ile hesaplanır.
2. Karekök ortalama en çok fiziksel uygulamalarda kullanılır.
3.2. Diğer Parametreler
Dağılımın merkezini tanımlamakta serinin tüm değerlerini içermeyen parametreler de kullanılır. En çok kullanılanları “tepe değeri (mod)” ve “orta değer (medyan)”dır.
3.2.1. Tepe Değeri (Mod)
Bir örnek yada toplumda en çok rastlanan değere (en büyük frekansa sahip sınıf değerine) “tepe değeri (mod)” denir. M0 ile gösterilir.
Örnek 3.9:1,1,2,2,2,6,6,7,8,9,10 serisinin tepe değeri (modu) nedir? M0 = 2 dir.
Örnek 3.10:1,1,2,2,2,6,7,7,7,10 serisinin tepe değeri (modu) nedir?
M0 = 2 ve M0 = 7 dir, gözlem grubu iki tepelidir.
Örnek 3.11: 3,5,5,5,6,6,6,7,9,9,9 serisinin tepe değeri (modu) nedir?
En çok tekrarlanan değerler yan yana olduğunda bu değerlerin aritmetik ortalaması tepe değer olarak alınır.
(5+6)/2= 5.5
Serinin tepe değerleri 5.5 ve 9 dur.
3.2.2. Orta Değer (Medyan)
Düzenli ve eleman sayısı tek olan serilerde gözlemlerin ortasındaki, çift sayılı düzenli serilerde ortada kalan iki gözlem değerinin aritmetik ortalamasıdır. Çok sayılı verilerde orta değer hesaplaması zorlaşır. Bu durumda frekans analiz çizelgesi düzenlenerek orta değer hesaplanır. Orta değer Md ile gösterilir.
Matematiksel olarak, x1, x2, x3, ……, xN gözlem değerleri büyüklüklerine göre artan sırada düzenlenmişlerse Md;
EMBED Equation.3
ï
î
ï
í
ì
+
=
+
ise
çift
N
2
x
x
ise
tek
N
x
M
1
2
N
2
N
1)/2
-
(N
d
(13)
Örnek 3.12: 2, 3, 8, 12, 20, 18, 5, 9, 7 serisinin orta değeri (medyanı) nedir?
4
4
3
4
4
2
1
4
3
4
2
1
4
4
20
18,
12,
9,
8,
,
7
5,
3,
2,
Md: 8 dir.
Örnek 3.13: 5, 14, 21, 6, 9, 12, 15, 3 serisinin orta değeri (medyanı) nedir?
3, 5, 6, 9, 12, 14, 15, 21 Md = (9+12)/2 = 10.5
Ödev 1:
Aşağıdaki veri setinin aritmetik, geometrik ve harmonik ortalamalarını, mod ve medyan değerlerini bulunuz.
2, 7, 21, 14, 5, 9, 9
3.3. Ortalama Değer Etrafındaki Saçılmalar
Bir veri kümesini en iyi temsil edebilecek büyüklük olan ortalama değer, dağılımı karakterize etmek için yeterli değildir. Bu nedenle frekans dağılımlarını ortaya koymada ortalama değer yanında, bu dağılımların ortalama değer etrafındaki saçılmalarının derecesi de önemlidir. Bu saçılmaları açıklayabilmek için bazı tanımların yapılması gereklidir.
3.3.1. Aralık (Range)
Bir serideki en büyük ile en küçük değer arasındaki farktır. AR ile gösterilir.
AR = xmax – xmin
(14)
Örnek 3.14:
a) 6, 5, 4, 3, 8, 2, 30, 15
b) 4, 35, 17, 19, 28, 41, 6
Yukarıda verilen iki serinin aralıklarını bulunuz.
a) AR = 30 - 2 = 28 b) AR = 41 – 4 = 37
3.3.2. Ortalama Sapma
Verilen ortalama veya orta değerden sapmaların mutlak değerlerinin ortalamasıdır. Aritmetik ortalamaya göre hesaplanırsa;
N
x
x
.
S
.
O
N
1
i
A
i
å
=
-
=
(15)
olarak verilir. Orta değere göre hesaplanırsa;
N
M
x
.
S
.
O
N
1
i
d
i
å
=
-
=
(16)
Örnek 3.15:
1, 1, 2, 4, 6, 7, 10, 17 serisinin ortalama sapmasını
a) aritmetik ortalama ve
b) orta değere göre hesaplayınız.
a)
6
8
48
8
17
10
7
6
4
2
1
1
x
A
=
=
+
+
+
+
+
+
+
=
b) Md = (4+6) / 2 = 5
4
8
32
8
6
x
.
S
.
O
8
1
i
i
=
=
-
=
å
=
4
8
32
8
5
x
.
S
.
O
8
1
i
i
=
=
-
=
å
=
Ortalama sapmanın aritmetik ortalama ve orta değere göre hesaplanması sonucu eşit çıkması zorunlu değildir.
Frekans serilerinde ortalama sapma;
x1, x2, x3, ……, xN verilerinin yenilenme sayıları (frekansları) f1, f2, f3, ……, fN ise ortalama sapma,
å
å
=
=
-
=
N
1
i
i
N
1
i
i
A
i
f
f
x
x
.
S
.
O
(17)
ve
å
å
=
=
-
=
N
1
i
i
N
1
i
i
d
i
f
f
M
x
.
S
.
O
(18)
olarak hesaplanır.
Ödev 2:
xi=10, 11, 13, 14, 17, 20 ve fi = 2, 8, 6, 4, 4, 1 serisinin ortalama sapmalarını
A
x
ve Md ‘e göre hesaplayınız.
3.3.3. Değişinti (Varyans)
Gözlemsel veriler az ya da çok saçılma gösterirler. Verilerin ortalama değer çevresinde saçılmalarını sayısal olarak göstermek için değişintiden yararlanılır. Ortalama sapma veya saçılmaların bir ölçüdür. Gözlemsel verilerin her birinin ortalama değerden olan farklarının karelerinin aritmetik ortalamasıdır.
(
)
2
N
1
i
i
2
x
x
N
1
å
=
-
=
s
(19)
bağıntısı ile verilir.
Ortalama değer çevresindeki saçılmayı sayısal olarak belirtmek için değişinti yerine standart
sapma kullanılır ve değişintinin karekökü olarak ifade edilir.
(
)
2
N
1
i
i
x
x
N
1
å
=
-
=
s
(20)
Pratikte sayısal hesaplamaları kolaylaştırmak için standart sapma aşağıdaki bağıntı ile hesaplanır.
2
A
N
1
i
2
i
x
N
x
-
=
s
å
=
(21)
Örnek 3.16: 2, 5, 6, 8, 9 verisinin standart sapmasını bulunuz.
6
x
A
=
dır.
449
.
2
5
)
6
9
(
)
6
8
(
)
6
6
(
)
6
5
(
)
6
2
(
2
1
2
2
2
2
2
=
ú
û
ù
ê
ë
é
-
+
-
+
-
+
-
+
-
=
s
3.3.3.1. Durağanlık Sınırı
Bir veri grubu içinde ortalama değerden olan farkların standart sapmanın (2, (3 katı veya daha büyük olan veriler veri grubundan çıkartılarak işlemler yinelenebilir. Bu durumda veri kümesinin sınırları daraltılarak yanılgılar içerenler atılarak veri iyileştirilmiş olur. Bu sınır durağanlık sınırı olarak adlandırılır ve
s
±
£
-
n
)
x
x
(
A
i
0 < n < 3
(22)
bağıntısı ile verilir.
Örnek 3.17:
2, 5, 6, 8, 9 verisinin n = ( 2 olarak seçildiğinde durağanlık sınırlarını saptayınız ve bu sınırlar içine girmeyen verileri bulunuz.
6
5
9
8
6
5
2
x
A
=
+
+
+
+
=
45
.
2
5
)
6
9
(
)
6
8
(
)
6
6
(
)
6
5
(
)
6
2
(
2
/
1
2
2
2
2
2
=
þ
ý
ü
î
í
ì
-
+
-
+
-
+
-
+
-
=
s
9
.
4
45
.
2
x
2
.
2
=
=
s
1
6)
-
(5
4
)
6
2
(
=
=
-
4 < 4.9 1< 4.9
0
)
6
6
(
=
-
2
)
6
8
(
=
-
3
)
6
9
(
=
-
Tüm veriler durağanlık sınırı içindedir.
0 < 4.9 2 < 4.9 3 < 4.9
3.3.3.2. Değişinti ve Standart Sapmanın Özellikleri
1. Dağılımdaki her bir veriye sabit bir değer eklendiği veya çıkarıldığı zaman değişinti ve standart sapma değişmez.
2. Dağılımdaki her bir veri, sabit bir değer ile çarpıldığında değişinti bu sabitin karesi kadar büyür.
3. x ve y gibi iki serinin toplamı durumunda değişinti :
(
)
(
)
N
y
y
x
x
2
N
1
i
A
i
A
i
2
y
2
x
2
y
x
å
=
+
-
-
+
s
+
s
=
s
(23)
x ve y gibi iki serinin farkları durumunda değişinti:
(
)
(
)
N
y
y
x
x
2
N
1
i
A
i
A
i
2
y
2
x
2
y
x
å
=
-
-
-
-
s
+
s
=
s
(24)
3.3.3.3. Ortak değişinti (Kovaryans)
İki veri setinin ortak ortalamaları etrafında beraberce gösterdikleri değişimin bir ölçüsüdür. (23) ve (24) bağıntılarından yararlanarak,
)
y
y
)(
x
x
(
1
N
1
KV
A
i
A
N
1
i
i
xy
-
-
-
=
å
=
(25)
Kovaryans değeri, +( ile – ( arasındadır.
Kovaryansın Yorumu:
· Kovaryans iki rastgele değişken arasında istatistiksel bir ölçüdür. Kovaryans iki değişkenin birlikte hareketini ya da değişiminin yönünü gösterir.
· Kovaryans(+)=>iki rastgele değişken aynı yönde hareket etmektedir.
· Kovaryans(-)=>iki rastgele değişken zıt yönde hareket etmektedir.
· Kovaryans(0)=> iki rastgele değişken arasında doğrusal bir ilişki yoktur
3.3.3.4. İlişki Katsayısı (Korelasyon)
İki veri setinin ortak değişintisinin, serilerden her birinin standart sapmalarının çarpımına oranıdır. İki rastgele değişken arasındaki doğrusal ilişkinin yönünü ve gücünü belirtir. Genel istatistiksel kullanımda ilişki katsayısı, bağımsızlık durumundan ne kadar uzaklaşıldığını gösterir.
y
x
xy
xy
KV
R
s
s
=
(26)
Tam bir artan doğrusal ilişkinin varlığı halinde ilişki katsayısı 1 değerini alır, tam bir azalan ilişkinin varlığı halinde ise ilişki katsayısı -1 değerini alır. Katsayının alabileceği diğer tüm değerler ise ilişkinin doğrusallığına bağlı olarak bu iki değer arasında olacaktır. Katsayı +1'e veya -1'e ne kadar yakınsa ilişkinin doğrusallığı o kadar güçlüdür.
Değişkenler istatistiksel olarak bağımsız ise ilişki 0'dır fakat bunun tersi doğru değildir, çünkü korelasyon katsayısı yalnızca doğrusal olan ilişkiyi belirler.
Bir seri (x, y) noktalar ve her set için x ile y arasındaki ilişki katsayısı değeri.
Yukarı sıradan görüldüğü gibi korelasyon bir doğrusal ilişkinin yönünü ve
rastgele yayılımını yansıtır. Orta sıradan anlaşılmaktadır ki korelasyon
ilişkinin eğiliminden etkilenmez. Son sıranın amacı ilişkinin doğrusal
olmayan bağlantılardan da etkilenmediğini göstermektir.
3.3.3.5. Standart Yanılgı
A
x
, xi gözlemsel değerlerinin aritmetik ortalaması ve ( da standart sapması ise
A
x
’nın standart yanılgısı;
N
s
=
a
(27)
olarak verilir ve uygulamada
A
x
( ( olarak belirtilir.
Herhangi bir f(x1, x2, …xn) fonksiyonun standart yanılgısı;
2
1
2
n
2
n
2
2
2
2
2
1
2
1
x
f
.......
x
f
x
f
ú
ú
û
ù
ê
ê
ë
é
a
÷
÷
ø
ö
ç
ç
è
æ
¶
¶
+
+
a
÷
÷
ø
ö
ç
ç
è
æ
¶
¶
+
a
÷
÷
ø
ö
ç
ç
è
æ
¶
¶
=
a
3.3.3.5. Normalleştirme (Standartlaştırma) İşlemi
Dağılımdaki birimlerin etkilerinin yok edilmesi ve dağılımın karşılaştırılmasına elverişli hale getirilmesi işlemidir.
s
-
=
A
i
i
x
x
z
(28)
ile verilen normalleştirme işleminin aritmetik ortalaması sıfır, standart sapma ve değişintisi 1’dir.
Örnek 3.18:
Bir yerde yapılan gözlemlerden yerçekimi ivmesi için, g = 980.1, 980.3, 978.9 değerleri ölçülmüştür. Yöredeki yerçekimi ivmesini yanılgısı ile beraber hesaplayınız.
A
g
= 979.76
62
.
0
=
s
36
.
0
3
62
.
0
N
=
=
s
=
a
36
.
0
76
.
979
g
±
=
Örnek 3.19:
Sismik yansıma uygulamasında bir ara yüzey derinliği h = V.to ile verilir. V ara yüzeye kadar olan hız, to sismik dalganın ara yüzeye gidiş-geliş süresinin yarısıdır. Yapılan bir çalışmada V= 2500 ( 50 m/sn ve zaman to = 0.5 ( 0.004 sn olduğuna göre, arayüzey derinliğini bulunuz.
h = V.to = 2500 x 0.5 = 1250 m.
Herhangi bir f(x1, x2, …xn) fonksiyonun standart yanılgısı;
2
1
2
n
2
n
2
2
2
2
2
1
2
1
x
f
.......
x
f
x
f
ú
ú
û
ù
ê
ê
ë
é
a
÷
÷
ø
ö
ç
ç
è
æ
¶
¶
+
+
a
÷
÷
ø
ö
ç
ç
è
æ
¶
¶
+
a
÷
÷
ø
ö
ç
ç
è
æ
¶
¶
=
a
idi.
[
]
2
1
2
t
2
2
V
2
o
2
1
2
t
2
o
2
V
2
o
o
V
t
t
h
V
h
a
+
a
=
ú
ú
û
ù
ê
ê
ë
é
a
÷
÷
ø
ö
ç
ç
è
æ
¶
¶
+
a
÷
ø
ö
ç
è
æ
¶
¶
=
a
[
]
.
m
93
.
26
004
.
0
2500
50
5
.
0
2
1
2
2
2
2
=
+
+
+
=
a
EMBED Equation.3
m
27
@
h = 1250 ( 27 metredir.
4. Frekans Dağılımları ve Histogramlar
Pek çok mühendislik dalında ve jeofizikte yapılan gözlemleri sınıflara ayırmak ve her gruptaki veri sayısını bilmek önemlidir. Bu aşamada her gruptaki veri sayısına frekans denir.
Eldeki örneğin analizi ile rastgele değişkenin olasılık dağılımının tahminine frekans analizi denir. Gözlem toplumunun tümünü gözlemek mümkün olmadığından olasılık dağılımının eldeki örneğin analizi ile elde edilen frekans dağılımına eşdeğer olduğu kabul edilir.
N elemanlı bir gruptaki xi verisi ni defa görülüyorsa bu verinin frekansı:
N
n
)
x
(
f
i
i
=
(29)
olarak tanımlanır. Bu şekilde hesaplanan
)
x
(
f
i
değerleri xi’ye göre sütun diyagram olarak grafiklendiğinde frekans grafiği elde edilir. Her bir frekans değeri bir sonraki ile toplanarak, yani üst üste yığılarak eklenik (kümülatif, yığınsal) frekans dağılımı elde edilir ve aşağıdaki gibi hesaplanır:
)
x
(
f
N
n
)
x
(
F
i
1
j
j
i
1
j
j
i
å
å
=
=
=
=
(30)
Her sınıfın ve grubun alt ve üst sınırları vardır. Alt ve üst sınırlar arasında kalan yere sınıf veya grup aralığı denir.
Örneğin; ögrencilerin ağırlıklarının en küçük değeri 38 kg, en büyük değeri 68 kg ise ağırlık aralığı 68-38=30 kg’dır.
Frekans dağılımlarını grafik üzerinde incelemek daha kolaydır ve böylece değişik sınıflara ilişkin frekansları kolayca karşılaştırma olanağı elde edilir. Bu tür grafiklere histogram denir. Bir başka ifadeyle frekans dağılımının grafik gösterimi histogram eğrisidir. Histogramlarda yatay eksende sınıf aralıkları, düşey eksende de frekanslar gösterilir.
Örnek 4.1:
Büyüklükleri aşağıdaki gibi verilen depremleri sınıflara ayırarak histogramını ve frekans
dağılım grafiğini çiziniz. Veri aralığını bulunuz.
1.2
3.1
2.1
2.3
3.1
1.7
1.8
1.9
3.2
4.1
2.2
1.8
1.5
1.6
2.2
3.2
3.3
4.1
2.2
2.8
4.1
4.2
3.1
3.2
4.4
Xmax = 4.4
Xmin = 1.2
Veri aralığı = Xmax – Xmin = 4.4 - 1.2 = 3.2
1 = xi<2 (7 adet)
2 = xi<3 (6 adet)
3 = xi<4 (7 adet)
4 = xi<5 (5 adet)
Toplam 7+6+7+5=25 veri
Histogramlar kimi zaman aşağıdaki şekildeki gibi poligon biçiminde gösterilebilir. Bunlara frekans dağılım eğrisi (poligonu) adı verilir. Frekans dağılım eğrilerinde en büyük frekansla meydana gelen olaya frekans dağılımının modu adı verilir.
Ödev 3:
90 öğrencinin bulunduğu bir sınıfta yapılan bir sınavda notların dağılımı aşağıdaki gibidir. (29) ve (30) denklemleri ile frekansları ve eklenik frekans dağılımlarını hesaplayarak grafiklerini çiziniz.
i
x
3
4
5
6
7
8
9
10
i
n
1
2
5
12
19
25
18
8
)
x
(
f
i
)
x
(
F
i
4.1.Çarpıklığına göre frekans dağılımları:
Çarpıklık, bir dağılıma ilişkin ölçme sonuçlarının nasıl dağıldığı hakkında bilgi verir.
Çarpıklık katsayısı aşağıdaki gibi hesaplanır:
Çarpıklık katsayısı (ÇK) =
s
-
)
M
x
(
3
d
A
ÇK>0 ise sağa çarpık dağılım, ÇK=0 ise normal dağılım, ÇK<0 ise sola çarpık dağılım
4.1.1. Simetrik (Normal) Dağılım
– Mod, medyan ve aritmetik ortalama birbirine eşittir (
A
d
0
x
M
M
=
=
).
– Çarpıklık değeri sıfırdır.
– Merkezi eğilim ölçülerine göre normal bir dağılımdır.
4.1.2. Sağa Çarpık Dağılım
–
A
d
0
x
M
M
<
<
ise dağılım sağa çarpıktır.
– Çarpıklık değeri pozitiftir.
– Örneğin başarısız bir sınıfın dağılımıdır.
4.1.3. Sola Çarpık Dağılım
–
A
d
0
x
M
M
>
>
ise dağılım sola çarpıktır.
– Çarpıklık değeri negatiftir.
– Örneğin başarılı bir sınıfın dağılımıdır.
Örnek 4.2:
9 öğrencinin jeofiziğe giriş dersinden aldığı notlar şu şekildedir:
100, 90, 80, 75, 60, 50, 20, 90, 10
Bu notların modunu, meydanını, aritmetik ortalamasını ve Ç.K.’nı hesaplayarak dağılım grafiğini çiziniz, sınıfın başarı durumunu değerlendiriniz.
Çözüm:
Öncelikle verileri sıralayalım:
10, 20, 50, 60, 75, 80, 90, 90, 100
Mod : 90, En fazla frekansa sahip (2 kez tekrar eden) dağılımın modudur.
N=9 tek olduğundan medyan değeri : 75 tir.
A
x
= 63.8
( = 31,8
Çarpıklık katsayısı (ÇK)=
s
-
)
M
x
(
3
d
A
=
-1.05
Buna göre
A
d
0
x
M
M
>
>
, Sola çarpık bir grafiktir. Sınıf başarılıdır.
5. Momentler
Frekans dağılımlarını ortalama ve saçılmalar temsil eder, Bununla birlikte frekans dağılımlarının özellikleri belirlenirken serinin simetrik durumdan ne kadar uzaklaştığının ölçülmesi gerekir. Bu da istatistik momentlerle hesaplanır. Kısacası değişkenin belli bir değerden veya aritmetik ortalamadan sapmalarının değişik kuvvetlerinin beklenen değerine moment adı verilir.
Bir x değişkeni N adet değer alıyor ise bunun sıfır etrafındaki r’ninci momenti;
N
x
x
N
1
i
r
i
r
å
=
=
(31)
Aritmetik ortalama etrafındaki r’ninci moment ise,
N
)
x
x
(
m
r
N
1
i
A
i
r
x
å
=
-
=
(32)
şeklinde hesaplanır. r = 2 alındığında (32) bağıntısı (19) nolu değişinti (varyans) bağıntısı ile aynı olur. Bu durumda Standart sapma 2. momentin kareköküdür denilebilir.
Friedman (1978), sedimentlerin tane boyu analizlerinde kullanılan parametreleri hesaplamada moment ölçümlerini kullanmıştır.
Örnek 5.1:
11
,
9
,
6
,
6
,
5
,
2
,
2
,
1
x
i
=
tane boyu değerleri serisinin sıfır etrafındaki birinci ve ikinci, ortalama etrafındaki ikinci momentlerini bulunuz.
i
x
2
i
x
x
x
i
-
x
(
x
x
i
-
)2
1
1
-4.25
5.25
18.0625
2
4
-3.25
10.5625
2
4
-3.25
10.5625
5
25
-0.25
0.0625
6
36
0.75
0.5625
6
36
0.75
0.5625
9
81
3.75
14.0625
11
121
5.75
33.0625
42
308
87.5000
N=8 dir ve sıfır etrafında birinci ve ikinci momentleri;
25
.
5
8
42
N
x
x
N
1
i
i
1
=
=
=
å
=
5
.
38
8
308
N
x
x
N
1
i
2
i
2
=
=
=
å
=
Aritmetik ortalama etrafındaki ikinci moment ise,
9375
.
10
8
5
.
87
N
)
x
x
(
m
2
N
1
i
A
i
2
x
=
=
-
=
å
=
6. Olasılık Teorisi
6.1. Rastgele Değişken ve Rastgele Olay
Rastgele Değişken gelecekte bir gözlemde alacağı değer önceden kesinlikle bilinemeyen bir değişkendir. Örneğin zar atışında gelebilecek sayı önceden bilinemez. Bir depremin herhangi bir gündeki büyüklüğü de önceden bilinemez. Belirsizlik doğal olaylardaki değişimlerden kaynaklanabileceği gibi olay hakkındaki bilgilerimizin eksikliğinden de ileri gelebilir. Böyle değişkenleri deterministik bir yaklaşımla incelemek mümkün değildir. Bunun yerine probabilistik (olasılıkçı) bir yaklaşım gerekir.
Değişkenin gelecekte alacağı değer kesin olarak bilinemeyeceğine göre ancak değişkenin belli bir değeri alma şansı hesaplanabilir. Bir rastgele değişkenin bir gözlem sırasında belli bir değeri almasına rastgele olay denir. Böylece herhangi bir rastgele olayın görülme şansını belirlemek mümkündür. Örneğin bir zar atışında 1 ile 6 arasında seçilen herhangi bir sayının görülme şansı belirlenebilir.
6.2. Küme Kavramı
Küme kavramı: Kesin bir şekilde tanımlanmış elemanlardan oluşur.
Küme adı büyük harfle, elemanları küçük harfle gösterilir.
Örnek:
S =
{
}
ü
,
u
,
ö
,
o
,
i
,
ı
,
e
,
a
ya da
S =
{
}
harf
sesli
bir
deki
'
Türkçe
:
s
Bir kümenin elemanı olma : a
Î
S,
Elemanı olmama : z
Ï
S
Hiçbir elemanı olmayan küme : boş küme ((),
Alt küme (A
Ì
C) : Bir kümenin bütün elemanları diğer bir kümenin de elemanları ise ilk küme ikinci kümenin bir alt kümesidir.
Venn diyagramı : Küme- alt küme ilişkilerini açıklamak için kullanılan grafikleme.
Kesişim(A
)
B
Ç
Birleşim(
B
A
È
)
Ayrık kümeler.
6.3. Olasılık Kavramı
Bir rastgele olayın meydana gelme şansı olasılık (probabilite) adı verilen bir büyüklükle ifade edilir. Olasılık teorisinde her rastgele olayın, değeri 0 ile 1 arasında değişen bir olasılığı vardır. X rastgele değişkeninin bir gözlem sırasında aldığı değer xi ise, bu olayın olasılığı şu şekilde gösterilir:
P( X = xi ) = pi
(33)
i
p
olasılık değeri 0 ile 1 arasında değişebilir. Olasılığın 0 olması olayın hiç bir zaman meydana gelmeyeceğini, 1 olması ise, kesinlikle (her gözlemde) meydana geleceğini gösterir.
Aşağıda örnek olarak, çeşitli faylar için hazırlanmış, 2030 yılından önce M ( 6.7 olan en az bir deprem olma olasılıkları verilmektedir (USGS Open-File Report 99-517, Earthquake Probabilities in the San Francisco Bay Region: 2000 to 2030—A Summary of Findings, 1999).
Fay Sistemi
Olasılık
San Gregorio
0.10
San Andreas
0.21
Hayward-Rodgers Creek
0.32
Calaveras
0.18
Concord-Green Valley
0.06
Greenville
0.06
Mount Diablo
0.04
Örnek 6.1:
Bir zar atışında 1 ve 7 gelme olasılığı nedir? 1 ile 6 arasında herhangi bir sayı görülme olasılığı nedir?
P( X = 1 ) = 1/6 = 0.166 , zarda 7 olmadığından olasılığı P( X = 7 ) = 0
1 ile 6 arasında herhangi bir sayı görülmesi kesin olduğundan bu olayın olasılığı 1’dir.
P( X = 1
È
X = 2
È
X= 3
È
X = 4
È
X = 5
È
X = 6) =1
Mühendislikte karşılaşılan problemler bu kadar basit değildir, bu nedenle olasılıklar o olaylın oluş frekansına ( fi = ni / N ) bağlı olarak hesaplanır. Gözlem sayısı arttıkça fi hızlı olarak pi’ye yaklaşır. Bu nedenle hesaplanan fi’lere o olayın olasılığı gözü ile bakılır.
N
/
n
lim
p
i
N
i
¥
¾
®
¾
=
(33)
6.4. FAKTÖRİYEL, PERMÜTASYON VE KOMBİNASYON
6.4.1. FAKTÖRİYEL
1’den n’e kadar olan tamsayıların çarpımına “n faktöriyel” denir ve n! şeklinde gösterilir.
1.2.3.....n = n!
0!=1
1!=1
2!=1.2 = 2
3!=1.2.3= 6
4!=1.2.3.4 = 24
n! = n.(n-1)! = n.(n-1).(n-2)!
6.4.2. PERMÜTASYON :
r ve n pozitif doğal sayılar ve r
£
n olmak üzere , n elemanlı bir A kümesinin r elemanlı sıralı r’ lilerine A kümesinin r’li permütasyonları denir. n elemanlı A kümesinin r’ li permütasyonlarının sayısı,
P(n,r)= n! / (n−r)!
(35)
denklemi ile bulunur.
Örnek 6.2:
5 Bay ve 3 bayan yan yana sıralanacaktır.
a) Bu 8 kişi yan yana kaç farklı şekilde sıralanabilir?
b) Bu 8 kişi bayanlar yan yana gelmek şartıyla kaç farklı şekilde sıralanabilir?
c) Bu 8 kişi bayanlar yan yana gelmemek şartıyla kaç farklı şekilde sıralanabilir?
Çözüm :
a) 8 Kişi yan yana 8! farklı şekilde sıralanır.
b) Bayanlar 1 kişi gibi düşünülürse 6 kişinin sıralanışı söz konusu olur. 6 kişi yan yana 6! farklı şekilde sıralanır, ayrıca bayanlar kendi aralarında 3! farklı şekilde sıralanır. Buna göre bu 8 kişi bayanlar yan yana gelmek şartıyla 6!. 3! farklı şekilde sıralanabilir.
c) Mümkün olan bütün sıralanışların sayısı 8! ve bayanların 3’ünün yan yana geldiği sıralanışların sayısı 6!. 3! Olduğu için bayanların 3’ünün yan yana gelmediği sıralanışların sayısı,
8! - 6!. 3! = 8.7.6! - 6!. 3.2.1 = 6! (56-6) = 50.6! olur.
6.4.3. KOMBİNASYON
r ve n pozitif doğal sayılar ve r
£
n olmak şartıyla n elemanlı bir A kümesinin r elemanlı alt kümelerinin her birine, A kümesinin r ’ li kombinasyonu denir.
n elemanlı kümenin r’li kombinasyonlarının sayısı, C(n,r), C
÷
÷
ø
ö
ç
ç
è
æ
r
n
ya da
÷
÷
ø
ö
ç
ç
è
æ
r
n
ile gösterilir.
n elemanlı kümenin r ' li kombinasyonlarının sayısı,
C (n, r) =
r)!.r!
-
(n
n!
(36)
formülü ile bulunur. Permütasyon ile kombinasyon arasındaki fark şöyledir. Permütasyonda sıralama veya diziliş söz konusudur, seçimden çok, seçilmiş olunan nesnelerin sıralanışı veya dizilişi önemlidir. Kombinasyonda ise, seçim veya seçme söz konusudur. Sıralama ve diziliş yoktur, nesneleri seçmiş olmak yeterlidir.
Kombinasyonun özellikleri:
1.
÷
÷
ø
ö
ç
ç
è
æ
=
÷
÷
ø
ö
ç
ç
è
æ
y
n
x
n
ise x = y veya x+y = n dir.
2.
1
0
n
=
÷
÷
ø
ö
ç
ç
è
æ
dir.
3.
n
1
n
=
÷
÷
ø
ö
ç
ç
è
æ
dir.
4.
1
n
n
=
÷
÷
ø
ö
ç
ç
è
æ
dir.
Örnek 6.3: (2008-KPSS)
1
2
3
4
5
6
Ayşen elindeki değişik renkteki 8 boya kalemini kullanarak yukarıdaki şekilde verilen altı kareyi, 3 ve 6 numaralı kareler aynı renkte diğer kareler de bu karelerden ve birbirinden farklı renklerde olmak koşuluyla boyamak istiyor. Ayşen bu boyama işini kaç farklı biçimde yapabilir?
A) 6720 B) 6048 C) 3024 D) 336 E) 56
Çözüm:
Ayşen elindeki 8 kalemden 1 tanesini
÷
÷
ø
ö
ç
ç
è
æ
1
8
ile seçer ve seçtiği bu kalemle 3 ve 6 numaralı kareleri boyar. Diğer kareler bu karelerden ve birbirinden farklı renklerde olacağından, kalan 7 kalemden 4 tanesini
÷
÷
ø
ö
ç
ç
è
æ
4
7
ile seçer ve seçtiği bu 4 kalemle 1, 2, 4 ve 5 numaralı kareleri boyar. Ancak bu 4 kalemde herhangi bir sıra zorunluluğu olmadığından, bu 4 renk kendi arasında 4! yer değiştirebilir. Sonuç olarak
÷
÷
ø
ö
ç
ç
è
æ
1
8
.
÷
÷
ø
ö
ç
ç
è
æ
4
7
. 4! = 8.
EMBED Equation.3
6720
1
.
2
.
3
.
4
1
.
2
.
3
.
4
4
.
5
.
6
.
7
=
Ödev 4:
Bir lokantada 3 çeşit çorba, 5 çeşit etli yemek, 3 çeşit tatlı bulunmaktadır. Lokantadaki bir müşteri kaç çeşit sıralı, kaç çeşit sırasız menü yiyebilir? (Bir menü 1 çeşit çorba, 1 çeşit etli yemek, 1 çeşit tatlıdan oluşmaktadır.)
7. Olasılık Dağılımları
Mühendislikte örneklere uygulanacak analiz yöntemleri veri toplumuna göre değiştiğinden toplum tiplerinin belirlenmesi gerekir. Toplumların dağılımları bazı fonksiyonlarla iyi ifade edilebilmekte ve mühendisler üzerinde çalıştıkları rastgele değişkenler için bu fonksiyonlardan birini seçip kullanmaktadır.
Olasılık dağılımları veri türlerine göre iki şekilde olabilir:
a) Ayrık olasılık dağılımı:
Sayılabilir şekilde ayrı ayrı sonuçlar ve bunlara bağlı olan pozitif olasılıklar var ise bu dağılım ayrık olasılık dağılımıdır.
b) Sürekli olasılık dağılımı:
Bir sürekli olasılık dağılımı değerleri bir sürekli olan açıklıkta tanımlar ve tek bir değer için olasılık sıfıra eşittir. Örneğin bir okçuluk sahasında atılan bir okun hedef tahtasında tek bir noktaya düşmesi olasılığı sıfırdır; çünkü geometri kuramına göre bir noktanın ne eni ne de boyu bulunmaktadır ve hedef üzerindeki varsayılan nokta sonsuz küçüklüktedir.
Uygulamada en çok kullanılan dağılımlar; Binom, Poisson, Normal (Gauss), Lognormal, Gumbel ve Weibull dağılımlarıdır.
7.1. Binom Dağılımı
7.1.1. Değişken Tanımları:
· Bağımsız değişken: Başka bir değişkeni tahmin etmek için kullanılan değişken çeşididir.
· Bağımlı değişken: Bağımsız değişkenin değişimlerinden etkilenen ve onun verileri ile tahmin edilmeye çalışılan değişkendir.
· Bağımlı ve bağımsız değişkenlerin birbirlerine göre aldıkları değerleri gösteren grafik dağılım grafiğidir. Bu grafiklerde genel olarak x ekseninde bağımsız değişken ve y ekseninde bağımlı değişken değerleri yer alır.
Bir rastgele değişken için her gözlemde sadece iki olaydan birinin olması probleminde, olayın olma olasılığı (başarı) p ve olmama olasılığı (başarısızlık) q olarak tanımlanan dağılımdır. Burada q = 1 - p dir. En iyi örnek olarak zar atışı verilebilir.
Denemede r başarı, N-r başarısızlık olasılığı,
P( r ) =
r
N
r
r
N
r
q
p
)
r
,
N
(
C
q
p
)!
r
N
(
!
r
!
N
-
-
=
-
(37)
bağıntısı ile verilir. Buna Binom dağılımı denir.
N
r
C
katsayısı, r = 0, 1, 2, 3, 4, …., N için
å
=
=
+
=
-
N
0
r
r
N
r
N
1
q
p
)
r
,
N
(
C
)
q
p
(
(38)
N
2
2
N
1
N
N
N
p
)
N
,
N
(
C
.......
p
q
)
N
,
2
(
C
p
q
)
N
,
1
(
C
q
)
N
,
0
(
C
)
p
q
(
+
+
+
+
=
+
-
-
(39)
Şeklinde ifade edilir ve buradaki 1,
)
N
,
1
(
C
,
)
N
,
2
(
C
, ..…. , 1 değerleri Binom katsayılarıdır.
(Not:
)
N
,
0
(
C
=
)
N
,
N
(
C
= 1 dir.)
Binom ortalaması:
p
.
N
x
=
Binom dağılımının değişinti ve standart sapması:
q
.
p
.
N
2
=
s
ve
Npq
=
s
Örnek 7.1: Yazı-tura atışında tura gelmesi başarı sayıldığına göre, 4 atışta;
a) Hiç tura gelmemesi olasılığı,
b) Bir kez tura gelmesi olasılığı,
c) En az iki kez tura gelmesi olasılığını bulunuz.
Çözüm:
a) p =q = 1/2
P(r) =
r
4
r
)
5
.
0
(
)
5
.
0
(
)!
r
4
(
!
r
!
4
-
-
r = 0, 1, 2, 3, 4
r = 0 → P(0) =1/16
b) P(1) =
16
/
4
)
5
.
0
(
)
5
.
0
(
)!
1
4
(
!
1
!
4
1
4
1
=
-
-
c) P( r ( 2) = P(2) + P(3) + P(4) =1 – [P(0) + P(1)] =1- (1/16+4/16) = 11/16
Örnek 7.2: Yazı-tura atışında 6 atışta en az 4 kez tura getirebilme olasılığı nedir?
P(en az 4 tura) =
34
%
2
1
2
1
)
6
,
6
(
C
2
1
2
1
)
5
,
6
(
C
2
1
2
1
)
4
,
6
(
C
0
6
1
5
2
4
=
÷
ø
ö
ç
è
æ
÷
ø
ö
ç
è
æ
+
÷
ø
ö
ç
è
æ
÷
ø
ö
ç
è
æ
+
÷
ø
ö
ç
è
æ
÷
ø
ö
ç
è
æ
Örnek 7.3: Bir yüklenici firma geçmiş yıllarda katıldığı 20 ihalenin 4’ünü kazanmıştır. Bu firmanın 2012 yılında teklif vermeyi planladığı 5 ihaleden en çok 3’ünü kazanma olasılığı nedir? Firmanın kazanmayı beklediği ihale adedi nedir?
Başarı olasılığı: p = 4/20 = 0.2 q = 1-p = 1-0.2 = 0.80
P(r ( 3 ) = P(0) + P(1) + P(2) + P(3)
P(r) =
r
5
r
)
8
.
0
(
)
2
.
0
(
)!
r
5
(
!
r
!
5
-
-
P(0) = 0.328 P(1) = 0.410 P(2) = 0.205 P(3) = 0.051
P(r ( 3 ) =0.328 + 0.410 + 0.205 + 0.051 = 0.994
p
.
N
x
=
= 5. (0,2) = 1 ihale
7.2. Poisson Dağılımı
Deneme sayısı (N) çok büyük ve başarı olasılığı (p) çok küçük olduğu zaman Binom dağılımı limitte Poisson dağılımı adını alır.
N→
¥
p→0 olduğunda :
Lim(np) = m = sabit olur.
N→
¥
p→0
Bununla birlikte p = m / n de Binom dağılımında yazılarak limit alındığında;
P( r ) =
!
r
e
.
m
m
r
-
(40)
bulunur.
Bu bağıntı Poisson bağıntısı olarak bilinir. Burada e = 2.71828’dir.Uygulamada p ( 1 olduğunda Poisson dağılımı kullanılır. m değeri küçüldükçe Poisson Binom dağılımına, çok büyürse Normal (Gauss) dağılıma yaklaşır.
Poisson ortalaması:
p
.
N
m
x
=
=
Poisson dağılımının değişinti ve standart sapması:
p
.
N
m
2
=
=
s
ve
Np
m
=
=
s
Örnek 7.4:
Bir makinenin ürettiği maddelerin bozuk olma olasılığı 0,1 dir. Bu üretimden rastgele seçilen 10 tanesinden en fazla 1 tanesinin bozuk olma olasılığı nedir? Hem Binom hem de Poisson dağılımı ile çözünüz.
Binom dağılımı ile:
P(en fazla 1 bozuk) = C(10,0) (0,1)0 (0,9)10 + C(10,1) (0,1)1 (0,9)9 = 0,7361
Poisson dağılımı ile:
m = n.p = 0,1x10 = 1
P(r = 0) =
3679
,
0
e
e
!
0
e
m
1
m
m
0
=
=
=
-
-
-
P(r = 1) =
3679
,
0
e
!
1
e
m
1
m
=
=
-
-
P(r ( 1) = P(r = 0) + P(r = 1) =0,3679 + 0,3679 = 0,7358
Görüldüğü gibi p çok küçük olduğu için Binom ve Poisson dağılımları çok yakın sonuçlar vermiştir.
Örnek 7.5:
Bir jeotermal ısı merkezi 100 yılda bir görülen büyük depreme göre inşa edilmiştir. Isı merkezinin planlanan hizmet süresi 50 yıldır.
a) Isı merkezinin planlanan hizmet süresi içinde projede kullanılan deprem büyüklüğündeki depreme maruz kalma olasılığı nedir?
b) Aynı olasılığı Binom dağılımı ile hesaplayınız.
Çözüm:
p = 1/100 = 0.01
p
.
N
m
x
=
=
=50 x 0.01 = 0.5
Isı merkezinin planlanan hizmet süresi içinde projede kullanılan deprem büyüklüğündeki depreme bir ya da birden çok defa maruz kalma olasılığı :
P(r ( 1) = 1- P(r < 1) = 1 – P( r = 0 )
P( r = 0 ) =
607
.
0
e
!
0
e
)
5
.
0
(
5
.
0
5
.
0
0
=
=
-
-
P(r ( 1) = 1- 0.607 = 0.393
b) Binom dağılımı ile : p = 0,01 q = 1- 0,01= 0,99 N=50 olmak üzere
P(r = 0) =
605
.
0
)
99
.
0
(
)
01
.
0
(
)!
0
50
(
!
0
!
50
0
50
0
=
-
-
P(r ( 1) = 1- 0.605 = 0.395
Örnek 7.6:
Bir torbada üzerinde 1,2,3,….,10 rakamları yazılı olan 10 top bulunmaktadır. Torbadan çekilen her top torbaya tekrar geriye atıldığına göre;
a) Bir çekilişte 3 nolu topun çıkma olasılığı nedir?
b) Bir çekilişte 3’ten daha büyük bir sayı çıkması olasılığı nedir?
Çözüm:
a) Her topun çekilme şansı aynıdır: P(r = 3) = 1/10
b) Bir çekilişte 3 ya da daha küçük bir topun çıkma olasılığı;
P(r ( 3) = P(r = 1) + P(r = 2) + P(r = 3) = 3/10
P(r > 3 ) = 1 - P(r ( 3) = 1 – 3/10 = 7/10
Ödev 5: Bir petrol bölgesinde yapılan sondajların %2’sinde petrol çıkmaktadır. Bu bölgede yapılacak sondajların 50 tanesinden 4’ünde petrol çıkma olasılığını,
A)Binom dağılımı
B) Poisson dağılımı ile bulunuz. Sonuçları tartışınız.
7.3. Normal (Gauss) Dağılımı
Diğer dağılımlardan farkı sürekli oluşudur. Binom dağılımından yola çıkarak sınıf aralıklarının ikiye ve daha çok aralığa bölünmesi esasına dayanır. Normal dağılım eğrisinin şekli standart sapma tarafından kontrol edilir.
Normal dağılımın bağıntısı,
2
2
/
)
x
x
(
2
1
e
2
1
y
s
-
-
p
s
=
ile verilir.
(41)
Burada (; standart sapma,
x
; ortalama değerdir.
z = (x -
x
) / ( dönüşümü yapıldığında (41) bağıntısı,
2
z
2
1
e
2
1
Y
-
p
=
(42)
Normal dağılımın standart biçimi adını alır. Verilen iki aralıktaki Normal dağılım olasılık değeri, eğrinin altında kalan alanın hesaplanmasıyla bulunur.
ò
p
=
-
1
2
2
z
z
z
2
1
dz
e
2
1
Y
(43)
Dağılımın toplam alanı 1’e eşittir.
Standart normal dağılım eğrisi şu özelliklere sahiptir:
1. Mod = Medyan = Aritmetik ortalama birbirine eşittir.
2. Mod, medyan ve aritmetik ortalama grubu tam ortadan ikiye ayırır.
3. Normal dağılım eğrisinin içinde standart sapmaların arasındaki alanlar hesaplanmıştır.
4. Çarpıklık Katsayısı= 0’dır.
5. Normal dağılım eğrisinin ortalaması 0 ve standart sapması 1’e eşittir.
Örnek 7.7: (Gamgam s.76)
Standart normal değişkeninin 1.06’dan daha küçük değerler alma olasılığı nedir?
Çözüm:
Tablodaki 1. sütundan, 1 değeri yatayda 0.06 ile çakıştığı yerdeki değerdir.
P(z < 1.06) = 0.8554
Olur.
Örnek 7.8: (Spiegel,s.203)
Standart normal değişkeninin z = 0.81 ve z = 1.94 arası değerler alma olasılığı nedir?
Çözüm:
İstenilen alan = (z =0 ile z = 1.94 arası alan ) – (z =0 ile z = 0.81 arası alan )
= 0.4738-0.2910 = 0.1828
8. İstatistiksel testler; Ki-Kare ve T (Student) testi.
İstatistikte gözlemsel dağılımlarla kuramsal dağılımlar arasındaki uyumu incelemek için değişik test yöntemleri geliştirilmiştir.
8.1. Ki-kare ((2 )testi:
Gözlemsel ve beklenen frekanslar sırasıyla gi ve bi olarak tanımlanırsa, bunlar arasındaki uyuşmazlığın derecesi;
n
n
n
b
b
g
b
b
g
b
b
g
2
2
2
2
2
1
2
1
1
2
)
(
....
)
(
)
(
-
+
+
-
+
-
=
c
(44)
olarak tanımlanır. (2 = 0 ise gözlemsel ve beklenen frekanslar birbirleri ile tam uyumludur.
(2 > 0 ise uyum yoktur. Bu durumda örnek sayısının bir eksiği olan serbestlik derecesine göre (2 güvenirlilik sınırları tablolarına bakılır. Bulunan (2 değeri tablo değerinden küçük ise söz konusu yüzdelik içerisinde bir güvenirlilik vardır. Hata oranı azaldıkça güvenirlik artar.
Ki-kare testi ayrıca, örneklerin standart sapmalarından yararlanarak belirli güvenirlilik düzeyinde veri topluluğunun standart sapma sınırlarının belirlenmesinde de kullanılır. Genellikle %95 güvenirlilik düzeyi kullanılır. Bu durumda Ki-kare eğrisinin altında kalan alanın her iki yanından (100-95)/2 = 2.5, %2.5’luk kısım atılacak demektir.
Ki-kare dağılımı,
(
)
[
]
2
2
2
2
2
2
1
2
2
s
=
-
+
+
-
+
-
=
c
Ns
x
x
x
x
x
x
n
/
)
(
.....
)
(
(45)
dir. Burada s2 örneklerin değişintisini, (2 de veri topluluğunun değişintisidir. %95 lik güvenirlilik sınırı içinde (2,
2
975
0
2
2
2
025
0
.
.
c
á
s
á
c
Ns
buradan da;
025
0
975
0
.
.
c
á
s
á
c
N
s
N
s
(46)
olur. Böylece örnek sayısı (N) ve örneklerin standart sapması (s) bilindiğinde veri topluluğunun standart sapmasının (() sınırları kolaylıkla bulunabilir.
Örnek 8.1:
Bir kumtaşından alınan örneklerin poroziteleri aşağıda yüzdelik olarak verilmiştir. Ki-kare testini uygulayarak %95 güvenirlilik düzeyinde,
a) Standart sapmanın sınırlarını,
b) beklenen porozite değerlerinin sınırlarını belirleyiniz.
No
1
2
3
4
5
6
7
8
9
10
Porozite
16
10
14
19
12
22
18
13
25
21
Çözüm:
a) xA=17
S2=
21
2
=
-
å
N
x
x
A
i
)
(
s = 4.5826
Serbestlik derecesi : ( = N-1 = 10-1 = 9
025
0
2
95
0
1
2
1
.
.
=
-
=
c
975
0
025
0
1
2
2
.
.
=
-
=
c
19
2
975
0
=
c
.
7
2
2
025
0
.
.
=
c
036
4
975
0
.
.
=
c
64
1
025
0
.
.
=
c
56
3
975
0
1
.
.
=
c
=
s
N
s
84
8
025
0
2
.
.
=
c
=
s
N
s
84
8
6
3
.
.
á
s
á
b) xA=17, Standart sapma max.
m
%8.84 arasında değişecektir. Porozite değeri (() sınırları
xA - (max < ( < xA + (max
17 - 8.84 < ( < 17 + 8.84
% 8.16 < ( < % 25.84
Örnek 8.2:
Aşağıdaki x değerleri bir bölgedeki sondajlardan elde edilen katman sayılarını göstermektedir. Bu değerlere % 95 güvenle standart sapma sınırlarını ve katman sayısının alt ve üst sınırlarını ki-kare testini uygulayarak bulunuz.
x = 5 , 6 , 6 , 7 , 8 , 9
Çözüm:
83
6
6
41
.
=
=
A
x
N
x
x
s
A
i
2
)
(
-
=
å
36
1
6
1
11
.
.
=
=
5
1
6
1
=
-
=
-
=
u
N
91
0
831
0
58
3
8
12
025
0
2
025
0
975
0
2
975
0
.
.
.
.
.
.
.
.
=
c
®
=
c
=
c
®
=
c
025
0
975
0
.
.
c
á
s
á
c
N
s
N
s
91
0
6
36
1
58
3
6
36
1
.
.
.
.
á
s
á
Þ
66
3
93
0
.
.
á
s
á
Katman sayısının alt ve üst sınırları (
)
max
s
m
A
x
:
6.83 - 3.66 < K < 6.83 + 3.66
3.17 < K < 10.49
8.2. T (Student) testi
T testi, ortalama değeri
x
olan bir veri topluluğu içinden alınan N adet örneğin ortalama değeri ( olmak üzere;
s
-
m
=
/
)
(
x
N
t
(47)
ile tanımlanır. Burada (, seçilen N adet örneğin standart sapmasıdır. Çeşitli güven sınırları için bu test yapılabilir.
T testinin önemli bir uygulaması da veri topluluğunun ortalama değerinin incelenmesidir. Belirli bir güvenirlilik düzeyi içinde ortalama değerin sınırları,
N
t
x
N
t
c
c
s
+
m
á
á
s
-
m
(48)
ile hesaplanır. Burada tc, t’nin verilen güvenirlilik sınırları için kritik değeridir. Örneğin % 95 güvenirlilik için tc, t0.975 olarak alınır.
Örnek 8.3:
Ortalama 100 gr. ürün veren bir fabrikada rastgele alınan 10 paketi gramajları aşağıda verilmiştir. Makinelerin % 95 güvenirlilikle çalışmasını ve ürün toleransını bulunuz.
98, 105, 108, 96, 100, 98, 97, 102, 106, 99
Çözüm:
9
100
.
=
m
EMBED Equation.3
94
3
2
.
)
(
=
-
=
s
å
N
x
x
i
x
=100
s
-
m
=
/
)
(
x
N
t
=
722
0
94
3
100
9
100
10
.
.
)
.
(
=
-
9
1
10
1
=
-
=
-
=
u
N
için
26
2
975
0
.
.
=
t
975
0
.
t
t
<
(0.722<2.26) koşulunu sağladığı için makineler % 95 güvenirlilik sınırı içinde çalışıyor demektir.
Ürün toleransı (alt ve üst sınırları);
N
t
x
x
N
t
c
c
s
m
=
Þ
s
-
m
=
m
/
)
(
10
94
3
26
2
9
100
10
94
3
26
2
9
100
.
.
.
.
.
.
+
<
<
-
x
82
2
9
100
82
2
9
100
.
.
.
.
+
<
<
-
x
x
= 100.9 ( 2.82bulunur.
9. Korelasyon ve Regresyon Analizi
Eğer x ve y iki değişken iseler, dik koordinat sisteminde (x,y) noktaları bir noktalar bulutu halinde görülür ( Bakınız Bölüm 3.3.3.4 ).
Korelasyon analizi; iki yada daha çok değişken arasında ilişki olup olmadığını, ilişki varsa yönünü ve gücünü inceleyen analiz yöntemidir. Regresyon analizi ise, değişkenlerden birisi belirli bir birim değiştiğinde, diğerinin nasıl bir değişim gösterdiğini inceleyen analiz yöntemidir.
9.1. Korelasyon Analizi
9.1.1. Negatif Korelasyon (Ters Orantılı İlişki):
x değişkeni artarken y değişkeni azalıyorsa veya x değişkeni azalırken y değişkeni artıyorsa bu iki değişken arasında negatif korelasyon var demektir. Örneğin, Enflasyon arttıkça vatandaşın alım gücü düşer.
9.1.2. Pozitif Korelasyon (Doğru Orantılı İlişki):
Bir A değişkeni artarken B değişkeni de artıyorsa ve A değişkeni azalırken B değişkeni de azalıyorsa bu iki değişken arasında pozitif korelasyon var demektir. Örneğin Ders çalışma arttıkça sınavdan yüksek puan alma artar.
9.1.3. Sıfır (Nötr) Korelasyon: İki değişken arasında bir ilişki yoktur. Örneğin çok yemek yeme ile çok gülmek arasında bir ilişki yoktur.
9.1.4. Korelasyon(İlişki) Katsayısı
Korelasyon katsayısı ilişkinin büyüklüğünü gösterir. Korelasyon katsayısı iki değişken arasındaki ilişkinin gücünü gösterir. x ve y arasındaki (–1,00) büyüklüğündeki korelasyon iki değişkenin en yüksek düzeyde ilişki olduğuna işaret eder. Yine A ve B değişkenleri arasındaki (+1,00) büyüklüğündeki korelasyon bu iki değişkenin en yüksek düzeyde ilişkili olduğunu gösterir. (0,00) korelasyon ise iki değişken arasında ilişkinin olmadığını, yani ilişki büyüklüğünün sıfıra eşit olduğunu gösterir. Değişkenler arasındaki ilişkinin büyüklüğüne bakılırken korelasyonun (–) veya (+) olması dikkate alınmaz. Mutlak değer olarak en büyük korelasyon en yüksek veya en güçlü ilişkiyi gösterir.
Bölüm 3.3.3.3. te kovaryans ve ilişki katsayısı;
)
y
y
)(
x
x
(
1
N
1
KV
A
i
A
N
1
i
i
xy
-
-
-
=
å
=
y
x
xy
xy
KV
R
s
s
=
(49)
olarak verilmiştir.
9.2. Regresyon Analizi (Doğrusal (Lineer) Regresyon)
Iki değişken arasında belirgin bir ilişki varken, bu ilişki dağılım grafiğindeki noktalar arasından geçen uygun bir doğru ile tanımlanabilir. Bu doğruya regresyon doğrusu denir ve matematiksek olarak bir bağıntı ile tanımlanabilir. Buna da regresyon bağıntısı denir. Bu bağıntı ile herhangi bir bağımsız değişkene karşılık gelen bağımlı değişken hesaplanabilir. Iki değişken arasında tam bir ilişki varsa yani R=(1 ise, dağılımdaki bütün noktalar regresyon doğrusu üzerine düşer. Regresyon doğrusu genelde En Küçük Kareler Yöntemi ile hesaplanır.
9.2.1 En Küçük Kareler (EKK) Yöntemi ile Regresyon Doğrusunu Hesaplanması
Regresyon doğrusunun denklemi, y = ax+b’ dir. Burada y bağımlı, x bağımsız değişken, a doğrunun y eksenini kestiği nokta, b ise doğrunun eğimi olan regresyon katsayısıdır. N adet nokta( xi, yi ) çifti için y ve y.x denklemleri,
å
å
å
å
å
+
=
+
=
2
x
b
x
a
xy
x
b
aN
y
(50)
şeklindedir.
Buradan regresyon katsayısı (b) çekildiğinde,
(
)
N
x
x
N
y
x
xy
b
2
2
å
å
å
å
å
-
-
=
(51)
Bulunur. Tüm x ve y değerlerinin aritmetik ortalamaları alınır. Bulunan değerlere göre EKK denklemi,
x
b
a
y
+
=
(52)
şeklini alır. Buradan
x
b
y
a
-
=
(53)
olur. Bulunan a ve b değerleri doğru denkleminde yerlerine yazılır. Regresyon doğrusu,
x
ve
y
noktalarının kesişimi ve a değeri bilindiğinden kolaylıkla çizilebilir.
EKK Yöntemi gerçek y değerleri ile
y
ler arasındaki farkların karelerinin toplamının en küçük olması esasına dayanır:
å
=
-
enküçük
y
y
i
i
2
)
(
(54)
İstatistikte doğrusal olmayan ilişkiler de vardır. Bunlar genellikle parabol denklemine uydurularak ya da doğrusallaştırma işlemi yapılarak çözülür.
9.2.1.1. Tahminin Standart Hatası
2
2
-
-
=
å
N
y
y
S
hes
yx
)
(
(55)
şeklinde hesaplanır. Gözlem sayısının çok olduğu durumlarda
2
2
-
-
-
=
å
å
å
N
xy
b
y
a
y
S
yx
(56)
olur.
Örnek 9.1:
(1, 1), (3, 2), (4, 4), (6, 4), (8, 5), (9, 7), (11, 8), (14, 9) verilerine EKK yöntemi regresyon analizi uygulayınız. Regresyon doğrusunu bulup çiziniz.
Çözüm:
x
y
xy
1
1
1
top
56
40
3
2
6
topxy
364
4
4
16
topx2
524
6
4
24
8
5
40
9
7
63
11
8
88
14
9
126
7
5
:ort
x*x
1
b=0.63636
9
a=5-0.63636*7=0.54545
16
36
64
81
121
196
1; 1
3; 2
4; 46; 4
8; 5
9; 7
11; 8
14; 9
y = 0.6364x + 0.5455
R2 = 0.9545
0
1
2
3
4
5
6
7
8
9
10
0246810121416
veri
EKK regresyon doğrusu
Ödev 6:
Aşağıdaki satış verilerine EKK yöntemi regresyon analizi uygulayınız. Regresyon doğrusunu bulup çiziniz. Tahminin standart hatasını hesaplayınız.
Sürekli
Kesikli
Periyodik Olmayan
(Non-periodical)
Periyodik
(Periodical)
Rastgele
(Non-deterministic or Random)
Tanımsal
(Deterministic)
Verilerin Sınıflandırılması
Alım
Gücü
Enflasyon
Yüksek Puan Alma
Ders
Çalışma
Çok Gülmek
Çok Yemek yeme
Çalışma