1
3. BEKLENEN DEĞER VE MOMENTLER
Matematiksel beklenti kavramı şans oyunlarından doğmuştur. En yalın biçimiyle, bir
oyuncunun kazanabileceği miktar ile kazanma olasılığının çarpımıdır. Sözgelimi büyük
ödülün 4800TL olduğu bir çekilişteki 10.000 biletten biri bizimse matematiksel beklentimiz
4800*1/10.000 = 0,48 olur.
3.1 BEKLENEN DEĞER ve ÖZELLİKLERİ
Beklenen değer ya da matematiksel beklenti kavramı matematiğin istatistik bilimine yaptığı
bir katkı olarak düşünülebilir. Bir X şans değişkeninin ya da bu şans değişkeninin herhangi bir
g(x) fonksiyonunun beklenen değeri, değişkenin tüm değerleri üzerinden, olasılık fonksiyonun
ortalama değerinin bulunmasıyla elde edilir. Beklenen değer teorik ya da ideal değerdir. Her
hangi bir denemede X şans değişkeninin beklenen değerini alması gerçekte beklenemez.
Matematiksel beklenti ya da beklenen değer E(x) ile gösterilir.
Tanım (Beklenen değer): Bir X şans değişkeninin olasılık kütle ya da yoğunluğu f(x) olsun.
Şans değişkeninin beklenen değeri, kesikli şans değişkeni için;
)()( xfxxEx
sürekli şans değişkeni için,
x
dxxxfxE )()(
her hangi tipteki bir şans değişkeni için,
dxxFdxxFxE
0
0
1
Bu eşitlik gerçekte X şans değişkeninin bir ağırlıklı ortalamasıdır. Burada ağırlıkları
olasılıklar tanımlamaktadır. Diğer bir ifade ile X şans değişkeninin tanımladığı f(x)
yoğunluğunun ağırlık merkezinin X eksenindeki değeridir. Beklenen değerin tanımlı
olabilmesi için toplam ya da integral işlemlerinin yakınsak olması gereklidir. Bir şans
değişkenin beklenen değeri, şans değişkeninin yoğunluk/kütle fonksiyonuna ya da birikimli
dağılım fonksiyonuna göre tanımlandığı için şans değişkeni referans alınmadan bu
fonksiyonlara göre tanımlanabilir.
Yukarıdaki tanım dikkate alındığında sonlu bir beklenen değere sahip her şans değişkeni için:
E(x)=
Diğer bir ifade ile şans değişkenin beklenen değeri anakütle ortalamasına eşittir. Beklenen
değer işlemi ile temel özellikler aşağıdaki teorem ile verilmiştir.
2
Teorem: X şans değişkenin anakütle ortalaması ve a ile b sabit sayılar olmak üzere:
1.E(a)=a
2.E(ax)=a
ve (1) ile (2) özelliklerinin sonucu olarak,
E(ax+b)=a+b
3. Genelde 0)( xE için )(
11
xExE
İspat: İspat sürekli şans değişkenleri için verilmiştir.
1. adxxfadxxafaE
2. adxxxfadxxaxfaxE
Teorem:
n
i
ininin xEbai
nbxaE
0
)()(
İspat:
n
i
inin bxai
nbxa
0
)( olduğuna göre,
n
i
ininiininin
i
n xEbai
nxba
i
nEbxaE
00
)()(
Beklenen değer ile ilgili diğer özellikler ileriki kısımlarda açıklanacaktır. Beklenen değer
şans değişkeninin anakütle ortalamasına eşit olduğundan sonuç olarak bir yer ölçüsüdür. Bir
sonraki kısımda şans değişkenleri için kullanılabilecek diğer yer ölçülerinden bazıları
tanıtılacaktır.
3.2 TEMEL YER ÖLÇÜLERİ
Şans değişkeni dağılımını farlı bakış açıları ile tanımak amacıyla farklı yer ölçüleri
kullanılmaktadır bu yer ölçülerinden bazıları aşağıda tanıtılmıştır.
Tanım (Kantil): X şans değişkeninin ya da ona ait dağılımın p-inci kantili xp ile gösterilir ve
F(xp)p
koşulunu sağlayan en küçük şans değişkeni değeridir. Eğer X sürekli bir şans değişkeni ise p-
inci kantil
F(xp)=p
koşulunu sağlayan en küçük şans değişkeni değeridir.
Tanım (Medyan): X şans değişkeninin ya da ona ait dağılımın 0.5-inci kantili x0.5 ile ya da M
gösterilir ve medyan olarak adlandırılır. Genel olarak:
Pr[XM]1/2 ya da Pr[XM]1/2
3
tanımlanır. Eğer X sürekli bir şans değişkeni ise medyan:
dxxfdxxfM
M
2/1 .
Medyan veya ortanca, bir frekans dağılımında frekansları iki eşit parçaya bölen x değerdir.
Tanım (Mod): X şans değişkenine ait olasılık kütle/yoğunluk fonksiyonunun x= x0 noktasında
bir maksimum değeri f(x0) var ise x0 değeri mod olarak adlandırılır. Eğer X sürekli bir şans
değişkeni ise:
0xdx
xdf
Bir şans değişkeninin en çok rastlanan değerine mod denir. Bir frekans dağılımında, özellikle
homojen olmayan dağılımlarda birden fazla mod değeri bulunabilir. Mod değeri olmayan
dağılımlarda vardır.
Bir kesikli değişkenin modu, frekansların maksimum olduğu değişken değeridir. f(x)’i
maksimum yapan x değeridir. Bir sürekli değişkenin modu, frekans dağılımında frekans
yoğunluğunun en yüksek değerine karşılık gelen değişken değeridir. f(x)’i maksimum yapan x
değeridir.
Yukarıda açıklanan yer ölçüleri farklı değerler alabileceği gibi dağılım biçiminin özel bir
durumu tanımlayan simetrik dağılımlarda her üç yer ölçüsü de aynı değere sahiptir.
Tanım (Simetri): Olasılık kütle/yoğunluk fonksiyonu f(x);
f(c-x)=f(c+x)
özelliğine sahip olan dağılımlar c noktasına ya da diğer bir deyişle x=c doğrusuna göre
simetriktir.
Eğer bir f(x) dağılımı c noktasına göre simetrik ve anakütle ortalaması sonlu ise c=
olmalıdır.
3.3 VARYANS
Şans değişkeninin dağılımı ile ilgili önemli bir ölçü grubu da yayılım ölçüleridir. Aşağıda bazı
önemli yayılım ölçüleri kısaca açıklanmıştır.
Tanım (Varyans): X bir şans değişkeni ve E(x)= ise şans değişkeninin varyansı V(x) ile ya
da 2 ile gösterilir ve kesikli şans değişkenleri için;
i
ii xfxxV2
sürekli şans değişkenleri için,
dxxfxxV
2
4
her hangi bir şans değişkeni için,
2
0
12
dxxFxFxxV
elde edilir.
Varyansın mevcut olabilmesi için toplam serisinin ya da integralin yakınsak olması gereklidir.
Bir şans değişkenin beklenen değerin de olduğu gibi varyansı da, şans değişkeninin
yoğunluk/kütle fonksiyonuna ya da birikimli dağılım fonksiyonuna göre tanımlandığı için
şans değişkeni referans alınmadan bu fonksiyonlara göre tanımlanabilir.
Gözlenen değerleri ortalamaya göre uzaklaşmaya meyilli X şans değişkenine göre değerleri
ortalama civarında olan bir Y şans değişkenin varyans değerleri karşılaştırıldığında X şans
değişkeninin varyansı daha büyük değerler aldığından varyans bir yayılım ölçüsüdür.
Varyansın formülleri incelendiğinde negatif olmayan değerlere sahip bir ölçüt olduğu
görülebilir. Varyans şans değişkeni ile aynı ölçü birimine sahip değildir.
Tanım (Standart sapma): X şans değişkeninin standart sapması ile gösterilir ve
xV
ile tanımlanır.
Pek çok uygulamada şans değişkeni ile aynı ölçü birimine sahip olduğu için varyansa göre
tercih edilir.
Teorem: Bir sabitin varyansı sıfırdır.
V(c)=0
Teorem:Bir sabit ile bir şans değişkeninin çarpımının varyansı:
V(cx)= c2V(x)
c0 ise, bir rasal değişkenin değerlerinin sabit bir sayıyla çarpılması varyansın da aynı sabit
sayının karesiyle çarpılması demek olduğundan, dağılım yayıklığında da ona uygun bir
değişmeyle karşılaşılır.
Teorem:Bir sabit ile bir şans değişkeninin toplamının varyansı:
V(c+x)= V(x)
Teoremin sonucuna göre; bir rassal değişkenin değerlerine sabit bir sayının eklenmesinin x’in
bütün değerlerinin sağa ya da sola kaymasına yol açtığını ama onun dağılım yayıklığını hiç
etkilemediğini görülür.
Varyans aritmetik ortalamanın etrafındaki yoğunlaşmanın zayıf bir ölçütüdür. Bununla
birlikte simetrik dağılışlar için yeterli bir ölçüdür. Varyans özellikle asimetrik dağılışlar ve
5
yoğunluğun küçük bir kısmının ortalamadan oldukça uzak olduğu dağılımlar için yetersiz bir
yayılım ölçüsüdür. Bir şans değişkeninin varyansının her zaman varolması gerekli değildir.
3.4 ŞANS DEĞİŞKENİNİN BİR FONKSİYONUN BEKLENEN DEĞERİ
Bazı durumlarda doğrudan X şans değişkeni ile değil onun bir fonksiyonu y=g(x) şeklinde
ortaya çıkan şans değişkenleri ile ilgilenilir. Beklenen değer alma işlemi doğrusal bir
operasyondur. Bu nedenle X’ in doğrusal bir fonksiyonunun beklenen değeri sabitlerin etkisi
dikkate alınarak kolayca bulunabilir.
Tanım: X yoğunluğu )(xf olan bir şans değişkeni olsun. Şans değişkeninin bir
fonksiyonunun )(xg ’ in beklenen değeri:
x
xfxgxgE )()()(
dxxfxgxgE )()()(
Teorem: X bir şans değişkeni, f(x)’de onun olasılık fonksiyonu c1, c2…,cn birer sabit sayı
ise gi(x) i=1,…,n fonksiyonlarının sabitlerle çarpımlarının toplamının beklenen değeri:
n
i
ii
n
i
ii xgEcxgcE11
)()(
İspat:
x
n
i x
ii
n
i
ii
n
i
ii xfxgcxfxgcxgcE111
)()()(.)()(
=
n
i x
n
i
iiii xgEcxfxgc1 1
)()()(
Teorem: X bir şans değişkeni, f(x)’de onun olasılık fonksiyonu olmak üzere, eğer tüm x
değerleri için 0)(1 xg ise
0)(1 xgE
Teorem: X bir şans değişkeni, f(x)’de onun olasılık fonksiyonu olmak üzere, eğer tüm x
değerleri için g1(x) g2(x) ise
E[g1(x)] E[g2(x)]
Teorem: X bir şans değişkeni ve cba ,, ise sabitler olsun. Beklenen değerleri mevcut )(1 xg ,
)(2 xg fonksiyonları için eğer tüm X değerleri için bxga )(1 ise
bxgEa )(1 .
3.5 ÇOK DEĞİŞKENLİ DAĞILIMLAR İÇİN BEKLENEN DEĞER VE
VARYANS
6
Beklenen değer ve varyans kavramları çok değişkenli durum için de genellenebilir. Örneğin
bir Z şans değişkeni X ve Y gibi iki şans değişkeninin z=f(x,y) ya da daha genel olarak X1,
X2,,..., Xk sonlu sayıdaki şans değişkenlerinin bir fonksiyonu f(x1,x2,...,xk) olarak ortaya
çıkabilir. Bu gibi durumlarda gereksinim duyulabilecek bazı önemli teoremler aşağıda
verilmiştir.
Teorem: X ve Y şans değişkenleri, f(x,y) bunların ortak olasılık fonksiyonları ise:
E(x+y)= E(x)+E(y)
Teorem: X1, X2,,..., Xk sonlu sayıdaki şans değişkenleri, f(x1,x2,...,xk) bunların ortak olasılık
fonksiyonları ise:
E(x1+x2+...+xk )= E(x1)+E(x2) +...+ E(xk)
Teorem: X ve Y bağımsız şans değişkenleri, f(x,y) bunların ortak olasılık fonksiyonları ise:
E(xy)= E(x)E(y)
İspat: Sadece kesikli şans değişkenleri için verilecektir:
x y
yxxyfxyE ,
Eğer şans değişkenleri bağımsız ise g(x) ve h(y) marjinal olasılık fonksiyonları olmak üzere
ortak olasılık fonksiyonu;
yhxgyxf ,
ve
x y
yhxxygxyE
yx
yyhxxg
yExE
Teorem: X1, X2,,..., Xk sonlu sayıdaki bağımsız şans değişkenleri, f(x1,x2,...,xk) bunların ortak
olasılık fonksiyonları ise:
E(x1,x2,...,xk)= E(x1)E(x2)...E(xk)
Teorem: X ve Y şans değişkenleri, f(x,y) bunların ortak olasılık fonksiyonları ise g(x,y)’nin
beklenen değeri:
yxfyxgyxgEx y
,,,
x y
dydxyxfyxgyxgE ,,, .
7
Teorem: X ve Y şans değişkenleri, f(x,y) bunların ortak olasılık fonksiyonları ise X’nin ve
Y’nin beklenen değeri:
yxfxxEx y
,
yxfyyEy x
,
x y
dydxyxxfxE ,
y x
dxdyyxyfyE ,
Teorem: X ve Y şans değişkenleri, f(x,y) bunların ortak olasılık fonksiyonları ise ve marjinal
dağılımlar g(x) ile h(y) biliniyorsa X ve Y şans değişkenlerinin beklenen değeri:
x
xxgxE
y
yyhyE
x
dxxxgxE
dyyyhyEy
Teorem: c1, c2…,cn birer sabit sayı ise:
i
ki
i
ki xxgEcxxgcE ,,,, 11
Teorem: X şans değişkeni ve f(x/y)’de verilen y değeri için x’in şartlı olasılık fonksiyonu ve
g(y/x) verilen x değeri için y’in şartlı olasılık fonksiyonu ise x’in ve y’nin şartlı beklenen
değeri:
yxxfyxEx
//
xyygxyEy
//
dxyxxfyxEx
//
dyxyygxyEy
//
Teorem: X şans değişkeni ve f(x/y)’de verilen y değeri için x’in şartlı olasılık fonksiyonu ve
u(x), x şans değişkeninin bir fonksiyonu ise verilen y değeri için u(x)’in şartlı beklenen
değeri:
8
yxfxuyxuEx
//
dxyxfxuyxuEx
//
Verilen y değeri yerine konduğunda E(x/y) sabit bir sayıdır, başka bir deyişle şartlı beklenen
değer y’nin bir fonksiyonudur. Benzer şekilde E(y/x)‘de x’in bir fonksiyonudur. E(y/x), x’in
belli bir değeri için sabit, fakat x’in değişen değerlerine bağlı olarak değiştiği için bir şans
değişkenidir. E(y/x)’in dağılımının beklenen değeri E[E(y/x)] olup. E(y/x) regresyon
fonksiyonu olarak da adlandırılır.
Teorem: Koşullu dağılımların beklenen değerleri için beklenen değerler;
E(y)=E[E(y/x)]
E(x)=E[E(x/y)]
Teorem: g(y), y şans değişkeninin bir fonksiyonu olmak üzere,
E[g(y)]=E[E[g(y)/x)]]
Teorem: Eğer x ve y stokastik bağımsız ise, yani
f(x,y)= h(x) g(y)
ise, veya şartlı ve şartsız dağılımlar arasında fark yoksa:
E(x/y) = E(x)
E(y/x) = E(y)
Teorem: x ve y şans değişkenleri, a ve b sabitler olmak üzere:
V(ax+by)= a2V(x)+ b
2V(y)+ 2abCov(x,y)
V(ax-by)= a2V(x)+ b
2V(y)- 2abCov(x,y)
Not: Şans değişkenleri doğrusal ilişkisiz ise Cov(x,y)=0
Teorem: Şans değişkenleri doğrusal ilişkisiz ise yukarıdaki Teorem ikiden çok sınırlı
sayıdaki şans değişkeni için genellenebilir: x1, x2,...,xk sınırlı sayıdaki bağımsız şans
değişkenleri, f(x1, x2,...,xk) bunların ortak olasılık fonksiyonları ise:
V(x1+x2+...+xk )= V(x1)+ V(x2) +...+ V(xk)
Teorem: g(y/x) ve f(x/y) şartlı dağılışlarının varyansı:
a. 22 /// yxEyxEyxV
b. 22 /// xyExyExyV
Şans değişkenleri kesikli ise:
yxfyxExyxVx
///2
9
xygxyEyxyVy
///2
Şans değişkenleri sürekli ise:
x
dxyxfyxExyxV ///2
y
dyxygxyEyxyV ///2
İspat: Sadece (a) şıkkı için verilmiştir.
yyxExEyxV ///2
yyxEyxxExE ///222
22 ///2/ yxEyxEyxEyxE
22 // yxEyxE
Teorem: E(y/x) dağılımının varyansı:
V(y) = E[V(y/x)] + V[E(y/x)]
Son eşitlikte, y’nin varyansı iki farklı varyansın toplamıdır. İlki y’nin değişen x değerleri için
şartlı varyanslarının beklenen değeri. İkincisi ise y’nin değişen x değerleri için şartlı
dağılımının ortalamalarının varyansıdır.
İspat:
22 /// xyEExyEExyVE
2222 / yExyEEyEyE
22// xyEExyEEyV
xyEVyV /
3.6 OLASILIK ÜZERİNE EŞİTSİZLİKLER
Beklenen değer kavramı kullanılarak olasılıklar üzerine bazı eşitsizlikler elde edilebilir. Bu
eşitsizliklerin en önemlisi Chebyshev eşitsizliği olarak bilinir. Chebyshev teoremi belirli bir
olasılık için üst sınırın bulunmasına imkan verir. Bu sınırların tam olasılık değerlerine eşit
yada yakın olması gerekli değildir. Bu nedenle bir olasılık değerine yakınsamak için genelde
bu teorem kullanılmaz. Bu teoremin ana kullanım alanlarından biri Büyük Sayılar Kanunudur.
Teorem: Şans değişkeni X’in olasılık fonksiyonu f(x) ve negatif olmayan bir fonksiyonu u(x)
olsun. Eğer E[u(x)] mevcut ise her bir pozitif k sabiti için;
k
xuEkxu Pr
10
İspat: Şans değişkeni X için A={x:u(x)k} olsun. Bu durumda,
dxxfxudxxfxudxxfxuxuEcAAx
Eşitliğin sağındaki her iki integral de negatif olmayan değerlere sahip olduğundan,
dxxfxuxuEA
Eğer xA bu durumda u(x)k olacağı için u(x) yerine k yazılması eşitsizliğin sağ tarafının
değerini artırmaz.
dxxfkxuEA
Burada kxuAxdxxfA
PrPr olduğundan,
kxukxuE Pr
İspat tamamlanır.
Açıklanan teoerem, Chebyshev eşitsizliği olarak adlandırılan bir eşitsizliğin genellenmiş
şeklidir. Bir şans değişkenin olasılık dağılımından bağımsız sadece beklenen değer ve varyans
bilgileri kullanılarak şans değişkeni ile ilgili bazı olasılık eşitsizlikleri elde edilebileceği, Rus
matematikçisi Chebyshev tarafından ispatlanmıştır.
Teorem (Chebyshev eşitsizliği): Şans değişkeni X’in bir olasılık dağılışına ve sonlu varyansa
sahip olduğu varsayılsın, (bu durumda mutlaka sonlu bir anakütle ortalaması vardır). Bu
koşul altında her k>0 için,
2
1Pr
zzx
ya da eşdeğer olarak,
2
11Pr
zzx .
İspat: Bir önceki teoremde,
2 xxu ve 22zk
alındığında,
22
2
222Pr
z
xEzx
2
1Pr
zzx
Bulunur. Burada z değeri birden büyük olarak alınır.
11
Yukarıda verilen teoreme göre ile , X rassal değişkeninin ortalaması ve standart sapması
ise, herhangi bir pozitif z sabiti için X’in ortalamanın iki yanında z standart sapma aralığında
bir değer alabilme olasılığı en az 2
11
z kadardır.
Örneğin, X rassal değişkeninin ortalamanın her iki yanında, iki standart sapma aralığında bir
değer alma olasılığı en az 1-(1/22)=3/4; 3 standart sapma aralığında bir değer alma olasılığı
1-(1/32)==8/9; 5 standart Sapma aralığında bir değer alma olasılığı 1-(1/5
2)=24/25 olur. Elde
edilen sonuçlar şans değişkeninin standart sapmasının değişkenin yayıklığını ya da
yaygınlığını bu anlamda denetime aldığını belirtmektedir.
Chebyshev teoreminin verdiği olasılığın bir alt sınır olduğu açıktır. Belli bir rassal değişkenin
ortalamanın iki yanında z standart sapma aralığında bir değer alma olasılığının 1-(1/z2)’den
büyük olup olmadığını bilemeyiz ama Chebyshev teoremi bize bu olasılığın kesinlikle
1-(1/z2)’den küçük olamayacağını söyler. Bir rassal değişkenin dağılımı bilinirse ancak o
zaman tam olasılık hesaplanabilir.
3.7 MOMENTLER
Moment terimi fizik biliminden gelmektedir. Moment bir f(x) frekansının (kuvvetinin) x birim
uzaklıkta olduğu bir nokta üzerinde oluşturduğu etkidir. Momentler, bir şans değişkenin
dağılışının kesin şeklini belirler. Bir dağılımın momentleri şans değişkeninin kuvvetlerinin
beklenen değeridir. Momentler genel olarak üç grupta incelenir.
1. Orijine göre momentler
2. Ana kütle ortalamasına göre momentler
3. Herhangi bir a noktasına göre momentler
12
Tanım (Orijine göre moment): X rassal değişkeninin r ile gösterilen, sıfır noktası
dolayındaki r -inci momenti, rx ‘nin beklenen değeridir.
x
rr
r xfxxE )()(
dxxfxxE rr
r )(
En çok kullanılan iki özel durum:
r=0 iken 10
0 dxxfxE
r=1 iken )('1 xE ‘ dir. Bu da X rassal değişkeninin beklenen değerinden başka bir
şey değildir.
Tanım : 1 ifadesine X dağılımının anakütle ortalaması ya da kısaca X şans değişkeninin
ortalaması denir ve ile gösterilir.
Tanım (Aritmetik ortalamaya göre moment): X şans değişkeninin ile gösterilen, ortalama
dolayındaki r -inci momenti, (x-) fonksiyonunun beklenen değeridir, ,2,1,0r için
x
rr
r xfxxE )()(])[(
dxxfxxE rr
r )()(])[(
Teorem: değeri var olan her rassal değişken için 10 ve 01 dır.
İspat: Aritmetik ortalamaya göre birinci moment;
0
)()(
)()(
)][(1
dxxfdxxxf
dxxfx
xE
Bu sonuç tanımlayıcı istatistikten bilinen, aritmetik ortalamadan sapmaların toplamının sıfır
olmasının teorik ispatıdır.
Bir dağılımın tüm momentleri ile ilgili bilgi bu dağılımı eşsiz olarak belirler. Ortalama
dolayındaki ikinci moment, bir rassal değişken dağılımının yayıklığı ya da yaygınlığının bir
göstergesi olduğundan istatistikte özel bir önem taşır. Aritmetik ortalamaya göre ikinci
moment;
xVxE 2
2
varyansdır. Bir dağılımın varyansı, dağılımın ortalama etrafındaki yoğunluğunun ölçümünü
verdiği daha önce açıklanmıştı.
13
Tanım (Herhangi Bir a Noktasına Göre Momentler): X şans değişkeninin, bir a noktası
etrafındaki r-inci momenti, (x- a)r’nin beklenen değeridir.
xfaxaxEr
x
r
r
xfaxaxEr
x
r
r
Tanım: Eğer '
r mevcut ise rk için '
k momentleri mevcuttur.
Eğer E(x2) mevcut ise E(x) mevcuttur ve sonuçta V(x) bulunur. Bu nedenle V(x)’in varlığı
E(x)’in var olduğunu belirtir.
Teorem: Ana kütle ortalamasına göre ikinci moment, yani varyans, daima herhangi bir a
noktasına göre ikinci dereceden momentten daha küçük veya ona eşittir. Buna varyansın
minimum olma özelliği denir:
22axExE
ya da eşdeğer olarak
22 ))(()( xExEaxEMina
İspat: 22axExExEaxE
xExaxEaxExExE 222
xExEaxEabxEExExE 222
22axExExE
Eşitliğin sağındaki terim daima pozitif olup ancak ve ancak E(x)=a olduğunda sıfır alabilir.
Teorem: Eğer X bir şans değişkeni ise;
medxEaxEMina
3.7.1 Aritmetik Ortalamaya Göre Momentlerin Orijine Göre Momentler
Cinsinden Hesabı:
Hesaplama kolaylığı açısından merkezi momentler orijine göre momentler cinsinden
bulunabilir. Orijine göre momentlerle aritmetik ortalamaya göre momentler arasındaki ilişki
Binom teoremi kurulanarak bulunabilir. Bilindiği gibi binom açılımı;
inin
i
n abi
nba
0
)( dir
Bu açılım ortalamaya göre momentlerde kullanıldığında;
14
i
rxx iri
r
i
ir
0
)1(
olup, beklenen değerin 2-inci özelliğinde rx)( alındığında a ve 1b olup sonuç
olarak,
r
i ir
ii
r
i
iriirxExE
0
'
0
1
1
Teorem : Eğer r=2 alınırsa 2'
2
2
İspat : )()(2)(2)( 222222 ExExExxExE
= 2'
2
22 2)( xE
3.7.2 Orijine Göre Momentlerin Aritmetik Ortalamaya Göre Momentler
Cinsinden Hesabı:
Orijine göre momentler de aritmetik ortalamaya göre momentler cinsinden hesaplanabilir.
ir
i
iri
r
rr
i
r
XEi
r
XE
XE
)(
)(
'
olarak bulunur.
3.7.3 Momentlere Dayanan Asimetri ve Basıklık Ölçüleri
Bir olasılık dağılımının biçimi ile ilgili ek bilgiler üçüncü ve dördüncü merkezi momentler
yardımı ile elde edilebilir. Bu ek bilgiler genellikle dağılımın çarpıklık ve basıklığı olarak
adlandırılır. Bir frekans dağılışının ortalama değerine göre simetriden ayrılış derecesine
asimetri ya da çarpıklık denir.
Asimetri ölçüleri için beklenen temel özellikler:
a. Değişkenin ölçme biriminden bağımsız olmalı
b. Dağılım simetrik olduğunda sıfır değerini almalı
X şans değişkeninin üçüncü merkezi momenti:
3
3 xE
kullanılarak asimetriyi ölçebilmek için 1 ölçüsü Pearson tarafından tek modlu dağılımlar için
bulunmuştur:
15
32
2
3
1
Değişkenin ölçü biriminden bağımsızdır. Simetrik dağılışlarda 1=0 ve asimetrik dağılışlarda
daima 1 > 0.
1‘in işaret eksikliğini gidermek için Fisher tarafından standartlaştırılmış üçüncü moment ya
da diğer adıyla çarpıklık katsayısı önerilmiştir:
3
3
1
1 Değişkenin ölçü biriminden bağımsızdır. Simetrik dağılışlarda 1=0, sağa çarpık
dağılışlarda 1>0, sola çarpık dağılışlarda 1<0
3=0 olduğu halde simetrik olmayan dağılışlarda mevcuttur. Bunun nedeni aşırı büyüklükteki
uç değerlerin aritmetik ortalamaya etki edip, onu büyütüp, küçültmeleridir. ’de oluşan bu
değişme 3’e yansımaktadır.
Bir dağılışın modunun, aynı aritmetik ortalama ve varyansa sahip bir normal dağılımın
moduna göre daha aşağıda ya da daha yukarıda bulunmasına basıklık farkı denir. Dağılışın
tepe noktası normal dağılımdan daha yüksekse sivri, alçaksa basık dağılımdır. Sivri dağılımda
aritmetik ortalama etrafında yoğunlaşma daha fazladır.
X şans değişkeninin dördüncü merkezi momenti:
16
4
4 xE
kullanılarak basıklığı ölçebilmek için 2 ölçüsü Pearson tarafından tek modlu dağılımlar için
bulunmuştur:
22
4
2
Değişkenin ölçü biriminden bağımsızdır. Normal dağılışlarda 2=3, normale göre basık
dağılışlarda 1 2< 3, normale göre sivri dağılışlarda 2>3.
Fisher basıklık ölçüsü:
322
Değişkenin ölçü biriminden bağımsızdır. Normal dağılışlarda 2 = 0, normale göre basık
dağılışlarda 2 < 0, normale göre sivri dağılışlarda 2 >0.
Bir ya da bir kaç tane momentin dağılış hakkında verdiği bilgi sınırlıdır. Aşağıdaki şekil ilk
dört momenti eşit olan iki dağılımı göstermektedir. Bununla birlikte momentlerin (1’, 2’,
3’,... ) bütün bir seti dağılımı tam olarak belirler.
Şans değişkeni X, standart değişkene dönüştürülürse;
Xz
E(z)=0 olduğu için z değişkeninin merkezi momentleri ile orijine göre momentleri eşittir. Bu
özellik kullanılarak z değişkeninin r -inci merkezi momenti, X değişkeninin r -inci merkezi
momenti cinsinden ifade edilebilir:
2/
2 )]([
)()(
])([1
)()(
r
r
r
r
r
r
r
r
r
x
xµxµ
xEX
EzEz
17
Sonuç olarak, 1)()( 2 zzV elde edilir. Görüldüğü gibi bir X şans değişkeninin
standardize edilmesi ortalama ve varyansı etkilemekte fakat
)()( 11 xz
)()( 22 xz
standardize üçüncü ve dördüncü momenti etkilememektedir.
Tanım (Şans Değişkeninin Fonksiyonun Momenti): u(x) şans değişkeni X’in bir fonksiyonu
ise r-inci dereceden momenti:
dxxfxuxuEx
r
x sürekli ise
x
rxfxuxuE x kesikli ise
3.7.4 İki Şans Değişkeni İçin Çarpım Momentleri
Bu kısımda iki şans değişkeninin ortak dağılımı dikkate alınarak şans değişkenlerinin çarpım
şeklindeki momentleri elde edilecektir.
Tanım (İki şans değişkeninin orijine göre çarpım momenti): X ve Y şans değişkenlerinin
olasılık fonksiyonları f(x,y) ise orijin civarındaki r-inci ve s-inci derecen orijine göre çarpım
momentleri sr , ile gösterilir ve xry
s ifadesinin beklenen değeri ile elde edilir:
sr
sr yxE,
Şans değişkenleri kesikli ise;
yxfyxyxEx y
srsr
sr ,,
Şans değişkenleri sürekli ise;
dxdyyxfyxyxEx y
srsr
sr ,,
Çarpım momentleri marjinal (tek değişkenli) momentlere dönüşebilir. Örneğin xE0,1 ya
da yE1,0 ile tanımlanabilir.
Tanım (İki şans değişkeninin ortalamaya göre çarpım momenti): X ve Y şans değişkenlerinin
olasılık fonksiyonları f(x,y) ise orijin civarındaki r-inci ve s-inci derecen ortalamaya göre
çarpım momentleri sr , ile gösterilir ve [x-E(x)]r[y-E(y)]
s ifadesinin beklenen değeri ile elde
edilir:
sr
sr yEyxExE ,
Şans değişkenleri kesikli ise;
18
yxfyEyxExyEyxExEx y
srsr
sr ,,
Şans değişkenleri sürekli ise;
dxdyyxfyEyxExyEyxExEx y
srsr
sr ,,
Çarpım momentleri marjinal (tek değişkenli) momentlere dönüşebilir. Örneğin xV0,2 ya
da yV2,0 ile tanımlanabilir. Ayrıca istatistikte özel öneme sahip bir ortalamaya göre
çarpım momenti de 1,1 ’ dir ve kovaryans olarak adlandırılır.
3.7.5 KOVARYANS
Kovaryans iki şans değişkeni arasındaki doğrusal ilişkinin bir ölçümünü verir. Aralarındaki
kovaryans sıfır olan şans değişkenlerine doğrusal ilişkisiz adı verilir. Stokastik bağımsızlık
doğrusal ilişkisizliği de otomatik olarak sağlar. Fakat ilişkisizliğin mutlaka stokastik
bağımsızlık anlamına geleceği söylenemez. Tek istisna normal dağılmış şans değişkenleridir.
Normal dağılmış iki değişken ilişkisiz ise aynı zamanda stokastik bağımsızdır.
Tanım (Kovaryans): X ve Y iki şans değişkeni ve onların ortalamaları sırası ile x ve y ise, x
ve y arasındaki kovaryans Cov(x,y) ile ya da xy ile gösterilir ve:
Cov (x,y)=E[(x- x)(y- y)]
eşitliğinden elde edilir.
Teorem: İki şans değişkeni X ve Y arasındaki kovaryans orijine göre ve ortalamaya göre
çarpım momentleri cinsinden ifade edilebilir:
1,00,11,1 xy
yx 1,1 .
İspat: Beklenen değerle ilgili teoremler kullanılarak,
yxxy yxE
yxxy yxxyE
yxxy yExExyE
yx 1,1
Teorem: İki Şans değişkeni bağımsız ise xy=0
İspat: Bağımsız şans değişkenleri için;
yExExyE
olduğu için
19
01,1 yExExyEyxxy
Teorem: Eğer X ile Y şans değişkenleri ve a ile b sabitler ise:
yxabCovbyaxCov ,,
yxCovbyaxCov ,,
xaVbaxxCov , .
İki değişken arasındaki kovaryans, değişkenlerin ölçülmesinde kullanılan birimlere bağlıdır.
İlişkinin ölçü birimlerinden arıtılmış ifadesi, ortak anakütle korelasyon katsayısıdır. Anakütle
korelasyon katsayısı ile gösterilir.
x.y = Cov(x,y)/xy
Korelasyon katsayısının temel özellikleri:
1. ‘nun işareti Cov(x,y)’nın işaretine göre değişir.
2. Cov(x,y)=0 ise x.y = 0 olur.
3. x.y ‘nun alabileceği maksimum ve minimum değerler:
-1 x.y 1
4. = 1olması x ve y arasında tam doğrusal ilişki bulunduğunu belirtir.
İspat (özellik 3): İki standart değişken u ve v ele alınsın:
u = [x-E(x)]/x v= [y-E(y)]/y
Tüm standart değişkenlerin; beklenen değeri sıfır, varyansı birdir.
Cov (u,v)= E[u-E(u)][v-E(v)]
=E{[uv]}
Cov (u,v) = (1/xy ) E{[x-E(x)] .[y-E(y)]
Cov (u,v) = Cov(x,y)/ xy = x.y
bulunur. İki şans değişkeninin toplamı ve farkı için verilen teorem standart değişkenlere
uygulandığında,
V(u v) = 2[1 Cov (u,v)]
Eşitliğin sol tarafı varyans olduğundan negatif olamaz. Bu nedenle sağ tarafta olamaz. Sonuç
olarak;
1+ Cov (u,v) 0 ve 1- Cov (u,v) 0
ya da
1+ x.y 0 ve 1- x.y 0
elde edilir. Bu ise
-1 x.y 1
20
eşitsizliğini verir.
İspat (özellik 4): u =1 ve v =1 olduğundan,
Cov (u,v) = 1 ise u.v = 1 ve
Cov (u,v) = -1 ise u.v = -1
olur. Cov (u,v)=1 olduğunda, İki şans değişkeninin toplamı ve farkı için verilen teorem
standart değişkenlere uygulanarak,
V(v-u) = 0
Diğer bir deyişle v-u bir sabittir:
[y-E(y)]/y - [x-E(x)]/x = c
y x - E(y)x- x y+ E(x) y = c x y
y = E(y) +c y – (y / x) E(x)+ (y / x) x
Eşitliğin sağ tarafındaki ilk üç terimin her biri bir sabit olduğundan, bu üç terim a ile temsil
edilerek;
y = a + bx
b’nin pozitif olması zorunludur, a pozitif ya da negatif olabilir.
Cov (u,v) = -1 olduğunda, İki şans değişkeninin toplamı ve farkı için verilen teorem standart
değişkenlere uygulanarak,
V(v+u) = 0
Diğer bir deyişle v+u bir sabittir.
[y-E(y)]/y + [x-E(x)]/x = c
yx - E(y) x+ xy- E(x) y = cxy
y = E(y) +cy + (y/x)E(x)-(y/x)x
Eşitliğin sağ tarafındaki ilk üç terimin her biri bir sabit olduğundan, bu üç terim a ile temsil
edilerek;
y = a - bx
b’nin negatif olması zorunludur, a pozitif ya da negatif olabilir. Elde edilen her iki denklem
için de;
b = y/x
bulunur. Model y = a bx ise
V(y) = b2V(x) ya da y = bx
olup bu sonuç kullanılarak,
Cov(x,y) = b V(x)
x.y = Cov(x,y) /y x=b V(x)/y x
21
12
2
, x
x
yxb
b
bulunur. x.y = 1 durumunda y = a bx doğrusunun grafiği x ve y’nin tüm olasılık dağılımını
içerir. Tüm (x,y) ikilileri doğru üzerindedir. Bu ekstrem durum için P(y = a bx)=1 olur.
Ekstrem durum haricinde, x ve y’nin tüm olasılık dağılımı y = a bx doğrusunun çevresinde
bir bant içindedir.
3.7.6 Faktöriyel Momentler
Özellikle kesikli şans değişkenlerinin momentlerinin bulunmasında faydalı olan bir yaklaşım
dağılımın faktöriyel momentleridir. İlk olarak şans değişkeninin karesi ele alınsın;
xxxx 12
Bu ifadenin beklenen değeri alınarak,
xExxExE 12
Sonuç olarak;
12
21 xExExxE
bulunur. Bu yaklaşım daha büyük momentler için de geçerlidir. Şans değişkeninin üçüncü
faktöriyel momenti
123
23 232321 xExExExxxE
olup,üçüncü faktöriyel moment kullanılarak,
123 2321 xxxE
bulunabilir. Genel olarak r-inci faktöriyel moment
121 rxxxxE
olarak tanımlanır.
3.8 MOMENT TÜRETEN FONKSİYONLAR
Beklenen değer tanımı kullanılarak momentler elde edilebilir. Bu yaklaşımın
hesaplamalarında zorluk olması durumunda dağılımın momentleri, bir fonksiyon yardımı ile
hesaplanabilir. Moment türeten fonksiyonlar sürekli veya kesikli bir X şans değişkenin
dağılımın momentlerinin hesaplanmasına yarayan bir fonksiyondur. X şans değişkeninin
moment türeten fonksiyonu )(tM x ile gösterilir. Bir X şans değişkeninin orjine ve aritmetik
ortalamaya göre moment türeten fonksiyonu bulunabilir.
Tanım (Moment türeten fonksiyon): X yoğunluğu )(xf olan bir şans değişkeni olsun. Eğer
22 hth aralığındaki t ‘nin her bir değeri için şans değişkeninin beklenen değeri mevcut
22
ise, txe ’ in beklenen değeri X‘ in moment türeten fonksiyonu olarak adlandırılır. Moment
türeten fonksiyon:
)(
)(
xfeeEtM
dxxfeeEtM
txtx
x
txtx
x
Eğer bir moment türeten fonksiyon mevcut ise, orijin civarında sürekli olarak türevlenebilir.
Çünkü 22 hth aralığı t=0 değerini içerir. Moment türeten fonksiyon t parametresinin
fonksiyonudur. Bu parametrenin gerçek bir anlamı yoktur, sadece momentlerin belirlenmesine
yardımcı olan matematiksel bir araçtır. Kukla değişkendir. )(tM fonksiyonu, t=0 için
1)0( M olur.
Teorem: Eğer X şans değişkeninin moment türeten fonksiyonu )(tM x ise ve
0
0
t
xr
rr
x tMdt
dM
olarak tanımlanmış ise
0r
x
r MxE
olur.
İspat: İntegral işareti altında türev alınabileceği varsayımı altında, moment türeten
fonksiyonun t ‘ ye göre türevi;
dxxfedt
dtM
dt
d tx
x
dxxfedt
d tx
dxxfxe tx
xtxeE
ve t=0 alınırsa;
xExeEtMdt
dM
t
xt
t
xx
0
0
0
Bu yaklaşım r-inci türev için genellendiğinde,
r
t
xtr
t
xr
rr
x xEexEtMdt
dM
00
0 .
23
Sonuç olarak; bir dağılımın momentleri, moment türeten fonksiyonun yapay değişken t’ye
göre türevi alınarak elde edilebilir. Fonksiyona neden moment türeten fonksiyon dendiğini
açıklayabilmek amacı ile )( xteE yerine bu fonksiyonun Maclaurin seri açılımı konulur.
Maclaurin serisi: Matematikteki fonksiyonları seri açılımları konusundaki Taylor teoreminin
0
2
!
)()(...
!
)()(...
!2
)()())(()()(
n
nn
rr
n
axaf
r
axaf
axafaxafafxf
özel olarak 0a alınarak oluşturulmuş serisidir.
0
2
!)(....
!)(....
!2)()()()(
n
nn
rr
n
xaf
r
xaf
xafxafafxf
Burada maclaurin serisine xe fonksiyonu uygulanmasının nedeni 1 değerine yakınsamasıdır.
Momentler şöyle bulunabilir; xexf )( fonksiyonu maclaurin serisiyle açılırsa,
...!
...!2
12
r
xxxe
rx
buradan da,
...!
...!2
1 22
rr
xt tr
xt
xxte
)(tM x ‘ in seri açılımı )(xf ‘ in momentlerine göre elde edilir.
0
'
2
2
1
22
22
!
1...
!...
!21
....)(!
....)(!2
)()1(...!
...!2
1)(
i
i
rr
r
rr
rr
xt
x
tir
ttt
xEr
txE
txtEEt
r
xt
xxtEeEtM
Bu durum r ‘ nin, )(tM x ‘ nin r defa türevi alınıp daha sonra 0t konularak elde
edilebileceğinin bir diğer kanıtıdır.
Örneğin birinci momenti bulmak için xM (t) nin t ye göre birinci türevi alınır;
0
)()()( t
x
xdt
tdMtMxE
0
1
321!
...!3
3
!2
2
tr
r
r
rttt
burada t=0 olduğunda
1 olarak bulunur.
İkinci moment
2 isteniyor ise
0
2 )()()(
t
x
xdt
tdM
dt
dtMxE xM (t)
24
0
2
32!
)1(...
!3
6
!2
2
tr
r
r
trrt
=
2
Burada söylenmesi gereken bir şans değişkeninin momentlerini belirlemek için bir moment
türeten fonksiyonun Maclaurin serisini kullanmaktaki asıl güçlük moment türeten
fonksiyonunu bulmak değil buna Maclaurin serisini uygulamaktır. Bazı dağılımlarda M(t), t
‘nin bütün değerleri için hesaplanabilir; bazı dağılımlarda ise M(t), t’ nin sadece belirli bir
aralıktaki değerleri için bulunabilir. Örneğin üstel dağılım.
Moment türeten fonksiyonun kullanılabileceği konulardan biri de bağımsız şans
değişkenlerinin toplamının dağılışının belirlenmesidir.
Eğer M(t) mevcut ise, X’ in dağılımı eşsiz ve tam olarak belirlenir. Eğer iki şans değişkeni
aynı moment türeten fonksiyona sahip ise, bu şans değişkenleri aynı olasılık dağılımına
sahiptir. Bazı durumlarda
dxxfe tx )( ’ in integrali ve )(xfex
tx ‘ in toplamı mevcut
değildir. Böyle durumlarda X’ in moment türeten fonksiyon bulunamaz. Diğer bir deyişle her
dağılımın moment türeten fonksiyonu yoktur. Bu tip dağılımlarda momenti bulmak için
karakteristik fonksiyon kullanılır.
3.9.1 Moment Türeten Fonksiyonlarla İlgili Teoremler
Teorem: c bir sabit sayı olmak üzere )(cx ’ in moment türeten fonksiyonu;
)()( ctMtM xcx ’ dir.
İspat: ctMdxxfedxxfeeEtM x
ctxcxtcxt
cx
)()( ’ dir.
Teorem: Bir X şans değişkeninin moment türeten fonksiyonu M(t) olsun, c sabit bir sayı
olmak üzere )( xc ’ in moment türeten fonksiyonu;
)()( tMetM x
ct
xc ’ dir.
İspat: tMedxtfeedxxfeeeEtM x
ctxtctxtcttxc
tc
)()( )(
)( ’ dir.
Teorem: baxy şeklinde tanımlanan y şans değişkeninin moment türeten fonksiyonu;
atMetM x
bt
y ’ dir.
İspat: bt
x
axtbtbtaxttbaxyt
y eatMeEeeeEeEeEtM ’ dir.
25
Teorem: Bir X şans değişkeninin moment türeten fonksiyonu M(t) olsun,
b
axy
olmak
üzere;
)/(/ baMeeEtM x
tbayt
y ’ dir.
Bu teoremde a ve b olarak alınır ise
//
/ tMetM x
t
x
olacaktır. Bu fonksiyon standart normal değişkenin moment türeten fonksiyonu olarak da
bilinir.
Teorem: Eğer iki şans değişkeni aynı moment türeten fonksiyona sahipse bu iki şans
değişkeni aynı dağılıma sahiptir. X şans değişkeninin moment türeten fonksiyonu Mx(t) ve Y
şans değişkeninin moment türeten fonksiyonu My(t) olsun, eğer 22 hth aralığındaki
tüm t değerleri için )()( tMtM yx ise X ve Y şans değişkenleri aynı olasılık dağılımına
sahiptir.
İspat: X şans değişkeninin dağılımı 2;u olsun baxy şeklinde ve normal dağılımlı
atMetM x
bt
x olsun. 2
22tetM t
x
‘ na göre;
2/2/ 2222tatabtatabt
x eeeetM ’ dir.
Bu ise ortalaması ba ve varyansı 22a olan normal bir dağılımın moment türeten
fonksiyonudur.
Teorem: X ve Y bağımsız ve aynı dağılıma sahip iki tesadüfi değişken ve bunların moment
türeten fonksiyonları sırasıyla )(tM x ve )(tM y olsun yxz şeklinde tanımlanan bir z
tesadüfi değişkeninin moment türeten fonksiyonu;
)()()( tMtMtM yxz ’ dir.
İspat: ytxttyxzt
z eeEeEeEtM )(
X ve Y bağımsız olduklarından;
)()()(
)(
tMtMtM
eEeEtM
yxz
ytxt
z
olur.
Eğer bu teorem n tane tesadüfi değişken için genişletilir ise;
)()...()()(21
tMtMtMtMnxxxz .
26
Tanım (Bir şans değişkeninin fonksiyonunun moment türeten fonksiyonu): X şans
değişkeninin her hangi bir fonksiyonu )(xu ise txu
xu eEtM )( dir.
dxxfetM xu
xu )(
x
xu
xu xfetM )( olur.
3.8.2 Aritmetik Ortalamaya Göre Moment Türeten Fonksiyon
Bir X şans değişkeninin kendi aritmetik ortalamasına göre de moment türeten fonksiyonu
bulunabilir. Buda genellikle )(tM x ile ifade edilir.
)()( tMeeEeEtM x
txt
x
’ dir.
Buna göre kesikli veya sürekli bir X şans değişkeninin orijine göre moment türeten
fonksiyonu biliniyorsa bu fonksiyon te ile çarpılarak aritmetik ortalama etrafındaki moment
türeten fonksiyon kolayca bulunabilir.
3.8.3 Faktöriyel Moment Türeten Fonksiyon
X şans değişkeninin faktöriyel moment türeten fonksiyonu eğer beklenen değer mevcutsa
)( xtEtG ile tanımlanır. Bu fonksiyon,
)]1).......(1([)( 1 rxxxEtEdt
dt
x
r
r
eşitliğini sağlar. Eşitliğin sağ tarafı r-inci dereceden faktöriyel momenttir. Eğer X kesikli bir
şans değişkeni ise,
x
xx xXfttE )()(
yazılabilir. Bu ifadede kuvvet serisinin katsayıları olasılıklar olduğu için faktöriyel moment
türeten fonksiyon, olasılık türeten fonksiyon olarak adlandırılır. Burada x=k olasılığını elde
etmek için
kxftEdt
d
kt
x
k
k
0)(!
1
Bu fonksiyonun çeşitli derecelerden türevleri alınıp, t yerine 1 konduğunda x şans
değişkenine ilişkin Faktöriyel momentler bulunur. Faktöriyel momentler kF' ile gösterilir.
Birinci türevi;
xEGxtEdt
dtEtE
dt
dtG t
xx
x
x 11
1
27
bulunur. İkinci türevi;
11 xxEG
bulunur. r -inci türevi;
trxxxEF r ...11
Faktöriyel moment özellikle kesikli değişkenlerde önemlidir.