sulyán tímea poisson eloszlás és alkalmazásai · köszönetnyilvánítás ezúton szeretném...

40

Upload: others

Post on 02-Feb-2020

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

Eötvös Loránd Tudományegyetem

Természettudományi Kar

Sulyán Tímea

Poisson eloszlás és alkalmazásai

BSc Elemz® Matematikus Szakdolgozat

Témavezet®:

Csiszár Vill®

Valószín¶ségelméleti és Statisztika Tanszék

Budapest, 2016

Page 2: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

Köszönetnyilvánítás

Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-

csokat, észrevételeket, mellyel segítette a dolgozatom elkészítését. Hálás vagyok a

konzultációkért valamint a türelméért és megértéséért. Köszönettel tartozom a csa-

ládomnak és barátaimnak, hogy megteremtették a légkört az íráshoz valamint tá-

mogattak a szakdolgozat létrejöttében.

2

Page 3: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

Tartalomjegyzék

Bevezetés 3

1. Poisson-eloszlás fajtái 5

1.1. Az egyszer¶ Poisson-eloszlás . . . . . . . . . . . . . . . . . . . . . . . 5

1.2. Az összetett Poisson-eloszlás . . . . . . . . . . . . . . . . . . . . . . . 9

1.3. A keverék Poisson-eloszlás . . . . . . . . . . . . . . . . . . . . . . . . 13

1.3.1. Paraméter becslés . . . . . . . . . . . . . . . . . . . . . . . . . 15

2. Az eloszlás használata közelítésre 18

2.1. A binomiális eloszlás közelítése

Poisson-eloszlással . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.2. Poisson-közelítés párosítással . . . . . . . . . . . . . . . . . . . . . . . 24

3. Folyamatok 27

3.1. A Poisson-folyamat . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3.1.1. Homogén Poisson-folyamat . . . . . . . . . . . . . . . . . . . . 27

3.1.2. Inhomogén Poisson-folyamat . . . . . . . . . . . . . . . . . . . 30

3.2. Az összetett Poisson-folyamat . . . . . . . . . . . . . . . . . . . . . . 36

Összefoglalás 37

3

Page 4: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

Bevezetés

Siméon Denis Poisson (1781−1840) francia matematikus, �zikus, statisztikus. Élete

során rengeteg ma is használatos eredményt ért el az alkalmazott matematika és

a matematikai �zika területén is. Élete során körülbelül 300-400 matematikai érte-

kezést publikált. Meglep® lehet ekkora mennyiség ismeretében, hogy egyszerre csak

egy dologgal foglalkozott. A Poisson-eloszlás, 1837-ben t¶nt fel el®ször az írásaiban.

A valószín¶ségszámításban egyik leggyakrabban alkalmazott eloszlás a Poisson-

eloszlás, melyet véletlenszer¶ id®pontokban bekövetkez® események számának meg-

határozására használunk egy adott id®intervallumban. Ilyen esemény például az

adatbázis szerverekhez beérkez® lekérdezések, üzletbe érkez® vev®k, sajtóhibák meny-

nyisége egy könyvben, forgalmas keresztez®désben történ® balesetek, valamint a ter-

mészeti katasztrófák száma is.

Szakdolgozatomban ennek az eloszlásnak a sokszín¶ségét vizsgálom. Az 1. feje-

zetben de�niálom a Poisson eloszlás különböz® változatait és a velük kapcsolatos

mértékeket és példákat. A 2. fejezetben módszereket láthatunk arra, hogy hogyan

használjuk más eloszlás közelítésére. A 3. fejezet a Poisson-eloszlás egy még érdeke-

sebb felhasználását mutatja majd be a Poisson-folyamatokon keresztül, ahol az id®

függvényében vizsgáljuk a modelljeinket.

4

Page 5: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

1. fejezet

Poisson-eloszlás fajtái

1.1. Az egyszer¶ Poisson-eloszlás

Azt a különleges diszkrét eloszlást fogom bemutatni, melyben a változó megszám-

lálhatóan végtelen sok értéket vehet fel.

1.1. De�níció. (Poisson-eloszlás) A ξ valószín¶ségi változót Poisson-eloszlásúnak

nevezzük, ha lehetséges értékei: 0,1,. . . és

p(k, λ) = P (ξ = k) =λk

k!· e−λ, (1.1)

ahol λ > 0 rögzített és k ∈ N.

Az 1.1-beli mennyiségeket k=0,1,. . . esetére összegezve és eλ Taylor-sorát alkalmazva:

∞∑k=0

p(k, λ) =∞∑k=0

λk

k!· e−λ = e−λ ·

∞∑k=0

λk

k!= e−λ · eλ = 1.

Tehát (1.1)-ben a pozitív számok eloszlást alkotnak, ezért elképzelhet® egy olyan

kísérlet, melynek során annak a valószín¶sége, hogy pontosan k-szor következik be

egy meg�gyelt esemény, éppen p(k, λ).

5

Page 6: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

1.2. Tétel. Ha a ξ valószín¶ségi változó Poisson-eloszlású, akkor várható értéke

E(ξ) = λ. (1.2)

Bizonyítás.

E(ξ) =∞∑k=0

xk · p(k, λ) =∞∑k=0

kλk

k!e−λ =

∞∑k=1

kλk

k!e−λ =

=∞∑k=1

λk

(k − 1)!e−λ = λe−λ

∞∑k=1

λk−1

(k − 1)!= λe−λ · eλ = λ.

Tehát valóban λ a várható értéke. �

1.3. Tétel. Ha a ξ valószín¶ségi változó Poisson-eloszlású, akkor szórása

D2(ξ) = λ. (1.3)

Bizonyítás.

E(ξ2) =∞∑k=0

k2λk

k!e−λ =

∞∑k=1

k2λk

k!e−λ =

∞∑k=1

kλk

(k − 1)!e−λ =

=∞∑k=1

[(k − 1) + 1]λk

(k − 1)!e−λ =

∞∑k=2

(k − 1)λk

(k − 1)!e−λ +

∞∑k=1

λk

(k − 1)!e−λ =

= λ2e−λ∞∑k=2

λk−2

(k − 2)!+ λe−λ

∞∑k=1

λk−1

(k − 1)!= λ2 + λ.

A szórásnégyzet:

D2(ξ) = E(ξ2)− E2(ξ) = (λ2 + λ)− λ2 = λ,

amit kapni is akartunk eredményül. �

1.4. De�níció. (Generátorfüggvény) Legyen (a0, a1, . . .) nemnegatív valós szá-

mok olyan sorozata, hogy∑∞

k=0 ak ≤ 1. Ekkor a sorozat generátorfüggvénye

G(z) =∞∑k=0

akzk.

6

Page 7: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

Néhány tulajdonsága:

1. G′ξ(1) = E(ξ)

2. Gξ(z) = E(zξ)

3. G′′ξ (1) = E(ξ2)− E(ξ)

1.5. De�níció. (Valószín¶ségi változó generátorfüggvénye) Ha pk jelöli a

P (ξ = k) valószín¶séget, akkor a ξ valószín¶ségi változóhoz tartozó generátorfügg-

vény

Gξ(z) =∞∑k=0

pkzk.

1.6. De�níció. A λ paraméter¶ Poisson-eloszlás generátorfüggvénye:

Gξ(z) =∞∑k=0

λk

k!e−λzk = e−λ

∞∑k=0

(λz)k

k!= e−λeλz = eλ·(z−1).

A generátorfüggvénynek az 1. és 3. tulajdonságát felhasználva, a Poisson-eloszlás

várható értéke és szórása könnyebben meghatározható:

G′ξ(z) = (e−λeλz)′ = λ · e−λeλz

E(ξ) = G′ξ(1) = λ · e−λeλ·1 = λ.

D2(ξ) = G′′ξ (1) +G′ξ(1)−[G′ξ(1)

]2= λ2eλ(1−1) + λeλ(1−1) −

(λeλ(1−1)

)2=

= λ2 + λ− λ2 = λ.

A Poisson-eloszlás fontos tulajdonsága, hogy ha ξ1 és ξ2 független, Poisson-

eloszlású valószín¶ségi változók λ1 és λ2 paraméterekkel, akkor a ξ1 + ξ2 összeg

is Poisson-eloszlású λ1 + λ2 paraméterrel.

A következ®kben megnézünk a valószín¶ségszámítással foglalkozó könyvek pél-

dáihoz hasonló feladatot.

1.7. Feladat. Egy 500 oldalas könyvben várhatóan 200 sajtóhiba található. Mek-

kora annak a valószín¶sége, hogy 10 véletlenszer¶en kiválasztott lapon nem lesz

sajtóhiba, ha feltételezzük, hogy a sajtóhibák száma Poisson-eloszlású?

7

Page 8: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

Megoldás. Az egy lapra jutó sajtóhibák száma 200500

, tíz lapra 25· 10 = 4 = λ.

P(10 lapon 0 hiba) =40

0!e−4 = 0, 0183

A könyvb®l 1, 83% eséllyel tudunk kiválasztani véletlenszer¶en 10 lapot, amely

hibátlan.

1.8. Feladat. Az elmúlt évben Nógrád megyében a Központi Statisztikai Hivatal

adatai szerint 649 baleset történt. Mennyi a valószín¶sége, hogy két napon, hétf®n

és pénteken is 3 baleset történik?

Megoldás. A balesetek átlagos száma egy napon λ = 649365

= 1, 78.

Független eseményekr®l van szó, mert a balesetek bekövetkezése nem függ egy-

mástól így az sem, hogy melyik nap hány baleset történik. Éppen ezért

P(hétf®n is és pénteken is 3 baleset) =1, 783

3!e−1,78 · 1, 783

3!e−1,78 = 0, 0251

Tehát annak a valószín¶sége, hogy a két legforgalmasabb nap mindegyikén 3

baleset történjen 2, 5%.

8

Page 9: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

1.2. Az összetett Poisson-eloszlás

A független valószín¶ségi változók összegének jelent®s szerepe van. Ezen belül külö-

nösen annak, hogy az összeg tagjainak száma is valószín¶ségi változó.

1.9. De�níció. (Összetett Poisson-eloszlás) Az SN = X1 + . . . + XN véletlen

tagszámú összegben, ha N Poisson-eloszlású, λ várható érték¶, és Xj, j = 1, 2, . . .

független, azonos eloszlású, nemnegatív egész érték¶ valószín¶ségi változókból áll,

melyek függetlenek N-t®l is, akkor SN eloszlása

QS = e−λ∞∑k=0

λk

k!Q∗k, (1.4)

ahol Q = QX-t az összeg tagjaiban szerepl® Xj eloszlások konvolúciójának nevezzük,

melynek jele, Q∗k.

Az összetett Poisson-eloszlás várható értékét és szórásnégyzetét a következ®kép-

pen kapjuk. A teljes várható érték tételét felhasználva kapjuk a várható értéket

E(SN) = E(N) · E(X) = λE(X)

A szórásnégyzet a teljes szórásnégyzet tételéb®l

D2(SN) = E(N)D2(X) +D2(N)E(X)2 = E(N)E(X2) = λE(X2).

1.10. Tétel. Jelölje gX az X1, X2, . . ., GS az SN , GN az N valószín¶ségi változók

generátorfüggvényét. Ekkor

GS = GN ◦GX .

1.11. De�níció. Egy Q = (q0, q1, . . .) valószín¶ségeloszlás korlátlanul osztható, ha

minden n = 1, 2, . . . esetén létezik olyan Pn = (pn,0, pn,1, . . .) eloszlás, amelynek

n-edik konvolúcióhatványa Q-val egyenl®: Q = Pn ∗Pn ∗ · · · ∗Pn. Azaz, ha Q gene-

rátorfüggvényre teljesül, hogy minden n-re n√G(z) is valószín¶ségi generátorfüggvény

a [0, 1] intervallumon.

9

Page 10: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

Ilyen például a Poisson-eloszlás. A λ paraméter¶ Poisson-eloszlás a λ/n paraméter¶

Poisson eloszlás n-edik konvolúcióhatványa.

Az 1.10 tétel szerint az összetett Poisson-eloszlás generátorfüggvénye

GS(z) = e−λ+λ·GX(z).

Ebb®l látszik, hogy korlátlanul osztható:

n√GS(z) = e

λn

(GX(z)−1)

szintén összetett Poisson-eloszlás generátorfüggvénye.

1.12. Tétel. (A generátorfüggvények folytonossági tétele) Legyen

n = 1, 2, . . . esetén az (an,0, an,1, . . .) számsorozat generátorfüggvénye Gn(z).

(a) Tegyük fel, hogy minden k = 0, 1, . . . esetén ∃ limn→∞ an,k =: ak. Ekkor

limn→∞Gn(z) = G(z), |z| < 1, ahol G(z) az (a0, a1, . . .) sorozat generátor-

függvénye. S®t, a konvergencia egyenletes a (−1, 1) intervallum minden zárt

részintervallumán.

(b) Tegyük fel, hogy Gn(z) konvergens minden z ∈ (0, 1) pontban. Ekkor minden

k = 0, 1, . . . esetén ∃ limn→∞ an,k =: ak, és Gn(z) az (a0, a1, . . .) sorozat G(z)

generátorfüggvényéhez tart minden z ∈ (−1, 1) pontban.

1.13. Tétel. A diszkrét korlátlanul osztható eloszlások éppen az összetett Poisson-

eloszlások.

Bizonyítás. Legyen H(z) egy korlátlanul osztható eloszlás generátorfüggvénye. Az

azonosan 0 valószín¶ségi változó eloszlása korlátlanul osztható és összetett Poisson

is, feltehetjük tehát, hogy H(0) < 1. Ha H(0) = 0 lenne, akkor n√H(0) = 0, és

mivel n√H(z) is generátorfüggvény, kiemelhet® lenne bel®le z, de akkor H(z)-b®l

már zn, méghozzá bármilyen nagy n-re, ami nyilvánvalóan nem lehetséges. Tehát

0 < H(0) < 1.

Tudjuk, hogy ha G(z) generátorfüggvény, akkor G(z) = G(z)−G(0)1−G(0)

is az: azé az

eloszlásé, amelyet úgy kapunk, hogy a G-hez tartozó eloszlás 0 index¶ tagja helyére

0-t írunk, a többi tagot pedig úgy szorozzuk fel, hogy az összeg ismét 1 legyen. Más

10

Page 11: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

szóval, ha G(z) = Gξ(z) = E(zξ), akkor G(z) = E(zξ | ξ > 0), a ξ változó ξ > 0

feltétel melletti feltételes eloszlásának a generátorfüggvénye. Ezért minden n pozitív

egészren√H(z)− n

√H(0)

1− n√H(0)

is generátorfüggvény. Ha a > 0, akkor

n√a = e

1n

log a = 1 +1

n(log a+ o(1)) ,

amint n→∞, ezért

n√H(z)− n

√H(0)

1− n√H(0)

→ logH(z)− logH(0)

− logH(0), 0 < z < 1.

Az 1.12 tétel (b) része szerint a határérték is generátorfüggvény, de azt nem mondja

ki, hogy valószín¶ségeloszlásé: tehát az együtthatók összege lehet, hogy kisebb, mint

1. A limeszfüggvény baloldali határértékét kiszámítva a z = 1 helyen ellen®rizhetjük

ezt. Jelen esetben H folytonossága és logH(1) = 0 miatt ez 1, vagyis

g(z) :=logH(z)− logH(0)

− logH(0)

is valószín¶ségeloszlás generátorfüggvénye.

Tehát a H(z) = eλ(G(z)−1), ahol λ = − logH(0) > 0. �

Az összetett Poisson-eloszlás alkalmazási területei:

A gyakorlatban azon belül az ökológiában széles körben alkalmazzák a következ®-

képpen. Egy adott területen az állatcsaládok számát Poisson-eloszlású valószín¶ségi

változónak tekintik. Az egyes almokban született állatok száma legyen egyforma F

eloszlású, és az állatcsaládokat függetlennek feltételezik. Ekkor a területen született

állatok száma összetett Poisson-eloszlású lesz.

A kockázati modellekben az egyes biztosítóintézetek m¶ködésénél három elemét

különböztetjük meg a pénzforgalomnak

- egyes károk esetén a ki�zetett összeg, más néven összkár,

- biztosítottak be�zetése és a

- kezdeti t®ke.

11

Page 12: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

Az összetett kockázati modellek esetén a teljes veszteség mértékét szeretnénk meg-

határozni. Minden egyedhez (kötvény, biztosítás) több káresemény tartozhat. Az

egyedekhez tartozó káresemények száma N , mely λ paraméter¶ Poisson-eloszlást

követ. A teljes kárki�zetés nagyságának eloszlását azonosnak vesszük. Feltesszük,

hogy a kárki�zetések nagyságát megadó Xi, i = 1, 2, . . . sorozat független az össze-

adandók számát megadó valószín¶ségi változótól, azaz N -t®l, valamint a sorozat

tagjai egymástól is függetlenek. Ha az Xi változók azonos eloszlásúak, véges várható

értékkel, N várható értékér®l tudjuk, hogy véges ezért

S =N∑i=1

Xi.

A következ® tétel biztosítja, hogyha a kárigényeket nagyság szerint rendezzük és

az egyes csoportokon belül külön tekintve az összkár értékét, ismét összetett Poisson-

eloszlásokat kapunk.

1.14. Tétel. (Összetett Poisson-eloszlás szétválasztása) Tekintsünk olyan

Z1, Z2, . . . valószín¶ségi változókat, melyek függetlenek, azonos Q eloszlásúak, továb-

bá függetlenek az N λ paraméter¶ Poisson-eloszlású változótól. Legyenek az

A1, . . . Am ⊂ R halmazok diszjunktak. Tegyük fel, hogy Q(Aj) > 0, j = 1, . . . ,m.

Ekkor az

Nk =N∑j=1

χ{Zj∈Ak}, k = 1, . . . ,m

valószín¶ségi változók független, λQ(Ak) paraméter¶ Poisson-eloszlású változók. To-

vábbá az

Sk =N∑j=1

Zjχ{Zj∈Ak} , k = 1, . . . ,m

változók egymástól független, összetett Poisson-eloszlásúak.

Ezt még fel fogjuk használni a kés®bbiekben az összetett Poisson-folyamat során.

12

Page 13: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

1.3. A keverék Poisson-eloszlás

A keverék eloszlásokra azért lehet szükségünk, hogy pontosabb modellt tudjunk

készíteni. Ezt egy példán keresztül fogjuk megnézni.

1.15. De�níció. (Keverék eloszlás) Jelölje ξ1, . . . , ξk a k darab független diszkrét

vagy folytonos valószín¶ségi változót. A k komponens¶ kevert eloszlás s¶r¶ségfügg-

vénye

fξ(x) =k∑j=1

δjfj(x).

A δj jelöli, hogy mekkora súlyokkal vesszük be az egyes változókat az új eloszlásba és

teljesül rájuk, hogy 0 < δj < 1, valamint∑k

j=1 δj = 1. Diszkrét eloszlások keveréké-

b®l diszkrét keverék eloszlást, folytonos eloszlások keverékéb®l pedig folytonos keverék

eloszlást kapunk.

Tekintsük az alábbi táblázatban szerepl® adatokat, melyek 1900 − 2006 között

történt 7-es vagy annál nagyobb er®sség¶ földrengések évenkénti számát adják meg.

13 14 8 10 16 26 32 27 18 32 36 24 22 23 22 18 25 21

21 14 8 11 14 23 18 17 19 20 22 19 13 26 13 14 22 24

21 22 26 21 23 24 27 41 31 27 35 26 28 36 39 21 17 22

17 19 15 34 10 15 22 18 15 20 15 22 19 16 30 27 29 23

20 16 21 21 25 16 18 15 18 14 10 15 8 15 6 11 8 7

18 16 13 12 13 20 15 16 12 18 15 16 13 15 16 11 11

Els®ként azt feltételeznénk, hogy az adatok Poisson-eloszlást követnek, melynek

valószín¶ségfüggvénye

p(k, λ) = e−λλk

k!.

Ekkor a minta várható értékének és a szórásnégyzetének nagyjából meg kellene

egyeznie, azonban a példában a minta szórásnégyzete D2 ≈ 52, a várható értéke

pedig E ≈ 19. Ez elég nagy eltérés, ezért alkalmazzuk a keverék eloszlást.

13

Page 14: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

Az el®z® táblázatbeli adatokat ábrázolva is láthatjuk.

1.1. ábra. Földrengések száma (1900-2006)

1.16. De�níció. (Poisson-eloszlások keveréke) Tekintsük a ξ1, . . . , ξk egymás-

tól független, Poisson eloszlású valószín¶ségi változókat λi, i = 1, . . . , k várható ér-

tékekkel. Az 1.15 de�níció alapján jelölje δ1, . . . , δk a súlyokat és p1, . . . , pk a való-

szín¶ségfüggvényüket. Legyen X eloszlása keverék eloszlás, mivel Poisson-eloszlások

keverékéb®l áll össze, ezért X keverék Poisson-eloszlású lesz, melynek valószín¶ség-

függvénye

P (X = x) =k∑i=1

P (X = x|C = i)P (C = i) =k∑i=1

δipi(x).

Az X tehát k darab komponensb®l tev®dik össze, ahol C értéke (1.5)-ben található.

komponens 1 2 . . . k

valószín¶ségfüggvény p1(x) p2(x) . . . pk(x)

C =

1, δ1 valószín¶séggel

2, δ2 valószín¶séggel...

k, δk valószín¶séggel.

(1.5)

14

Page 15: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

A keverék eloszlás várható értéke a komponens eloszlások várható értékének li-

neáris kombinációja:

E(X) =k∑i=1

P (C = i)E(X|C = i) =k∑i=1

δiE(ξi).

1.17. Tétel. (Teljes szórásnégyzet tétel) A tétel általánosan

D2(X) =k∑i=1

δiD2(ξi) +

k∑i=1

δiE(ξi)2 −

(k∑i=1

δiE(ξi)

)2

=

=k∑i=1

δiE(ξ2i )−

(k∑i=1

δiE(ξi)

)2

.

A szórásnégyzet a két komponens¶ esetre még könnyen meghatározható analitikusan

is az el®z® tétel alapján

D2(X) = δ1D2(ξ1) + δ2D

2(ξ2) + δ1δ2 (E(ξ1)− E(ξ2))2 .

1.3.1. Paraméter becslés

Azokban az esetekben, amikor azt feltételezzük, hogy az adataink keverék Poisson-

eloszlásból származnak, becsülnünk kell a λi és δi paramétereket. A paraméter becs-

lést leggyakrabban maximum likelihood becsléssel végezzük el.

1.18. De�níció. (Maximum-likelihood módszer) Tegyük fel, hogy

x1, x2, . . . , xn az adott minta, amelynek segítségével az ismeretlen a paramétert akar-

juk becsülni. Ha az ismeretlen a paramétert®l függ® eloszlás mintaelemeinek közös

s¶r¶ségfüggvénye f(x, a), akkor a független mintaelemek együttes s¶r¶ségfüggvénye

f(x1, a) · . . . · f(xn, a) =n∏i=1

f(xi, a),

ahol x1, . . . , xn számok a mintaelemeknek a kísérlet során mért értékei. Ekkor a

maximum likelihood-módszer szerint az a paraméter becslésének az x1, . . . , xn min-

taelemeknek azt az a = a(x1, x2, . . . , xn) függvényét nevezzük, melyre a∏n

i=1 f(xi, a)

szorzat a lehet® legnagyobb értéket veszi fel, feltéve, hogy a maximum létezik és egy-

értelm¶.

15

Page 16: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

Általában a k komponens¶ keverék eloszlás likelihood függvénye adott

L(θ1, . . . , θk, δ1, . . . , δk|x1, . . . , xn) =n∏j=1

k∑i=1

δipi(xj, θi), (1.6)

ahol θ1, . . . , θk a komponens eloszlások paraméterei, a δi, i = 1, . . . , k a súlyok, me-

lyek összege 1. Az xi-k pedig a meg�gyelések. Ennek vesszük a logaritmusát, majd ezt

követ®en a maximumát. A maximum likelihood becslést analitikusan végig számolni

elég bonyolult, ezért numerikus módszerrel szokás elvégezni, amelyre található egy

hasznosR-beli, �exmix csomag. A példánkra ezt alkalmazva, behelyettesítünk az 1.6

képletbe, majd maximalizáljuk a loglikelihood függvényt egy R-beli függvénnyel, az

nlm-el.

A δi ≥ 0 és λi ≥ 0, (i = 1, . . . , k) paramétereket el®ször át kell paraméterezni,

hogy használni tudjuk az optimalizálás során. Az átparaméterezésre azért van szük-

ségünk, mert az nlm függvény a valós számok teljes halmazán keresi a loglikelihood

függvény maximum értékét, viszont a δi és λi értékekre van megszorítás. Legyenek

ηi = log λi, (i = 1, . . . , k)

τi = log

(δi

1−∑k

j=2 δj

), (i = 2, . . . , k).

Így az ηi, τi ∈ R tetsz®legesek.

Az eredeti paramétereket a következ®képpen fejezhetjük ki:

λi = eηi , (i = 1, . . . , k),

δi =eτi

1 +∑k

j=2 eτi, (i = 2, . . . , k) és

δ1 = 1−k∑j=2

δi.

Ezeket a változókat már tudjuk használni az nlm során.

16

Page 17: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

modell i δi λi − logL várható érték szórásnégyzet

k = 1 1 1,000 19,364 391,9189 19,364 19,364

k = 2 1 0,676 15,777 360,3690 19,364 46,182

2 0,324 26,840

k = 3 1 0,278 12,736 356,8489 19,364 51,170

2 0,593 19,785

3 0,130 31,629

k = 4 1 0,093 10,584 356,7337 19,364 51,638

2 0,354 15,528

3 0,437 20,969

4 0,116 32,079

meg�gyelés 19,364 51,573

1.2. ábra. Poisson eloszlások keveréke a földrengés modellben.

Az 1.2 táblázatban találhatjuk a különböz® esetekre, milyen értékeket kapunk.

Látható, hogy k = 3 és k = 4 esetekben a keverék eloszlás jól közelíti a szórásnégy-

zetet. Azonban a − logL értéke k = 4 esetnél már nem változik jelent®sen, valamint

van egy változónk 0,09 súllyal, ami szintén nem annyira mérvadó. Így a négy vál-

tozós eset már nem hoz annyival jobb eredményt, hogy megérje azt választanunk.

Ez azt jelenti, hogy három egymástól független, 12,736; 19,785; 31,629 paraméte-

r¶ Poisson-eloszlású valószín¶ségi változók keverékét kell használnunk 0,278; 0,593;

0,130 súlyokkal, hogy jól modellezhet® legyen a probléma.

17

Page 18: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

2. fejezet

Az eloszlás használata közelítésre

2.1. A binomiális eloszlás közelítése

Poisson-eloszlással

A binomiális eloszlást szeretnénk úgy közelíteni, hogy az eltérés a lehet® legkisebb le-

gyen, azaz a binomiális és a másik eloszlás hányadosára 1 körüli értéket kapjunk. Erre

a Poisson eloszlást szokás használni. Ez azért is célszer¶ mert a Poisson-eloszlásnak

egyetlen paramétere van, míg a binomiális eloszlásnak az n és a p.

2.1. De�níció. (Binomiális eloszlás) Legyen az n kísérletb®l álló Bernoulli-kísér-

letsorozatban p a jó és q a rossz eset valószín¶sége, és b(k;n, p) jelölje annak a va-

lószín¶ségét, hogy a kísérletek során k jó és n− k rossz eset következik be. Ekkor

b(k;n, p) = P (ξ = k) =

(n

k

)pkqn−k, (2.1)

ahol 0 < p < 1, q = 1− p és k = 0, . . . n.

Sokszor olyan Bernoulli-kísérletsorozattal foglalkozunk, ahol egymáshoz viszo-

nyítva n nagy, p kicsi, és a

λ = np

szorzat nem túl nagy és nem is túl kicsi. Ezekben az esetekben b(k;n, p) Poissontól

származó becslését szokás használni.

18

Page 19: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

2.2. Tétel. Ha n→∞ esetén p→ 0 úgy, hogy közben n · p szorzat állandó marad,

np = λ > 0, akkor q = 1− p jelöléssel

limn→∞

(n

k

)pkqn−k =

λk

k!e−λ.

Bizonyítás. Ha k = 0, akkor

b(0;n, p) = (1− p)n =

(1− λ

n

)n.

Mindkét oldal logaritmusát véve és Taylor-sorba fejtve,

ln(b(0;n, p)) = n · ln(

1− λ

n

)= −λ+

λ2

2n− . . . .

Tehát, ha n elég nagy, akkor

b(0;n, p) ≈ e−λ.

Továbbá, hogy ha n elég nagy, akkor bármely rögzített k-ra

b(k;n, p)

b(k − 1;n, p)=λ− (k − 1)p

kq≈ λ

k.

Ezek alapján

b(1;n, p) ≈ λ · b(0;n, p) ≈ λe−λ,

b(2;n, p) ≈ 1

2λ · b(1;n, p) ≈ 1

2λ2e−λ,

és általánosságban � amint teljes indukcióval belátható �

b(k;n, p) ≈ λk

k!e−λ. (2.2)

Ez a binomiális eloszlás klasszikus közelítése a Poisson-eloszlással. �

2.3. Feladat. Tegyük fel, hogy az emberek egy százaléka balkezes. Becsüljük meg

annak valószín¶ségét, hogy 200 emberb®l legalább 4 balkezes!

Megoldás. Tudjuk, hogy 1% balkezes, tehát 200 emberb®l várhatóan 2 balkezes

⇒ λ = 2.

P(legalább 4 ember balkezes)=1-P(legfeljebb 3 ember balkezes)=

=1-(P(0 balkezes)+P(1 balkezes)+P(2 balkezes)+P(3 balkezes))=

= 1− (20

0!e−2 + 21

1!e−2 + 22

2!e−2 + 23

3!e−2) = 0, 143

19

Page 20: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

Annak a valószín¶sége, hogy 200 emberb®l legalább 4 balkezes, körülbelül 14, 3%.

A következ®kben a binomiális eloszlás Poisson-féle közelítését használjuk, vala-

mint együttes viselkedésüket vizsgáljuk, tehát λ = np.

2.4. Állítás. Ha k monoton növekedve 0-tól végtelenhez tart, akkor az

ak =b(k;n, p)

p(k;λ)(2.3)

hányados el®ször n®, majd csökken, és maximumát a legnagyobb olyan k egész számra

éri el, mely (λ+ 1)-nél nem nagyobb.

Bizonyítás. Tekintsük az akak−1

hányadost:

b(k;n, p)

p(k;λ)· p(k − 1;λ)

b(k − 1;n, p)=

(nk

)pkqn−k

e−λ λk

k!

·e−λ λk−1

(k−1)!(nk−1

)pk−1qn−k+1

=

=

n!k!·(n−k)!

pkqn−k

e−λ λk

k!

·e−λ λk−1

(k−1)!

n!(k−1)!(n−k+1)!

pk−1qn−k+1=

pkλk−1

λk·qk·(n−k+1)

=pλk−1

λk·qn−k+1

=

= p · λk−1 · n− k + 1

q · λk=p(n− k + 1)

q· λ−1 =

pn− pk + p

Ha ennek a törtnek a számlálója nagyobb a nevez®jénél,

pn− pk + p > λq = λ(1− p)

λ− pk + p > λ− λp

−pk + p+ λp > 0

p(1 + λ) > pk

1 + λ > k,

akkor (2.3) hányados addig n®, amíg k < 1 + λ. �

20

Page 21: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

2.5. Állítás. Ha k n®, akkor b(k;n, p) el®ször kisebb, majd nagyobb, majd ismét

kisebb, mint p(k;λ).

Bizonyítás. Mindkét eloszlás tagjainak összege külön-külön 1, ezért nem lehetsé-

ges, hogy az egyik eloszlás mindig kisebb, mint a másik, mert akkor az összeg kisebb

lenne 1-nél.

b(0;n, p) =

(n

0

)p0qn = qn =

(1− λ

n

)np(0, λ) = e−λ · λ

0

0!= e−λ = e−np

Felhasználva, hogy 1 + x < ex, ha x 6= 0,

1− p < e−p,

(1− p)n < e−np

egyenl®tlenséget kapjuk. Azaz b(0;n, p) < p(0, λ), ugyanakkor b(k;n, p) = 0, ha

k > n, így elég nagy k-ra is b(k;n, p) < p(k, λ). �

A binomiális-eloszlást szeretnénk úgy alulról és felülr®l becsülni, hogy az egyen-

l®tlenséget tovább alakítva majd felhasználva, a Poisson-eloszlás segítségével kap-

junk egy újabb közelítést.

2.6. Állítás.

λk

k!

(1− λ

n

)n−k≥ b(k;n, p) ≥ λk

k!

(1− k

n

)k (1− λ

n

)n−k. (2.4)

Bizonyítás. Átírva az egyenl®tlenség közepét azt kapjuk, hogy

λk

k!

(1− λ

n

)n−k≥(n

k

)(λ

n

)k (1− λ

n

)n−k≥ λk

k!

(1− k

n

)k (1− λ

n

)n−kEzt leegyszer¶sítve:

1 ≥ n · . . . · (n− k + 1)

nk≥(

1− k

n

)k=

(n− kn

)kA baloldali egyenl®tlenségben a tört számlálójában egy k tényez®s szorzat áll. Ennek,

ha minden tényez®jét n-nel felülr®l becsüljük, az egyenl®tlenség teljesül.

21

Page 22: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

A jobb oldalon álló egyenl®tlenségben pedig a tört számlálójában minden tényez®t

(n− k)-val alulról becsülve kapjuk a végeredményt. �

A 2.3 feladatban becsültük a balkezesek számát, ennek a becslésnek a pontosságát

láthatjuk a következ® táblázatban a 2.6 egyenl®tlenség alapján.

k 2k

k!

(1− 2

200

)200−kb(k; 200; 0, 01) 2k

k!

(1− k

200

)k (1− 2

200

)200−k

0 0,134 0,1340 0,1340

1 0,2707 0,2707 0,2693

2 0,2734 0,2720 0,2680

3 0,1841 0,1814 0,1759

4 0,0930 0,0902 0,0858

5 0,0376 0,0357 0,0331

6 0,0126 0,0117 0,0105

7 0,0037 0,0033 0,0028

8 9, 2189 · 10−4 8, 0002 · 10−4 6, 6504 · 10−4

9 2, 0693 · 10−4 1, 7239 · 10−4 1, 3673 · 10−4

10 4, 1805 · 10−5 3, 3260 · 10−5 2, 5030 · 10−5

2.7. Állítás. A 2.6 állítás felhasználásával következik, hogy

p(k;λ)ek·λn ≥ b(k;n, p) ≥ p(k;λ)e

−k2n−k−

λ2

n−λ . (2.5)

Bizonyítás. Els®ként tekintsük a bal oldali egyenl®tlenséget. Az el®z® feladatból

tudjuk, hogyλk

k!

(1− λ

n

)n−k≥ b(k;n, p). (2.6)

Azt kell belátnunk, hogy

λk

k!e−λek

λn ≥ λk

k!

(1− λ

n

)n−k,

ekkor a 2.5 bal oldala biztosan teljesül. Átrendezve kell, hogy

e−nλ+kλ

n ≥(

1− λ

n

)n−k.

22

Page 23: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

Felhasználva, hogy 1− t ≤ e−t

1− λ

n≤ e−

λn ,(

1− λ

n

)n−k≤(e−

λn

)n−k= e

−nλ+kλn .

Ezzel a bal oldalt beláttuk.

A jobb oldalon ugyanezt a technikát alkalmazva akarjuk belátni, hogy

λk

k!

(1− k

n

)k (1− λ

n

)n−k≥ λk

k!e−λe

−k2n−k−

λ2

n−λ ,

(1− k

n

)k (1− λ

n

)n−k≥ e−λe

−k2n−k−

λ2

n−λ . (2.7)

Itt azt az egyenl®tlenséget használjuk a 2.7 egyenl®tlenség bal oldalán lév® ténye-

z®kre külön�külön, hogy 1− t ≥ e−t1−t(

1− k

n

)k≥(e−k/n

1−(k/n)

)k= e

−k2/n1−(k/n) = e

−k2n−k ,

(1− λ

n

)n−k≥(e−λ/n

1−(λ/n)

)n−k=(e−λn−λ

)n−k= e

−λ(n−k)n−λ .

Azonban az (1− λ

n

)n−k≥ e−λe

−λ2n−λ = e

−λ(n−λ)−λ2n−λ = e

−λnn−λ

egyenl®tlenséget szeretnénk kapni. Tehát szeretnénk, ha

e−λ(n−k)n−λ ≥ e

−λnn−λ .

egyenl®tlenség teljesülne. Az eλkn−λ hatványban a kitev® pozitív, tehát az egész hat-

vány egynél nagyobb. Ezt kihasználva:

e−nλn−λ+ λk

n−λ = e−nλn−λ · e

λkn−λ ≥ e

−λnn−λ .

Azaz a 2.5 egyenl®tlenség mindkét oldalát igazoltuk. �

Ebben az egyenl®tlenségben már megjelenik a Poisson-eloszlás, ahogy azt szeret-

tük volna.

A 2.3 feladat adataira vizsgáljuk a becslés pontosságát, mégpedig úgy, hogy

az állítás bal valamint jobb oldalán szerepl® kifejezésekkel leosztjuk a binomiális

eloszlást. Annál jobb a becslésünk minél közelebb van a hányados értéke 1-hez.

23

Page 24: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

k b(k;200;0,01)

p(k;2)ek2

200

b(k;200;0,01)

p(k;2)e−k2

200−k−22

200−2

0 0,9900 1,0102

1 0,9900 1,0255

2 0,9851 1,0465

3 0,9753 1,0735

4 0,9607 1,1072

5 0,9416 1,1482

6 0,9181 1,1976

7 0,8906 1,2564

8 0,8595 1,3259

9 0,8251 1,4079

10 0,7880 1,5043

2.2. Poisson-közelítés párosítással

2.8. De�níció. Legyenek Pn = (pn,0, pn,1, . . .), n = 1, 2, . . ., és Q = (q0, q1, . . .)

diszkrét valószín¶ségeloszlások. Azt mondjuk, hogy Pn gyengén konvergál Q-hoz

(Pnw→ Q), ha minden k = 0, 1, . . . esetén limn→∞ pn,k = qk.

2.9. De�níció. Legyen P = (p0, p1, . . .) és Q = (q0, q1, . . .) két diszkrét valószín¶-

ségeloszlás. Ekkor a variációs távolságuk

||P−Q|| =∞∑k=0

|pk − qk| (ez a két számsorozat l1 -távolsága).

Azt mondjuk, hogy a Pn diszkrét valószín¶ségeloszlások teljes variációban konvergál-

nak Q-hoz, ha ||Pn −Q|| → 0.

2.10. Lemma. Pnw→ Q ⇔ ||Pn − Q|| → 0, azaz az el®bbi két konvergenciafajta

ekvivalens.

2.11. Lemma. Legyen ξ és η nemnegatív egész érték¶. Ekkor az eloszlásaik variá-

ciós távolságára∞∑k=0

|P (ξ = k)− P (η = k)| ≤ 2 · P (ξ 6= η).

24

Page 25: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

Nézzük a bizonyítását, amit egy kés®bbi tétel során felhasználunk.

Bizonyítás. A szumma tagjaiban mindkét valószín¶ségb®l vonjuk ki P (ξ = k, η =

k)-t.

∞∑k=0

|P (ξ = k)− P (η = k)| =∞∑k=0

|P (ξ = k, η 6= k)− P (η = k, ξ 6= k)| ≤

≤∞∑k=0

P (ξ = k, η 6= ξ) +∞∑k=0

P (η = k, ξ 6= η) = 2P (ξ 6= η).

Amit eredményül akartunk kapni. �

Ezzel a lemmával már úgy adhatunk jó becslést két diszkrét eloszlás variációs

távolságára, hogy keresünk hozzájuk olyan valószín¶ségi változókat, amelyek elosz-

lása éppen a két megadott, és amelyek minél nagyobb valószín¶séggel megegyeznek

egymással. Ezt az eljárást párosításnak nevezik.

Legyenek A1, A2, . . . , An független események. Legyen P (Ai) = pi, és jelölje N

azon események számát, amelyek teljesülnek: N = I(A1) + I(A2) + · · · + I(An).

E(N) = p1 + · · ·+ pn, legyen ez λ. Ekkor N eloszlása a következ® mértékben köze-

líthet® a λ paraméter¶ Poisson-eloszlással.

2.12. Tétel. (Le Cam)

∞∑k=0

∣∣∣∣P (N = k)− λk

k!e−λ∣∣∣∣ ≤ 2 ·

n∑i=1

pi2.

Bizonyítás. A 2.10 lemmát alkalmazzuk. Egy-egy Poisson-eloszlású valószín¶ségi

változót párosítunk külön-külön az I(Ai) indikátorokhoz.

Legyenek ξ1, ξ2, . . . , ξn független valószín¶ségi változók, amelyek a {−1, 0, 1, . . .}értékeket vehetik fel. Legyen továbbá ηi = I(ξi ≥ 0) és ζi = ξ+

i . Ekkor η1, η2, . . . , ηn

független indikátorok. A ζ1, ζ2, . . . , ζn is függetlenek és ζi, pi paraméter¶ Poisson-

eloszlásúak. A P (ξi = k), P (ηi = k), P (ζi = k) valószín¶ségeket az alábbi táblázat-

ban találjuk.

25

Page 26: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

k P(ξi = k) P(ηi = k) P(ζi = k)

-1 1− pi 0 0

0 e−pi − 1 + pi 1− pi e−pi

1 pi1

1!e−pi pi

pi1

1!e−pi

k > 1 pik

k!e−pi 0 pi

k

k!e−pi

Tudjuk, hogy η1 + η2 + · · ·+ ηn ugyanolyan eloszlású, mint N , ζ1 + ζ2 + · · ·+ ζn

pedig λ paraméter¶ Poisson-eloszlású, ezen felül

P (ηi 6= ζi) = 1− P (ηi = ζi) = 1− P (ηi = ζi = 0)− P (ηi = ζi = 1) =

1− P (ξi = −1)− P (ξi = 1) = 1− (1− pi)− e−pi · pi = pi(1− e−pi) ≤ pi2

Itt megint azt az egyenl®tlenséget használtuk, hogy ex ≥ 1 + x, x = −pi-re.Tehát a

∞∑k=0

∣∣∣∣P (N = k)− λk

k!e−λ∣∣∣∣ ≤ 2P

(n∑i=1

ηi 6=n∑i=1

ζi

)≤ 2

n∑i=1

P (ηi 6= ζi) ≤ 2n∑i=1

pi2

közelítéssel meg tudtunk adni két olyan diszkrét eloszlást melyekre a feltételek tel-

jesülnek és a becslés jól m¶ködik. �

Ennél a közelítésnél, ha a mindegyik pi-t p-nek választjuk, akkor a binomiális

eloszlás és a Poisson-eloszlás variációs távolságát kapjuk. Azaz p = λnesetén

∞∑k=0

∣∣∣∣(nk)pkqn−k − λk

k!e−λ∣∣∣∣ ≤ 2 ·

n∑1

p2 = 2n

n

)2

= 2 · λ2

n

26

Page 27: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

3. fejezet

Folyamatok

Általában, ha folyamatokról beszélünk, az id®vel valamilyen kapcsolatba hozzuk a

történéseket. Mint például, mennyi ideig tartott egy vizsgált cselekvés? Valamennyi

eltelt id® alatt hányszor következett be a meg�gyelt esemény? Ebben a fejezetben

ez utóbbi kérdésre választ adó modellekkel foglalkozunk.

3.1. A Poisson-folyamat

A folyamatot Siméon-Denis Poisson francia matematikusról nevezték el, amely egy

véletlenszer¶ (sztochasztikus) folyamat és az id®ben véletlenszer¶en bekövetkez®

eseményeket modellezi. Ilyen például az áruházba beérkez® vev®k száma, telefon-

központba beérkez® hívások mennyisége, radioaktív bomlás stb. Ezt a folyamatot

szokták pontfolyamatnak is nevezni, mert minden bekövetkezést az id®tengely egy

pontjának feleltetünk meg.

A Poisson-folyamaton belül megkülönböztetünk homogén és inhomogén változatot.

3.1.1. Homogén Poisson-folyamat

Azt vizsgáljuk, hogy tetsz®leges t hosszúságú intervallumban mennyi az összes be-

következések N(t) száma. Feltételezzük, hogy egy esemény bekövetkezésének való-

szín¶sége bármely t hosszúságú intervallumban mindig ugyanannyi és független a

múltbeli eseményekt®l.

Tegyük fel, hogy N(t) monoton növ® számláló folyamat, azaz egy természetes

szám minden t-re. Továbbá az N(ti) − N(ti−1) valószín¶ségi változók függetlenek

27

Page 28: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

minden t0 < t1 < · · · < tn-re, tehát a folyamat független növekmény¶.

Vizsgáljuk meg a valószín¶ségét annak, hogy bizonyos id®n belül 0; 1 vagy egynél

több esemény következik be. Jelölje

Pn(t) = P (N(t) = n).

Azt mondjuk, hogy a folyamat az En állapotban van, ha 0 és t id®pillanat között n

darab esemény következett be.

Vegyük az egység hosszú id®intervallum ekvidisztáns felosztását, ekkor h = 1n.

Azon részintervallumok várható száma melyben van ugrás, azaz bekövetkezett ese-

mény

n · (1− P0(h)) =1

h· (1− P0(h)).

A h→ 0 esetén az várható el, hogy ez az egységnyi hosszúságú intervallumon bekö-

vetkez® események várható értékéhez fog konvergálni, azaz feltehetjük, hogy

1

h· (1− P0(h))→ λ.

Tehát annak a valószín¶sége, hogy egy részintervallumon nem következik be esemény,

P0(h) = 1− hλ+ o(h), (3.1)

ahol o(h) egy h-nál kisebb mennyiséget jelent. A t-edik id®pillanatig bekövetkezett

események számát jelölje St. Innen csak a �szomszédos� St+1 pontba tudunk ugrani a

�zikai háttérb®l adódóan. Azaz egy részintervallumon egynél több ugrást tartalmazó

h hosszúságú részintervallumok számának várható értéke 0-hoz kell, hogy tartson,

tehát

n · (1− P0(h)− P1(h))→ 0.

Ebb®l már megkapjuk azt is, hogy mennyi a valószín¶sége, hogy egy esemény bekö-

vetkezik h-n1

h(1− 1− hλ+ o(h)− P1(h))→ 0

P1(h) = hλ+ o(h) (3.2)

Egynél több bekövetkezés valószín¶sége pedig

o(h). (3.3)

28

Page 29: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

Ezek ismeretében már megmutatható, hogy

Pn(t) =(λt)n

n!e−λt. (3.4)

Tegyük fel, hogy n ≥ 1 és a t+ h id®pillanatban n esemény következett be, ennek a

valószín¶sége Pn(t+ h). Ez háromféleképpen következhet be:

a) A t-edik pillanatban már bekövetkezett n esemény, ekkor [t, t+ h]-n már nem

fog bekövetkezni egyetlen esemény sem. Ennek valószín¶sége:

Pn(t)P0(h) = Pn(t)(1− λh) + o(h)

b) A t-edik pillanatban n − 1 darab esemény következett be eddig és [t, t + h]-n

bekövetkezik még egy, aminek a valószín¶sége

Pn−1(t)P1(h) = Pn−1(t)λh+O(h)

c) Ha ezeken kívül bármilyen más eset fordul el®, akkor [t, t + h]-n legalább két

eseménynek kell teljesülnie, aminek a valószín¶sége igen csak kicsi, az el®bbiek

alapján o(h).

Így Pn(t+ h)-t ennek a három független eseménynek az összegéb®l kapjuk

Pn(t+h) = Pn(t)(1−λh) +Pn−1(t)λh+ o(h) = Pn(t)−Pn(t)λh+Pn−1(t)λh+ o(h),

amelyet átalakítva

Pn(t+ h)− Pn(t)

h= −Pn(t)λ+ Pn−1(t)λ+

o(h)

h.

Amennyiben h 0-hoz tart akkor az utolsó tag is 0-hoz tart, így

P ′n(t) = −Pn(t)λ+ Pn−1(t)λ n ≥ 1.

Az a) esetben lehetséges csak, hogy n = 0, ekkor

P0(t+ h) = P0(t)(1− λh) + o(h) = P0(t)− P0(t)λh+ o(h).

P ′0(t) = −λP0(t).

Ennek és a P0(0) = 1 segítségével láthatjuk, hogy P0(t) = e−λt, valamint P1(0) = 0

miatt P1(t) = λte−λt.

Ezek ismeretében már a Possion-folyamat teljes de�nícióját is bevezethetjük.

29

Page 30: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

3.1. De�níció. Az N(t) (t ≥ 0) Poisson-folyamat, ha

• N(t) számláló folyamat, N(t) természetes szám minden minden t-re és N(t)

monoton növ®.

• Ha a t0 = 0 < t1 < · · · < tn esetén az N(ti) − N(ti−1) valószín¶ségi változók

függetlenek, tehát a folyamat független növekmény¶.

• Ha a [ti−1, ti], i = 0, . . . n id® intervallumok azonos nagyságúak, akkor az

N(ti) − N(ti−1) valószín¶ségi változók, Poisson-eloszlásúak λt (t = ti − ti−1)

várható értékkel.

Például, ha t = 1.6; 2.7; 3.1; 3.7; 4.3; 5.2 id®pontokat, akkor az N(5, 2) − N(3, 1)

és az N(2, 7)−N(1, 6) növekmények függetlenek, de az N(5, 2)−N(3, 1) és N(4, 3)−N(3, 7) növekmények már nem, mert az id®intervallumok nem diszjunktak. Azonban,

ha két intervallum végpontja megegyezik azokat függetlennek tekintjük.

A Poisson-folyamat tehát egy számláló folyamat, melyben két bekövetkezés id®-

pontja között eltelt id® exponenciális eloszlású valószín¶ségi változó 1λvárható ér-

tékkel. Ez látható abból is, amikor azt vizsgáljuk, hogy egy intervallumon 0 esemény

következik be. A másik jellege a folyamatnak, hogy (3.1) � (3.3) valószín¶ségek nem

függenek a korábbi, N(t) állapottól.

3.1.2. Inhomogén Poisson-folyamat

Az el®z® részben (3.1) � (3.3) esetekben a λ egy konstans, t-t®l nem függ® mennyiség

volt. Azoknak az eseményeknek a modellezésekor, melyeknek az intenzitása változik

id®ben, azoknál célszer¶ λ-t az id®t®l függ®vé tenni.

Tegyük fel továbbra is, hogy N(t) számláló folyamat. Az inhomogén folyama-

tot hasonlóan de�niáljuk mint a homogén esetben de nem ugyanazok a jellemz®k

rá. Az egymást nem átfed® intervallumok továbbra is függetlenek. A homogén eset-

ben ugyanolyan nagyságú intervallumok ugyanolyan paraméter¶ eloszlást követtek,

itt nem mondható el ugyanez. Az intenzitás id®t®l függ, ezért egy intervallumon

bekövetkez® események várható értékét az alábbiak szerint számoljuk

Λ(ti; ti+1) =

∫ ti+1

ti

λ(x)dx.

30

Page 31: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

3.2. Példa. Tegyük fel, hogy N egy Poisson-folyamat egy adott λ(t) = 2t inten-

zitásfüggvénnyel. Továbbá azt, hogy 100 esemény következett be t = 1, 2-ig, azaz

N(1, 2) = 100. Az M = N(1, 2) = N(1, 2)−N(0) egy Poisson-eloszlású valószín¶sé-

gi változó, Λ =∫ 1,2

02zdz = 1, 44 várható értékkel. Ezt a meg�gyelést használjuk föl

ahhoz, hogy meghatározzuk az N(2, 6) eloszlását.

Azt már ismerjük, hogy a [0; 1, 2] intervallumon mi történt, így már csak az [1, 2; 2, 6]

intervallumot kell vizsgálnunk.

N(2, 6) = [N(2, 6)−N(1, 2)] + [N(1, 2)−N(0)].

Az els® zárójelben lév® valószín¶ségi változó várható értékét a de�níció alapján

számolva kapjuk, hogy

Λ =

∫ 2,6

1,2

2zdz = 5, 32.

Ezzel együtt már ismerünk mindent az N(2, 6) meghatározásához, mégpedig

[N(2, 6)|N(1, 2) = 100] ≈ N + 100.

Ez megkönnyíti N(2, 6) várható értékének meghatározását

E[N(2, 6)|N(1, 2) = 100] = E[M + 100] = E[M ] + 100 = 5, 32 + 100 = 105, 32

A szórásnégyzete pedig

D2[N(2, 6)|N(1, 2) = 100] = D2[M + 100] = D2[M ] = 5, 32.

A valószín¶séget ezek után már még könnyebb számolni. Számoljuk ki annak a

valószín¶ségét, hogy t = 2, 6 id®pontig 115 esemény következik be.

P [N(2, 6) = 115|N(1, 2) = 100] =

= P [M + 100 = 115] = P [M = 15] =e−5,325, 3215

15!= 2, 8955 · 10−4.

3.3. Példa. Ahogy azt az el®z® példában is feltettük, legyenN egy Poisson-folyamat,

λ(t) = 2t intenzitásfüggvénnyel.

Feladatunk, hogy meghatározzuk P [T3 > 1, 2]-t, azaz mennyi a valószín¶sége annak,

hogy a harmadik esemény bekövetkezése t = 1, 2 után történt.

A harmadik esemény t = 1, 2 után történt ezért 1,2 id®pontig legfeljebb 2 esemény

31

Page 32: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

következett be, azaz N(1, 2) ≤ 2. Ez ekvivalens azzal, hogy T3 > 1, 2, ezért a való-

szín¶ségük is megegyezik. Az el®z® példa alapján N(1, 2) egy Poisson-eloszlású M

valószín¶ségi változó 1,44 várható értékkel. Így

P [T3 > 1, 2] = P [N(1, 2) ≤ 2] = P [M ≤ 2] =

= P [M = 0] + P [M = 1] + P [M = 2] =

= e−1,44 + e−1,44 1, 441

1!+ e−1,44 1, 442

2!= 0, 82375.

Tehát 82%-os valószín¶séggel az 1,2 id®pont után fog bekövetkezni a harmadik ese-

mény.

A homogén folyamatot sok esetben használjuk, azonban az inhomogén folya-

mat modellezésével pontosabb eredményt kapunk. A valóságban ilyen folyamattal

modellezünk például:

• telefonközpontba beérkez® hívásokat, ahol a hívások száma reggel 8 óra és

délután 6 óra között gyakoribb, mint a nap többi id®szakában,

• autópályáról érkez® kocsik száma a f®városba, reggel 8 óra körül megn® az

intenzitás, aztán megint csökken,

• adatbázis rendszerben a tranzakciós folyamatokat,

• vendégek érkezése a gyorsétterembe különböz® napszakokban s¶r¶södik.

Sok módja van az inhomogén Poisson-folyamat generálásának, amiket röviden

áttekintünk.

1. Az els®, hogy a λ = 1 paraméter¶ homogén Poisson-folyamat id®intervallumát

átskálázzuk. Ha az E1, E2, . . . a bekövetkezett események id®pontja a homo-

gén folyamatban, akkor Λ−1(E1),Λ−1(E2), . . . pontok az inhomogén folyamat

pontjait jelöli Λ(t) intenzitásfüggvénnyel. Ezt láthatjuk a 3.1 ábrán. Tekint-

sünk egy id®intervallumot, � legyen ez a [ti−1, ti] � melyben található esemény,

az intervallum átskálázását az ábráról leolvasva könny¶ meghatározni.

32

Page 33: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

A ti−1; ti id®pontokat a Λ(t) tengelyre vetítve azok, azt a Λ(ti−1) és Λ(ti)

pontokban metszik. Innen

N(ti)−N(ti−1) = N(Λ(ti))− N(Λ(ti−1))

valószín¶ségi változók Poisson-eloszlásúak Λ(ti)−Λ(ti−1) =∫ titi−1

λ(x)dx para-

méterrel.

3.1. ábra. Homogén folyamat transzformációja

2. A második módszer csak említés szintjén: inhomogén folyamat el®állítására

a pontok közötti intervallumok egyenként való generálása. Adottak az X1 =

x1, X2 = x2, . . . , Xi = xi pontok és x1 < x2 < . . . < xi. Az Xi+1 − Xi

intervallumok függetlenek minden i-re és az eloszlásfüggvényük

F (x) = 1− e−[Λ(xi+x)−Λ(xi)].

33

Page 34: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

Intenzitás függvény becslése:

Tekintsük azt a példát, amikor a gyorsétteremben vásárlók érkezését �gyeljük

meg egy adott napon, ezt láthatjuk a 3.2 ábrán.

3.2. ábra. Fogyasztók érkezése egy nap

Vegyük egy vizsgált nap ekvidisztáns felosztását, ahol óránként meg�gyeljük a

folyamatunkat. A λ(t) intenzitás függvényt úgy becsüljük, hogy szakaszonként kons-

tans értéket vegyen föl. Ezzel a módszerrel a 3.3 ábrán látható becslését kapjuk a

λ(t)-nek.

3.3. ábra.

34

Page 35: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

A Λ(t) intenzitás függvény becslésére azt alkalmazzuk, hogy nem a meg�gyelések

szerepelnek az id®intervallumon, hanem maguk a bekövetkezések id®pontjai. Két

bekövetkezés id®pontja között az intenzitás függvényt egy szakaszonként változó

lineáris függvénnyel becsüljük.

Λ(t) =i · n

(n+ 1)+

[n(t− ti)

(n+ 1)(ti+1 − ti)

]ti < t ≤ ti+1 és i = 0, 1, . . . , n.

Minél közelebb van egymáshoz két bekövetkezés annál meredekebb lesz azon az

intervallumon a lineáris függvény.

3.4. ábra.

35

Page 36: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

3.2. Az összetett Poisson-folyamat

Az összetett Poisson-folyamatot például a kockázati folyamatok modellezése során

alkalmazzák, ezért most ezen keresztül vizsgáljuk. A már korábban tárgyalt összetett

Poisson-eloszlás példái között szerepelt az összetett kockázati modell, ahol az S-el

jelölt teljes kár eloszlása összetett Poisson-eloszlás volt. Az összkár értékét azonban

gyakran az id® függvényében vizsgálják, ekkor a kárszámot megadó N változó az

id® függvénye. Jelölje ezt N(t), t ≥ 0. Ezt hívják kárigény folyamatnak. Ekkor az

összkár is az id®t®l függ®

S(t) =

N(t)∑i=1

Zi.

A kár ki�zetéséhez szükséges tartalék leírásának másik két eleme a díjbevételt meg-

adó Pt folyamat a [0, t] intervallumban, valamint a kezdeti t®ke értéke u. Így kapjuk

a rizikófolyamatot

U(t) = u+ P (t)− S(t).

Klasszikus rizikófolyamatról beszélünk akkor, ha

P (t) = c · t, ahol c állandó

N(t), λ paraméter¶ Poisson-folyamat

Zi, i = 1, 2, . . . függetlenek és azonos eloszlásúak.

Ekkor az S(t) folyamat, amely tehát a független, azonos eloszlású Zj valószín¶ségi

változók Poisson-tagszámú összege úgynevezett összetett Poisson-folyamat.

3.4. De�níció. Egy folyamatot sztochasztikusan folytonosnak nevezünk, ha bármely

ε > 0 esetén P (|N(s)−N(t)| > ε)→ 0, ha s→ t, minden rögzített t ≥ 0 mellett.

3.5. Tétel. Ha az S(t), t ≥ 0 folyamat sztochasztikusan folytonos, független növek-

mény¶, az ugyanolyan növekmény¶ id®intervallumokhoz tartozó növekmények azo-

nos eloszlásúak, S(0) = 0, akkor a folyamat összetett Posson-folyamat.

A homogén Poisson-folyamattól abban tér el, hogy egyszerre több esemény is be-

következhet, azaz az ugrások száma nem feltétlenül 1. A növekmények eloszlása az

id®tartamtól függ.

36

Page 37: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

Az 1.14 tételt általánosabban, Poisson-folyamatokra is alkalmazhatjuk. Tekint-

sük az S(t) =∑N(t)

j=1 Zj, t ≥ 0összetett folyamatot. Tetsz®leges A ⊂ R esetén néz-

hetjük, hogy melyek azok a [0, t] id®intervallumon bekövetkezett káresemények, me-

lyekben a kár értéke az A halmazba esett. Azaz legyen

S(t)A =

N(t)∑k=1

Zkχ{Zk∈A}.

Ez az S(t) folyamat ritkítása, ami szintén összetett Poisson-folyamat. Diszjunkt

A halmazok esetén a kapott SA(t) folyamatok egymástól függetlenek. Tehát, ha

a kárigény nagysága szerint csoportosítjuk az összetett Poisson-folyamat ugrásait,

egymástól független összetett Poisson-folyamatokat kapunk.

37

Page 38: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

Összefoglalás

Láthattuk, hogy a Poisson-eloszlás széleskör¶en alkalmazható a mindennapokban is

és a hasznosságának csak egy kicsi hányadát olvashattuk. Az eloszlás bemutatott

változatai különböz® területen használatosak és adnak pontos értékeket.

A binomiális eloszlás közelítésére meglep®en jó becsléseket kaptunk. Ezeket cél-

szer¶ alkalmazni, hogy megkönnyítsük a számolásunkat, hiszen kevesebb paramétert

kell felhasználni és az eltérés nem jelent®s. A Poisson-eloszlást is szokták közelíteni,

mégpedig a normális eloszlással.

Az utolsó fejezetben vált érdekesebbé a Poisson-eloszlás alkalmazása, amikor a

folyamat során az id®t®l függ®vé tettük paraméterünket. Ez mondható a leghaszno-

sabb alkalmazásának, ugyanis, ha valamilyen mindennapos véletlenszer¶ eseménye-

ket szeretnénk meg�gyelni, arra modellt építeni, az id® haladásával a bekövetkezések

s¶r¶sége változik.

A szakdolgozatomban a balesetekr®l szóló adatok a www.ksh.hu, Siméon Denis

Poisson életrajzi érdekességei a www.hu.wikipedia.org oldalról származnak.

38

Page 39: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

Irodalomjegyzék

[1] Arató Miklós, Prokaj Vilmos, Zempléni András Bevezetés a valószín¶ségszámí-

tásba és alkalmazásaiba: Példákkal, szimulációkkal, 2013

[2] Csernyák László, Valószín¶ségszámítás, Nemzeti tankönyvkiadó, 2007

[3] D.J. Daley, D.Vere-Jones, An Introduction to the Theory of Point Proesses:

Volume I, Springer, 2003

[4] D.R. Cox, Valerie Isham, Point Processes, Chapmann & Hall/CRC, 2000

[5] Denkinger Géza, Valószín¶ségszámítási gyakorlatok, Nemzeti tankönyvkiadó,

1999

[6] James W. Daniel, Poisson Processes and mixture distibutions, 2008

[7] Larry Leemis, Estimating and Simulating Nonhomogeneous Poisson Processes,

2003

[8] Michaletzky György, Kockázati folyamatok jegyzet, 2001

[9] Móri Tamás, Generátorfüggvények jegyzet, 2007

[10] Móri Tamás, Poisson-approximáció párosítással jegyzet, 2007

[11] Obádovics J. Gyula, Valószín¶ségszámítás és matematikai statisztika, Scolar

Kiadó, 2001

[12] P.A.W. Lewis, G.S. Shedler, Simulation of Nonhomogeneous Poisson Processes

by thinning, 1978

[13] Sz¶cs Gábor, Kockázati folyamatok jegyzet, 2015

39

Page 40: Sulyán Tímea Poisson eloszlás és alkalmazásai · Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet®mnek, Csiszár Vill®nek a hasznos taná-csokat, észrevételeket,

[14] Walter Zucchini,Iain L. MacDonald, Hidden Markov Models for Time Series:

An Introduction Using R, CRC Press, 2009

[15] William Feller, Bevezetés a valószín¶ségszámításba és alkalmazásaiba, M¶szaki

könyvkiadó, 1978

40