seminarski empirijska raspodela adobe
DESCRIPTION
Seminarski Rad + Empirijska RaspodelaPredmet + Matematicka StatistikaTRANSCRIPT
-
VISOKA HEMIJSKO TEHNOLOKA KOLA KRUEVAC
Seminarski rad
EMPIRIJSKA RASPODELA
Student: Nikola Tomi 78 Profesor: Branko Grubi
Kruevac, 2014
-
2
SADRAJ
1.0 EMPIRIJSKA RASPODELA ........................................................................................................ 3
1.1 GRUPISANJE PODATAKA ....................................................................................................... 3
2.0 OBLIK EMPIRIJSKE RASPODELE ............................................................................................ 9
2.1 ASIMTERIAN OBLIK RASPODELE ..................................................................................... 10
3.0 DESKRIPTIVNE MERE EMPIRIJSKIH RASPODELA ........................................................... 12
3.1 MERE CENTRALNE TENDENCIJE ....................................................................................... 12
3.2 MERE VARIJABILITETA ......................................................................................................... 13
3.3 ODNOSI I PROPORCIJA ........................................................................................................ 13
PRIMER ............................................................................................................................................. 13
LITERATURA ................................................................................................................................... 17
-
3
1.0 EMPIRIJSKA RASPODELA
Empirisjka raspodela je raspodela uestalosti vrednosti obeleja posmatranja.
Nastaju grupisanjem (sreivanjem, razvrstavanjem, organizovanjem) i prebrojavanjem jedinica opservacije koje odgovaraju odreenoj vrednosti obeleja. Uestalost (frekvencija) je broj jedinica opservacije koje odgovaraju odreenoj vrednosti obeleja.
Prikazuju se tabelarno i grafiki.
1.1 GRUPISANJE PODATAKA
Grupisanje razvrstavanje jedinica posmatranja po gradacijama vrednosti posmatranog obeleja.
Za nominalne i ordinalne podatake grupisanje se obavlja po kategorijama modalitetima
Za numerike diskontinuirane podatke grupisanje se obavalja po grupama koje odgovaraju diskretnim vrednostima, a ako je raspon veliki onda po klasnim
intervalima
Za numeriko kontinuirano obeleje grupisanje se obavlja po klasnim intervalima
Uestalosti apsolutne i relativne, parcijalne i kumulativne
Apsolutne uestalosti nastaju prebrojavanjem.
Relativne uestalosti odnos apsolutnih uestalosti i ukupnog broja jedinica opservacija.
Parcijalne uestalosti uestalosti pojedinanih kategorija ili grupnih intervala.
Kumulativne uestalosti sukcesivni zbirovi uestalosti pojedinih kategorija ili grupnih intervala.
Nominalni podaci - tabelarni prikaz raspodele uestalosti
Apsolutne frekvencije Relativne frekvencije
Navika puenja n %
Puai 23 46
Nepuai 27 54
Ukupno 50 100
-
4
Nominalni podaci grafiki prikaz raspodele uestalosti krunim dijagramom i stubiastim dijagramom
27
23
Nepuai 54%
Puai 46%
21
22
23
24
25
26
27
28
Puai Nepuai
Ue
stal
ost
Stubiasti dijagram
-
5
Ordinalni podaci - tabelarni prikaz raspodele uestalosti
Parcijalne frekvencije Kumulativne frekvencije
Apsolutne
frekvecije
Relativne
frekvecije
Apsolutne
frekvecije
Relativne
frekvecije
Zadovoljstvo
zdr . zatitom n % n %
Vrlo
nezadovoljan
4 8 4 8
Nezadovoljan 6 12 10 20
Neutralan 20 40 30 60
Zadovoljan 16 32 46 92
Vrlo
zadovoljan
4 8 50 100
Ukupno 50 100
Ordinalni podaci grafiki prikaz raspodele uestalosti krunim dijagramom i stubiastim dijagramom
32%8%
12%
8%
40%
Zadovoljan
Vrlo zadovoljan
Nezadovoljan
Vrlo nezadovoljan
Neutralan
-
6
Numeriki diskontinuirani podaci tabelarni prikaz raspodele uestalosti
Parcijalne frekvencije Kumulativne frekvencije
Apsolutne
frekvecije
Relativne
frekvecije
Apsolutne
frekvecije
Relativne
frekvecije
Br. resp.
infekcija
N % N %
0 13 26 13 26
1 12 24 25 50
2 10 20 35 70
3 10 20 45 90
4 3 6 48 96
5 2 4 50 100
Ukupno 50 100
Zadovoljan Vrlo zadovoljan Nezadovoljan Vrlonezadovoljan
Neutralan
0
5
10
15
20
25
Ordinalni prikaz - Stubiasti dijagram
Ue
stal
ost
-
7
Numeriki diskontinuirani podaci prikaz raspodele uestalosti tapiastim dijagramom
Numeriki kontinuirani podaci tabelarni prikaz raspodele uestalosti
Parcijalne frekvencije Kumulativne frekvencije
Apsolutne
frekvecije
Relativne
frekvecije
Apsolutne
frekvecije
Relativne
frekvecije
Starost
(godine)
N % N %
15 - 19 2 4 2 4
20 - 24 6 12 8 16
25 - 29 7 14 15 30
30 - 34 16 32 31 62
35 - 39 5 10 36 72
40 - 44 5 10 41 82
45 - 49 5 10 46 92
50 - 54 4 8 50 100
Ukupno 50 100
0 1 2 3 4 5
0
2
4
6
8
10
12
14
Ue
stal
ost
Broj respiratornih infekcija
-
8
Numeriki kontinuirani podaci prikaz raspodele uestalosti histogramom i poligonom frekvencija
2
67
16
5 5 54
0
2
4
6
8
10
12
14
16
18
15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54
Histogram - prikaz uestalosti
Starost
15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54
0
2
4
6
8
10
12
14
16
18
Ue
stal
ost
Starost
-
9
2.0 OBLIK EMPIRIJSKE RASPODELE
Osnovne informacije o obliku empirijske raspodele se mogu dobiti iz grafikih prikaza (histogram, poligon frekvencija, tapiasti dijagrm, stubiasti dijagram)
Oblik se obino klasifikuje kao unimodalan, bimodalan ili multimodalan. Unimodalan oblik moe biti simetrian ili asimetrian (pozitivno ili desno iskoen, negativno ili levo iskoen).
1 3 4 5 6 9 11 12 16 18 17 14 11 8 5 4 3 2 2 1
0
2
4
6
8
10
12
14
16
18
20
Ue
stal
ost
Unimodalna raspodela
1 3 7 12 18 13 9 4 2 1 1 3 6 11 18 12 10 4 2 1
0
2
4
6
8
10
12
14
16
18
20
Ue
stal
ost
Bimodalna raspodela
-
10
2.1 ASIMTERIAN OBLIK RASPODELE
Vrednost skjunisa vea od 1 ukazuje na desnu iskoenost, a vrednost manja od - 1 na levu iskoenost
Desna iskoenost
Leva iskoenost
Zailjenost / zaravnjenost raspodele
Vrednosti kurtosisa vee od 1 ukazuju nailjatu raspodelu, a manje od - 1 ukazuju na zaravnjenu raspodelu
Mezokurtina
-
11
Leptokurtina Zailjena
Platikurtina Zaravnjena
Grafikon kutije (boxplot)
Prikazuje minimalnu i maksimalnu vrednost (produeci), kvartile (duina kutije) i medijanu (linija koja preseca kutiju).
-
12
Produeci pokazuju minimalnu i maksimalnu vrednost ako su one unutar 1.5 duine kutije od same kutije (interkvartilni opseg). Vrednosti koje su udaljene od kutije 1.5 do 3 njene duine oznavaavaju se kao neobine vrednosti (outlier), a vrednosti koje su udaljene vie od 3 duine kutije nazivaju ekstremnim vrednostima.
Neobine i ekstremne vrednosti zahtevaju proveru i eventualnu korekciju ako je u pitanju pogrean podatak.
3.0 DESKRIPTIVNE MERE EMPIRIJSKIH RASPODELA
3.1 MERE CENTRALNE TENDENCIJE
Aritmetika sredina
=
Aritmetiku sredinu koristiti kada postoji priblino simetrina raspodela. Ne koristiti je kod asimetrine raspodele, raspodele sa ekstremnim vrednostima i bimodalne raspodele.
Medijana
Centralna vrednost, srednja poziciona vrednost. Centralna vrednost u nizu podataka poreanih po veliini. Deli distribuciju na dva jednaka dela. 50% vrednosti se nalazi ispod medijane, a 50% vrednosti iznad medijane. Medijana je bolja mera centralne tendencije od aritmetike sredine kada je raspodela iskoena ili sadri ekstremne vrednosti.
Mod
Tipina vrednost. Vrednost sa najveom frekvencijom. Pogodan za primenu kod nominalnih i ordinalnih podataka.
Kvantili
Dele raspodelu uestalosti na n jednakih delova.
Frakcija Naziv
Medijana
1/3 Tercil
Kvartil
1/5 Kvintil
1/10 Decil
1/100 Percentil
-
13
3.2 MERE VARIJABILITETA
Apsolutne
mere
varijabiliteta
Interval varijacije
Varijansa 2 =( )
2
1
Standardna devijacija = ( )2
1
Interkvartilni opseg 1 3
Relativne
mere
varijabiliteta
Koeficijent varijacije =
100
Standardizovana vrednost =
3.3 ODNOSI I PROPORCIJA
Odnos pokazuje relativan odnos dva kvanatiteta a/b. Odnos je bez dimenzija ako su oba kvantiteta
iskazana istim jedinicima. Primer odnosa ukljuuje odnos ansi i odnos rizika.
Proporcija je specifian tip odnosa gde je brojilac deo imenioca - odnos apsolutne frekvencije (x) jedinica opservacije sa datom karakteristikom i totalnog broja (n) jedinica opservacije: p=x/n.
Vrednosti proporcije su ograniene na interval od 0.0 do 1.0. Ova relativna frekvencija moe biti interpretirana ekvivalentno veroavtnoi. Proporcija se moe iskazati u procentima p(%)=100*x/n.
Stopa
Stopa je broj (frekvencija) dogaaja, kao to su roenje, bolest ili smrt, koji se mogu pojaviti u odreenom periodu, podeljeno prosenom populacijom tokom tog perioda. Stopa je proprocija ako je brojilac deo imenioca. Ova vrednost je najee pomnoena konstantom da bi se izbegle decimale:
=
PRIMER U grupi od 25 studenata II godine studija su anketiranjem dobijeni podaci o starosti u godinama: 22, 21, 20, 23, 22, 24, 25, 21, 22, 23, 21, 22, 21, 23, 22, 22, 21, 25, 21, 26, 23, 21, 22, 21, 21
Treba formirati empirijsku raspodelu starosti studenata u apsolutnim i relativnim iznosima.
-
14
Reenje:
Prvo treba formirati varijacioni niz na sledei nain: U kolonu C se upisuju se podaci o starosti u godinama, oni se mogu prepisati redom iz zadataka, nakon toga sortirati. Sortiranje podatak u tabeli se vri tako to se obelee podaci i klikne na ikonicu
Sort Ascending
i kao rezultat dobija se kolona C koja izgleda kao na slici (desno). Nakon toga korienjem funkcije COUNT prebrojavaju se podaci. Funkcija se dobija iz padajueg menija Insert, opcije Function, i iz
statistikih funkcija odabere COUNT.
Argumente funkcije predstavljaju lanovi varijacionog niza. U
sledeem koraku formira se nova tabela, ona sadri grupisane
podatke o broju godina.
Vrednosti za m se dobijaju opet korienjem funkcije COUNT, i to
prebrojavanjem podataka za odreenu vrednost x*, na primer :
I na kraju se izraunavaju vrednosti , i to kao odnos m i n, za odgovarajuu grupu podataka. Ovde
se pri kopiranju formula na ostatak reda mora voditi rauna o tome da je n konstanta, i da njen
poloaj mora biti fiksiran, tj. da se ispred oznake reda i kolone mora staviti znak $.
-
15
Poto je tabela konano formirana crta se grafik. Iako je crtanje grafika ve prethodno objanjeno,
ovde e jo jednom biti prikazano na konkretnom primeru. Crtanje se zapoinje ili odabirom Chart iz padajueg menija Insert, ili klikom na ikonicu Chart Wizard. Tada se otvara novi prozor, u kome se bira tip grafika (Chart type), i odabere se XY (Scatter).
Klikne se na Next, i u sledeem prozoru odabere kartica Series, gde e se obeleiti podaci na osnovu kojih se crta grafik. Na x osi treba da budu vrednosti za x*, a na y osi za m i . Serije podataka se dodaju klikom na dugme Add, a zatim se u poljima X values i Y values upisuju odgovarajue
vrednosti.
Klikne se na Next, i u sledeem prozoru urade ostala podeavanja grafika, kao to su oznake za x i y osu, naziv grafika i slino. Nakon toga se ponovo klikne na Next i u sledeem prozoru na Finish,
ime se crtanje grafika zavrava, a dodatna podeavanja se rade na grafiku, kada se desnim tasterom
mia klikne na grafik i odabere opcija format.
-
16
Poto bi ovde trebalo prikazati zavisnost od x* na sekundarnoj osi, desnim tasterom se klikne na seriju , Format Data Series, kada se otvori novi prozor klikne se na karticu Axis i odabere opcija Plot Series on Secondary axis, potvruje se sa OK.
Kao rezultat dobija se grafik sa primarnom i sekundarnom osom, tj. poligon raspodele starosti studenata u apsolutnim i relativnim i znosima.
-
17
LITERATURA [1] Matematika i statistika http://en.wikipedia.org/wiki/Mathematical_statistics [2] Empirijska raspodela Tehnoloki fakultet Novi Sad
http://www.tf.uns.ac.rs/~omorr/radovan_omorjan_003_is/Mcad/Empirijska%20raspodela-2001.htm
[3] Statistika Elektronski fakultet Ni
http://www.tf.uns.ac.rs/~omorr/radovan_omorjan_003_is/Mcad/Empir-ijska%20raspodela-2001.htm
[4] Praktikum Excel slideshare.net http://www.slideshare.net/gaja972/praktikum-excel