dopasowanie rozkładów
DESCRIPTION
Dopasowanie rozkładów. Dopasowanie rozkładów- ogólny cel. Porównanie średnich dwóch zmiennych 2 zmienne posiadają rozkład normalny -> test parametryczny (t- studenta ) 2 zmienne nie spełniają rozkładu normalnego -> testy nieparametryczne. Dopasowanie rozkładów- ogólny cel. - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: Dopasowanie rozkładów](https://reader036.vdocuments.mx/reader036/viewer/2022070405/56813e7a550346895da8a221/html5/thumbnails/1.jpg)
Dopasowanie rozkładów
![Page 2: Dopasowanie rozkładów](https://reader036.vdocuments.mx/reader036/viewer/2022070405/56813e7a550346895da8a221/html5/thumbnails/2.jpg)
Dopasowanie rozkładów- ogólny cel
Porównanie średnich dwóch zmiennych
2 zmienne posiadają rozkład normalny -> test parametryczny (t- studenta)
2 zmienne nie spełniają rozkładu normalnego -> testy nieparametryczne
![Page 3: Dopasowanie rozkładów](https://reader036.vdocuments.mx/reader036/viewer/2022070405/56813e7a550346895da8a221/html5/thumbnails/3.jpg)
Dopasowanie rozkładów- ogólny cel
Cele prognostyczne
Często dla celów prognostycznych jest wskazane zrozumienie kształtu rozważanego rozkładu populacji.
![Page 4: Dopasowanie rozkładów](https://reader036.vdocuments.mx/reader036/viewer/2022070405/56813e7a550346895da8a221/html5/thumbnails/4.jpg)
Najczęściej używane rozkłady
-Bernoulliego
- Beta
- Dwumianowy
- Chi-kwadrat
- Wykładniczy
- F (Snedeckora)
- Gamma
- Geometryczny
- Gompertza
- Logistyczny
- Logarytmiczno- normalny
- Pareto
- Poissona
- Prostokątny
- Rayleigha
- t-studenta
- Weibulla
- NORMALNY
![Page 5: Dopasowanie rozkładów](https://reader036.vdocuments.mx/reader036/viewer/2022070405/56813e7a550346895da8a221/html5/thumbnails/5.jpg)
ROZKŁAD NORMALNY
Rozkład o charakterystycznym kształcie "krzywej dzwonowej", symetrycznej w stosunku do średniej.
![Page 6: Dopasowanie rozkładów](https://reader036.vdocuments.mx/reader036/viewer/2022070405/56813e7a550346895da8a221/html5/thumbnails/6.jpg)
ROZKŁAD NORMALNY
Ogólnie jest dobrym modelem dla rozkładu zmiennej losowej, w sytuacji gdy:
-Występuje silna tendencja do przyjmowania wartości położonych blisko środka rozkładu;
![Page 7: Dopasowanie rozkładów](https://reader036.vdocuments.mx/reader036/viewer/2022070405/56813e7a550346895da8a221/html5/thumbnails/7.jpg)
ROZKŁAD NORMALNY
Ogólnie jest dobrym modelem dla rozkładu zmiennej losowej, w sytuacji gdy:
- Dodatnie i ujemne odchylenia od środka rozkładu są jednakowo prawdopodobne;
![Page 8: Dopasowanie rozkładów](https://reader036.vdocuments.mx/reader036/viewer/2022070405/56813e7a550346895da8a221/html5/thumbnails/8.jpg)
ROZKŁAD NORMALNY
Ogólnie jest dobrym modelem dla rozkładu zmiennej losowej, w sytuacji gdy:
- Liczność odchyleń gwałtownie spada wraz ze wzrostem ich wielkości.
![Page 9: Dopasowanie rozkładów](https://reader036.vdocuments.mx/reader036/viewer/2022070405/56813e7a550346895da8a221/html5/thumbnails/9.jpg)
ROZKŁAD NORMALNY
Podstawowy mechanizm tworzący rozkład normalny: nieskończoną liczbę niezależnych zdarzeń losowych które generują wartości danej zmiennej.
Przykład: istnieje prawdopodobnie prawie nieograniczona liczba czynników determinujących wzrost człowieka (olbrzymia liczba genów, sposób odżywiania, przebyte choroby itd.). Tak więc należy spodziewać się, że w populacji wzrost podlega rozkładowi normalnemu.
![Page 10: Dopasowanie rozkładów](https://reader036.vdocuments.mx/reader036/viewer/2022070405/56813e7a550346895da8a221/html5/thumbnails/10.jpg)
JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?
1. obliczenie skośności i kurtozy
2. analiza histogramu
3. analiza wykresów P-P
4. testy normalności
![Page 11: Dopasowanie rozkładów](https://reader036.vdocuments.mx/reader036/viewer/2022070405/56813e7a550346895da8a221/html5/thumbnails/11.jpg)
JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?
1. obliczenie skośności i kurtozy
Skośność mierzy odchylenie rozkładu od symetrii.
Jeśli wartość skośności jest wyraźnie różna od zera, wówczas dany rozkład jest asymetryczny.
Rozkład normalny jest symetryczny (skośność jest bliska 0)
![Page 12: Dopasowanie rozkładów](https://reader036.vdocuments.mx/reader036/viewer/2022070405/56813e7a550346895da8a221/html5/thumbnails/12.jpg)
JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?
1. obliczenie skośności i kurtozy
Kurtoza mierzy "spiczastość" rozkładu.
Jeśli wartość kurtozy jest wyraźnie <0, wówczas rozkład jest bardziej płaski, a jeśli jest wyraźnie >0 to rozkład jest bardziej spiczasty niż rozkład normalny.
Wartość kurtozy dla rozkładu normalnego wynosi 0!
![Page 13: Dopasowanie rozkładów](https://reader036.vdocuments.mx/reader036/viewer/2022070405/56813e7a550346895da8a221/html5/thumbnails/13.jpg)
JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?
2. Analiza histogramu
![Page 14: Dopasowanie rozkładów](https://reader036.vdocuments.mx/reader036/viewer/2022070405/56813e7a550346895da8a221/html5/thumbnails/14.jpg)
JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?
3. Analiza wykresów P-P
Wykres prawdopodobieństwo-prawdopodobieństwo
Dystrybuanta empiryczna kreślona jest względem dystrybuanty teoretycznej.
Jeśli teoretyczny rozkład dobrze przybliża rozkład obserwowany, wówczas punkty na wykresie powinny leżeć blisko przekątnej.
![Page 15: Dopasowanie rozkładów](https://reader036.vdocuments.mx/reader036/viewer/2022070405/56813e7a550346895da8a221/html5/thumbnails/15.jpg)
JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?
3. Analiza wykresów P-P
![Page 16: Dopasowanie rozkładów](https://reader036.vdocuments.mx/reader036/viewer/2022070405/56813e7a550346895da8a221/html5/thumbnails/16.jpg)
JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?
4. Testy normalności
W celu zidentyfikowania rozkładu zazwyczaj dopasowuje się rozkład empiryczny do rozkładu teoretycznego poprzez:
porównanie częstości zaobserwowanych w danych rzeczywistych do częstości oczekiwanych rozkładu teoretycznego
![Page 17: Dopasowanie rozkładów](https://reader036.vdocuments.mx/reader036/viewer/2022070405/56813e7a550346895da8a221/html5/thumbnails/17.jpg)
JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?
częstości zaobserwowane w danych rzeczywistych
częstości oczekiwane rozkładu teoretycznego
![Page 18: Dopasowanie rozkładów](https://reader036.vdocuments.mx/reader036/viewer/2022070405/56813e7a550346895da8a221/html5/thumbnails/18.jpg)
JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?
4. Testy normalności
Porównania częstości zaobserwowanych w danych rzeczywistych do częstości oczekiwanych rozkładu teoretycznego dokonuje się za pomocą testów statystycznych:
- chi kwadrat- Kołmogorowa-Smirnowa- Lillieforsa- Shapiro-Wilka
![Page 19: Dopasowanie rozkładów](https://reader036.vdocuments.mx/reader036/viewer/2022070405/56813e7a550346895da8a221/html5/thumbnails/19.jpg)
JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?
4. Testy normalności
Test Kołmogorowa-Smirnowa: Wykorzystuje maksymalną wartość różnicy między dystrybuantą z próby, a założoną dystrybuantą teoretyczną.
p< 0.05 -> rozkład różni się istotnie od normalnego
p> 0.05 -> rozkład jest normalny
![Page 20: Dopasowanie rozkładów](https://reader036.vdocuments.mx/reader036/viewer/2022070405/56813e7a550346895da8a221/html5/thumbnails/20.jpg)
JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?
4. Testy normalności
Test chi-kwadrat:Stopnie swobody: df = liczba kategorii - liczba
parametrów - 1liczba kategorii - liczba klas w tablicy liczności, w
której liczności oczekiwane są wyższe niż 5,liczba parametrów- liczba parametrów
odpowiedniego rozkładu teoretycznego.
p< 0.05 -> rozkład różni się istotnie od normalnegop> 0.05 -> rozkład jest normalny
![Page 21: Dopasowanie rozkładów](https://reader036.vdocuments.mx/reader036/viewer/2022070405/56813e7a550346895da8a221/html5/thumbnails/21.jpg)
JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?
4. Testy normalności
Test W Shapiro-Wilka: preferowany test normalności ze względu na jego dużą moc w porównaniu z innymi testami.
p< 0.05 -> rozkład różni się istotnie od normalnegop> 0.05 -> rozkład jest normalny
![Page 22: Dopasowanie rozkładów](https://reader036.vdocuments.mx/reader036/viewer/2022070405/56813e7a550346895da8a221/html5/thumbnails/22.jpg)
JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY?
4. Testy normalności
Test Lillieforsa: test oparty na badaniu maksymalnej różnicy pomiędzy dystrybuantą empiryczną (z próby) a dystrybuantą rozkładu normalnego o takiej samej średniej i wariancji jak oszacowana z próby
p< 0.05 -> rozkład różni się istotnie od normalnegop> 0.05 -> rozkład jest normalny