weryfikacja hipotez statystycznych, parametryczne testy...

Weryfikacja hipotez

statystycznych, parametryczne

testy istotności w populacji

Dr Joanna Banaś

Zakład Badań Systemowych

Instytut Sztucznej Inteligencji i Metod Matematycznych

Wykład 9

Wydział Informatyki Politechniki Szczecińskiej

Metody probabilistyczne i statystyka

23. Weryfikacja hipotez statystycznych

� Cel weryfikacji hipotez statystycznych – ustalenie, czy estymacja parametrów populacji (lub jej rozkładu) uzyskana na podstawie próbki jest do przyjęcia

� Działanie

� porównanie wyników otrzymanych z próbki z założeniami teoretycznymi

� porównanie wyników otrzymanych z dwóch próbek

Określamy przy tym, czy porównywane wyniki różnią sięw sposób istotny, czy przypadkowy

� Podstawowe pojęcia

� hipoteza statystyczna

� test statystyczny

Wykład 9

Opracowała Joanna Banaś


Podstawowe pojęcia� Hipoteza statystyczna – dowolne przypuszczenie o nieznanym rozkładzie

badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się w oparciu o pobraną próbkę

� Hipoteza nieparametryczna – przypuszczenie dotyczy postaci rozkładu cechy populacji

� Hipoteza parametryczna – przypuszczenie dotyczy wartości parametrów rozkładu cechy populacji

� Test statystyczny – reguła postępowania, która każdej możliwej realizacji próby (x1,…, xn) przyporządkowuje (z ustalonym prawdopodobieństwem) decyzję przyjęcia albo odrzucenia sprawdzanej hipotezy

� Test parametryczny – dotyczy hipotezy parametrycznej

� Test nieparametryczny (test zgodności) – dotyczy hipotezy nieparametrycznej

Wykład 9



Elementy testu statystycznego

� X – badana cecha populacji

� H0 – pewna hipoteza statystyczna, dotycząca rozkładu cechy X, zwana hipotezą zerową

� H1 – hipoteza alternatywna, którą będziemy skłonni przyjąć, gdyby H0 okazała się fałszywa

� Statystyka testowa albo sprawdzian – statystyka Un = Un

(X1,…, Xn), dobrana jako miernik rozbieżności między wynikami próby a postacią hipotetyczną

� Obszar krytyczny – przedział liczbowy K, do którego prawie na pewno nie powinna należeć żadna realizacja statystyki Un, jeśli H0 jest prawdziwa

Wykład 9



Błędy przy podejmowaniu decyzji� Dla próbki (x1,…, xn) wartości cechy X obliczamy un = Un (X1,…, Xn)

i podejmujemy jedną z decyzji:

� odrzucamy H0 i przyjmujemy H1, jeśli un∈ K

� przyjmujemy H0 i odrzucamy H1, jeśli un∉ K

� Przy weryfikacji hipotezy w oparciu o wyniki próbki można popełnić dwa rodzaje błędów:

� błąd pierwszego rodzaju – odrzucenie hipotezy H0, gdy jest ona prawdziwa (prawdopodobieństwo popełnienia tego błędu nazywamy poziomem istotnościi oznaczamy przez α)

(23.1) α = P (Un∈ K / H0)

� błąd drugiego rodzaju – przyjęcie hipotezy H0, gdy jest ona fałszywa (prawdopodobieństwo popełnienia oznaczamy przez β)

(23.2) β = P (Un ∉ K / H1) = 1− P (Un ∈ K / H1)

Wykład 9



Błędy przy podejmowaniu decyzji� Tablica 23.1. Decyzje słuszne i błędy przy podejmowaniu decyzji

� Dla ustalonego α∈(0,1) bliskiego zera, obszar krytyczny K dobiera się tak, aby βbyło możliwie najmniejsze (wówczas test jest najmocniejszy)

� Ponieważ najczęściej β jest dość duże, albo nie jest znane, zamiast wysoce ryzykownej decyzji „przyjmujemy H0„ podejmujemy ostrożniejszą:

„nie ma podstaw do odrzucenia H0„

� Testy istotności – testy, w których nie uwzględnia się błędu 2-go rodzaju

Wykład 9



decyzja słuszna

1 – β

błąd 1-go rodzaju

αOdrzucenie H0

błąd 2-go rodzaju

β

decyzja słuszna

1 – αPrzyjęcie H0

H0 – fałszywaH0 – prawdziwaSytuacja

Decyzja

24. Parametryczne testy istotności

w populacji

� (24.1) Wartość oczekiwana (średnia)

� Model 1 (rozkład normalny, znana wariancja)

X – zmienna losowa o rozkładzie normalnym N(m,σ), wartość oczekiwana m = EX nie jest znana, wariancja σ2 = D2X jest znana

Statystyka

ma rozkład N(0,1) przy założeniu prawdziwości hipotezy zerowej H0: m = m0

Dla przykładu pokażemy konstrukcję obszaru krytycznego dla hipotezy alternatywnej H1: m > m0

Wykład 9



0X mU n

−=

σ

Weryfikacja hipotezy dotyczącej

wartości średniej – model 1

Dla ustalonego α∈(0,1) mamy

α = P (U∈ K / m = m0)

Obszar krytyczny K dobiera się tak, aby β było możliwie najmniejsze, tzn. P (U ∈ K / H1) było największe

Ponieważ H1: m > m0, więc

α = P (U ≥ k) = 1 − P (U < k) = 1 − Φ(k) dla pewnego k

Stąd Φ(k) = 1−α

Oznacza to, że k jest kwantylem rzędu 1−αi będziemy go oznaczać przez u(1−α)

W rezultacie

K = ⟨u(1−α); ∞)

Dla pozostałych hipotez obszary krytyczne buduje się analogicznie

Wykład 9



( )f x

0

0.1

(0,1)N

k

1− αα

Rys.24.1. Gęstość rozkładu N(0,1)



Tablica 24.1. Tablica testu dla średniej – model 1

Wykład 9



H1: m < m0

H1: m > m0

H1: m ≠ m0

H0: m = m0

alternatywnazerowaUwagi

Obszar

krytyczny K

Statystyka

testowa U

Hipoteza

0X mn

−

σ

2

2

( ; (1 )

(1 ); )

u

u

α

α

−∞ − − ⟩

∪⟨ − ∞0

0.1

(0,1)N

2(1 )u α−

1− α2α

2(1 )u α− −

2α

0

0.1

(0,1)N

(1 )u − α

1− αα

0

0.1

(0,1)N

(1 ) ( )u u− − α = α

1− αα( ; (1 )u−∞ − − α ⟩

(1 ); )u⟨ − α ∞



� Przykład (do modelu 1)

� Norma przewiduje, że waga produkowanego wyrobu powinna wynosić 50 dag

� Wysunięto przypuszczenie, że producent zawyża wagę wyrobów

� Aby potwierdzić przypuszczenie wylosowano 16 wyrobów, dla których średnia waga wynosiła 51 dag

� Wiadomo, że odchylenie standardowe wynosi 1.1 dag

� Waga wyrobów ma rozkład normalny

Na poziomie istotności 0.05 zweryfikować hipotezę, że waga wyrobów według normy i waga rzeczywista sąrówne wobec hipotezy alternatywnej, że są różne

Wykład 9





� Model 2 (rozkład normalny, parametry nieznane)

X – zmienna losowa o rozkładzie normalnym N(m,σ), parametry m i σ nie są znane

Statystyka

ma rozkład Studenta z n−1 stopniami swobody przy założeniu, że prawdziwa jest hipoteza zerowa H0: m = m0

Ponieważ funkcja gęstości rozkładu Studenta ma podobne własności jak krzywa Gaussa, obszary krytyczne dla hipotez alternatywnych H1: m ≠ m0 , H1: m < m0 oraz H1: m > m0 buduje się podobnie jak w modelu 1

Wykład 9



0 1X m

t nS

−= −



Tablica 24.2. Tablica testu dla średniej – model 2

Wykład 9



H1: m < m0

H1: m > m0

H1: m ≠ m0

H0: m = m0

alternatywnazerowaUwagi

Obszar krytyczny

K

Statystyka

testowa t

Hipoteza

0 1X m

nS

−−

2

2

( ; (1 , 1)

(1 , 1); )

t n

t n

α

α

−∞ − − − ⟩

∪⟨ − − ∞0

0.1

t

2(1 , 1)t nα− −

1− α2α

2(1 , 1)t nα− − −

2α

0

0.1

t

(1 , 1)t n− α −

1− αα

0

0.1

t

(1 , 1)t n− − α −

1− αα( ; (1 , 1)t n−∞ − − α − ⟩

(1 , 1); )t n⟨ − α − ∞




� Norma przewiduje, że średni czas potrzebny na wykonanie pewnego detalu wynosi 1.5 h

� Robotnicy skarżą się, że czas ten jest zbyt krótki

� Aby sprawdzić zasadność skargi, zmierzono faktyczny czas produkcji 17 losowo wybranych detali i otrzymano wartośćśredniej z próbki 1.6 h, a odchylenia standardowego 0.2 h

� Zakładamy, że czas potrzebny do wykonania detalu jest zmiennąlosową o rozkładzie normalnym

Na poziomie istotności 0.05 stwierdzić, czy uzyskane wyniki stanowią podstawę do zwiększenia normy

Wykład 9




wartości średniej – model 3� Model 3 (rozkład nieznany, duża próba n ≥ 100 )

X – zmienna losowa o nieznanym rozkładzie, istnieją wartość oczekiwana EX = m i wariancja σ2 = D2X > 0

Jeśli próba jest duża ( n ≥ 100 ), to statystyka

ma w przybliżeniu rozkład normalny N(0,1), a nieznaną wartość parametru σmożemy oszacować za pomocą estymatora S, gdzie

W rezultacie do weryfikacji hipotez stosujemy statystykę

przy założeniu, że prawdziwa jest hipoteza zerowa H0: m = m0

Obszary krytyczne dla hipotez alternatywnych H1: m ≠ m0 , H1: m < m0 oraz H1: m > m0 wyznaczamy tak samo jak w modelu 1

Wykład 9



X mU n

−=

σ

( )22 1

1

n

in iS X X

== −∑

0X mU n

S

−=


wariancji – model 1

� (24.2) Wariancja (lub odchylenie standardowe)

� Model 1 (rozkład normalny, parametry nieznane)


Statystyka

ma rozkład χ2 z n−1 stopniami swobody przy założeniu, że prawdziwa jest hipoteza zerowa H0: σ

2 = σ02 ( lub H0: σ = σ0 )

Wykład 9



22

20

nSχ =

σ



Tablica 24.3. Tablica testu dla wariancji – model 1

Wykład 9



H1: σ2 < σ0

2

H1: σ2 > σ0

2

H1: σ2 ≠ σ0

2

H0: σ2 = σ0

2

alternatywnazerowaUwagiObszar krytyczny K

Statystyka

testowa χ2

Hipoteza

2

20

nS

σ

2

2

2

2

0; ( , 1)

(1 , 1); )

n

n

α

α

⟨ χ − ⟩∪

⟨χ − − ∞2α1− α

2

2( , 1)nαχ −

2α

( )f x

0 x

2χ

2

2(1 , 1)nαχ − −

1− α

2 ( , 1)nχ α −

α

( )f x

0 x

2χ

α1− α

( )f x

0 x

2χ

2(1 , 1)nχ − α −

20; ( , 1)n⟨ χ α − ⟩

2 (1 , 1); )n⟨χ − α − ∞




� Dokonano 10 pomiarów pewnej wielkości

� Otrzymano odchylenie standardowe z próbki 1.5

� W teorii pomiarów zakładamy, że wynik pomiaru jest zmienną losową o rozkładzie normalnym N(m,σ), zaśodchylenie standardowe jest miarą dokładności pomiarów

Zweryfikować hipotezę H0: σ = 1.0 wobec hipotezy alternatywnej H1: σ > 1.0 na poziomie istotności 0.05

Wykład 9





� Model 2 (rozkład normalny, duża próba n ≥ 50 )



ma w przybliżeniu rozkład normalny N(0,1), przy założeniu, że prawdziwa jest hipoteza zerowa H0: σ

2 = σ02 ( lub H0: σ = σ0 )

Obszary krytyczne dla hipotez alternatywnych

H1: σ2 ≠ σ0

2, H1: σ2 < σ0

2 oraz H1: σ2 > σ0

2

wyznaczamy tak samo jak w modelu 1 dla średniej

Wykład 9



22 2 3U n= χ − −



� Model 3 (rozkład nieznany, duża próba n ≥ 100 )



ma w przybliżeniu rozkład normalny N(0,1), przy założeniu, że prawdziwa jest hipoteza zerowa H0: σ

2 = σ02 ( lub H0: σ = σ0 )


H1: σ2 ≠ σ0

2, H1: σ2 < σ0

2 oraz H1: σ2 > σ0

2


Wykład 9



2 20

20

ˆ

2

S nU

− σ=

σ


wariancji

� Przykład

� Wylosowano 200 robotników pewnego zakładu

� Zbadano stopień wykonania normy [%]

� Wyniki przedstawiono w szeregu rozdzielczym

Na poziomie istotności 0.05 zweryfikować hipotezę, że odchylenie standardowe stopnia wykonania normy jest równe 10 % wobec hipotezy alternatywnej, że jest mniejsze od 10 %

Wykład 9



131217507029153Liczba pracowników

150140130120110100908070Stopień wykonania

normy [%]

Weryfikacja hipotezy o wskaźniku

struktury� (24.3) Wskaźnik struktury

� Model (rozkład 0-1, parametr p nieznany, duża próba n ≥ 100 )

X – zmienna losowa o rozkładzie 0-1, parametr p nie jest znany


gdzie M jest zmienną losową, której wartości są liczbami wyróżnionych elementów w n-elementowej próbce, ma rozkład w przybliżeniu normalny N(0,1), przy założeniu, że prawdziwa jest hipoteza zerowa H0: p = p0


H1: p ≠ p0, H1: p < p0 oraz H1: p > p0


Wykład 9



0

0 0(1 )

Mn

pU

p p

n

−=

−

Weryfikacja hipotezy o wskaźniku

struktury

� Przykład

� Zbadano 2000 pacjentów pewnego szpitala

� 8 % miało grupę krwi AB

� 25 % pacjentów z grupą krwi AB miało czynnik RH–

Na poziomie istotności 0.01 zweryfikowaćhipotezę, ze odsetek osób o grupie krwi AB RH–wynosi 3 % wobec alternatywnej, że jest mniejszy niż 3 %

Wykład 9



Wykład 9Metody probabilistyczne i statystyka

Dziękuję za uwagę


weryfikacja hipotez statystycznych, parametryczne testy...

Documents