weryfikacja hipotez statystycznych, parametryczne testy...
TRANSCRIPT
Weryfikacja hipotez
statystycznych, parametryczne
testy istotności w populacji
Dr Joanna Banaś
Zakład Badań Systemowych
Instytut Sztucznej Inteligencji i Metod Matematycznych
Wykład 9
Wydział Informatyki Politechniki Szczecińskiej
Metody probabilistyczne i statystyka
23. Weryfikacja hipotez statystycznych
� Cel weryfikacji hipotez statystycznych – ustalenie, czy estymacja parametrów populacji (lub jej rozkładu) uzyskana na podstawie próbki jest do przyjęcia
� Działanie
� porównanie wyników otrzymanych z próbki z założeniami teoretycznymi
� porównanie wyników otrzymanych z dwóch próbek
Określamy przy tym, czy porównywane wyniki różnią sięw sposób istotny, czy przypadkowy
� Podstawowe pojęcia
� hipoteza statystyczna
� test statystyczny
Wykład 9
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Podstawowe pojęcia� Hipoteza statystyczna – dowolne przypuszczenie o nieznanym rozkładzie
badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się w oparciu o pobraną próbkę
� Hipoteza nieparametryczna – przypuszczenie dotyczy postaci rozkładu cechy populacji
� Hipoteza parametryczna – przypuszczenie dotyczy wartości parametrów rozkładu cechy populacji
� Test statystyczny – reguła postępowania, która każdej możliwej realizacji próby (x1,…, xn) przyporządkowuje (z ustalonym prawdopodobieństwem) decyzję przyjęcia albo odrzucenia sprawdzanej hipotezy
� Test parametryczny – dotyczy hipotezy parametrycznej
� Test nieparametryczny (test zgodności) – dotyczy hipotezy nieparametrycznej
Wykład 9
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Elementy testu statystycznego
� X – badana cecha populacji
� H0 – pewna hipoteza statystyczna, dotycząca rozkładu cechy X, zwana hipotezą zerową
� H1 – hipoteza alternatywna, którą będziemy skłonni przyjąć, gdyby H0 okazała się fałszywa
� Statystyka testowa albo sprawdzian – statystyka Un = Un
(X1,…, Xn), dobrana jako miernik rozbieżności między wynikami próby a postacią hipotetyczną
� Obszar krytyczny – przedział liczbowy K, do którego prawie na pewno nie powinna należeć żadna realizacja statystyki Un, jeśli H0 jest prawdziwa
Wykład 9
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Błędy przy podejmowaniu decyzji� Dla próbki (x1,…, xn) wartości cechy X obliczamy un = Un (X1,…, Xn)
i podejmujemy jedną z decyzji:
� odrzucamy H0 i przyjmujemy H1, jeśli un∈ K
� przyjmujemy H0 i odrzucamy H1, jeśli un∉ K
� Przy weryfikacji hipotezy w oparciu o wyniki próbki można popełnić dwa rodzaje błędów:
� błąd pierwszego rodzaju – odrzucenie hipotezy H0, gdy jest ona prawdziwa (prawdopodobieństwo popełnienia tego błędu nazywamy poziomem istotnościi oznaczamy przez α)
(23.1) α = P (Un∈ K / H0)
� błąd drugiego rodzaju – przyjęcie hipotezy H0, gdy jest ona fałszywa (prawdopodobieństwo popełnienia oznaczamy przez β)
(23.2) β = P (Un ∉ K / H1) = 1− P (Un ∈ K / H1)
Wykład 9
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Błędy przy podejmowaniu decyzji� Tablica 23.1. Decyzje słuszne i błędy przy podejmowaniu decyzji
� Dla ustalonego α∈(0,1) bliskiego zera, obszar krytyczny K dobiera się tak, aby βbyło możliwie najmniejsze (wówczas test jest najmocniejszy)
� Ponieważ najczęściej β jest dość duże, albo nie jest znane, zamiast wysoce ryzykownej decyzji „przyjmujemy H0„ podejmujemy ostrożniejszą:
„nie ma podstaw do odrzucenia H0„
� Testy istotności – testy, w których nie uwzględnia się błędu 2-go rodzaju
Wykład 9
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
decyzja słuszna
1 – β
błąd 1-go rodzaju
αOdrzucenie H0
błąd 2-go rodzaju
β
decyzja słuszna
1 – αPrzyjęcie H0
H0 – fałszywaH0 – prawdziwaSytuacja
Decyzja
24. Parametryczne testy istotności
w populacji
� (24.1) Wartość oczekiwana (średnia)
� Model 1 (rozkład normalny, znana wariancja)
X – zmienna losowa o rozkładzie normalnym N(m,σ), wartość oczekiwana m = EX nie jest znana, wariancja σ2 = D2X jest znana
Statystyka
ma rozkład N(0,1) przy założeniu prawdziwości hipotezy zerowej H0: m = m0
Dla przykładu pokażemy konstrukcję obszaru krytycznego dla hipotezy alternatywnej H1: m > m0
Wykład 9
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
0X mU n
−=
σ
Weryfikacja hipotezy dotyczącej
wartości średniej – model 1
Dla ustalonego α∈(0,1) mamy
α = P (U∈ K / m = m0)
Obszar krytyczny K dobiera się tak, aby β było możliwie najmniejsze, tzn. P (U ∈ K / H1) było największe
Ponieważ H1: m > m0, więc
α = P (U ≥ k) = 1 − P (U < k) = 1 − Φ(k) dla pewnego k
Stąd Φ(k) = 1−α
Oznacza to, że k jest kwantylem rzędu 1−αi będziemy go oznaczać przez u(1−α)
W rezultacie
K = ⟨u(1−α); ∞)
Dla pozostałych hipotez obszary krytyczne buduje się analogicznie
Wykład 9
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
( )f x
0
0.1
(0,1)N
k
1− αα
Rys.24.1. Gęstość rozkładu N(0,1)
Weryfikacja hipotezy dotyczącej
wartości średniej – model 1
Tablica 24.1. Tablica testu dla średniej – model 1
Wykład 9
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
H1: m < m0
H1: m > m0
H1: m ≠ m0
H0: m = m0
alternatywnazerowaUwagi
Obszar
krytyczny K
Statystyka
testowa U
Hipoteza
0X mn
−
σ
2
2
( ; (1 )
(1 ); )
u
u
α
α
−∞ − − ⟩
∪⟨ − ∞0
0.1
(0,1)N
2(1 )u α−
1− α2α
2(1 )u α− −
2α
0
0.1
(0,1)N
(1 )u − α
1− αα
0
0.1
(0,1)N
(1 ) ( )u u− − α = α
1− αα( ; (1 )u−∞ − − α ⟩
(1 ); )u⟨ − α ∞
Weryfikacja hipotezy dotyczącej
wartości średniej – model 1
� Przykład (do modelu 1)
� Norma przewiduje, że waga produkowanego wyrobu powinna wynosić 50 dag
� Wysunięto przypuszczenie, że producent zawyża wagę wyrobów
� Aby potwierdzić przypuszczenie wylosowano 16 wyrobów, dla których średnia waga wynosiła 51 dag
� Wiadomo, że odchylenie standardowe wynosi 1.1 dag
� Waga wyrobów ma rozkład normalny
Na poziomie istotności 0.05 zweryfikować hipotezę, że waga wyrobów według normy i waga rzeczywista sąrówne wobec hipotezy alternatywnej, że są różne
Wykład 9
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Weryfikacja hipotezy dotyczącej
wartości średniej – model 2
� Model 2 (rozkład normalny, parametry nieznane)
X – zmienna losowa o rozkładzie normalnym N(m,σ), parametry m i σ nie są znane
Statystyka
ma rozkład Studenta z n−1 stopniami swobody przy założeniu, że prawdziwa jest hipoteza zerowa H0: m = m0
Ponieważ funkcja gęstości rozkładu Studenta ma podobne własności jak krzywa Gaussa, obszary krytyczne dla hipotez alternatywnych H1: m ≠ m0 , H1: m < m0 oraz H1: m > m0 buduje się podobnie jak w modelu 1
Wykład 9
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
0 1X m
t nS
−= −
Weryfikacja hipotezy dotyczącej
wartości średniej – model 2
Tablica 24.2. Tablica testu dla średniej – model 2
Wykład 9
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
H1: m < m0
H1: m > m0
H1: m ≠ m0
H0: m = m0
alternatywnazerowaUwagi
Obszar krytyczny
K
Statystyka
testowa t
Hipoteza
0 1X m
nS
−−
2
2
( ; (1 , 1)
(1 , 1); )
t n
t n
α
α
−∞ − − − ⟩
∪⟨ − − ∞0
0.1
t
2(1 , 1)t nα− −
1− α2α
2(1 , 1)t nα− − −
2α
0
0.1
t
(1 , 1)t n− α −
1− αα
0
0.1
t
(1 , 1)t n− − α −
1− αα( ; (1 , 1)t n−∞ − − α − ⟩
(1 , 1); )t n⟨ − α − ∞
Weryfikacja hipotezy dotyczącej
wartości średniej – model 2
� Przykład (do modelu 2)
� Norma przewiduje, że średni czas potrzebny na wykonanie pewnego detalu wynosi 1.5 h
� Robotnicy skarżą się, że czas ten jest zbyt krótki
� Aby sprawdzić zasadność skargi, zmierzono faktyczny czas produkcji 17 losowo wybranych detali i otrzymano wartośćśredniej z próbki 1.6 h, a odchylenia standardowego 0.2 h
� Zakładamy, że czas potrzebny do wykonania detalu jest zmiennąlosową o rozkładzie normalnym
Na poziomie istotności 0.05 stwierdzić, czy uzyskane wyniki stanowią podstawę do zwiększenia normy
Wykład 9
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Weryfikacja hipotezy dotyczącej
wartości średniej – model 3� Model 3 (rozkład nieznany, duża próba n ≥ 100 )
X – zmienna losowa o nieznanym rozkładzie, istnieją wartość oczekiwana EX = m i wariancja σ2 = D2X > 0
Jeśli próba jest duża ( n ≥ 100 ), to statystyka
ma w przybliżeniu rozkład normalny N(0,1), a nieznaną wartość parametru σmożemy oszacować za pomocą estymatora S, gdzie
W rezultacie do weryfikacji hipotez stosujemy statystykę
przy założeniu, że prawdziwa jest hipoteza zerowa H0: m = m0
Obszary krytyczne dla hipotez alternatywnych H1: m ≠ m0 , H1: m < m0 oraz H1: m > m0 wyznaczamy tak samo jak w modelu 1
Wykład 9
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
X mU n
−=
σ
( )22 1
1
n
in iS X X
== −∑
0X mU n
S
−=
Weryfikacja hipotezy dotyczącej
wariancji – model 1
� (24.2) Wariancja (lub odchylenie standardowe)
� Model 1 (rozkład normalny, parametry nieznane)
X – zmienna losowa o rozkładzie normalnym N(m,σ), parametry m i σ nie są znane
Statystyka
ma rozkład χ2 z n−1 stopniami swobody przy założeniu, że prawdziwa jest hipoteza zerowa H0: σ
2 = σ02 ( lub H0: σ = σ0 )
Wykład 9
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
22
20
nSχ =
σ
Weryfikacja hipotezy dotyczącej
wariancji – model 1
Tablica 24.3. Tablica testu dla wariancji – model 1
Wykład 9
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
H1: σ2 < σ0
2
H1: σ2 > σ0
2
H1: σ2 ≠ σ0
2
H0: σ2 = σ0
2
alternatywnazerowaUwagiObszar krytyczny K
Statystyka
testowa χ2
Hipoteza
2
20
nS
σ
2
2
2
2
0; ( , 1)
(1 , 1); )
n
n
α
α
⟨ χ − ⟩∪
⟨χ − − ∞2α1− α
2
2( , 1)nαχ −
2α
( )f x
0 x
2χ
2
2(1 , 1)nαχ − −
1− α
2 ( , 1)nχ α −
α
( )f x
0 x
2χ
α1− α
( )f x
0 x
2χ
2(1 , 1)nχ − α −
20; ( , 1)n⟨ χ α − ⟩
2 (1 , 1); )n⟨χ − α − ∞
Weryfikacja hipotezy dotyczącej
wariancji – model 1
� Przykład (do modelu 1)
� Dokonano 10 pomiarów pewnej wielkości
� Otrzymano odchylenie standardowe z próbki 1.5
� W teorii pomiarów zakładamy, że wynik pomiaru jest zmienną losową o rozkładzie normalnym N(m,σ), zaśodchylenie standardowe jest miarą dokładności pomiarów
Zweryfikować hipotezę H0: σ = 1.0 wobec hipotezy alternatywnej H1: σ > 1.0 na poziomie istotności 0.05
Wykład 9
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Weryfikacja hipotezy dotyczącej
wariancji – model 2
� Model 2 (rozkład normalny, duża próba n ≥ 50 )
X – zmienna losowa o rozkładzie normalnym N(m,σ), parametry m i σ nie są znane
Jeśli próba jest duża ( n ≥ 50 ), to statystyka
ma w przybliżeniu rozkład normalny N(0,1), przy założeniu, że prawdziwa jest hipoteza zerowa H0: σ
2 = σ02 ( lub H0: σ = σ0 )
Obszary krytyczne dla hipotez alternatywnych
H1: σ2 ≠ σ0
2, H1: σ2 < σ0
2 oraz H1: σ2 > σ0
2
wyznaczamy tak samo jak w modelu 1 dla średniej
Wykład 9
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
22 2 3U n= χ − −
Weryfikacja hipotezy dotyczącej
wariancji – model 3
� Model 3 (rozkład nieznany, duża próba n ≥ 100 )
X – zmienna losowa o rozkładzie normalnym N(m,σ), parametry m i σ nie są znane
Jeśli próba jest duża ( n ≥ 100 ), to statystyka
ma w przybliżeniu rozkład normalny N(0,1), przy założeniu, że prawdziwa jest hipoteza zerowa H0: σ
2 = σ02 ( lub H0: σ = σ0 )
Obszary krytyczne dla hipotez alternatywnych
H1: σ2 ≠ σ0
2, H1: σ2 < σ0
2 oraz H1: σ2 > σ0
2
wyznaczamy tak samo jak w modelu 1 dla średniej
Wykład 9
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
2 20
20
ˆ
2
S nU
− σ=
σ
Weryfikacja hipotezy dotyczącej
wariancji
� Przykład
� Wylosowano 200 robotników pewnego zakładu
� Zbadano stopień wykonania normy [%]
� Wyniki przedstawiono w szeregu rozdzielczym
Na poziomie istotności 0.05 zweryfikować hipotezę, że odchylenie standardowe stopnia wykonania normy jest równe 10 % wobec hipotezy alternatywnej, że jest mniejsze od 10 %
Wykład 9
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
131217507029153Liczba pracowników
150140130120110100908070Stopień wykonania
normy [%]
Weryfikacja hipotezy o wskaźniku
struktury� (24.3) Wskaźnik struktury
� Model (rozkład 0-1, parametr p nieznany, duża próba n ≥ 100 )
X – zmienna losowa o rozkładzie 0-1, parametr p nie jest znany
Jeśli próba jest duża ( n ≥ 100 ), to statystyka
gdzie M jest zmienną losową, której wartości są liczbami wyróżnionych elementów w n-elementowej próbce, ma rozkład w przybliżeniu normalny N(0,1), przy założeniu, że prawdziwa jest hipoteza zerowa H0: p = p0
Obszary krytyczne dla hipotez alternatywnych
H1: p ≠ p0, H1: p < p0 oraz H1: p > p0
wyznaczamy tak samo jak w modelu 1 dla średniej
Wykład 9
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
0
0 0(1 )
Mn
pU
p p
n
−=
−
Weryfikacja hipotezy o wskaźniku
struktury
� Przykład
� Zbadano 2000 pacjentów pewnego szpitala
� 8 % miało grupę krwi AB
� 25 % pacjentów z grupą krwi AB miało czynnik RH–
Na poziomie istotności 0.01 zweryfikowaćhipotezę, ze odsetek osób o grupie krwi AB RH–wynosi 3 % wobec alternatywnej, że jest mniejszy niż 3 %
Wykład 9
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka