pomiary w technice studyjnej - multimed · 2021. 1. 6. · statystyczna analiza wyników...

Pomiary w Technice Studyjnej:

statystyczna analiza wyników eksperymentalnych

mgr inż. Adam Kurowski

Statystyczna analiza wyników eksperymentalnych

▪ We wszelkich zastosowaniach, które w jakiś sposób stosują metodęnaukową zwykle konieczne jest upewnienie się, że wnioskiwyciągane z różnego rodzaju obserwacji są prawidłowe.

▪ Jedną z technik takiego upewniania jest posłużenie się statystykąmatematyczną do określenia jak bardzo prawdopodobny, albo jakbardzo nieprawdopodobny jest wynik właśnie przeprowadzonegoeksperymentu.

▪ Pozwala to na rozpoznanie sytuacji w której w wyniku jakiegośzewnętrznego, nieprzewidzianego czynnika, wynik eksperymentuzostaje zafałszowany.

Wprowadzenie


Podstawowe pojęcia – czym jest eksperyment?

ane

ksper ent

bserwa ja

or ułowanieproble u badaw ego

nioskowanie

źródło: Mason R. L., Gunst, R. F., Hess J. L. Statistical design and analysis of experiments with applications to engineering and science. Second edition, Wiley & Sons Inc., 2003.


1. Faza planowania projektu

• Jaka wartość będzie mierzona?

• Jak wielkiego zróżnicowania danych się spodziewamy?

• Jakie czynniki mogą wpłynąć na wyniki projektu?

2. Faza planowania eksperymentu

• Kontrola znanych źródeł zmienności danych (pożądanych i niepożądanych)

• Plan ograniczenia wpływu źródeł niepożądanej zmienności

• Plan na wyeksponowanie zmienności wynikającej z pożądanych (badanych) jej źródeł

3. Fa a obróbki stat st nej dan h

• Wyciągnięcie wniosków z danych zebranych w eksperymencie

• Projekt eksperymentu dopasowany do metod analizy

• Dobranie modeli statystycznych pozwalających na możliwie najbardziej wiarygodną ocenę zebranego materiału eksperymentalnego

Rola statystyki w projekcie badawczym


▪ Populacja – popula ja stat st na składa się e ws stki h ożliw h do aobserwowania obiektów, jakie istnieją w ra a h dan h warunków eksperymentalnych lub obserwacyjnych

▪ Proces – powtar alna seria nnoś i, której skutkie jest powstanie obserwowalnej harakter st ki lub s eregu po iarów

▪ Cecha – właś iwość lub harakter st ka, która jest po skiwana a po o ą eksper entu, lub stanowi wartość wejś iową w eksper en ie

▪ Obserwacja – pojed n a kolek ja różn h e h,

▪ Próba – grupa obserwacji

▪ Odpowiedź– każda obserwa ja stanowią a w nik eksper entu,

▪ Czynnik – ienna, którą ożna kontrolować w pr ebiegu eksper entu i która wpł wa na wartoś i odpowied i u skiwan h w w niku eksper entu

Rola statystyki w projekcie badawczym


Populacja, a próba

opula ja róba grupa obserwa ji

opula ja

nioskowanie

róba

osowe próbkowanie

popula ji

nr obserwa ji e ha e ha e ha

, ,

, ,

, ,

, ,

, ,

, ,

, ,

, ,

bserwa je

o kład prawdopodobie stwa

n or a ja o ro kład ie

źródło: Górecki, T. Podstawy statystyki z przykładami w R, Wydawnictwo BTC, 2011.

Schematyczne przedstawienie procesu prowadzenia badań

Schematyczne przedstawienie procesu prowadzenia eksperymentu

nnik

nnik

ksper ent

ilka reali a ji pro esu w ra a h eksper entu

opula ja róbka

grupa obserwa ji opula ja

róbka

grupa obserwa ji

opula ja róbka

grupa obserwa ji

opula ja róbka

grupa obserwa ji

w nik eksper entu,

li estaw odpowied i

dla różn h wartoś i

nników

Przykład zbioru obserwacji z „prawdziwego życia” ;)

źródło: https://www.kaggle.com/goldenoakresearch/us-household-income-stats-geo-locations

Zbiór danych „US Household Income Statistics”, przygotowany oryginalnie na potrzeby badań nad rynkiem nieruchomości i inwestycji (32527 obserwacji)

https://www.kaggle.com/goldenoakresearch/us-household-income-stats-geo-locations


▪ Stałe – wartoś i wspólne dla ws stki h po skan h w eksper en ie obserwa ji, nie podlegają badanio , ale de dują o własnoś ia h popula ji np as badania lub określon biór osób na jakich przeprowadzono badanie)

▪ Zmienne – właś iwoś i, które różnią pos ególne jednostki stat st ne i podlegają obserwa ji

Podstawowe pojęcia – typy cech


▪ Jakościowe – ęsto są to określenia słowne np płeć lub rod aj w kon wanego awodu Nie ożna i h e sobą porówn wać

▪ Ilościowe – właś iwoś i które są ożliwe do po iaru i które ożna porówn wać:

• Porządkowe – szeregują natężenie badanej właściwości przedstawionej w sposób opisowy (np. oceny studentów lub system ocen za pomocą gwiazdek w sklepie internetowym)

• Dyskretne (skokowe) – przyjmują skończony lub przeliczalny zbiór wartości na danej skali liczbowej, często jest to zbiór liczb całkowitych dodatnich (np. liczba samochodów przejeżdżających dziennie przez dany odcinek drogi). Nie mogą przyjmować wszystkich wartości bez względu na dokładność prowadzonego pomiaru

• Ciągłe – mogą przyjąć każdą wartość z określonego przedziału liczbowego [a,b], przy czym liczba miejsc dziesiętnych jest uzależniona od dokładności dokonywanych pomiarów.

Podstawowe pojęcia – typy zmiennych


▪ Nominalna – u ożliwia jedynie klasyfikowanie pod w ględe mierzonej własnoś i, brak upor ądkowania, brak jednostki pomiaru,dotyczy tylko cech o charakterze jakoś iow , ożna jedyniestwierd ić, czy obiekty są równe czy są różne (np. płeć, kolor oczu),

▪ Porządkowa (rangowa) – u ożliwia upor ądkowanie pod w ględe mierzonej własnoś i (rangowanie), brak punktu zerowego i jednostkipomiaru, ożna porównać obiekty ze sobą na zasadziewięks / niejs , czy lepszy/gorszy, ale nie znamy „odległoś i” ięd pos ególn i stopniami (np. skala ocen, poziomw ks tał enia ,

Podstawowe pojęcia – typy skal pomiarowych


▪ Przedziałowa – u ożliwia porówn wanie różni pod w ględe mierzonej wartoś i, określona jest arbitralnie jednostka pomiaru iumowne zero skali, ożna określić na ile dane wielkoś i się różnią.Nie da się natomiast opisać stosunku dwó h obiektów ze w ględu na ier oną e hę (np. poziom iśnienia akustycznego w dB – 60 dB niejest dwa razy więks e od 30 dB),

▪ Ilorazowa – U ożliwia określenie mierzonej własnoś i dla obiektu,podany jest jednoznacznie absolutny punkt zerowy i jednostkapomiaru. Jest to skala w której ożliwe jest porówn wanie jednostekza po o ą w ględn h charakterystyk na takiej zasadzie, że np. jedenobiekt jest dwa razy iężs od drugiego (np. masa w kilogramach,albo liczba kand datów pr jęta na dany kierunek na uczelni)

Podstawowe pojęcia – typy skal pomiarowych


Zbiór obserwacji oże awierać bardzo wiele danych, każda z cech ożeposiadać wiele wartoś i po hod ą h z wielu różn h próbek.

Z tego w ględu powstał szereg sposobów na opisanie własnościstatystycznych wszystkich badanych cech za po o ą para etrów opojedynczej wartoś i.

r kłada i grup takich wartoś i są:

▪ miary tendencji centralnych (np. średnia arytmetyczna, mediana),

▪ miary rozproszenia iennoś i danych (np. ro stęp, wariancja,odchylenie standardowe, kwartyle),

▪ miary asymetrii (np. skośność ,

▪ miary koncentracji (np. kurtoza).

Opis własności cechy statystycznej


Średnia arytmetyczna – wartość obliczana ze wzoru:

ҧ𝑥 =1

𝑁

𝑛=1

𝑁

𝑥[𝑛] ,

gdzie przez ҧ𝑥 rozumiemy wartość średniej arytmetycznej,

𝑁 stanowi li ebność prób ,

𝑛 stanowi indeks pojedynczej wartoś i cechy

𝑥[𝑛] po hod ą ej z kolejnych obserwacji pobranych z prób .

Opis własności cechy statystycznej – miary tendencji centralnych


W przypadku gdy chcemy uśrednić kilka średnich składowych policzonych zkilku estawów obserwacji, średnia wynikowa staje się średnią ważoną:

ҧ𝑥𝑝 =

𝑖=1

𝑘

ҧ𝑥𝑖𝑁𝑖𝑁𝑝

, 𝑁𝑝=

𝑖=1

𝑘

𝑁𝑖 ,

gdzie ҧ𝑥𝑝 oznacza w nikową średnią ważoną,

𝑘 oznacza li bę populacji, dla któr h liczona jest średnia,

ҧ𝑥𝑖 to średnia składowa wyliczona dla każdej populacji,

𝑁𝑖 to li ebność prób , dla której policzona ostała każda ze średni h,

𝑁𝑝 to suma li ebnoś i wszystkich prób składow h.



Mediana – zwana też wartoś ią środkową, którą ożna obli ć dla szereguuporządkowanego. Jej spe jalną e hą jest to, że powyżej i poniżej niejznajduje się jednakowa liczba obserwacji (czyli dokładnie połowa).

Aby ją obli ć konieczne jest posortowanie obserwacji ze w ględu na w braną e hę, dla której mediana jest obliczana. Następnie dla nieparzystej liczbyobserwacji wybierana jest wartość w środku, a dla parzystej liczby obserwacjiobliczana jest średnia dwóch środkowych próbek, co ożna apisać teżwzorem:

𝑀𝑒 =

𝑥𝑁 + 1

2, dla 𝑁 nieparzystego

1

2𝑥𝑁

2+ 𝑥

𝑁 + 1

2, dla 𝑁 parzystego

Gdzie 𝑀𝑒 oznacza obli aną wartość mediany, 𝑥 to wartoś i cech obserwacjiuż wan h w obliczeniach, a 𝑁 to liczba obserwacji



Rozstęp – oznaczany przez 𝑅 , najprostsza miara będą a różni ą po ięd aks alną (𝑥𝑚𝑎𝑥), a ini alną (𝑥𝑚𝑖𝑛) wartoś ią cechy:

𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛.

Wariancja – oznaczana przez 𝑠2 i obliczana ze wzoru:

𝑠2 =1

𝑁

𝑖=1

𝑁

𝑥𝑖 − ҧ𝑥 2 ,

gdzie 𝑁 to liczba obserwacji dla któr h wariancja jest obliczana,

ҧ𝑥 to średnia cechy dla której obliczana jest wariancja,

a 𝑥𝑖 to 𝑖-ta wartość tej cechy.

Wariancja jest średnią wartoś ią cechy unormowanej i której wartoś i ostał podniesione do kwadratu.

Opis własności cechy statystycznej – miary rozproszenia (zmienności)


Kwartyl dolny (pierwszy) – taka wartość, poniżej której znajduje się1

4wartoś i

obserwacji, a pow żej której najdują się3

4wartoś i, oznaczany przez 𝑄1.

Kwartyl górny (trzeci) – taka wartość, poniżej której najdują się3

4wartoś i

obserwacji, a pow żej której znajduje się1

4wartoś i, oznaczany przez 𝑄3.

Rozstęp międzykwartylowy (ang. interquartile range, IQR) – miara ro stępuobliczana poprzez odję ie wartoś i kwartyla górnego od wartoś i kwartyla dolnego,oznaczana jako IQR lub 𝑄:

IQR = 𝑄 = 𝑄3 − 𝑄1.

ielkość 𝑄/2 ęsto nazywana bywa odchyleniem ćwiartkow lub kwantylowym(ang. quartile deviation).




ws stki h obserwa ji

e




Skośność – oznaczana przez 𝐴𝑠 , pozwala na dodatkowe określenie tego, czywdanym ro kład ie w żs e prawdopodobie stwa w stąpienia danych wartoś ipr eważają wartoś i pow żej/poniżej średniej arytmetycznej

𝐴𝑠 =ҧ𝑥 − 𝐷

𝑠,

gdzie ҧ𝑥 oznacza średnią ar t et ną badanego iągu obserwacji,

𝑠 oznacza odchylenie standardowe obliczone na podstawie posiadanych obserwacji,

a 𝐷 oznacza do inantę odę , czyli naj ęś iej w stępują ą wartość tego ro kładu

Opis własności cechy statystycznej – skośność


Opis własności cechy statystycznej – skośność

d str bu ja s etr na

średnia ar t et na

ediana

oda

d str bu ja dodatnią

skośnoś ią

oda średnia

ar t et na

ediana

d str bu ja uje ną

skośnoś ią

odaśrednia

ar t et na

ediana

średnia arytmetyczna = mediana = moda

moda < mediana < średnia arytmetycznaśrednia arytmetyczna < mediana < moda


Kurtoza – oznaczana przez 𝐾 , oznacza, czy dany układ jest bardziej czy mniejskupiony wokół pojedynczej wartoś i niż ro kład Gaussa

𝐾 =

1𝑁σ𝑖=1𝑁 𝑥𝑖 − ҧ𝑥 4

𝑠4− 3,

gdzie 𝑁 to liczba obserwacji dla któr h wariancja jest obliczana,

ҧ𝑥 to średnia cechy dla której obliczana jest kurtoza,

𝑥𝑖 to 𝑖-ta wartość tej cechy,

a 𝑠4 to kwadrat wariancji tej cechy obliczony na podstawie posiadanych obserwacji.

Opis własności cechy statystycznej – kurtoza


Opis własności cechy statystycznej – kurtoza

Rozkład o smukłości takiej jak rozkład Gaussa nazywamy rozkładem mezokurtycznym (K=0).Rozkład bardziej smukły od rozkładu Gaussa to rozkład leptokurtyczny (K>0), a mniej smukły to rozkład platokurtyczny (K<0).

ro kład e okurt n ,

ro kład leptokurt n ,

ro kład platokurt n ,


nogość wskaźników, jakie opisują pos ególne cechy jest bardzo duża.Z tego w ględu powstał graficzne przedstawienia służą e np. do analizyznacznych biorów cech. r kłade takiego zobrazowania jest tzw.wykres pudełkow .

Na wykresie pudełkow w formie graficznej przedstawione sąnajważniejs e parametry danego iągu wartoś i takie jak:

▪ wartość ini alna i aks alna,

▪ położenie kwartyli dolnego i górnego,

▪ mediana,

▪ wartoś i odstają e

Istnieje także wariant wykresu pudełkowego, na któr naniesiona jestgraficzna prezentacja estymowanego ro kładu danej zmiennej. Nazywanyjest on wtedy wykresem skrzypcowym.

Wizualizacja danych – wykres pudełkowy i skrzypcowy


Wizualizacja danych – wykres pudełkowy i skrzypcowy

obserwacja odstająca

wartość maksymalna

kwartyl górny (𝑄3)

kwartyl dolny (𝑄1)

mediana

wartość minimalna

nazwa cechy

Na wykresie pudełkowym naniesione opróczpodstawowych parametrów statystycznychnaniesione są także wartości maksymalne iminimalne znajdujące się w ciągu wartościpowiązanym z wizualizowaną cechą.Wąs obrazujący wartość maksymalną niemoże być jednak wyższy niż wartość progowa:

𝑄3 + 1,5 ⋅ 𝑄3 − 𝑄1A wąs wartości minimalnej nie może być niższy niż:

𝑄1 − 1,5 ⋅ 𝑄3 − 𝑄1Wartości poza tym zakresem uznawane są za tzw. wartości odstające.

Przykład wykresu pudełkowego na podstawie zbioru danych US Household Income

Przykład wykresu pudełkowego na podstawie zbioru danych US Household Income(kod w języku Python)

import pandas as pd

import seaborn as sns

import matplotlib.pyplot as plt

sns.set(style="whitegrid")

dataset = pd.read_excel("kaggle_income.xlsx")

sns.boxplot(x='State_Name',y='Median', data=dataset)

plt.xticks(rotation=90, size=14)

plt.yticks(size=15)

plt.xlabel('nazwa stanu', size=15)

plt.ylabel('mediana przychodu gospodarstw [USD]', size=15)

plt.subplots_adjust(bottom=0.3)

plt.show()

Przykład wykresu skrzypcowego na podstawie zbioru danych US Household Income

Przykład wykresu skrzypcowego na podstawie zbioru danych US Household Income(kod w języku Python)

import pandas as pd

import seaborn as sns

import matplotlib.pyplot as plt

sns.set(style="whitegrid")

dataset = pd.read_excel("kaggle_income.xlsx")

sns.violinplot(x='State_Name',y='Median', data=dataset, width=2.5)

plt.xticks(rotation=90, size=14)

plt.yticks(size=15)

plt.xlabel('nazwa stanu', size=15)

plt.ylabel('mediana przychodu gospodarstw [USD]', size=15)

plt.subplots_adjust(bottom=0.3)

plt.gca().set_ylim([0,None])

plt.show()


Czasem zachodzi potrzeba ustalenia, w jakim przedziale wielkoś iznajduje się wartość zmierzona w eksperymencie.

Oszacowanie takie nazywane jest określenie tzw. przedziału ufności.

r ed iał u noś i, jest to zakres wartoś i w któr znajduje się pewnazmierzona wielkość z zadanym prawdopodobie stwe , np. 0,95. W takimprzypadku akłada , że prawdopodobie stwo tego, że naszeoszacowanie jest błędne wynosi 0,05.

ielkość tę nazywamy poziomem istotności (ang. significance level) i ęsto oznaczany jest gre ką literą 𝜶.

Testy statystyczne – przedziały ufności i poziom istotności statystycznej


ęstą prakt ką jest obliczanie pr ed iałów u noś i dla średni h wartoś i jakiejśmierzonej wielkoś i.

Wpierw z szeregu 𝑁 o estymowanej wariancji 𝑠2 i odchylenia standardowego 𝑠obserwacji wyliczana jest wartość średnia ҧ𝑥.

r ed iał u noś i w takim przypadku dany jest wzorem:

ҧ𝑥 − 𝑡1−

𝛼2,𝑁−1

⋅𝑠

𝑁 − 1; ҧ𝑥 + 𝑡

1−𝛼2,𝑁−1

⋅𝑠

𝑁 − 1,

gdzie 𝑡1−

𝛼

2,𝑛−1

jest wartoś ią z pomocniczego ro kładu zmiennej 𝑡 odczytanej z

tablicy, lub pozyskanej z programu komputerowego przy zadanych wartoś ia h𝛼 i 𝑁.

Testy statystyczne – przedziały ufności i poziom istotności statystycznej


Testy statystyczne – zmienna t

Jest to specjalna, unormowana zmienna ają a ro kład prawdopodobie stwaunormowanego ro kładu, któr jest wynikiem obserwacji populacji o rozkładzienormalnym za pomocą próby o 𝑵 obserwacjach. Fakt obserwacji objawia się ięd innymi konie noś ią liczenia estymaty odchylenia standardowego 𝑠, która astępuje nam „prawd iwą” wartość odchylenia o na aną przez 𝜎.

Wartość 𝑵 przy takiej obserwacji ęsto nazywa się liczbą stopni swobodyrozkładu.

Im mniejsza wartość 𝑵 , tym bardziej rozkład ten różni się od rozkładunormalnego.

Im wartość 𝑵 większa, tym bardziej ten rozkład przypomina rozkładnormalny. tąd, jeżeli wartość 𝑵 jest bardzo duża (zwyczajowo ówi się o 30obserwacjach), to ożna zamiast rozkładu i zmiennej 𝒕 stosować „ w kł ”rozkład Gaussa



−𝑡1−

𝛼2,𝑁−1

+𝑡1−

𝛼2,𝑁−1

,

prawdopodobie stwa

,

prawdopodobie stwa

,

prawdopodobie stwa

0

Przykład analizy za pomocą przedziałów ufności (𝛼 = 0.05) na podstawie zbioru danych US Household Income


drębn zagadnieniem jest możliwość wyciągania wniosków napodstawie danych zebranych w eksperymencie. Na pr kład oże b ćto w iągnię ie wniosku, że średni pr hód gospodarstwa domowego wstanie X jest więks niż w stanie Y.

Do tego celu konieczne jest przeprowadzenie testu statystycznego.Konstrukcja tego typu testów polega na dwó h podstawowych poję ia h:

Hipotezie zerowej (ang. null hypothesis) – oznaczanej przez 𝐻0 i któraoznacza hipote ę sprawd aną w teś ie statystycznym,

Hipotezie alternatywnej (ang. alternative hypothesis) – oznaczanejprzez 𝐻1, która oznacza dowolną hipote ę inną niż hipoteza zerowa

Testy statystyczne – hipotezy statystyczne


Jednym z najprostszych testów statystycznych jest test t-Studenta.Pozwala on na sprawdzenie, czy wartość średnia danego ciągu jestrówną wielkości 𝝁𝟎.

Test ten akłada, że populacja z której pozyskiwane są obserwacjema rozkład Gaussa.

Hipoteza zerowa akłada, że iąg ma wartość średnią równą 𝜇0, czyli:𝐻0: 𝜇 = 𝜇0

Hipoteza alternatywna oże ieć różną postać:

Testy statystyczne – test t-Studenta

𝐻1: 𝜇 = 𝜇1 < 𝜇0 , tzw. hipoteza lewostronna

𝐻1: 𝜇 = 𝜇1 > 𝜇0 , tzw. hipoteza prawostronna

𝐻1: 𝜇 = 𝜇1 ≠ 𝜇0 , tzw. hipoteza dwustronna


Statystyka testowa ma postać:

𝑡 =ҧ𝑥 − 𝜇0𝑠

𝑁 − 1,

gdzie ҧ𝑥 to wartość średnia iągu obserwacji,

𝜇0 to wartość średnia akładana przez hipote ę erową,

𝑠 to estymowana ze zbioru obserwacji wartość odchylenia standardowego

𝑁 to liczba obserwacji, na podstawie której dokonywane są obliczenia.

Obliczona wartość t jest porówn wana z ro kłade wzorcowym zmiennej𝑡 . Jeżeli wartość statystyki znajduje się w obszarze odrzucenia, toPrzyjmowana jest hipoteza alternatywna. Jeśli wartość ta nie znajdzie sięw tym obszarze – w mocy pozostaje hipoteza zerowa



Hipoteza alternatywna 𝐻1 jest przyjmowana:

▪ W przypadku hipotezy lewostronnej, jeżeli wartość statystyki 𝑡 będ iemniejsza niż wartość progowa −𝑡1−𝜶,𝑁−1 ,

▪ W przypadku hipotezy prawostronnej, jeżeli wartość statystyki 𝑡 będ iemniejsza niż wartość progowa 𝑡1−𝜶,𝑁−1 ,

▪ W przypadku hipotezy dwustronnej, jeżeli wartość statystyki 𝑡 będ iemniejsza niż wartość progowa -𝑡

1−𝛼

2,𝑁−1

, lub więks a niż wartość

progowa 𝑡1−

𝛼

2,𝑁−1




obszary odrzucenia w teście dwustronnym

𝑡1−

𝛼2,𝑁−1

−𝑡1−

𝛼2,𝑁−1

,

prawdopodobie stwa

,

prawdopodobie stwa

obs ar odr u enia

,

prawdopodobie stwa

obs ar odr u enia



obszar odrzucenia w teście lewostronnym

−𝑡1−𝛼,𝑁−1

,

prawdopodobie stwa

,

prawdopodobie stwa

obs ar odr u enia



obszar odrzucenia w teście prawostronnym

𝑡1−𝛼,𝑁−1

,

prawdopodobie stwa ,

prawdopodobie stwa

obs ar odr u enia


Czasem zamiast podawać wynik w postaci stwierdzenia faktu, żeodrzucono hipote ę erową, podaje się tzw. p-wartość.

Jest to najmniejszy poziom istotności, któr prowadzi do odrzuceniahipotezy zerowej. Pozwala to na pozbycie się problemu arbitralnegodoboru poziomu istotności, któr zwyczajowo przyjmowany jest jako0,05.

Poprzez podanie p-wartoś i każd oże do danych w ników stosowaćkryterium w postaci swojego własnego progu istotnoś i.

Testy statystyczne – p-wartość


Testy statystyczne – p-wartość

,

prawdopodobie stwa ,

prawdopodobie stwa

obs ar wią an

p wartoś ią np

obli ona wartość

Ilustracja p-wartości dla hipotezy prawostronnej


ażd test stat st n wiąże się ożliwoś ią popełnienia błędu, w różnia się dwa t p błędów:

▪ Błąd 1. rodzaju, gdy hipoteza zerowa została odrzucona pomimo tego,że jest ona prawdziwa. Jest on tym mniej prawdopodobny im niższajest wartość poziomu istotności 𝜶. Wartość poziomu istotności jestprawdopodobieństwem popełnienia błędu 1. rodzaju.

▪ Błąd 2. rodzaju, gdy hipoteza zerowa nie została odrzucona pomimotego, że jest ona fałszywa. Im mniejsze prawdopodobie stwo tego błędutym więks a jest tak zwana moc testu statystycznego.

Przy wyborze testu statystycznego należy wybierać taki test, którywartość 𝜶 i zapewnia maksymalną moc.

Testy statystyczne – rodzaje błędów

Na całe szczęście, prawda nie została podzielona przez matematyków na dwa odrębne rodzaje…

źródło: [email protected]


Testy statystyczne – problem wielokrotnego testowania

Jeżeli wykonujemy zestaw trzech testów, to efektywne prawdopodobieństwo popełnienia błędu 1. rodzaju wynosi nie 𝛼, tylko 1 − 1 − 𝛼 3, co dla 𝜶 = 𝟎, 𝟎𝟓 daje efektywną wartość prawdopodobieństwa pomyłki równą aż 0,14.

Prawdopodobieństwo popełnienia błędu 1. rodzaju w takim przypadku jest prawie 3 razy większe niż w przypadku pojedynczego testu!

porównanie 2 (prawdopodobieństwo błędu równe 𝛼)

porównanie 3 (prawdopodobieństw

o błędu równe 𝛼)

porównanie 1 (prawdopodobieństw

o błędu równe 𝛼)

Zmienna A

Zmienna BZmienna C


Aby pr e iwd iałać problemowi wielokrotnego testowania ożna astosować tzw. poprawkę na wielokrotne testowanie, np. poprawkęBonferroniego, która polega na pr ję iu faktycznego poziomu istotnoś irównego

𝛼𝑒𝑓𝑓 =𝛼

𝑘,

gdzie 𝛼 to poziom istotnoś i ałego zestawu bada , k to liczba testówwykonanych w ramach zestawu bada , a 𝛼𝑒𝑓𝑓 to efektywny poziomistotnoś i, jaki jest stosowany do pos ególn h testów składow h.

Dla testowania gdzie podawane są p-wartości poprawka ta polega poprostu na przemnożeniu podanych p-wartości przez 𝒌, co odpowiadaoperacji dzielenia zaproponowanej dla podejścia z wykorzystaniem𝜶𝒆𝒇𝒇.

ostępne są także inne poprawki, np. poprawka Holma-Bonferonniego.

Testy statystyczne – poprawki na wielokrotne testowanie


Innym podejściem do wykonywania wielu testów na raz, na pr kładporówn wania ze sobą wielu estymowanych średni h jest zastosowaniespecjalnych testów wykonujących jednoczesne porównanie, np.testu ANOVA (Analysis of Variance).

Dostarczana przez nie p-wartość pozwala na zweryfikowanie hipotezy,czy którakolwiek z k średnich różni się od którejkolwiek zpozostałych.

b dowied ieć się, która para średnich jest parą różnią ą się konie ne jest wykorzystanie testu specjalnie przystosowanego do wielokrotnego testowania, tzw. testu post-hoc.

ęst teste post-ho w kor st wan po teś ie N V jest test HSD Tukeya.

Dodatkowo, ANOVA zakłada, że wariancje wszystkich analizowanych zmiennych są równe, co wymaga uprzednio wykonania dodatkowego testu na równość wariancji – testu Levene’a lub Browna-Forsythe’a.

Testy statystyczne - ANOVA


Testy statystyczne – ANOVA (zasada działania)

grupa

𝑆12

𝑆22

𝑆32

𝑆1232

𝑆12 - wariancja grupy 1.



𝑆1232 - wariancja zbiorcza

sumy grup 1.-3.


Czasem nie jest możliwe spełnienie założeń przyjmowanych dozastosowania określon h testów statystycznych, na pr kład ro kładuGaussa dla testu t-Studenta, czy równoś i wariancji dla testu ANOVA. Otestach przyjmujących tego typu dodatkowe założenia mówimy, żesą to testy parametryczne.

W takim wypadku konieczne jest posłużenie się tzw. testaminieparametrycznymi. Testy te skonstruowane są w oparciu omniejszą liczbę założeń (aczkolwiek nie są ich pozbawione), zwyklemają tez mniejszą moc.

Testy statystyczne – testy parametryczne i nieparametryczne


ęst nieparametrycznym odpowiednikiem dla testu t-Studenta jesttest kolejności par Wilcoxona.

Podobnie dla testu ANOVA jego nieparametrycznym odpowiednikiemjest test Kruskala-Wallisa. Odpowiednikiem testu post-hoc HSD Tukeyaw przypadku testu Kruskala-Wallisa jest test post-hoc Dunn.

Testy statystyczne – testy parametryczne i nieparametryczne


stnieje wiele inn h testów stat st n h dostosowan h do konkretn h potr eb, na pr kład:

▪ Test na godność ro kładów dwó h iągów,

▪ Test na równość warian ji dwó h iągów,

▪ Test oł ogorowa-Smirnova do stwierd enia dan iąg wartoś i a ro kład nor aln ,

… i wiele inn h, które ożna dobierać do danego astosowania według konkretnego zapotrzebowania.

Testy statystyczne – inne rodzaje testów statystycznych


Dziękuję za uwagę!

pomiary w technice studyjnej - multimed · 2021. 1. 6. · statystyczna analiza wyników...

Documents