pomiary w technice studyjnej - multimed · 2021. 1. 6. · statystyczna analiza wyników...
TRANSCRIPT
Pomiary w Technice Studyjnej:
statystyczna analiza wyników eksperymentalnych
mgr inż. Adam Kurowski
Statystyczna analiza wyników eksperymentalnych
▪ We wszelkich zastosowaniach, które w jakiś sposób stosują metodęnaukową zwykle konieczne jest upewnienie się, że wnioskiwyciągane z różnego rodzaju obserwacji są prawidłowe.
▪ Jedną z technik takiego upewniania jest posłużenie się statystykąmatematyczną do określenia jak bardzo prawdopodobny, albo jakbardzo nieprawdopodobny jest wynik właśnie przeprowadzonegoeksperymentu.
▪ Pozwala to na rozpoznanie sytuacji w której w wyniku jakiegośzewnętrznego, nieprzewidzianego czynnika, wynik eksperymentuzostaje zafałszowany.
Wprowadzenie
Statystyczna analiza wyników eksperymentalnych
Podstawowe pojęcia – czym jest eksperyment?
ane
ksper ent
bserwa ja
or ułowanieproble u badaw ego
nioskowanie
źródło: Mason R. L., Gunst, R. F., Hess J. L. Statistical design and analysis of experiments with applications to engineering and science. Second edition, Wiley & Sons Inc., 2003.
Statystyczna analiza wyników eksperymentalnych
1. Faza planowania projektu
• Jaka wartość będzie mierzona?
• Jak wielkiego zróżnicowania danych się spodziewamy?
• Jakie czynniki mogą wpłynąć na wyniki projektu?
2. Faza planowania eksperymentu
• Kontrola znanych źródeł zmienności danych (pożądanych i niepożądanych)
• Plan ograniczenia wpływu źródeł niepożądanej zmienności
• Plan na wyeksponowanie zmienności wynikającej z pożądanych (badanych) jej źródeł
3. Fa a obróbki stat st nej dan h
• Wyciągnięcie wniosków z danych zebranych w eksperymencie
• Projekt eksperymentu dopasowany do metod analizy
• Dobranie modeli statystycznych pozwalających na możliwie najbardziej wiarygodną ocenę zebranego materiału eksperymentalnego
Rola statystyki w projekcie badawczym
Statystyczna analiza wyników eksperymentalnych
▪ Populacja – popula ja stat st na składa się e ws stki h ożliw h do aobserwowania obiektów, jakie istnieją w ra a h dan h warunków eksperymentalnych lub obserwacyjnych
▪ Proces – powtar alna seria nnoś i, której skutkie jest powstanie obserwowalnej harakter st ki lub s eregu po iarów
▪ Cecha – właś iwość lub harakter st ka, która jest po skiwana a po o ą eksper entu, lub stanowi wartość wejś iową w eksper en ie
▪ Obserwacja – pojed n a kolek ja różn h e h,
▪ Próba – grupa obserwacji
▪ Odpowiedź– każda obserwa ja stanowią a w nik eksper entu,
▪ Czynnik – ienna, którą ożna kontrolować w pr ebiegu eksper entu i która wpł wa na wartoś i odpowied i u skiwan h w w niku eksper entu
Rola statystyki w projekcie badawczym
Statystyczna analiza wyników eksperymentalnych
Populacja, a próba
opula ja róba grupa obserwa ji
opula ja
nioskowanie
róba
osowe próbkowanie
popula ji
nr obserwa ji e ha e ha e ha
, ,
, ,
, ,
, ,
, ,
, ,
, ,
, ,
bserwa je
o kład prawdopodobie stwa
n or a ja o ro kład ie
źródło: Górecki, T. Podstawy statystyki z przykładami w R, Wydawnictwo BTC, 2011.
Schematyczne przedstawienie procesu prowadzenia badań
Schematyczne przedstawienie procesu prowadzenia eksperymentu
nnik
nnik
ksper ent
ilka reali a ji pro esu w ra a h eksper entu
opula ja róbka
grupa obserwa ji opula ja
róbka
grupa obserwa ji
opula ja róbka
grupa obserwa ji
opula ja róbka
grupa obserwa ji
w nik eksper entu,
li estaw odpowied i
dla różn h wartoś i
nników
Przykład zbioru obserwacji z „prawdziwego życia” ;)
źródło: https://www.kaggle.com/goldenoakresearch/us-household-income-stats-geo-locations
Zbiór danych „US Household Income Statistics”, przygotowany oryginalnie na potrzeby badań nad rynkiem nieruchomości i inwestycji (32527 obserwacji)
Statystyczna analiza wyników eksperymentalnych
▪ Stałe – wartoś i wspólne dla ws stki h po skan h w eksper en ie obserwa ji, nie podlegają badanio , ale de dują o własnoś ia h popula ji np as badania lub określon biór osób na jakich przeprowadzono badanie)
▪ Zmienne – właś iwoś i, które różnią pos ególne jednostki stat st ne i podlegają obserwa ji
Podstawowe pojęcia – typy cech
Statystyczna analiza wyników eksperymentalnych
▪ Jakościowe – ęsto są to określenia słowne np płeć lub rod aj w kon wanego awodu Nie ożna i h e sobą porówn wać
▪ Ilościowe – właś iwoś i które są ożliwe do po iaru i które ożna porówn wać:
• Porządkowe – szeregują natężenie badanej właściwości przedstawionej w sposób opisowy (np. oceny studentów lub system ocen za pomocą gwiazdek w sklepie internetowym)
• Dyskretne (skokowe) – przyjmują skończony lub przeliczalny zbiór wartości na danej skali liczbowej, często jest to zbiór liczb całkowitych dodatnich (np. liczba samochodów przejeżdżających dziennie przez dany odcinek drogi). Nie mogą przyjmować wszystkich wartości bez względu na dokładność prowadzonego pomiaru
• Ciągłe – mogą przyjąć każdą wartość z określonego przedziału liczbowego [a,b], przy czym liczba miejsc dziesiętnych jest uzależniona od dokładności dokonywanych pomiarów.
Podstawowe pojęcia – typy zmiennych
Statystyczna analiza wyników eksperymentalnych
▪ Nominalna – u ożliwia jedynie klasyfikowanie pod w ględe mierzonej własnoś i, brak upor ądkowania, brak jednostki pomiaru,dotyczy tylko cech o charakterze jakoś iow , ożna jedyniestwierd ić, czy obiekty są równe czy są różne (np. płeć, kolor oczu),
▪ Porządkowa (rangowa) – u ożliwia upor ądkowanie pod w ględe mierzonej własnoś i (rangowanie), brak punktu zerowego i jednostkipomiaru, ożna porównać obiekty ze sobą na zasadziewięks / niejs , czy lepszy/gorszy, ale nie znamy „odległoś i” ięd pos ególn i stopniami (np. skala ocen, poziomw ks tał enia ,
Podstawowe pojęcia – typy skal pomiarowych
Statystyczna analiza wyników eksperymentalnych
▪ Przedziałowa – u ożliwia porówn wanie różni pod w ględe mierzonej wartoś i, określona jest arbitralnie jednostka pomiaru iumowne zero skali, ożna określić na ile dane wielkoś i się różnią.Nie da się natomiast opisać stosunku dwó h obiektów ze w ględu na ier oną e hę (np. poziom iśnienia akustycznego w dB – 60 dB niejest dwa razy więks e od 30 dB),
▪ Ilorazowa – U ożliwia określenie mierzonej własnoś i dla obiektu,podany jest jednoznacznie absolutny punkt zerowy i jednostkapomiaru. Jest to skala w której ożliwe jest porówn wanie jednostekza po o ą w ględn h charakterystyk na takiej zasadzie, że np. jedenobiekt jest dwa razy iężs od drugiego (np. masa w kilogramach,albo liczba kand datów pr jęta na dany kierunek na uczelni)
Podstawowe pojęcia – typy skal pomiarowych
Statystyczna analiza wyników eksperymentalnych
Zbiór obserwacji oże awierać bardzo wiele danych, każda z cech ożeposiadać wiele wartoś i po hod ą h z wielu różn h próbek.
Z tego w ględu powstał szereg sposobów na opisanie własnościstatystycznych wszystkich badanych cech za po o ą para etrów opojedynczej wartoś i.
r kłada i grup takich wartoś i są:
▪ miary tendencji centralnych (np. średnia arytmetyczna, mediana),
▪ miary rozproszenia iennoś i danych (np. ro stęp, wariancja,odchylenie standardowe, kwartyle),
▪ miary asymetrii (np. skośność ,
▪ miary koncentracji (np. kurtoza).
Opis własności cechy statystycznej
Statystyczna analiza wyników eksperymentalnych
Średnia arytmetyczna – wartość obliczana ze wzoru:
ҧ𝑥 =1
𝑁
𝑛=1
𝑁
𝑥[𝑛] ,
gdzie przez ҧ𝑥 rozumiemy wartość średniej arytmetycznej,
𝑁 stanowi li ebność prób ,
𝑛 stanowi indeks pojedynczej wartoś i cechy
𝑥[𝑛] po hod ą ej z kolejnych obserwacji pobranych z prób .
Opis własności cechy statystycznej – miary tendencji centralnych
Statystyczna analiza wyników eksperymentalnych
W przypadku gdy chcemy uśrednić kilka średnich składowych policzonych zkilku estawów obserwacji, średnia wynikowa staje się średnią ważoną:
ҧ𝑥𝑝 =
𝑖=1
𝑘
ҧ𝑥𝑖𝑁𝑖𝑁𝑝
, 𝑁𝑝=
𝑖=1
𝑘
𝑁𝑖 ,
gdzie ҧ𝑥𝑝 oznacza w nikową średnią ważoną,
𝑘 oznacza li bę populacji, dla któr h liczona jest średnia,
ҧ𝑥𝑖 to średnia składowa wyliczona dla każdej populacji,
𝑁𝑖 to li ebność prób , dla której policzona ostała każda ze średni h,
𝑁𝑝 to suma li ebnoś i wszystkich prób składow h.
Opis własności cechy statystycznej – miary tendencji centralnych
Statystyczna analiza wyników eksperymentalnych
Mediana – zwana też wartoś ią środkową, którą ożna obli ć dla szereguuporządkowanego. Jej spe jalną e hą jest to, że powyżej i poniżej niejznajduje się jednakowa liczba obserwacji (czyli dokładnie połowa).
Aby ją obli ć konieczne jest posortowanie obserwacji ze w ględu na w braną e hę, dla której mediana jest obliczana. Następnie dla nieparzystej liczbyobserwacji wybierana jest wartość w środku, a dla parzystej liczby obserwacjiobliczana jest średnia dwóch środkowych próbek, co ożna apisać teżwzorem:
𝑀𝑒 =
𝑥𝑁 + 1
2, dla 𝑁 nieparzystego
1
2𝑥𝑁
2+ 𝑥
𝑁 + 1
2, dla 𝑁 parzystego
Gdzie 𝑀𝑒 oznacza obli aną wartość mediany, 𝑥 to wartoś i cech obserwacjiuż wan h w obliczeniach, a 𝑁 to liczba obserwacji
Opis własności cechy statystycznej – miary tendencji centralnych
Statystyczna analiza wyników eksperymentalnych
Rozstęp – oznaczany przez 𝑅 , najprostsza miara będą a różni ą po ięd aks alną (𝑥𝑚𝑎𝑥), a ini alną (𝑥𝑚𝑖𝑛) wartoś ią cechy:
𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛.
Wariancja – oznaczana przez 𝑠2 i obliczana ze wzoru:
𝑠2 =1
𝑁
𝑖=1
𝑁
𝑥𝑖 − ҧ𝑥 2 ,
gdzie 𝑁 to liczba obserwacji dla któr h wariancja jest obliczana,
ҧ𝑥 to średnia cechy dla której obliczana jest wariancja,
a 𝑥𝑖 to 𝑖-ta wartość tej cechy.
Wariancja jest średnią wartoś ią cechy unormowanej i której wartoś i ostał podniesione do kwadratu.
Opis własności cechy statystycznej – miary rozproszenia (zmienności)
Statystyczna analiza wyników eksperymentalnych
Kwartyl dolny (pierwszy) – taka wartość, poniżej której znajduje się1
4wartoś i
obserwacji, a pow żej której najdują się3
4wartoś i, oznaczany przez 𝑄1.
Kwartyl górny (trzeci) – taka wartość, poniżej której najdują się3
4wartoś i
obserwacji, a pow żej której znajduje się1
4wartoś i, oznaczany przez 𝑄3.
Rozstęp międzykwartylowy (ang. interquartile range, IQR) – miara ro stępuobliczana poprzez odję ie wartoś i kwartyla górnego od wartoś i kwartyla dolnego,oznaczana jako IQR lub 𝑄:
IQR = 𝑄 = 𝑄3 − 𝑄1.
ielkość 𝑄/2 ęsto nazywana bywa odchyleniem ćwiartkow lub kwantylowym(ang. quartile deviation).
Opis własności cechy statystycznej – miary rozproszenia (zmienności)
Statystyczna analiza wyników eksperymentalnych
Opis własności cechy statystycznej – miary rozproszenia (zmienności)
ws stki h obserwa ji
e
ws stki h obserwa ji
ws stki h obserwa ji
Statystyczna analiza wyników eksperymentalnych
Skośność – oznaczana przez 𝐴𝑠 , pozwala na dodatkowe określenie tego, czywdanym ro kład ie w żs e prawdopodobie stwa w stąpienia danych wartoś ipr eważają wartoś i pow żej/poniżej średniej arytmetycznej
𝐴𝑠 =ҧ𝑥 − 𝐷
𝑠,
gdzie ҧ𝑥 oznacza średnią ar t et ną badanego iągu obserwacji,
𝑠 oznacza odchylenie standardowe obliczone na podstawie posiadanych obserwacji,
a 𝐷 oznacza do inantę odę , czyli naj ęś iej w stępują ą wartość tego ro kładu
Opis własności cechy statystycznej – skośność
Statystyczna analiza wyników eksperymentalnych
Opis własności cechy statystycznej – skośność
d str bu ja s etr na
średnia ar t et na
ediana
oda
d str bu ja dodatnią
skośnoś ią
oda średnia
ar t et na
ediana
d str bu ja uje ną
skośnoś ią
odaśrednia
ar t et na
ediana
średnia arytmetyczna = mediana = moda
moda < mediana < średnia arytmetycznaśrednia arytmetyczna < mediana < moda
Statystyczna analiza wyników eksperymentalnych
Kurtoza – oznaczana przez 𝐾 , oznacza, czy dany układ jest bardziej czy mniejskupiony wokół pojedynczej wartoś i niż ro kład Gaussa
𝐾 =
1𝑁σ𝑖=1𝑁 𝑥𝑖 − ҧ𝑥 4
𝑠4− 3,
gdzie 𝑁 to liczba obserwacji dla któr h wariancja jest obliczana,
ҧ𝑥 to średnia cechy dla której obliczana jest kurtoza,
𝑥𝑖 to 𝑖-ta wartość tej cechy,
a 𝑠4 to kwadrat wariancji tej cechy obliczony na podstawie posiadanych obserwacji.
Opis własności cechy statystycznej – kurtoza
Statystyczna analiza wyników eksperymentalnych
Opis własności cechy statystycznej – kurtoza
Rozkład o smukłości takiej jak rozkład Gaussa nazywamy rozkładem mezokurtycznym (K=0).Rozkład bardziej smukły od rozkładu Gaussa to rozkład leptokurtyczny (K>0), a mniej smukły to rozkład platokurtyczny (K<0).
ro kład e okurt n ,
ro kład leptokurt n ,
ro kład platokurt n ,
Statystyczna analiza wyników eksperymentalnych
nogość wskaźników, jakie opisują pos ególne cechy jest bardzo duża.Z tego w ględu powstał graficzne przedstawienia służą e np. do analizyznacznych biorów cech. r kłade takiego zobrazowania jest tzw.wykres pudełkow .
Na wykresie pudełkow w formie graficznej przedstawione sąnajważniejs e parametry danego iągu wartoś i takie jak:
▪ wartość ini alna i aks alna,
▪ położenie kwartyli dolnego i górnego,
▪ mediana,
▪ wartoś i odstają e
Istnieje także wariant wykresu pudełkowego, na któr naniesiona jestgraficzna prezentacja estymowanego ro kładu danej zmiennej. Nazywanyjest on wtedy wykresem skrzypcowym.
Wizualizacja danych – wykres pudełkowy i skrzypcowy
Statystyczna analiza wyników eksperymentalnych
Wizualizacja danych – wykres pudełkowy i skrzypcowy
obserwacja odstająca
wartość maksymalna
kwartyl górny (𝑄3)
kwartyl dolny (𝑄1)
mediana
wartość minimalna
nazwa cechy
Na wykresie pudełkowym naniesione opróczpodstawowych parametrów statystycznychnaniesione są także wartości maksymalne iminimalne znajdujące się w ciągu wartościpowiązanym z wizualizowaną cechą.Wąs obrazujący wartość maksymalną niemoże być jednak wyższy niż wartość progowa:
𝑄3 + 1,5 ⋅ 𝑄3 − 𝑄1A wąs wartości minimalnej nie może być niższy niż:
𝑄1 − 1,5 ⋅ 𝑄3 − 𝑄1Wartości poza tym zakresem uznawane są za tzw. wartości odstające.
Przykład wykresu pudełkowego na podstawie zbioru danych US Household Income
Przykład wykresu pudełkowego na podstawie zbioru danych US Household Income(kod w języku Python)
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
sns.set(style="whitegrid")
dataset = pd.read_excel("kaggle_income.xlsx")
sns.boxplot(x='State_Name',y='Median', data=dataset)
plt.xticks(rotation=90, size=14)
plt.yticks(size=15)
plt.xlabel('nazwa stanu', size=15)
plt.ylabel('mediana przychodu gospodarstw [USD]', size=15)
plt.subplots_adjust(bottom=0.3)
plt.show()
Przykład wykresu skrzypcowego na podstawie zbioru danych US Household Income
Przykład wykresu skrzypcowego na podstawie zbioru danych US Household Income(kod w języku Python)
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
sns.set(style="whitegrid")
dataset = pd.read_excel("kaggle_income.xlsx")
sns.violinplot(x='State_Name',y='Median', data=dataset, width=2.5)
plt.xticks(rotation=90, size=14)
plt.yticks(size=15)
plt.xlabel('nazwa stanu', size=15)
plt.ylabel('mediana przychodu gospodarstw [USD]', size=15)
plt.subplots_adjust(bottom=0.3)
plt.gca().set_ylim([0,None])
plt.show()
Statystyczna analiza wyników eksperymentalnych
Czasem zachodzi potrzeba ustalenia, w jakim przedziale wielkoś iznajduje się wartość zmierzona w eksperymencie.
Oszacowanie takie nazywane jest określenie tzw. przedziału ufności.
r ed iał u noś i, jest to zakres wartoś i w któr znajduje się pewnazmierzona wielkość z zadanym prawdopodobie stwe , np. 0,95. W takimprzypadku akłada , że prawdopodobie stwo tego, że naszeoszacowanie jest błędne wynosi 0,05.
ielkość tę nazywamy poziomem istotności (ang. significance level) i ęsto oznaczany jest gre ką literą 𝜶.
Testy statystyczne – przedziały ufności i poziom istotności statystycznej
Statystyczna analiza wyników eksperymentalnych
ęstą prakt ką jest obliczanie pr ed iałów u noś i dla średni h wartoś i jakiejśmierzonej wielkoś i.
Wpierw z szeregu 𝑁 o estymowanej wariancji 𝑠2 i odchylenia standardowego 𝑠obserwacji wyliczana jest wartość średnia ҧ𝑥.
r ed iał u noś i w takim przypadku dany jest wzorem:
ҧ𝑥 − 𝑡1−
𝛼2,𝑁−1
⋅𝑠
𝑁 − 1; ҧ𝑥 + 𝑡
1−𝛼2,𝑁−1
⋅𝑠
𝑁 − 1,
gdzie 𝑡1−
𝛼
2,𝑛−1
jest wartoś ią z pomocniczego ro kładu zmiennej 𝑡 odczytanej z
tablicy, lub pozyskanej z programu komputerowego przy zadanych wartoś ia h𝛼 i 𝑁.
Testy statystyczne – przedziały ufności i poziom istotności statystycznej
Statystyczna analiza wyników eksperymentalnych
Testy statystyczne – zmienna t
Jest to specjalna, unormowana zmienna ają a ro kład prawdopodobie stwaunormowanego ro kładu, któr jest wynikiem obserwacji populacji o rozkładzienormalnym za pomocą próby o 𝑵 obserwacjach. Fakt obserwacji objawia się ięd innymi konie noś ią liczenia estymaty odchylenia standardowego 𝑠, która astępuje nam „prawd iwą” wartość odchylenia o na aną przez 𝜎.
Wartość 𝑵 przy takiej obserwacji ęsto nazywa się liczbą stopni swobodyrozkładu.
Im mniejsza wartość 𝑵 , tym bardziej rozkład ten różni się od rozkładunormalnego.
Im wartość 𝑵 większa, tym bardziej ten rozkład przypomina rozkładnormalny. tąd, jeżeli wartość 𝑵 jest bardzo duża (zwyczajowo ówi się o 30obserwacjach), to ożna zamiast rozkładu i zmiennej 𝒕 stosować „ w kł ”rozkład Gaussa
Statystyczna analiza wyników eksperymentalnych
Testy statystyczne – zmienna t
Statystyczna analiza wyników eksperymentalnych
Testy statystyczne – zmienna t
−𝑡1−
𝛼2,𝑁−1
+𝑡1−
𝛼2,𝑁−1
,
prawdopodobie stwa
,
prawdopodobie stwa
,
prawdopodobie stwa
0
Przykład analizy za pomocą przedziałów ufności (𝛼 = 0.05) na podstawie zbioru danych US Household Income
Statystyczna analiza wyników eksperymentalnych
drębn zagadnieniem jest możliwość wyciągania wniosków napodstawie danych zebranych w eksperymencie. Na pr kład oże b ćto w iągnię ie wniosku, że średni pr hód gospodarstwa domowego wstanie X jest więks niż w stanie Y.
Do tego celu konieczne jest przeprowadzenie testu statystycznego.Konstrukcja tego typu testów polega na dwó h podstawowych poję ia h:
Hipotezie zerowej (ang. null hypothesis) – oznaczanej przez 𝐻0 i któraoznacza hipote ę sprawd aną w teś ie statystycznym,
Hipotezie alternatywnej (ang. alternative hypothesis) – oznaczanejprzez 𝐻1, która oznacza dowolną hipote ę inną niż hipoteza zerowa
Testy statystyczne – hipotezy statystyczne
Statystyczna analiza wyników eksperymentalnych
Jednym z najprostszych testów statystycznych jest test t-Studenta.Pozwala on na sprawdzenie, czy wartość średnia danego ciągu jestrówną wielkości 𝝁𝟎.
Test ten akłada, że populacja z której pozyskiwane są obserwacjema rozkład Gaussa.
Hipoteza zerowa akłada, że iąg ma wartość średnią równą 𝜇0, czyli:𝐻0: 𝜇 = 𝜇0
Hipoteza alternatywna oże ieć różną postać:
Testy statystyczne – test t-Studenta
𝐻1: 𝜇 = 𝜇1 < 𝜇0 , tzw. hipoteza lewostronna
𝐻1: 𝜇 = 𝜇1 > 𝜇0 , tzw. hipoteza prawostronna
𝐻1: 𝜇 = 𝜇1 ≠ 𝜇0 , tzw. hipoteza dwustronna
Statystyczna analiza wyników eksperymentalnych
Statystyka testowa ma postać:
𝑡 =ҧ𝑥 − 𝜇0𝑠
𝑁 − 1,
gdzie ҧ𝑥 to wartość średnia iągu obserwacji,
𝜇0 to wartość średnia akładana przez hipote ę erową,
𝑠 to estymowana ze zbioru obserwacji wartość odchylenia standardowego
𝑁 to liczba obserwacji, na podstawie której dokonywane są obliczenia.
Obliczona wartość t jest porówn wana z ro kłade wzorcowym zmiennej𝑡 . Jeżeli wartość statystyki znajduje się w obszarze odrzucenia, toPrzyjmowana jest hipoteza alternatywna. Jeśli wartość ta nie znajdzie sięw tym obszarze – w mocy pozostaje hipoteza zerowa
Testy statystyczne – test t-Studenta
Statystyczna analiza wyników eksperymentalnych
Hipoteza alternatywna 𝐻1 jest przyjmowana:
▪ W przypadku hipotezy lewostronnej, jeżeli wartość statystyki 𝑡 będ iemniejsza niż wartość progowa −𝑡1−𝜶,𝑁−1 ,
▪ W przypadku hipotezy prawostronnej, jeżeli wartość statystyki 𝑡 będ iemniejsza niż wartość progowa 𝑡1−𝜶,𝑁−1 ,
▪ W przypadku hipotezy dwustronnej, jeżeli wartość statystyki 𝑡 będ iemniejsza niż wartość progowa -𝑡
1−𝛼
2,𝑁−1
, lub więks a niż wartość
progowa 𝑡1−
𝛼
2,𝑁−1
Testy statystyczne – test t-Studenta
Statystyczna analiza wyników eksperymentalnych
Testy statystyczne – test t-Studenta
obszary odrzucenia w teście dwustronnym
𝑡1−
𝛼2,𝑁−1
−𝑡1−
𝛼2,𝑁−1
,
prawdopodobie stwa
,
prawdopodobie stwa
obs ar odr u enia
,
prawdopodobie stwa
obs ar odr u enia
Statystyczna analiza wyników eksperymentalnych
Testy statystyczne – test t-Studenta
obszar odrzucenia w teście lewostronnym
−𝑡1−𝛼,𝑁−1
,
prawdopodobie stwa
,
prawdopodobie stwa
obs ar odr u enia
Statystyczna analiza wyników eksperymentalnych
Testy statystyczne – test t-Studenta
obszar odrzucenia w teście prawostronnym
𝑡1−𝛼,𝑁−1
,
prawdopodobie stwa ,
prawdopodobie stwa
obs ar odr u enia
Statystyczna analiza wyników eksperymentalnych
Czasem zamiast podawać wynik w postaci stwierdzenia faktu, żeodrzucono hipote ę erową, podaje się tzw. p-wartość.
Jest to najmniejszy poziom istotności, któr prowadzi do odrzuceniahipotezy zerowej. Pozwala to na pozbycie się problemu arbitralnegodoboru poziomu istotności, któr zwyczajowo przyjmowany jest jako0,05.
Poprzez podanie p-wartoś i każd oże do danych w ników stosowaćkryterium w postaci swojego własnego progu istotnoś i.
Testy statystyczne – p-wartość
Statystyczna analiza wyników eksperymentalnych
Testy statystyczne – p-wartość
,
prawdopodobie stwa ,
prawdopodobie stwa
obs ar wią an
p wartoś ią np
obli ona wartość
Ilustracja p-wartości dla hipotezy prawostronnej
Statystyczna analiza wyników eksperymentalnych
ażd test stat st n wiąże się ożliwoś ią popełnienia błędu, w różnia się dwa t p błędów:
▪ Błąd 1. rodzaju, gdy hipoteza zerowa została odrzucona pomimo tego,że jest ona prawdziwa. Jest on tym mniej prawdopodobny im niższajest wartość poziomu istotności 𝜶. Wartość poziomu istotności jestprawdopodobieństwem popełnienia błędu 1. rodzaju.
▪ Błąd 2. rodzaju, gdy hipoteza zerowa nie została odrzucona pomimotego, że jest ona fałszywa. Im mniejsze prawdopodobie stwo tego błędutym więks a jest tak zwana moc testu statystycznego.
Przy wyborze testu statystycznego należy wybierać taki test, którywartość 𝜶 i zapewnia maksymalną moc.
Testy statystyczne – rodzaje błędów
Na całe szczęście, prawda nie została podzielona przez matematyków na dwa odrębne rodzaje…
źródło: [email protected]
Statystyczna analiza wyników eksperymentalnych
Testy statystyczne – problem wielokrotnego testowania
Jeżeli wykonujemy zestaw trzech testów, to efektywne prawdopodobieństwo popełnienia błędu 1. rodzaju wynosi nie 𝛼, tylko 1 − 1 − 𝛼 3, co dla 𝜶 = 𝟎, 𝟎𝟓 daje efektywną wartość prawdopodobieństwa pomyłki równą aż 0,14.
Prawdopodobieństwo popełnienia błędu 1. rodzaju w takim przypadku jest prawie 3 razy większe niż w przypadku pojedynczego testu!
porównanie 2 (prawdopodobieństwo błędu równe 𝛼)
porównanie 3 (prawdopodobieństw
o błędu równe 𝛼)
porównanie 1 (prawdopodobieństw
o błędu równe 𝛼)
Zmienna A
Zmienna BZmienna C
Statystyczna analiza wyników eksperymentalnych
Aby pr e iwd iałać problemowi wielokrotnego testowania ożna astosować tzw. poprawkę na wielokrotne testowanie, np. poprawkęBonferroniego, która polega na pr ję iu faktycznego poziomu istotnoś irównego
𝛼𝑒𝑓𝑓 =𝛼
𝑘,
gdzie 𝛼 to poziom istotnoś i ałego zestawu bada , k to liczba testówwykonanych w ramach zestawu bada , a 𝛼𝑒𝑓𝑓 to efektywny poziomistotnoś i, jaki jest stosowany do pos ególn h testów składow h.
Dla testowania gdzie podawane są p-wartości poprawka ta polega poprostu na przemnożeniu podanych p-wartości przez 𝒌, co odpowiadaoperacji dzielenia zaproponowanej dla podejścia z wykorzystaniem𝜶𝒆𝒇𝒇.
ostępne są także inne poprawki, np. poprawka Holma-Bonferonniego.
Testy statystyczne – poprawki na wielokrotne testowanie
Statystyczna analiza wyników eksperymentalnych
Innym podejściem do wykonywania wielu testów na raz, na pr kładporówn wania ze sobą wielu estymowanych średni h jest zastosowaniespecjalnych testów wykonujących jednoczesne porównanie, np.testu ANOVA (Analysis of Variance).
Dostarczana przez nie p-wartość pozwala na zweryfikowanie hipotezy,czy którakolwiek z k średnich różni się od którejkolwiek zpozostałych.
b dowied ieć się, która para średnich jest parą różnią ą się konie ne jest wykorzystanie testu specjalnie przystosowanego do wielokrotnego testowania, tzw. testu post-hoc.
ęst teste post-ho w kor st wan po teś ie N V jest test HSD Tukeya.
Dodatkowo, ANOVA zakłada, że wariancje wszystkich analizowanych zmiennych są równe, co wymaga uprzednio wykonania dodatkowego testu na równość wariancji – testu Levene’a lub Browna-Forsythe’a.
Testy statystyczne - ANOVA
Statystyczna analiza wyników eksperymentalnych
Testy statystyczne – ANOVA (zasada działania)
grupa
𝑆12
𝑆22
𝑆32
𝑆1232
𝑆12 - wariancja grupy 1.
𝑆22 - wariancja grupy 2.
𝑆32 - wariancja grupy 3.
𝑆1232 - wariancja zbiorcza
sumy grup 1.-3.
Statystyczna analiza wyników eksperymentalnych
Czasem nie jest możliwe spełnienie założeń przyjmowanych dozastosowania określon h testów statystycznych, na pr kład ro kładuGaussa dla testu t-Studenta, czy równoś i wariancji dla testu ANOVA. Otestach przyjmujących tego typu dodatkowe założenia mówimy, żesą to testy parametryczne.
W takim wypadku konieczne jest posłużenie się tzw. testaminieparametrycznymi. Testy te skonstruowane są w oparciu omniejszą liczbę założeń (aczkolwiek nie są ich pozbawione), zwyklemają tez mniejszą moc.
Testy statystyczne – testy parametryczne i nieparametryczne
Statystyczna analiza wyników eksperymentalnych
ęst nieparametrycznym odpowiednikiem dla testu t-Studenta jesttest kolejności par Wilcoxona.
Podobnie dla testu ANOVA jego nieparametrycznym odpowiednikiemjest test Kruskala-Wallisa. Odpowiednikiem testu post-hoc HSD Tukeyaw przypadku testu Kruskala-Wallisa jest test post-hoc Dunn.
Testy statystyczne – testy parametryczne i nieparametryczne
Statystyczna analiza wyników eksperymentalnych
stnieje wiele inn h testów stat st n h dostosowan h do konkretn h potr eb, na pr kład:
▪ Test na godność ro kładów dwó h iągów,
▪ Test na równość warian ji dwó h iągów,
▪ Test oł ogorowa-Smirnova do stwierd enia dan iąg wartoś i a ro kład nor aln ,
… i wiele inn h, które ożna dobierać do danego astosowania według konkretnego zapotrzebowania.
Testy statystyczne – inne rodzaje testów statystycznych
Statystyczna analiza wyników eksperymentalnych
Dziękuję za uwagę!