podstawy statystyki medycznej - jagiellonian university · 2018-09-24 · podstawy statystyki...

24
Podstawy statystyki medycznej Laboratorium Zajęcia 5 – wprowadzenie do programu Statistica Program STATISTICA uruchamia się klikając na przycisk Start w systemie Windows, a następnie na pozycję STATISTICA dostępną w menu Programy. Po uruchomieniu programu na ekranie pojawia się okno aplikacji podobne do tego z Rys. 1. Rys. 1. Okno programu STATISTICA. Poszczególne opcje programu uruchamia się z tzw. wstążki Rys. 2. Rys. 2. Wstążka – opcje dostępne na karcie Statystyka Tworzenie nowego dokumentu 1. Na karcie wstążki Podstawowe kliknij górną część przycisku polecenia Nowy umieszczonego w grupie Plik. Na ekranie pojawi się okno Utwórz nowy dokument (Rys. 3). Dla naszych potrzeb utworzymy na początku tabelę z Rys. 4. W tym celu na karcie Arkusz zmieniamy wartość w polu Liczba przypadków z 10 na 15. Resztę ustawień należy pozostawić bez zmian i kliknąć OK. Zostanie utworzony nowy arkusz danych. Korzystając z polecenia Zapisz jako dostępnego pod dolną częścią przycisku Zapisz

Upload: others

Post on 03-Jul-2020

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Podstawy statystyki medycznej - Jagiellonian University · 2018-09-24 · Podstawy statystyki medycznej Laboratorium Zajęcia 5 – wprowadzenie do programu Statistica Program STATISTICA

Podstawy statystyki medycznejLaboratorium

Zajęcia 5 – wprowadzenie do programu Statistica

Program STATISTICA uruchamia się klikając na przycisk Start w systemie Windows, a następnie na pozycję STATISTICA dostępną w menu Programy. Po uruchomieniu programu na ekranie pojawia się okno aplikacji podobne do tego z Rys. 1.

Rys. 1. Okno programu STATISTICA.

Poszczególne opcje programu uruchamia się z tzw. wstążki Rys. 2.

Rys. 2. Wstążka – opcje dostępne na karcie Statystyka

Tworzenie nowego dokumentu1. Na karcie wstążki Podstawowe kliknij górną część przycisku polecenia Nowy

umieszczonego w grupie Plik. Na ekranie pojawi się okno Utwórz nowy dokument (Rys. 3).Dla naszych potrzeb utworzymy na początku tabelę z Rys. 4. W tym celu na karcie Arkusz zmieniamy wartość w polu Liczba przypadków z 10 na 15. Resztę ustawień należy pozostawić bez zmian i kliknąć OK. Zostanie utworzony nowy arkusz danych. Korzystając z polecenia Zapisz jako dostępnego pod dolną częścią przycisku Zapisz

Page 2: Podstawy statystyki medycznej - Jagiellonian University · 2018-09-24 · Podstawy statystyki medycznej Laboratorium Zajęcia 5 – wprowadzenie do programu Statistica Program STATISTICA

umieszczonego w grupie Plik na karcie wstążki Podstawowe nadajemy dokumentowi nazwę Przyklad_1.sta.

Rys. 3. Opcje dostępne na karcie Arkusz w oknie Utwórz nowy dokument.

Nazwisko i imię Płeć Wzrost WagaNowak Jerzy 2 174 79Kowal Anna 1 169 77Rózga Jan 2 179 69Sala Ewa 1 170 70Róg Edyta 1 156 55Bodo Kamil 2 184 74Dyra Andrzej 2 176 96Malak Ewa 1 171 57Car Magda 1 182 94Wilk Jan 2 178 71Bendo Ola 1 162 62Bik Kasia 1 171 83Bora Piotr 2 180 81Lis Elwira 1 175 61Madziar Anna 1 167 54

Rys. 4. Dane do przykładu 1.

Page 3: Podstawy statystyki medycznej - Jagiellonian University · 2018-09-24 · Podstawy statystyki medycznej Laboratorium Zajęcia 5 – wprowadzenie do programu Statistica Program STATISTICA

2. Wprowadzanie danych do arkusza rozpoczniemy od wprowadzenia nazw przypadków. W tym celu klikamy dwukrotnie lewym przyciskiem myszy w pierwszej od góry komórce, umieszczonej w pierwszej z lewej strony kolumnie arkusza. Następnie kolejno wpisujemy nazwiska i imiona osób. Po wpisaniu nazwiska i imienia naciskamy przycisk ENTER przechodząc do następnego wiersza.

3. Po wpisaniu wszystkich nazwisk i imion pierwszej zmiennej w pliku nadajemy nazwę Płeć. W tym celu klikamy dwukrotnie lewym klawiszem myszy w obrębie nagłówka zmiennej Zmn1. Pojawi się okno jak na Rys. 5. W polu Nazwa należy wprowadzić nazwę zmiennej (należy wpisać Plec – w zależności od ustawień programu STATISTICA może nie być możliwości wprowadzania polskich liter w nazwie zmiennej).

Rys. 5. Okno specyfikacji zmiennej Płeć.

4. Po wprowadzeniu nazwy zmiennej Płeć w kolumnie o tej nazwie wprowadzamy kody liczbowe, za pomocą których zostaną oznaczone kategorie występujące dla zmiennej Płeć. Założymy, że dla kobiet wprowadzimy kod 1, a dla mężczyzn kod 2. Po wprowadzeniu kodów liczbowych przypiszemy im etykiety tekstowe. W tym celu klikamy dwukrotnie na nagłówku zmiennej Płeć, a następnie wybieramy przycisk Etykiety tekstowe. Na ekranie pojawi się okno Edytor etykiet tekstowych [Płeć]. Aby przypisać etykiety tekstowe wprowadzonym wcześniej kodom liczbowym w pierwszym wierszu kolumny Etykieta tekstowa wprowadzamy tekst Kobieta i przypisujemy mu (w kolumnie Liczbowe) kod liczbowy 1. Podobnie w komórce znajdującej się w drugim wierszu wprowadzamy tekst Mężczyzna i przypisujemy mu kod liczbowy 2.

5. W następnych krokach wprowadzamy nazwy i wartości dla kolejnych dwóch zmiennych Wzrost i Waga.

Page 4: Podstawy statystyki medycznej - Jagiellonian University · 2018-09-24 · Podstawy statystyki medycznej Laboratorium Zajęcia 5 – wprowadzenie do programu Statistica Program STATISTICA

6. Utwórz w 4 kolumnie (Zmn4) nową zmienną WBC wg formuły: wzrost-waga-100. Formułę należy wpisać w polu Długa nazwa (etykieta lub formuła) okna specyfikacji zmiennej, jak to pokazano na Rys. 6.

Rys. 6. Okno specyfikacji zmiennej WBC z formułą.

7. W tym kroku przekształcimy zmienną ilościową na zmienną typu jakościowego (kategoryzacja). W tym celu utworzymy zmienną WBC_kat, w której umieścimy kody liczbowe (1, 2 lub 3) w sposób umowny określające kategorie proporcji wagowo-wzrostowych. Z wstążki wybierz kolejno polecenia Dane/Przekoduj. Na ekranie pojawi się okno Przekoduj wartości zmiennej 5: WBC_kat. W kolejnych polach należy wprowadzić formuły definiujące proponowane kategorie. przedstawia wygląd okna po wprowadzeniu odpowiednich formuł.

8. Utworzonym kategoriom nadaj etykiety tekstowe wg następującego szablonu: 1- Nadwaga, 2 – Norma, 3 – Niedowaga. Sposób nadawania etykiet tekstowych został pokazany w punkcie 4.

Page 5: Podstawy statystyki medycznej - Jagiellonian University · 2018-09-24 · Podstawy statystyki medycznej Laboratorium Zajęcia 5 – wprowadzenie do programu Statistica Program STATISTICA

Rys. 7. Okno Przekoduj wartości zmiennej5: WBC_kat z wprowadzonymi formułami.

Import przykładowego zbioru z innej aplikacjiW przykładzie zostanie zaimportowany zbiór danych Zapotrzebowanie I 2013.xls, który został przygotowany w programie Excel. Zbiór przedstawia zapotrzebowanie na energię elektryczną liczoną w MW w pewnym mieście.

1. Kliknij przycisk Otwórz na karcie Podstawowe w grupie Plik. W oknie Otwórz, które pojawi się na ekranie wskaż folder zawierający importowany plik. W wybranym folderze pojawi się m.in. nazwa pliku Zapotrzebowanie I 2013.xls. Zaznacz ją i kliknij przycisk Otwórz.

Program rozpocznie operację importu pliku. Na ekranie pojawi się okno Otwierany plik: Zapotrzebowanie I 2013.xls. ()

Rys. 8. Okno Otwierany plik.

2. Kliknij przycisk Import wybranego arkusza. Pojawi się okno Wybierz arkusz do importu, w którym można wybrać arkusz, gdzie znajdują się dane. Zaznacz Arkusz 1. Na ekranie

Page 6: Podstawy statystyki medycznej - Jagiellonian University · 2018-09-24 · Podstawy statystyki medycznej Laboratorium Zajęcia 5 – wprowadzenie do programu Statistica Program STATISTICA

pojawi się okno Otwórz plik Excel (Rys. 9). Znajduje się w nim informacja o zakresie importowanych danych. W oknie zaznacz pole wyboru Weź nazwy z 1 wiersza (dzięki temu zaimportowany plik będzie posiadał odpowiednie nazwy zmiennych).

Rys. 9. Wygląd okna Otwórz plik Excel.

3. Kliknij OK, co kończy proces importowania pliku. Po zaimportowaniu pliku (z domyślną nazwą taką jak oryginalny plik oraz z rozszerzeniem sta) czasami zachodzi konieczność dostosowania wyglądu tabeli. W tym celu należy zaznaczyć wszystkie zmienne i kliknąć prawy przycisk myszy. Z menu podręcznego, które pojawi się na ekranie wybierz opcję Format, a następnie Automatyczne dopasowanie. Po tej modyfikacji plik wygląda tak jak na Rys. 10.

Rys. 10. Wygląd arkusza po operacji importowania

Page 7: Podstawy statystyki medycznej - Jagiellonian University · 2018-09-24 · Podstawy statystyki medycznej Laboratorium Zajęcia 5 – wprowadzenie do programu Statistica Program STATISTICA

Sprawdzanie poprawności danych

Zaimportowane dane mogą zawierać pewne błędy np. wartości danych mogą „odstawać” tzn. wykraczać poza dopuszczalny zakres. Przykładowo jeżeli tabela zawiera zmienną wzrost człowieka, to nie jest możliwe, aby były tam wartości powyżej 3m. Program Statistica zawiera narzędzia pozwalające na sprawdzanie poprawności danych. Aby skorzystać z tych narzędzi należy najpierw określić zakres wartości sprawdzanej zmiennej. Z reguły osoba przeprowadzająca analizę zna zakres zmiennych. Jeżeli tak nie jest to można spróbować zidentyfikować ten zakres.

1. W tym punkcie ćwiczenia zostanie sprawdzona poprawność danych zawartych w zmiennej Zapotrzebowanie. W tym celu kliknij dwukrotnie w nagłówku zmiennej Zapotrzebowanie i w oknie, które się pojawi kliknij przycisk Wartości, statystyki. Spowoduje to pojawienie się okna pokazującego wartości sprawdzanej zmiennej posortowane od najmniejszej do największej. Dzięki temu można sprawdzić, czy w obrębie zmiennej nie występują odstające wartości. Zanotuj na kartce lub w pamięci prawidłowy zakres danych, następnie kliknij przycisk Anuluj i jeszcze raz Anuluj.

2. Po ustaleniu zakresu wartości sprawdzanej zmiennej kliknij przycisk Dane na wstążce i w grupie Operacje na arkuszach kliknij przycisk Sprawdź. Na ekranie pojawi się okno Sprawdzanie danych. W oknie tym można wprowadzać określone warunki służące do sprawdzania poprawności danych. Dla naszego przykładu można przyjąć, że jako niepoprawne będziemy traktować przypadki, dla których zapotrzebowanie będzie wykraczać poza przedział od 300 do 700 MW. A zatem w polu Warunek 1 najpierw w polu listy wybierz polecenie Niepoprawne jeśli, a następnie wprowadź warunek o postaci:

v4<300 or v4>700

W polu Zakres ustal zakres przypadków od przypadku 1 do przypadku 744. Po wykonaniu czynności z tego punktu okno Sprawdzanie danych powinno wyglądać jak na Rys. 11.

Page 8: Podstawy statystyki medycznej - Jagiellonian University · 2018-09-24 · Podstawy statystyki medycznej Laboratorium Zajęcia 5 – wprowadzenie do programu Statistica Program STATISTICA

Rys. 11. Okno Sprawdzanie danych z wprowadzonymi warunkami

3. Mamy teraz możliwość sprawdzenia czy przypadki zawarte w pliku danych spełniają podany warunek. W celu rozpoczęcia sprawdzania poprawności danych kliknij Znajdź pierwszy. Zostanie podświetlony pierwszy przypadek, który nie spełnia podanych kryteriów. Naciskaj Kombinację klawiszy CTRL+F3 aby interaktywnie kontynuować sprawdzanie danych.

4. Wywołaj jeszcze raz okno sprawdzanie danych w sposób podany w kroku 2. Tym razem użyj przycisku Podświetl niepoprawne w celu podświetlenia wszystkich przypadków nie spełniających naszych warunków. Zmień kolor podświetlonych przypadków na niebieski, a czcionkę na pogrubioną w oknie Edytuj układ arkusza: Podświetlone komórki, do którego uzyskuje się dostęp korzystając z opcji menu Narzędzia/Podświetlanie komórek/Edytuj układ Podświetlone komórki.

5. Istnieje również możliwość utworzenia podzbioru przypadków spełniających podane przez użytkownika warunki w osobnym arkuszu. W celu utworzenia podzbioru dodaj w arkuszu danych zmienną o nazwie Lp. W oknie specyfikacji tej zmiennej w polu Długa nazwa (etykieta lub formuła z funkcją) wprowadź formułę =v0, która spowoduje wstawienie nr przypadków.

6. W celu utworzenia podzbioru na karcie Dane wybierz polecenie Podzbiór. Na ekranie pojawi się okno Utwórz podzbiór. W oknie tym kliknij przycisk Zmienne i wybierz wszystkie zmienne dla tworzonego podzbioru w tym celu w oknie Wybierz zmienne kliknij przycisk Wszystkie i kliknij OK. Następnie kliknij przycisk Przypadki. Na ekranie pojawi się okno Warunki selekcji przypadków. Zaznacz pole Włącz warunki selekcji i w polu Włącz przypadki zaznacz przycisk Określone przez, a następnie w polu Wyrażenie: wpisz warunek:

v4<300 or v4 >700

Page 9: Podstawy statystyki medycznej - Jagiellonian University · 2018-09-24 · Podstawy statystyki medycznej Laboratorium Zajęcia 5 – wprowadzenie do programu Statistica Program STATISTICA

7. W nowym arkuszu zostaną umieszczone nieprawidłowe przypadki. Na Rys. 12 przedstawiono ten arkusz. Dzięki temu, że wcześniej została dodana zmienna Lp można łatwo zidentyfikować przypadki w wyjściowym arkuszu danych.

Rys. 12. Arkusz zawierający niepoprawne dane

Podstawowe narzędzia analizy danychTen przykład prezentuje najważniejsze metody analizy danych w programi STATISTICA.1. Otwórz plik Zawaly.sta zawierający informacje o wybranych parametrach

biochemicznych i klinicznych, które zebrano wśród pacjentów z chorobą niedokrwienną serca. Naszym zadaniem jest utworzenie zestawienie liczby i odsetka kobiet i mężczyzn, u których stwierdzono różne rodzaje zawałów serca. Zestawienia tego typu nazywa się tabelami dwudzielczymi. Zaobserwowane prawidłowości zostaną zilustrowane wykresami.

Rys. 13. Okno Statystyki podstawowe i tabele

Page 10: Podstawy statystyki medycznej - Jagiellonian University · 2018-09-24 · Podstawy statystyki medycznej Laboratorium Zajęcia 5 – wprowadzenie do programu Statistica Program STATISTICA

Rys. 14. Okno definiowania Tabele wielodzielcze.

2. W celu sporządzenia tabeli dwudzielczej na karcie Statystyka kliknij przycisk Statystyki podstawowe. Na ekranie pojawi się okno Statystyki podstawowe i tabele: Zawały.sta (Rys. 13). W oknie tym wybierz pozycję tabele wielodzielcze. Po kliknięciu przycisku OK program przejdzie do okna definiowania analizy Tabele wielodzielcze: Zawały, które zamieszczono na Rys. 14.

3. Na oknie z Rys. 14 kliknij przycisk Określ tabele (wybierz zmienne). W kolejnym oknie jakie się pojawi wybierz zmienne do analizy. Na liście Lista1 zaznacz zmienną Płeć, a na liście Lista2 zmienną Rodzaj zawału. Następnie naciśnij przycisk OK oraz ponownie OK. Po chwili pojawi się okno Wyniki tabelaryzacji: Zawały, które umożliwia wybranie całego szeregu wyników analizy w postaci tabel i wykresów. Dostępne opcje zostały rozmieszczone na kartach. Przejdź na kartę Opcje i odznacz pole wyboru Podświetl liczności > 10 (opcja ta jest wykorzystywana w przypadku przeprowadzania testu chi-kwadrat. Następnie przejdź na kartę Więcej i kliknij przycisk Dokładne tabele dwudzielcze. Na ekranie pojawi się okno kolejnego dokumentu programu STATISTICA, a mianowicie skoroszytu, który zawiera arkusz z wynikami analizy Rys. 15.

Rys. 15. Okno skoroszytu z arkuszem zawierającym tabelę dwudzielczą.

Na podstawie otrzymanych wyników można porównać liczby pacjentów, u których stwierdzono występowanie zawałów określonego rodzaju (pomiędzy badanymi kobietami i mężczyznami).

4. Na podstawie otrzymanej tabeli dwudzielczej można utworzyć wykres. W tym celu naciśnij kombinację klawiszy CTRL+R przez co zostanie przywołane okno Wyniki tabelaryzacji: Zawały.sta oraz kliknij przycisk Wykresy interakcji liczności. Na ekranie pojawi się wykres zamieszczony na Rys. 16.

Page 11: Podstawy statystyki medycznej - Jagiellonian University · 2018-09-24 · Podstawy statystyki medycznej Laboratorium Zajęcia 5 – wprowadzenie do programu Statistica Program STATISTICA

Rys. 16. Okno skoroszytu z aktywnym wykresem

5. Wygląd wykresu można dostosować do naszych wymagań, aby to zrobić kliknij dwukrotnie lewym klawiszem myszy w obrębie wykresu.

Rys. 17. Okno opcje wykresu z aktywną kartą Okno

Page 12: Podstawy statystyki medycznej - Jagiellonian University · 2018-09-24 · Podstawy statystyki medycznej Laboratorium Zajęcia 5 – wprowadzenie do programu Statistica Program STATISTICA

Pojawi się okno jak na Rys. 17. Przejdź dla przykładu na kartę Wykres właściwy/Etykiety punktów i zaznacz pole wyboru Wyświetl etykiety punktów, a następnie usuń zaznaczenie pola wyboru Pokaż etykiety tekstowe i w zamian za to zaznacz pole wyboru Współrzędne Y. Tych samych modyfikacji dokonaj po wybraniu w polu Wykres właściwy opcji 2: Płeć Mężczyzna. Zmień także odpowiednio opisy zawarte w legendzie wykresu. Po zaakceptowaniu zmian kliknięciem przycisku OK. zmodyfikowany wykres powinien wyglądać tak jak na Rys. 18.

Rys. 18. Okno skoroszytu z aktywnym wykresem po modyfikacjach.

6. Utwórz tablicę dwudzielczą zawierającą odsetki kobiet i mężczyzn w zależności od rodzaju zawału. W tym celu naciśnij kombinację klawiszy CTRL+R przywołując okno Wyniki tabelaryzacji: Zawały i przejdź na kartę Opcje. Aby uwzględnić relatywne liczebności badanych pacjentów obydwu płci zaznacz pole wyboru Procenty w wierszach. Następnie wróć na kartę Więcej i kliknij przycisk Dokładne tabele dwudzielcze. Arkusz z wynikami zamieszczono na Rys. 19..

Rys. 19. Okno skoroszytu z aktywnym arkuszem wyników

Page 13: Podstawy statystyki medycznej - Jagiellonian University · 2018-09-24 · Podstawy statystyki medycznej Laboratorium Zajęcia 5 – wprowadzenie do programu Statistica Program STATISTICA

Elementy opisowej analizy danych

Po sprawdzeniu poprawności danych i ewentualnym wyliczeniu dodatkowych zmiennych można przystąpić do opracowania zebranych danych. Z reguły taką analizę rozpoczyna się od tabelarycznej i graficznej prezentacji empirycznych rozkładów badanych zmiennych. Następnie można wyliczyć charakterystyki liczbowe zmiennych zgodnie z regułami statystyki opisowej.

Badanie empirycznego rozkładu zmiennej jakościowej

W tym punkcie zostanie przedstawiony sposób wyznaczenia empirycznego rozkładu zmiennej jakościowej w postaci tabelarycznej i graficznej. W tym celu otwórz plik Analiza płac.sta.

1. Na początek utworzymy szereg rozdzielczy dla jakościowej zmiennej Wykszałcenie. W tym celu na karcie wstążki Statystyka kliknij przycisk Statystyki podstawowe umieszczony w grupie Podstawowe. Następnie w oknie, które pojawi się na ekranie wybierz pozycję Tabele liczności. Pojawi się okno jak na Rys. 20.

Rys. 20. Widok okna Tabele liczności: Analiza_plac.sta.

2. W oknie z Rys. 20 kliknij przycisk Zmienne i w oknie Wybierz zmienne wskaż zmienną Wykształcenie. Następnie przejdź na kartę Więcej i kliknij przycisk Podsumowanie:. W przypadku zmiennych jakościowych rozkład empiryczny określa się bardzo prosto podając wartości badanych zmiennych i odpowiadające im liczności, liczności procentowe oraz liczności skumulowane i liczności skumulowane procentowe. Na Rys. 21 pokazano Skoroszyt z tabelą liczności dla zmiennej Wykształcenie.

Page 14: Podstawy statystyki medycznej - Jagiellonian University · 2018-09-24 · Podstawy statystyki medycznej Laboratorium Zajęcia 5 – wprowadzenie do programu Statistica Program STATISTICA

Rys. 21. Tabela liczności dla zmiennej Wykształcenie.

3. Kontynuuj analizę klikając lewym przyciskiem myszy na ikonę Tabele liczności: Ana … umieszczoną na pasku Analizy w dolnej części okna aplikacji. Na ekranie ponownie pojawi się okno Tabele liczności: Analiza płac.sta. Zostanie teraz utworzony histogram rozkładu dla zmiennej Wykształcenie, który jest graficznym odpowiednikiem szeregu rozdzielczego. W tym celu kliknij na przycisk Histogramy.

4. Po utworzeniu wykresu zmień jego domyślny tytuł na: Histogram rozkładu zmiennej Wykształcenie poprzez dwukrotne kliknięcie lewym przyciskiem myszy na tytule wykresu i wpisaniu odpowiedniego tytułu. Zmniejsz również szerokość słupków na 0,75 tak, aby pomiędzy słupkami występowały odstępy (w ten sposób powszechnie przedstawia się histogramy dla zmiennych jakościowych). Aby zmniejszyć szerokość słupków kliknij prawym klawiszem myszy na dowolny słupek i w menu podręcznym wybierz Opcje słupka, a następnie w polu Szerokość wpisz wartość 0,75. Po wykonaniu opisanych wyżej czynności wykres powinien wyglądać jak na Rys. 22.

Rys. 22. Histogram rozkładu empirycznego dla zmiennej Wykształcenie.

Page 15: Podstawy statystyki medycznej - Jagiellonian University · 2018-09-24 · Podstawy statystyki medycznej Laboratorium Zajęcia 5 – wprowadzenie do programu Statistica Program STATISTICA

Badanie empirycznego rozkładu zmiennej ilościowej

W kolejnym punkcie zostanie zbadany rozkład zmiennej ilościowej. W tym celu otwórz najpierw plik Zawały.sta.

1. Po otwarciu pliku z danymi przejdź na kartę Statystyka i kliknij przycisk Statystyki podstawowe umieszczony w grupie Podstawowe. W oknie, które pojawi się na ekranie wybierz opcję Tabele liczności. Następnie kliknij przycisk Zmienne i zaznacz zmienną Choresterol całkowity i kliknij OK. Przejdź na kartę Więcej i w polu Metoda kategoryzacji dla tabel i wykresów zaznacz przycisk opcji Krok (oznaczający szerokość przedziału klasowego). W sąsiednim polu edycji wprowadź wartość 20 oraz anuluj zaznaczenia pola wyboru od minimum, a w polu edycji rozpocznij od wprowadź wartość 100. Wygląd okna Tabele liczności: Zawały.sta z wybraną kartą Więcej i wprowadzonymi wartościami przedstawia Rys. 23.

2. Aby obejrzeć wynikową tabelę liczności kliknij przycisk Podsum.: Tabele liczności. Na ekranie pojawi się tabela z szeregiem rozdzielczym przedstawiona na

Rys. 23. Wygląd okna Tabele liczności: Zawały.sta po wybraniu karty Więcej i wprowadzeniu wartości.

Page 16: Podstawy statystyki medycznej - Jagiellonian University · 2018-09-24 · Podstawy statystyki medycznej Laboratorium Zajęcia 5 – wprowadzenie do programu Statistica Program STATISTICA

Rys. 24. Szereg rozdzielczy dla zmiennej Choresterol całkowity.

3. Na podstawie danych z tabeli widzimy, że liczności najpierw stopniowo wzrastają, a potem maleją. Może to oznaczać, że zmienna ma rozkład zbliżony do normalnego. Aby zaobserwować empiryczny rozkład można wyznaczyć histogram. Aby to zrobić kliknij na przycisk Tabele liczności: Zaw… w dolnym lewym rogu okna programu STATISTICA. W oknie, które się pojawi kliknij przycisk Histogramy. Pojawi się wykres jak na … . Słupki odzwierciedlają rozkład empiryczny zmiennej. Na histogram jest nałożona krzywa rozkładu normalnego w celu przybliżonej oceny rozkładu empirycznego z rozkładem teoretycznym.

Rys. 25. Histogram rozkładu dla zmiennej Cholesterol całkowity z nałożoną krzywą rozkładu normalnego.

Page 17: Podstawy statystyki medycznej - Jagiellonian University · 2018-09-24 · Podstawy statystyki medycznej Laboratorium Zajęcia 5 – wprowadzenie do programu Statistica Program STATISTICA

Szerokość przedziału klasowego

W tym punkcie zostaną porównane ze sobą histogramy o różnych szerokościach przedziałów klasowych. Zostanie również pokazany sposób umieszczania wyników bezpośrednio w dokumencie programu Word. Aby pokazać wspomniane opcje otwórz plik Analiza płac.sta.1. Po otwarciu pliku przejdź na kartę Podstawowe i w grupie Narzędzia wybierz polecenie

Opcje. W oknie Opcje, które pojawi się na ekranie przejdź na pozycję Globalne ustawienia wyjścia i w polu z listą opcji Wyjście do MS Word wybierz opcję Jeden dokument (wspólny dla wszystkich analiz). Następnie na karcie Statystyka wybierz kolejno polecenie Statystyki podstawowe oraz Tabele liczności. Kliknij przycisk Zmienne i zaznacz zmienną Wiek, a następnie przejdź na kartę Więcej i w polu Metoda kategoryzacji dla tabel i wykresów zaznacz przycisk opcji Krok (oznaczający szerokość przedziału klasowego). W sąsiednim polu edycji wprowadź wartość 10 oraz anuluj zaznaczenia pola wyboru od minimum, a w polu edycji rozpocznij od wprowadź wartość 10. Następnie kliknij przycisk Podsum.: Tabele liczności w celu obejrzenia tabeli liczności. W celu utworzenia histogramu kliknij przycisk Histogramy.

2. Utwórz histogramy dla przedziałów klasowych 5, 3 i 2. Aby to zrobić trzeba kliknąć przycisk Tabele liczności: Ana … . Następnie zmienić wartość Krok na odpowiednią wartość (5 lub 3 lub 2) i kliknąć przycisk Histogramy. Za każdym razem po wykonaniu czynności w tym kroku w skoroszycie będzie pojawiał się nowy histogram (dla kolejnej wartości przedziału klasowego). Ostateczny wygląd skoroszytu jest przedstawiony na Rys. 26. Niezależnie od pojawiania się histogramów w skoroszycie, pojawiają się również one w dokumencie MS Word.

3. Aby porównać ze sobą histogramy warto umieścić je w jednym oknie obok siebie. W tym celu kliknij na kartę Wykresy, a następnie Układ wielu wykresów i wybierz opcję Pusty wykres. Następnie do okna, które pojawiło się na ekranie przeciągnij ikony histogramów ze skoroszytu. Po przeciągnięciu wszystkich ikon rozmieść je tak, aby móc porównać ze sobą histogramy ( Rys. 27).

Rys. 26. Wygląd skoroszytu po utworzeniu 4 histogramów.

Page 18: Podstawy statystyki medycznej - Jagiellonian University · 2018-09-24 · Podstawy statystyki medycznej Laboratorium Zajęcia 5 – wprowadzenie do programu Statistica Program STATISTICA

Rys. 27. Wygląd okna Pusty wykres po dodaniu do niego histogramów.

Z porównania histogramów wynika, że aby dobrze zinterpretować empiryczny rozkład zmiennej należy przeanalizować histogramy dla różnych przedziałów klasowych. Pierwszy rozkład (dla szerokości przedziału klasowego 10) sugeruje, że mamy do czynienia z rozkładem jednomodalnym o prawostronnej skośności (asymetrii). Natomiast ostatni z histogramów wydaje się być zbyt szczegółowy i zacierać występujące prawidłowości. Dokładne przyjrzenie się drugiemu i trzeciemu histogramowi pozwala zauważyć, że oprócz asymetrii badany rozkład charakteryzuje się dwumodalnością. W rozkładzie empirycznym występuje lokalne maksimum dla wieku około 25-28 lat, a drugie w pobliżu wieku 45 lat. Dokładniejsza analiza przyczyn tego zjawiska może niekiedy doprowadzić do wartościowych wniosków badawczych.

Charakterystyki liczbowe rozkładu zmiennejW tym punkcie zapoznamy się z wybranymi miarami opisowymi próby losowej takimi jak średnia, mediana, odchylenie standardowe, miary asymetrii itp.

Obliczanie miar opisowych1. Otwórz plik danych Analiza płac.sta. Korzystając ze wstążki wybierz kolejno polecenia

Statystyka/Statystyki podstawowe/Statystyki opisowe. Pojawi się okno jak na Rys. 28.

Page 19: Podstawy statystyki medycznej - Jagiellonian University · 2018-09-24 · Podstawy statystyki medycznej Laboratorium Zajęcia 5 – wprowadzenie do programu Statistica Program STATISTICA

Rys. 28. Widok okna Statystyki opisowe: Analiza płac. sta

2. W oknie Statystyki opisowe kliknij przycisk Zmienne i przytrzymując klawisz CTRL wskaż zmienne: Wiek, Staż pracy i Płaca brutto. Po zaakceptowaniu wyboru zmiennych (kliknięciem przycisku OK.) przejdź na kartę Więcej i oprócz domyślnych ustawień programu dodatkowo zaznacz pola wyboru: %ważnych, Mediana, Wsp. Zmienności oraz Skośność (Rys. 29). Po kliknięciu przycisku Podsumowanie program obliczy zaznaczone statystyki opisowe dla wybranych zmiennych i umieści arkusz zawierający wyniki w skoroszycie (Rys. 30).

Rys. 29. Wygląd okna Statystyki opisowe po wybraniu karty Więcej.

Page 20: Podstawy statystyki medycznej - Jagiellonian University · 2018-09-24 · Podstawy statystyki medycznej Laboratorium Zajęcia 5 – wprowadzenie do programu Statistica Program STATISTICA

Rys. 30. Skoroszyt z arkuszem wyników statystyk opisowych

Analiza w grupach

W tym punkcie zostaną przeanalizowane dane zawarte w pliku Nadciśnienie.sta. Plik zawiera wybrane dane dotyczące osób, u których zdiagnozowano chorobę nadciśnieniową. Najpierw zostanie porównany przeciętny poziom skurczowego ciśnienia krwi pomiędzy badanymi kobietami i mężczyznami, a następnie dodatkowo będzie uwzględnione to, czy badane osoby były osobami palącymi, czy też osobami niepalącymi.

1. Otwórz plik Nadciśnienie.sta. Ze wstążki wybierz kartę Statystyka i Statystyki podstawowe. Następnie w oknie Statystyki podstawowe i tabele: Nadciśnienie, które pojawi się na ekranie wybierz pozycję Przekroje, prosta ANOVA. Po kliknięciu przycisku OK program przejdzie do okna definiowania analizy Statystyki w grupach (przekroje): Nadciśnienie. (Rys. 31).

2. Na karcie Pojedyncze tabele w tym oknie kliknij przycisk Zmienne. W kolejnym oknie, które pojawi się na ekranie wybierz zmienne do analizy. Na liście Zmienne zależne zaznacz zmienną Ciśnienie skurczowe, a na liście Zmienne grupujące zmienną Płeć. Następnie kliknij OK oraz ponownie OK, aby program wykonał odpowiednie obliczenia.

Rys. 31. Okno definiowania analizy Statystyki w grupach (przekroje)

Po chwili na ekranie pojawi się okno Statystyki w grupach – wyniki, które umożliwia wybranie całego szeregu wyników analizy. Dostępne opcje zostały rozmieszczone na kartach.

Page 21: Podstawy statystyki medycznej - Jagiellonian University · 2018-09-24 · Podstawy statystyki medycznej Laboratorium Zajęcia 5 – wprowadzenie do programu Statistica Program STATISTICA

Przechodząc na kartę Statystyki opisowe można np. wybrać rodzaj statystyk, które zostaną wyświetlone w arkuszu z wynikami (Rys. 32).

Rys. 32. Okno wyników analizy Statystyki w grupach – wyniki

3. Aby uzyskać dobry obraz sytuacji trzeba obliczyć podstawowe charakterystyki liczbowe zmiennej Ciśnienie skurczowe w grupach badanych kobiet i mężczyzn. W tym celu na karcie Statystyki opisowe zaznacz dodatkowo pole wyboru Mediana i kwartale. Aby obejrzeć wyniki kliknij przycisk Podsum: tabela statystyk. Jeżeli wszystko zostało poprawnie wykonane na ekranie powinna pojawić się tabela jak na Rys. 33.

Rys. 33. Arkusz wyników analizy przekrojowej.

4. Na podstawie wyników zawartych w tabeli z Rys. 33 można stwierdzić, że wyższy przeciętny poziom badanej zmiennej występuje w grupie mężczyzn. Warto dodatkowo utworzyć wykresy typu ramka-wąsy, które pozwalają bliżej przyjrzeć się rozkładom

Page 22: Podstawy statystyki medycznej - Jagiellonian University · 2018-09-24 · Podstawy statystyki medycznej Laboratorium Zajęcia 5 – wprowadzenie do programu Statistica Program STATISTICA

badanej zmiennej w porównywanych grupach. Aby to zrobić przywołaj okno Statystyki w grupach – wyniki za pomocą kombinacji klawiszy CTRL+R i kliknij przycisk Skategoryzowane wykresy ramka-wąsy. Jako typ wykresu wskaż Mediana/Kwartyle/Rozstęp. Na ekranie pojawi się wykres zamieszczony na Rys. 34.

Rys. 34. Wykresy ramka wąsy w porównywanych grupach kobiet i mężczyzn.

5. Wykres przedstawiony na Rys. 34 ilustruje podstawowe statystyki opisowe analizowanej zmiennej w porównywanych grupach badanych. Można zauważyć, że wyższy przeciętny poziom zmiennej Ciśnienie skurczowe występuje u mężczyzn a ponadto zróżnicowanie wyników jest zdecydowanie większe w tej grupie badanych. Na wykresie typu ramka-wąsy można przedstawić także surowe dane. W tym celu kliknij dwukrotnie lewym przyciskiem myszy w obrębie tła wykresu i w oknie Opcje wykresu, które pojawi się na ekranie przejdź kolejno na karty Wykres właściwy i Ramka-wąsy. Aby umieścić na wykresie surowe dane kliknij przycisk Więcej i kolejno zaznacz pole wyboru Pokaż dane surowe oraz Losowa na liście Separacja punktów. Można także zmienić rodzaj znacznika punktów (wybierz Wykres właściwy/Ogólne wybierz Dane surowe i kliknij przycisk Znaczniki) oraz usunąć ramki i wąsy (wybierz Wykres właściwy/Rozrzut i odznacz odpowiednie pola). Po modyfikacji wykres wygląda jak na Rys. 35.

Page 23: Podstawy statystyki medycznej - Jagiellonian University · 2018-09-24 · Podstawy statystyki medycznej Laboratorium Zajęcia 5 – wprowadzenie do programu Statistica Program STATISTICA

Rys. 35. Zmodyfikowany wykres ramka-wąsy z surowymi danymi.

Jak widać wykres pozwala na dokładną analizę rozkładu surowych danych poprzez łatwą identyfikację obserwacji, które odbiegają od środka rozkładu.

6. W tym kroku zostanie wykonana analiza danych w grupach ze względu na zmienną grupującą Palenie. W tym celu w oknie z wynikami analizy Statystyki w grupach – wyniki klikamy przycisk Anuluj aby cofnąć się do poprzedniego kroku analizy i zmodyfikować zmienne do analizy. W oknie Statystyki w grupach (przekroje) kliknij przycisk Zmienne i na liście Zmienne grupujące zaznacz dodatkowo zmienną Palenie (przy zaznaczaniu trzymaj wciśnięty przycisk CTRL) Kliknij przycisk OK w celu zaakceptowania wyboru oraz kliknij ponownie przycisk OK, aby program wykonał potrzebne obliczenia. Aby obejrzeć wyniki analizy kliknij przycisk Podsum.: tabela statystyk na karcie Statystyki opisowe. Na ekranie pojawi się arkusz wyników jak na Rys.36.

7. Podobnie jak poprzednio można również przedstawić wyniki na wykresie typu ramka wąsy. Należy to zrobić tak jak w kroku 4. Jeżeli wszystkie czynności wykonano poprawnie powinien pojawić się wykres jak na .

Page 24: Podstawy statystyki medycznej - Jagiellonian University · 2018-09-24 · Podstawy statystyki medycznej Laboratorium Zajęcia 5 – wprowadzenie do programu Statistica Program STATISTICA

Rys. 36. Arkusz wyników analizy przekrojowej

Rys. 37. Wykresy ramka-wąsy w grupach palących i niepalących w podziale na płeć.

Wyniki przedstawione zarówno w tabeli z Rys. 36 jak i wykresu z pozwalają na jednoczesną ocenę zróżnicowanego przeciętnego poziomu skurczowego ciśnienia krwi ze względu na płeć badanych osób oraz status palenia.