wstĘp - pzh · title: wstĘp author: biblioteka created date: 2/15/2018 1:02:55 pm
TRANSCRIPT
1
1
PODSTAWOWE POJĘCIA I MIARY W EPIDEMIOLOGII
Podstawowym pojęciem w epidemiologii jest populacja. W pierwotnym sensie słowa
populację stanowią wszyscy ludzie zamieszkujący dany obszar: glob ziemski, kraj,
region. Ale termin ten używany też bywa w innym, bardziej technicznym znaczeniu. Nie
musi wtedy dotyczyć wyłącznie ludzi, a może być stosowany również do innych
jednostek: przedmiotów, zdarzeń, instytucji, dokumentów. W tym znaczeniu populację
stanowi zdefiniowany odpowiednio dla danego badania zbiór jednostek, z którego
pobieramy próbę do badań i do którego mają odnosić się zamierzone wyniki badania.
Próba jest to podzbiór populacji, na którym dokonywane są pomiary i
przeprowadzana jest analiza statystyczna. Wybór elementów (osób) do próby nazywamy
selekcją. Jeżeli selekcja spełnia warunek reprezentatywności, wyniki uzyskane w
badaniu próby można odnieść do populacji.
Dobór losowy (randomizacja). Słowo „random” 1
w swym statystycznym
znaczeniu odnosi się do sekwencji obserwacji, aktywności, przyporządkowań i t.p. które
są wynikiem procesu losowego, w którym prawdopodobieństwo każdego ciągu zdarzeń
jest znane lub może zostać określone. Randomizacja jest procesem przyporządkowania
pacjentów (jednostek badanych) grupom badawczym przy użyciu procesu losowego
scharakteryzowanego wyżej. Nie jest to każde przyporządkowanie przypadkowe, ani „jak
leci”, ale wymaga umiejętnego korzystania z tablic liczb losowych lub odpowiednich
generatorów komputerowych. Rzuty monetą lub kostką nie spełniają w pełni wymogów
randomizacji.
Błąd jest to odejście od prawdy. Możemy mieć do czynienia z błędami
przypadkowymi, rozłożonymi losowo, które obniżają precyzję badań i powtarzalność
(reliability) wyników; lub z błędami systematycznymi wynikającymi ze stronniczości
(bias), zwykle niezamierzonej, naszych selekcji lub pomiarów i w konsekwencji
nieprawidłowego zaklasyfikowania jednostek.
1 Podawanie w cudzysłowach lub nawiasach przy terminach polskich, terminy używane w epidemiologii
anglosaskiej mają na celu ułatwienie wyłowienia z gąszczu synonimów tych określeń, które zadomowiły się
2
2
Dobrą ilustracją zdefiniowanych wyżej rozróżnień jest strzelanie do tarczy. Duży
rozrzut oznacza małą precyzję i małą powtarzalność wyników. Położenie punktu
centralnego trafień, czyli takiego, do którego suma odległości trafień jest najmniejsza
względem środka tarczy, jest miarą trafności (validity, internal validity) strzelania,
obecności lub braku błędu stronniczości (bias). Możemy mieć do czynienia ze
strzelaniem precyzyjnym, ale nietrafnym, gdy rozrzut trafień jest mały, a punkt centralny
jest odległy od środka tarczy. Mówimy wtedy, że błąd przypadkowy jest mały, a błąd
systematyczny duży. Możemy mieć też duży błąd przypadkowy, a mały systematyczny,
gdy średnia trafień jest bliska środka tarczy, ale ich rozrzut jest duży.
Jeśli wyniki uzyskane na naszej próbie lub badanej populacji możemy odnieść do
szerszej populacji, której bezpośrednio badana populacja jest podzbiorem, mówimy o
trafności zewnętrznej (external validity), nazywanej inaczej generalizowalnością lub
prawomocnym uogólnieniem wyników.
W badaniach epidemiologicznych, podobnie jak w innych badaniach, często
stawiamy sobie tzw. pytania rozstrzygnięcia. Czy spośród dwóch zdań sprzecznych ze
sobą, a odnoszących się do przedmiotu naszych badań mamy wybrać pierwsze, czy
drugie? Zdania takie nazywamy hipotezami. Nie zawsze, ale zazwyczaj pierwsze z tych
zdań przyjmuje jako prawdziwą naszą dotychczasową wiedzę - status quo. Zdanie to
uznajemy za hipotezę zerową. Zdanie przeciwne, że prawdziwy jest stan inny, ni -
uznawany dotychczas, nazywamy hipotezą alternatywną. W odpowiedzi na pytanie, czy
praca z azbestem stanowi zagrożenie powstaniem raka płuc, hipoteza zerowa będzie
głosić, że nie, a hipoteza alternatywna, że tak. Nie jest to reguła sztywna. Stojąc na
rozstaju dróg możemy pytanie formułować różnie: Czy ta droga prowadzi do miasta X?
Która z tych dwu dróg prowadzi do miasta X? Ale zawsze muszą to być pytania
rozstrzygnięcia, które nie mogą być jednocześnie prawdziwe. Jeśli do miasta prowadzą
obie drogi, odpowiedzi na drugie z podanych wyżej pytań nie stanowią układu hipotez.
Błędy w testowaniu hipotez:
w terminologii epidemiologicznej. Niestety polska terminologia epidemiologiczna jest znacznie uboższa, co
naraża czytelnika na korzystanie z nie zawsze niezawodnego wyczucia językowego.
3
3
1. Błąd pierwszego rodzaju polega na odrzuceniu hipotezy zerowej, gdy jest ona
prawdziwa. Prawdopodobieństwo popełnienia błędu pierwszego rodzaju jest mierzone
poziomem znamienności testu: .
2. Błąd drugiego rodzaju polega zaakceptowaniu hipotezy zerowej, jeśli jest ona
fałszywa. Prawdopodobieństwo popełnienia błędu drugiego rodzaju stanowi dopełnienie
współczynnika mocy testu: (1-).
Zmienne są to wartości liczbowe lub opisowe przyporządkowane cechom
jednostek będących przedmiotem analizy. Wynik (outcome variable, indicator variable)
jest tą zasadniczą wartością, której dotyczy badanie. Może to być choroba, lub jej zejście:
wyleczenie śmierć czy stan przewlekły, może to być rezultat naszych zabiegów
rehabilitacyjnych lub oświatowych. Zmienne analizy (analysis variables, predictors) są
to zmienne, których związek przyczynowy lub tylko związek statystyczny ze zmienną
wynikową jest badany. Często zmienne analizy stanowią jakościowe lub ilościowe
określenia czynników narażenia (exposure), których związek z wynikiem np.
zachorowaniem jest badany. Jeżeli w badaniu wykażemy, że narażenie zwiększa
prawdopodobieństwo zachorowania na daną chorobę, to możemy je uznać za czynnik
ryzyka tej choroby, a po uwzględnieniu dodatkowych kryteriów, jako jej przyczynę.
Łatwa do zauważenia jest analogia narażenia i wyniku ze zmiennymi niezależną i zależną
w funkcjach matematycznych.
Zmienne kategoryczne mogą przybierać tylko wartości dyskretne, których liczbę
można policzyć. Są to grupy wieku, płeć, rasa, narodowość.
Zmienne ciągłe mogą przybierać w swym realnym zakresie wszystkie wartości ze
zbiorów liczb rzeczywistych odpowiadających temu zakresowi. Liczby wymierne
stanowią dostateczne ich przybliżenie.
Wśród zmiennych kategorycznych mamy zmienne nominalne i zmienne porządkowe.
Zmiennych nominalnych, jak płeć czy rasa, nie możemy uporządkować w szereg według
kryterium większości lub następstwa. Natomiast zmienne porządkowe możemy
uporządkować, choć nie we wszystkich przypadkach ma sens przypisywanie im liczb. Na
przykład ból może być niewielki, wyraźny, silny, bardzo silny, nie do zniesienia. Ale nie
4
4
ma podstaw, aby podawać różnicę między bólem silnym, a nie do zniesienia lub stosunek
ile razy większy jest ból nie do zniesienia od bólu silnego.
Zmienne kardynalne to takie, w obrębie których ma sens mierzenie różnicy
pomiędzy wielkościami. Wszystkie zmienne kardynalne są oczywiście zmiennymi
porządkowymi.
Jeśli charakter zmiennej kardynalnej pozwala na określanie tylko różnicy między
wartościami, mamy do czynienia ze skalą interwałową. Zmiennymi interwałowymi są
zazwyczaj skale arbitralne, jak np. skala temperatury Celsjusza. Możemy powiedzieć, że
od 10 do 30 stopni temperatura wzrosła o 20 stopni, ale nie ma sensu powiedzenie, że
wzrosła trzykrotnie. Natomiast zmienne takie jak ciężar ciała, wiek, ciśnienie krwi
pozwalają na zastosowanie skali stosunków, w której możliwe jest dzielenie wielkości
przez siebie. Możemy z sensem powiedzieć, że Jan jest trzy razy starszy od Piotra i waży
dwa razy więcej.
Statystyka w języku polskim jest nauką. Natomiast w jezyku angielskim nauka
nazywa się „statistics”, co dałoby się przetłumaczyć na „statystyki” w liczbie mnogiej.
Po angielsku „statistic” oznacza funkcję określającą pewne cechy rozkładu elementów w
zbiorze. I tak mamy „statystykę t” określającą właściwości prawdopodobieństwa
rozkładu Studenta, czy „statystykę z” określającą właściwości prawdopodobieństwa
rozkładu normalnego (Gaussa). Uświadomienie sobie tej dwuznaczności pozwoli nam na
uniknięcie nieporozumień przy czytaniu dalszych partii tekstu.
Proporcja jest definiowana w epidemiologii jako stosunek części jakiejś całości
do tej całości. Jest to inne znaczenie niż wynieśliśmy ze szkolnego kursu matematyki,
gdzie proporcja oznacza równość dwóch stosunków (ilorazów).
Stosunek jest to iloraz dwu wielkości o tym samym mianie i w związku z tym jest
liczbą niemianowaną.
„Rate” w epidemiologii anglosaskiej oznacza iloczyn dwu wielkości o różnym
mianie, przy czym w mianowniku zazwyczaj jest czas lub zmienna przestrzenna
(powierzchnia lub objętość). W języku polskim nie mamy tu jednego odpowiednika.
Może to być prędkość, częstość, czy zagęszczenie (np.liczba mieszkańców na km2).
„Rate” zawsze ma miano. Należy jednak zaznaczyć, że to dość purystyczne podejście nie
5
5
przez wszystkich epidemiologów jest przestrzegane i w literaturze anglojęzycznej zdarza
się użycie słowa „rate” do określenia stosunku dwóch liczb niemianowanych lub o tym
samym mianie.
„Odds” to kolejny termin epidemiologiczny niemający precyzyjnego
odpowiednika w języku polskim. Stosując słownikowe tłumaczenie na „szanse” należy
pamiętać o precyzyjnym epidemiologicznym zastosowaniu tego słowa. W epidemiologii
odds oznacza stosunek części zbioru do jego dopełnienia. Jeżeli w próbie 80 osób
występuje 20 osób ze skurczowym ciśnieniem tętniczym powyżej 140 mmHg, to odds
należenia do tej grupy jest: 20/ (80-20)=1/3. Łatwo spostrzec, że „odds” jest zawsze
większe od proporcji. Zauważmy też, że proporcja zdarzeń w zbiorze daje nam
prawdopodobieństwo wystąpienia tego zdarzenia wśród innych zdarzeń lub elementów
zbioru, natomiast odds, co najwyżej prawdopodobieństwo to przybliża. Przybliżenie to
jest tym dokładniejsze, im zdarzenie jest rzadsze.
Terminy wymienione powyżej są używane w epidemiologii, ale mogą odnosić się
i do innych dziedzin. Kolejne definicje dotyczą miar specyficznie epidemiologicznych.
Analiza narażenia (ekspozycji).
Narażenie na czynnik, o którym zakładamy, że wywołuje chorobę lub modyfikuje
jej przebieg bywa w epidemiologii niekiedy nazywane ekspozycją. Bywa, że narażenie
jest krótkotrwałym wydarzeniem jednorazowym jak kąpiel w przeręblu lub jednorazowy
kontakt płciowy z osobą zakażoną rzeżączką. Niekiedy jednak narażenie trwa długo i ma
zmienny przebieg, jak w przypadku palenia papierosów. W takich sytuacjach zwykle
dokonujemy sumarycznego podsumowania czasu i intensywności narażenia
wprowadzając wskaźniki uwzględniające obie zmienne: intensywność i czas. Należy
jednak pamiętać, że taki sposób przedstawienia narażenia może stanowić źródło istotnych
błędów, szczególnie tam, gdzie występują ekstrema zakresu intensywności narażenia. Nie
jest tym samym oddychanie 2% dwutlenkiem węgla w tlenie przez 10 godzin co 40%
przez pół godziny. Charakter narażenia, a także doświadczenie i rozsądek badacza musi
pomóc wybrać, kiedy najwłaściwsze będzie określenie maksymalnego stężenia bądź
intensywności czynnika, kiedy najlepiej określi narażenie średnia dawka pomnożona
6
6
przez czas jego trwania, a kiedy skumulowana ilość danego czynnika będzie
najwłaściwszą miarą narażenia.
Okres czasu między ekspozycją a pojawieniem się pierwszych klinicznych
manifestacji chorób zakaźnych nosi nazwę okresu inkubacji, w stosunku do chorób
niezakaźnych zwykle mówimy o indukcji. Okres ten może się wahać praktycznie od zera
przy urazach do wielu lat w wypadku wirusów powolnych i/lub prionów. Na przykład
nowe przypadki kuru pojawiały się na Nowej Gwinei jeszcze 27 lat po zaprzestaniu
rytualnego kanibalizmu, który stanowił sposób przenoszenia czynnika zakaźnego.
Uwzględnianie okresu indukcji jest istotne przy wykluczaniu z analizy przypadków
pojawiających się zbyt wcześnie, aby mogły być związane przyczynowo z narażeniem.
Miary częstości występowania chorób.
Miary częstości występowania chorób używane najczęściej w epidemiologii
należą do dwu szerokich kategorii: rozpowszechnienia - chorobowości (prevalence) i
zapadalności (incidence). Chorobowość mierzy proporcję osób w populacji mających
daną chorobę, lub inną badaną cechę, w zdefiniowanym momencie i dostarcza
oszacowania prawdopodobieństwa (ryzyka), że dana osoba będzie chora w tej chwili, lub
krótkim przedziale czasowym.
Formuła obliczania chorobowości:
populacji Liczebnosc
populacji chorych w osób LiczbaćChorobowoś
Jeżeli na przykład w badaniach Framingham stwierdzono pośród osób w grupie
wieku 52-85 lat, że 310 spośród 2477 osób badanych miało katarakty w chwili badania,
chorobowość z powodu katarakt będzie: P=310/2477=12.5%. „Punkt czasowy” może
oznaczać dzień kalendarzowy, ale może też być definiowany jako określony moment w
kursie zdarzeń i mieć różny czas realny dla różnych osób, jak na przykład pierwsza
miesiączka, czy drugi dzień po operacji wyrostka.
Zapadalność mierzy liczbę nowych przypadków chorobowych (ale może być
używana jako wskaźnik innych zdarzeń), które pojawiły się w badanej próbie (populacji)
7
7
w określonym przedziale czasowym. Istnieją dwie różne miary zapadalności:
zapadalność kumulacyjna (zbiorcza) oraz gęstość zapadalności.
Zapadalność zbiorcza (CI) jest proporcją ludzi z badanej populacji, którzy zachorowali w
określonym przedziale czasowym:
populacji Liczebnosc
czasie okreśkreśl wpopulacji danej choroby w przypadkównowych LiczbaCI
Zapadalność zbiorcza stanowi oszacowanie prawdopodobieństwa zachorowania (ryzyka),
że u danej osoby rozwinie się choroba w określonym przedziale czasu. Na przykład w
badaniach nad użyciem doustnych środków antykoncepcyjnych i bakteriurią zbadano
2390 kobiet w wieku 16-49 lat wolnych od bakteriurii na początku badań. Spośród nich
482 używały doustnych środków antykoncepcyjnych na początku badań. Po trzyletniej
obserwacji okazało się, że 27 spośród nich rozwinęło bakteriurię, co daje CI= 5.6%.
Istotne w ocenie zapadalności zbiorczej jest określenie czasu obserwacji. Inaczej będzie
ona postrzegana, jeśli czas obserwacji wynosił jeden miesiąc, a inaczej jeśli 10 lat.
Przy obliczaniu zapadalności zbiorczej zakładamy, że cała obserwowana próba
jest włączona do badań na ich początku i obserwowana do końca badań. Wypadanie osób
włączonych do badań z pola obserwacji stwarza bardzo duże trudności interpretacyjne, o
których będzie mowa w rozdziale poświęconym badaniu kohort. Tu zauważmy tylko, że
wypadanie badanych osób z pola obserwacji powoduje, że czas jaki obserwujemy
jednostki włączone do badań, nie jest w tym przypadku taki sam dla wszystkich
uczestników.
Pewien sposób na rozwiązanie tej trudności stanowi wprowadzenie innego
wskaźnika, jakim jest gęstość zapadalności (ID). Jest on pomyślany jako chwilowa
częstość rozwijania choroby w badanej populacji i jest definiowany w następujący
sposób:
obserwacjiczasu -osobo Suma
badania doh wlaczonycosob wsródprzypadkównowych LiczbaID
Jak w każdej mierze zapadalności, w liczniku mamy tu liczbę nowych
przypadków choroby, natomiast w mianowniku mamy sumę powstałą z dodania
8
8
indywidualnych czasów obserwacji wszystkich członków próby. Jest to bardzo użyteczny
i sprawdzony praktycznie wskaźnik, ale intuicyjnie dość dziwaczny. Tysiąc osobo-lat
możemy uzyskać obserwując pięćdziesiąt osób przez dwadzieścia lat lub tysiąc osób
przez rok. W granicach rozsądku lepiej wskaźnik ten funkcjonuje przy krócej
obserwowanych liczniejszych grupach niż na odwrót. Licznik i mianownik mają tu różne
miana. Gęstość zapadalności nie jest zatem proporcją tylko „rate”. W przypadku
zastosowania tego wskaźnika nie ma już konieczności utrzymywania kohorty stacjonarnej
z jednym dla wszystkich początkiem i końcem badań. Można użyć kohorty dynamicznej,
do której uczestnicy są włączani w różnym czasie i obserwowani przez różne okresy
czasu. Jeśliby, jak w badaniach Stampfera dotyczących choroby wieńcowej u kobiet po
menopauzie, 90 z 32 317 rozwinęło chorobę wieńcową po całkowitym czasie obserwacji
105 786.2 osobo-lat, ID obliczylibyśmy dzieląc 90 osób przez 105 786.2 osobo-lat
uzyskując 85.1/105
osobo-lat. W kohortach dynamicznych z użyciem ID przyjmujemy
założenie, że ryzyko badanej choroby pozostaje niezmienione w czasie obserwacji. Jest
oczywiste, że założenie to ma większy sens przy stosunkowo krótkich czasach
obserwacji. Tym niemniej w planowaniu badań z użyciem tego wskaźnika dobrze jest, o
ile to tylko możliwe, odwołać się do wcześniejszej wiedzy z innych badań, które
uzasadniałyby takie założenie. A gdy porównujemy ze sobą różne badania posługujące się
miarami gęstości zapadalności, powinniśmy zwrócić uwagę, czy różnice zakresów
czasów obserwacji nie są zbyt duże, gdyż wtedy wzrasta możliwość, że badania te różnią
się dynamiką ryzyka rozwoju choroby.
Jeśli możemy rozsądnie założyć stabilność ryzyka obserwowanej choroby w
czasie obserwacji w warunkach naszych badań, istnieje możliwość wyliczenia
zapadalności zbiorczej (CI) z gęstości zapadalności (ID).
CI(t) = ID t
gdzie t oznacza czas obserwacji kohorty stacjonarnej. Dokładność tego przybliżenia jest
tym większa, im choroba występuje rzadziej i bliżej końca okresu obserwacji.
Praktycznie można używać tego przybliżenia, gdy CI<0.1. Bardziej precyzyjne
przybliżenie, mniej wrażliwe na wymienione wyżej założenia, daje następująca formuła
wykładnicza:
9
9
CI(t) = 1- exp(-ID t)
Załóżmy, ze gęstość zapadalności na raka piersi u 40-44 letnich kobiet przed menopauzą
wynosi 200 przypadków na 100 000 osobo-lat. Jaka jest zapadalność zbiorcza w tej
grupie u osób zdrowych w ciągu pięciu lat obserwacji?
CI(5) = 1 - e - (200 / 100 000) 5
= 0.00995 1000 / 105
.
Rzadko ryzyko wystąpienia badanej choroby jest takie samo na przestrzeni lat. Na
przykład ryzyko choroby wieńcowej i pewnych chorób nowotworowych zmienia się z
wiekiem pacjenta, a ryzyko raka płuc związanego z ekspozycją na azbest zmieniało się
upływem lat w zależności od tego, jak powszechnie azbest był stosowany w przemyśle i
budownictwie. Aby badanie epidemiologiczne mogło uchwycić te zmiany, potrzebne jest
pogrupowanie (stratyfikacja) badanych osób według wieku lub kalendarzowych lat
obserwacji, a nieraz i innych kryteriów. Jeżeli obserwacja jest prowadzona odpowiednio
długo, badane osoby mogą przechodzić z jednej grupy do drugiej. Nie mamy wtedy do
czynienia tylko z prostym wyliczaniem czasu obserwacji narażonych i nienarażonych, ale
prócz czasu obserwacji musimy też niekiedy uwzględnić zmienny stopień narażenia.
W określaniu miar częstości kluczową rolę odgrywa definicja mianownika. W
teorii mianownik miary częstości powinien obejmować tylko tych, którzy ponoszą ryzyko
rozwinięcia choroby, czyli należeć do populacji, w której mogą powstać nowe przypadki.
Dlatego ci, którzy są aktualnie chorzy, lub byli chorzy w przeszłości lub ze względów
takich jak wiek, płeć, szczepienie czy też chirurgiczne usunięcie organu będącego
punktem wyjścia choroby nie mogą zachorować, winni z zasady być wykluczeni z
mianownika. Zazwyczaj nie jest możliwe uzyskanie takiej informacji o wszystkich
ludziach w populacji. Powstaje więc praktyczny problem, kiedy wykluczenia takie mają
znaczenie. Zależy to w pierwszym rzędzie od tego, jaką część całej populacji stanowią
ludzie niemający szansy rozwinięcia choroby. Jeżeli tacy ludzie są włączeni do badań,
uzyskana miara nie doszacowuje prawdziwej zapadalności. Jest za niska.
Dla większości chorób przewlekłych proporcja osób z populacji ogólnej
kwalifikujących się do wykluczenia z mianownika jest względnie mała i nie wpływa
znacząco na gęstość zapadalności. Ale dla chorób takich jak rak macicy w populacji
Nowego Jorku, gdzie 25% kobiet powyżej 45 roku życia i 35% z przedziału 60-69 miało
10
10
wykonaną histerektomię, proporcja osób bez ryzyka jest zbyt wielka, aby można ją
pominąć w analizie. Zwłaszcza w badaniach porównawczych kobiet z różnych grup
etnicznych i z różnych rejonów geograficznych, różnice w tym względzie mogłyby być
źródłem poważnych błędów, które poznamy później jako różnicową stronniczość
doboru (differential selection bias).
Nie zawsze rozróżnienie pomiędzy zapadalnością i chorobowością jest jasne na
pierwszy rzut oka. Na przykład częstość diagnoz uzyskanych w autopsjach jest proporcją
osób zmarłych, u których w badaniu post mortem znaleziono określone zmiany
patologiczne. W 105 autopsjach amerykanskich żołnierzy, którzy zginęli w Wietnamie, u
47 znaleziono zaawansowane zmiany miażdżycowe, co daje rozpowszechnienie w tej
grupie młodych zdrowych ludzi 45%. Wynik ten nie może być reprezentatywny dla
zgonów w populacji ogólnej, ani nawet zgonów szpitalnych ze względu na rozmaitość
powodów śmierci, po których następowały autopsje i różnorodność powodów, dla
których podejmowano decyzję o wykonaniu sekcji pośmiertnej. Toteż, mimo że
umieralność analizujemy analogicznie do zapadalności, wyniki autopsji pośmiertnych
rozpatrujemy jako chorobowość (prevalence) odnoszącą się do populacji wykonanych
sekcji. Podobna jest sytuacja z wadami wrodzonymi obserwowanymi przy porodzie. Nie
można ich traktować jako zapadalności, gdyż w tym wypadku mianownik powinien
reprezentować wszystkie produkty zapłodnień: zarówno sztuczne jak i spontaniczne
poronienia, urodzenia martwe i żywe. Zatem wady wrodzone traktujemy jako
chorobowość (prevalence) z czasowym odniesieniem do momentu porodu licząc zarówno
porody żywe jak martwe. Szczególny typ chorobowości stanowi chorobowość
okresowa (period prevalence), która jest wyliczana z proporcji przypadków, które
występują w danej populacji w sprecyzowanym okresie czasu. Zatem licznik obejmuje
przypadki obecne na początku tego okresu oraz te, które pojawiły się w czasie jego
trwania. Jest to dziwaczna kombinacja chorobowości i zapadalności, która z tego właśnie
powodu rzadko jest stosowana. Jest jednak pożyteczna tam, gdzie trudno jest określić
początek choroby, jak ma to niekiedy miejsce w chorobach psychicznych.
11
11
Specyficzną formą wskaźnika zapadalności jest zapadalność epidemiczna
(attack rate) będąca kumulacyjną zapadalnością w specyficznej grupie ryzyka
obserwowaną w ograniczonym okresie czasu, która często jest spowodowana specyficzną
przyczyną. Wyróżniającą cechą zapadalności epidemicznej jest jej użyteczność w
sytuacjach, gdy gwałtowny wybuch lokalnej epidemii następuje po narażeniu w
stosunkowo krótkim i stałym odstępie czasu. W jednej z takich epidemii spośród 75 osób,
które jadły posiłek w jadłodajni, 46 zachorowało dając zapadalność epidemiczną 61%. Po
zbadaniu potraw, jakie jedli, okazało się, że zachorowało 46 spośród 54 osób, które jadły
lody waniliowe i tylko 3 osoby spośród 18, które nie jadły tych lodów, co dało
zapadalność odpowiednio 80% i 17%. Jest to szybki i niezbyt skomplikowany sposób na
znalezienie czynnika ryzyka: potrawy, której zjedzenie spowodowało zachorowanie, a
następnie czynnika chorobotwórczego odpowiedzialnego za wybuch epidemii.
Jak wspomniano wyżej umieralność (mortality rate) jest analizowana podobnie
jak zapadalność (incidence). Może być wyrażana jako umieralność ze wszystkich
przyczyn (total mortality rate) lub umieralność z przyczyn specyficznych (cause-
specific mortality rate). Umieralność z przyczyn specyficznych wyliczamy dzieląc liczbę
zgonów z określonej przyczyny w określonej populacji w zdefiniowanym czasie przez
liczebność tej populacji. Śmiertelność z powodu danej choroby (case-fatality rate) jest
obliczana jako proporcja zgonów z powodu danej choroby do liczby przypadków tej
choroby. Umieralność z przyczyn specyficznych zależy od częstości danej choroby
(przyczyny) w populacji oraz od ciężkości tej choroby. Śmiertelność z powodu danej
choroby jest przede wszystkim efektem ciężkości tej choroby. Na przykład umieralność z
przyczyny AIDS jest w Polsce stosunkowo niska, natomiast śmiertelność w AIDS jest
stuprocentowa. Jeżeli choroba powodująca zgon jest przewlekła i trwa wiele lat, a my
chcemy podać roczne dane umieralności na tę chorobę, trzeba zauważyć, że przypadki
tworzące licznik niekoniecznie muszą być podzbiorem przypadków z mianownika. Zgon
tegoroczny mógł być spowodowany chorobą zdiagnozowaną przed dwoma laty. Takie
sprawozdania są zatem uzasadnione tylko w wypadku stabilizacji częstości zachorowań
w okresie sprawozdawczym.
12
12
Zazwyczaj dane o umieralności są dzielone według grup wieku. Jest rzeczą
oczywistą, że umieralność jest różna w różnych grupach wiekowych. Dlatego
porównywanie umieralności w różnych krajach, gdzie dystrybucja grup wiekowych jest
odmienna, stwarza pewne trudności, które próbujemy rozwiązać za pomocą
standaryzacji. Generalnie zastosowania standaryzacji pozwalają na porównywanie
zapadalności i umieralności w populacjach różniących się rozkładem nie tylko wieku, ale
wszelkich innych cech mogących pozostawać w związku z badanym wynikiem jak płeć,
rasa, status ekonomiczny, wykształcenie etc. Metody standaryzacji bezpośredniej i
pośredniej zostaną przedstawione w dalszych partiach tej książki.
Proporcja osób chorych w danej populacji i pojawianie się w niej nowych
przypadków są ze sobą ściśle związane. Chorobowość zależy zarówno od zapadalności,
jak i czasu trwania choroby. W chorobach przewlekłych możemy mieć wysoką
chorobowość przy niskiej zapadalności, a w chorobach krótkotrwałych wysoka
zapadalność nie gwarantuje wysokiej chorobowości. Zmiany chorobowości mogą
następować w wyniku zmniejszenia zapadalności, ale także w wyniku wprowadzenia
nowych sposobów leczenia skracających czas trwania choroby, jak miało to miejsce z kiłą
po wprowadzeniu penicyliny. Jeśli zapadalność jest stabilna, nie obserwujemy wybuchu
epidemii, ani wyraźnych fluktuacji sezonowych możemy wyliczyć chorobowość (P) jako
iloczyn zapadalności (I) i średniego czasu trwania choroby (D):
P = I D
Zapadalność można oczywiście wyliczyć z chorobowości i czasu trwania choroby
po przekształceniu tej samej formuły.
Przejrzystą metodę prezentacji miar epidemiologicznych stanowi tabela 2x2,
której kolumny reprezentują odpowiednio chorobę (D) i nieobecność choroby (D), a
rzędy narażenie na potencjalny czynnik chorobotwórczy (E) oraz brak takiego narażenia
(E).
13
13
Tabela 1.
CHOROBA
NARAŻENIE D D SUMA
MARGINES
WIERSZA
E a b M1 = a+b
E c d M0 =c+d
SUMA
MARGINES
KOLUMNY
N1 = a+c N0 = b+d SUMA CAŁOŚCI
N = a+b+c+d
Gdzie:
a = liczba osób narażonych na czynnik chorobotwórczy, którzy są chorzy
b = liczba osób narażonych na czynnik chorobotwórczy, którzy nie są chorzy
c = liczba osób nienarażonych na czynnik chorobotwórczy, którzy są chorzy
d = liczba osób narażonych na czynnik chorobotwórczy, którzy nie są chorzy
M1 = a+b = całkowita liczba osób narażonych
M0 = c+d = całkowita liczba osób nienarażonych
N1 = a+c = całkowita liczba osób chorych
N0 = b+d = całkowita liczba osób zdrowych
Tabela przedstawiona wyżej jest dostosowana do prezentacji wskaźników
chorobowości oraz zapadalności kumulatywnej, a zatem do takich miar, które w
mianowniku mają liczby osób.
W oparciu o dane tej tabeli możemy zdefiniować następujące wskaźniki:
Chorobowość wśród narażonych: Pe = a/(a+b)
Chorobowość wśród nienarażonych: P0 = c/(c+d)
14
14
Zapadalność zbiorcza wśród narażonych: CIE = a /(a+b)
Zapadalność zbiorcza wśród nienarażonych: CI0 = c /(c+d)
Szanse wystąpienia choroby: OD = a / c
Szanse narażenia: OE = a / b
Prezentacja badań, w których mianownik jest wyrażony w jednostkach
osobo-czasu wymaga pewnej modyfikacji tabeli:
Tabela 2.
CHOROBA
NARAŻENIE D D JEDNOSTKI
OSOBO-CZASU
OBSERWACJI
E a
- PY1
E c - PY0
SUMA
MARGINES
KOLUMNY
N1 = a+c - PY1 + PY0
Gdzie:
a = liczba osób narażonych na czynnik chorobotwórczy, którzy są chorzy
c = liczba osób nienarażonych na czynnik chorobotwórczy, którzy są chorzy
PY1 = sumaryczny czas obserwacji osób narażonych mierzony np. w osobo-latach
PY0 = sumaryczny czas obserwacji osób nienarażonych mierzony np. w osobo-
latach
N1 = a+c = całkowita liczba osób chorych
PY1 + PY0 =sumaryczny czas obserwacji wszystkich osób badanych
15
15
Gęstość zapadalności wśród narażonych: IDE = a / PY1
Gęstość zapadalności wśród nie narażonych: ID0 = c / PY0
Miary asocjacji epidemiologicznych.
W badaniach epidemiologicznych rzadko poprzestajemy na stwierdzeniu
tylko proporcji występowania choroby, czy innego zjawiska, albo częstości jej
pojawiania się. Zazwyczaj w dążeniu do ustalenia związków przyczynowych
porównujemy ze sobą różne populacje lub próby o odmiennych rozkładach
zarówno chorób, jak i narażenia na czynniki, które możemy przyjąć jako
potencjalne czynniki chorobotwórcze. Takie porównania umożliwiają nam miary
asocjacji, które przy pomocy jednej liczby pozwalają porównać dwie populacje.
Ryzyko względne (relative risk, risk ratio) - RR. Jest to porównawczy
wskaźnik ryzyka rozwinięcia choroby dwu grup: narażonych i nienarażonych.
Wskaźnik ten jest stosunkiem zapadalności w obu grupach i ma zastosowanie w
zarówno badaniach, w których porównywana jest zapadalność zbiorcza,
)(
)(
0 bac
dca
CI
CIRR E
jak i gęstość zapadalności:
E
E
PYc
PYa
ID
IDRR
0
0
Stosunek szans (odds ratio) - OR. Jest to porównawczy wskaźnik zarówno
ryzyka rozwinięcia choroby, jak i ryzyka narażenia. W przypadku chorób o niskiej
chorobowości (P 0.1) OR stanowi akceptowalne przybliżenie względnego
ryzyka, gdyż jeśli choroba jest rzadka, a+b b oraz c+d d. Jak zobaczymy
później OR jest podstawowym wskaźnikiem w niektórych typach badań
epidemiologicznych i w analizie z zastosowaniem regresji logistycznej.
16
16
cb
da
d
cb
a
d
bc
a
OR
Jak widać stosunek szans narażenia chorych do narażenia zdrowych równy jest
stosunkowi szans choroby u narażonych i u nienarażonych. Ta właściwość
wskaźnika OR stanowi o jego zastosowaniu w badaniach referencyjnych, w
których mamy grupę „przypadków” – osób chorych lub posiadających inną cechę
charakteryzowaną przez zmienną badaną (wynik). W obu tych grupach określamy
proporcję osób narażonych i wyliczamy stosunek szans narażenia w grupie
przypadków i grupie kontrolnej. Korzystając z faktu, że stosunek szans narażenia
jest równy stosunkowi szans zachorowania narażonych i nienarażonych, który
stanowi przybliżenie stosunku ryzyka, możemy dzięki temu w badaniach
referencyjnych uzyskać oszacowanie stosunku ryzyka.
Różnica ryzyka (risk difference, attributable risk) - AR. Podczas gdy RR jest
miarą względnego ryzyka dwu porównywanych grup, różnica ryzyka daje liczby
bezwzględne wskaźników zapadalności w przeliczeniu na zdefiniowaną wielkość
populacji, na przykład na 100 000 mieszkańców danego kraju. Jest to różnica w
zapadalności osób narażonych i nienarażonych.
AR = Ie - I0
Podobnie wyliczamy różnicę dla gęstości zapadalności (rate difference). Należy z
naciskiem podkreślić, że badanie różnicy ryzyka jest możliwe tylko w badaniach
kohortowych i ich odmianach, bo tylko te badania, w których otrzymujemy wynik
w postaci zachorowalności narażonych i nienarażonych pozwala określić między
nimi różnicę.
Aby obliczyć, ile wynosi proporcja zachorowań, które można by
wyeliminować usuwając czynnik narażenia, obliczamy procent różnicy ryzyka -
AR%.
17
17
100% 0
E
E
I
IIAR
Jest to wyrażony w procentach stosunek różnicy między zapadalnością wśród
narażonych i nienarażonych do zapadalności wśród narażonych. Innymi słowy
wskazuje on, jaki odsetek zapadalności wśród narażonych stanowi przyrost
zapadalności spowodowany narażeniem.
Można ten wskaźnik wyliczyć również ze stosunku ryzyka dzieląc wyrażenia w
ułamku przez I0:
1001
%
RR
RRAR
Ostatnia formuła pozwala na oszacowanie miary AR% w badaniach
referencyjnych, przez zastąpienie stosunku ryzyka stosunkiem szans:
1001
%
OR
ORAR
Jeśli narażenie ma charakter zapobiegawczy, na przykład w wypadku szczepień
ochronnych, różnica ryzyka traci sens. Możemy jednak wtedy wyliczać inny
wskaźnik, frakcję prewencyjną - PF:
0
0
I
IIPF E
Jak zobaczymy dalej jest to podstawowa miara używana w badaniu efektywności
szczepień.
Jeżeli narażenie na dany czynnik dotyczy w różnym stopniu różnych członków
populacji, całkowita zapadalność w populacji (It) może być wyliczona jako średnia
ważona zapadalności we wszystkich kategoriach narażenia. Kategorie narażenia można
określić poprzez nasilenie czynnika narażenia np. stężenie substancji trującej lub przez
18
18
wyliczanie różnych niekoniecznie związanych ze sobą przyczyn wywołujących tę samą
chorobę.
It = ni=0 (Ii ) (Pi )
gdzie Pi jest proporcją osób narażonych na czynnik „i”. W wypadku jednego
tylko czynnika narażenia mamy:
It = (Ie ) (Pe ) + ( I0) (P0 )
Gdzie Ie stanowi zapadalność wśród narażonych, I0 zapadalność wśród nie-
narażonych, Pe proporcję narażonych w populacji, a P0 proporcję nie-
narażonych w populacji.
Wskaźnik różnicy ryzyka pozwala na porównanie dwóch subpopulacji
różniżcych się rodzajem narażenia pod względem liczby przypadków, króre w
nich wystąpiły. Aby oszacować liczbę o jaką wzrosła liczba zachorowań w danej
populacji z powodu interesującej nas ekspozycji, wyliczamy różnicę ryzyka dla
populacji- PAR (population attributable risk):
PAR = It - I0 = (AR) (Pe )
Jeśli różnica ryzyka podaje przyrost zapadalności spowodowany
narażeniem w próbie narażonych w porównaniu z próbą nienarażonych, to różnica
ryzyka dla populacji podaje, ile zachorowań np. na 100 000 (lub dowolną inną
liczbę osób) powoduje narażenie w populacji. Wskaźnik ten zależy od
rozpowszechnienia choroby w populacji, od rozpowszechnienia w tej populacji
czynników narażenia powodujących daną chorobę oraz od tego, jak skuteczne są
te czynniki w wywoływaniu choroby. Od zwykłej różnicy ryzyka odróżnia ją
właśnie uwzględnienie rozpowszechnienia czynników narażenia w populacji.
Jeżeli w grupie 100 narażonych zachoruje w określonym czasie 90 osób, a w
grypie nienarażonych w tym samym czasie zachoruje tylko 10 osób, różnica
ryzyka wynosi:
19
19
AR=0,9-0,1 = 0,8
Znaczy to, że w grupie narażonych, narażenie powoduje przyrost
zachorowań o 8 przypadków choroby na każde 10 osób i proporcjonalnie więcej w
większych grupach. Ale w naszej populacji mamy tylko 20% narażonych, a
pozostałe osoby nie są narażone. Zatem:
PAR = 0,80,2 = 0,16
Rozpowszechnienie narażenia, z jakim mamy do czynienia w tej populacji,
powoduje w przyjętym czasie zachorowanie nie 800, a zaledwie 160 osób na 1000
jej członków.
Interpretacja miar asocjacji jest kluczem do właściwej oceny wyników
badań epidemiologicznych. Ryzyko względne jest miarą siły asocjacji między
ekspozycją i chorobą i dostarcza informacji, która jest użyteczna do oceny, czy
zaobserwowana relacja może być traktowana jako związek przyczynowy.
Różnica ryzyka dostarcza natomiast informacji ważnej z punktu widzenia zdrowia
publicznego, o ile przedtem przyjmiemy, że związek między daną ekspozycją i
chorobą ma charakter przyczynowy. Różnica ryzyka mówi nam, ile zachorowań z
powodu danej przyczyny mamy w interesującym nas okresie np. w ciągu roku.
Różnica ryzyka nie pozwala nam na oszacowanie ryzyka względnego, zależy ona
bowiem nie tylko od niego, ale i od rozpowszechnienia danej choroby w
interesującej nas populacji. Najlepszą ilustracją odmienności tych miar jest
przykład z wpływem palenia tytoniu na powstawanie raka płuc oraz na rozwój
choroby wieńcowej. Stwierdzono czternastokrotny wzrost umieralności z powodu
raka płuc u osób, które paliły co najmniej jedną paczkę papierosów dziennie w
porównaniu z osobami niepalącymi, RR=14. Z drugiej strony względne ryzyko
rozwinięcia choroby wieńcowej u palaczy w stosunku do niepalących wyniosło
zaledwie 1.6. Zatem palenie papierosów jest znacznie silniejszym czynnikiem
ryzyka, jeśli chodzi o raka płuc niż o chorobę wieńcową. Jakkolwiek palenie jest
związane przyczynowo z obydwiema chorobami, wyeliminowanie palenia
zapobiegłoby znacznie większej liczbie zgonów z powody chorób serca niż z
powodu raka płuc. Różnica ryzyka dla śmierci z powodu choroby wieńcowej
20
20
wyniosła w tych badaniach 256 osób na 100 000, a z powodu raka płuc 130 na
100 000. Wyjaśnieniem tego jest fakt, że rak płuc występuje dużo rzadziej,
powodując 10 zgonów rocznie na 100 000 u niepalących, a choroba wieńcowa w
tej samej grupie powoduje 413 zgonów rocznie na 100 000. Dlatego
sześćdziesięcioprocentowy wzrost ryzyka śmierci z powodu choroby wieńcowej
dotyka większej liczby ludzi niż czternastokrotny wzrost liczby zgonów z powodu
raka płuc. Zrozumiałe jest zatem, dlaczego z punktu widzenia zdrowia
publicznego tak ważne jest obliczanie różnicy ryzyka, a dla badań siły związków
przyczynowych używane jest ryzyko względne.
Ale, żeby wiedzieć jak palenie tytoniu grozi jakiejś populacji np.
mieszkańcom naszego kraju, należałoby jeszcze uwzględnić w szacunkach
odsetek osób palących w społeczeństwie, co pozwoliłoby wyliczyć różnicę ryzyka
dla populacji.