4_lezione_infernza statistica_stima dei parametri_intervallo di confidenza_2°anno
TRANSCRIPT
-
8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno
1/21
I Facolt di Medicina e Chirurgia
CORSO DI STATISTICA 2Dott.sa Laura Perrotta
- Lezione 7 - Inferenza statistica: gli intervalli di confidenza -
A.A. 2006/2007
-
8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno
2/21
POPOLAZIONE E UNITA STATISTICHE Perpopolazione o universo si intende linsieme di tutti
gli elementi che hanno in comune il carattere che deveessereesaminato.
Leunit statistiche sono i singoli elementi, checostituiscono la popolazione, deputati a fornire le
informazioni grezze.
La scelta di una popolazione statistica oggetto di studioviene definita dallo sperimentatore seguendo un criteriooggettivo per assegnare o meno un elemento allapopolazione di interesse (popolazione bersaglio).
Esempio: linsieme di soggetti di et superiore a 60 anniappartenenti al comprensorio sanitario di una ASL; i tempi disopravvivenza dopo il trapianto di midollo; ecc.
Moltericerche indagano su un ridotto numero diosservazione (il campione)e successivamentegiungono a conclusioni generalizzabili.
-
8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno
3/21
POPOLAZIONI FINITE ED INFINITE
Una popolazione si definiscefinita se costituita da unnumero finito di unit, cio si in grado di identificaretutte le unit.
Un popolazione definita infinita se costituita da unnumero illimitato di unit, cio non si in grado diidentificare tutte le unit che costituiscono lapopolazione.
Difficilmente una popolazione statistica coincide con lapopolazione anagrafica: a causa di problemiorganizzativi, economici e di tempo diventa dispendiosofarriferimento alla totalit delle unit di una popolazione.
-
8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno
4/21
LINFERENZA STATISTICA
Linferenza statistica il procedimento induttivo, cheavvalendosi del calcolo delle probabilit, consente diestendere allintera popolazione le informazioni fornite dauna campione
Lericerche in campo biomedico vengono sviluppateattraverso indagini campionarie. Per la scelta delcampione devono essererispettati i criteri di casualit erappresentativit
Concettualmente si definisceerrore campionario ladifferenza esistente tra le caratteristiche del campioneequellevere della popolazione bersaglio
Esistono tecniche di campionamento in grado di prevedere
e controllare lerroremigliorando la bont del campione
-
8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno
5/21
POPOLAZIONE
PARAMETRI DELLA
POPOLAZIONE
STIMECAMPIONARIE
CAMPIONE
Tecniche
campionarie
Inferenzastatistica
Rilevamento ed
elaborazione dati
Schema logico di un indagine statistica campionaria
Media
Deviazione standard
Media m
Deviazione standard s
-
8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno
6/21
Il processo inferenziale, nel caso pi
semplice, indirizzato a stimare i
parametri della popolazione attraverso
le stime campionarie della tendenza
centralee della dispersione.
-
8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno
7/21
SIMBOLOGIA DEI
PARAMETRI
Parametri della
popolazione
Parametri del
campioneMedia (mu) m =
Deviazione
standard (sigma) s
VALORI NOTEVOLI DELLA DISTRIBUZIONE Z
Z Area compresa
nellintervallo (-z; +z)
Area esterna allintervallo
(-z; +z) (code della distribuzione)
1 0,68 68% 0,32 32%
1,96 0,95 95% 0,05 5%
2,58 0,99 99% 0,01 1%
x
Numerosit N n
-
8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno
8/21
Esempio 1
La variabile altezza di una popolazione segue ladistribuzione normale, un individuo scelto a caso dadetta popolazione avr, con il 95% di probabilit,unaltezza compresa tra lintervallo
2 e + 2Se i parametri della variabile altezza sono noti:
= 174 cm = 11 cm
si pu dire, con una probabilit circa del 95%, che unindividuo avr unaltezza localizzata tra 152 e 196 cm
)(%95 WQWQ zxzP !
)196152(%95 ! xP
-
8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno
9/21
Perconoscere laltezza dei giovani di una certaet, si misura la statura solo di un campione di
individui e se ne calcola la media aritmetica
Presumibilmente il valorerilevato si scosta dallamedia vera della popolazione;ed intuitivo che
la media campionaria tender ad avvicinarsi
alla media vera con laumentare della
numerosit del campione, fino a coincidere ilnumero di unit rilevate al numero delle unit
che costituiscono la popolazione.
x
-
8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno
10/21
La differenza tra la media stimata e quella vera
rappresenta lerrore campionario (quanto pinumeroso sar il campione tanto pi piccolo lerrore
campionario che si commette).
Se da una stessa popolazionevengono estratti infiniti
campioni e perogni campionevengono calcolate le
stime della media, secondo il teorema del limite
centrale, le medie campionarie si distribuiscono
come una normale con media coincidente con
quella della popolazione e deviazione standarddella media uguale a
Con n che indica la numerosit del campione.
x
nx
WW !
-
8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno
11/21
STIMA INTERVALLARE DI UNA MEDIA
Sfruttando le propriet della distribuzione normale
standardizzata Z, si pu facilmente supporre che la
media della popolazione sia compresa con la
probabilit del 95% nellintervallo definito dai valori
e nel 99% dei casi nellintervallo
Nx
Nx
WQ
W96,196,1
Nx
Nx
WQ
W58,258,2
-
8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno
12/21
Purtroppo la deviazione standard della popolazione quasi sempre ignota, percui occorre farriferimentola stima campionaria s.
Ne consegue che la media della popolazione compresa nellintervallo:
a seconda della fiducia probabilistica prescelta.
n
sx
n
sx 96,196,1 Q
n
sx
n
sx 58,258,2 Q
-
8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno
13/21
INTERVALLO DI CONFIDENZASi parla di intervalli di confidenza IC perdefinire
entro quali valori localizzata la media vera in base
alle stime campionarie
1 - = 95%
1 - = 99% livello di confidenza
n
sxIC 96,1%95 s!
n
sxI 58,299 s!
-
8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno
14/21
Quando non nota la deviazione standard , si
stima il valore s del campione.
Nel caso di campioni molto grandi (N > 120 unit)
per il calcolo degli intervalli di confidenza pu essere
presa in considerazione la distribuzione normaleperch solo perN molto grande la media campionaria
si distribuisce come una normale.
Nel caso di piccoli campioni (N > 30 unit)per il calcolo degli intervalli di confidenza si fa
riferimento ad una famiglia di distribuzioni definita:
Distribuzione della t di Student.
-
8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno
15/21
DISTRIBUZIONE
DELLA T-Student
Le distribuzioni della t di student
differiscono tra loro per i gradi di
libert (N 1). Igradi di libert corrispondono
ad N (la numerosit del
campione)meno il numero dei
parametri stimati percampione.
La distribuzione t unadistribuzione di probabilit
teorica, della qualeesistono
tabelle predisposte con i valori
critici.
-
8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno
16/21
Esempio 2
In un campione di 14 misure a carattere quantitativo siottiene = 41 e s = 7 con 13 gradi di libert. Qual la media della popolazione al livello di confidenza del99%?
Poich il campione inferiore alle 30 unit necessario fare riferimento alla distribuzione della t-student,
per cui la media della popolazione al 99% diprobabilit localizzata nellintervallo (35 < < 41).
x
6,541147012.34199,0 s!s!s!
N
stxQ
-
8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno
17/21
STIMA INTERVALLARE DI UNA
FREQUENZA PERCENTUALEAnche la stima campionaria di una frequenza relativa(o percentuale)viene utilizzata a scopo inferenziale percalcolare gli intervalli di confidenza della frequenza delfenomeno nella popolazione
Con P che indica la frequenza relativa della popolazionee P la deviazione standard
Lintervallo di confidenza al 95%
Lintervallo di confidenza al 99%
NPPPIC )1(96,1%95 s!
N
PPPIC
)1(58,2
%99
s!
-
8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno
18/21
Esempio 3
Ne
llarev
isione
di unarivista a ca
ratt
erebio
medico siriscontra che in un campione di 147 articoli, 64 presentano
conclusioni statistiche non compatibili con i dati presentati.Quale percentuale di articoli pubblicati si presume abbia,al 95% di probabilit, una statistica corretta?
La frequenza percentuale di articoli contenenti elaborazioni statistichecorrette risulta:
Tale stima campionaria si utilizza a scopo inferenziale per calcolarelintervallo di confidenza della percentuale di articoli corretti:
Possiamo ipotizzare con un livello di confidenza del 95%, che lapercentuale vera complessiva di articoli con elaborazioni statistichecorrette sia compresa tra il 52,4% e il 60,6%.
%6.56565,0147
64147}!
1,45,56147
)5,56100(5,5696,15,56
)100(95,0%95 s!
s!
s!
N
PPzPIC
-
8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno
19/21
ESERCIZIO - 1
In un campione di 139 individui il tempo medio di
assorbimento di un farmaco antinfiammatorio di 19
minuti con una deviazione standard di 7 minuti.
Calcolare lintervallo si confidenza della media della
popolazione al 95% e 99%.
N = 139; X = 19 minuti; S = 7 minuti;
Z95% = 1,96; Z99% = 2,58;
17,2082,17139
796,119 959595 eeps!s! QI
n
szxI
54,2045,17
139
758,219 %99%99%99 eeps!s! QIC
n
szxIC
-
8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno
20/21
VERIFICA DELLEIPOT
ESISi vogliono confrontare, ad esempio, i risultatiche si ottengono somministrando due diversifarmaci a due gruppi di pazienti affetti da una
determinata malattia, nellipotesi di omogeneitdei pazienti peret, sesso, stato di saluteecc..
Possiamo accettare lipotesi, detta nulla o dibase, che il farmaco A migliore del farmaco B?
Secondo la statistica inferenziale si partedallipotesi di base, tramite un test statistico,fissato il livello di probabilit, si accetter o sirifiuter lipotesi di base
-
8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno
21/21
Due sono le principali aree dellinferenza statistica:
La stima dei parametri
Esempio: si vuole stimare il tempo medio di recupero dalleffetto
dellanestesia tra i pazienti operati di appendicite
La verifica delle ipotesi
Esempio: si vuole determinare se un nuovo prodotto farmaceutico
pi efficace nel trattamento di una certa affezione rispetto ad unprodotto tradizionale.