4_lezione_infernza statistica_stima dei parametri_intervallo di confidenza_2°anno

Upload: sergio

Post on 09-Apr-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno

    1/21

    I Facolt di Medicina e Chirurgia

    CORSO DI STATISTICA 2Dott.sa Laura Perrotta

    - Lezione 7 - Inferenza statistica: gli intervalli di confidenza -

    A.A. 2006/2007

  • 8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno

    2/21

    POPOLAZIONE E UNITA STATISTICHE Perpopolazione o universo si intende linsieme di tutti

    gli elementi che hanno in comune il carattere che deveessereesaminato.

    Leunit statistiche sono i singoli elementi, checostituiscono la popolazione, deputati a fornire le

    informazioni grezze.

    La scelta di una popolazione statistica oggetto di studioviene definita dallo sperimentatore seguendo un criteriooggettivo per assegnare o meno un elemento allapopolazione di interesse (popolazione bersaglio).

    Esempio: linsieme di soggetti di et superiore a 60 anniappartenenti al comprensorio sanitario di una ASL; i tempi disopravvivenza dopo il trapianto di midollo; ecc.

    Moltericerche indagano su un ridotto numero diosservazione (il campione)e successivamentegiungono a conclusioni generalizzabili.

  • 8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno

    3/21

    POPOLAZIONI FINITE ED INFINITE

    Una popolazione si definiscefinita se costituita da unnumero finito di unit, cio si in grado di identificaretutte le unit.

    Un popolazione definita infinita se costituita da unnumero illimitato di unit, cio non si in grado diidentificare tutte le unit che costituiscono lapopolazione.

    Difficilmente una popolazione statistica coincide con lapopolazione anagrafica: a causa di problemiorganizzativi, economici e di tempo diventa dispendiosofarriferimento alla totalit delle unit di una popolazione.

  • 8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno

    4/21

    LINFERENZA STATISTICA

    Linferenza statistica il procedimento induttivo, cheavvalendosi del calcolo delle probabilit, consente diestendere allintera popolazione le informazioni fornite dauna campione

    Lericerche in campo biomedico vengono sviluppateattraverso indagini campionarie. Per la scelta delcampione devono essererispettati i criteri di casualit erappresentativit

    Concettualmente si definisceerrore campionario ladifferenza esistente tra le caratteristiche del campioneequellevere della popolazione bersaglio

    Esistono tecniche di campionamento in grado di prevedere

    e controllare lerroremigliorando la bont del campione

  • 8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno

    5/21

    POPOLAZIONE

    PARAMETRI DELLA

    POPOLAZIONE

    STIMECAMPIONARIE

    CAMPIONE

    Tecniche

    campionarie

    Inferenzastatistica

    Rilevamento ed

    elaborazione dati

    Schema logico di un indagine statistica campionaria

    Media

    Deviazione standard

    Media m

    Deviazione standard s

  • 8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno

    6/21

    Il processo inferenziale, nel caso pi

    semplice, indirizzato a stimare i

    parametri della popolazione attraverso

    le stime campionarie della tendenza

    centralee della dispersione.

  • 8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno

    7/21

    SIMBOLOGIA DEI

    PARAMETRI

    Parametri della

    popolazione

    Parametri del

    campioneMedia (mu) m =

    Deviazione

    standard (sigma) s

    VALORI NOTEVOLI DELLA DISTRIBUZIONE Z

    Z Area compresa

    nellintervallo (-z; +z)

    Area esterna allintervallo

    (-z; +z) (code della distribuzione)

    1 0,68 68% 0,32 32%

    1,96 0,95 95% 0,05 5%

    2,58 0,99 99% 0,01 1%

    x

    Numerosit N n

  • 8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno

    8/21

    Esempio 1

    La variabile altezza di una popolazione segue ladistribuzione normale, un individuo scelto a caso dadetta popolazione avr, con il 95% di probabilit,unaltezza compresa tra lintervallo

    2 e + 2Se i parametri della variabile altezza sono noti:

    = 174 cm = 11 cm

    si pu dire, con una probabilit circa del 95%, che unindividuo avr unaltezza localizzata tra 152 e 196 cm

    )(%95 WQWQ zxzP !

    )196152(%95 ! xP

  • 8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno

    9/21

    Perconoscere laltezza dei giovani di una certaet, si misura la statura solo di un campione di

    individui e se ne calcola la media aritmetica

    Presumibilmente il valorerilevato si scosta dallamedia vera della popolazione;ed intuitivo che

    la media campionaria tender ad avvicinarsi

    alla media vera con laumentare della

    numerosit del campione, fino a coincidere ilnumero di unit rilevate al numero delle unit

    che costituiscono la popolazione.

    x

  • 8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno

    10/21

    La differenza tra la media stimata e quella vera

    rappresenta lerrore campionario (quanto pinumeroso sar il campione tanto pi piccolo lerrore

    campionario che si commette).

    Se da una stessa popolazionevengono estratti infiniti

    campioni e perogni campionevengono calcolate le

    stime della media, secondo il teorema del limite

    centrale, le medie campionarie si distribuiscono

    come una normale con media coincidente con

    quella della popolazione e deviazione standarddella media uguale a

    Con n che indica la numerosit del campione.

    x

    nx

    WW !

  • 8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno

    11/21

    STIMA INTERVALLARE DI UNA MEDIA

    Sfruttando le propriet della distribuzione normale

    standardizzata Z, si pu facilmente supporre che la

    media della popolazione sia compresa con la

    probabilit del 95% nellintervallo definito dai valori

    e nel 99% dei casi nellintervallo

    Nx

    Nx

    WQ

    W96,196,1

    Nx

    Nx

    WQ

    W58,258,2

  • 8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno

    12/21

    Purtroppo la deviazione standard della popolazione quasi sempre ignota, percui occorre farriferimentola stima campionaria s.

    Ne consegue che la media della popolazione compresa nellintervallo:

    a seconda della fiducia probabilistica prescelta.

    n

    sx

    n

    sx 96,196,1 Q

    n

    sx

    n

    sx 58,258,2 Q

  • 8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno

    13/21

    INTERVALLO DI CONFIDENZASi parla di intervalli di confidenza IC perdefinire

    entro quali valori localizzata la media vera in base

    alle stime campionarie

    1 - = 95%

    1 - = 99% livello di confidenza

    n

    sxIC 96,1%95 s!

    n

    sxI 58,299 s!

  • 8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno

    14/21

    Quando non nota la deviazione standard , si

    stima il valore s del campione.

    Nel caso di campioni molto grandi (N > 120 unit)

    per il calcolo degli intervalli di confidenza pu essere

    presa in considerazione la distribuzione normaleperch solo perN molto grande la media campionaria

    si distribuisce come una normale.

    Nel caso di piccoli campioni (N > 30 unit)per il calcolo degli intervalli di confidenza si fa

    riferimento ad una famiglia di distribuzioni definita:

    Distribuzione della t di Student.

  • 8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno

    15/21

    DISTRIBUZIONE

    DELLA T-Student

    Le distribuzioni della t di student

    differiscono tra loro per i gradi di

    libert (N 1). Igradi di libert corrispondono

    ad N (la numerosit del

    campione)meno il numero dei

    parametri stimati percampione.

    La distribuzione t unadistribuzione di probabilit

    teorica, della qualeesistono

    tabelle predisposte con i valori

    critici.

  • 8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno

    16/21

    Esempio 2

    In un campione di 14 misure a carattere quantitativo siottiene = 41 e s = 7 con 13 gradi di libert. Qual la media della popolazione al livello di confidenza del99%?

    Poich il campione inferiore alle 30 unit necessario fare riferimento alla distribuzione della t-student,

    per cui la media della popolazione al 99% diprobabilit localizzata nellintervallo (35 < < 41).

    x

    6,541147012.34199,0 s!s!s!

    N

    stxQ

  • 8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno

    17/21

    STIMA INTERVALLARE DI UNA

    FREQUENZA PERCENTUALEAnche la stima campionaria di una frequenza relativa(o percentuale)viene utilizzata a scopo inferenziale percalcolare gli intervalli di confidenza della frequenza delfenomeno nella popolazione

    Con P che indica la frequenza relativa della popolazionee P la deviazione standard

    Lintervallo di confidenza al 95%

    Lintervallo di confidenza al 99%

    NPPPIC )1(96,1%95 s!

    N

    PPPIC

    )1(58,2

    %99

    s!

  • 8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno

    18/21

    Esempio 3

    Ne

    llarev

    isione

    di unarivista a ca

    ratt

    erebio

    medico siriscontra che in un campione di 147 articoli, 64 presentano

    conclusioni statistiche non compatibili con i dati presentati.Quale percentuale di articoli pubblicati si presume abbia,al 95% di probabilit, una statistica corretta?

    La frequenza percentuale di articoli contenenti elaborazioni statistichecorrette risulta:

    Tale stima campionaria si utilizza a scopo inferenziale per calcolarelintervallo di confidenza della percentuale di articoli corretti:

    Possiamo ipotizzare con un livello di confidenza del 95%, che lapercentuale vera complessiva di articoli con elaborazioni statistichecorrette sia compresa tra il 52,4% e il 60,6%.

    %6.56565,0147

    64147}!

    1,45,56147

    )5,56100(5,5696,15,56

    )100(95,0%95 s!

    s!

    s!

    N

    PPzPIC

  • 8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno

    19/21

    ESERCIZIO - 1

    In un campione di 139 individui il tempo medio di

    assorbimento di un farmaco antinfiammatorio di 19

    minuti con una deviazione standard di 7 minuti.

    Calcolare lintervallo si confidenza della media della

    popolazione al 95% e 99%.

    N = 139; X = 19 minuti; S = 7 minuti;

    Z95% = 1,96; Z99% = 2,58;

    17,2082,17139

    796,119 959595 eeps!s! QI

    n

    szxI

    54,2045,17

    139

    758,219 %99%99%99 eeps!s! QIC

    n

    szxIC

  • 8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno

    20/21

    VERIFICA DELLEIPOT

    ESISi vogliono confrontare, ad esempio, i risultatiche si ottengono somministrando due diversifarmaci a due gruppi di pazienti affetti da una

    determinata malattia, nellipotesi di omogeneitdei pazienti peret, sesso, stato di saluteecc..

    Possiamo accettare lipotesi, detta nulla o dibase, che il farmaco A migliore del farmaco B?

    Secondo la statistica inferenziale si partedallipotesi di base, tramite un test statistico,fissato il livello di probabilit, si accetter o sirifiuter lipotesi di base

  • 8/8/2019 4_LEZIONE_Infernza statistica_STIMA DEI PARAMETRI_intervallo di confidenza_2anno

    21/21

    Due sono le principali aree dellinferenza statistica:

    La stima dei parametri

    Esempio: si vuole stimare il tempo medio di recupero dalleffetto

    dellanestesia tra i pazienti operati di appendicite

    La verifica delle ipotesi

    Esempio: si vuole determinare se un nuovo prodotto farmaceutico

    pi efficace nel trattamento di una certa affezione rispetto ad unprodotto tradizionale.