insegnamento di statistica medica per la facoltà di medicina e chirurgia a.a. 2011/2012 (3 cfu)...
TRANSCRIPT
Insegnamento di “Statistica Medica”
per la Facoltà di Medicina e Chirurgiaa.a. 2011/2012
(3 cfu)
DocenteDott.ssa Filippa Bono
Università degli Studi di Palermo
1
Etimologia della parola “Statistica”
Deriva dal vocabolo Italiano STATO Ghislini (1589): “la Statistica è la descrizione delle qualità
che caratterizzano e degli elementi che compongono uno Stato
2
Le due anime della Statistica
Risposta a un’esigenza conoscitiva
Raccolta, Organizzazione e diffusione di dati statistici
Constatazione che la realtà è variabile ma vi sono risultati che meritano più fiducia di altri perché si ripetono con maggiore regolarità
Studio dell’incertezza come fattore immanente nella scienza, nella tecnica, nelle attività umane
3
La Statistica ha come scopo la conoscenza quantitativa dei fenomeni collettivi.
“La statistica è la disciplina che elabora i principi e le metodologie che presiedono alla rilevazione e alla raccolta dei dati, alla rappresentazione sintetica e all’interpretazione dei dati stessi e, laddove ve ne siano le condizioni, alla generalizzazione delle evidenze osservate” (Cicchitelli)
E’ una scienza probabilistica. L’analisi statistica dei dati conduce a risultati che non sono certi ma sono molto vicini alla realtà, con un’approssimazione che si può calcolare.
Definizioni
4
Statistica
Statistica metodologica
Statistica economica
Statistica sociale
Statistica medica
5
Obiettivi del corso
Introdurre le basi della metodologia statistica, indirizzando la conoscenza delle tecniche utilizzate ai problemi che si incontrano più frequentemente in ambito medico-sanitario
Sarà illustrata la metodologia statistica descrittiva per il trattamento e l’elaborazione statistica dei dati, per giungere a svolgere autonomamente analisi statistiche descrittive e saper interpretare i risultati ottenuti.
Saranno introdotti la teoria della probabilità, il campionamento statistico e gli aspetti relativi alla statistica inferenziale con applicazioni all’ambito medico-sanitario. 6
1. Misurare l’efficacia di nuovi test, procedure e terapie
2. Individuare categorie di pazienti che possono trarre il maggior giovamento da una terapia, evitando di sottoporre i pazienti non idonei a potenti farmaci e a pesanti effetti collaterali
3. Valutazione di efficienza ed efficacia dei servizi sanitari:
Di che cosa si occupa la statistica medica?
Efficacia attesa: Capacità potenziale di un intervento di modificare in modo favorevole le condizioni di salute dei pazienti cui è rivolto quando viene applicato in modo ottimaleEfficacia osservata: Risultati ottenuti dall’applicazione di routine dell’interventoEfficienza: Capacità di raggiungere risultati in termini di salute con il minimo impiego di risorse
4. Fornire gli strumenti necessari per l’uso della letteratura scientifica nella medicina clinica (Evidence-based medicine) 7
A cosa servono i metodi della biostatistica- Prima che un nuovo farmaco possa essere commercializzato la casa farmaceutica richiede che venga sottoposta a un clinical trial: uno studio sperimentale condotto sull’uomo
L’obiettivo è quello di verificare l’efficacia del farmaco e gli effetti collaterali- Le decisioni del governo degli Stati Uniti sono in parte basate sulle previsioni relative alla longevità della popolazione-Dove investire le risorse pubbliche per ridurre la mortalità infantile?-Quali fattori aumentano in un soggetto la probabilità di sviluppare malattie coronariche? 8
Libri di testo
Biostatistica di M. Pagano, K. Gauvreau, II Ed. italiana a cura di I.F. Angelillo, M. Pavia, P. Villari, Ed. IDELSON-GNOCCHI
oppure Biostatistica di Wayne W. Daniel, Edises
edizione 2010
9
10/1
Statistica descrittiva e inferenza Statistica descrittiva e inferenza
La statistica descrittiva fornisce gli strumenti per sintetizzare ed esplicitare in forma corretta il modo in cui il fenomeno si è manifestato nel collettivo osservato
Mediante l’inferenza statistica è possibile misurare e controllare l’attendibilità delle informazioni provenienti da un campione
estrazione del campione
Carattere statistico
Carattere statistico: è la caratteristica con cui si presenta un’unità nel collettivo di riferimento.
Es. unità statistica=paziente: età, sesso, colesterolo sierico, tipo di terapia.
In genere, su un determinato collettivo si osservano più caratteri che possono essere studiati singolarmente o in modo congiunto (studio delle relazioni)
11
Ciascun carattere statistico si articola in “modalità” qualitative e quantitative, che sono i modi in cui un carattere si presenta nelle unità del collettivo.
La modalità qualitativa è espressa in termini nominali, categorie, attributi. La modalità quantitativa è espressa da numeri.
Es.
sesso: maschio, femmina
titolo studio: senza titolo, scuola elementare, scuola media inferiore,…
Gruppo sanguigno: A, B, 0
Spesa sanitaria
Colesterolo sierico, glicemia, statura, diametro della lesione in mm
Modalità di un carattere
12
Un esempio di dati osservatiUn esempio di dati osservati
Nome Età Sesso Titolo di studio
Attività Peso(kg)
Punteggio esercizi
Rossi M. 32 M laurea occupato 72 65
Bianchi G. 39 F laurea occupato 55 55
Nicoletti C. 46 M diploma disoccupato 79 53
Marcelli F. 28 M diploma studente 63 78
Petrone A. 51 F diploma casalinga 64 21
13
CLASSIFICAZIONE DEI CARATTERI STATISTICI
Caratteri qualitativi o sconnessi
Dicotomici
Policotomici
Caratteri semi-quantitativi
Ordinali rettilinei
Ordinali ciclici
Caratteri quantitativi
Discreti
Continui
14
Sperimentali (Medicina, Fisica, Chimica)
1. Ipotesi di lavoro
2. Possibilità di controllo
Osservazionali(Indagini di mercato, sondaggi)
Non si ha la possibilità di controllc
Indagine StatisticaControllo
Diretto dei Fattori Sperimentali e dei Fattori di Stratificazione
Indiretto: Randomizzazione
Rilevazioni: Sperimentali/osservazionaliRilevazioni: Sperimentali/osservazionali
15
Indagine statisticaIndagine statisticaIndagine Totale
Indagine Campionaria
Fasi dell’indagineFasi dell’indaginedefinizione degli obiettivi
definizione delle unità e delle variabili da rilevare
scelta del periodo di riferimentoindividuazione della popolazione e della lista delle
unità statistichedefinizione del piano di campionamentoraccolta dei dati
scelta della tecnica di rilevazione formulazione del questionario e pretest rilevazione sul campo
registrazione dei dati• registrazione su supporto magnetico• controllo e correzione
elaborazione e analisi dei dati
16
17/1
La rilevazione dei datiLa rilevazione dei dati
È completa quando si esa-minano tutte le unità statistiche che compongono la popolazione oggetto di studio.
Pregi: Accuratezza delle stime anche a livelli territoriali molto spinti Ricchezza delle informazioni raccolteEsaustività
Difetti:Costo elevatoTempi di elaborazione dei dati molto lunghi Qualità dei dati non elevata
È parziale quando ci si limita a studiare un sottoinsieme, detto “campione” dell’insieme di riferimento.
Pregi: Continuità della rilevazioneEconomicitàIndagini più mirate e approfondite
Difetti:Riferimento territoriale non spintoVariabilità campionaria
La raccolta delle informazioni può essere completa oppure parziale.
CARATTERE QUANTITATIVO O VARIABILE
Continuo: è un carattere le cui modalità possono assumere, in linea di principio, qualsiasi valore contenuto in un intervallo reale.
Discreto: è un carattere le cui modalità possono essere poste in corrispondenza con l’insieme dei numeri naturali {1, 2,3,..} o un suo sottinsieme proprio.
Per i caratteri quantitativi possono prendersi come modalità delle classi
18
DIVISIONE IN CLASSI DI UN CARATTERE CONTINUO
1. Si individuano il minimo e il massimo dei nostri dati
2. Si sceglie un adeguato numero di classi (si può usare
la formula di Sturges k=1+3.322*log10 (n), dove n è la
numerosità del data-set)
3. Si calcola il range= massimo-minimo
4. Si determina l’ampiezza della classe a=Range/k.
5. La prima classe avrà estremi [minimo;minimo+a]
19
Esercizio: Determinare la distribuzione di frequenza in 5 classi di uguale ampiezza e costruire il grafico
score inferiore superiore frequenze0.30 0.05 0.2 70.45 0.2 0.35 20.25 0.35 0.5 10.60 0.5 0.65 20.20 0.65 0.8 20.10 140.050.700.200.100.050.550.200.80
range= 0.75a= 0.150
classi frequenze
≤0.2 7
0.2-|0.35 2
0.35-|0.5 1
0.5-|0.65 2
0.65-|0.80 2
20
MISURAZIONE DEI CARATTERI STATISTICI
Carattere Esempi
Qualitativo
sconnesso
sesso, guarigione (SI/NO), causa di morte
Qualitativo
Ordinato rettilineo
Anno di nascita, anno di corso, sintomatologia, qualità di un’immagine
Qualitativo
Ordinato ciclico
Giorno della settimana, mese dell’anno
Quantitativo
discreto
Numero di figli, numero di carie, numero di aborti, numero di noduli di una lesione cancerosa
Quantitativo
continuo
Peso, statura, colesterolo, glicemia
21
2) ordinale o per ranghi
1) Nominale o classificatoria
3) ad intervalli
4) di rapporti
Aumentano leproprietà di misura sulla scala
Classificazione dei caratteri rispetto al livello di misurazione
22
Scala nominale
Scala nominale: quei caratteri qualitativi le cui modalità non presentano un ordine di successione e senza nessuna relazione quantitativa.
TIPO DI DIETA
Ipoproteica
Iposodica
Ipolipidica
Ipoglucidica
Ipocalorica
Esiste solo una sola relazione: l’identità
Operazione ammessa il conteggio (es.: numero di pazienti che guariscono)
23
Scala ordinale
Scala ordinale: quei caratteri qualitativi le cui modalità presentano un ordine di successione ma non una grandezza.
Lettura di un'ecografia da parte di un osservatoreAssolutamente benignoBenignoNormaleMalignoAssolutamente maligno
Classificazione BI-RADS
24
Ordinale o per ranghi
Non solo uguaglianza o diversità ma anche...
gradazione tra le classi o tra individui di classi differenti
In una scala ordinale, non è possibile quantificare le differenze di intensità tra le osservazioni.
limite
Relazione d’ordine è asimmetrica e transitiva
25
Scala a intervalli
Scala a intervalli: rappresentata da caratteri quantitativi le cui modalità sono espresse da numeri e consentono dunque di misurare la distanza tra esse.
Non hanno uno zero assoluto, naturale e non arbitrario.
B è più intelligente di A, ma non posso fare il rapporto e
dire che B è il doppio intelligente di A (50:25=2)
QI (quoziente intelligenza)
A 25
B 50
B-A 25
Il rapporto tra le distanze su una scala è uguale al
rapporto tra le distanze su un’altra scala (es. Scala Celsius o Fahrenheit)26
Scala di rapporti: rappresentata da caratteri quantitativi le cui modalità sono metriche, consentendo il calcolo di rapporti tra le unità rispetto ai valori del carattere
Esiste uno zero assoluto, naturale e non arbitrario
Scala di rapporti
Età
Meno di 5
6-10
11-20
21-40
41-70
Oltre 70
Classi di spesa sanitaria
Meno di 4 (mila euro)
4|-10
10|-25
25|-50
50|-100
100 e oltre
La scala Kelvin è scala di rapporti!
Il rapporto tra le misurazioni su una scala è uguale al
rapporto tra le misurazioni su un’altra scala (es. Scala Kilogrammi e Libbre)27
Scalogramma di Guttmann
Nominale Ordinale Intervallo Rapporti
Identità + + + +
Ordinamento + + +
Differenze + +
Rapporti +
28
Rappresentare le variabili in un foglio excelID studente Sesso Anno di nascita Anno di immatricolazione Esami completati Voto medio
123456789
1011121314151617181920
Scala nominale Scala
ordinale
Scala ordinale
Variabile discreta
Variabile continua
29