argomento: analisi dei dati - formazione infermiere...le procedure statistiche sono classificate in...
TRANSCRIPT
Metodologia della Ricerca Infermieristica
C.L. in Infermieristica 3° A.A.
Dott.ssa Marzia LommiE-mail: [email protected]
Cell. 339-3235608
La Ricerca Infermieristica
Argomento: Analisi dei dati
Libro di riferimento
Fain, J. A. (2004). La ricerca infermieristica: leggerla, comprenderla e
applicarla. E. Vellone (Ed.). McGraw-Hill.
Materiale in aggiunta per la presente lezione
Non necessario.
Slide fornite dal docente.
Modalità lezione
Streaming
Note e specifiche della presente lezione
Durata lezione
45 minuti circa
Your test is published and
available at:
testmoz.com/2882224
Passcode: metodologia
Fase 4: Analisi dei dati
Sessione 1
• Analisi dei dati
• Interpretazione dei risultati
• Una volta che i dati sono stati raccolti, è necessario analizzarli
da un punto di vista statistico perché solo in questo modo è
possibile dare una risposta alle domande di ricerca o testare le
ipotesi
• L’analisi statistica non è un'attività a sé stante nella ricerca,
ma è strettamente condizionata dal disegno di ricerca e dal
tipo di dati raccolti
• Esistono molte procedure statistiche ma in questa lezione
viene fornita una panoramica di quelle più comunemente
utilizzate per descrivere le variabili, esaminare le relazioni e
valutarne le differenze
• L'utilizzatore della ricerca infermieristica ha bisogno di saper
interpretare i dati statistici che trova nei rapporti di ricerca
STATISTICA DESCRITTIVA
Le procedure statistiche sono classificate in due categorie:
• Descrittive che descrivono, organizzano e riassumono i dati
• Inferenziali che producono generalizzazioni sulla popolazione
sulla base dei dati raccolti dai campioni
La S. Descrittiva comprende:
- Misure di tendenza centrale che descrivono la posizione o il
centro approssimativo di una distribuzione di dati (media,
moda e mediana)
- Misure di dispersione che sono dati che mostrano la
variabilità in un insieme di dati numerici (range, varianza e
deviazione standard)
STATISTICA DESCRITTIVA
MISURE DI TENDENZA CENTRALE
MEDIA
• La media è la misura di tendenza centrale più comune che viene
calcolata sommando tutti i valori di una distribuzione e dividendo il
totale per il numero dei valori stessi.
• Una delle caratteristiche principali della media è che il calcolo tiene
in considerazione ogni punteggio o valore presente nella
distribuzione.
• La media è la misura di tendenza centrale preferita quando i dati
sono raccolti su una scala intervallare o di rapporto.
• È una misura stabile e affidabile e, se da una popolazione sono
estratti campioni in modo random e di uguali dimensioni, il suo
valore è simile alla mediana e alla moda.
• La media è molto sensibile a valori estremi, detti anche valori
erratici, che sono molto diversi dagli altri presenti nel campione. In
una distribuzione di punteggi con la presenza di valori erratici, la
media è tirata verso questi valori.
23, 22, 25, 26, 29, 27, 23 = 175/7 = 25
N (7), M età: 25
Supponiamo che il 29 diventi 50
23, 22, 25, 26, 50, 27, 23 = 196/7= 28
il valore 50 è un valore erratico e sposta la M a 28
STATISTICA DESCRITTIVA
STATISTICA DESCRITTIVA
MISURE DI TENDENZA CENTRALE
MEDIANA
La mediana è il valore intermedio di una distribuzione. A volte è
chiamata «il 50° percentile», poiché il 50% della distribuzione si trova
al di sotto e al di sopra di questo valore.
La mediana è calcolata prima di tutto ponendo i valori in ordine
crescente o decrescente. Se il numero di valori è dispari, la mediana è
il valore che si trova a metà della distribuzione; se il numero di valori è
pari la mediana è la media dei due valori che si trovano a metà della
distribuzione. Quindi la mediana non è necessariamente uno dei valori
della distribuzione
Scala del dolore N 5 = 4, 5, 7, 8, 9 → Mdn 7
Scala del dolore N 6 = 4, 5, 5, 7, 7, 9 → Mdn (5+7/2) è 6
Una delle caratteristiche principali della mediana è che essa non tiene
in considerazione ogni punteggio della distribuzione quindi non è
sensibile ai valori estremi (outlier).
Scala coping N 5 = 12,15, 22, 31, 35 → Mdn 22, M 23
Scala coping N 5 = 12,15, 22, 31, 125 → Mdn 22, M 41
STATISTICA DESCRITTIVA
MISURE DI TENDENZA CENTRALE
MEDIANA
• La mediana è una misura di tendenza centrale utilizzata
appropriatamente quando i dati hanno una distribuzione
asimmetrica (più orientati verso uno dei due estremi della
distribuzione); in questi casi la media, la mediana e la moda hanno
valori più o meno diversi. In una distribuzione simmetrica, invece,
poiché i valori estremi sono bilanciati, la media, la mediana e la
moda hanno valore simile.
• Una distribuzione asimmetrica ha il picco decentrato e una coda
(detta curva di Gauss) più lunga in una direzione. In questa
distribuzione la media, la mediana e la moda non coincidono. La
moda è la più vicina al picco della curva poiché in questa zona si
trovano i punteggi più frequenti; la media è la più vicina alla coda
dove i valori estremi l'hanno trascinata; la mediana si trova tra la
moda e la media.
• Nelle distribuzioni asimmetriche possiamo avere:
- la distribuzione asimmetrica positiva (asimmetria a destra) in cui la
media è spostata verso i valori più alti
- la distribuzione asimmetrica negativa (asimmetria a sinistra) in cui
la media è spostata verso i valori più bassi.
STATISTICA DESCRITTIVA
STATISTICA DESCRITTIVA
MISURE DI TENDENZA CENTRALE
MODA
• La moda è il punteggio o valore che si verifica più frequentemente
in una distribuzione; è una misura appropriata di tendenza centrale
per dati nominali.
CONFRONTO TRA M, Mdn E MODA
I ricercatori scelgono le misure di tendenza centrale a seconda del livello di
misurazione, della forma della distribuzione dei dati e degli obiettivi della
ricerca.
LIVELLO DI MISURAZIONE
• L’utilizzo della M è appropriato con dati intervallari o di rapporto e qualche
volta con dati ordinali. La media è una misura più precisa rispetto alla
mediana e alla moda, poiché prende in considerazione tutti i valori di una
distribuzione ed è anche la più stabile tra le tre misure. Se dalla popolazione
target vengono estratti in modo casuale più campioni, le loro medie
varieranno di poco rispetto alla mediana e alla moda.
• Non ha senso calcolare una mediana per dati nominali ( es. stato civile).
• Poiché la moda richiede solo il conteggio con le frequenza, può essere
applicata a qualsiasi insieme di dati nominali, ordinali, intervallari o di
rapporto.
STATISTICA DESCRITTIVA
CONFRONTO TRA M, Mdn E MODA
FORMA DELLA DISTRIBUZIONE
• La forma della distribuzione è un altro fattore che influenza la scelta del
ricercatore sulla misura di tendenza centrale.
• Nelle distribuzioni asimmetriche la media, la mediana e la moda non
coincidono, nonostante la loro posizione relativa rimanga costante quando ci
si sposta dal punto più alto della curva verso la coda.
• L’ordine va sempre dalla moda, alla mediana, alla media. In una distribuzione
asimmetrica la mediana si trova sempre tra la media e la moda. È questa
caratteristica che fa della mediana la più appropriata misura di tendenza
centrale per la descrizione di una distribuzione asimmetrica.
OBIETTIVO DELLA RICERCA
• Il ricercatore utilizza la moda come indicatore preliminare di tendenza
centrale. Qualora venisse cercata una misura più precisa si utilizza la
mediana e la media.
• Per descrivere una distribuzione asimmetrica, il ricercatore sceglie la
mediana in modo da bilanciare i valori estremi (erratici). Inoltre la mediana è
talvolta utilizzata come punto della distribuzione in cui i valori possono
essere divisi in 2 categorie contenenti lo stesso numero di soggetti.
• La media è preferita rispetto alla mediana poiché è facilmente utilizzata in
molte analisi di statistica avanzata.
STATISTICA DESCRITTIVAMISURE DI DISPERSIONE
RANGE
Il range detto anche campo di variazione, è la più semplice misura di
dispersione e viene calcolato sottraendo nella distribuzione il valore più
basso dal valore più alto.
Il ricercatore riporta i range potenziali e reali per ogni variabile
dipendente.
Il range è considerato una misura instabile perché si basa esclusivamente su
due valori nella distribuzione, è estremamente sensibile ai valori erratici e
non tiene in considerazione della variazioni di valori tra gli estremi.
VARIANZA O DEVIAZIONE STANDARD
Entrambe sono basate sugli scarti che sono la differenza tra un qualsiasi
valore grezzo e la media della distribuzione. I valori grezzi sotto la media
hanno una deviazione negativa mentre quelli sopra la media una deviazione
positiva. La somma degli scarti in una distribuzione è sempre uguale a «0»,
per cui se il ricercatore utilizza gli scarti per calcolare le misure di
variabilità deve prenderli nel loro valore assoluto (senza segno positivo o
negativo). Se uno scarto viene elevato al quadrato diventa positivo.
La somma degli scarti al quadrato divisa per il numero dei valori si chiama
varianza.
MISURE DI DISPERSIONE
CONFRONTO TRA RANGE, VARIANZA E DEVIAZIONE STANDARD
• Nonostante il range sia veloce e semplice da ottenere, non è
molto affidabile poiché prende in considerazione solo due
valori della distribuzione.
• La varianza e la deviazione standard invece vengono calcolate
con tutti i valori.
• Nonostante la relativa stabilità, la varianza non è molto
utilizzata perché non può essere impiegata in molte analisi
statistiche.
• Contrariamente la SD riflette in modo più reale la variabilità
dei dati. Il calcolo della SD costituisce la fase iniziale per
ottenere altre misure statistiche specialmente quelle che
riguardano la scelta dei test per l’analisi dei risultati.
STATISTICA DESCRITTIVA
STATISTICA
DESCRITTIVA INFERENZIALE
STIMA
PUNTUALE INTERVALLARE
CONVALIDA IPOTESI
PROCEDURE
PARAMETRICHE
PROCEDURE NON
PARAMETRICHE
STATISTICA INFERENZIALE
È quella branca della statistica che si occupa di fare generalizzazioni
sulla popolazione sulla base dei dati provenienti da un campione. Questi
dati sono utilizzati per eseguire inferenze su un parametro che è una
caratteristica numerica della popolazione (es. media della popolazione,
deviazione standard della popolazione). I ricercatori poiché non possono
accedere ai dati di tutta la popolazione, possono solo stimarne i
parametri e questo viene fatto con i dati ottenuti dal campione.
Es. Io seleziono in modo random dalla popolazione un campione di 125
persone con diabete di tipo 1 e voglio misurare i cambiamenti del livello
di glicemia.
Io so che la glicemia media è 70 mg/dl come riferimento standard nella
popolazione e quindi questa è la media del mio campione.
Non ho la possibilità di studiare tutti gli individui con diabete di tipo 1 di
tutta la popolazione ma la S. inferenziale mi permette di fare inferenze
su una popolazione più ampia (tutti gli individui con diabete di tipo 1)
dallo studio del mio campione (i 125 soggetti con diabete di tipo 1
estratti a random dalla popolazione).
Le procedure di S. inferenziale sono di due tipi:
1. Procedura che va a stimare il parametro della popolazione in
modo puntuale (ossia preciso) o in modo intervallare (ossia
entro i limiti di un range).
Es. Voglio calcolare l’età media di un campione di donne che
guidano e stimarlo puntualmente in base all’età media nella
popolazione (parametro) delle donne che guidano.
Oppure il parametro della popolazione (l’età media delle donne
che guidano) è stimato in un intervallo di valori con un’età
compresa tra 16 e 22 anni e voglio usarlo come stima nel mio
campione. Questa è una stima intervallare associata ad un
intervallo di confidenza (grado di confidenza).
L’intervallo di confidenza è un range di valori che ha alcune
probabilità specifiche (per esempio 0,95 o 0,99 ossia 95% o 99% di
probabilità) di includere un particolare parametro della
popolazione.
STATISTICA INFERENZIALE
2. Procedura di convalida delle ipotesi che permette
di formulare un’ipotesi riguardo ad un parametro,
ricavare un campione della popolazione di interesse
e prendere delle decisioni obiettive sui risultati del
campione. Nel processo di convalida delle ipotesi è
centrale il concetto di probabilità. La probablità
aiuta a valutare l’accuratezza di un test statistico
(ossia quante probabilità si hanno che quanto
affermato dal test statistico abbia un riscontro
reale nella popolazione) e a validare un’ipotesi. I
risultati della ricerca sono spesso comunicati
utilizzando questo concetto. Le procedure di
convalida delle ipotesi sono sia quelle parametriche
sia quelle non parametriche.
STATISTICA INFERENZIALE
STATISTICA INFERENZIALEPROBABILITÀ
• È un concetto essenziale per comprendere la statistica inferenziale. È
un mezzo di predizione (c’è una probabilità del 50% che piova per il
resto della settimana).
• La probabilità è un sistema di regole per analizzare un insieme di
risultati. È la possibilità che un evento si verifichi. La probabilità è
espressa con la lettera «p».
• Per stabilire se un risultato è statisticamente significativo il
ricercatore deve fissare un livello di confidenza. Si tratta di un livello
di probabilità con cui l’ipotesi nulla può essere rifiutata con fiducia e
può essere accettata con altrettanta fiducia l’ipotesi di ricerca.
• I ricercatori utilizzano il livello minimo di confidenza standard di
0,05. Questo livello significa che esiste una differenza significativa
tra variabili quado ci sono al massimo 5 possibilità su 100 che quello
che sostengono sia errato.
• Il valore della «p» non indica le dimensioni delle validità associate
con ogni ipotesi di ricerca. Una volta che è stato fissato il livello di
significatività questo rappresenta una regola di decisione. Le regole
di decisione sono dicotomiche: sì o no, significativo o non
significativo. Una volta che la decisione è stata presa, il valore della
«p» riflette solo la confidenza che può essere posta in quella
decisone.
2,5% 2,5%
z = - 1,96 0 z = + 1,96
95%
Confidenza: 0,05
Il 95% delle differenze del campione cadono tra una SD -1,96
e +1,96
2,5% 2,5%
z = - 2,58 0 z = + 2,58
99%
Confidenza: 0,01
1 possibilità su 100 che le differenze riscontrate nel campione siano
dovute al caso (1%)
TEST PARAMETRICI E NON PARAMETRICI
Esistono diversi test statistici utilizzabili per l’analisi dei dati
raccolti su un campione e sono test parametrici o non
parametrici.
Le procedure parametriche richiedono il rispetto di alcune
condizioni affinché i risultati statistici possano essere validi:
- la variabile dipendente è misurata su una scala intervallare o
di rapporto
- distribuzione normale dei valori nella popolazione
- gruppi indipendenti (ad es campionamento randomizzato)
I test non parametrici non pongono condizioni sulla forma della
distribuzione dei valori e infatti sono anche chiamati test di
distribution-free. Sono di solito usati quando i dati sono stati
raccolti con scale ordinali o nominali e richiedono meno e più
semplici calcoli. La ragione principale per cui i non parametrici
sono meno utilizzati è perchè sono meno potenti rispetto ai test
parametrici.
UTILIZZO DELLA STATISTICA PER ESAMINARE RELAZIONI
CORRELAZIONI
La correlazione è una misura che definisce una relazione tra due
variabili (es. relazione fra fumo e capacità polmonare).
Per determinare la natura e la dimensione della relazione si usa un
coefficiente di relazione (r) che va da +1,0 a – 1,0. il segno + o – che
precede il coefficiente indica se la correlazione è positiva o negativa.
Nella correlazione positiva alti valori o punteggi di una variabile sono
associati ad alti valori o punteggi dell’altra variabile; oppure bassi valori
o punteggi in una sono associati a bassi valori o punteggi in un’altra.
Nella correlazione negativa bassi valori o punteggi in una variabile sono
correlati ad alti valori o punteggi dell’altra e viceversa.
Per valutare la forza o la dimensione di una correlazione si considera il
coefficiente senza segno (es. 0,63) e il valore di p (inferiore a 0,05).
Più il valore del coeffinciente è vicino a 1 più alta e forte è la
correlazione.
• 0,90-1,00 molto alta
• 0,89-0,70 alta
• 0,69-0,50 moderata
• 0,49-0.26 bassa
• 0,25-0,00 piccola o nessuna
UTILIZZO DELLA STATISTICA PER ESAMINARE RELAZIONI
CORRELAZIONE DI PEARSON
La correlazione di Pearson detta anche «r di Pearson» è una tecnica di
correlazione comune che si utilizza per esaminare le relazioni tra due
variabili. È una procedura parametrica che utilizza dati intervallari o di
rapporto.
Si possono presentare le correlazioni in tabella, chiamata matrice di
correlazione, o nel testo.
Correlazione tra fattori predisponenti e comportamenti di sesso sicuro
1 2 3 4 5 6
1 Autostima 1,00
2 LOC interno 0,21* 1,00
3 LOC in cambiamento -0,14* 0,21* 1,00
4 Suscettibilità percepita -0,17** -0,08 0,04 1,00
5 Atteggiamenti verso il condom 0,08 0,02 0,15** 0,05 1,00
6 Atteggiamenti di sesso sicuro -0,08 0,16** 0,01 -0,05 0,38* 1,00
*p < 0,01; **p < 0.05
CORRELAZIONE DI PEARSON PRESENTATE SENZA TABELLA
UTILIZZO DELLA STATISTICA PER ESAMINARE RELAZIONI
Le correlazioni di Pearson sono state utilizzate per esaminare le
relazioni tra le variabili dello studio, gli anni di assistenza forniti dalla
famiglia a un genitore anziano e lo status socio-economico della
famiglia. Gli anni di assistenza erano negativamente e
significativamente correlati con il benessere della famiglia, r = -0,23,
p<0,05 ma con nessuna delle variabili indipendenti. Lo status socio-
economico era significativamente correlato con le risorse interne
della famiglia, r = 0,25, p<0,05 e il benessere della famiglia, r = 0,40,
p< 0,01.
LETTURA CRITICA
• Gli anni di assistenza con il benessere della famiglia = r 0,23 e p<0,05
Più era il tempo da quando veniva fornita assistenza a un genitore anziano
meno era il benessere della famiglia
• Lo status socio-economico con le risorse interne della famiglia = r
0,25, p<0,05 e con il benessere della famiglia = r 0,40, p< 0,01
Più alto era il livello socio economico più era forte il senso di forza
interna e di capacità a lavorare insieme nella risoluzione dei problemi e
più alto il benessere della famiglia.
UTILIZZO DELLA STATISTICA PER ESAMINARE RELAZIONI
T-TEST
È una procedura statistica inferenziale utilizzata per determinare se le
medie di due gruppi sono significativamente differenti.
GRUPPO 1
Impianto arteria mammaria interna
GRUPPO 2
Impianto della vena safena
4
3
5
6
8
-------
Score dolore 26
M 5,2
6
5
8
7
10
-------
Score dolore 36
M 7,2
Voglio conoscere se i pazienti sottoposti a bypass aorto-coronarico con
impianto dell’arteria mammaria interna, hanno più dolore toracico
postoperatorio rispetto ai pazienti in cui è stata impiantata la vena
safena. La variabile «dolore toracico» è misurata su una scala di rapporto
che utilizza una scala visiva analogica (VAS).
UTILIZZO DELLA STATISTICA PER ESAMINARE RELAZIONI
T-TEST
GRUPPO 1
Impianto arteria mammaria interna
GRUPPO 2
Impianto della vena safena
4
3
5
6
8
-------
Score dolore 26
M 5,2
6
5
8
7
10
-------
Score dolore 36
M 7,2
Osservando le medie si può constatare che il gruppo con l’impianto della
v. safena aveva un dolore più intenso nel post-operatorio rispetto
all’altro gruppo.
Il quesito statistico diventa…
La differenza fra le due medie dei campioni è abbastanza ampia da
permettere di concludere che anche le medie della popolazione
differiscono l’una dall’altra?
UTILIZZO DELLA STATISTICA PER ESAMINARE RELAZIONIT-TEST
Il t-test può rispondere al quesito purché si rispettino le condizioni dei
test parametrici (v. dipendente su scala intervallare o di rapporto,
distribuzione normale dei valori, gruppi indipendenti) ed un ulteriore
condizione ossia che le variabili dipendenti in entrambi i gruppi devono
avere una varianza simile (omogeneità della varianza)
FORME DEL T-TEST
Esistono due tipi di T-Test:
• per gruppi indipendenti, quando i valori o punteggi in un gruppo non
hanno alcuna relazione logica con i valori o punteggi di un altro
gruppo. Se i gruppi hanno delle varianze significativamente differenti
(violata la condizione di omogeneità della varianza), si utilizza una
procedura più prudente, calcolando t-test separati.
• per gruppi dipendenti, detto anche per gruppi correlati o appaiati è
utilizzato per le situazioni in cui i punteggi in un primo gruppo hanno
una qualche associazione con i punteggi del secondo gruppo (es.
quando faccio un pre e post-test in cui misuro un singolo gruppo due
volte).
Il lettore critico non deve per forza sapere come calcolare le varie forme di T-Test o
come utilizzare le tabelle per determinare se esiste una differenza significativa.
Piuttosto deve andare a valutare i valori di p, se il livello di probabilità è inferiore a
0,05 esiste una differenza significativa tra le due medie.
UTILIZZO DELLA STATISTICA PER ESAMINARE RELAZIONI
ANALISI DELLA VARIANZA
• L’analisi della varianza (ANOVA) serve per determinare se esiste una
differenza significativa tra 3 o più medie. In sostanza sostituisce il T-
Test se sono presenti più di due gruppi in cui confrontare le M.
• Un’ANOVA semplice o a una via si riferisce a una variabile
indipendente con diversi livelli.
• L’ANOVA a più vie rappresenta due variabili indipendenti con diversi
livelli.
• La variabile dipendente deve essere misurata su scala nominale.
• Nell’ANOVA viene determinato se la varianza tra gruppi è maggiore
rispetto alla varianza all’interno dei gruppi. Se la varianza tra gruppi è
maggiore di quella all’interno dei gruppi, le medie dei gruppi sono
significativamente differenti. Se la varianza tra i gruppi è uguale o
inferiore a quella all’interno dei gruppi allora le medie dei gruppi non
sono significativamente differenti.
• La funzione F indica la dimensione delle differenze all’interno di ogni
gruppo. Più grande è la F (più grande la varianza tra gruppi) maggiore
è la probabilità di trovare una differenza statisticamente significativa
tra le medie dei gruppi.
UTILIZZO DELLA STATISTICA PER ESAMINARE RELAZIONI
ANALISI DELLA VARIANZA
Fonte di variazione SQ GL MQ F
Tra gruppi 55,6 2 27,8 23,16*
All’interno dei gruppi 14,4 12 1,2
Totale 70,0 14
Note: *p<0,05; SQ somma dei quadrati; GL gradi di libertà; MQ medie
quadratiche; F funzione F
Il valore che il lettore deve osservare è la F; se si trova una differenza
significativa tra le medie dei campioni, un asterisco vicino al valore F
indica la significatività. Nell’esempio esiste una reale differenza tra le
medie dei campioni studiati.
UTILIZZO DELLA STATISTICA PER ESAMINARE RELAZIONI
CHI QUADRO (NON PARAMETRICO)
• È il test che confronta le frequenze osservate (numero reale in ogni
categoria), con le frequenze teoriche (basate sulla teoria o
esperienze passate).
• Il chi quadro è un test statistico appropriato quando le variabili sono
misurate su una scala nominale in cui il ricercatore va a misurare il
numero di eventi verificatisi in ogni categoria.
• Le condizioni per usare il chi quadro sono: a) dati sintetizzati in
frequenze, b) le categorie devono escludersi a vicenda, c) deve
esistere una base teorica per categorizzare le variabili.
• Il chi quadro utilizza dati su scale nominale (categorici) e mette a
confronto frequenze e non medie.
• Viene utilizzato quando i dati raccolti nello studio non hanno una
distribuzione normale e violano le condizioni per l’utilizzo dei test
parametrici.
UTILIZZO DELLA STATISTICA PER ESAMINARE RELAZIONI
CHI QUADRO (NON PARAMETRICO)
Esistono due tipi di test chi quadro:
1. per un campione si utilizza ad esempio se voglio confrontare il
numero di parte cesarei in un ospedale X (frequenze reali) con il
numero di parti cesarei riferiti a tutti gli ospedali (frequenze
teoriche).
2. per campioni indipendenti per determinare se due variabili
categoriche sono indipendenti l’una dall’altra (esempio glicemia a
digiuno in gruppo sperimentale che segue un programma di
educazione alimentare e gruppo di controllo che non segue il corso.
La glicemia viene misurata in genere su una scala intervallare o di
rapporto ma per applicare il chi quadro la portiamo su una scala
ordinale o nominale, creando 2 categorie con valori o superiori o
inferiori a 120mg/dl)
CRITICA STATISTICA DESCRITTIVA E INFERENZIALE
• La statistica descrittiva utilizzata è stata appropriata?
La statistica descrittiva deve riportare misure di tendenza centrale e di
dispersione. Essa sintetizza dati numerici importanti e non fa inferenza
sui dati
• La statistica descrittiva riportata è appropriata per il livello di
misurazione di ogni variabile?
I dati nominali e ordinali possono essere descritti come frequenze, i dati
intervallari e di rapporto possono essere sommati o sottratti. I test di
inferenza statistica che richiedono calcoli matematici possono essere
applicati solo a variabili su scala intervallare e di rapporto. Quasi
sempre le scale psicologiche vengono considerate su scala intervallare.
• La statistica utilizzata è appropriata per rispondere alle domande
di ricerca o testare delle ipotesi?
La statistica nella ricerca serve a tre obiettivi principali: descrivere i
dati, esaminare relazioni tra variabili e verificare l’esistenza di
differenze tra gruppi. Non bisogna rimanere bloccati di fronte ai vari
test statistici riportati in uno studio di ricerca. Se una tecnica non è
familiare, è necessario andare a rivederla. Se vengono riportate delle
tabelle bisogna osservare i dati che vi sono elencati e identificare se
l’autore ha descritto i risultati nel testo.
CRITICA STATISTICA DESCRITTIVA E INFERENZIALE
• La numerosità del campione è adeguata?
Per conoscere la dimensione del campione necessaria all’esecuzione di
un’accurata analisi statistica, può essere utile l’analisi della potenza.
Bisogna controllare se è stata eseguita questa procedura.
• Se sono utilizzate tabelle, i risultati sono chiari e completi?
Bisogna osservare le tabelle nel loro insieme prima di focalizzarsi su
informazioni specifiche. Tutte le tabelle devono essere adeguatamente
introdotte nel rapporto di ricerca, con le indicazioni dell’autore per
fare attenzione ai dati specifici. Il titolo della tabella ne descrive con
chiarezza il contenuto? I dati numerici della tabella sono stati sottoposti
a test di significatività? Qualora questo fosse avvenuto, i test sono
riportati in modo appropriato per poter meglio interpretare i risultati?