alcune note su test non parametrici e loro...
TRANSCRIPT
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
1
Alcune note su
test non parametrici e
loro applicazioni (PARTE I)
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
2
I metodi più comunemente usati per effettuare analisi inferenziali sono
costituiti da tecniche parametriche. Con statistica parametrica si
intendono quelle tecniche statistiche basate su assunzioni circa la
distribuzione della popolazione da cui viene selezionato il campione. Data
l’ipotesi sulla distribuzione, l’analisi statistica consiste nell’eseguire
inferenza sui parametri di quella popolazione. Ad esempio, se si assume
la normalità di una distribuzione, dato che la normale è completamente
identificata dalla sua media e della sua varianza, studiare le proprietà di
quella popolazione consiste nel fare inferenza (costruire intervalli di
confidenza e/o verificare ipotesi) sulla media, sulla varianza o su
entrambi.
L’assunzione sulla distribuzione è essa stessa cruciale per eseguire le
analisi statistiche.
Per esempio, per eseguire un t test per la verifica di ipotesi su una media,
è necessario assumere che i dati campionari provengano da una
popolazione normalmente distribuita.
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
3
Problemi:
Cosa possiamo fare se dall’osservazione di un normal probability plot o di
un istogramma ci accorgiamo che la distribuzione è ben lungi dalla
normalità e il numero di osservazioni non ci consente di invocare il
teorema limite centrale?
Cosa possiamo fare se la scala di misurazione delle variabili di interesse è
qualitativa? (Si ricordi che le scale di misurazione, tra cui le scale Likert, che vengono usate
per misurare la soddisfazione, l’importanza, l’accordo, l’emozione, ecc. sono
tutte di tipo qualitativo. Quando su di esse si applicano le tecniche statistiche
standard, si fanno delle assunzioni rilevanti e non necessariamente verificate su
di esse).
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
4
Metodi statistici non parametrici. Le tecniche statistiche non parametriche richiedono meno ipotesi sulla
distribuzione e sui parametri della popolazione da cui è estratto il
campione.
Talvolta queste tecniche sono chiamate distribution free perché possono
essere usate qualunque sia la forma della distribuzione della variabile di
interesse.
Nel caso di verifica di ipotesi, questa potrà sempre riguardare un
parametro della popolazione ma il modello di riferimento sarà non
parametrico (cioè non sarà identificato da uno o più parametri, come
invece accade per la distribuzione normale che è identificata da due
parametri)
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
5
Principali vantaggi delle tecniche non parametriche:
- in alcuni casi non c’è alternativa al loro uso;
- alcuni test non parametrici possono essere usati per variabili
qualitative sconnesse;
- alcuni test non parametrici possono essere usati per variabili
qualitative ordinate;
- quando i campioni sono piccoli, i calcoli per i test non parametrici
sono più semplici rispetto ai calcoli per i test parametrici;
- in molti casi, i test non parametrici consentono di ottenere valori di
probabilità (ad es. il p-value) esatti, cioè senza approssimazioni.
L’uso delle tecniche non parametriche ha anche alcuni svantaggi:
- i test non parametrici non sono così diffusi (e quindi disponibili su
software) come i test parametrici;
- nel caso di grandi campioni, i calcoli possono diventare lunghi e
tediosi.
I test non parametrici sono moltissimi. Noi considereremo i seguenti:
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
6
Test non parametrici
1 campione
2 c
am
pio
ni
3 o più campioni
Test dei
segni
Test di
Wilcoxon
Test di
Wilcoxonper
campioni
appaiati
Test di
Mann-Whitney per campioni
indipendenti
Test di
Kruskal-Wallis
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
7
1. TEST A UN CAMPIONE
Tutti i test che prenderemo in considerazione si occupano della verifica di
ipotesi riguardanti un parametro di posizione della popolazione X che si
suppone continua. Il parametro di posizione su cui si concentra
l’attenzione è la mediana in quanto: 1) la mediana è più robusta della
media rispetto a valori anomali; 2) tutte le distribuzioni continue
possiedono la mediana.
Si ricordi che, data una distribuzione continua, la mediana (indichiamola
con θ) è quella modalità del carattere tale
F(θ)=1/2 ossia P(X > θ) = P(X < θ) = 1/2.
L’ipotesi nulla da verificare è H0: θ = θ0
L’ipotesi alternativa potrà essere:
unilaterale H1: θ > θ0 o H1: θ < θ0
oppure bilaterale H1: θ ≠ θ0
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
8
Test dei segni Se l’ipotesi nulla è vera ci aspettiamo, al livello di dati osservati (ossia di
determinazioni x della variabile X), che circa la metà di essi sia più grande
di θ0 e circa la metà di essi sia più piccola di θ0.
Operativamente, invece che sulla variabile X, è più comodo lavorare sui
suoi scarti dalla mediana ipotizzata θ0, ossia sulla variabile D = X – θ0
Se è vera l’ipotesi nulla H0: θ = θ0, allora la mediana di D sarà pari a zero
in quanto
P(D > 0) = P(X – θ0 > 0) = P(X > θ0) = ½ e (1)
P(D < 0) = P(X – θ0 < 0) = P(X < θ0) = ½
Al livello di dati osservati (ossia di determinazioni d della variabile D), ci
aspettiamo che se l’ipotesi nulla è verificata, la metà circa di esse sia
maggiore di zero e la metà circa di esse sia minore di zero.
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
9
Per ogni determinazione d della v.a. D = X – θ0 assegniamo:
- valore 1 se d>0 (ossia se x è più grande della mediana ipotizzata θ0)
- valore 0 se d<0 (ossia se x è più piccola della mediana ipotizzata θ0)
e indichiamo con Ψ(D) la corrispondente variabile, ossia
( )1 se >0
0 se <0
dd
d
Ψ =
Esempio1: un’azienda romana produce brioche da colazione e
distribuisce i suoi prodotti nei bar della capitale. Crea un nuovo tipo di
brioche e decide di verificare se esso incontra i gusti dei consumatori
sperimentandone la vendita in alcuni bar di Roma. A un mese dalla messa
in commercio decide di monitorare per 10 giorni le quantità totali vendute
in questi bar. L’azienda si pone come target di vendere almeno 190
brioche nell’ora di punta.
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
10
Disponiamo solamente di un campione piccolo e quindi abbiamo bisogno
di effettuare un test che non si appoggi sull’ipotesi di normalità.
La nostra azienda ha il seguente problema di verifica di ipotesi:
H0: θ = 190
H1: θ > 190
Vediamo i dati e di conseguenti conti: Giorno Brioche vendute
(xi)
D = X – 190
(di) Ψ(di)
1 301 111 1
2 198 8 1
3 278 88 1
4 205 15 1
5 249 59 1
6 410 220 1
7 360 170 1
8 124 -66 0
9 253 63 1
10 191 1 1
Osserviamo che
solamente in un giorno
su 10 il numero di
brioche vendute rimane
sotto il target di 190.
Questo risultato ci
consente di concludere
che l’obiettivo è stato
raggiunto?
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
11
In sostanza Ψ(D) è una variabile bernoulliana in quanto assume valori 0 e
1. Indichiamo con π la probabilità di successo, ossia la probabilità che
Ψ(D) sia uguale 1.
Sotto l’ipotesi nulla H0: θ = θ0 la metà delle volte la variabile bernoulliana
è pari a 1 e la metà delle volte è pari a 0, cioè se H0 questa variabile
bernoulliana ha parametro π = ½ in quanto, come si vede dalla (1), è pari
a ½ la probabilità D sia maggiore di zero.
Sommiamo il numero di successi (cioè il numero di volte che le
osservazioni superano la mediana postulata θ0). Indichiamo con S questa
somma. Questa è la somma di n variabili bernoulliane indipendenti.
Sappiamo che la somma di n variabili bernoulliane indipendenti di
parametro π è una variabile binomiale Bin(n, π).
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
12
Pertanto il nostro problema di ipotesi originario
H0: θ = θ0
H1: θ > θ0
si riduce al seguente
H0: π = ½
H1: π > ½
La statistica test è data da S, ossia dal numero di volte che la variabile X è
maggiore della mediana postulata θ0 . Sappiamo che S ha distribuzione
binomiale.
Questo risultato consente di poter risolvere il problema di ipotesi sia
quando il campione è piccolo (e non si può ricorrere ad approssimazioni
normali) sia quando il campione è grande1.
1 E’ stato dimostrato che i test non parametrici sono sempre più efficienti (anche molto) dei test paramatrici che
poggiano sull’ipotesi di normalità quando la distribuzione della variabile di interesse non è normale anche
quando la dimensione campionaria è grande. Nel caso in cui la distribuzione della variabile di interesse sia
normale, i test non parametrici sono tanto efficienti (o quasi) quanto i corrispettivi test parametrici. Considerate
due statistiche test e, fissato lo stesso livello di significatività, un test si dice più efficiente se gli corrisponde
una maggiore probabilità di rifiutare l’ipotesi nulla quando l’ipotesi nulla è falsa (detta potenza del test).
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
13
In generale i diversi set di ipotesi visti
0 0
1 0
:
:
H
H
θ θ
θ θ
=
> 0 0
1 0
:
:
H
H
θ θ
θ θ
=
< 0 0
1 0
:
:
H
H
θ θ
θ θ
=
≠
possono essere riformulati
0
1
: 1 2
: 1 2
H
H
π
θ
=
> 0
1
: 1 2
: 1 2
H
H
π
θ
=
< 0
1
: 1 2
: 1 2
H
H
π
θ
=
≠
La scelta tra le due ipotesi avviene mediante calcolo delle zone di rifiuto e
di accettazione oppure mediante il calcolo del livello di significatività
osservato (p-value).
Con riferimento al p-value2, questo può essere calcolato usando: la
distribuzione binomiale se il campione ha bassa numerosità; usando
l’approssimazione della binomiale alla normale se il campione ha
numerosità più elevata.
2 Mostriamo solo applicazioni basate sul p-value in quanto costituisce l’output che in automatico viene fornito
dai software.
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
14
Torniamo al nostro esempio. Il numero di valori campionari maggiori di
θ0 = 190 è pari a 9 (S = 9). I dati supportano il fatto che il target di 190
brioche vendute nell’ora di punta sia stato raggiunto? Sign Test for Median: brioches vendute Sign test of median = 190,0 versus > 190,0
N Below Equal Above P Median
brioches vendute 10 1 0 9 0,0107 251,0
vediamo che la mediana del nostro campione è 251.
Inoltre troviamo che il valore P (livello di significatività osservato) è pari
a 0.0107, cioè il test è significativo e la mediana risulta essere
significativamente maggiore della mediana postulata (190).
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
15
Vediamo come eseguire il test usando il software Minitab:
Il test dei segni in
Minitab è indicato
come
1-Sample Sign
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
16
La finestra di dialogo
chiede solamente:
- la specificazione del
valore postulato della
mediana “Test
median”(nel nostro
esempio è 190) e
- la specificazione del
tipo di ipotesi
alternativa “Alterntive”
(se unilaterale > allora
“greater than”, se
unilaterale < allora
“less than”, se
bilaterale allora “note
qual”)
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
17
Test dei ranghi segnati di Wilcoxon
Ranghi
Consideriamo l’esempio1.
Giorno Brioche vendute
(xi)
Rango
(ri)
1 301 8
2 198 3
3 278 7
4 205 4
5 249 5
6 410 10
7 360 9
8 124 1
9 253 6
10 191 2
L’idea dei ranghi è quella di guardare non al valore preciso della modalità
ma solamente alla posizione occupata nella lista ordinata dei dati.
Il rango di una osservazione è il
posto occupato da questa
osservazione nella sequenza
ordinata dei dati (dal valore più
piccolo al valore più grande).
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
18
In generale, dato un campione casuale (X1,...,Xi,...,Xn) ed una sua
determinazione campionaria (x1,...,xi,...,xn), a questa possiamo associare
(r1,...,ri,...,rn) dove ri rappresenta la posizione occupata dall’osservazione
xi nella lista ordinata di x1,...,xi,...,xn.
Test dei ranghi segnati di Wilcoxon
Il test dei segni effettua una verifica di ipotesi sulla mediana usando
informazione molto basilare: il numero di osservazioni che sono più
grandi del valore mediano ipotizzato.
Vediamo, ora, un altro test che invece riesce a considerare in qualche
misura anche l’entità dello scarto rispetto alla mediana ipotizzata.
L’entità di questo scarto viene calcolata mediante i ranghi.
La condizione affinché il test possa essere eseguito è che la variabile di
interesse X abbia distribuzione continua e simmetrica.
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
19
Torniamo al nostro esempio.
Il set di ipotesi è
0
1
: 190
: 190
H
H
θ
θ
=
>.
Se la mediana delle brioche vendute supera veramente il valore 190,
allora ci aspettiamo:
1) di avere molte osservazioni maggiori di 190 e
2) che queste presentino valori molto più grandi.
In altre parole ci aspettiamo che:
1) i valori superiori a 190 siano molti di più e
2) che questi siano anche molto più lontani da 190 di quanto lo siano i
valori inferiori a 190.
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
20
Per mettere in formule questo ragionamento dobbiamo:
1. come fatto per il test dei segni, associare ad ogni dato xi o il valore 0
se questo è minore di 190 o il valore 1 se questo è maggiore di 190. E
abbiamo già visto che indichiamo con Ψ(di) questa trasformazione;
2. misurare in valore assoluto l’entità degli scarti dalla mediana
postulata (|D|=|X – 190|). In questo modo si può avere una misura
della lontananza assoluta di ciascuna osservazione da 190;
3. calcolare i ranghi corrispondenti a questi valori assoluti (ossia
scrivere la loro posizione nell’elenco ordinato in modo crescente)
4. misurare la lontananza dalla mediana delle sole osservazioni che la
superando, sommando i ranghi degli scarti ad essi associati.
Torniamo al nostro esempio.
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
21
Si ottiene la seguente tabella Giorno Brioche vendute
(xi)
D = X – 190
(di) Ψ(di) |D| = |X – 190|
(|di|)
Rango di |di|
(ri) riΨ(di)
1 301 111 1 111 8 8
2 198 8 1 8 2 2
3 278 88 1 88 7 7
4 205 15 1 15 3 3
5 249 59 1 59 4 4
6 410 220 1 220 10 10
7 360 170 1 170 9 9
8 124 -66 0 66 6 0
9 253 63 1 63 5 5
10 191 1 1 1 1 1
49
Le due informazioni “essere sopra la mediana”+”entità dello scarto dalla
mediana in modulo” vengono sintetizzate sommando i ranghi degli scarti
in modulo delle sole osservazioni sopra la mediana postulata (190):
vediamo nel nostro esempio che l’osservazione n. 8 non entra nella
somma perché nell’ottavo giorno le brioche vendute sono meno di 190.
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
22
In formule possiamo scrivere la statistica test come segue:
( )1
n
i ii
W r d+
=
= Ψ∑
nel nostro esempio W+ = 49.
Come decidere sulla base di questo valore?
Innanzitutto possiamo, sulla scorta delle considerazioni viste per il test dei
segni, dire che se H0 non è vera e cioè se (nel nostro esempio) la mediana
è maggiore di 190, allora ci si attende che le osservazioni superino la
mediana in più della metà dei casi. Ciò ha come conseguenza che anche
Ψ(di) sia pari a 1 nel maggior parte dei casi (con probabilità maggiore di
½). Guardando la formula ne deriva che nella maggior parte dei casi i
prodotti riΨ(di) assumono valori positivi e quindi la loro somma sarà più
elevata.
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
23
Come decidere se questo valore della statistica test è sufficientemente
grande per far rifiutare l’ipotesi?
Occorre conoscere la distribuzione di W+.
Non ci soffermiamo su questo aspetto ma solo su tre caratteristiche
principali di W+ e della sua distribuzione.
1. W+ può assumere qualunque valore intero compreso tra 0 e
( )1
2
n n +;
2. la statistica test W+ ha valore atteso ( )
( )1E
4
n nW
+ += ;
3. la statistica test W+ ha varianza ( )
( )( )1 2 1Var
24
n n nW
+ + += .
Tornando al nostro esempio vediamo che il valore osservato della
statistica test è 49 ed è molto più grande del suo valore atteso che nel
nostro esempio è E(W+) = 27.5.
Concludiamo la nostra valutazione eseguendo il test con Minitab.
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
24
Il test dei ranghi
segnati di Wilcoxon
in Minitab è indicato
come
1-Sample Wilcoxon
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
25
La finestra di dialogo
chiede solamente:
- la specificazione del
valore postulato della
mediana “Test
median”(nel nostro
esempio è 190) e
- la specificazione del
tipo di ipotesi
alternativa “Alterntive”
(se unilaterale > allora
“greater than”, se
unilaterale < allora
“less than”, se
bilaterale allora “note
qual”)
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
26
Wilcoxon Signed Rank Test: brioches vendute Test of median = 190,0 versus median > 190,0
N for Wilcoxon Estimated
N Test Statistic P Median
brioches vendute 10 10 49,0 0,016 251,0
vediamo che la mediana del nostro campione è 251.
Vediamo che il valore della statistica test di Wilcoxon è 49 così come da
noi calcolato.
Inoltre troviamo che il valore P (livello di significatività osservato) è pari
a 0.016, cioè il test è significativo quindi la mediana risulta essere
significativamente maggiore della mediana postulata (190).
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
27
In generale i diversi set di ipotesi visti
0 0
1 0
:
:
H
H
θ θ
θ θ
=
>
0 0
1 0
:
:
H
H
θ θ
θ θ
=
<
0 0
1 0
:
:
H
H
θ θ
θ θ
=
≠
La statistica test è data dalla somma dei ranghi (posti occupati nella lista
ordinata degli scarti in modulo da θ0 ) associati alle sole osservazioni più
grandi di 0θ .
In formule:
( )1
n
i ii
W r d+
=
= Ψ∑ .
La statistica test W+ rifiuta l’ipotesi nulla di uguaglianza rispetto ad una
mediana ipotizzata quando W+ assume un valore molto lontano rispetto
alla sua media ( ) ( )E 1 4W n n+
= + .
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
28
In particolare:
- quando il test è unilaterale destro (>) allora si rifiuta H0 quando W+
assume un valore molto più grande di E(W+);
- quando il test è unilaterale sinistro (<) allora si rifiuta H0 quando W+
assume un valore molto più piccolo di E(W+)
3;
- quando il test è bilaterale (≠) allora si rifiuta H0 quando W+ assume un
valore molto lontano (in positivo o in negativo) da E(W+).
3 Ciò accade perché se H0 è falsa e cioè la vera mediana è più piccola di θ0 allora:1) sono poche le osservazioni
con valore maggiore di θ0; 2) queste ultime hanno valore che eccede di poco θ0 e quindi hanno rango basso.
Quindi la somma dei ranghi degli scarti in modulo da θ0 corrispondenti alle poche osservazioni maggiori di θ0
sarà molto bassa.
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
29
La decisone di accettare o rifiutare l’ipotesi nulla viene presa mediante il
P-value.
Il P-value viene calcolato
- usando la distribuzione esatta (implementata in molti software) se il
campione ha bassa numerosità;
- usando l’approssimazione alla normale se il campione ha numerosità
più elevata in quanto è stato dimostrato che
( )
( )
( )
( )( )
1E
4
1 2 1Var
24
n nWW W
n n nW
++ +
+
+−−
=+ +
converge ad una distribuzione N(0,1).
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
30
Il caso delle osservazioni alla pari (Ties)
Alla base dei test qui presentati c’è l’ipotesi che le variabili abbiano
distribuzione continua. Ciò implica che sia nulla la probabilità di avere
due osservazioni uguali (“alla pari”).
Nella pratica però può capitare (anche spesso) di avere più osservazioni
uguali. Ciò avviene per due motivi fondamentali:
1. la variabile studiata è quantitativa ma, poiché i valori osservati
vengono registrati con al massimo una o due cifre decimali, si
possono avere alcune osservazioni coincidenti;
2. la variabile studiata è quantitativa discreta (assume un numero finito
di valori possibili) o è una scala di misurazione (quale ad. es. la scala
Likert) e allora si possono avere molte osservazioni coincidenti.
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
31
Cosa fare quando capitano osservazioni alla pari?
La prassi principalmente applicata prevede che si assegni a tutti i valori
identici la media dei loro ranghi.
Esempio2: chiediamo il tempo di attesa (in minuti) prima di essere serviti
a 10 clienti di una banca e ci rispondono:
Tempo di attesa 15 8 4 5 4 3 2 7 8 10
alcune modalità si presentano più volte (l’attesa di 4 e di 3 minuti).
Mettiamo in ordine le osservazioni e scriviamo anche il loro rango:
Tempo di attesa
(ordinato) 2 3 4 4 5 7 8 8 10 15
Posto
nell’ordine 1 2 3 4 5 6 7 8 9 10
Rango
assegnato 1 2 3.5 3.5 5 6 7.5 7.5 9 10
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
32
Consideriamo questo stesso esempio. Tempo di attesa 15 8 4 5 4 3 2 7 8 10
Supponiamo che il tempo mediano di attesa dichiarato sia di 5 minuti.
Alla luce dei dati osservati, studiamo se effettivamente la mediana della
distribuzione è pari a 5.
Abbiamo il seguente sistema di ipotesi:
0
1
: 5
: 5
H
H
θ
θ
=
≠
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
33
Wilcoxon Signed Rank Test: attesa Test of median = 5,000 versus median not = 5,000
N for Wilcoxon Estimated
N Test Statistic P Median
attesa 10 9 32,5 0,260 6,000
La mediana stimata è 6 minuti ma non differisce significativamente dalla
mediana dichiarata pari a 5 minuti.
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
34
2. TEST A DUE CAMPIONI
Come nel caso dell’inferenza parametrica, quando si effettua il confronto
tra due popolazioni si possono avere due situazioni diverse:
- i campioni sono appaiati;
- i campioni sono indipendenti.
Occupiamoci dei test non parametrici per l’analisi di queste due
situazioni.
Test dei ranghi segnati di Wilcoxon per campioni appaiati
Molto spesso (nelle applicazioni sociali, economiche, aziendali e
sperimentali, ecc.) è necessario eseguire il confronto tra due campioni
(X1,...,Xn) e (Y1,...,Yn) di misure effettuate sulle stesse unità statistiche.
Molto spesso capita di misurare una stessa caratteristica su uno stesso
campione di unità in due tempi diversi (eventualmente prima e dopo il
verificarsi di un certo evento, ad es. prima e dopo l’applicazione di una
decisione manageriale o di una nuova strategia di
marketing/comunicazione ecc.).
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
35
Riprendiamo l’Esempio1.
Un’azienda romana produce brioche da colazione e distribuisce i suoi
prodotti nei bar della capitale. Questa decide di continuare la produzione
della nuova brioche dopo avere visto che le vendite superano la soglia
della mediana pari a 190.
L’azienda, volendo far crescere le vendite della nuova brioche, decide di
lanciare una campagna pubblicitaria. In via sperimentale decide di fare
questa pubblicità nella stessa zona in cui si trovano i bar rilevati nella
prima indagine. Dopo un mese, rileva per 10 giorni la quantità di brioche
vendute in questi bar nell’ora di punta. Si ottengono i seguenti dati: Giorno 1 2 3 4 5 6 7 8 9 10
Brioche vendute
prima della campagna
pubblicitaria
(xi)
301 198 278 205 249 410 360 124 253 191
Brioche vendute dopo la
campagna pubblicitaria
(yi) 374 187 332 212 243 478 386 141 251 265
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
36
La domanda a cui dobbiamo rispondere è:
C’è stato un incremento significativo della quantità di brioche vendute a
seguito della campagna pubblicitaria?
L’idea è quella di utilizzare la stessa tecnica vista per il test parametrico
per il confronto tra medie per campioni appaiati.
In sostanza, non lavoriamo separatamente sulle due variabili X e Y ma
sulla loro differenza D =Y – X.
In questo modo possiamo utilizzare il test dei ranghi segnati di Wilcoxon
visto per il caso di un solo campione.
Se la campagna pubblicitaria non ha avuto effetto allora ci aspettiamo che
la distribuzione di D sia centrata nel valore 0, ossia che la mediana della
distribuzione di D sia θ = 0.
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
37
Se invece la campagna pubblicitaria ha avuto successo allora le vendite
devono essere aumentate e quindi la distribuzione di D (n° brioche
vendute dopo la campagna – n° brioche vendute prima della campagna)
deve essere concentrata su valori maggiori di zero. In simboli, la mediana
della distribuzione di D sia θ > 0.
Il problema di ipotesi che sostanzialmente ci stiamo ponendo è del tipo
0
1
: 0
: 0
H
H
θ
θ
=
>
A scopo illustrativo mostriamo i calcoli che vengono eseguiti.
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
38
Giorno Brioche
vendute
prima della
campagna
pubblicitaria
(xi)
Brioche
vendute
dopo la
campagna
pubblicitaria
(yi)
D = Yi – Xi
(di) Ψ(di) |D|
(|di|)
Rango di |di|
(ri) riΨ(di)
1 301 374 73 1 73 9 9
2 198 187 -11 0 11 4 0
3 278 332 54 1 54 7 7
4 205 212 7 1 7 3 3
5 249 243 -6 0 6 2 0
6 410 478 68 1 68 8 8
7 360 386 26 1 26 6 6
8 124 141 17 1 17 5 5
9 253 251 -2 0 2 1 0
10 191 265 74 1 74 10 10
48
Quindi la statistica test è: ( )1
48n
i ii
W r d+
=
= Ψ =∑
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
39
Utilizziamo anche Minitab4 per eseguire i calcoli e per ottenere il valore
P. Si ha :
Wilcoxon Signed Rank Test: dopo-prima Test of median = 0,000000 versus median > 0,000000
N for Wilcoxon Estimated
N Test Statistic P Median
dopo-prima 10 10 48,0 0,021 31,00
Come vediamo il valore P è piuttosto piccolo e quindi possiamo ritenere
che i dati ci forniscano sufficiente evidenza per rifiutare l’ipotesi nulla e
quindi per concludere che la campagna pubblicitaria ha prodotto un
incremento significativo delle vendite.
4 Poiché il test per campioni appaiati prevede che l’analisi venga eseguita su una sola variabile (data dalla
differenza delle due variabili in input), il comando in Minitab da scegliere è 1-Sample Wilcoxon.
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
40
In generale il test dei ranghi segnati di Wilcoxon per campioni appaiati
può essere eseguito quando:
1) i campioni sono selezionati in modo casuale,
2) le distribuzioni di riferimento sono entrambe simmetriche.
In generale, possiamo scrivere che il test dei ranghi segnati di Wilcoxon
per campioni appaiati, si occupa dei seguenti possibili set di ipotesi
0
1
: 0
: 0
H
H
θ
θ
=
> 0
1
: 0
: 0
H
H
θ
θ
=
< 0
1
: 0
: 0
H
H
θ
θ
=
≠
Nota: guardando i tre set di ipotesi si può pensare che le distribuzioni di
X e di Y debbano avere la stessa identica forma e che a differire
possa essere solo il parametro di locazione (cioè la mediana).
Questa sarebbe un’ipotesi alquanto restrittiva per poter essere
sempre verificata in pratica.
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
41
In realtà il test di Wilcoxon si applica a contesti molto più generali e
quindi le ipotesi che effettivamente vengono messe a confronto sono:
0
1
: le misurazioni nei due tempi hanno la stessa distribuzione
: le misurazioni sono sistematicamente più grandi nel secondo campione
H
H
invece di 0
1
: 0
: 0
H
H
θ
θ
=
>
0
1
: le misurazioni nei due tempi hanno la stessa distribuzione
: le misurazioni sono sistematicamente più piccole nel secondo campione
H
H
invece di 0
1
: 0
: 0
H
H
θ
θ
=
<
0
1
: le misurazioni nei due tempi hanno la stessa distribuzione
: le misurazioni sono sistematicamente diverse nei due campioni
H
H
invece di 0
1
: 0
: 0
H
H
θ
θ
=
≠
Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard
42
La statistica test è data dalla somma dei ranghi (posti occupati nella lista
ordinata delle differenze |Y – X|) associati alle sole differenze positive.
In formule:
( )1
n
i ii
W r d+
=
= Ψ∑ .
Infine il valore P viene calcolato in modo esatto oppure mediante
l’approssimazione normale a seconda della numerosità campionaria.
Caso1 (parità interna a una coppia). Se per una coppia di osservazioni
si ha che la differenza è zero (cioè la misurazione effettuata su un’unità
prima e dopo è identica, Xi = Yi) allora quella coppia di osservazioni (la i-
esima) può essere eliminata.
Caso2 (parità nell’elenco delle differenze). Se invece la parità di valori
si ha con riferimento alla colonna delle differenze in modulo (cioè tra i
|di|) allora abbiamo già visto che si lavora assegnando alle unità la media
dei ranghi da esse occupati nell’elenco ordinato.