alcune note su test non parametrici e loro...

Corso di Statistica per il Management – A.A. 2012/13 Prof.ssa Paola Vicard

1

Alcune note su

test non parametrici e

loro applicazioni (PARTE I)


2

I metodi più comunemente usati per effettuare analisi inferenziali sono

costituiti da tecniche parametriche. Con statistica parametrica si

intendono quelle tecniche statistiche basate su assunzioni circa la

distribuzione della popolazione da cui viene selezionato il campione. Data

l’ipotesi sulla distribuzione, l’analisi statistica consiste nell’eseguire

inferenza sui parametri di quella popolazione. Ad esempio, se si assume

la normalità di una distribuzione, dato che la normale è completamente

identificata dalla sua media e della sua varianza, studiare le proprietà di

quella popolazione consiste nel fare inferenza (costruire intervalli di

confidenza e/o verificare ipotesi) sulla media, sulla varianza o su

entrambi.

L’assunzione sulla distribuzione è essa stessa cruciale per eseguire le

analisi statistiche.

Per esempio, per eseguire un t test per la verifica di ipotesi su una media,

è necessario assumere che i dati campionari provengano da una

popolazione normalmente distribuita.


3

Problemi:

Cosa possiamo fare se dall’osservazione di un normal probability plot o di

un istogramma ci accorgiamo che la distribuzione è ben lungi dalla

normalità e il numero di osservazioni non ci consente di invocare il

teorema limite centrale?

Cosa possiamo fare se la scala di misurazione delle variabili di interesse è

qualitativa? (Si ricordi che le scale di misurazione, tra cui le scale Likert, che vengono usate

per misurare la soddisfazione, l’importanza, l’accordo, l’emozione, ecc. sono

tutte di tipo qualitativo. Quando su di esse si applicano le tecniche statistiche

standard, si fanno delle assunzioni rilevanti e non necessariamente verificate su

di esse).


4

Metodi statistici non parametrici. Le tecniche statistiche non parametriche richiedono meno ipotesi sulla

distribuzione e sui parametri della popolazione da cui è estratto il

campione.

Talvolta queste tecniche sono chiamate distribution free perché possono

essere usate qualunque sia la forma della distribuzione della variabile di

interesse.

Nel caso di verifica di ipotesi, questa potrà sempre riguardare un

parametro della popolazione ma il modello di riferimento sarà non

parametrico (cioè non sarà identificato da uno o più parametri, come

invece accade per la distribuzione normale che è identificata da due

parametri)


5

Principali vantaggi delle tecniche non parametriche:

- in alcuni casi non c’è alternativa al loro uso;

- alcuni test non parametrici possono essere usati per variabili

qualitative sconnesse;

- alcuni test non parametrici possono essere usati per variabili

qualitative ordinate;

- quando i campioni sono piccoli, i calcoli per i test non parametrici

sono più semplici rispetto ai calcoli per i test parametrici;

- in molti casi, i test non parametrici consentono di ottenere valori di

probabilità (ad es. il p-value) esatti, cioè senza approssimazioni.

L’uso delle tecniche non parametriche ha anche alcuni svantaggi:

- i test non parametrici non sono così diffusi (e quindi disponibili su

software) come i test parametrici;

- nel caso di grandi campioni, i calcoli possono diventare lunghi e

tediosi.

I test non parametrici sono moltissimi. Noi considereremo i seguenti:


6

Test non parametrici

1 campione

2 c

am

pio

ni

3 o più campioni

Test dei

segni

Test di

Wilcoxon

Test di

Wilcoxonper

campioni

appaiati

Test di

Mann-Whitney per campioni

indipendenti

Test di

Kruskal-Wallis


7

1. TEST A UN CAMPIONE

Tutti i test che prenderemo in considerazione si occupano della verifica di

ipotesi riguardanti un parametro di posizione della popolazione X che si

suppone continua. Il parametro di posizione su cui si concentra

l’attenzione è la mediana in quanto: 1) la mediana è più robusta della

media rispetto a valori anomali; 2) tutte le distribuzioni continue

possiedono la mediana.

Si ricordi che, data una distribuzione continua, la mediana (indichiamola

con θ) è quella modalità del carattere tale

F(θ)=1/2 ossia P(X > θ) = P(X < θ) = 1/2.

L’ipotesi nulla da verificare è H0: θ = θ0

L’ipotesi alternativa potrà essere:

unilaterale H1: θ > θ0 o H1: θ < θ0

oppure bilaterale H1: θ ≠ θ0


8

Test dei segni Se l’ipotesi nulla è vera ci aspettiamo, al livello di dati osservati (ossia di

determinazioni x della variabile X), che circa la metà di essi sia più grande

di θ0 e circa la metà di essi sia più piccola di θ0.

Operativamente, invece che sulla variabile X, è più comodo lavorare sui

suoi scarti dalla mediana ipotizzata θ0, ossia sulla variabile D = X – θ0

Se è vera l’ipotesi nulla H0: θ = θ0, allora la mediana di D sarà pari a zero

in quanto

P(D > 0) = P(X – θ0 > 0) = P(X > θ0) = ½ e (1)

P(D < 0) = P(X – θ0 < 0) = P(X < θ0) = ½

Al livello di dati osservati (ossia di determinazioni d della variabile D), ci

aspettiamo che se l’ipotesi nulla è verificata, la metà circa di esse sia

maggiore di zero e la metà circa di esse sia minore di zero.


9

Per ogni determinazione d della v.a. D = X – θ0 assegniamo:

- valore 1 se d>0 (ossia se x è più grande della mediana ipotizzata θ0)

- valore 0 se d<0 (ossia se x è più piccola della mediana ipotizzata θ0)

e indichiamo con Ψ(D) la corrispondente variabile, ossia

( )1 se >0

0 se <0

dd

d

Ψ =

Esempio1: un’azienda romana produce brioche da colazione e

distribuisce i suoi prodotti nei bar della capitale. Crea un nuovo tipo di

brioche e decide di verificare se esso incontra i gusti dei consumatori

sperimentandone la vendita in alcuni bar di Roma. A un mese dalla messa

in commercio decide di monitorare per 10 giorni le quantità totali vendute

in questi bar. L’azienda si pone come target di vendere almeno 190

brioche nell’ora di punta.


10

Disponiamo solamente di un campione piccolo e quindi abbiamo bisogno

di effettuare un test che non si appoggi sull’ipotesi di normalità.

La nostra azienda ha il seguente problema di verifica di ipotesi:

H0: θ = 190

H1: θ > 190

Vediamo i dati e di conseguenti conti: Giorno Brioche vendute

(xi)

D = X – 190

(di) Ψ(di)

1 301 111 1

2 198 8 1

3 278 88 1

4 205 15 1

5 249 59 1

6 410 220 1

7 360 170 1

8 124 -66 0

9 253 63 1

10 191 1 1

Osserviamo che

solamente in un giorno

su 10 il numero di

brioche vendute rimane

sotto il target di 190.

Questo risultato ci

consente di concludere

che l’obiettivo è stato

raggiunto?


11

In sostanza Ψ(D) è una variabile bernoulliana in quanto assume valori 0 e

1. Indichiamo con π la probabilità di successo, ossia la probabilità che

Ψ(D) sia uguale 1.

Sotto l’ipotesi nulla H0: θ = θ0 la metà delle volte la variabile bernoulliana

è pari a 1 e la metà delle volte è pari a 0, cioè se H0 questa variabile

bernoulliana ha parametro π = ½ in quanto, come si vede dalla (1), è pari

a ½ la probabilità D sia maggiore di zero.

Sommiamo il numero di successi (cioè il numero di volte che le

osservazioni superano la mediana postulata θ0). Indichiamo con S questa

somma. Questa è la somma di n variabili bernoulliane indipendenti.

Sappiamo che la somma di n variabili bernoulliane indipendenti di

parametro π è una variabile binomiale Bin(n, π).


12

Pertanto il nostro problema di ipotesi originario

H0: θ = θ0

H1: θ > θ0

si riduce al seguente

H0: π = ½

H1: π > ½

La statistica test è data da S, ossia dal numero di volte che la variabile X è

maggiore della mediana postulata θ0 . Sappiamo che S ha distribuzione

binomiale.

Questo risultato consente di poter risolvere il problema di ipotesi sia

quando il campione è piccolo (e non si può ricorrere ad approssimazioni

normali) sia quando il campione è grande1.

1 E’ stato dimostrato che i test non parametrici sono sempre più efficienti (anche molto) dei test paramatrici che

poggiano sull’ipotesi di normalità quando la distribuzione della variabile di interesse non è normale anche

quando la dimensione campionaria è grande. Nel caso in cui la distribuzione della variabile di interesse sia

normale, i test non parametrici sono tanto efficienti (o quasi) quanto i corrispettivi test parametrici. Considerate

due statistiche test e, fissato lo stesso livello di significatività, un test si dice più efficiente se gli corrisponde

una maggiore probabilità di rifiutare l’ipotesi nulla quando l’ipotesi nulla è falsa (detta potenza del test).


13

In generale i diversi set di ipotesi visti

0 0

1 0

:

:

H

H

θ θ

θ θ

=

> 0 0

1 0

:

:

H

H

θ θ

θ θ

=

< 0 0

1 0

:

:

H

H

θ θ

θ θ

=

≠

possono essere riformulati

0

1

: 1 2

: 1 2

H

H

π

θ

=

> 0

1

: 1 2

: 1 2

H

H

π

θ

=

< 0

1

: 1 2

: 1 2

H

H

π

θ

=

≠

La scelta tra le due ipotesi avviene mediante calcolo delle zone di rifiuto e

di accettazione oppure mediante il calcolo del livello di significatività

osservato (p-value).

Con riferimento al p-value2, questo può essere calcolato usando: la

distribuzione binomiale se il campione ha bassa numerosità; usando

l’approssimazione della binomiale alla normale se il campione ha

numerosità più elevata.

2 Mostriamo solo applicazioni basate sul p-value in quanto costituisce l’output che in automatico viene fornito

dai software.


14

Torniamo al nostro esempio. Il numero di valori campionari maggiori di

θ0 = 190 è pari a 9 (S = 9). I dati supportano il fatto che il target di 190

brioche vendute nell’ora di punta sia stato raggiunto? Sign Test for Median: brioches vendute Sign test of median = 190,0 versus > 190,0

N Below Equal Above P Median

brioches vendute 10 1 0 9 0,0107 251,0

vediamo che la mediana del nostro campione è 251.

Inoltre troviamo che il valore P (livello di significatività osservato) è pari

a 0.0107, cioè il test è significativo e la mediana risulta essere

significativamente maggiore della mediana postulata (190).


15

Vediamo come eseguire il test usando il software Minitab:

Il test dei segni in

Minitab è indicato

come

1-Sample Sign


16

La finestra di dialogo

chiede solamente:

- la specificazione del

valore postulato della

mediana “Test

median”(nel nostro

esempio è 190) e


tipo di ipotesi

alternativa “Alterntive”

(se unilaterale > allora

“greater than”, se

unilaterale < allora

“less than”, se

bilaterale allora “note

qual”)


17

Test dei ranghi segnati di Wilcoxon

Ranghi

Consideriamo l’esempio1.

Giorno Brioche vendute

(xi)

Rango

(ri)

1 301 8

2 198 3

3 278 7

4 205 4

5 249 5

6 410 10

7 360 9

8 124 1

9 253 6

10 191 2

L’idea dei ranghi è quella di guardare non al valore preciso della modalità

ma solamente alla posizione occupata nella lista ordinata dei dati.

Il rango di una osservazione è il

posto occupato da questa

osservazione nella sequenza

ordinata dei dati (dal valore più

piccolo al valore più grande).


18

In generale, dato un campione casuale (X1,...,Xi,...,Xn) ed una sua

determinazione campionaria (x1,...,xi,...,xn), a questa possiamo associare

(r1,...,ri,...,rn) dove ri rappresenta la posizione occupata dall’osservazione

xi nella lista ordinata di x1,...,xi,...,xn.

Test dei ranghi segnati di Wilcoxon

Il test dei segni effettua una verifica di ipotesi sulla mediana usando

informazione molto basilare: il numero di osservazioni che sono più

grandi del valore mediano ipotizzato.

Vediamo, ora, un altro test che invece riesce a considerare in qualche

misura anche l’entità dello scarto rispetto alla mediana ipotizzata.

L’entità di questo scarto viene calcolata mediante i ranghi.

La condizione affinché il test possa essere eseguito è che la variabile di

interesse X abbia distribuzione continua e simmetrica.


19

Torniamo al nostro esempio.

Il set di ipotesi è

0

1

: 190

: 190

H

H

θ

θ

=

>.

Se la mediana delle brioche vendute supera veramente il valore 190,

allora ci aspettiamo:

1) di avere molte osservazioni maggiori di 190 e

2) che queste presentino valori molto più grandi.

In altre parole ci aspettiamo che:

1) i valori superiori a 190 siano molti di più e

2) che questi siano anche molto più lontani da 190 di quanto lo siano i

valori inferiori a 190.


20

Per mettere in formule questo ragionamento dobbiamo:

1. come fatto per il test dei segni, associare ad ogni dato xi o il valore 0

se questo è minore di 190 o il valore 1 se questo è maggiore di 190. E

abbiamo già visto che indichiamo con Ψ(di) questa trasformazione;

2. misurare in valore assoluto l’entità degli scarti dalla mediana

postulata (|D|=|X – 190|). In questo modo si può avere una misura

della lontananza assoluta di ciascuna osservazione da 190;

3. calcolare i ranghi corrispondenti a questi valori assoluti (ossia

scrivere la loro posizione nell’elenco ordinato in modo crescente)

4. misurare la lontananza dalla mediana delle sole osservazioni che la

superando, sommando i ranghi degli scarti ad essi associati.

Torniamo al nostro esempio.


21

Si ottiene la seguente tabella Giorno Brioche vendute

(xi)

D = X – 190

(di) Ψ(di) |D| = |X – 190|

(|di|)

Rango di |di|

(ri) riΨ(di)

1 301 111 1 111 8 8

2 198 8 1 8 2 2

3 278 88 1 88 7 7

4 205 15 1 15 3 3

5 249 59 1 59 4 4

6 410 220 1 220 10 10

7 360 170 1 170 9 9

8 124 -66 0 66 6 0

9 253 63 1 63 5 5

10 191 1 1 1 1 1

49

Le due informazioni “essere sopra la mediana”+”entità dello scarto dalla

mediana in modulo” vengono sintetizzate sommando i ranghi degli scarti

in modulo delle sole osservazioni sopra la mediana postulata (190):

vediamo nel nostro esempio che l’osservazione n. 8 non entra nella

somma perché nell’ottavo giorno le brioche vendute sono meno di 190.


22

In formule possiamo scrivere la statistica test come segue:

( )1

n

i ii

W r d+

=

= Ψ∑

nel nostro esempio W+ = 49.

Come decidere sulla base di questo valore?

Innanzitutto possiamo, sulla scorta delle considerazioni viste per il test dei

segni, dire che se H0 non è vera e cioè se (nel nostro esempio) la mediana

è maggiore di 190, allora ci si attende che le osservazioni superino la

mediana in più della metà dei casi. Ciò ha come conseguenza che anche

Ψ(di) sia pari a 1 nel maggior parte dei casi (con probabilità maggiore di

½). Guardando la formula ne deriva che nella maggior parte dei casi i

prodotti riΨ(di) assumono valori positivi e quindi la loro somma sarà più

elevata.


23

Come decidere se questo valore della statistica test è sufficientemente

grande per far rifiutare l’ipotesi?

Occorre conoscere la distribuzione di W+.

Non ci soffermiamo su questo aspetto ma solo su tre caratteristiche

principali di W+ e della sua distribuzione.

1. W+ può assumere qualunque valore intero compreso tra 0 e

( )1

2

n n +;

2. la statistica test W+ ha valore atteso ( )

( )1E

4

n nW

+ += ;

3. la statistica test W+ ha varianza ( )

( )( )1 2 1Var

24

n n nW

+ + += .

Tornando al nostro esempio vediamo che il valore osservato della

statistica test è 49 ed è molto più grande del suo valore atteso che nel

nostro esempio è E(W+) = 27.5.

Concludiamo la nostra valutazione eseguendo il test con Minitab.


24

Il test dei ranghi

segnati di Wilcoxon

in Minitab è indicato

come

1-Sample Wilcoxon


25

La finestra di dialogo

chiede solamente:


valore postulato della

mediana “Test

median”(nel nostro

esempio è 190) e


tipo di ipotesi

alternativa “Alterntive”

(se unilaterale > allora

“greater than”, se

unilaterale < allora

“less than”, se

bilaterale allora “note

qual”)


26

Wilcoxon Signed Rank Test: brioches vendute Test of median = 190,0 versus median > 190,0

N for Wilcoxon Estimated

N Test Statistic P Median

brioches vendute 10 10 49,0 0,016 251,0

vediamo che la mediana del nostro campione è 251.

Vediamo che il valore della statistica test di Wilcoxon è 49 così come da

noi calcolato.

Inoltre troviamo che il valore P (livello di significatività osservato) è pari

a 0.016, cioè il test è significativo quindi la mediana risulta essere

significativamente maggiore della mediana postulata (190).


27

In generale i diversi set di ipotesi visti

0 0

1 0

:

:

H

H

θ θ

θ θ

=

>

0 0

1 0

:

:

H

H

θ θ

θ θ

=

<

0 0

1 0

:

:

H

H

θ θ

θ θ

=

≠

La statistica test è data dalla somma dei ranghi (posti occupati nella lista

ordinata degli scarti in modulo da θ0 ) associati alle sole osservazioni più

grandi di 0θ .

In formule:

( )1

n

i ii

W r d+

=

= Ψ∑ .

La statistica test W+ rifiuta l’ipotesi nulla di uguaglianza rispetto ad una

mediana ipotizzata quando W+ assume un valore molto lontano rispetto

alla sua media ( ) ( )E 1 4W n n+

= + .


28

In particolare:

- quando il test è unilaterale destro (>) allora si rifiuta H0 quando W+

assume un valore molto più grande di E(W+);

- quando il test è unilaterale sinistro (<) allora si rifiuta H0 quando W+

assume un valore molto più piccolo di E(W+)

3;

- quando il test è bilaterale (≠) allora si rifiuta H0 quando W+ assume un

valore molto lontano (in positivo o in negativo) da E(W+).

3 Ciò accade perché se H0 è falsa e cioè la vera mediana è più piccola di θ0 allora:1) sono poche le osservazioni

con valore maggiore di θ0; 2) queste ultime hanno valore che eccede di poco θ0 e quindi hanno rango basso.

Quindi la somma dei ranghi degli scarti in modulo da θ0 corrispondenti alle poche osservazioni maggiori di θ0

sarà molto bassa.


29

La decisone di accettare o rifiutare l’ipotesi nulla viene presa mediante il

P-value.

Il P-value viene calcolato

- usando la distribuzione esatta (implementata in molti software) se il

campione ha bassa numerosità;

- usando l’approssimazione alla normale se il campione ha numerosità

più elevata in quanto è stato dimostrato che

( )

( )

( )

( )( )

1E

4

1 2 1Var

24

n nWW W

n n nW

++ +

+

+−−

=+ +

converge ad una distribuzione N(0,1).


30

Il caso delle osservazioni alla pari (Ties)

Alla base dei test qui presentati c’è l’ipotesi che le variabili abbiano

distribuzione continua. Ciò implica che sia nulla la probabilità di avere

due osservazioni uguali (“alla pari”).

Nella pratica però può capitare (anche spesso) di avere più osservazioni

uguali. Ciò avviene per due motivi fondamentali:

1. la variabile studiata è quantitativa ma, poiché i valori osservati

vengono registrati con al massimo una o due cifre decimali, si

possono avere alcune osservazioni coincidenti;

2. la variabile studiata è quantitativa discreta (assume un numero finito

di valori possibili) o è una scala di misurazione (quale ad. es. la scala

Likert) e allora si possono avere molte osservazioni coincidenti.


31

Cosa fare quando capitano osservazioni alla pari?

La prassi principalmente applicata prevede che si assegni a tutti i valori

identici la media dei loro ranghi.

Esempio2: chiediamo il tempo di attesa (in minuti) prima di essere serviti

a 10 clienti di una banca e ci rispondono:

Tempo di attesa 15 8 4 5 4 3 2 7 8 10

alcune modalità si presentano più volte (l’attesa di 4 e di 3 minuti).

Mettiamo in ordine le osservazioni e scriviamo anche il loro rango:

Tempo di attesa

(ordinato) 2 3 4 4 5 7 8 8 10 15

Posto

nell’ordine 1 2 3 4 5 6 7 8 9 10

Rango

assegnato 1 2 3.5 3.5 5 6 7.5 7.5 9 10


32

Consideriamo questo stesso esempio. Tempo di attesa 15 8 4 5 4 3 2 7 8 10

Supponiamo che il tempo mediano di attesa dichiarato sia di 5 minuti.

Alla luce dei dati osservati, studiamo se effettivamente la mediana della

distribuzione è pari a 5.

Abbiamo il seguente sistema di ipotesi:

0

1

: 5

: 5

H

H

θ

θ

=

≠


33

Wilcoxon Signed Rank Test: attesa Test of median = 5,000 versus median not = 5,000



attesa 10 9 32,5 0,260 6,000

La mediana stimata è 6 minuti ma non differisce significativamente dalla

mediana dichiarata pari a 5 minuti.


34

2. TEST A DUE CAMPIONI

Come nel caso dell’inferenza parametrica, quando si effettua il confronto

tra due popolazioni si possono avere due situazioni diverse:

- i campioni sono appaiati;

- i campioni sono indipendenti.

Occupiamoci dei test non parametrici per l’analisi di queste due

situazioni.

Test dei ranghi segnati di Wilcoxon per campioni appaiati

Molto spesso (nelle applicazioni sociali, economiche, aziendali e

sperimentali, ecc.) è necessario eseguire il confronto tra due campioni

(X1,...,Xn) e (Y1,...,Yn) di misure effettuate sulle stesse unità statistiche.

Molto spesso capita di misurare una stessa caratteristica su uno stesso

campione di unità in due tempi diversi (eventualmente prima e dopo il

verificarsi di un certo evento, ad es. prima e dopo l’applicazione di una

decisione manageriale o di una nuova strategia di

marketing/comunicazione ecc.).


35

Riprendiamo l’Esempio1.

Un’azienda romana produce brioche da colazione e distribuisce i suoi

prodotti nei bar della capitale. Questa decide di continuare la produzione

della nuova brioche dopo avere visto che le vendite superano la soglia

della mediana pari a 190.

L’azienda, volendo far crescere le vendite della nuova brioche, decide di

lanciare una campagna pubblicitaria. In via sperimentale decide di fare

questa pubblicità nella stessa zona in cui si trovano i bar rilevati nella

prima indagine. Dopo un mese, rileva per 10 giorni la quantità di brioche

vendute in questi bar nell’ora di punta. Si ottengono i seguenti dati: Giorno 1 2 3 4 5 6 7 8 9 10

Brioche vendute

prima della campagna

pubblicitaria

(xi)

301 198 278 205 249 410 360 124 253 191

Brioche vendute dopo la

campagna pubblicitaria

(yi) 374 187 332 212 243 478 386 141 251 265


36

La domanda a cui dobbiamo rispondere è:

C’è stato un incremento significativo della quantità di brioche vendute a

seguito della campagna pubblicitaria?

L’idea è quella di utilizzare la stessa tecnica vista per il test parametrico

per il confronto tra medie per campioni appaiati.

In sostanza, non lavoriamo separatamente sulle due variabili X e Y ma

sulla loro differenza D =Y – X.

In questo modo possiamo utilizzare il test dei ranghi segnati di Wilcoxon

visto per il caso di un solo campione.

Se la campagna pubblicitaria non ha avuto effetto allora ci aspettiamo che

la distribuzione di D sia centrata nel valore 0, ossia che la mediana della

distribuzione di D sia θ = 0.


37

Se invece la campagna pubblicitaria ha avuto successo allora le vendite

devono essere aumentate e quindi la distribuzione di D (n° brioche

vendute dopo la campagna – n° brioche vendute prima della campagna)

deve essere concentrata su valori maggiori di zero. In simboli, la mediana

della distribuzione di D sia θ > 0.

Il problema di ipotesi che sostanzialmente ci stiamo ponendo è del tipo

0

1

: 0

: 0

H

H

θ

θ

=

>

A scopo illustrativo mostriamo i calcoli che vengono eseguiti.


38

Giorno Brioche

vendute

prima della

campagna

pubblicitaria

(xi)

Brioche

vendute

dopo la

campagna

pubblicitaria

(yi)

D = Yi – Xi

(di) Ψ(di) |D|

(|di|)

Rango di |di|

(ri) riΨ(di)

1 301 374 73 1 73 9 9

2 198 187 -11 0 11 4 0

3 278 332 54 1 54 7 7

4 205 212 7 1 7 3 3

5 249 243 -6 0 6 2 0

6 410 478 68 1 68 8 8

7 360 386 26 1 26 6 6

8 124 141 17 1 17 5 5

9 253 251 -2 0 2 1 0

10 191 265 74 1 74 10 10

48

Quindi la statistica test è: ( )1

48n

i ii

W r d+

=

= Ψ =∑


39

Utilizziamo anche Minitab4 per eseguire i calcoli e per ottenere il valore

P. Si ha :

Wilcoxon Signed Rank Test: dopo-prima Test of median = 0,000000 versus median > 0,000000



dopo-prima 10 10 48,0 0,021 31,00

Come vediamo il valore P è piuttosto piccolo e quindi possiamo ritenere

che i dati ci forniscano sufficiente evidenza per rifiutare l’ipotesi nulla e

quindi per concludere che la campagna pubblicitaria ha prodotto un

incremento significativo delle vendite.

4 Poiché il test per campioni appaiati prevede che l’analisi venga eseguita su una sola variabile (data dalla

differenza delle due variabili in input), il comando in Minitab da scegliere è 1-Sample Wilcoxon.


40

In generale il test dei ranghi segnati di Wilcoxon per campioni appaiati

può essere eseguito quando:

1) i campioni sono selezionati in modo casuale,

2) le distribuzioni di riferimento sono entrambe simmetriche.

In generale, possiamo scrivere che il test dei ranghi segnati di Wilcoxon

per campioni appaiati, si occupa dei seguenti possibili set di ipotesi

0

1

: 0

: 0

H

H

θ

θ

=

> 0

1

: 0

: 0

H

H

θ

θ

=

< 0

1

: 0

: 0

H

H

θ

θ

=

≠

Nota: guardando i tre set di ipotesi si può pensare che le distribuzioni di

X e di Y debbano avere la stessa identica forma e che a differire

possa essere solo il parametro di locazione (cioè la mediana).

Questa sarebbe un’ipotesi alquanto restrittiva per poter essere

sempre verificata in pratica.


41

In realtà il test di Wilcoxon si applica a contesti molto più generali e

quindi le ipotesi che effettivamente vengono messe a confronto sono:

0

1

: le misurazioni nei due tempi hanno la stessa distribuzione

: le misurazioni sono sistematicamente più grandi nel secondo campione

H

H

invece di 0

1

: 0

: 0

H

H

θ

θ

=

>

0

1


: le misurazioni sono sistematicamente più piccole nel secondo campione

H

H

invece di 0

1

: 0

: 0

H

H

θ

θ

=

<

0

1


: le misurazioni sono sistematicamente diverse nei due campioni

H

H

invece di 0

1

: 0

: 0

H

H

θ

θ

=

≠


42

La statistica test è data dalla somma dei ranghi (posti occupati nella lista

ordinata delle differenze |Y – X|) associati alle sole differenze positive.

In formule:

( )1

n

i ii

W r d+

=

= Ψ∑ .

Infine il valore P viene calcolato in modo esatto oppure mediante

l’approssimazione normale a seconda della numerosità campionaria.

Caso1 (parità interna a una coppia). Se per una coppia di osservazioni

si ha che la differenza è zero (cioè la misurazione effettuata su un’unità

prima e dopo è identica, Xi = Yi) allora quella coppia di osservazioni (la i-

esima) può essere eliminata.

Caso2 (parità nell’elenco delle differenze). Se invece la parità di valori

si ha con riferimento alla colonna delle differenze in modulo (cioè tra i

|di|) allora abbiamo già visto che si lavora assegnando alle unità la media

dei ranghi da esse occupati nell’elenco ordinato.

alcune note su test non parametrici e loro...

Documents