contrastes no paramÉtricos -...

34
A. Morillas: C. no paramétricos (II) 1 CONTRASTES NO PARAMÉTRICOS: ALEATORIEDAD Y LOCALIZACIÓN Antonio Morillas

Upload: buidieu

Post on 22-Feb-2018

217 views

Category:

Documents


1 download

TRANSCRIPT

A. Morillas: C. no paramétricos (II) 1

CONTRASTES NO PARAMÉTRICOS:ALEATORIEDAD Y LOCALIZACIÓN

Antonio Morillas

A. Morillas: C. no paramétricos (II) 2

1. Contrastes de aleatoriedad. Contraste de rachas.

2. Contrastes de localización

2.1 Contraste del signo

2.1.1 Localización de una población (mediana)

2.1.2 Diferencia de medianas para parejas de datos relacionados

2.2 Contraste del rango signado (Wilcoxon)

2.2.1 Localización de una población (mediana)

2.2.2 Diferencia de medianas para parejas de datos relacionados

2.3 Contraste de Wilcoxon/Mann-Whitney (dos muestras independientes)

2.4 Contraste de Kruskal-Wallis (más de dos muestras independientes)

CONTRASTES NO PARAMÉTRICOS: ALEATORIEDAD Y LOCALIZACIÓN

A. Morillas: C. no paramétricos (II) 3

CONTRASTES DE ALEATORIEDAD

Aleatoriedad: Principio básico de la inferencia estadística

Muestra no aleatoria Observaciones no independientes

Expresiones varianzas de los estimadores erróneas

NO FIABLES

Contraste de hipótesisIntervalos de confianza

A. Morillas: C. no paramétricos (II) 4

CONTRASTE DE RACHAS

• Problema: dependencia entre observaciones en la muestra

•Aplicable a variables con escala de orden estadísticas rangos

• Definición de RACHA:

• sucesión de valores situados por encima (racha positiva) o

por debajo de la mediana (racha negativa)

• LONGITUD de una racha:

• Número de observaciones de esa sucesión

A. Morillas: C. no paramétricos (II) 5

2. Obtención de las rachas:

• Los valores iguales a la mediana no intervienen

• Se observa, en la muestra original, los valores que están por encima (+) y por debajo de la mediana (-) :

EJEMPLO CÁLCULO DE RACHAS

n = 9 23, 32, 43, 45, 21, 35, 33, 54, 22

23

-

32

-

43

+

45

+

21

-

35

+

54

+

22

-5 rachas

1. Obtención de la mediana:

Muestra ordenada: 21, 22, 23, 32, 33, 35, 43, 45, 54

A. Morillas: C. no paramétricos (II) 6

ESTADÍSTICO DE PRUEBA

• Número de rachas ( r ) tabulado bajo hipótesis aleatoriedad,

en función del número de signos positivos ( k ):

• Si no hay valores repetidos de la mediana:

• k = n/2 , para n par

• k = (n-1)/2 , para n impar

• Pocas rachas indicios de correlación positiva

• Muchas rachas indicios de correlación negativa

• Valores intermedios (dos colas): rmín ≤ r ≤ rmáx aleatoriedad

• Para n > 100 : dos colas

Función de n , en definitiva

2 ( 1) 1 ; 2 1

k kr N kk

µ σ −⎛ ⎞∼ = + =⎜ ⎟−⎝ ⎠

A. Morillas: C. no paramétricos (II) 7

CONTRASTES DE LOCALIZACIÓN

Objeto: Localizar la tendencia central de la población

Alternativa a contrastes sobre la media (Z y t) para:• Muestras pequeñas y no normalidad Distribución media?• Estadísticas de rangos (no cuantitativas)• Casos de asimetría o existencia de outliers

¡Mediana!

M1 M21x 2x

1/2 1/2

X

f1(x)

f2(x)

A. Morillas: C. no paramétricos (II) 8

CONTRASTE DEL SIGNO (Fisher)UNA POBLACIÓN: MEDIANA

• Objeto: Localizar la posición de una distribución de forma desconocida

• Se basa en la mediana, que, para cualquier distribución, tiene la propiedad (supondremos que X es continua):

P(X ≤ M) = P(X ≥ M) = 1/2

• Hipótesis nula: H0 : M = M0

• Hipótesis alternativas: H1 : M > M0

H1 : M < M0

H1 : M ≠ M0

A. Morillas: C. no paramétricos (II) 9

• Si H0 es cierta, para una muestra de tamaño n, se cumple que:

P(xi ≥ M0 ) = P(xi – M0 ≥ 0) = 1/2 ; i = 1, 2, ..., n

• Se construye una variable auxiliar, W, en la siguiente forma:

•Wi = 1 , si (xi – M0 ) ≥ 0 signo positivo (+)

•Wi = 0 , en caso contrario signo negativo (-)

• Por tanto, Wi es un experimento de Bernouilli, con p=1/2

• Si las observaciones son independientes (muestra aleatoria):

∑ Wi = U ~ B(n, p=1/2) con E(U) =np=n/2 ; Var(U)=npq=n/4

CONTRASTE DEL SIGNOESTADÍSTICO DE PRUEBA

A. Morillas: C. no paramétricos (II) 10

CONTRASTE DEL SIGNOREGIÓN CRÍTICA

• Si H0 es cierta, el valor de U (∑ Wi), debiera ser próximo a n/2. Discrepancias grandes, llevarían a rechazar dicha hipótesis nula. Por tanto:

• Si H1 : M > M0 RC a la derecha:

• Se calcula P(U ≥ Uobs ) = α0 (p-Nivel del test)

• Si α0 < α rechazar la hipótesis nula (Uobs cae en la RC)

• Si H1 : M < M0 RC a la izquierda:

• Se calcula P(U ≤ Uobs ) = α0

• Si α0 < α rechazar la hipótesis nula (Uobs cae en la RC)

• Si H1 : M ≠ M0 RC bilateral:

• Se observa si Uobs es mayor o menor que n/2

• Si Uobs > n/2 P(U ≥ Uobs ) = α0 α0 < α/2, rechazaremos H0

• Si Uobs < n/2 P(U ≤ Uobs ) = α0 α0 < α/2, rechazaremos H0

A. Morillas: C. no paramétricos (II) 11α0 = U1- α

CONTRASTE DEL SIGNOAPROXIMACIÓN NORMAL

• Al tratarse de una distribución discreta (binomial) no siempre es posible encontrar la región crítica del tamaño predeterminado (α).

• Al ser p=1/2 , la aproximación normal es buena para n ≥ 10. Aquí α sí existe.

• Por aproximación de variable discreta a continua, suele utilizarse U+1/2, para RC izquierda, y U-1/2, para RC derecha.

( 1/ 2)2( / 2 , / 4 ) (0,1)

/ 4

nU -U N n n N

n

±∼ → ∼

0 nn/2

Uobs (discreta)

+U

α

A. Morillas: C. no paramétricos (II) 12

CONTRASTE DEL SIGNODOS POBLACIONES: DATOS RELACIONADOS

• Ampliación natural del caso anterior para la población de diferencias, cuya forma es desconocida.

• Sean f1(x) y f2(x) las funciones de densidad, continuas y con la misma forma.

• Sean (x1 , y1 ) , (x2 , y2 ) , ... , (xn , yn ) las n parejas de valores muestrales observadas en ambas poblaciones.

• Si Ho: M1 = M2 es cierta, (xi , yi ) es una muestra de tamaño 2 de la misma población y, por tanto,

P(xi > yi ) = P(xi < yi ) = P [(xi – yi )> 0] = 1/2

A. Morillas: C. no paramétricos (II) 13

CONTRASTE DEL SIGNODATOS RELACIONADOS - ESTADÍSTICO

• Se construye una variable auxiliar, W, en la siguiente forma:

•Wi =1, si ( xi – yi ) > 0 signo positivo (+)

•Wi =0, en caso contrario signo negativo (-)

•Σ Wi , variable U, será la misma binomial anterior:

U ∼ B(n , p= 1/2 ), E(U) = np = n/2 ; Var(U) = npq = n/4• Comentarios:

• Si la población no es conocida, este test es más potente que la t . Pero, si se conoce su distribución ocurre lo contrario.

• Siempre válido, aunque f1 (x) y f2 (x), idénticas para ambas muestras, cambien de un par muestral a otro U ∼ Binomial

A. Morillas: C. no paramétricos (II) 14

CONTRASTE DEL SIGNODATOS RELACIONADOS – REGIÓN CRÍTICA

• La región crítica depende de H1 (similar al caso anterior):

• H1: M1 > M2 f1(x) está desplazada a la derecha de f2(x). Se espera Uobs > n/2 RC derecha.

• H1: M1 < M2 f1(x) está desplazada a la izquierda de f2(x). Se espera Uobs < n/2 RC izquierda.

• H1: M1 ≠ M2 , es decir, las poblaciones son distintas y no se sabe el sentido del deslizamiento. Ver valor de Uobs y elegir región apropiada, como en el caso anterior.

• La aproximación normal, como en el caso anterior.

A. Morillas: C. no paramétricos (II) 15

CONTRASTE DEL RANGO SIGNADO (Wilcoxon)UNA POBLACIÓN - MEDIANA

Incorpora, sobre el anterior, la distancia a la mediana:• El contraste será más potente• La población ha de asumirse continua y simétrica

Procedimiento :1. Obtener xi –M0 = di, para i=1, 2, ..., n2. Ordenar |di| y asignar un rango, al que se incorpora el

signo original de di (rango signado o rango con signo)3. Se obtienen las sumas de los rangos con signos + (T+) y

con signos – (T- ). La menor es el estadístico de prueba.4. Cuestiones a tener en cuenta:

a. A un grupo de diferencias iguales, se les asigna la media de sus rangos

b. Si la diferencia es cero, se omite y se ajusta el tamaño de la muestra

A. Morillas: C. no paramétricos (II) 16

CONTRASTE DEL RANGO SIGNADO (Wilcoxon)CÁLCULO DE RANGOS

6027553375

xi

H0: M = 50; n = 5

Suma rangos = 1+2+3+4+5 = n(n+1)/2 = 5*6/2 = 15T0 157,5

di=xi-M0

10-235

-1725

10235

1725

|di| Rango24135

15

Rango +2

1

5

Rango -

4

3

T+= 8 T-= 7

A. Morillas: C. no paramétricos (II) 17

Hipótesis nula: M = M0 si es cierta, cualquier secuencia de signos y rangos es equiprobable (suma de rangos + y – han de ser similares). Aquí juega la hipótesis de simetría.

Estadístico muestral: distribución muestral de la menor de las dos sumas: T, que está tabulada por Wilcoxon.

Si la suma es T+ + T- = n(n+1) / 2 (progresión aritmética de orden n), el valor esperado será la mitad: E(T) = n(n+1) / 4

Cuanto menor sea una suma respecto a la otra, más evidencia para rechazar H0 . Por el contrario, si H0 es cierta, ambas sumas deben de estar próximas al valor esperado.

CONTRASTE RANGO SIGNADOMEDIANA - ESTADÍSTICO MUESTRAL

A. Morillas: C. no paramétricos (II) 18

CONTRASTE RANGO SIGNADOMEDIANA - REGIÓN CRÍTICA

• Si H1 : M > M0 , normalmente ocurrirá que T- es menor que T+ , y rechazaremos la hipótesis nula si T- ≤ T0 (T0 es el valor crítico de la tabla).

• Si H1 : M < M0 , normalmente ocurrirá que T+ es menor que T- , y rechazaremos la hipótesis nula si T+ ≤ T0

• Si H1 : M ≠ M0 , no se sabe, en principio, cuál de las dos serála menor (la llamaremos T ). Rechazaremos la hipótesis nula si T ≤ T0 dos colas

• Si n es grande (n ≥ 15)

( 1)4 (0,1)

( 1)(2 1)24

n n

Z Nn n n

T++−

= ∼+ +

A. Morillas: C. no paramétricos (II) 19

CONTRASTE RANGO SIGNADODOS POBLACIONES - DATOS RELACIONADOS

• Igual que el anterior, pero con la población de diferencias (xi – yi = di) , y con H0 : M1 = M2 . Región crítica:

• Si H1 : M1 > M2 , normalmente ocurrirá que T- es menorque T+ , y rechazaremos la hipótesis nula si T- ≤ T0 (T0 es el valor crítico de la tabla).

• Si H1 : M1 < M2 , normalmente ocurrirá que T+ es menor que T- , y rechazaremos la hipótesis nula si T+ ≤ T0

• Si H1 : M1 ≠ M2 , no se sabe, en principio, cuál de las dos serála menor (la llamaremos T ). Rechazaremos la hipótesis nula si T ≤ T0 dos colas

• Si n es grande (n ≥ 15) Normal

A. Morillas: C. no paramétricos (II) 20

CONTRASTE DE LA SUMA DE RANGOSDOS POBLACIONES - INDEPENDIENTES (Wilcoxon)

• Test original de Wilcoxon. Posteriormente, Mann y Whitneyproponen otro y demuestran que es equivalente (U de Mann-Whitney). No se refiere necesariamente a la mediana.

• Se suponen dos variables continuas, misma forma (solo difieren en su localización) y muestras independientes. Aplicable a datos ordinales (se basa en rangos).

• Si H0 es cierta (las dos poblaciones son iguales), ambas muestras proceden, en realidad, de la misma población. Por tanto, pueden considerarse como una única muestra de tamaño (n1 + n2 ):

1 21 2 1 2,n n(x , x ,..., x y , y ,..., y )

A. Morillas: C. no paramétricos (II) 21

• Si asignamos rango a los elementos de la muestra conjunta, debería ocurrir que la suma de rangos en la muestra n1 (T1)fuese similar a la suma de rangos (T2) en la muestra n2 (n1 y n2pueden ser distintos; n1 la menor). La suma de ambos será:

T1 + T2 = n(n+1) / 2 , con n= n1+ n2

• Si hay mucha diferencia entre ambas sumas (una pequeña, la otra grande), será indicio de que la hipótesis nula no es cierta.

• Bajo H0 , T1 (suma de rangos en la muestra más pequeña) es un estadístico que depende solo de n1 y n2 . Los valores críticos inferior (TL ) y superior (TU ) que debe tomar T1 de ser cierta H0 están tabulados.

CONTRASTE DE LA SUMA DE RANGOSDOS POBLACIONES - ESTADÍSTICO MUESTRAL

A. Morillas: C. no paramétricos (II) 22

CONTRASTE DE LA SUMA DE RANGOSDOS POBLACIONES - REGIÓN CRÍTICA

1. Si H1 : M1 < M2 , rechazaremos la hipótesis nula siempre que T1 ≤ TL , ya que T1 sería la menor de las dos sumas.

2. Si H1 : M1 > M2 , rechazaremos la hipótesis nula siempre que T1 ≥ TU , puesto que, en este caso, T1 sería la mayor de las dos sumas.

3. Si H1 : M1 ≠ M2 , no se sabe si T1 es la mayor o la menor. Rechazaremos la hipótesis siempre que T1 ≤ TL o T1 ≥ TU , obteniendo los puntos críticos de la tabla para un contraste de dos colas.

• No deben repetirse muchas observaciones para que sea válido.

• T1 ~ N[E(T1 )=n1(n1+ n2+1)/2; Var(T1 )=n1n2(n1+ n2+1)/12], para muestras grandes (n1 , n2 >10).

H1 : F1 (x)> F2 (x)

H1 : F1 (x)< F2 (x)

H1 : F1 (x)≠ F2 (x)

A. Morillas: C. no paramétricos (II) 23

ESPECIFICACIÓN ALTERNATIVADE LAS HIPÓTESIS

M1 M2X

f1(x)

f2(x)

xi

F1(xi) F2(xi)

H1: M1 < M2 H1: F1 (x) > F2 (x)

El test no se limita a M

A. Morillas: C. no paramétricos (II) 24

CONTRASTE DE MANN-WHITNEYDOS POBLACIONES - INDEPENDIENTES

• Se parte del mismo planteamiento inicial de Wilcoxon

• Para cada posible combinación de valores se crea la variable:

(en caso de no ser iguales, supondremos n1 < n2)

• El estadístico dará el número total de veces que

las observaciones procedentes de X son inferiores a las de Y,

en la muestra combinada y ordenada.

⎧⎪⎪⎪⎨⎪⎪⎪⎩

<= = =

>

1 si x yi jW para i 1,2,...,n y j 1,2,...,nij 1 20 si x yi j

1 2

11 1

n n

iji j

U W= =

=∑∑

A. Morillas: C. no paramétricos (II) 25

CONTRASTE DE MANN-WHITNEYDOS POBLACIONES INDEPENDIENTES: Wij

XY

xn1

..

xi

..

x2

x1

yn2..yj..y3y2y1

Wij

xi < yj Wij = 1

xi > yj Wij = 0

A. Morillas: C. no paramétricos (II) 26

CONTRASTE DE MANN-WHITNEYDOS POBLACIONES INDEPENDIENTES

• Se hace lo mismo respecto a los valores de X superiores a los de Y:

Estadístico:

(en caso de que xi=yj , se asigna 1/2 tanto en Wij como en W*ij)

• El más pequeño está tabulado y se llama U de Mann-Whitney

• Para comprobar los cálculos:

⎧⎪⎪⎪⎨⎪⎪⎪⎩

<=

>ij

0 si x yi j* W 1 si x yi j

1 2*

21 1

n n

iji j

U W= =

= ∑∑

1 2 1 2*

1 2 1 21 1 1 1

( ) 1n n n n

ijiji j i j

U U W n nW= = = =

+ = + = =∑∑ ∑∑ U1= n1n2 – U2

U2= n1n2 – U1

A. Morillas: C. no paramétricos (II) 27

CONTRASTE DE MANN-WHITNEYDOS POBLACIONES INDEPENDIENTES: W*ij

XY

xn1

..

xi

..

x2

x1

yn2..yj..y3y2y1

xi > yj W*ij = 1

xi < yj W*ij = 0W* ij

A. Morillas: C. no paramétricos (II) 28

La aplicación del contraste, para las distintas hipótesis

alternativas, se hará como sigue:

a) Si H1: M1 > M2 [H1: F1 (x) < F2 (x)] ocurriría que, en

general, xi > yi (U1 < U2 ), contradiciendo la hipótesis nula.

Así, pues, rechazaremos la hipótesis nula si U1 es demasiado

pequeña y, por tanto, U2 es demasiado grande. Para un α

dado, se rechazará H0 siempre que:

α0 = P(U ≤ Uobs.) ≤ α Uobs : valor muestral de U1 (menor)

CONTRASTE DE MANN-WHITNEYDOS POBLACIONES - REGIÓN CRÍTICA

A. Morillas: C. no paramétricos (II) 29

b) Si H1 : M1 < M2 [H1: F1 (x) > F2 (x)]; es decir, la hipótesis

alternativa es que f1(x) está localizada a la izquierda de f2(x).

Esto significaría que, en general, xi < yi (U1 > U2) .

Por tanto, rechazaremos la hipótesis nula si U1 es demasiado

grande y U2 es pequeña. Para un α dado, se rechazará H0

siempre que:

α0 = P(U ≤ Uobs.) ≤ α Uobs : valor muestral de U2 (menor)

CONTRASTE DE MANN-WHITNEYDOS POBLACIONES - REGIÓN CRÍTICA

A. Morillas: C. no paramétricos (II) 30

c) Si H1 : M1 ≠ M2 [H1: F1 (x) ≠ F2 (x)]; rechazaremos la

hipótesis nula tanto si U1 es grande como pequeño. De ser así,

habría evidencia en la muestra de que los valores de Y son,

generalmente, superiores a los de X, o, por el contrario, de que

las observaciones de X superan a las de Y, contradiciendo la

hipótesis de igualdad propuesta como nula. Para un α dado, la

región crítica sería de dos colas, y podremos rechazar H0 si:

α0 = P(U ≤ Uobs.) ≤ α/2 Uobs : la menor de U1 y U2

CONTRASTE DE MANN-WHITNEYDOS POLACIONES - REGIÓN CRÍTICA

A. Morillas: C. no paramétricos (II) 31

MANN-WHITNEY: RELACIÓN CON WILCOXON Y APROXIMACIÓN NORMAL

Entre estos estadísticos y los propuestos por Wilcoxon, existen las siguientes relaciones:

Para n1, n2 > 10, se puede aproximar una normal con U2 :

U2 ∼ N [E(U2 )= n1 n2 /2 , Var(U2 )= n1 n2 (n1+ n2+1)/ 12]

+= + − ⇒ ≤ ≤

+= + − ⇒ ≤ ≤

1 11 1 2 1 1 2

2 22

1

21 2 2 1 2

n (n 1)U n n 0 U n n2

n (n 1)U n n 0 U n2

T n

T

A. Morillas: C. no paramétricos (II) 32

CONTRASTE DE KRUSKAL-WALLISMÁS DE DOS POBLACIONES

• Coincide con Wilcoxon-Mann-Whitney para k=2

• Es un ANOVA (análisis de la varianza) no paramétrico.

La hipótesis a contrastar es:

H0 : Todas las poblaciones tienen idéntica distribución de probabilidad (mediana): M1 = M2 = …. = Mk

H1 : Al menos dos de las k poblaciones difieren en su localización (mediana)

A. Morillas: C. no paramétricos (II) 33

CONTRASTE DE KRUSKAL-WALLISPROCEDIMIENTO

Los pasos a seguir son (idea similar a suma de rangos):

1. Se ordenan en una muestra única el conjunto de las observaciones del experimento, de menor a mayor

2. Se asigna un rango a cada observación (¡empates!)

3. Se calcula para cada muestra la suma de los rangos (R.j )

4. El estadístico muestral es (aproximación χ2 con nj > 5):

=−

=

= = − + →+ +

− ∑∑k

2j .j ..

2k 2j

k 1j 1 j 1 j

12 12 R.H 3(n 1)n(n 1) n(n 1) n

n (R R ) χ

V

A. Morillas: C. no paramétricos (II) 34

CONTRASTE DE KRUSKAL-WALLISORGANIZACIÓN DE LOS DATOS

y1k

y2k

..

..

..

..

..

y12

y22

..

y11

y21

..

k..21Muestras

1n 1y2n 2y

kn ky

.1R .2R .kR

= = =

= = = + + + = +∑ ∑∑jnk k

.. .j ijj 1 i 1 j 1

R R r 1 2 ... n n(n 1) 2

(r11 )(r21 )

)2n 2(r)

1n 1(r )kn k(r

Suma rangos R.1 R.2 R.kMedia rangos

(r12 )(r22 )

(r1k )(r2k )

..

..

Rangos en muestra única