comparación de distribuciones estadísticas · comparación de distribuciones estadísticas ......

21
7/7/2010 1 Comparación de distribuciones estadísticas estadísticas Tercer Verano de Probabilidad y Estadística 2010 Eloísa Díaz Francés Murguía A d P b bilid d E t dí ti /CIMAT Area de Probabilidad y Estastica/CIMAT [email protected]

Upload: buiduong

Post on 03-Oct-2018

237 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Comparación de distribuciones estadísticas · Comparación de distribuciones estadísticas ... – Dos tipos de fertilizantes – TiemposTiempos parapara realizarrealizartareastareas

7/7/2010

1

Comparación de distribucionesestadísticasestadísticas

Tercer Verano de Probabilidad y Estadística 2010

Eloísa Díaz Francés MurguíaA d P b bilid d E t dí ti /CIMATArea de Probabilidad y Estadística/CIMAT

[email protected]

Page 2: Comparación de distribuciones estadísticas · Comparación de distribuciones estadísticas ... – Dos tipos de fertilizantes – TiemposTiempos parapara realizarrealizartareastareas

7/7/2010

2

ContenidoContenido

• Modelado estadístico (G P Box 1980)Modelado estadístico (G. P. Box 1980)

• Comparación de distribuciones: N ét i

( )F x– No paramétricas

• Mann Whitney Wilcoxon Ho: Fx=Fy

• Kruskal Wallis Ho: Las medianas de k grupos son iguales• Kruskal Wallis Ho: Las medianas de k grupos son iguales

– Paramétricas

A li i Ci i N t l

( ; )F x

• Aplicaciones en Ciencias Naturales

• Ejemplo de Neurobiología

Page 3: Comparación de distribuciones estadísticas · Comparación de distribuciones estadísticas ... – Dos tipos de fertilizantes – TiemposTiempos parapara realizarrealizartareastareas

7/7/2010

3

George E. P. Box (1919‐ )"Essentially, all models are wrong, but some are useful"

Page 4: Comparación de distribuciones estadísticas · Comparación de distribuciones estadísticas ... – Dos tipos de fertilizantes – TiemposTiempos parapara realizarrealizartareastareas

7/7/2010

4

Modelado Estadístico ParamétricoModelado Estadístico Paramétrico

1 Datos de fenómeno aleatorio de interés1. Datos de fenómeno aleatorio de interés

2. Propuesta de 

3 C bi ió d i h é

( ; )f x 3. Combinación de experimentos homogéneos

4. Estimación del vector de parámetros

5. Validación del modelo con los datos

6 Aceptar el modelo como razonable hasta que6. Aceptar el modelo como razonable hasta quehaya evidencia en contra de él (y regresarentonces al punto 2)entonces al punto 2).

Page 5: Comparación de distribuciones estadísticas · Comparación de distribuciones estadísticas ... – Dos tipos de fertilizantes – TiemposTiempos parapara realizarrealizartareastareas

7/7/2010

5

Hay dos poblaciones de interés a comparar

• Se cuenta con dos distribuciones estimadas:Se cuenta con dos distribuciones estimadas:

1( ; )f x

2 ( ; )f x y1( ; )f x 2 ( ; )f x y

Notar que también se puede desear comparar: q p p

Distribución Empírica Distribución Teórica

vs n oF F

¿Có d ?

n o

¿Cómo se pueden comparar?

Page 6: Comparación de distribuciones estadísticas · Comparación de distribuciones estadísticas ... – Dos tipos de fertilizantes – TiemposTiempos parapara realizarrealizartareastareas

7/7/2010

6

Algunas posibilidades:Algunas posibilidades:

Graficar las dos densidades estimadas fx, fy, y Graficar las dos distribuciones estimadas Fx, Fy Graficar los contornos de las verosimilitudes bajo( )(si mismo modelo para los dos grupos)

Gráficas de verosimilitudes perfiles para cadaparámetro del modelo (mismos modelos)parámetro del modelo (mismos modelos)

Gráficas Q‐Q o Cuantil‐Cuantil Gráficas P‐P (de probabilidades)

[ ]P X Q Gráficas P P (de probabilidades)

Curvas ROC (Receiver Operating Characteristic Curve) Parámetro de confiabilidad:  [ ]P X Y a á et o de co ab dad [ ]P X Y

Page 7: Comparación de distribuciones estadísticas · Comparación de distribuciones estadísticas ... – Dos tipos de fertilizantes – TiemposTiempos parapara realizarrealizartareastareas

7/7/2010

7

Comparación de densidades y d b ldistribuciones Exponenciales

Page 8: Comparación de distribuciones estadísticas · Comparación de distribuciones estadísticas ... – Dos tipos de fertilizantes – TiemposTiempos parapara realizarrealizartareastareas

7/7/2010

8

Verosimilitud PerfilVerosimilitud Perfil

Page 9: Comparación de distribuciones estadísticas · Comparación de distribuciones estadísticas ... – Dos tipos de fertilizantes – TiemposTiempos parapara realizarrealizartareastareas

7/7/2010

9

Superficie de verosimilitud y sus contornosp y

Page 10: Comparación de distribuciones estadísticas · Comparación de distribuciones estadísticas ... – Dos tipos de fertilizantes – TiemposTiempos parapara realizarrealizartareastareas

7/7/2010

10

Contornos de VerosimilitudContornos de Verosimilitud

Page 11: Comparación de distribuciones estadísticas · Comparación de distribuciones estadísticas ... – Dos tipos de fertilizantes – TiemposTiempos parapara realizarrealizartareastareas

7/7/2010

11

Gráficas Q‐Q (cuantil‐cuantil) l d ó d d lpara validación de modelos

• Graficar en eje vertical observaciones ordenadas quej qson los cuantiles empíricos ordenados de probabilidades:

( )ix

• Graficar en eje horizontal cuantiles estimados bajo

1 2, , . . . ,1 1 1

nn n n

• Graficar en eje horizontal cuantiles estimados bajomodelo propuesto con mismas probabilidades.

• Coordenadas:  1

( ) para 1XiF x i n

• Agregar la recta de 45o como referencia

( ), para 1,..., .1

X iF x i nn

Page 12: Comparación de distribuciones estadísticas · Comparación de distribuciones estadísticas ... – Dos tipos de fertilizantes – TiemposTiempos parapara realizarrealizartareastareas

7/7/2010

12

Gráficas Q‐Q (cuantil‐cuantil) d d bpara comparar dos distribuciones

• Graficar en eje horizontal cuantiles de la G a ca e eje o o ta cua t es de adistribución de X para probabilidades0.01,0.02,….,0.99.

• Graficar en eje vertical cuantiles de la distribuciónde Y, para mismas probabilidades

• Coordenadas: 

1 1, para 0.01,0.02,...,0.99.X YF F

• Agregar a manera de referencia la recta de 45o

, p , , ,X Y

Page 13: Comparación de distribuciones estadísticas · Comparación de distribuciones estadísticas ... – Dos tipos de fertilizantes – TiemposTiempos parapara realizarrealizartareastareas

7/7/2010

13

Gráficas P‐P (probabilidades) l d ó d d lpara validación de modelos

G fi j h i t l b bilid d• Graficar en eje horizontal probabilidadesacumuladas bajo estimada para un vector de valores en el soporte de X.

( )XF tt p

• Graficar en eje vertical probabilidadesl d l di ib ió í i Xacumuladas con la distribución empírica

para mismos valores de    t( )X

nF t

• Coordenadas: 

X , para vector de valores XX nF t F t t

Page 14: Comparación de distribuciones estadísticas · Comparación de distribuciones estadísticas ... – Dos tipos de fertilizantes – TiemposTiempos parapara realizarrealizartareastareas

7/7/2010

14

Ejemplos gráficas Q‐Q y P‐PEjemplos gráficas Q Q y P P

Page 15: Comparación de distribuciones estadísticas · Comparación de distribuciones estadísticas ... – Dos tipos de fertilizantes – TiemposTiempos parapara realizarrealizartareastareas

7/7/2010

15

Curvas ROC(Receiver Operating Characteristic Curves)

• Graficar en eje horizontal probabilidadesacumuladas bajo estimada para un vector  ( )XF tde valores t en el soporte de X.

( )

• Graficar en eje vertical probabilidadesacumuladas bajo para mismos valores de t .   ( )YF t

• Coordenadas:  ( ) ( )X YF t F t ( ), ( )X YF t F t

Page 16: Comparación de distribuciones estadísticas · Comparación de distribuciones estadísticas ... – Dos tipos de fertilizantes – TiemposTiempos parapara realizarrealizartareastareas

7/7/2010

16

Ejemplos curvas ROC para comparard b ó b ll b ldistribución Weibull con Gumbel:

Page 17: Comparación de distribuciones estadísticas · Comparación de distribuciones estadísticas ... – Dos tipos de fertilizantes – TiemposTiempos parapara realizarrealizartareastareas

7/7/2010

17

Curva ROC, Weibull vs GumbelCurva ROC, Weibull vs Gumbel

Page 18: Comparación de distribuciones estadísticas · Comparación de distribuciones estadísticas ... – Dos tipos de fertilizantes – TiemposTiempos parapara realizarrealizartareastareas

7/7/2010

18

Notar que: 

= 0.5, dondeX YF F

á b j ROC P[X Y] = área bajo curva ROC = P[X<Y]

Page 19: Comparación de distribuciones estadísticas · Comparación de distribuciones estadísticas ... – Dos tipos de fertilizantes – TiemposTiempos parapara realizarrealizartareastareas

7/7/2010

19

Curva ROC para ejemplo de exponenciales

Page 20: Comparación de distribuciones estadísticas · Comparación de distribuciones estadísticas ... – Dos tipos de fertilizantes – TiemposTiempos parapara realizarrealizartareastareas

7/7/2010

20

Ejemplo curva ROC donde 0.5 pero donde las distribuciones discrepan:

Page 21: Comparación de distribuciones estadísticas · Comparación de distribuciones estadísticas ... – Dos tipos de fertilizantes – TiemposTiempos parapara realizarrealizartareastareas

7/7/2010

21

Aplicaciones en Ciencias Naturales:Aplicaciones en Ciencias Naturales:

• Comparar dos poblaciones biológicas conComparar dos poblaciones biológicas con respecto a alguna característica o desempeño– Dos tratamientos médicos– Dos tratamientos médicos

– Dos tipos de fertilizantes

Tiempos para realizar tareas de dos grupos– Tiempos para realizar tareas de dos gruposindividuos

• Bondad de ajuste de un modelo propuesto• Bondad de ajuste de un modelo propuesto– Distribución empírica vs teórica (estimada)