equipo 10 estadistica

16
 INSTITUTO TECNOLÓGICO DE REYNOSA SOFTWARE ESTADÍSTICO EQUIPO NO. 10 DOCENTE: ING. ANA MARITZA RAMÍREZ GOVEA. MATERIA: ESTADÍSTICA INFERENCIAL I TURNO: MATUTINO. CARRERA: INGENIE RÍA INDUSTRIAL. 3° SEMEST RE INTEGRANTES DEL EQUIPO:  GARCÍA SÁNCHEZ MARIO ALBERTO  LOMBARD MONTERO WENDY MARICRUZ  RODRÍGUEZ OLVERA KARLA ABIGAIL  TORRES DE LA ROSA SANDRA NOHEMÍ  ZERMEÑO GONZÁLEZ KARLA YESENIA A: 28.NOV.2011 CD. REYNOSA, TAMPS.

Upload: angel-barragan-robles

Post on 11-Jul-2015

2.709 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Equipo 10 Estadistica

5/11/2018 Equipo 10 Estadistica - slidepdf.com

http://slidepdf.com/reader/full/equipo-10-estadistica 1/16

INSTITUTO TECNOLÓGICO DE REYNOSA

SOFTWARE ESTADÍSTICOEQUIPO NO. 10

DOCENTE: ING. ANA MARITZA RAMÍREZ GOVEA.

MATERIA: ESTADÍSTICA INFERENCIAL ITURNO: MATUTINO. 

CARRERA: INGENIERÍA INDUSTRIAL. 3° SEMESTRE

INTEGRANTES DEL EQUIPO:

  GARCÍA SÁNCHEZ MARIO ALBERTO  LOMBARD MONTERO WENDY MARICRUZ  RODRÍGUEZ OLVERA KARLA ABIGAIL  TORRES DE LA ROSA SANDRA NOHEMÍ   ZERMEÑO GONZÁLEZ KARLA YESENIA

A: 28.NOV.2011

CD. REYNOSA, TAMPS.

Page 2: Equipo 10 Estadistica

5/11/2018 Equipo 10 Estadistica - slidepdf.com

http://slidepdf.com/reader/full/equipo-10-estadistica 2/16

2

PRUEBAS NO PARAMÉTRICAS

Se estudiarán las pruebas NO PARAMÉTRICAS, las cuales no requieren asumir

normalidad de la población y que en su mayoría se basan en el ordenamiento de los

datos.

Todas las pruebas vistas en este capítulo requieren que la población sea continua. El

parámetro que se usa para hacer las pruebas estadísticas es la Mediana y no la Media.

En MINITAB, para las pruebas no paramétricas se elige la secuencia:

→ Abrir programa.

→ Estadísticas. → No Paramétricos. 

Page 3: Equipo 10 Estadistica

5/11/2018 Equipo 10 Estadistica - slidepdf.com

http://slidepdf.com/reader/full/equipo-10-estadistica 3/16

3

6. PRUEBA DE KOLMOGOROV-SMIRNOV (KS)

En estadística, la prueba de Kolmogórov-Smirnov (también prueba K-S) es una prueba no

paramétrica que se utiliza para determinar la bondad de ajuste de dos distribuciones de

probabilidad entre sí.Conviene tener en cuenta que la prueba Kolmogórov-Smirnov es más sensible a los valores

cercanos a la mediana que a los extremos de la distribución. La prueba de Anderson-

Darling proporciona igual sensibilidad con valores extremos.

En esta prueba también se está interesado en el grado de concordancia entre la distribución de

frecuencia muestral y la distribución de frecuencia teórica, bajo la hipótesis nula de que la

distribución de la muestra es f0(x,q) e interesa probar que no existe diferencia significativa. La

prueba trabaja con la función de distribución (distribución de frecuencia acumulativa). Esta

prueba pertenece al campo de la Estadística No Paramétrica.

Sea F0(x) la función de distribución teórica para la variable aleatoria X, y representa la

probabilidad de que la variable aleatoria X tome un valor menor o igual a x (también se

interpreta como la proporción esperada de observaciones que tengan un valor menor o igual a

x). Es decir:

Sea Sn (x) la función de distribución empírica, calculada con base en los valores observados de

la muestra n observaciones. Sn (x) representa la proporción de valores observados que son

menores o iguales a x, y está definida como:

Sn (x) = P ( X £ x/ dados los resultados muestrales) = m/n

donde m es el número de valores observados que son menores o iguales a x.

Page 4: Equipo 10 Estadistica

5/11/2018 Equipo 10 Estadistica - slidepdf.com

http://slidepdf.com/reader/full/equipo-10-estadistica 4/16

4

PASOS A SEGUIR EN MINITAB:

1.-Generaremos 100 datos aleatorios con una Media= 264.6 y una Desviación Estándar de32.02, de la siguiente manera:

→ Calc

→ Datos Aleatorios

→ Normal 

→ Damos doble clic. 

→ Rellenamos la pantalla con los datos que nosproporcionaron en el problema, como se observaen la imagen, y damos un clic más en aceptar.

→ Aparecerán 100 datos en la columna C1

[Distribución Normal].

Nos aseguramos que los datos se distribuyan normalmente con la prueba de Kolmogorov-Smirnov como sigue.

→ Estadísticas 

→ Estadísticas Básicas 

→ Prueba de Normalidad 

→ Rellenamos los datos que nos piden: envariable seleccionamos C1 y ahí en dondedice prueba de normalidad seleccionamosKolmogorov-Smirnov.

→ Presionamos Aceptar. 

Page 5: Equipo 10 Estadistica

5/11/2018 Equipo 10 Estadistica - slidepdf.com

http://slidepdf.com/reader/full/equipo-10-estadistica 5/16

5

→ De ahí les aparecerá el grafico donde se observa la distribución de los datos. 

El VALOR P > 0.05 para que losdatos se distribuyan

normalmente.Y como se puede observar en elgrafico el Valor P > 0.100, lo quenos indica que los datos si sedistribuyen normalmente y por lotanto Aceptamos H₀ yrechazamos H₁.

Page 6: Equipo 10 Estadistica

5/11/2018 Equipo 10 Estadistica - slidepdf.com

http://slidepdf.com/reader/full/equipo-10-estadistica 6/16

6

PRUEBA DE ANDERSON-DARLIN

La prueba Anderson-Darling es, en general, más potente que la pruebas X2 de Pearson y la deKolmogorov-Smirnov . Resulta lógico pensar que la X2  de Pearson es menos potente que la de

Kolmogorov-Smirnov y la de Anderson- Darling debido a que trabaja con datos agrupadosdebido al agrupamiento. Hay pérdida de información. Por otro lado, la prueba Kolmogorov-Smirnov es menos sensible a desajustes que pudieran haber en las colas de la distribución,que la prueba Anderson- Darling (Easterling 1976; Stephens 1974, Cap 4). En particular, laprueba Anderson- Darling funciona mejor que cualquiera otra, cuando haya casosextraordinarios o aberrantes (outliers).

La estadística Anderson-Darling está dada por la siguiente expresión:

A2  =-n- (1/n)Σ [(2i - 1) Ln(P ( i ) ) + (2n +1 - 2i)Ln{1 - p ( i ) }]  

Donde P (i) es el área bajo la curva normal para el intervalo (-oo,z( i )), o sea es la función

distribución normal estándar evaluada en el i-ésimo elemento (en orden ascendente) de lamuestra.

Se presentan dos situaciones para la estadística Anderson-Darling: la primera en que seconocen los parámetros de la distribución llamado caso 0 (cero), y la otra en que se desconoceal menos uno de ellos (casos 1, 2 y 3).

Situándonos en el caso de bondad de ajuste a la distribución normal se consideran lossiguientes casos:

Caso 0: µ y s 2 conocidos.Caso 1: s 2 conocida y µ desconocida y estimada por X .

Caso 2: µ conocida y s 

desconocida y estimada por s (n) = Σ (x i -  µ)

 /nCaso 3: ambos desconocidos, estimados por X y s n-1 = Σ (x i - x )2  /n-1

Para cada uno de los casos existe una tabla estadística para realizar la prueba de lahipótesis, Ho: "La muestra aleatoria proviene de una distribución normal". La estadística deAnderson-Darling se calcula para los cuatro casos de la misma manera; sin embargo, en elcaso 3 se debe multiplicar por un factor de corrección el cual es: 1 + (0.75/n) + (2.25/n2 ), quemejora la aproximación.La prueba Anderson-Darling para la bondad de ajuste normal, en el caso 0, se realiza siguiendolos siguientes pasos:

Page 7: Equipo 10 Estadistica

5/11/2018 Equipo 10 Estadistica - slidepdf.com

http://slidepdf.com/reader/full/equipo-10-estadistica 7/16

7

Supongamos que tenemos 40 pesos en libras de estudiantes varones.

¿Provienen estos datos d una distribución normal?

154 135 126 138 132 135 125 135136 128 138 147 140 152 142 144

144 145 145 176 156 157 158 161163 164 165 168 173 146 146 140147 148 149 150 150 142 119 153

Ho: Los datos se ajustan a un modelo normal.Ha: Los datos no se ajustan a un modelo normal.

PASOS A SEGUIR EN MINITAB:

→ Introducimos los 40 datos de los pesos en C1 .

→ Estadísticas. 

→ Estadísticas Básicas. 

→ Mostrar Estadísticas descriptivas. 

→ Aparecen estadísticas.

→ Estadísticas Básicas.

→ Prueba de Normalidad.

Page 8: Equipo 10 Estadistica

5/11/2018 Equipo 10 Estadistica - slidepdf.com

http://slidepdf.com/reader/full/equipo-10-estadistica 8/16

8

→ Rellenamos datos y seleccionamos la prueba

de Anderson-Darling.

→ De ahí nos aparece el gráfico.

El VALOR P > 0.05 para que los datos se distribuyan normalmente.

Y como se puede observar en el grafico el Valor P = 0.926, lo que nos indica que los datos si

se distribuyen normalmente y por lo tanto Aceptamos H₀ y rechazamos H₁.

Page 9: Equipo 10 Estadistica

5/11/2018 Equipo 10 Estadistica - slidepdf.com

http://slidepdf.com/reader/full/equipo-10-estadistica 9/16

9

PRUEBA DE RYAN-JOINER

La prueba de Ryan - Joiner es usada para probar si una muestra viene de una distribución

especifica. Esta prueba es una modificación de la prueba de Kolmogorov-Smirnov donde se le

da más peso a las colas de la distribución que la prueba de Kolmogorov-Smirnov .

En estadística, la prueba de Ryan - Joiner es una prueba no paramétrica sobre si los datos de

una muestra provienen de una distribución específica. La fórmula para el estadístico determina

si los datos (observar que los datos se deben ordenar) vienen de una distribución con función

acumulativa F.

Formulas:

A2 = − N  − S  

Donde:

Elestadístico de la prueba se puede entonces comparar contra las distribuciones del estadísticode prueba (dependiendo que F se utiliza) para determinar el P-valor. 

Page 10: Equipo 10 Estadistica

5/11/2018 Equipo 10 Estadistica - slidepdf.com

http://slidepdf.com/reader/full/equipo-10-estadistica 10/16

10

Ejemplo:

En el método de Anderson Darling o Ryan Joiner, si el valor de probabilidad P de la prueba es

mayor a 0.05, se considera que los datos son normales. Seguir los siguientes pasos:

H₀= Los datos tienen una distribución normal

H₁= Los datos NO tienen una distribución normal

PASOS A SEGUIR EN MINITAB:

1.-Generaremos 100 datos aleatorios con una Media= 264.6 y una Desviación Estándar de

32.02, de la siguiente manera:

→ Calc.

→ Datos Aleatorios

→ Normal 

→ Damos doble clic.

→ Rellenamos la pantalla con los datos que nos

proporcionaron en el problema, como se observa

en la imagen, y damos un clic más en aceptar.

Page 11: Equipo 10 Estadistica

5/11/2018 Equipo 10 Estadistica - slidepdf.com

http://slidepdf.com/reader/full/equipo-10-estadistica 11/16

11

→ Aparecerán 100 datos en la columna C1 

[Distribución Normal].

Nos aseguramos que los datos se distribuyan normalmente con la prueba de

Ryan-Joiner como sigue.

→ Estadísticas 

→ Estadísticas Básicas 

→ Prueba de Normalidad 

→ Rellenamos los datos que nos

piden: en variable seleccionamos C1

y ahí en donde dice prueba de

normalidad seleccionamos

Ryan-Joiner.

→ Presionamos Aceptar.

→ De ahí les aparecerá el grafico donde se observa la distribución de los datos. 

Page 12: Equipo 10 Estadistica

5/11/2018 Equipo 10 Estadistica - slidepdf.com

http://slidepdf.com/reader/full/equipo-10-estadistica 12/16

12

Como el de la siguiente imagen:

El VALOR P > 0.05 para que los datos se distribuyan normalmente.

Y como se puede observar en el grafico el Valor P > 0.100, lo que nos indica que los datos sise distribuyen normalmente y por lo tanto Aceptamos H₀ y rechazamos H₁.

Otra opción por medio de una gráfica de probabilidad normal, se tiene:

→ Gráfica. 

→ Gráfica de Probabilidad.

→ Individual. Clic Aceptar.

→ Aparece Gráfica de Probabilidad. 

Page 13: Equipo 10 Estadistica

5/11/2018 Equipo 10 Estadistica - slidepdf.com

http://slidepdf.com/reader/full/equipo-10-estadistica 13/16

13

→ En la variable seleccionan C1, y luego distribución dan clic en distribución normal. Luego

Aceptar.

→Los puntos deben

quedar dentro del

intervalo de confianza

para indicar que es

normal la distribución.

Page 14: Equipo 10 Estadistica

5/11/2018 Equipo 10 Estadistica - slidepdf.com

http://slidepdf.com/reader/full/equipo-10-estadistica 14/16

14

PRUEBA DE SHAPPIRO-WILK

En estadística, el Test de Shapiro –Wilk, se usa para contrastar la normalidad de un conjunto dedatos. Se plantea como hipótesis nula que una muestra x 1…x n  proviene de una poblaciónnormalmente distribuida. Fue publicado en 1965 por Samuel Shapiro y Martin Wilk.  Se

considera uno de los test más potentes para el contraste de normalidad, sobre todo paramuestras pequeñas.

El estadístico del test es:

Donde

  x (i ) (con el subíndice i entre paréntesis) es el número que ocupa la i-ésima posición en lamuestra;

  = (x 1 + ... + x n ) / n es la media muestral;  las constantes a i  se calculan2 

Donde

Siendo m 1...m n  son los valores medios del estadístico ordenado, de variables aleatoriasindependientes e idénticamente distribuidas, muestreadas de distribuciones normales. V es lamatriz de covarianzas de ese estadístico de orden.

La hipótesis nula se rechazará si W es demasiado pequeño.Es un contraste de ajuste que se utiliza para comprobar si unos datos determinados (X 1, X2,…,

Xn) han sido extraídos de una población normal. Los parámetros de la distribución no tienenporqué ser conocidos y está adecuado para muestras pequeñas (n<50).Un contraste de ajustetiene como objetivo comprobar si con base en la información suministrada por una muestra sepuede aceptar que la población de origen sigue una determinada distribución de probabilidad,en nuestro caso, la distribución normal

Page 15: Equipo 10 Estadistica

5/11/2018 Equipo 10 Estadistica - slidepdf.com

http://slidepdf.com/reader/full/equipo-10-estadistica 15/16

15

PASOS A SEGUIR EN MINITAB:

1.-Generaremos 25 datos aleatorios con una Media= 152.05 y una Desviación Estándar de

48.09, de la siguiente manera:

→ Calc

→ Datos Aleatorios

→ Normal 

→ Damos doble clic. 

→ Rellenamos la pantalla con los datos que nos proporcionaron en el problema, como seobserva en la imagen, y damos un clic más en aceptar.

→ Aparecerán 25 datos en la columna C1.

→ Realizaremos la prueba de Wilcoxon

para 1 muestra.

→ Estadísticas. 

→ No paramétricas. 

→ Wilcoxon de 1 muestra. 

→ Rellenamos los datos que nos piden: en variable seleccionamos C1 y ahí en donde dice

media de la prueba rellenamos con 152 y damos clic en

aceptar.

→ Nos aparece otra ventana 

Page 16: Equipo 10 Estadistica

5/11/2018 Equipo 10 Estadistica - slidepdf.com

http://slidepdf.com/reader/full/equipo-10-estadistica 16/16

16

→ Gráfica. →Gráfica de Probabilidad. 

→ Individual. Con distribución normal. 

→ Y aparece el gráfico. 

Mide el ajuste de la muestra a una recta, al dibujarla en papel probabilístico normal. Este tipode representación también lo proporcionan algunos programas de estadística, de tal manera

que nos permite además apreciar el ajuste o desajuste de forma visual:

En escala probabilística normal se representa en el eje horizontal, para cada valor observadoen nuestros datos, la función de distribución o probabilidad acumulada observada, y en el ejevertical la prevista por el modelo de distribución normal. Si el ajuste es bueno, los puntos sedeben distribuir aproximadamente según una recta a 45º. En la imagen vemos que en esteejemplo existe cierta discrepancia.

En cualquier caso siempre es adecuado efectuar una representación gráfica de tipo histogramade los datos, y comparar el valor de la media y la mediana, así como evaluar el coeficiente deasimetría y apuntamiento, además de llevar a cabo una representación en escala probabilísticade la distribución de probabilidad esperada versus observada, como la de la figura.