cuadernillo estadistica

54
CUADERNILLO ESTADISTICA INTEGRANTES : * ARZATE SALGADO JOSE IVAN * MIGUEL HERRERA ENRIQUE * SALAS CURIEL JESSICA * SAN VICENTE FERNANDEZ ALEJANDRA * VALDEZ MANZO SARAI MIROSLAVA ESTADISTICA BASICA

Upload: sarai470

Post on 26-Jun-2015

996 views

Category:

Documents


11 download

TRANSCRIPT

Page 1: CUADERNILLO ESTADISTICA

CUADERNILLO ESTADISTICA

INTEGRANTES : * ARZATE SALGADO JOSE IVAN * MIGUEL HERRERA ENRIQUE * SALAS CURIEL JESSICA * SAN VICENTE FERNANDEZ ALEJANDRA * VALDEZ MANZO SARAI MIROSLAVA

ESTADISTICA BASICA

Page 2: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

Unidad Temas Subtemas1 Estadística descriptiva.

1.1 Definición y campo de la estadística.1.2 Planteamiento de un caso específico.1.3 Organización de datos.1.4 Medidas de tendencia central.1.5 Medidas de dispersión.1.6 Aplicación en el caso específico.

2 Distribuciones muéstrales. 2.1 Introducción.

2.2 Distribución muestral de la media con varianza conocida.2.3 Teorema del límite central.2.4 Distribución muestral de la proporción.2.5 Distribución muestral de la diferencia de medias y de diferencia de proporciones.2.6 Distribución muestral de la media con varianza desconocida.2.7 Distribución muestral de la diferencia de medias.2.8 Distribución muestral de la varianza.2.9 Distribución muestral de la razón de varianzas.2.10 Aplicación en el caso específico.

Page 3: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

3 Teoría de la estimación. 3.1 Introducción.

3.2 Estimación y propiedades de los estimadores.3.3 Estimación por intervalo.3.4 Intervalo de confianza para la media con varianza conocida y desconocida.3.5 Intervalo de confianza para una proporción y diferencia de proporciones.3.6 Intervalo de confianza para diferencias de medias con varianza conocida y desconocida.3.7 Intervalo de confianza para una varianza.3.8 Intervalo de confianza para una razón de varianzas.3.9 Aplicación en el caso específico.

4 Pruebas de hipótesis.4.1 Conceptos de la teoría de prueba de hipótesis.4.2 Errores tipo I y II.4.3 Prueba de hipótesis para una media con varianza conocida y desconocida.4.4 Prueba de hipótesis para una proporción y diferencia de proporciones.

Page 4: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

4.5 Prueba de hipótesis para diferencia de medias con varianzas conocidas y desconocidas.4.6 Prueba de hipótesis para una varianza4.7 Prueba de hipótesis para una razón de varianzas.4.8 Prueba de bondad de ajuste.4.9 Aplicación en el caso específico.

ESTADISTICA:

La estadística es la ciencia cuyo objetivo es reunir información cuantitativa relacionada a individuos, grupos, series de hechos, entre otros. Gracias al análisis de estos datos se pueden deducir algunos significados precisos o algunas previsiones para el futuro. La estadística, en general, es la ciencia que trata la recopilación, la organización, la presentación, el análisis y la interpretación de datos numéricos con el fin de realizar una toma de decisiones más efectiva.

“Ciencia que se ocupa del estudio de fenómenos de tipo genérico, normalmente complejos y enmarcados en un universo variable, mediante el empleo de modelos de reducción de la información y de análisis de validación de los resultados en términos de representatividad”. La información puede ser numérica, alfabética o simbólica. Consta de las fases de recogida de información, de análisis y de presentación e interpretación de los resultados y elaboración de métodos.

Importancia

La estadística resulta muy útil no sólo para recopilar y describir datos, sino también para interpretar la información obtenida, que puede ser aprovechada para demostrar la evolución de un fenómeno a través de cierto tiempo.

En México, el Instituto Nacional de Estadística y Geografía (INEGI) se encarga de recabar información estadística y geográfica de todo el país, en diferentes áreas y contextos. Los datos que publica sirven para dar a conocer a cualquier persona la situación en la que se encuentra el área de donde se obtuvo la información. Al gobierno le son muy útiles para tomar decisiones, por ejemplo, para saber qué

Page 5: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

acciones se deben implementar en tal o cual zona del país, conocer los avances que se han registrado o como herramienta para la evaluación de un proyecto. Los métodos estadísticos se utilizan prácticamente en investigaciones de todas las áreas de conocimiento; tanto en el ámbito académico, como en el profesional y laboral.

División de la Estadística

La Estadística para su mejor estudio se ha dividido en dos grandes ramas: la Estadística Descriptiva y la Inferencial.

Estadística Descriptiva: La función descriptiva de la estadística se enfoca en la presentación y clasificación de los datos obtenidos de la población que se analiza.

Estadística Inferencial: Esta aplicación de la estadística busca plantear y resolver problemas específicos y/o hacer previsiones a partir de los datos de una muestra.

La estadística descriptiva describe datos.La estadística inferencial infiere con esos datos, entendiendo inferir como la predicción de un resultado.

Conceptos básicos: Población: Conjunto de todos los elementos que presentan una característica común determinada, observable y medible. Por ejemplo, si el elemento es una persona, se pueden estudiar las características edad, peso, nacionalidad, sexo, etc. Los elementos que integran una población pueden corresponder a personas, objetos o grupos (por ejemplo, familias, las manzanas de una cosecha, empleados de una empresa, etc.).

Individuo: Un individuo o unidad estadística es cada uno de los elementos que componen la población. Nota que un individuo en estadística puede ser distinto a un individuo como persona. Por ejemplo, en los censos económicos se obtienen datos de los negocios. En este caso cada negocio, que está formado por varias personas, es un individuo de la población.

Muestra: La mayoría de los estudios estadísticos se realiza, no a partir de toda la población, sino de un subconjunto o parte de ésta, llamado muestra, partiendo del supuesto de que este subconjunto presenta el mismo comportamiento y características que la población. En general el tamaño de la muestra es mucho menor al tamaño de la población.

Page 6: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

Muestreo: Es el proceso de recabar los datos que se desean analizar, obtenidos de una proporción reducida y representativa de la población.

Variable: Se llama variable a una característica que se observa en una población o muestra, y a la cual se desea estudiar. La variable puede tomar diferentes valores dependiendo de cada individuo. Las variables se pueden clasificar en cuantitativas y cualitativas:

a) Variable cuantitativa: se expresa en valores numéricos. Dentro de ella, se subdividen en:

Discreta: Se tratan de variables expresadas con valores enteros. Ej. N° de hijos de una Familia, n° de alumnos de un curso.

Continua: son valores que pueden tomar cualquier valor dentro de un intervalo. Ej. Peso, estatura, sueldos.

b) Variable cualitativa: es aquella que describe cualidades. No son numéricas y se subdividen en:

Nominal: son variables presentadas sin orden ni jerarquía. Ej. Estado civil, preferencia por una marca, sexo, lugar de residencia.

Ordinal: son variables organizadas de acuerdo con una clasificación. Ej. grado de estudios, días de la semana, calidad de la atención, nivel socioeconómico.

Solución de un problema estadístico

La solución de un problema estadístico comprende los siguientes pasos:

A) Planteamiento del problema.En el planteamiento se define la población, la característica a estudiar (las variables), una hipótesis, etc. En este punto también se analizan los medios de los que se dispone y el procedimiento a seguir.

B) Elaboración de un modelo.Se establece un modelo teórico de comportamiento de las variables de estudio. En ocasiones no es posible diseñar el modelo hasta realizar un estudio previo.Los posibles modelos son Normal, Binomial, Poisson, Uniforme, etc.

C) Extracción de la muestra.Se usa alguna técnica de muestreo o un diseño experimental para obtener información de una pequeña parte de la población.

D) Tratamiento de los datos

Page 7: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

En esta fase se eliminan posibles errores, se depura la muestra, se tabulan los datos y se calculan los valores que serán necesarios en pasos posteriores, como la media y la varianza de la muestra. Los métodos de esta etapa corresponden a los métodos de la estadística descriptiva. Algunas de las etapas de esta fase son: recopilación, clasificación y presentación de la información.

E) Estimación de los parámetrosLa estadística inferencial nos proporciona herramientas para la predicción o estimación de los parámetros de la población que nos ayudarán a resolver el problema. Un ejemplo de estas herramientas son las pruebas de hipótesis que se obtienen del análisis de los datos y los intervalos de confianza.

EJERCICIO:

Durante un mes de verano los 8 vendedores en una empresa de equipos de calefacción de aire acondicionado vendieron los siguientes números en unidades centrales de aire acondicionado 8, 11, 5, 14, 8, 11, 16 y 11 con los datos anteriores encuentre el rango, moda, mediana, media aritmética, varianza y desviación estándar de esta población.

RANGO: 5 8 8 11 11 11 14 16 = 5-16 =11

MODA: 11

MEDIANA: 11+11=22/2=11

MEDIA ARITMETICA:

μ2=∑i=1

n

¿x in

=¿ 5+8+8+11+11+11+14+168

=848

=¿¿10.5

VARIANZA:

σ 2=∑i−1

n

¿¿¿¿

+¿¿10.75

DESVIACION ESTANDAR:

Page 8: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

σ=√σ2=√10.75=¿ 3.278

“DATOS AGRUPADOS”Es agrupar la información con la que se cuenta, e ir clasificando por características que nos faciliten manejar y tener el control de los datos.

Es decir cuando el conjunto de datos de interés, contiene solo pocas observaciones, proporciona habitualmente un adecuado resumen de los mismos, sin embargo, en la práctica, la mayor parte de los conjuntos de datos, contienen muchas observaciones y será preciso lograr una presentación más completa, de la distribución de tales datos.

En los datos agrupados se pueden calcular, su media y varianza, pero sería útil proporcionar además una idea visual de la información que contienen los datos.

Una ordenación de datos es una de las formas más sencillas de presentarlos: Organiza los valores en orden ascendente o descendente.

La ordenación de datos ofrece varias ventajas con respecto a los datos sin procesar.

• Podemos identificar los valores mayor y menor rápidamente.

• Es fácil dividir los datos en secciones.

• Podemos ver si algunos valores aparecen más de una vez en el arreglo.

• Podemos observar la distancia entre valores sucesivos de los datos.

Una distribución de frecuencias es una tabla, en la que organizamos los datos en clases, es decir, en grupo de valores, qué describen una característica de los datos, muestra el número de observaciones, de el conjunto de datos que caen en cada una de las clases. Si se puede determinar la frecuencia con la que se presentan los valores en cada clase de un conjunto de datos, se puede construir una distribución de frecuencias.

Page 9: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

EJEMPLOS

x=∑i=1

n

¿ fimi

∑ fi=166280

=20.770

s2=∑i=1

nfim2

n−x2=36306.02

80−¿¿

s=√s2=√22.43=4.73

Page 10: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

EJERCICIO #2A) Encuentre la media aritmética

B) DETERMINE LA VARIANZA

C) Encuentre la desviación estándar

Clases ventas dólares

f M fM F M 2

10-20 1 15 15 225

20-30 8 25 200 5,000

30-40 10 35 350 12,250

40-50 9 45 405 18,225

50-60 8 55 440 24,200

60-70 4 65 260 16,900

70-80 2 75 150 11,250

total 42 1,820 88,050

x̅$= 182042 =43.3

88,05042

– (43.3)2= 2,096.42-1,874.89

S2=221.53

S= √221.53

S=14.88

Page 11: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

UNIDAD II

DISTRIBUCIONES MUESTRALES

Muestrear es una forma de evaluar la calidad de un producto, la opinión de los

consumidores, la eficacia de un medicamento o de un tratamiento. Muestra es una

parte de la población. Población es el total de resultados de un experimento.

Hacer una conclusión sobre el grupo entero (población) basados en información

estadística obtenida de un pequeño grupo (muestra) es hacer una inferencia

estadística.

A menudo no es factible estudiar la población entera. Algunas de las razones por

lo que es necesario muestrear son:

1. La naturaleza destructiva de algunas pruebas

2. La imposibilidad física de checar todos los elementos de la población.

3. El costo de estudiar a toda la población es muy alto.

4. El resultado de la muestra es muy similar al resultado de la población.

5. El tiempo para contactar a toda la población es inviable.

Distribución muestral de las medias. Es una distribución de probabilidad de todas

las posibles medias muestréales, de un tamaño de muestra dado, seleccionadas

de una población.

Page 12: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

EJERCICIO #3

DISTRIBUCIONES MUESTRALESUNA POBLACION NORMAL TIENE MEDIA=80 Y DESVIACION ESTANDAR=14

A) Calcule la probabilidad de tener un valor entre 75 y 90.

B) La probabilidad de tener un valor de 75 o menor.

C) Calcule la probabilidad de tener un valor entre 55 y 70.

A) M=80 Z=90−8014 =0.7142=0.2611σ=14

P (75<X<90)

P (90<X<80) Z=75−8014=0.3571=0.1368

0.2611+0.168 R= 39.79%

Page 13: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

B) μ=80 0.5 - 0.1368=.3632

σ=14 R= 36.32% P (75<X)

Page 14: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

C) M=80

σ=14

P (55<X<70) Z=70−8014=0.7142 =.2611

.2611-.1368= .1243

R= 12.43%

EJERCICIO #4

LA MEDIA DE LA POBLACION NORMAL, ES 60 Y LA DESVIACION=12. SE TOMA UNA MUESTRA ALEATORIA DE 9. CALCULE LA PROBABILIDAD DE QUE LA MEDIA MUESTRAL.

A) Se mayor que 63B) Menor que 56C) Este entre 56 y 63

Page 15: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

A) x̅$=60 P (x̅$>63)

σ =56 Z=63−2012√9

=34=.75 R=.75

.5 + 2734 = .7734 1 - .7734 = 0.2266

22.66%

B) P (x̅$>56) .05 + .0398 = .5398

Z=56−6012√9

=44=1 1 - .5398 = .4602=

R=46.02%

Page 16: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

C)P(56<X<63)

0.3938+.2734=0.3132

0.3132X100= R=31.32%

Page 17: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

DISTRIBUCION MUESTRAL DE LA PROPORCION

Sea X1, X2,…, Xn una muestra aleatoria tomada de una población con una

distribución de Bernoulli con parámetro q. Por lo tanto su función de probabilidad,

su media y su varianza están dadas por:

E(X) = q, V(X) = q (1 - q)

Si P es la proporción muestral, definida como

En virtud del Teorema Central del Límite, como P es la media muestral de los

diferentes valores de Xi, entonces P tiende a seguir una distribución normal con

los parámetros dados anteriormente, es decir, P ~. Ó también la variable aleatoria

Sigue una distribución normal estándar con media cero y varianza unitaria, cuando

el tamaño de la muestra n es grande.

Page 18: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

EJEMPLO

Se elije una muestra de 2000 electores potenciales en el estado de México.

Se encontró que 1550 planean votar por el gobernador actual ¿cuál es la probabilidad de que el gobernador sea elegido presidente de la Republica?

En una encuesta previa se determinó que el 80% de la población total del padrón votante elegiría a dicho candidato.

ρ=.80 formula Z= ρ−ρσ ρ

=¿Z = ρ−p

√ ρqn

=

ρ=.775

n=2000 P (A ) 15502000

=.775

q=.225

Z= .775−.80

√ ( .775 )(.225)2000

= -2.67

Page 19: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

DISTRIBUCION MUESTRAL DE LA DIFERENCIA DE MEDIAS

Para conocer la distribución muestral de las diferencias entre las medias se debe

saber si las varianzas poblacionales son conocidas o desconocidas, y en caso de

que sean desconocidas, se debe saber si son iguales o diferentes. Cada uno de

estos tres casos se analizará por separado.

a) Distribución de la diferencia entre dos medias cuando las varianzas son

conocidas. Si las varianzas y son conocidas, tanto como se distribuyen

normalmente. Por lo tanto la distribución de la diferencia entre las medias

muéstrales es normal con el valor esperado y la varianza dados anteriormente, es

decir,

De acuerdo con lo anterior la siguiente variable aleatoria tiene una distribución

normal estándar:

Por lo tanto, con base en la expresión anterior se pueden realizar inferencias con

respecto a la diferencia de medias poblacionales, bajo el supuesto de que las

varianzas sean conocidas. Si además, son iguales, la expresión anterior se puede

expresar como:

b) Distribución de la diferencia entre dos medias cuando las varianzas son

desconocidas pero iguales ( = = )

Cuando las varianzas son desconocidas, se debe realizar previamente una prueba

estadística para verificar si éstas son iguales o diferentes. Para realizar esta

prueba debemos hacer uso de la distribución F para verificar si la relación de

varianzas es igual a uno o diferente de uno.

Para cada una de las dos muestras se definen sus respectivas varianzas como:

Además tienen distribuciones chi cuadrado con n1–1 y n2–1 grados de libertad

respectivamente. Por lo tanto su suma también sigue otra distribución chi

cuadrado con n1+n2–2 grados de libertad. Es decir:

Page 20: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

Ahora bien, si Z es una variable normal (0,1) y Y tiene una distribución chi

cuadrado con n grados de libertad, entonces la variable tiene una distribución t con

n grados de libertad. Para nuestro caso la variable Z corresponde a la distribución

de la diferencia de las dos medias, con varianzas conocidas, y la variable chi

cuadrado corresponde a la variable Y acabada de definir. Por lo tanto

Donde es un estimador ponderado de la varianza poblacional s

Obtenida ponderando las varianzas poblacionales por sus respectivos grados de

libertad.

c) Distribución de la diferencia entre dos medias cuando las varianzas son

desconocidas y diferentes

EJEMPLO:De una población se toma una muestra de 40 observaciones. La media muestral es de 102 y la desviación estándar de 5. De otra población se toma una muestra de 50 observaciones y la media muestral es ahora 99 y la desviación estándar es 6. Calcule el valor estadístico de la prueba.

Supongo que las medias poblacionales son iguales a las varianzas.

x� 1= 102 Z=¿¿¿ x� 2= 99

S1=5 Z=(102−99)(0)

1.18= 31.18

=2.54

S2=6

S2=(n−1 ) S1

2+(n2−1)S22

n1+n2−2 = (40−1 )52+(50−1 )62

40+50−2 =975+176488=273988 = 31.13

σ x1x2√ S2n1+ S22

n2 =√ 31.1340 + 31.13

50=√0.77+0.62=√1.3926=1.18

.5+.4945=0.9945

.1-0.9945=.0055

Page 21: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

DISTRIBUCION DE PROBABILIIDAD

Page 22: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

T DE STUDENTDISTRIBUCION DE PROBABILIDAD:

Con respecto a una variable aleatoria es una función que asigna a cada suceso definido sobre la variable aleatoria la probabilidad de que dicho suceso ocurra. La distribución de probabilidad está definida sobre el conjunto de todos los eventos rango de valores de la variable aleatoria.Cuando la variable aleatoria toma valores en el conjunto de los números reales, la distribución de probabilidad está completamente especificada por la función de distribución, cuyo valor en cada real x es la probabilidad de que la variable aleatoria sea menor o igual que x.

T DE STUDENT:

Permite decidir si dos variables aleatorias normales y con la misma varianza tienen medias diferentes. Dada la ubicuidad de la distribución normal puede aplicarse en numerosos contextos, para comprobar si la modificación en las condiciones de un proceso (humano o natural) esencialmente aleatorio producen una elevación o disminución de la media poblacional. Esto opera decidiendo si una diferencia en la media muestral entre dos muestras es estadísticamente significativa, y entonces poder afirmar que las dos muestras corresponden a distribuciones de probabilidad de media poblacional distinta, o por el contrario afirmar que la diferencia de medias puede deberse a oscilaciones estadísticas.La eficacia aumenta con el número de datos del que constan las dos muestras, en concreto del número de grados de libertad conjunto de las dos muestras, este número viene siendo Ni el tamaño muestral, es decir, el número de datos en cada muestral.

Page 23: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

1.- Suponga que los datos siguientes se seleccionan al azar de una población de valores normalmente distribuidos y realicen un intervalo de confianza del 95%para calcular la media poblacional.

40,51,43,48,44,57,54,39,42,48,45,39 y 43

χ=∑i=1

n X i

n=40+51+43+48+44+57+54+39+42+48+45+39+43

13=59313

= 45.61

s2=∑i=1

n ( x−xi)n−1

=¿¿

+¿¿

+¿¿

s=√s2=√32.42=5.69∝=1− .95%=0.05÷2=0.025

gl=n−1=13−1=12

S x=5.69√13

=1.57

I∝=x ± t S x

I∝=45.61+(2.179 ) (1.57 )=¿

45.61+3.42=49.03Límite superior

45.61−3.42=42.12Límite inferior

(42.12, 49.03)

Page 24: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

EJERCICIO#2Si se supone que X esta normalmente distribuida utiliza la siguiente información para calcular un intervalo de confianza de 90% para estimar la media poblacional.

χ=∑i=1

n X i

n313, 320, 319, 340, 325, 310, 321, 329, 317, 311, 307, 318.

313 ,320 ,319 ,340 ,325 ,310 ,321 ,329 ,317 ,311 ,307 ,318.12

= 319.16

S2=∑

i=1

n

¿¿¿

¿ ¿¿¿

37.9456+0.7056+0.0256+434.305634 .1056+83.9056+3.3856+96.82564 .6656+66.5856+¿147.8656+1.34512−1

= 911.667211 = 82.87 √82.87 = 9.10

x=319.16

σ 2=82.87 σ=9.10gl= n-1

gl= 12-1=11

∝ 1-.90%= 0.2/2= 0.05

IC=319.16+ (1.796) (2.6269) Sx=9.10

√12 =2.6269

319.16 + 4.7179= 323.8779 Límite Superior

319.16 – 4.7179= 314.4421 Límite Inferior

(314.4, 323.8)

Page 25: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

EJERCICIO #3

Si una muestra aleatoria de 27 Artículos produce x= 128.4 y S= 20.6, cual es el intervalo de confianza de 98% para la media poblacional. Suponga que X esta normalmente distribuida para la población. ¿Cuál es la estimación puntual?

x= 128.4

S= 20.6σ= 4.53

gl= n-1

gl= 27-1= 26

∝= 1-.98%= 0.02/2= 0.01

IC= 128.4+ (2.479) (3.96) Sx=20.6

√27 =3.96

128.4 + 9.8168= 138.21 Límite Superior

128.4 – 9.8168= 118.58 Límite Inferior

(118.58, 138.21)

Page 26: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

Use información en base a cada una de las siguientes muestras para calcular el intervalo de confianza para estimar la proporción de la población.

A)n= 44 y p= .51 calcule en IC 99%

B)n= 300 y p= .82 calcule un IC 95%

C)n= 1150 y p= .48 calcule un IC 90%

D)n= 95 y p= .32 calcule un IC 88%

A)n=44

p=.51

σρ=x=√( .51 )(.49)44

=0.075

IC=p± zσx

IC=.51± (2.57) (.075)

=.51+0.19=0.7

=.51-0.19=.32

B)n=300

p=.82

σp=√ ( .82 )¿¿¿

IC=.82± (1.96) (.022)

=.82+0.043=0.863

Page 27: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

=.82-0.043=0.777

C)n=1150

p=.48

σp=√( .48 )(.52)1150

=0.014

IC=.48± (1.65) (0.014)

=.48+0.023=.50

=.48-0.023=.45

D)n=95

p=.32

σp=√( .32 )(.68)95

=0.047

IC=.32± (1.56) (0.047)

=.32+.073=0.39

=.32-.073=0.24

INTERVALO DE CONFIANZA PARA ESTIMAR P

INTERVALO DE CONFIANZA:

Se llama intervalo de confianza en estadística a un par de números entre los cuales se estima que estará cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos números determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es un parámetro poblacional.

El intervalo de confianza para estimar una proporción p, conocida una proporción muestral pn de una muestra de tamaño n, a un nivel de confianza del (1-α)·100% es:

Page 28: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

Una compañía textil produce pantalones para hombre, los pantalones se confeccionan y venden con corte regular o con corte de bota. En un esfuerzo por estimar la proporción del mercado de sus pantalones para hombre en el centro de la ciudad que prefiere pantalones con corte de bota, el analista toma una muestra aleatoria de 212 ventas de pantalones de las 2 tiendas de venta al público de la ciudad solo 34 de las ventas fueron con pantalones de corte de bota. Construye un intervalo de confianza de 90% para estimar la proporción de la población en toda la ciudad que prefieren pantalones con corte bota.

n=212PB=.16

P(A) 34212

=.16

P = IC =PB ± ZσPB

IC= .16 ± (1.65) (0.25)σPB=√ pqn

σPB¿ √( .16 )(.84)212 =.025

IC=.16 + .041 = .2 Limite Superior

IC= .16 - .041 = .11 Límite Inferior

(.11, .2)

PROBLEMASUsen la información sobre cada una de las siguientes muestras para calcular el intervalo de confianza para estimar la proporción de la población.

a) n=44 p=.51 ; Calcule un Intervalo de Confianza del 99%

n= 44 p= IC∝ =p±Z√ p

p=.51 IC= .51± (2.57) (0.075)

IC= .51+ 0.19= 0.7 Limite Superior

IC= .51- 0.19= 0.32 Límite Inferior

(.32, .7)

σ p= √ pqn =√ .51(.49)44= 0.075

Page 29: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

b) n=300 PB=.82; calcule un intervalo de confianza de 95%

σ PB= √ pqn

σPB=√( .82 )(.18)300

=.022

.82 ± (1.96) (.022)

Límite superior .82+ .043=.863

Límite inferior .82 - .043= .777

(.77, .86)

c)n=1150 PB=.48; calcule un intervalo de confianza de 90%

n=1150

Page 30: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

PB=.48 σPB=√ pqn

σPB=√( .48 )(.52)1150

=.014

.48 ± (1.65) (.014)

Limite Superior .48 + .023=.503

Límite Inferior .48 - .023=.45 (.457, 503)

d) n=95 PB=.32; calcule un intervalo de confianza de 88%

n=95 σPB=√ pqn

σPB=√( .32 )(.68)95

=.047

PB=.32

.32 ± (1.56) (.047)

Limite Superior.32 + .073=.393

Límite Inferior .32 - .073=.247 (.247, .393)

Page 31: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

EJERCICIOS

Use la siguiente Información para construir intervalo de confianza de 90%, 95% y 99% para estimar la media poblacional de los siguientes datos que provienen de una población normalmente distribuida.

12.3, 11.6, 11.9, 12.8, 12.5, 11.4, 12.0, 11.7, 11.8, 12.3

χ=∑i=1

n X i

n12.3 ,11.6 ,11.9 ,12.8 ,12.5 ,11.4 ,12.0 ,11.7 ,11.8 ,12.3

10=12.03

s2=∑i=1

n ( x−xi)n−1

¿¿¿ ¿

Page 32: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

0.0729+0.1849+0.0169+0.5929+0.2209+0.3969+ .0009+0.1089+0.0529+0.072910−1

= 1.7219 = .191 √ .191 = .4370

x= 12.03

σ 2= .191

σ= .4370

gl= n-1 gl=10-1 =9

∝ =1-.90% = 0.1/2= 0.05

IC= 12.03+ (1.833) (0.1381) Sx=.4370

√10 =0.1381

12.03+0.2531= 12.2831 Límite Superior

12.03-0.2531= 11.7769 Límite Inferior

(11.7, 12.2)

∝= 1-.95%= 0.05/2= 0.025

IC= 12.03+ (2.262) (0.1381) Sx=.4370

√10 =0.1381

12.03+0.3123= 12.3423 Límite Superior

Page 33: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

12.03-0.3123= 11.7177 Límite Inferior

(11.7, 12.3)

∝= 1-.99%= 0.01/2= .005

IC= 12.03+ (3.250) (0.1381) Sx=.4370

√10 =0.1381

12.03+0.4488= 12.478 Límite Superior

12.03-0.4488= 11.5812 Límite Inferior

(11.5, 12.4)

Page 34: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

Use la Siguiente información para calcular el Intervalo de Confianza para la proporción poblacional. 90% de Confianza

a) n= 284p= .71

P = IC =PB ± ZσPB

IC= .71±(1.65) (0.026) σPB=√ pqn

σPB¿ √( .71 )(.29)284 =0.026

.71+ 0.0429= 0.7529 .71- 0.0429= 0.6671

(0.66, 0.75)

b) n= 1,250p= .48

P = IC =PB ± ZσPB

Page 35: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

IC= .48±(1.96) (0.014) σPB=√ pqn

σPB¿ √( .48 )(.52)1,250 =0.014

.48+ 0.0274= 0.5074

.48- 0.0274= 0.4526

(0.45, 0.50)

PRUEBA DE HIPOSTESIS

Afirmación acerca de los parámetros de la población.

Etapas Básicas en Pruebas de Hipótesis.

Al realizar pruebas de hipótesis, se parte de un valor supuesto (hipotético) en parámetro poblacional. Después de recolectar una muestra aleatoria, se compara la estadística muestral, así como la media (x), con el parámetro hipotético, se compara con una supuesta media poblacional (). Después se acepta o se rechaza el valor hipotético, según proceda. Se rechaza el valor hipotético sólo si el resultado muestral resulta muy poco probable cuando la hipótesis es cierta.

Etapa 1.- Planear la hipótesis nula y la hipótesis alternativa. La hipótesis nula (H0) es el valor hipotético del parámetro que se compra con el resultado muestral resulta muy poco probable cuando la hipótesis es cierta.

Etapa 2.-Especificar el nivel de significancia que se va a utilizar. El nivel de significancia del 5%, entonces se rechaza la hipótesis nula solamente si el resultado muestral es tan diferente del valor hipotético que una diferencia de esa magnitud o mayor, pudiera ocurrir aleatoria mente con una probabilidad de 1.05 o menos.

Etapa 3.- Elegir la estadística de prueba. La estadística de prueba puede ser la estadística muestral (el estimador no segado del parámetro que se prueba) o una

Page 36: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

versión transformada de esa estadística muestral. Por ejemplo, para probar el valor hipotético de una media poblacional, se toma la media de una muestra aleatoria de esa distribución normal, entonces es común que se transforme la media en un valor z el cual, a su vez, sirve como estadística de prueba.

Consecuencias de las Decisiones en Pruebas de Hipótesis.

Decisiones Posibles Situaciones Posibles

La hipótesis nula es verdadera

La hipótesis nula es falsa

Aceptar la Hipótesis Nula Se acepta correctamente Error tipo II

Rechazar la Hipótesis Nula

Error tipo I Se rechaza correctamente

Etapa 4.- Establecer el valor o valores críticos de la estadística de prueba. Habiendo especificado la hipótesis nula, el nivel de significancia y la estadística de prueba que se van a utilizar, se produce a establecer el o los valores críticos de estadística de prueba. Puede haber uno o más de esos valores, dependiendo de si se va a realizar una prueba de uno o dos extremos.

Etapa 5.- Determinar el valor real de la estadística de prueba. Por ejemplo, al probar un valor hipotético de la media poblacional, se toma una muestra aleatoria y se determina el valor de la media muestral. Si el valor crítico que se establece es un valor de z, entonces se transforma la media muestral en un valor de z.

Etapa 6.-Tomar la decisión. Se compara el valor observado de la estadística muestral con el valor (o valores) críticos de la estadística de prueba. Después se acepta o se rechaza la hipótesis nula. Si se rechaza ésta, se acepta la alternativa; a su vez, esta decisión tendrá efecto sobre otras decisiones de los administradores operativos, como por ejemplo, mantener o no un estándar de desempeño o cuál de dos estrategias de mercadotecnia utilizar.

La distribución apropiada de la prueba estadística se divide en dos regiones: una región de rechazo y una de no rechazo. Si la prueba estadística cae en esta última región no se puede rechazar la hipótesis nula y se llega a la conclusión de que el proceso funciona correctamente.

Al tomar la decisión con respecto a la hipótesis nula, se debe determinar el valor crítico en la distribución estadística que divide la región del rechazo (en la cual la hipótesis nula no se puede rechazar) de la región de rechazo. A hora bien el valor crítico depende del tamaño de la región de rechazo.

Page 37: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

PASOS DE LA PRUEBA DE HIPÓTESIS1. Expresar la hipótesis nula 2. Expresar la hipótesis alternativa3. Especificar el nivel de significancia4. Determinar el tamaño de la muestra5. Establecer los valores críticos que establecen las regiones de rechazo de las

de no rechazo.6. Determinar la prueba estadística.7. Coleccionar los datos y calcular el valor de la muestra de la prueba

estadística apropiada.8. Determinar si la prueba estadística ha sido en la zona de rechazo a una de no

rechazo. 9. Determinar la decisión estadística.10.Expresar la decisión estadística en términos del problema.

CONCEPTOS BÁSICOS PARA EL PROCEDIMIENTO DE PRUEBAS DE HIPÓTESIS.

Hipótesis Estadística:

Al intentar alcanzar una decisión, es útil hacer hipótesis (o conjeturas) sobre la población aplicada.

Tales hipótesis, que pueden ser o no ciertas, se llaman hipótesis estadísticas.

Son, en general, enunciados acerca de las distribuciones de probabilidad de las poblaciones.

Hipótesis Nula.

En muchos casos formulamos una hipótesis estadística con el único propósito de rechazarla o invalidarla. Así, si queremos decidir si una moneda está trucada, formulamos la hipótesis de que la moneda es buena (o sea p = 0,5, donde p es la probabilidad de cara).

Analógicamente, si deseamos decidir si un procedimiento es mejor que otro, formulamos la hipótesis de que no hay diferencia entre ellos (o sea. Que cualquier diferencia observada se debe simplemente a fluctuaciones en el muestreo de la misma población). Tales hipótesis se suelen llamar hipótesis nula y se denotan por Ho.

Para todo tipo de investigación en la que tenemos dos o más grupos, se establecerá una hipótesis nula.

La hipótesis nula es aquella que nos dice que no existen diferencias significativas entre los grupos.

Page 38: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

Por ejemplo, supongamos que un investigador cree que si un grupo de jóvenes se somete a un entrenamiento intensivo de natación, éstos serán mejores nadadores que aquellos que no recibieron entrenamiento. Para demostrar su hipótesis toma al azar una muestra de jóvenes, y también al azar los distribuye en dos grupos: uno que llamaremos experimental, el cual recibirá entrenamiento, y otro que no recibirá entrenamiento alguno, al que llamaremos control. La hipótesis nula señalará que no hay diferencia en el desempeño de la natación entre el grupo de jóvenes que recibió el entrenamiento y el que no lo recibió.

Una hipótesis nula es importante por varias razones:

Es una hipótesis que se acepta o se rechaza según el resultado de la investigación.

El hecho de contar con una hipótesis nula ayuda a determinar si existe una diferencia entre los grupos, si esta diferencia es significativa, y si no se debió al azar.

No toda investigación precisa de formular hipótesis nula. Recordemos que la hipótesis nula es aquella por la cual indicamos que la información a obtener es contraria a la hipótesis de trabajo.

Al formular esta hipótesis, se pretende negar la variable independiente. Es decir, se enuncia que la causa determinada como origen del problema fluctúa, por tanto, debe rechazarse como tal.

Otro ejemplo:

Hipótesis: el aprendizaje de los niños se relaciona directamente con su edad.

Hipótesis Alternativa.

Toda hipótesis que difiere de una dada se llamará una hipótesis alternativa. Por ejemplo: Si una hipótesis es p = 0,5, hipótesis alternativa podrían ser p = 0,7, p " 0,5 ó p > 0,5.

Una hipótesis alternativa a la hipótesis nula se denotará por H1.

Al responder a un problema, es muy conveniente proponer otras hipótesis en que aparezcan variables independientes distintas de las primeras que formulamos. Por tanto, para no perder tiempo en búsquedas inútiles, es necesario hallar diferentes hipótesis alternativas como respuesta a un mismo problema y elegir entre ellas cuáles y en qué orden vamos a tratar su comprobación.

Las hipótesis, naturalmente, serán diferentes según el tipo de investigación que se esté realizando. En los estudios exploratorios, a veces, el objetivode la investigación podrá ser simplemente el de obtener los mínimos conocimientos que permitan formular una hipótesis. También es aceptable que, en este caso, resulten poco precisas, como cuando afirmamos que "existe algún tipo de problema social

Page 39: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

en tal grupo", o que los planetas poseen algún tipo de atmósfera, sin especificar de qué elementos está compuesto.

Los trabajos de índole descriptiva generalmente presentan hipótesis del tipo "todos los X poseen, en alguna medida, las característica Y". Por ejemplo, podemos decir que todas las naciones poseen algún comercio internacional, y dedicarnos a describir, cuantificando, las relaciones comerciales entre ellas. También podemos hacer afirmaciones del tipo "X pertenece al tipo Y", como cuando decimos que una tecnología es capital - intensiva. En estos casos, describimos, clasificándolo, el objeto de nuestro interés, incluyéndolo en un tipo ideal complejo de orden superior.

Por último, podemos construir hipótesis del tipo "X produce (o afecta) a Y", donde estaremos en presencia de una relación entre variables.

Errores de tipo I y de tipo II.

Si rechazamos una hipótesis cuando debiera ser aceptada, diremos que se ha cometido un error de tipo I.

Por otra parte, si aceptamos una hipótesis que debiera ser rechazada, diremos que se cometió un error de tipo II.

En ambos casos, se ha producido un juicio erróneo.

Para que las reglas de decisión (o no contraste de hipótesis) sean buenos, deben diseñarse de modo que minimicen los errores de la decisión; y no es una cuestión sencilla, porque para cualquier tamaño de la muestra, un intento de disminuir un tipo de error suele ir acompañado de un crecimiento del otro tipo. En la práctica, un tipo de error puede ser más grave que el otro, y debe alcanzarse un compromiso que disminuya el error más grave.

La única forma de disminuir ambos a la vez es aumentar el tamaño de la muestra que no siempre es posible.

EJERCICIO 1Un desarrollador considera 2 ubicaciones alternadas para un centro comercial regional dado que el ingreso domestico de la comunidad es una consideración importante en la selección del sitio, el desarrollador desea probar la hipótesis nula de que no existe diferencia entre los montos de ingreso domestico medio que de las 2 comunidades. En consonancia con esta hipótesis se supone que la desviación estándar del ingreso domestico también es igual en los dos comunidades.En una muestra de n1=30 hogares de la primera comunidad el ingreso anual promedio es de x� 1=45,000 con una desviación estándar S1= 1800. En una muestra de n2=40 hogares de la segunda comunidad x� 2=44,600 y S2=2,400. Pruebe la hipótesis nula el nivel de significancia del 5%.

Page 40: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

n1=30 H 0=M 1- M 2 = 0 z=.95 / 2= .475 = 1.96 S1=.4 H 1=M 1-M 2≠ 0 x� 1=45,500S1 = 1800 n2=40x� 2=44,600 S2=2,400 ∝=.05

Z=(X1−X2)(μ−μ2)

σ X 1−X2= (45,500−44,600 )−(0 )

522.78=1.74

S2=(n1−1 )S12+(n2−1)S2

2

n1+n2−2

S2 (30−1 )1,8002+ (40−1 )2,4002

30+40−2 =318,600,00068 = 4, 685,294

σ x1x2√ S2n1+ S22

n2

=√ 4,685,29430+ 4,685,294

40=√156,176−117,132.35=522.78

Se acepta la hipótesis nula

Page 41: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

EJERCICIO 2

2) Una muestra aleatoria de n1=12 de estudiantes de informática tiene un promedio de calificación media de x� 1= 2.60 (donde a=4) con una desviación estándar de .40.En el caso de los estudiantes de ingeniería en sistemas, una muestra aleatoria de n2=10 estudiantes tiene un promedio de calificación media de x� 2=2.9 con una desviación estándar de .30. Se supone que los valores de calificación siguen la distribución normal.Pruebe la hipótesis nula de que el promedio de calificación medio de las 2 categorías de estudiantes no es diferente con un nivel de significación del 5%

H 0 : μ1−μ2=0

H 1: μ1−μ2≠0

n1=12

x1=2.7

S1=40

n2=10

x2=2.90

S2=30

α=.05

.05/2=.025

gl=n1+n2−2=12+10−2=20 t=2.086

t=¿¿¿= (2.7−2.9 )−(0 ).1534

= -1.30

S2=(n−1 ) S1

2+(n2−1)S22

n1+n2−2= (11) .42+(9 ) .32

12+10−2=2.57

20 =.1285

√ .128512 + .128510

=.1534

Se acepta la hipótesis nula

Page 42: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

EJERCICIO 4Una empresa desea saber cómo está el ausentismo en sus trabajadores. A continuación se da el número de días de ausencia durante una quincena en una muestra de diez trabajadores 4, 1, 2, 2, 1, 2, 2, 1, 0 y 3.

A) Determine la media y la desviación estándar de la muestraB) Cuál es la media poblacional y cuál es la mejor estimación de ese valorC) Proporcione un intervalo de confianza de 95% para la media poblacional D) Explique por qué se usa la distribución “t” como punto del intervalo de

confianzaE) Es razonable concluir que el trabajador promedio no falto ningún día

durante la quincena

χ=∑i+1

n X i

n=4+1+2+2+1+2+2+1+0+3

10=1810

= 1.8

s2=∑i=1

n ( x−xi)n−1

=¿¿

=11.69

=1.288

s2=1.288 s=√s2=√1.288=1.134

Page 43: CUADERNILLO ESTADISTICA

CUADERNILLO DE ESTADISTICA

∝=1− .95%=0.05÷2=0.025

gl=n−1=10−1=9

t=2.262

S x=s

√n=1.134

√10=.358

I∝=x ± t S x

I∝=1.8+ (2.262 ) ( .358 )=¿

1.8+.809=2.609

1.8−.809=.991

(.991, 2.609)