estadistica i

45
Estadística I APUNTES DE ESTADÍSTICA I ESTOS APUNTES PERTENECEN A: ______________________________________________________________________ MATRICULA_________________ GRUPO_______________________________ LICENCIATURA EN ________________________________________________

Upload: jesus-alberto

Post on 21-Jun-2015

1.672 views

Category:

Documents


2 download

DESCRIPTION

Manual para la materia de Estadistica I (Estadistica descriptiva)

TRANSCRIPT

Page 1: ESTADISTICA I

Estadística I

APUNTES DE ESTADÍSTICA I

ESTOS APUNTES PERTENECEN A: ______________________________________________________________________ MATRICULA_________________ GRUPO_______________________________ LICENCIATURA EN ________________________________________________

Page 2: ESTADISTICA I

Estadística I

2

CAPITULO 1 INTRODUCCIÓN A LA ESTADÍSTICA

ANTECEDENTES

Puede decirse que la estadística nació con los primeros Estados, y ésa es precisamente la etimología de la palabra estadística que deriva del término latín status (estado). En efecto, desde la Antigüedad los estados necesitaron recopilar datos sobre sus respectivos dominios y con diversos propósitos: fiscal, militar, agrícola, etc. Aunque estas primitivas estadísticas no tenían una finalidad científica, proporcionaban información numérica útil para el estado, que a partir del conocimiento estadístico del pasado y del presente podía establecer hipótesis sobre el futuro que orientasen su acción política.

La palabra estadística la acuño el profesor Gottfried Achenwall (1719-1772), siendo el Dr. E. A. W. Zimmerman quien introdujo el término en Inglaterra. Su uso lo divulgó Sir John Sinclair en su obra titulada “Statical Account of Scotland 1791-1799” (Informe estadístico sobre Escocia 1791-1799), la verdadera estadística científica comenzó en el siglo XVII con los trabajos de Pierre Simón Laplace (1749-1827) y de Carl Friedrich Gauss (1777-1855), quienes obtuvieron importantes resultados a partir de su estudio de la teoría de los errores y la probabilidad. A lo largo del siglo XIX, la estadística se consolidó como disciplina científica, herramienta auxiliar imprescindible para otras ciencias que facilitó importantes descubrimientos. Ya en el siglo XX, los métodos de inferencia estadística incorporaron la formulación matemática de las leyes de la probabilidad.

DEFINICIÓN

Con el fin de estudiar inteligentemente el tema de la estadística debemos, en primer lugar, comprender lo que el término significa: ESTADÍSTICA.- Es un conjunto de técnicas mediante las cuales se recopilan, organizan y analizan datos con el propósito de tomar decisiones. Es una ciencia que se sirve de conjuntos de datos para obtener, a partir de ellos, conclusiones basadas en el cálculo de probabilidades.

Las aplicaciones de la estadística en el mundo moderno son innumerables y está presente como herramienta auxiliar en todas las ramas de la ciencia, la industria y la economía. La estadística tiene un gran campo de aplicación en diversas áreas de estudio. Dentro de las aplicaciones típicas en el área administrativa económica podemos mencionar:

Pruebas de calidad Administración de personal

Page 3: ESTADISTICA I

Estadística I

3

Administración de recursos humanos Cotizaciones Pólizas de garantía Oportunidades de crédito Nivel de competencia Investigación de mercados Registros contables Análisis de proyectos de inversión Seguros de vida Accidentes de trabajo Presupuestos Desempleo Niveles de productividad Bolsa de valores Composición del sector industrial Auditorias Establecimiento de salarios Inventarios Predicciones en el nivel de ventas y demanda de productos.

CLASIFICACIÓN DE LA ESTADÍSTICA La estadística se divide en dos áreas: descriptiva e inferencial.

1. Estadística descriptiva: Incluye las técnicas y herramientas que nos permiten recolectar, organizar, ordenar y resumir un conjunto de datos.

Estas técnicas pueden ser de índole distinta: gráficas tabulares o de cálculo. Algunas técnicas son: *Gráficas: Histogramas, polígonos, ojivas. * Tabulares: Distribuciones de frecuencia * Cálculo: Obtener medidas de tendencia central y variación. Ejemplos del uso de la aplicación de la estadística descriptiva: Calcular el promedio de artículos en inventario por mes Presentar gráficamente el comportamiento de ventas mensuales en una

empresa Determinar cuál de dos fábricas presenta una mayor variación en el

número de artículos producidos diariamente Calcular el salario medio de un grupo de trabajadores Representar gráficamente como está segmentado el mercado de

consumidores de acuerdo con marcas de refresco Determinar cuál es la falla más frecuente que se presenta en un grupo

de máquinas Clasificar un grupo de trabajadores de acuerdo con: la edad,

productividad, salarios, etc.

Page 4: ESTADISTICA I

Estadística I

4

2. Estadística inferencial: Comprende aquellas técnicas que nos permiten obtener y deducir conclusiones acerca de una población basándose en resultados del estudio de una muestra, con la finalidad de tomar decisiones. Debido a que estas decisiones normalmente se toman en condiciones de incertidumbre se requiere el uso de conceptos de probabilidad. Algunas técnicas son: Distribución de muestreo Intervalos de confianza Pruebas de hipótesis Análisis de regresión y correlación Pruebas Xi cuadrada Ejemplos de aplicación de la estadística inferencial: Se puede estimar la respuesta de los consumidores acerca de una

campaña publicitaria Se puede predecir los porcentajes de votantes que registrará cada

partido político en una elección Estimar cuantas de las declaraciones anuales de los contribuyentes

contienen errores o datos falsos Predecir el % de artículos defectuosos que se encuentran en un

embarque Encontrar si existe alguna relación entre la productividad de los

trabajadores con respecto a una nueva política de trabajo

TAREA: DAR TRES EJEMPLOS DE APLICACIÓN DE LA ESTADÍSTICA DESCRIPTIVA Y DOS DE LA ESTADÍSTICA INFERENCIAL.

DESCRIPCIÓN Y RESUMEN DE DATOS

Los datos estadísticos se obtienen mediante un proceso que comprende la observación o medición de conceptos como: ingresos anuales de una comunidad, calificaciones de exámenes, cantidad de café por sobre, resistencia a la ruptura de ciertos materiales, porcentaje de azúcar en cereales, etc. Tales conceptos reciben el nombre de variables, ya que producen valores que tienden a mostrar un cierto grado de diferencia al efectuar mediciones sucesivas.

Page 5: ESTADISTICA I

Estadística I

5

Dependiendo de la naturaleza de los datos a medir, las variables se pueden clasificar de la siguiente manera: Cualitativas Variables Continuas Cuantitativas Discretas

Las variables cualitativas (o nominales) permiten arreglar los datos en categorías por ejemplo: contar cuantos profesores, ingenieros, administradores, contadores hay en un grupo de personas; determinar si un producto es de buena, mala o regular calidad; clasificar a los obreros como calificados o no calificados, etc. Las variables cuantitativas se determinan mediante valores numéricos por ejemplo: las ganancias anuales de una empresa, la producción diaria de petróleo, el tiempo requerido para rellenar un formulario gubernamental o el valor de un inventario. Las variables cuantitativas de dividen a su vez en dos tipos: continuas y discretas. Se denominan continuas cuando pueden asumir cualquier valor dentro de un determinado intervalo, por ejemplo: . El peso de un producto . La temperatura del día . La altura de una persona . Los litros de gasolina vendidos en un día Las variables discretas por el contrario, sólo pueden asumir ciertos valores dentro de un intervalo, es decir números enteros, por ejemplo: . Número de latas en una caja . Número de máquinas en reparación . Número de pedidos al día . Cantidad de facturas en un archivero . Número de clientes de una compañía . Número de piezas defectuosas producidas por una máquina

TAREA: PROPORCIONAR 5 EJEMPLOS DE VARIABLE CUALITATIVA, 5 DE VARIABLE CUANTITATIVA DISCRETA Y 5 DE VARIABLE CUANTITATIVA CONTINUA.

Page 6: ESTADISTICA I

Estadística I

6

CAPITULO 2

ESCALAS DE MEDICIÓN

Una escala de medición nos permite realizar la medición y clasificación de los datos a estudiar y está directamente relacionada con el tipo de variable a medir.

Existen cuatro tipos de escala de medición: 1. Nominal 2. Ordinal 3. De intervalo 4. De razón

1.- Escala nominal.- Representa el nivel mínimo de medición y se utiliza para variables de tipo cualitativo y consiste en categorizar solamente el tipo de dato en algún grupo o con algún nombre. Por ejemplo: Variable.- Marca de zapato deportivo

Marca Número de pares 1 Nike 12 2 Adidas 50 3 New Balance 45 4 Concord 15

Otros ejemplos: Sexo (masculino, femenino), religión (católico, protestante, testigo, etc.) 2.- Escala ordinal.- Permite además de categorizar los datos, darles un orden de acuerdo con el grado en el que posean determinado atributo. Por ejemplo: Variable.- Calidad de un producto

Calidad Número de productos

1 Excelente 56 2 Buena 30 3 Regular 20

Page 7: ESTADISTICA I

Estadística I

7

Otros ejemplos: Nivel socioeconómico (bajo, medio, alto); complexión (delgada, media, gruesa). 3.- Escala de intervalo.- Se utiliza para variables de tipo cuantitativo y permite además de darle un orden, medir numéricamente las diferencias que existen entre los datos. Es importante mencionar que no tiene un cero absoluto, es decir, que sí una variable tiene el valor de cero no indica que haya ausencia de la característica medida. Por ejemplo: Variable.- La edad en años cumplidos

Edad Número de personas 1 0*-10 25 2 11-20 30 3 21-30 48 4 Más de 30 5

(*) En este caso 0 años no significa que no tengan edad, sino que no han cumplido aún un año (Cero Relativo). Otros ejemplos: La temperatura del día (00 no indica que no haya temperatura), calificación de desempeño del empleado (0 no indica que no exista desempeño, sino tal vez un mal desempeño), saldo promedio de una tarjeta de crédito (0 no significa que no tenga saldo).

4.- Escala de razón.- Tiene las propiedades de una escala por intervalos, con la excepción de que si posee un cero absoluto, es decir, el cero indica ausencia total de la característica medida. Por ejemplo: Variable.- Número de artículos defectuosos en embarques

Número de artículos defectuosos

Cantidad de embarques

1 0-20 10 2 21-40 5 3 41-60 1 4 Más de 60 0

Otros ejemplos: Velocidad de un automóvil, cantidad de cafeína en un producto, número de de cajas de cigarrillos en exhibición.

Page 8: ESTADISTICA I

Estadística I

8

DISTRIBUCIONES DE FRECUENCIA Es una tabla de resumen en la cual se agrupan en clases o categorías los posibles valores de una variable y se registra el número de observaciones (frecuencia) que corresponde a cada clase. Las variables pueden ser cualitativas (nominales) o cuantitativas (numéricas), y si son cuantitativas, las clases de la distribución pueden ser de punto o de intervalo. Ejemplos: Variable Cualitativa

Variable Cuantitativa Distribución de punto

Edad (Clase) Número de alumnos (frecuencia) 18 4 19 10 20 5 21 1 22 10 23 10 Total 40 Variable Cuantitativa Distribución por intervalo De extremo cerrado

Edad (clase) Número de alumnos (frecuencia)

18-20 19 21-23 21 Total 40 Variable Cuantitativa Distribución por intervalo De extremo abierto

Edad (clase) Número de alumnos (frecuencia) Menos de 20 14 20 o más 26 Total 40

Sexo (clase o categoría) Número de alumnos (frecuencia) Masculino 25 Femenino 15 Total 40

Page 9: ESTADISTICA I

Estadística I

9

CONSTRUCCIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS POR INTERVALO

Una distribución de frecuencias se puede definir como: La tabulaciòn, o el registro por marcas, del número de veces que se presenta una cierta medición de una característica, dentro de la muestra o población que se está examinando. Para ejemplificar el procedimiento de construcción se tomará el siguiente ejemplo: La siguiente es una lista de los salarios diarios a destajo para los 30 obreros que laboran en una fábrica.

24 28 30 33 26 30 28 24 31 26 29 30 31 28 28 25 26 26 32 32 28 26 24 32 25 28 27 27 29 30

Procedimiento: 1.- Calcular el rango: RANGO= DATO MAYOR – DATO MENOR (A este procedimiento también se le conoce como Amplitud, Gama o Recorrido, que es la medida más simple de dispersión). RANGO= 33 – 24 = 9 2.- Determinar el número de clases con la fórmula siguiente, redondeando a un valor entero que no sea menos a 4 ni mayor a 15: Número de clases = Número de datos # Clases = (30)1/2 = 5.47 -> 5 Criterio de redondeo > ó = 0.5 hacia arriba y < 0.5 hacia abajo 3.- Determinar el intervalo de clase: Intervalo= (Rango + 1) / Número de clases Intervalo= (9+1) = 2 5 El resultado se debe redondear según la resolución de datos, si son enteros a enteros, si tienen un decimal a un decimal, etc. 4.- Construir la tabla de distribución, anotando para cada clase el límite inferior, superior y frecuencia (número de datos que incluye). En algunos casos se debe agregar una clase más a las calculadas para que todos los datos estén en alguna clase (sucede generalmente cuando el intervalo fue redondeado hacia abajo en el paso anterior)

Page 10: ESTADISTICA I

Estadística I

10

Número de clase Salario Limite inferior

Salario Limite superior

Frecuencia

1 24 25 5 2 26 27 7 3 28 29 8 4 30 31 6 5 32 33 4

Total 30

FRECUENCIA RELATIVA Y ACUMULADA

Clase Limite inferior

Limite superior

Frecuencia absoluta

Frecuencia relativa

Frecuencia acumulada

Frecuencia relativa

acumulada

Marca de clase

1 24 25 5 16.7 % 5 16.7% 25 2 26 27 7 23.3% 12 40.0% 27 3 28 29 8 26.7% 20 66.7% 29 4 30 31 6 20.0% 26 86.7% 31 5 32 33 4 13.3% 30 100% 33 (Nota: Marca de clase: Xc= Limite inferior + Intervalo) 2

TAREA: LOS DATOS QUE SE DAN A CONTINUACIÓN CORRESPONDEN A LA LONGITUD MEDIA EN PIES PARA UNA MUESTRA DE 23 LANCHAS PESQUERAS: 66 65 96 80 71 93 66 96 75 61 69 61 51 84 58 73 77 89 69 57 56 55 78 CONSTRUYA UNA DISTRIBUCIÓN DE FRECUENCIAS COMPLETA PARA EL PROBLEMA

Page 11: ESTADISTICA I

Estadística I

11

¿Población o Muestra?

Cuando no es posible trabajar con todos los datos de la población es necesario trabajar con una muestra representativa. Los expertos en estadística recogen datos de una muestra y utilizan esa información para hacer inferencias sobre la población que representa esa muestra.

Así, una población es un todo y una muestra es una fracción o segmento de ese todo.

La estadística reclama una muestra lo más grande posible a fin de asegurar la máxima protección. Como resultado, el tamaño de la muestra apropiado para un análisis, no se decide sobre la base de un cálculo estadístico fijo, sino que por lo general hay que tomar en cuenta dos factores:

1. El aspecto económico; o sea, ¿cuánto costará tomar cada lectura?

2. La exactitud estadística que se requiere; es decir, ¿qué error se puede permitir en la determinación de los valores de las medidas de dispersión y de tendencia central de la distribución?.

Por lo tanto, se debe buscar una compensación entre los aspectos

económicos y estadístico. Un profesionista capaz es aquel que puede llevar a la práctica los

conocimientos de la estadística, la lectura de la información y el cálculo de los datos obtenidos, para con ello permitir que la toma de decisiones sea más eficiente y la probabilidad de error disminuya.

La experiencia que se tenga del proceso de que se trate y el sentido común del personal interesado, juega un papel importante en estas decisiones.

Heriberto Romo muestra una tabla muy práctica con margen de error de +/- 5%, para determinar tamaños de muestra:

Tamaño del universo Tamaño de la muestra 10 10 20 19 50 44

100 79 200 131 500 216

1000 275 2000 319 5000 353

10 000 366 100 000 378

1 000 000 380 50 000 000 380

Fuente: Galindo Càceres Jesús (Coord.) “Técnicas de investigación en Sociedad, Cultura y comunicación” México Ed. Pearson 1988, 528 pp

Page 12: ESTADISTICA I

Estadística I

12

CAPITULO 3

REPRESENTACIONES GRÁFICAS.

Gráficas para variables cualitativas. Gráfica de barras.- Se anotan sobre uno de los ejes las categorías y sobre el otro eje la frecuencia (conteo) dibujando una barra para cada categoría. Ejemplos: Profesión (clase)

Número de Personas (frecuencia)

% de Personas

Grados

Grados acumulados

Médico 25 16.7 60° 60° Contador 10 6.7 24° 84° Administrador 40 26.7 96° 180° Ingeniero 50 33.3 120° 300° Abogado 25 16.7 60° 360° Total 150 100.1

Page 13: ESTADISTICA I

Estadística I

13

Histograma

25

10

40

50

25

0

10

20

30

40

50

60

Profesión

Frec

uenc

ia

No de personas 25

No de personas 10

No de personas 40

No de personas 50

No de personas 25

Médico Contador Administrador Ingeniero Abogado

Gráfica de Pastel (Pay).- La circunferencia es dividida de acuerdo con el % de frecuencia (frecuencia relativa) que corresponda a cada categoría sobre la base de 360° de la circunferencia.

Médico. 16.70%Contador.

6.70%

Administrador. 26.70%

Ingeniero. 33.30%

Abogado. 16.70%

Médico Contador Administrador Ingeniero Abogado

Page 14: ESTADISTICA I

Estadística I

14

TAREA: Construya una distribución de frecuencias para los alumnos de su grupo por género (hombres y mujeres) y represéntelos gráficamente. Construya la distribución de frecuencias y las gráficas para la pregunta 7 del problema 6 de los ejercicios de la página 19 y 20.

GRÁFICAS PARA VARIABLES CUANTITATIVAS.

Histograma.- El histograma es la forma más común para la presentación de datos clasificados. Es una gráfica a base de barras sin espacios intermedios de una distribución de frecuencias. Se construye fabricando sobre el eje horizontal los límites inferiores de clase y sobre el eje vertical la frecuencia absoluta o frecuencia relativa. La escala vertical o eje Y generalmente comienza en cero, mientras que el eje X o la escala horizontal puede iniciarse con cualquier número adecuado que convenga como punto de partida para iniciar las clases.

Histograma de frecuencia absoluta

5

78

6

4

0123456789

salarios

No

de o

brer

os

salario 5

salario 7

salario 8

salario 6

salario 4

24 26 26 28 28 30 30 32 32 34

Page 15: ESTADISTICA I

Estadística I

15

Histograma de frecuencia relativa

16.70%

23.30%

26.70%

20%

13.30%

0.00%

5.00%

10.00%

15.00%

20.00%

25.00%

30.00%

Salario

% d

e ob

rero

s

salario 16.70%salario 23.30%salario 26.70%salario 20%salario 13.30%

24 26 26 28 28 30 30 32 32 34

Polígono de Frecuencia.- Es una gráfica de líneas de una distribución de frecuencia, en el eje horizontal se anota las marcas de clase y en el eje vertical la frecuencia absoluta o relativa. (El polígono de frecuencia también puede formarse colocando un punto sobre la mitad de la cúspide de cada rectángulo del histograma y luego uniendo dichos puntos por medio de una línea). Representan curvas útiles para describir los datos.

0

57

86

4

002468

10

0 23 23 25

25 27

27 29

29 31

31 33

33 35

Salario

No

de o

brer

os

Los polígonos poseen ciertas ventajas:

1. El polígono de frecuencias es más sencillo que su histograma correspondiente.

2. Bosqueja con más claridad un perfil del patrón de datos.

Page 16: ESTADISTICA I

Estadística I

16

3. El polígono se vuelve cada vez más suave y parecido a una curva conforme aumentemos el número de clases y el número de observaciones. Un polígono como el que se acaba de describir (suavizado mediante el aumento de datos y de clases puntuales) se conoce como curva de frecuencia.

Los histogramas y los polígonos de frecuencia son similares

Ojiva.- Es una gráfica de líneas de la frecuencia acumulada, sobre el eje horizontal se anota los límites inferiores de clase y sobre el eje vertical la frecuencia acumulada o relativa acumulada. (Muchas de éstas tienen el aspecto de una “S”). Nos permite ver cuántas observaciones están por encima de ciertos valores, en lugar de hacer un mero registro del número de elementos que hay dentro de los intervalos.

Ojiva porcentual (frecuencia relativa acumulada)

0% 0.00%

17%

40.00%

52%

66.70%76%

87%

100%

52% 52% 52% 52% 52%

76% 76% 76% 76% 76% 76% 76%

-20%

0%

20%

40%

60%

80%

100%

120%

0 24 26 28 29 30 31 32 34

Salario

% d

e O

brer

os

Uso de ojiva (interpolación) ¿Qué porcentaje de trabajadores ganan menos de $29? R= 52% ¿Qué porcentaje de trabajadores ganan más de $31? R= 100-76=24%

Page 17: ESTADISTICA I

Estadística I

17

1.- Del problema de las lanchas pesqueras:

aaa))) Construya las gráficas de histogramas, polígonos y ojivas. bbb))) Usando la ojiva ¿cuántas de las lanchas de la muestra mide menos de

75 pies? ccc))) Si un artículo del reglamento para construcción de las lanchas especifica

que por lo menos el 20% debe medir más de 90 pies, usando la ojiva responda si se está cumpliendo con esta disposición.

2.- A continuación se muestra un registro de un superintendente sobre el tiempo muerto en minutos sobre una muestra de los turnos de operación: 60 72 126 110 91 115 112 80 66 101 75 93 129 105 113 121 93 87 119 111 97 102 116 114 107 113 119 100 110 99 139 108 128 84 99

aaa))) Construya una tabla de distribución de frecuencia absoluta, relativa, acumulada, relativa acumulada y marca de clase.

bbb))) Dibuje los histogramas, polígonos y ojivas. 3.- Los registros de una empresa sobre el número de trabajadores que han llegado tarde diariamente durante el último mes se reportan a continuación: 2 3 12 8 15 2 0 11 5 7 5 9 4 10 2 7 9 11 15 12 0 3 7 9 18 16 12 6 8 3

aaa))) Construya una tabla de distribución de frecuencia absoluta, relativa, acumulada, relativa acumulada y marca de clase.

bbb))) Dibuje los histogramas, polígonos y ojivas.

TAREA: Resuelve los siguientes ejercicios.

Page 18: ESTADISTICA I

Estadística I

18

4.- De los registros escolares sobre el porcentaje de alumnos que reprueban su primer examen se tomó una muestra aleatoria de 40 grupos de diversas licenciaturas y los resultados fueron: 20 5 12 8 6 9 15 35 20 6 3 8 9 12 4 15 23 14 11 5 10 12 25 12 16 24 18 10 6 3 12 16 18 14 13 32 20 26 14 18

aaa))) Construya una tabla de distribución de frecuencia absoluta, relativa, acumulada, relativa acumulada y marca de clase.

bbb))) Dibuje los histogramas, polígonos y ojivas para frecuencias absolutas. 5.- Los registros de tránsito sobre el número de accidentes automovilísticos en la ciudad durante las primeras 6 semanas de este año indican lo siguiente:

Número de accidentes por día. 1ª semana

5 22 12 16 40 10 8

2ª semana

22 8 16 14 8 11 6

3ª semana

14 10 8 9 14 12 4

4ª semana

18 14 13 21 17 28 8

5ª semana

26 14 5 30 26 35 12

6ª semana

16 18 7 18 26 34 15

aaa))) Construya una tabla de distribución de frecuencia absoluta, relativa, acumulada, relativa acumulada y marca de clase.

bbb))) Dibuje los histogramas, polígonos y ojivas solo de frecuencias relativas. 6.- Se realizó una encuesta para conocer la opinión de la gente sobre algunos de los temas que ha tratado el actual gobierno, algunas de las preguntas fueron:

111... Edad. 222... Sexo: M (asculino) F (emenino). 333... Ingreso mensual. 444... ¿Cómo considera que el gobierno manejó el asunto de la liquidación del

SME?

(1) Bien (2) Regular (3) Mal

Page 19: ESTADISTICA I

Estadística I

19

555... ¿Está de acuerdo que será bueno para el país el grabar las medicinas

con el IVA?

(1) Si (2) No

666... ¿Está de acuerdo con la legalización de autos chocolates?

(1) Si (2) No

777... ¿Cómo califica el desempeño del gobierno de Felipe Calderón?

(1) Excelente (2) Bueno (3) Regular (4) Malo De las encuestas se tomó una muestra de 35 personas con la siguiente información. Pregunta 1 2 3 4 5 6 7 Persona Edad Sexo Ingreso SME Medicina Legalización Calif. 1 25 M 3400 2 2 2 3 2 42 M 5200 2 1 1 2 3 18 M 2300 3 2 1 2 4 26 F 3600 1 2 1 1 5 48 M 5800 2 2 2 2 6 52 M 6800 2 2 2 2 7 40 M 12500 2 2 2 3 8 36 F 8450 3 2 2 4 9 21 M 4150 1 1 1 3 10 36 F 6850 1 2 2 4 11 42 F 8900 1 1 1 4 12 58 F 2680 3 1 2 1 13 19 F 4600 2 2 1 1 14 26 M 5800 3 2 2 2 15 32 F 11000 1 2 2 2 16 18 M 3240 1 2 1 2 17 42 F 8600 1 2 1 1 18 47 M 2450 1 2 1 3 19 45 M 2600 2 2 2 2 20 32 M 8500 2 1 2 2 21 22 M 3200 2 2 2 2 22 26 M 2800 3 2 2 2 23 29 F 1600 3 2 2 2 24 40 F 2400 1 2 1 2 25 35 M 4650 1 2 2 1 26 36 F 3220 2 1 2 1 27 22 F 1450 3 1 1 2 28 28 F 3620 3 2 2 2 29 16 F 1100 2 2 2 3

Page 20: ESTADISTICA I

Estadística I

20

30 35 M 3680 1 2 2 1 31 42 M 5700 2 2 1 4 32 48 F 6800 2 1 2 2 33 65 F 1850 3 2 2 1 34 52 M 7400 1 2 2 3 35 32 M 3650 1 2 1 2

aaa))) Realiza una distribución de frecuencias para cada pregunta. bbb))) Identifica para cada pregunta el tipo de variable y la escala de

medición que se usa. ccc))) Construye una gráfica de pastel para la pregunta 2. ddd))) Construye un histograma de frecuencia relativa para la pregunta 3. eee))) Construye una ojiva de frecuencia relativa para la pregunta 1.

El análisis exploratorio de datos

Es una técnica que permite revisar muchos datos y resumirlos con rapidez usando algo tan sencillo como la aritmética básica y unos cuantos diagramas simples. Una de las técnicas más útiles es: La gráfica de tallo y hoja. Ejemplo: Calificaciones en el primer examen parcial:

79 78 78 67 76 87 85 73 99 84 72 66 57 94 84 72 51 48 61 82 93 100 89 72

Para producir una gráfica de tallo y hoja: 1. Hacer una lista vertical de los tallos 2. Dibujar una línea vertical a la derecha de los tallos 3. Listar las hojas 4. Ordenar las hojas en cada renglón 5. Girar en 900 la gráfica, obteniéndose algo que se parece a los

histogramas.

TAREA: Hacer el diagrama de tallo y hoja de los problemas 2 y 3 de la página 17

Page 21: ESTADISTICA I

Estadística I

21

CAPITULO 4

MEDIDAS DE TENDENCIA CENTRAL (MTC) El objetivo de las medidas de tendencia central es calcular un valor que sea representativo del grupo de datos bajo estudio.

¿Por qué se les llama de tendencia central? Porque el valor calculado es muy similar (tiende) a los valores que estarían en medio (parte central) del grupo de datos ordenados.

Las medidas de centralización o de tendencia central son valores que tienden a situarse en el centro de un conjunto de datos ordenados según su magnitud.

Para usos industriales, las dos medidas de tendencia central más utilizadas con la media y la mediana.

Principales MTC: a. Media simple b. Media aritmética (promedio) c. Mediana d. Moda

¿Cómo se calculan las MTC? Dependiendo como se tengan los datos que se van a procesar:

1) Datos sin agrupar: Se calculan a partir de los valores individuales de los datos, es decir, se debe conocer cada uno de los valores.

2) Datos agrupados: Se calculan a partir de una tabla de distribución de frecuencias (resumen), es decir, los datos ya han sido procesados previamente en una distribución y no se cuenta con los valores individuales.

1) CALCULO DE MTC PARA DATOS SIN AGRUPAR a) Media simple: La media simple es el guarismo intermedio entre la observaciòn menor y la mayor. Por definición: Media simple= Observaciòn mayor + Observaciòn menor 2 b) Media aritmética: Es la medida de localización más frecuentemente utilizada, especialmente en el campo de la comprobación de hipótesis estadísticas. Fórmulas:

)( poblaciónNxi

Page 22: ESTADISTICA I

Estadística I

22

)(muestrax nxi

.poblacióndearitméticamedia

.muestraunadearitméticamediax 21 xxvaloresdeSumatoriaxi

.poblaciónlaendatosdenúmeroN .muestralaendatosdenúmeron

c) Mediana: La mediana es el valor que ocupa el valor central de toda la distribución de frecuencias (es el valor que divide a la distribución por la mitad). Esto es, la mitad de los casos caen por debajo de la mediana y la otra mitad se ubica por encima de ella. La mediana es una medida de tendencia central propia de los niveles de medición ordinal, por intervalos y de razón. Primeramente se deben ordenar los datos (en forma ascendente o descendente) y después se ubica el valor que esté exactamente en la parte central de la lista ordenada. Puede ser que existan dos valores centrales, en cuyo caso se debe calcular un promedio entre ellos. d) Moda. Se define como el dato que más se repite en el grupo, es decir, el de mayor frecuencia. Si solo existe un valor de moda, se dice que los datos tienen una distribución UNIMODAL, si hay dos valores distintos de moda, entonces es BIMODAL y si hay más de dos será MULTIMODAL (o POLIMODAL), También pueden existir casos donde no haya moda. Ejemplo: Calcule las MTC en datos sin agrupar para las horas extra laboradas a la semana por una muestra de 16 empleados tomados de una empresa, cuyos registros fueron:

2 2.5 3 4 2.5 2 2.5 3 3 1.5 2 3.5 1.5 1 2.5 2.5

1. Calcule las medidas de tendencia central del problema los salarios

diarios a destajo para los 30 obreros de la página 9. 2. Calcule las medidas de tendencia central del problema de las

lanchas pesqueras de la página 10.

TAREA: Resuelve los siguientes ejercicios.

Page 23: ESTADISTICA I

Estadística I

23

2) CALCULO DE MTC PARA DATOS AGRUPADOS. aaa))) Media Aritmética.

)( poblacióni

ciifXf

)(muestraxi

cii

fXf

.clasecadadeabsolutafrecuenciafi

.clasecadademarcaXci

bbb))) Mediana.

)(2inf ILMed

c

aAif

ff

med

.inf medianaclasedeInferiorLímiteL med

.medianalaaanteriorclaseladeacumuladaFrecuenciafaA

.medianaclaseladeabsolutaFrecuenciaf c

.clasedeIntervaloI

.datoslosdemitadlaaigualomayorseaacumuldafrecuenciacuyaclaseprimerMedianaClase

Page 24: ESTADISTICA I

Estadística I

24

ccc))) Moda.

)(21

1modinf ILMod dd

d

.modinf ModalclasedeInferiorLímiteL .1 anteriorlayModalclaseladeabsolutafrecuencialaentrediferenciad

.2 siguientelayModalclaseladeabsolutafrecuencialaentrediferenciad

.clasedeIntervaloI

datosmásabsolutafrecuenciamayorconclaseModalClase

TAREA: 1. Calcule las MTC para el problema de los salarios en datos agrupados:

Clase L inf L sup f fa Xc 1 24 25 5 5 25 2 26 27 7 12 27 3 28 29 8 20* 29 4 30 31 6 26 31 5 32 33 4 30 33

2. Calcule las MTC para el problema 4 de los registros escolares sobre el porcentaje de alumnos que reprueban su primer examen en datos agrupados de la página 18.

3. Calcule las MTC para el problema 5 de los registros de tránsito sobre el

número de accidentes automovilísticos en datos agrupados de la página 18.

Page 25: ESTADISTICA I

Estadística I

25

CAPITULO 5 PERCENTILES

Un percentil es una medida que señala los valores, no necesariamente en una localización central. Un percentil da información acerca de cómo se distribuyen los valores sobre el intervalo, desde el menor hasta el mayor. Para valores que no tienen muchos valores repetidos el p-ésimo (se dice “peésimo”) percentil divide los datos en dos partes. Más o menos el p por ciento de los elementos tienen valores menores que el p-ésimo percentil. Aproximadamente el (100 –p) por ciento de los elementos tienen valores mayores que el p-ésimo percentil. Este percentil se define como sigue:

Percentil El p-ésimo percentil es un valor tal que por lo menos un p por ciento de

los elementos tienen dicho valor o menos y, al menos (100 –p) por ciento de los elementos tienen este valor o más.

Cálculo del p-ésimo percentil

1. Ordenar los datos de manera ascendente 2. Calcular un índice i

i = (p/100) n

En donde p es el percentil de interés y n es la cantidad de elementos.

3. (a) Si i no es entero, se redondea. El valor entero inmediato mayor que i indica la posición del p-ésimo percentil (b) Si i sí es entero, el p-ésimo percentil es el promedio de los valores de los datos ubicados en los lugares i e i+1.

Ejemplo: 1. Determinar el 85º. percentil de los siguientes datos: 2210 2255 2350 2380 2390 2420 2440 2450 2550 2630 2825 2. De los mismos datos calcule el 50º. percentil

CUARTILES Con frecuencia se dividen los datos en cuatro partes, cada una con aproximadamente la cuarta parte (25% de los elementos). A los puntos de división se les llama cuartiles y se definen como sigue: Q1 = Primer cuartil ó 25% percentil Q2 = Segundo cuartil ó 50% percentil (mediana) Q3 = Tercer cuartil ó 75% percentil Ejemplo:

3. Determinar el segundo cuartil (o la mediana) de los siguientes datos: 2210 2255 2350 2380 2390 2420 2440 2450 2550 2630 2825

4. Determinar de los mismos datos Q1 y Q3. 5. De los problemas 2 y 3 de la página 17 determine los valores de Q1, Q2 y

Q3.

Page 26: ESTADISTICA I

Estadística I

26

CAPÍTULO 6 MEDIDAS DE VARIACIÓN

(DISPERSIÓN)

El objetivo de las medidas de variación es determinar que tanta similitud o diferencia (variación) existe entre los datos bajo estudio. Las medidas de dispersión dan idea de la separación de los datos numéricos alrededor de un valor medio. Las dos medidas de dispersión de mayor utilidad son la desviación estándar y la amplitud (“range”). Las medidas de variación se calculan en base al valor de la media aritmética y entre las principales podemos mencionar:

a) Desviación media (DM) b) Varianza y desviación estándar ( o típica) c) Coeficiente de variación

1) DATOS SIN AGRUPAR

a) Desviación media.- Es un promedio de las diferencias absolutas que existe entre cada dato del grupo con respecto a su media aritmética.

.)()(

)(

datocadaymedialaentrepositivaabsolutaDiferenciaXiMmuestraDM

poblaciónDM

niXx

NXiM

b) Varianza y desviación estándar.- Son las medidas de variación más importantes en estadística y valoran la diferencia al cuadrado que existe entre cada dato y la media, para eliminar los efectos que ocasionan datos extremosos (valores que son muy altos o muy bajos con respecto al resto del grupo). La desviación estándar o típica es el promedio de desviación de las puntuaciones con respecto a la media. La varianza es la desviación estándar elevada al cuadrado.

Varianza

)(

)(

12

2

2

2

muestras

población

niXx

NXiM

Page 27: ESTADISTICA I

Estadística I

27

c) Coeficiente de variación.- Es útil para comparar la variación de dos grupos de datos cuyos valores sean de distinta naturaleza. Se expresa como un porcentaje de la magnitud de la desviación estándar con respecto a su propia media aritmética.

)(100

)(100muestraCvpoblaciónCv

xsM

Ejemplo: Determine las medidas de variación en datos sin agrupar para el problema de las horas extra. 44.2x

Xi Xix 2Xix

2 0.44 0.1936 2.5 0.06 0.0036 3 0.56 0.3136 1.5 0.94 0.8836 2.5 0.06 0.0036 2 0.44 0.1936 1.5 0.94 0.8836 1 1.44 2.0736 3 0.56 0.3136 2.5 0.06 0.0036 2 0.44 0.1936 2.5 0.06 0.0036 4 1.56 2.4336 3 0.56 0.3136 3.5 1.06 1.1236 2.5 0.06 0.0036 ∑ 9.24 8.9376

Desviación Estándar o Típica

)(

)(

2

2

muestrass

población

Page 28: ESTADISTICA I

Estadística I

28

%63.31100100)(7719.05958.0

(var)5958.0

5775.0

44.27719.0

2159376.8

12

1624.9

2

xs

nXix

nXix

CvDEhrss

hrss

hrsDM

2) DATOS AGRUPADOS a) Desviación media

..

)(

)(

clasecadadeMarcaXciclasecadadeabsolutafrecuenciafi

muestraDM

poblaciónDM

fi

Xcixfi

fi

XciMfi

b) Varianza y desviación estándar.

Varianza

)(

)(

12

2

2

2

muestras

población

fi

Xcixfi

fi

XciMfi

Page 29: ESTADISTICA I

Estadística I

29

c) Coeficiente de variación.

)(100

)(100muestraCv

poblaciónCv

xsM

Ejemplo: Salarios (datos agrupados). Clase infL

supL

f Xc

XciM

XciMf

2XciM

2XciMfi

1 24 25 5 25 3.8 19 14.44 72.2 2 26 27 7 27 1.8 12.6 3.24 22.68 3 28 29 8 29 0.2 1.6 0.04 0.32 4 30 31 6 31 2.2 13.2 4.84 29.04 5 32 33 4 33 4.2 16.8 17.64 70.56 Total 30 63.2 194.8

%85.810010055.2$49.6

49.6

11.2$)(80.28$

80.2855.2

2

230

8.1942

302.63

MCv

pesos

DMcalculadaepreviamentagrupadosdatos

Desviación estándar

)(

)(

2

2

muestrass

población

Page 30: ESTADISTICA I

Estadística I

30

TAREA: 1. El departamento de transito de la ciudad de Irapuato está preocupado

por la velocidad a la que los conductores manejan en un tramo de la carretera principal. Los datos de la velocidad de 45 conductores en Km / hr son los siguientes:

15 32 45 46 42 39 68 47 18 31 48 49 56 52 39 48 69 61 44 42 38 52 55 58 62 58 48 56 58 48 47 52 37 64 29 55 38 29 62 49 69 18 61 55 49

Calcule:

a. Las medidas de tendencia central y de dispersión de los datos no agrupados

b. Las medidas de tendencia central y de dispersión de los datos agrupados

c. El departamento de transporte informa que a nivel nacional, no más del 10% de los conductores excede 55 Km / hr ¿Se comportan los conductores del municipio de Irapuato de acuerdo con las afirmaciones del Departamento de Transporte acerca de los patrones de manejo?

2. El administrador de un hospital ordenó un estudio del tiempo que un

paciente debe esperar antes de ser tratado por el personal de la sala de urgencias. Los datos que se presentan a continuación fueron tomados durante un día normal:

Tiempo de espera (minutos) 12 26 13 16 21 7 20 14 24 25 11 27 17 15 16 29 18 5

25 13 a) Organice los datos en un ordenamiento ascendente ¿Qué comentario

puede hacer con respecto al tiempo de espera a partir del ordenamiento?

b) Calcule las medidas de tendencia central de los datos sin agrupar c) Calcule las medidas de variación de los datos agrupados d) A partir de una ojiva, establezca cuánto tiempo debe suponerse que el

75% de los pacientes aguarden en la sala de espera.

Page 31: ESTADISTICA I

Estadística I

31

DETECCIÓN DE VALORES ATÍPICOS

A veces un conjunto de datos tiene uno o más elementos con valores demasiado grandes o demasiado pequeños. a los valores extremos como éstos se les llama valores atípicos. Las personas con experiencia en estadística, toman sus precauciones al identificar los valores atípicos y los revisan uno a uno cuidadosamente. Un valor atípico puede ser un elemento para el cual se haya anotado su valor en forma errónea. También puede ser uno que por error se incluyó en el conjunto de datos y debe eliminarse. Para identificarlos de acuerdo con el “Teorema de Chebysev” se puede aplicar una regla empírica que dice que casi todos elementos están a menos de tres desviaciones estándar de la media (z). De esta manera nos aseguramos la validez de los valores de datos antes de efectuar una serie de pruebas. Ejemplo:

1. Calcule los valores de z para los siguientes datos: Muestra Desviación respecto a la

mediana

(_x - xi)

Valor de z

(_

x - xi) / s

46 54 42 46 32

Por consiguiente, los valores de z muestran que los datos anteriores _______ hay valores atípicos.

2. Se tiene la muestra de tamaño 5 con los valores de datos: 10, 20, 12, 17 y 16. Determine el valor de z para cada uno de los siguientes valores.

3. Se tiene una muestra con media de 500 y desviación estándar de 100 ¿Cuál es el valor z de cada uno de los siguientes valores: 520, 650, 500, 450 y 280?

4. Los siguientes datos son salarios anuales para una muestra de gerentes de tienda. Los datos están en miles de pesos.

33.7 45.4 44.0 47.5 59.6 45.1 37.7 43.9 48.3 53.0 39.5 42.9 51.0 35.6 41.5 48.8 31.3 51.2 43.2 54.4

a) Calcule la media y la desviación estándar b) Un gerente de Monterrey gana $28 000. 00 al año. Calcule el

valor de z para este gerente y diga si cree que este salario debe considerarse como valor atípico.

c) Calcule los valores de z para salarios de $30 000.00, $45 000.00, $60 000.00 y $75 000.00 ¿Debe considerarse atípico alguno de ellos?

Page 32: ESTADISTICA I

Estadística I

32

ASIMETRÍA Y LA CURTOSIS.

Las medidas de distribución nos permiten identificar la forma en que se separan o aglomeran los valores de acuerdo a su representación gráfica. Estas medidas describen la manera como los datos tienden a reunirse de acuerdo con la frecuencia con que se hallen dentro de la información. Su utilidad radica en la posibilidad de identificar las características de la distribución sin necesidad de generar el gráfico. Sus principales medidas son la Asimetría y la Curtosis. 1. Asimetría Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmética). La asimetría presenta tres estados diferentes, cada uno de los cuales define de forma concisa como están distribuidos los datos respecto al eje de asimetría.

Se dice que la asimetría es positiva cuando la mayoría de los datos se encuentran por encima del valor de la media aritmética, la curva es Simétrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la media y se conoce como asimetría negativa cuando la mayor cantidad de datos se aglomeran en los valores menores que la media 2. Curtosis Cuando medidos la curtosis de una distribución, estamos midiendo qué tan puntiaguda es. Es un indicador de lo plana o picuda que es una curva. Mide cuan 'puntiaguda' es una distribución respecto de un estándar. Este estándar es una forma acampanada denominada 'normal', y corresponde a una curva de gran importancia en Estadística. Esta medida determina el grado de concentración que presentan los valores en la región central de la distribución. Por medio del Coeficiente de Curtosis, podemos identificar si existe una gran concentración de valores (Leptocúrtica), una concentración normal (Mesocúrtica) ó una baja concentración (Platicúrtica).

Page 33: ESTADISTICA I

Estadística I

33

CAPITULO 7 PROBABILIDAD

Jacob Bernoulli (1654-1705), Abraham de Moivre (1667-1754), el reverendo Thomas Bayes (1702-1761) y Joseph Lagrange (1736-1813) desarrollaron fórmulas y técnicas para el cálculo de la probabilidad. En el siglo XIX, Pierre Simón, marqués de Laplace (1749-1827), unificó todas estas ideas y compiló la primera teoría general de probabilidad. La teoría de la probabilidad fuè aplicada con éxito en las mesas de juego y, lo que es más importante a la resolución de problemas sociales y económicos. Históricamente se han desarrollado tres enfoques para definir y calcular la probabilidad:

a) Clásico (axiomático) b) Frecuencia relativa c) Subjetivo Enfoque clásico.- La probabilidad se determina de la siguiente manera: Si existen N(A) resultados que son favorables a un evento de un total de N(S) resultados posibles, y todos los resultados son igualmente probables y mutuamente excluyentes, entonces la probabilidad de que ocurra el evento (A) está dada por:

)()()(

SNANAP

Se dice que dos resultados son mutuamente excluyentes si no pueden ocurrir simultáneamente, es decir; que al ocurrir uno de ellos automáticamente la ocurrencia del otro se anula.

Page 34: ESTADISTICA I

Estadística I

34

Ejemplos de probabilidad clásica:

1. Lanzar una moneda.

%505.021 solP

Favorable que caiga sol.

2. Lanzar un dado.

Favorable que caigan 3 puntos.

%67.161667.03 61 ptosP

Probabilidad favorable que caigan más de 4 puntos.

%33.333333.062 puntosMásP

3. Lanzar dos dados.

Probabilidad de que caigan 3 puntos. Dado A: 6 resultados. Dado B: 6 resultados. 6*6=36

%55.505.03 362 puntosP

Page 35: ESTADISTICA I

Estadística I

35

4. ¿Cuál es el número más probable que salga?

1 2 3 4 5 6

1 1,1 1,2 1,3 1,4 1,5 1,6

2 2,1 2,2 2,3 2,4 2,5 2,6

3 3,1 3,2 3,3 3,4 3,5 3,6

4 4,1 4,2 4,3 4,4 4,5 4,6

5 5,1 5,2 5,3 5,4 5,5 5,6

6 6,1 6,2 6,3 6,4 6,5 6,6

El número 7.

%67.16166.07 366 P

5. Si se lanzan 3 monedas ¿cuál es la probabilidad de que caigan 2 soles?

1 A A A A S S S S 2 A A S S S S A A 3 A S S A S A A S

%5.37375.02 83 solesP

Page 36: ESTADISTICA I

Estadística I

36

FRECUENCIA RELATIVA. La probabilidad se determina con base en la proporción de veces que se registra un resultado favorable a un evento de un total de observaciones registradas. No hay implícita ninguna suposición previa de igualdad de probabilidades. Ejemplo: A continuación se muestra una distribución de frecuencias para las comisiones mensuales que obtuvieron un grupo de 300 vendedores. Comisión Mensual No. de vendedores 0-5,000 15 >5,000-10,000 25 >10,000-15,000 35 >15,000-20,000 125 >20,000 100 300 Determine la probabilidad de que al elegir un vendedor, este obtenga una comisión:

aaa))) Mayor a $10,000. bbb))) Mayor a $20,000. ccc))) De $10,000 ó Menor

%33.131333.0000,10

%33.333333.0000,20%67.868667.0000,10

30040300100300260

comisiónPcomisiónPcomisiónP

SUBJETIVO.

La probabilidad esta determinada por el grado de confianza que una persona tiene en que un evento en particular ocurra, basándose en la evidencia que tiene disponible. (Es ampliamente usado).

Page 37: ESTADISTICA I

Estadística I

37

EXPRESIONES DE VALORES DE PROBABILIDAD.

La probabilidad es un valor que varia en un rango de 0 á 1 (0 á 100%). Si el valor es cero esto indica que es imposible que el evento ocurra, pero si es uno indica que el evento es seguro que ocurra.

10 AP

La probabilidad de que un evento ocurra más la probabilidad de que no ocurra debe ser igual a uno. (100%)

1' APAP

APAP

APAP

1''1

P(A)= Probabilidad de que ocurra “A”. P (A’)= Probabilidad de que no ocurra “A”.

REGLAS DE PROBABILIDAD PARA COMBINACIÓN DE EVENTOS.

Regla de la suma (adición).

Cuando se quiere calcular la probabilidad de que un evento (A) u otro (B) ó ambos (A y B) ocurran entonces se aplica la regla de la suma, en la cual se pueden dar dos casos dependiendo si los eventos son ó no mutuamente excluyentes. .

.sexcluyentemutuamenteEventosBPAPBóAP

sexcluyentemutuamenteNoEventosABPBPAPBóAP

Ejemplo:

Grupo Edad 1 Hombre 30 años 2 Hombre 32 3 Hombre 40 4 Mujer 45 5 Mujer 20

Page 38: ESTADISTICA I

Estadística I

38

aaa))) ¿Probabilidad de que sean mujeres ó mayores de 30

años?

%808.0

3030

54

51

53

52

ymujerPPmujerP

bbb)))

BA

óP 4030

%404.04030

52

51

51

PP

ccc))) Sea hombre ó tenga >35 años.

%8035,35

54

52

53

53

añosHombrePañosPHombreP

ddd))) Sea mujer ó >40 años.

%8040,40

54

51

53

52

añosmujerPañosPmujerP

eee))) Sea un hombre >40 años.

%4040, 5

2 añosHombreP

fff))) Sea hombre ó mujer.

%10055

52

53 mujerPHombreP

ggg))) Tenga >20 años y <28 años.

0

2820

añosPyañosP

Page 39: ESTADISTICA I

Estadística I

39

Otro Ejemplo: En una fábrica hay un total de 130 técnicos que trabajan en tres departamentos distintos: 30 en Almacén. 65 en Mantenimiento. 35 en Producción. En cada departamento existen técnicos calificados y no calificados. En almacén 20 calificados, en mantenimiento 40 y en producción 20. En base a estos datos determine la probabilidad de:

aaa))) De que al elegir a un técnico este sea No calificado y trabaje en almacén.

%7.707.0130

10 almacénPycalificadonoP

bbb))) Calificado y trabaje en producción.

%38.1515.013020 producciónPycalificadoP

ccc))) Calificado ó trabaje en mantenimiento.

%8080.0130105

13040

13065

13080

ntomantenimieycalificadoPntomantenimiePcalificadoP

ddd))) No calificado ó no trabaje en almacén.

%61.8484.0130110

13040

130100

13050

almacénnoycalificadonoPalmacénnoPcalificadonoP

eee))) Trabaje en mantenimiento ó no sea calificado.

%6969.013090

13025

13050

13065

calificadonoyntomantenimiePcalificadonoPntomantenimieP

fff))) No trabaje en producción y no sea calificado.

%92.262692.013035 calificadonoPyproducciónnoP

Depto. Calif. No Calif. Total Almacén 20 10 30 Mantenimiento 40 25 65 Producción 20 15 35 Total 80 50 130

Page 40: ESTADISTICA I

Estadística I

40

ggg))) Trabaje en mantenimiento.

%505.013065 ntomantenimieP

hhh))) No trabaje en almacén.

%7776.0130

100 almacénnoP

iii))) Trabaje en almacén ó producción.

%505.013065

13035

13030 producciónPalmacénP

DIAGRAMAS DE VENN EN PROBABILIDAD.

Estos diagramas se utilizan para representar de forma gráfica las probabilidades en la combinación de eventos que se presentan en la regla de la suma. Los eventos se representan mediante círculos, dentro de los cuales se anotan los valores de probabilidad o bien el número de elementos que pertenecen al evento, y en un rectángulo se encierran todos los eventos y elementos que intervienen en el problema. Algunos de los diagramas más representativos se ilustran a continuación:

P(A ó B) P (AB)

A B A B

Page 41: ESTADISTICA I

Estadística I

41

P (A’) Ejemplo:

Nota: La suma de probabilidades es igual a la unidad. Calcule la probabilidad de los siguientes eventos:

aaa))) P(A)= 0.4 bbb))) P(B)= 0.5 ccc))) P(A ó B)= 0.6 ddd))) P(AB)= 0.3 eee))) P(A’)= 0.6 fff))) P(A’ ó B)= 0.9 ggg))) P(A’ B)= 0.2 hhh))) P(A’ ó B’)= 0.7 iii))) P(A’ B’)= 0.4

A

A B

.1 .3

.2 .4

Page 42: ESTADISTICA I

Estadística I

42

Regla de la Multiplicación. Para determinar la probabilidad conjunta de dos eventos: P(A B), que pueden ocurrir simultáneamente ó en sucesión se utiliza la regla de multiplicación la cual difiere según los eventos sean dependientes ó independientes: P(A B)= P(A) P (B) eventos independientes. P(A B)= P(A) P (B/A) eventos dependientes. P(A B)= Probabilidad conjunta de que ocurran A y B. P(A)= Probabilidad de que ocurra A. P (B)= Probabilidad de que ocurra B. P (B/A)= Probabilidad de que ocurra B dado (si es que) ocurre A. Probabilidad Condicional. Ejemplo: En una caja existen 10 refacciones, 8 en buen estado y 2 defectuosas. Si se extraen 2 piezas de la caja, determine la probabilidad de que:

aaa))) Ambas sean defectuosas. .sin%22.2.1

.%404.0.2.1

902

91

102

1.2

1004

102

102

reemplazoPdefP

reemplazocondefydefPsdefectuosaseanAmbasP

defdef

bbb))) La primera sea defectuosa y la segunda en buen estado.

.sin%77.17.

.%1616.02.1

9016

98

102

10016

108

102

reemplazoPdefPreemplazoconbuenydefP

defbuen

ccc))) Una pieza esta defectuosa y otra en buen estado.

Resuelva el problema suponiendo primero que la primera pieza es devuelta antes de extraer la segunda (con reemplazo) y vuelva a resolver suponiendo que la primera pieza no es devuelta (sin reemplazo).

%55.35Pr%77.17

%77.17.1sin

9016

92

108

9016

98

102

totalobabilidadPbuenP

PdefPreemplazo

buendef

defbuen

100

16102

108

10016

.212.1

defybuenPbuenydefP

%3232.0

..

10032

PbienotraydefPreemplazocon

Page 43: ESTADISTICA I

Estadística I

43

ÁRBOL DE PROBABILIDAD. Es un diagrama que nos permite determinar probabilidades conjuntas P (AB), es decir ilustrar las operaciones para la regla de multiplicación. Se construye en base a círculos denominados nodos que se unen a través de líneas denominadas ramas. En los nodos se anotan las probabilidades conjuntas y sobre las ramas las probabilidades individuales de los eventos. Ejemplifíquese sobre el problema anterior (de las refacciones). Con reemplazo.

NOTA: Es más útil en eventos dependientes.

1

0.8

0.2

.64

.16

.16

0.04

8.0buenaP

2.0defP

8.0buenaP

2.0defP

8.0buenoP

2.0defP

buenaybuenaP 21

defybuenaP 21

buenaydefP 21

defydefP 21

1° Refacción 2° Refacción

Page 44: ESTADISTICA I

Estadística I

44

Sin reemplazo.

1

0.8

0.2

.6222

.1778

.1778

.0222

8.0buenoP

2.0defP

7778.0197 buena

buenaP

2222.0192 buena

defP

8889.198 def

buenaP

1111.191 def

defP

buenaybuenaP 21

defybuenaP 21

buenaydefP 21

defydefP 21

1° Refacción 2° Refacción

Page 45: ESTADISTICA I

Estadística I

45

TAREA: 1. De los 300 estudiantes de una Universidad:

170 son de Contaduría, 70 son de Administración, 40 son de Comercio y el resto son de Mercadotecnia. En cada carrera hay alumnos que cuentan con beca: 50 de Administración, 30 de Contaduría, 10 de Comercio y 15 de Mercadotecnia. Determine la probabilidad de que al elegir un estudiante:

a) Sea de Comercio y tenga beca b) Sea de Contabilidad o tenga beca c) Sea de Administración o no tenga beca d) No sea de Mercadotecnia o tenga beca e) Sea de Comercio o no tenga beca

2. De 100 personas que solicitaron un puesto en una compañía 40 ya

tenían experiencia. De los 100, había 30 que tenían certificado profesional y de ellos sólo 20 tenían experiencia. Si se elige a un solicitante del grupo determine la probabilidad de que

a) Tenga certificado y experiencia b) Tenga experiencia o certificado c) Tenga certificado o no tenga experiencia

3. En una urna se tienen 50 canicas: 10 rojas 25 azules 15 blancas. De las rojas hay 5 veteadas, mientras que de las azules 10 y de las blancas 8. Si se saca una canica de la urna determine la probabilidad de que:

a) Sea azul o este veteada b) Sea azul o blanca c) No sea azul d) Sea blanca o este veteada Si se sacan dos canicas sin reemplazo, determine la probabilidad de que: e) Ambas sean rojas f) La primera sea blanca y la segunda azul g) La primera esté veteada y la segunda no.

4. La probabilidad de que una máquina produzca tuercas hexagonales

aceptables es del 90%. Si las piezas producidas son independientes encuentre la probabilidad de que:

a) Dos piezas seguidas que no sean aceptables b) Una pieza aceptable y una no aceptable, en ese orden. c) Una pieza aceptable y una no aceptable, en cualquier orden.