estadística fundamental -...
TRANSCRIPT
1
Estadística
Fundamental Conceptos y Definiciones
Prof. (Ing.) Andrés Scott Velásquez
Según Syllabus del I.U.G.T.
2
ÍNDICE
TÍTULOS CAPÍTULO TEMA PÁGINA
I 01 Resumen de Conceptos y definiciones 03
02 Distribución de Frecuencias 09
II 03 Medidas de Tendencia Central 21
04 Medidas de Posición 26
05 Medidas de Dispersión o Desviación 32
06 Estudio de la curva originada por un Polígono de Frec. 36
III 07 Estudio de las Probabilidades 51
08 Distribución de Probabilidades 84
09 Distribuciones Especiales de Variables Discretas 88
10 Distribución de Variables Continua (Dist. Normal o Z) 93
IV 11 Teoría del Muestreo y Teorema del Límite Central 106
12 Estimación 113
13 Prueba de Hipótesis 121
V 14 Análisis de Varianza (ANOVA) 140
15 Prueba No Paramétrica del Chi-Cuadrado 145
VI 16 Correlación Lineal y Recta de Regresión Lineal 159
17 Series Temporales, Cronológicas o de Tiempo 168
18 Número Índices 182
Apéndices Tabla y Cuadros 199
3
TÍTULO I Capítulo 01
ESTADISTICA
RESUMEN DE CONCEPTOS Y DEFINICIONES
1. Historia, fines e importancia de la Estadística
1.1.-Datos Históricos.
Si hacemos una revisión del concepto elemental de Estadística podemos intuir que
este conocimiento parte desde el momento cuando se realiza el primer censo de propiedades con fines de cobrar impuestos para mantener la estructura de estado que ya se comenzaba a organizar. Fueron los babilonios, los persas, los egipcios, los griegos y los chinos quienes comenzaron con este tipo prácticas. Nos refleja la biblia dos hechos que tienen que ver con el nacimiento de la recolección de datos base de la estadística; en primer lugar el censo que realizó Moisés para conocer el número de personas que constituía su pueblo, y en segundo lugar, cuando nace Jesús sus padres iban a empadronarse en el censo que periódicamente llevaba a cabo el imperio romano para conocer los detalles de estado que tenía que ver con sus dominios. Se tiene escasas noticias de que en América tanto los Aztecas como los Incas realizaban censos para darle forma económica y socialmente a sus pueblos. Hacia el Siglo XVI, cuando se tiene conocimiento de los primeros estudios de Probabilidades, la Estadística toma un gran impulso. En el siglo XVII la Estadística aplicada a las Matemáticas toma un gran impulso, continuando su desarrollo en Siglo XVIII cuando se profundiza los estudios de la Estadística Inductiva o Inferencial, los estudios demográficos, se da la base para la iniciación de los negocios con los seguro de vida cuando se realiza el primer inventario sobre la mortalidad. En ese mismo siglo nace la Sociometría y en el Siglo XVIII la Biometría. Es tal la importancia a la que ha llegado la estadística hoy en día, que no existe ciencias tanto naturales como sociales, ni disciplina que no se apoye en los métodos estadísticos para darle sentido a sus investigaciones. Se puede señalar que personalidades como: Girolano Gargano, Gottfriend Achenwall, Juan Pedro Sussmilch, Antonio Deparcioux, Jacques Bernoulli, Pedro Simón Laplace, Carl Friedrich Gauss, Lambert Jacques Quetelet, Pafnuti Lvovich Chevyshev, Grégor Johann Méndel, Francis Gaston, Karl Pearson, Ronald Fisher, John van Neumann y William Féller, son los padres de la Estadística tal como la conocemos en la actualidad. Sus aportes han sido de una gran valía, porque ello ha contribuido en gran parte a los avances en el mundo de lo científico, lo social, lo económico, lo político y lo cultural.
4
1.2.- Fines e Importancia de la Estadística Para conocer los fines e importancia de la Estadística debemos conocer de dónde viene este vocablo. La voz latina STATUS es el origen de la palabra estadística, referida fundamentalmente a la recolección de datos requeridos por su utilidad al Estado como Nación o al Estado como tal. Cualquier estudio sobre datos tomados de las realidades para escrutar información sobre ellos, que permitan llegar a análisis lógicos y concluyentes sobre fenómenos naturales o sociales, que nos permita tomar decisiones acertadas señalan de por si la importancia de la estadísticas. Los cuadros y gráficos estadísticos por sí solo no nos señalan un camino a seguir. Se requiere profundizar ese primer conocimiento con una serie de definiciones metodológicas que afinen una conclusión final que oriente con acierto la toma de decisiones efectivas. La política, la sociología, la psicología, la medicina, la economía y la ingeniería por decir algunas actividades de la vida diaria se les hace indispensable recurrir a la Estadística para la toma de decisiones, es por eso que muchos académicos la consideran como una ciencia auxiliar de las ciencias madres.
2. Estadística Estadística es una ciencia auxiliar que establece los métodos para recopilar, organizar, presentar, analizar e interpretar información para orientar en la toma de decisiones más efectivas. 2.1.- Tipos de estadísticas.
2.1.1. – Estadística Descriptiva o Deductiva: La cual define el conjunto de métodos para recopilar, organizar, resumir y presentar los datos de manera informativa. También podemos definirla como el conjunto de métodos tantos numéricos como gráficos que luego de recolectada la información de los datos de la población o muestra sometida al estudio se utiliza para resumirla y procesarla para transformarla y presentarla para analizarla. 2.1.2.- Estadística Inferencial o Inductiva: La cual define el conjunto de métodos para determinar algún atributo medible acerca de una población en base a una muestra representativa de la misma. Podemos agregar que la Estadística Inferencial constituye la base para formular predicciones, previsiones y estimaciones que se utilizan para transformar la información en
conocimiento. Este tipo de estadística toma como basamentos los fundamentos de la Teoría de las Probabilidades y de la Teoría del Muestreo.
2.1.2.1 Población: Es el conjunto de todos los individuos, objetos o medidas de interés o a estudiar.
2.1.2.2 Elemento: Son las unidades simples (individuos, objetos o medidas) que integran una población.
2.1.2.3 Población Finita: Cuando el número de elementos que forman una población es limitado.
5
2.1.2.4 Población No Finita: Son poblaciones formadas por una cantidad infinita o muy grande de elementos, cuyo comportamiento puede asumirse como el de una población de infinitos elementos.
2.1.2.5 Característica: Son los rasgos, cualidades o propiedades que poseen los elementos o las unidades que constituyen la población o la muestra.
2.1.2.6 Parámetro: Característica asociada a una población. 2.1.2.7 Muestra: Es una porción o parte representativa de la población de
interés sometida a estudio. 2.1.2.8 Marco: Conocido también como Marco Muestral o Marco de
Referencia, lo constituye la lista, el mapa o cualquier otro material aceptable, que contenga todas las unidades o elementos perfectamente identificadas y actualizadas, de la cual se selecciona la muestra.
2.1.2.9 Estadístico: Característica asociada a una muestra 2.1.2.10 Estadígrafo o Estimador: Es la descripción numérica de una
característica correspondiente a cualquier elemento de una muestra. 2.1.2.11 Atributo: Característica no mensurable, pero si cuantificable de
una población o muestra. Son atributos: profesión, cargo, marcas, calidad, etc.; como se observa son características no mensurables pero que si se pueden cuantificar.
2.1.2.12 Censo: Es una colección e datos de cada un de los miembros de
una población. 2.1.2.13 Dato: Valores que han sido recopilados como resultado de
observaciones y que se refieren a alguna variable en particular. 2.1.2.14 Observación: Es cualquier registro de información ya sea
numérico o categórico 2.1.2.15 Muestra Probabilística: Son muestras donde sus elementos o
unidades se toman al azar o de manera aleatoria, es decir todos los elementos de la población a estudiar tienen la misma posibilidad de ser seleccionados.
2.1.2.16 Muestras No Probabilística: Conocidas también como muestras erráticas o circunstanciales, son aquellas muestras donde los elementos de la población son seleccionados de manera conveniente o caprichosa del investigador.
3. Variable o Unidad Estadística Es una de las tantas particularidades o característica que conforman un fenómeno estadístico de la población o muestra que se está estudiando o analizando.
3.1 Variable Cualitativa: Variable que presenta observaciones no numéricas. Ejemplos: Gentilicios, Religiones, Profesiones, Colores, etc.
3.2 Variable Cuantitativa: Variable que presenta observaciones numéricas. Ejemplos: Las Notas, Edades, Pesos, Longitudes, Áreas, Volúmenes, Compras, Ventas, etc. 2.2.1 Variable Cuantitativa Discreta: Variable numérica que representa valores claramente contables, generalmente números enteros (individuos y objetos). Ejemplo: Personas, Animales, Números de Visas Concedidas, Numero de Carros, etc. 2.2.2 Variable Cuantitativa Continua: Variable numérica que toma cualquier valor dentro de los infinitos valores de un rango determinado (todo número real
6
para señalarla). Ejemplo: Estaturas, Monto de Gastos, Sueldos, Monto de Inversiones, etc.
4. Escala de Medidas o Niveles de Medición Rige los cálculos que se llevan a cabo con el fin de resumir y presentar los datos. Es la manera de clasificar los datos para su presentación. 3.1 Medidas en Escala Nominal: Escala no numérica de nombres o clasificaciones que se utilizan para presentar datos en categorías distintas y separadas. Ejemplo:
Fuente Millones de Barriles Diarios
Porcentajes
OPEP
OCDE (Inc. a USA) Rusia China Otra
32,91
22,76 11,33 3,62 12,35 82,97
39,7
27,4 13,7 4,4 14,8
100,0 TABLA.- Suministro mundial de petróleo para 2004
Se observa en la tabla presentada un nivel de medición que no responde a un orden en particular en las categorías. Propiedades: a) Las categorías de datos la representan los nombres clasificados y b) Aun cuando los nombres se codifiquen con valores, las categorías de datos no siguen un orden lógico. 3.2.- Medidas en Escala Ordinal: Escala no numérica de nombres o clasificaciones que se utilizan para presentar los datos en categorías distintas y separadas pero siguiendo un orden significativo. Ejemplo:
Orden Fuente Millones de Barriles Diarios
Porcentajes
Primero Segundo Tercero Cuarto Quinto
OPEP OCDE (Inc. a USA) Otra Rusia China
32,91 22,76 12,35 11,33 3,62 82,97
39,7 27,4 14,8 13,7 4,4
100,0
TABLA.- Suministro mundial de petróleo para 2004
En esta tabla ya se observa un orden de acuerdo a los volúmenes de barriles de petróleo suministrado por países o grupo de países.
Propiedades: a) Las clasificaciones de los datos se encuentran representados por conjuntos de nombres (Sobresaliente, Bueno, Regular, Malo), las cuales representan valores relativos y b) Estos valores relativos permiten la clasificación atendiendo a un orden lógico. Para definir las medidas en escalas de intervalo debe conocerse las propiedades siguientes: a) de la MUTUA EXCLUSION: propiedad de un grupo o conjunto de categorías por la cual un individuo, objeto o medición se incluye en una sola categoría y b) del EXHAUSTIVO COLECTIVO: propiedad de un grupo o conjunto de categorías
7
según la cual cada uno de los individuos, objetos o mediciones deben integrarse por lo menos a una de las categorías. 4.1 Medidas en Escala de Intervalo: Son escalas numéricas donde el valor cero se
toma de manera arbitraria, siendo significativa la diferencia entre sus valores. Asume todas las características del nivel ordinal. Ejemplo: Las escalas de temperaturas, en las cuales el cero no significa que no haya calor o frío, la mejor manera de observar este hecho es que ninguna de las escalas de temperaturas existentes coinciden en el cero. La escala de Tiempo entre las diferente eras y edades de nuestro momentos históricos, el cero de la era actual no significa que en ese momento no haya habido hechos históricos. Propiedades: a) Las clasificaciones de datos se ordenan en correspondencia con el grado que posea de la característica en estudio y b) Diferencias iguales en la característica representa diferencias iguales en las mediciones.
4.2 Medidas en Escala de Razón: Son escalas numéricas, que a diferencia de la escala de intervalo el valor cero será fijo y tiene significado. Asume todas las características del nivel de intervalo. Ejemplo: El dinero, si tiene tantos bolívares, tienes dinero; si tiene cero bolívares entonces no tienes dinero. Si se compra cero gramos de un producto entonces no se tiene el producto Propiedades: a) Las clasificaciones de datos se ordenan de acuerdo de acuerdo a la cantidad de característica que posee, b) Diferencia iguales en la característica representa diferencias iguales a los números asignados en las clasificaciones y c) El punto cero representa la ausencia de características y la razón entre dos números es significativa. Ejercicios Resueltos
Ejercicio 01.- Tomando una información hipotética de las cinco ciudades de las más importantes de Venezuela sobre las condiciones y estilo de vidas, cuyos hipotéticos datos se presentan a continuación:
Ciudad Población
(En
Millones)
Ingreso Medio
por Familia
(Miles de
bolívares)
Mejor negocio
hotelero
Atracción más
visitada
Tasa de
criminalidad
por cada
100.000
Caracas 3,8 9,2 Hotel Tamanaco Galipán 492,67
Maracaibo 1,8 8,9 Hotel Ciruma Sinamaíca 152,32
Valencia 1,3 10,2 Hotel Intercontinental El Acuario 90,10
Barquisimeto 0,9 5,4 Hotel La hostería Quíbor-Titorero 85,6
Maracay 0,8 7,7 Hotel Pipo Bahía de Cata 81,4
Responder: a) Identificar las variables cualitativas y cuantitativas, b) ¿Cuáles son las Discretas y cuáles las continuas?, c) Identificar cada variable como nominal, ordinal, o de razón y d) ¿Cuáles son descriptivas y cuales son inferenciales? Respuestas: a) Cualitativas: ciudad, mejor negocio hotelero y atracción más visitada; y Cuantitativas: Población, Ingreso Medio por Familia y tasa de criminalidad; b) Discretas: Población; y Continuas: Ingreso Medio por Familia y Tasa de Criminalidad; c) Nominal: ciudad; Ordinal: Mejor Negocio Hotelero y Atracción más Visitada; o De Razón: Población, Ingreso Medio por Familia y Tasa de Criminalidad; y d) Descriptivas: Ciudad, Población, Mejor Negocio Hotelero y Atracción más Visitada; e Inferenciales: Ingreso medio por Familia y Tasa de Criminalidad.
8
Ejercicio 02.- El Director Gerente de una institución benéfica desea tomar una muestra de las opiniones de 86 de sus miembros respecto a las actividades a realizar en las próximas fechas navideñas. Responder: a) ¿Cuál es la población? Y b) ¿Cuál es la mejor forma como debe tomarse la muestra? Respuestas: a) La población la constituye todos los integrantes de la institución benéfica y b) La mejor forma de tomarla muestra es a través de una selección aleatoria, usando cualquiera de los métodos establecidos para la investigación. Ejercicio 03.- Una comisión tripartita integradas por miembros del sector público, del sector privado y del sector sindical, le encomendó a una empresa que realiza estudios de opinión, para que tomara una muestra de 1.000 de trabajadores para consultarle si estaban de acuerdo con las últimas mejoras salariales. De la muestra 718 se mostraron de acuerdo,
196 mostraron su desacuerdo y el resto 86 manifestaron que le daba lo mismo. Se pregunta: a) ¿Qué podría informar la empresa que realiza estudios de opinión a la comisión tripartita? y b) ¿Es un ejemplo de Estadística Descriptiva o Estadística Inferencial? Explicar. Respuestas: a) La información sería que: el 71,8% están de acuerdo; el 19,6% están en desacuerdo y al 8,6% le era indiferente y b) Es un ejemplo de Estadística Inferencial porque partiendo de una muestra se llegó a una conclusión. Ejercicio 04.- ¿Cuál es el Nivel de Medición o Escala que reflejan los siguientes datos? a) Los pesos en kilogramos de 20 bultos de libros que llegaron a los depósitos de un puerto del país son;
102 116 123 104 102 110 110 115 110 102 104 116 110 102 110 112 122 118 110 102
y b) En una encuesta realizada a 120 trabajadores que transitaban por el Boulevard de Sabana Grande sobre el lugar donde trabajaban, 48 manifestaron que trabajaban en Sabana Grande, 32 en Chacaíto, 26 en Chacao, 11 en Altamira y 3 en Los Cortijos de Lourdes. Respuestas: a) El peso de los bultos es una variable de razón, ya que si el bulto pesa cero kilogramos es porque no ha libro, y si comparamos un bulto que pesa 116 kilogramos contra uno que pesa 104 kilogramos, observamos que le lleva 12 kilogramos, b) Es una escala nominal porque se es indiferente la ordenación de los lugares. Ejercicio 05.- En la lista de variables de variables que se dan a anexa, decir a qué tipo de variables corresponden: a) Salario, b) Género c) Volúmenes de ventas de textos de estudio, d) Preferencia por los tipos de cervezas, e) Temperatura, f) Lugar que ocupa un estudiante en
clase, g) Cantidad de computadoras domésticas, h) Calificaciones de un profesor de Estadística e i) Resultados de un cuestionario. Respuestas: a.- Salario (Cuantitativa, Continua y Ordinal). b.- Género (Cualitativa y Discreta), c.- Volúmenes de Ventas de Textos (Cuantitativa, Continua, Ordinal y de Razón), d.- Preferencia por los tipos de cervezas (Cualitativa y Ordinal), e.- Temperatura (Continua y de Intervalo), f.- Lugar que ocupa un estudiante en la clase (Cuantitativa, Ordinal y Discreta), g.-
Cantidad de Computadoras Domésticas (Cuantitativa, Discreta y Ordinal), h.- Calificaciones de un profesor de Estadística (Cuantitativa, Discreta y ordinal) e i.- Resultados de un cuestionario (Cuantitativa, Discreta y de Razón)
9
Capítulo 02
DISTRIBUCION DE FRECUENCIA TABLAS Y GRAFICAS ESTADISTICAS
1. Distribución de Frecuencia: Son tablas estadísticas donde se presentan los datos organizado en categorías mutuamente excluyente (clases o los datos como tal) mostrando el número de observaciones de cada una de las categorías. Las categorías son las clasificaciones ordenadas en orden creciente o decreciente
mediante la cual presentamos los datos en una Tabla Estadística. Las categorías pueden ser presentadas mediante los datos como tal o datos sueltos en datos no agrupados y mediante clases o intervalo de clases en datos agrupados. Cuando estudiamos una distribución de frecuencia de datos no agrupados o sueltos (Máximo 10 datos; convenio) haremos su graficación a través de barras o representación dentro de un circulo o diagrama de torta o pastel. Cuando la distribución de frecuencia sea de datos agrupados (más de 10 datos, se agrupan; convenio) haremos su graficación a través de histograma, polígonos de frecuencia y ojiva.
2. Pasos a seguir para desarrollar o crear una distribución de frecuencia (se ordenan los datos en orden creciente o decreciente según sea el caso, por lo general en orden creciente) 2.1. Datos no agrupados o sueltos
PRIMERO: Determinar la frecuencia absoluta (fi) de cada dato, siendo ésta el número de veces que se repite un dato, o es el número de observaciones que de él se tiene. SEGUNDO: Determinar la frecuencia absoluta acumulada (Fi) de cada dato. Esta frecuencia se obtiene partiendo de la primera frecuencia absoluta y luego acumulando de manera sucesiva el resto de las frecuencias una a una. TERCERO: Determinar la frecuencia relativa (hi) de cada dato. Se obtiene dividiendo la frecuencia absoluta de cada dato entre el número total de las observaciones de la serie de datos o la suma de las frecuencias absolutas.
CUARTO: Determinar la frecuencia relativa acumulada (Hi) de cada dato. Esta frecuencia se obtiene partiendo de la primera frecuencia relativa y luego acumulando de manera sucesiva el resto de las frecuencias relativas una a una.
2.2. Datos agrupados
PRIMERO: Determinar el rango (R) de la serie de datos R= DM – Dm + 1 DM=Dato mayor; Dm: Dato menor
10
SEGUNDO: Determinar el número de intervalos de clases o clase (NIC) 1) Método Empírico: Lo determina la experiencia del profesional que
realiza el estudio.
2) Método del Exponencial 2
;
3) Método de Sturges
N= Tamaño de la población n= Tamaño de la muestra
Si al obtener el resultado en el método exponencial dos le sumamos la unidad estamos coincidiendo plenamente con el Método de Sturges.
TERCERO: Determinar la amplitud del intervalo de clase (IC)
; IC es un valor constante
CUARTO: Definir los intervalos de clase o clase.
Cada intervalo de clase tendrá límites inferiores y superiores siendo estos aparentes y reales. Aparentes cuando el límite superior de un intervalo no es igual al límite inferior del intervalo siguiente y así sucesivamente. Reales cuando el límite superior de un intervalo es igual al límite inferior del intervalo siguiente y así sucesivamente. Con el método empírico se pueden establecer directamente los límites reales, mientras que con los restantes métodos (Exponencial 2 y Sturges) obtenemos límites aparentes (convenimiento). Cuando desarrollamos el Método de Sturges o el Método Exponencial 2, lo más importante es lograr el primer intervalo de clase o primera clase. Algunos estudiosos de la estadística lo logran haciendo coincidir el primer dato de la serie con el límite aparente inferior del primer intervalo y luego define el resto de los mismos. A veces no todos los datos quedan contenidos en la Distribución de Frecuencias que se elabora. Una manera de evitar este inconveniente se logra tomando la amplitud del intervalo de clase y dividiéndolo en dos partes de valores enteros, si es par en dos partes iguales y se le resta al primer dato y ese será el límite aparente inferior del primer intervalo. Si es impar se hace lo mismo pero habrá un
entero menor que el otro, se toma el menor y se le resta al primer dato, sino resulta se le resta el mayor. De no resultar la utilización de valores medios mediante esta metodología se asumen valores pero que no pasen del tamaño o amplitud del intervalo de clase o clase. VER DESARROLLO DE UN EJERCICIO EN LA SOLUCIÓN DE ALGUN PROBLEMA.
QUINTO: Determinar la marca de clase (Xmi) de cada intervalo de clase o clase.
11
La marca de clase se obtiene a través de la semi suma de cualquiera de los tipos de los límites reales o aparentes de un intervalo de clase.
Xs= Límite aparente superior XI = Límite aparente inferior Ls = Límite real superior LI = Límite real inferior
SEXTO: Determinar la frecuencia absoluta de cada intervalo de clase o clase. Se obtiene para cada intervalo de clase o clase sumando las frecuencias absolutas de los datos contenidos en cada intervalo de clase o clase definida.
SEPTIMO: El resto de las frecuencias (Fi, hi, Hi) se obtienen siguiendo el patrón observado para los datos no agrupados.
3. Propiedades de las frecuencias: 3.1. Las frecuencias absolutas siempre son valores enteros. 3.2. La suma de las frecuencias absolutas son igual a N (tamaño de la población) o n
(tamaño de la muestra) 3.3. Las frecuencia relativas son siempre valores fraccionarios o decimales es decir
0 <hi < 1 3.4. La suma de las frecuencias relativas es igual a 1. 3.5. La última frecuencia absolutas acumuladas de una serie de datos previamente
ordenados, es igual a N (tamaño de la población) n (tamaño de la muestra). 3.6. La última frecuencia relativa acumulada de una serie de datos previamente
ordenados, es igual a 1.
4. Tablas o cuadros estadísticos Las tablas o cuadros estadísticos corresponden a arreglos sistematizados de los datos en órdenes crecientes o decrecientes mediante filas y columnas. El desarrollo o la creación de una distribución cualquiera, se presentan a través de cuadros o tablas.
5. Graficas estadísticas: Son figuras que se pueden originar de los cuadros o tablas estadísticas y que sirven para visualizar mejor la información.
5.1. Diagrama de Barras: Gráfica en las cuales las marcas de clases se llevan al eje
horizontal y las frecuencias de cada clase (Preferentemente las frecuencias absolutas) al eje vertical, las cuales serán las alturas de las barras las que se dibujaran cada una separadas de las otras.
5.2. Histograma: Gráfica en las cuales las marcas de clases se llevan al eje horizontal y las frecuencias de cada clase al eje vertical, las cuales serán las alturas de rectángulos los cuales se graficarán cada uno colindante al otro. Los puntos colindantes son los límites reales de la distribución de datos agrupados, el ancho del rectángulo corresponde a la dimensión de cada Intervalo de Clase o Clase, y cuando el tamaño de estas dimensiones son constante el ancho de los rectángulos son iguales.
12
5.3. Polígono de Frecuencia: Es una gráfica formada por segmentos de líneas que partiendo del límite real inferior del primer intervalo de clase o clase va conectando los puntos formados por las intersecciones de las líneas verticales apoyadas en cada marca de clase (eje horizontal) con las líneas horizontales salidas de las frecuencias absolutas de cada intervalo de clase o clase (eje vertical), concluyendo en el límite real superior del último intervalo de clase o clase.
5.4. Polígono de Frecuencia Acumulada u Ojiva: Es una gráfica formada por segmentos de línea que conectan los puntos formados por las intersecciones de las líneas verticales apoyadas en cada marca de clase y las líneas horizontales salidas de las frecuencias acumuladas de cada intervalo de clase o clase.
5.5. Diagrama de Torta o Pastel: Es una gráfica circular donde el círculo queda repartido en parte cuyo tamaño lo define la magnitud de la frecuencia relativa expresada en tanto por ciento.
Para establecer cada parte se realiza: =360 hi; y ese valor se lleva a la parte interna
del círculo usando un transportador si la gráfica se va a realizar de manera manual. Estos son los tipos de gráficos estadísticos más usado, pero hay otros que de acuerdo al estudio realizado son recomendables tales como los: Gráficos Logarítmicos, los Gráficos Semi-logarítmicos, los Pictogramas, los Cartogramas, los Cuadrados, los Triángulos, los de Cajas, los de Sectores Circulares, los Polares, los Estereogramas, etc.
Problemas Resueltos Ejercicio Nº 01.- De manera aleatoria se toman la edad de 30 estudiantes del I. U. G. T., las cuales fueron:
21 26 18 20 20 25 26 24 28 21 21 20 23 25 25 20 20 21 21 26 20 23 21 21 18 28 23 24 20 21
Se pide: a) ¿Será muestra o población?, b) la característica asociada a esta distribución, ¿Será un parámetro o un estadístico?, c) Al ordenar estos datos en el orden que sea y construir la respectiva distribución de frecuencias, ¿Qué nivel de medición o escala de medida estamos utilizando?, d) ¿Qué tipo de variable cuantitativa se está utilizando?, e) ¿Cuántos datos y cuántas observaciones presenta esta distribución de frecuencias?, f) Elaborar la respectiva distribución de frecuencias, y determinar; número de categorías, frecuencia absoluta de la segunda categoría, frecuencia absoluta acumulada de la cuarta categoría, frecuencia relativa de la sexta categoría, frecuencia relativa acumulada de la tercera categoría y el rango de la distribución, g) Porcentajes de estudiantes que tienen una edad de 21 años o menos a 21 y porcentajes de estudiantes que tiene una edad mayor a 23
años, y h)Elaborar las gráficas de esta distribución.
Solución a) Es una muestra ya que los 30 estudiantes se están tomando de manera aleatoria de
una población que corresponde a todos los estudiantes inscritos en el I. U. G. T. b) Por ser la característica asociada a esta muestra entonces es un estadístico. c) Se utilizaría una escala de medición Ordinal y de Razón. d) Se podría considerar una Variable Cuantitativa Continua, porque las edades se podría
expresar en partes fraccionales, años, meses y días.
13
e)
Edades Xi
Cantidad fi
X1=18 X2=20 X3=21 X4=23 X5=24 X6=25 X7=26 X8=28
2 7 8 3 2 3 3 2
∑ 30
Presenta 8 datos y 30 observaciones f) Distribución de Frecuencias
Xi fi Fi hi Hi
18 2 2 0,067 0,067
20 7 9 0,233 0,300
21 8 17 0,267 0,567
23 3 20 0,100 0,667
24 2 22 0,067 0,733
25 3 25 0,100 0,833
26 3 28 0,100 0,933
28 2 30 0,067 1,000
∑ 30 1,000
Categorías= 8 f2 = 7
F4 = 20 h6 = 0,100 H3 = 0,567
R = 28-18 +1 = 11 g) Porcentajes
21 17, 30
100 21% 21
100 17% 2
30
%
1
Total de Estudiantes Edades Años Total Estudiantes
x Total de Estudiantes Edades Añosde Estudiantes con Edades Años
Total Estudiantes
xde Est
de Estudiantes con Edades
udiantes de Edades Años
21 56,67%Años
14
23 10, 30
100 21% 23
100 10% 2
30
%
3
Total de Estudiantes Edades Años Total Estudiantes
x Total de Estudiantes Edades Añosde Estudiantes con Edades Años
Total Estudiantes
xde Es
de Estudiantes con Edad
tudiantes con Edades ñ
s
s
e
A o
23 33,33%Años
h) Gráficas
Diagrama de Barras
6,67%
0%
23,33%
26,67%
0%
10,00%
6,67%
10,00%
10,00%
0%
6,67%
1 2 3 4 5 6 7 8 9 10 11
Series1 6,67% 0% 23,33 26,67 0% 10,00 6,67% 10,00 10,00 0% 6,67%
0,00%
5,00%
10,00%
15,00%
20,00%
25,00%
30,00%1
2
3
4
5
6
7
8
9
10
Gráfica de Torta o Pastel
10,00%
6,67%
10,00%
10,00%
6,67%
7%
23%
26%10%
7%
10%
10%
7%
15
Ejercicio 02.- Los siguientes datos corresponden a las ventas (En miles de bolívares) realizados por una comercial que vende materiales de oficinas en un lapso de 30 días.
30 45 19 38 18 27 45 30 31 39 15 28 20 13 22 25 48 32 15 14 33 28 49 45 17 16 42 19 47 19
Con estos datos se pide: a) Elaborar una Distribución de Frecuencias de Datos Agrupados aplicando el Método de Sturges y de ella responder: Rango, Número de Intervalos de Clases o Clases, la Amplitud de cada Clase, Límite Aparente Inferior de la Segunda Clase y Límite Aparente Superior de la Tercera Clase, Límite Real Inferior de la Quinta Clase y Límite Real Superior de la Segunda Clase, y Marca de Clase de la Cuarta Clase y b) Elaborar gráficas.
Solución
a) Distribución de Frecuencias de Datos Agrupados. Ordenación de los datos en orden creciente y estableciendo sus Frecuencias Absolutas
Datos fi Datos fi 13 14 15 16 17 18 19 20 22 25 27 28
1 1 2 1 1 1 3 1 1 1 1 2
30 31 32 33 38 39 42 45 47 48 49
2 1 1 1 1 1 1 3 1 1 1
∑ 16 ∑ 14
Aplicando el Método de Sturges.
: 1 49 13 1
( º ) 1 3,322log 1 3,322log30 5,
37
6
7
907
37( ) 6,264
5,907
M m R
NI
Rango R D D
NIC N de Intervalos deClases n
RIC Amplitud del Intervalo deCla
C
sesNIC
IC
Para inicial el Primer Intervalo se toma el IC=7 y se divide en dos partes enteras 3 y 4,
primero se toma el menor de estos dos valores y se le resta al dato menor entonces sería 13-3=10.
16
NIC XI XS LI LS Xmi fi Fi hi Hi
1 10 16 09,5 16,5 13 5 5 0,167 0,167
2 17 23 16,5 23,5 20 7 12 0,233 0,400
3 24 30 23,5 30,5 27 6 18 0,200 0,600
4 31 37 30,5 37,5 34 3 21 0,100 0,700
5 38 44 37,5 44,5 41 3 24 0,100 0,800
6 45 51 44,5 51,5 48 6 30 0,200 1,000
∑ 30 1,000 Rango: R = 37; NIC = 6; IC = 7; XI2 = 17, XS3 = 30; LI5 = 30,5; LS2 = 23,5; Xm4 = 34
b) Gráficas
Histograma
0 5
0 7
0 6
0 3
0 3
0 6
0
1
2
3
4
5
6
7
8
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
1 2 3 4 5 6
Series1
Series2
Polígono de Frecuencias
17
0
5
7
6
3
3
6
0
(9,5; 0)
(13; 5)
(20; 7)
(27; 6)
(34; 3) (41; 3)
(48; 6)
(51,5; 0)
0
2
4
6
8
10
12
14
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Ojiva
0 5
0 12
0 18
0 21
0 24
0 30
(13;5)
(20;12)
(27;18)
(34;21)
(41;24)
(48;30)
0
5
10
15
20
25
30
35
1 2 3 4 5 6
Problemas Propuesto del Título I Problema 01.- Se toma dentro de un colegio un grupo de 25 alumnos cuya edad esté comprendida entre
los 7 y 12 años para darle un juguete como regalo de navidad. La selección se hizo por un sorteo quedando los siguientes alumnos según sus edades: 9-7-12-10-9-8-7-7-11-10-9-8-9-7-8-10-12-11-11-8-7-9-10-11-12.
Se pide: a) ¿Será muestra o población?, b) la característica asociada a esta distribución, ¿Será un parámetro
o un estadístico?, c) Al ordenar estos datos en el orden que sea y construir la respectiva distribución de
frecuencias, ¿Qué nivel de medición o escala de medida estamos utilizando?, d) ¿Qué tipo de variable
cuantitativa se está utilizando?, e) ¿Cuántos datos y cuántas observaciones presenta esta distribución de
frecuencias?, f) Elaborar la respectiva distribución de frecuencias, y determinar; número de categorías, frecuencia absoluta de la segunda categoría, frecuencia absoluta acumulada de la cuarta categoría,
frecuencia relativa de la sexta categoría, frecuencia relativa acumulada de la tercera categoría y el rango de
la distribución y g) Elaborar las gráficas de esta distribución.
Problema 02.- En cada enunciado que se presenta a continuación, determinar, tipo de variable
cuantitativa: a) El sueldo de un presidente de la república está por el orden de Bs. 12.000,00, _________________;b) Un estudiante de estadística hace un estudio sobre el promedio general de las notas de
18
los estudiantes del I.U.G.T. y con siguió que éste fue de 12,8 puntos,_______________; c) En una encuesta
realizada entre 500 personas adultas se encontró que el 42% de ellos tienen armas de fuego,_______________
y d) Se probaron 50 aparatos de televisión y 4 de ellos presentaron defectos,_______________. Problema 03.- Determinar si el valor dado es un parámetro o un estadístico: a) La Asamblea Nacional
consta de 165 diputados, ________; b) Se selecciona un grupo de estudiantes y el número promedio de textos
comprados por ellos este período es de 3,8; c) El número de miembros promedio de una familia venezolana
es de 5 y d) En un estudio realizado se constató que de los 2223 pasajeros del Titanic solamente
sobrevivieron 706.
Problema 04.- Al final se presentan cinco (5) Distribuciones; señalar los tipos de variables contenida en cada una, bien sea Cuantitativa o Cualitativa: a) Distribución de alumnos por mes de nacimiento,__________;
b) Distribución de profesionales por estatura y peso,__________; c) Distribución de comerciantes por
nacionalidad,__________ d) Distribución de obreros por salarios,__________ y e) Distribución de accidentes
por causa___________.
Problema 05.- Al final se presentan cinco (5) Distribuciones, señalar que tipo de variable cuantitativa representan: a) Distribución de empleados por sueldos,__________; b) Distribución de fallecimientos por
edades,__________; c) Distribución de alumnos por número de hermanos,__________; d) Distribución de
alumnos por estatura,__________ y e) Distribución de gallinas por posturas de huevos__________.
Problema 06.- Los directivos de una fábrica de refresco están pensando lanzar al mercado un nuevo
producto. Realizada una encuesta a objeto de medir la aceptación del producto, en una muestra de 30 niños
y utilizando una escala de 0 a 10 puntos para medir el grado de aceptación; este fue el resultado obtenido:2-6-8-7-4-5-10-6-6-7-6-7-3-8-7-6-8-6-5-4-7-8-5-7-6-7-2-7-2-7. La muestra tomó 15 niñas y 15 niños, con
edades comprendidas entre los 5 y 12 años de edad, residentes en un barrio de la ciudad de Caracas. Se
pide: a) Estructurar una tabla de Distribución de Frecuencias, b) Definir, ¿Cuál es la población y cuál es la
muestra?, c) ¿Qué variables se utilizaron?, d) ¿Cuál es la variable?, e) ¿De qué tipo es la variable?, f) ¿Qué
tipo de escala se ha utilizado en la medición de la variable?, g) ¿Cuál es la Frecuencia Absoluta de la cuarta clase o categoría?, h) ¿Cuál es la Frecuencia Relativa de la segunda clase o categoría?, i) ¿Cuál es la
Frecuencia Absoluta Acumulada de la sexta clase o categoría?, j) ¿Cuál es la Frecuencia Relativa Acumulada
de la quinta clase o categoría? Y k) Elaborar la respectiva gráfica de barras y de torta o pastel.
Problema 07.- Leer el siguiente texto: “Una vez recolectados los datos en forma ordenada, es
necesario en forma tal que se facilite su comprensión y su posterior análisis y utilizaciones. Para
ello se ordenan en cuadro numéricos y luego se representan en gráficos, para variable discreta mediante diagramas de frecuencias tanto para absolutas ó relativas”. Se pide: a) Considerando a rr y
ll como letra única, formar una tabla de Distribución de Frecuencias de Datos Agrupados en Clases ó
Intervalos de Clases, tomando como base el número el número de letras que forma cada palabra, b)
Elaborar; Histograma y Polígono de Frecuencias y Ojiva.
Problema 08.- (Modelo para datos sueltos).- Un grupo de productores de maíz del Estado Guárico entrega su producción en toneladas, a una planta receptora del producto, y 20 de ellos entregaron el siguiente
tonelaje: 29 24 35 42 25 24 29 27 27 38 44 25 40 42 42 32 35 32 44 32. Se pide: a) Elaborar una tabla de distribución de frecuencias señalando; frecuencia absoluta de la quinta
categoría, frecuencia absoluta acumulada de la octava categoría , la frecuencia relativa de novena categoría
y la frecuencia relativa acumulada para la cuarta categoría. b) Calcular el porcentaje de productores que
entregaron menos de 29 toneladas, el porcentaje de los productores que entregaron 32 o más toneladas y el porcentaje de los productores que entregaron entre 27 y 35 toneladas y c) Elaborar gráficas (Barras y Torta).
Problema 09.- (Modelo para datos agrupados).-Dentro de los televidentes del país se seleccionaron 50 que
ven R.C.T.V. entre personas mayores de 18 años, a las cuales se le consultaron sus edades;
49 26 33 25 19 48 19 52 48 38
38 34 25 21 38 40 40 46 38 20 36 22 38 25 42 19 38 20 23 33
41 20 24 38 41 36 28 34 40 51
21 33 25 24 20 23 20 38 28 31.
Se pide: a) Elaborar la tabla estadística para La Distribución de Frecuencias, b) Señalar; Número de
Intervalos de Clase o Clases, amplitud o tamaño de cada Clase, Frecuencia Absoluta de la tercera Clase,
Frecuencia Absoluta Acumulada de la cuarta clase, Frecuencia Relativa de la segunda Clase, Frecuencia Relativa Acumulada de la quinta Clase, Límite Aparente Inferior de la sexta Clase, Límite Aparente Superior
de la tercera Clase, Límite Real Inferior de la segunda Clase, Límite Real Superior de cuarta Clase y la Marca
19
de Clase de la tercera Clase, c) Calcular un aproximado del número de personas que tienen menos de 28
años y el porcentaje de personas que tienen 36 o más años y d) Elaborar gráficas (Histograma, Polígono de
Frecuencias y Ojiva). Problema 10.- Se seleccionaron 30 estudiantes del I.U.G.T. de acuerdo a sus edades y luego de realizados
los cálculos, se presentaron las Marcas de Clases con sus respectivas Frecuencias Absolutas:
Xmi 18 22 26 30 34
fi 6 7 10 5 2
Se pide: a) Desarrollar la Distribución de Frecuencias y señalar; Número de Intervalos de Clase, amplitud de
los Intervalos de Clases, Límite Aparente Inferior de la cuarta Clase, Límite Real Superior de la tercera Clase, Frecuencia Absoluta Acumulada de la segunda Clase y Frecuencia Relativa de la quinta Clase, b)
Elaborar gráficas, Histograma, Polígono de Frecuencias y Ojiva.
Problema 11.- El cuadro anexo al finalizar nos presenta la clasificación de un grupo de niños por estatura.
Se pide: a) Elaborar el cuadro completo de la distribución de frecuencias y determinar de ella; frecuencia
absoluta de la tercera clase, frecuencia absoluta acumulada de la cuarta clase, frecuencia relativa de la segunda clase, frecuencia relativa acumulada de la quinta clase, límite real inferior de la segunda, límite
real superior de la quinta clase y la marca de clase de la sexta clase y b) Elaborar las respectivas gráficas.
Problema 12.- Un profesor de Estadística General para instruir a sus alumnos sobre todo lo referente a la
Distribución de Frecuencias en cuanto a Datos Sueltos o No Agrupado en Intervalos de Clase, tomó las
notas de un trabajo previo al primer examen parcial las cuales fueron: 16 08 14 10 07 11 11 14 10 11
14 13 12 11 10 08 13 12 07 12. Se pide: a) Tabla de Distribución de Frecuencias y b) Elaborar gráficas de Barras y Pastel o Torta.
Problema 13.- Se da una clasificación (extraídas del último censo) de mujeres de 50 a 54 años de edad
según el número de hijos vivos:
Se pide: a) El estudio será sobre una población o una muestra, sobre qué sector se realiza el estudio sobre la
s mujeres o los niños, b) Completar la tabla de distribución de frecuencias y c) Elaborar las gráficas
respectivas.
Problema 14.- Tomadas las edades de los estudiantes del curso diurno del I.U.G.T. de Estadística
Instrumental de las carreras Recursos Humanos y Mercadeo y Publicidad, con las cuales se elaboró una distribución de frecuencias, la cual se muestra a continuación definida por sus frecuencias absolutas y
marcas de clases:
fi 5 7 10 16 10 7 5
Xmi 13 18 23 28 33 38 43
Problema 15.- A continuación se presenta número de obreros que laboran en 40 empresas de
construcción que contratan con el sector público:
53 58 63 56 53 62 95 98 83 97
56 59 64 71 84 96 102 57 76 69 57 85 93 83 68 72 79 81 80 56
Estatura
(centímetros)
Número de
niños
De 85 a 90
De 90 a 95 De 95 a100
De 100 a 105
De 105 a 110
De 110 a115
3
15 22
18
12
5
Número de hijos 0 1 2 3 4
Número de mujeres (%) 19 25 23 14 9
20
61 80 70 77 80 63 60 59 78 74
Se pide: a) Desarrollar la Distribución de Frecuencias y señalar; Número de Intervalos de Clase, amplitud de
los Intervalos de Clases, Límite Aparente Inferior de la cuarta Clase, Límite Real Superior de la tercera Clase, Frecuencia Absoluta Acumulada de la segunda Clase y Frecuencia Relativa de la sexta Clase y b)
Elaborar gráficas (Histograma, Polígono de Frecuencias y Ojiva.
Problema 16.- Un productor de cítricos hizo 60 entregas de sacos de naranjas californias en el Mercado al
por Mayor de Coche, relación de entregas que se presenta a continuación, sacos entregados:
67 56 52 56 73 79 64 72 72 58 73 69 54 67 51
59 58 59 76 66 79 57 69 64 69 60 68 63 74 67 63 61 74 67 70 63 71 64 75 71 67 59 76 67 71
64 72 67 57 58 58 68 73 58 74 72 60 59 69 60
Se pide: a) Desarrollar la Distribución de Frecuencias y señalar; Número de Intervalos de Clase, amplitud de
los Intervalos de Clases, Límite Aparente Inferior de la tercera Clase, Límite Real Superior de la sexta Clase,
Frecuencia Absoluta Acumulada de la cuarta Clase y Frecuencia Relativa de la segunda Clase y b) Elaborar gráficas (Histograma, Polígono de Frecuencias y Ojiva.
Problema 17.- Un matadero industrial estableció una clasificación de los frigoríficos a los cuales les
suministra sus productos, tomando como referencia el pesaje de los pedidos por mes. Luego de hacer un
estudio estadístico estableció sus Marcas de Clase con sus respectivas Frecuencias Absolutas:
Kilogramos despachados (Xmi): 216,5 256,5 296,5 336,5 376,5 416,5
Frigoríficos receptores del producto (fi) 10 15 30 25 15 05 Se pide: a) Desarrollar la Distribución de Frecuencias y señalar; Número de Intervalos de Clase, amplitud de
los Intervalos de Clases, Límite Aparente Inferior de la cuarta Clase, Límite Real Superior de la tercera
Clase, Frecuencia Absoluta Acumulada de la segunda Clase y Frecuencia Relativa de la quinta Clase y b)
Elaborar gráficas (Histograma, Polígono de Frecuencias y Ojiva.
21
TÍTULO II Capítulo 03
MEDIDAS ESTADISTICAS
Medidas de Tendencia Central Medidas Estadísticas.- Son valores obtenidos mediante metodologías de cálculos según sea el caso, que nos permite describir el comportamiento de un hecho o de un conjunto de observaciones. Las Medidas de Tendencia Central.- Son medidas estadísticas cuyos valores son promedios que se ubican hacia el centro del rango de una serie de datos previamente ordenados.
Medidas de tendencia central
1. Media Aritmética: Es una medida de tendencia central que resulta de promediar los
valores de los datos de una distribución o serie de datos; y se obtiene dividendo la suma total de los valores de los datos entre el número de observaciones que se tienen de los mismos. Es el promedio más usual, el más conocido, y el de uno de los manejos más fáciles para su cálculo.
Conjunto Tipo de Datos
POBLACION
MUESTRA
Datos No Agrupados, Sueltos o Sencillos
Datos Agrupados, Por Intervalos de Clases o Clases
Media Ponderada
Desvíos o desviaciones: Son diferencias que se presentan entre los valores de los datos y un valor fijo establecido, generalmente la media aritmética o en todo caso un valor de origen del trabajo.
1.1.1 Propiedades de la media aritmética
22
a) Todos los valores de una serie de datos participan en el cálculo de la media aritmética, la cual es única.
b) La suma de las desviaciones del valor de la cada dato respecto de la media aritmética, siempre será cero (0).
c) Si realizamos una partición en dos o más sub-muestras de una serie de datos, el valor de la media aritmética de la serie de datos será igual a la suma de las medias aritméticas ponderadas de todas las sub-muestras de la partición efectuada.
d) Si a todos los valores de los datos de la suma de datos se le suma o resta un número constante o mismo número, la media aritmética queda aumentada o disminuidas en ese mismo número.
e) Si a todos los valores de los datos de una serie de datos se le multiplica o divide por un número constante o mismo número, la media aritmética queda multiplicada o dividida por ese mismo número.
1.1.2 Desventajas de la media aritmética a) Los valores de datos extremos influyen de manera importante en el valor
de la media aritmética, distorsionándola. b) No se puede calcular en serie de datos ordenados cuyos extremos se
consideren abiertos. c) Es muy sensible a los cambios que se haga en alguno de sus valores.
1.2 Media Geométrica: Es una medida de tendencia central que resulta de promediar
fundamentalmente datos que responda a crecimientos geométricos, como tasas porcentuales, razones y tasa o índices de crecimientos. 1.2.1 Propiedades de la media geométrica.
a. En su cálculo intervienen todos los datos de la serie de datos y es única. b. El valor de la media geométrica siempre es menor que él de la media
aritmética.
1.2.2 Ventajas de la media geométrica. a) Se define rígidamente por una fórmula matemática. b) Cuando los valores ordenados de los datos responden a un crecimiento
geométrico se recomienda el uso de la media geométrica. c) Es utilizable cuando se requiere dar importancia a valores pequeños de la
variable d) Su valor es poco influenciable por los datos extremos, no siendo así con
los otros promedios conocidos. e) Su resultado puede utilizarse en trabajos estadísticos posteriores, puesto
que los promedios geométricos de varias muestras se pueden combinar para obtener el promedio global de las muestras.
1.2.3 Desventajas de la Media Geométrica.
a) La complicación para su cálculo b) Cuando en una serie de datos existe un valor nulo (0) ó negativo, la media
geométrica no se calcula; ya que no responde a la realidad de la serie datos, la cual tiene que dar algún valor promedio real positivo.
23
c) En una serie de datos los valores extremos distorsionan la media geométrica en menor cuantía que la media aritmética.
d) Es sensible a cualquier cambio en alguno de los valores de la distribución.
1.2.4 Fórmulas para su cálculo
G= 1
1 2n
nG X X X
G= 1 2
1
1 2nff f n
nG X X X
Aplicando logaritmo
Para cualquier caso: G=
Problemas Resueltos
Problema Nº 01.- De manera aleatoria se toman la edad de 30 estudiantes del I. U. G. T., las cuales fueron: Se pide: comprobar que la Media Aritmética es mayor que la Media Geométrica
Solución
Edades
Xi
Cantidad
fi
21 26 18 20 20 25 26 24 28 21 21 20 23 25 25 20 20 21 21 26 20 23 21 21 18 28 23 24 20 21
24
X1=18
X2=20 X3=21 X4=23 X5=24 X6=25 X7=26 X8=28
2
7 8 3 2 3 3 2
∑ 30
Presenta 8 datos y 30 observaciones De la Distribución de Frecuencias
Xi fi Xifi
18 2 36
20 7 140
21 8 168
23 3 69
24 2 48
25 3 75
26 3 78
28 2 56
∑ 30 670
Por ser una muestra ya que se seleccionaron 30 estudiantes de los que conforman la población estudiantil del I. U. G. T., para la Media Aritmética:
67022,33
33
0
i iX fX X
nX
Media Geométrica:
1 2
1 12 7 8 3 2 3 3 2 30
1 2 18 20 21 23 24 2 25 2,17226 28nff f nnG X X X G x x x x x Gx x
Problema N° 02.- El Director Ejecutivo de una empresa de transporte aéreo desea determinar la tasa de crecimiento promedio que se refleja en tabla anexa. Si la tasa de crecimiento promedio es menor que el promedio industrial del 10%, se asumirá una nueva campaña publicitaria. Se pide: a) Razonar, ¿Por qué es más conveniente utilizar el promedio geométrico y no el aritmético para realizar este estudio? Demostrarlo, y b) ¿Será necesaria realizar esa campaña
publicitaria?
Ingresos del Transporte Aéreo
Año Ingresos en Bolívares
1992 500.000
1993 550.000
1994 660.000
25
1995 600.000
1996 780.000
Solución
a) Como se ve en el cuadro se presenta los ingresos inter-anuales de la empresa de transporte aéreo, y por ser ingresos inter-anuales se recomienda usar el promedio geométrico, que es una de las aplicaciones naturales de la Media Geométrica.
Año Ingresos en Bolívares Incremento Anual
1992 500.000 -------
1993 550.000 1,100
1994 660.000 1,200
1995 600.000 0,909
1996 780.000 1,300
PrIngreso Año esenteIncremento Anual
Ingreso Año Anterior
Media Geométrica de los Ingresos Anuales: 1 1
4. . 1 . .2 . . 1,1 1,2 0,909 1,11,3 178n
I A n II A AG I I I G x x x G
Media Aritmética de los Ingresos Anuales:
1 2. . . .. .
1,1 11,
,2 0,909
47
1 32
,1n
I I AA I A
I I IX X X
n Hagamos una proyección año por año utilizando tanto el incremento geométrico
como el incremento aritmético.
Año Utilizando Incremento Geométrico Utilizando Incremento Aritmético
1992 500.000,00x1,1178 558.890,00 500.000,00x1,127 563.500,00
1993 558.890,00x1,1178 624.738,42 563.500,00x1,127 635.064,50
1994 624.738,42x1,1178 698.332,61 635.064,50x1,127 715.717,59
1995 698.332,61x1,1178 780.596,19 715.717,59x1,127 806.613,84
1996 780.596,19 806.613,84
De este cuadro se desprende que utilizando el incremento geométrico en la proyección hacia 1996 que fue de 780.596,19; observamos que se acerca con bastante aproximación al ingreso real del año 1996 que fue de 780.000,00; razón por la cual podemos concluir que para este tipo de estudio es más conveniente utilizar la Media Geométrica. b) Si la media de los Crecimientos Geométricos es de 1,1178 eso significa que la tasa de crecimiento industrial de la empresa de transporte aéreo estará por el orden del 11,78%, con lo cual concluimos: “Que la empresa de transporte aéreo no debe asumir una nueva campaña publicitaria por cuanto su tasa de crecimiento industrial de 11,78% es mayor que la del 10,00% crecimiento industrial que sirve de base para tomar la decisión” Problema N° 03.- Inversiones y Construcciones CONANDEL C. A., paga a sus trabajadores que laboran por hora Bs 244,20; Bs 281,20 o Bs 370,00. Hay 42 trabajadores para trabajar por hora; 20 de los cuales recibirán el pago de Bs 244,20; 16 recibirán pago de Bs 281,20 y 6 recibirán el pago de 370,00. ¿Cuál es el pago promedio por hora que se le cancelan a los 42 trabajadores?
Solución
26
Este problema se puede calcular empleando la fórmula de Media Aritmética Ponderada, donde el número de trabajadores cumplen el rol de ponderación y el pago por hora la variable.
20 244,20 16 281,20 6 370,00
20 16 6276,27i i
p p
i
p
X p x x xX X
pX
Problema N° 04.-Para construir una escuela en el poblado capital de una parroquia venezolana, se requiere conocer la posible población escolar para el año 2015. La información que se tiene estima que el 3% del total de la población del país tiene entre los 7 y 12 años inclusive, y además el número de habitantes de ese poblado durante los últimos cinco años y que se muestra en tabla al final. ¿Cuál sería la población escolar estimada de
ese poblado hacia el 2015?
Año 2007 2008 2009 2010 2011
Población (miles de Hs.) 9,821 10,202 10,389 10,501 10,792
Solución
Para un crecimiento poblacional la fórmula sería: Re
. .
AñodeEstimación Añode ferencia
E R C PP P G
Y la de los crecimientos poblacionales: . .Población Año Presente
C PPoblación Año Anterior
Operación 1
10,202. .
9,821C P 2
10,389. .
10,202C P 3
10,501. .
10,389C P
4
10,792. .
10,501C P
C. Poblacional 1,039
1,018 1,011 1,028
1 1
4. . 1 2 3 4 . . . .. . . . . . . . 1,039 1,018 1,011 1,0202 41, 8 C P
NC P C PG C P C P C P C P G x x Gx
2015 2011 4
2015 2011 . . 2015 201510,792 1, 110 .86624C P PP P G P x
Población Escolar para el Año 2015 2015 2015
3 11.866. .
100. . 356P E
xP E
Capítulo 04
MEDIDAS DE POSICION O DE UBICACIÓN
1. Medidas de Posición
Son medidas estadísticas cuyo cómputo se ubican en cualquier lugar del rango originado por los valores de la serie de datos, como la moda o el modo que depende a
27
de la mayor frecuencia absoluta, y otros, los fractiles, determinados a partir de patrones pre-establecidos que responden a valores porcentuales especificados. Modo o Moda (Mo) Medidas de posición Mediana (Md) Cuartiles (Qi) Fractiles Deciles (Di)
Centiles o Percentiles (Pi)
1.1. Modo o Moda: Es el valor del dato que más se repite, es decir el valor del dato que presenta, el mayor número de observaciones o la mayor frecuencia absoluta en el caso de datos sueltos, simples o no agrupados. De acuerdo a este concepto pueden existir series de datos multimodales, ya que puede darse el caso de series de datos con más de un modo, es decir el modo no necesariamente puede ser único. Para datos agrupados se obtiene de una fórmula, donde la mayor frecuencia absoluta define el intervalo donde debe encontrarse el modo. Esta Frecuencia Absoluta, la
conoceremos como Frecuencia Absoluta Modal f
1.1.1. Su cálculo: a) Para serie de datos sueltos o no agrupados, la definición nos da
su valor y b) Para datos agrupados
1
1 2
xI
q ICM L
q q
= Limite real inferior del intervalo de clase o clase donde se ubica la frecuencia
modal.
= –
of = frecuencia modal
= frecuencia anterior a la frecuencia modal
= frecuencia posterior a la frecuencia modal
Propiedad de la Moda o Modo Por depender para su obtención siempre de la mayor frecuencia absoluta tanto en Datos No Agrupados como en Datos Agrupado, su cálculo se hace sencillo Ventajas del Modo o Moda a) Es un concepto de muy fácil manejo para su calculo b) Los valores extremos no la afectan c) Cuando una distribución es muy asimétrica, se observa que el modo es el
dato más representativo de la serie d) Si la diferencia entre el valor del Modo y el valor de la Media Aritmética es muy
significativo, es preferible utilizar el Modo, para el estudio que se realiza.
28
e) En series polimodales, el modo permite dividir la serie con fines de estratificación
f) Algunos profesionales de la estadística consideran a la moda o modo como la mejor medida de posición.
Desventajas del Modo o Moda
a) En una serie de datos agrupados su valor no es muy preciso, por lo tanto no es confiable, y se hace algo complicado su cálculo
b) En una serie de datos agrupados, su valor depende de cómo se estructuren los intervalos de clase o clase.
c) El Modo es muy inestable en el muestreo d) El Modo no puede ser usado en procesos algebraicos posteriores. e) El Modo no es sensible a cambios de valores de la serie de datos, a menos que
esos cambios afecten su propio valor. f) No es recomendable usar el Modo en la variable continua cuando la amplitud
de los intervalos no son constantes. 1.2. Fractiles: Son medidas de posición que se ubican en cualquier parte o lugar del
rango originado por los valores de los datos de la serie, luego de ordenados, y atendiendo a fraccionamiento de este rango con patrones porcentuales pre-establecidos. Si se fracciona en dos partes iguales, el punto medio es la mediana (50%); si es en cuatro partes iguales (Cada uno de 25%), los puntos de cada cuarto es el cuartil; si es en diez partes iguales (Cada 10%); el punto de cada decimo es el decil; y si es en cien partes iguales (Cada 1%), el punto de cada centésimo es el centil o percentil. Estas medidas se utilizan para las series de Datos No Agrupados que presentan muchas categorías, o en Datos Agrupados que presentan muchos intervalos de clases o clases, cuando se quieren obtener promedios en una parte de la serie o en la distribución de esos datos.
1.2.1. Mediana: Es el valor del punto medio de los valores de una serie de datos
previamente ordenados en orden creciente o decreciente. 1.2.1.1. Propiedades de la Mediana:
a) Se ubica en todo el medio de la recta originada por el rango de los valores de la serie de datos y es única.
b) Cuando las desviaciones se toman respecto a la Mediana, la suma de sus valores absolutos toman un valor mínimo.
1.2.1.2. Ventajas de la Mediana
a) Es un concepto fácil de manejar para su cálculo
b) Los valore extremos no influyen para su calculo c) Se puede obtener en series abiertas de datos d) Sustituye a la media aritmética en series abiertas de datos. e) Por ubicarse en la mitad del rango de una serie de datos, se presentan
situaciones en las cuales la es única medida estadística que se puede calcular.
f) A pesar que tiene menos estabilidad en el muestreo que la Media Aritmética, es más estable que otras medidas estadísticas.
1.2.1.3. Desventajas de la Mediana a) No es tan conocida como la Media Aritmética.
29
b) Para obtenerla es requisito indispensable ordenar los datos por lo general en orden creciente, o en orden decreciente según sea el caso.
c) La Mediana obtenida directamente de la totalidad de los datos, no es la misma, si divida la serie de datos en grupos y obtener medianas de esos grupos al buscar por esa vía la Mediana de la serie no es la misma.
d) La Mediana no es sensible a cambios de datos que puedan producirse en la serie de datos.
1.2.2. Calculo de los fractiles.
1.2.2.1. Datos no agrupados o sueltos 1.2.2.1.1. Formula General para obtener el lugar donde se ubica el fractil en
una serie de datos.
Número de observaciones
iP = Percentil deseado.
De esta fórmula general se obtiene el resto de las fórmulas para obtener los lugares de la serie de datos donde se ubican el resto de los fractiles
Lugar del valor del percentil buscado
1.2.2.1.2. Fórmula para obtener el fractil luego de ubicado su lugar en la serie de
dato
.int. .int .int.. .i m M mD p d D D
.int.
.int.
;
;
;
. .
i
m
M
Fractil a calcular
D Dato menor delos valores entrelos cuales seubica la posición del fractil acalcular
D Dato mayor delos valores entrelos cuales seubica la posición del fractil acalcular
p d Parte decimal del valor que seobtuvo al obtener la posición dela serie de datos donde
seubica el fractil a calcular
1.2.2.2. Datos agrupados
30
1.2.2.2.1. Fórmulas para obtener los fractiles de manera directa en Datos Agrupados
100i i aa
i
IC iNPercentiles P L F
f
10i i aa
i
IC iNDeciles D L F
f
4i i aa
i
IC iNCuartiles Q L F
f
2D i aa
i
IC NMediana M L F
f
= Frecuencia absoluta acumulada anterior
= índice del fractil a calcular.
1.2.2.2.2. Fórmulas para obtener el porcentaje de cualquier número de observaciones que sean menores o mayores que cualquier dato ubicado en algún intervalo de la distribución.
100% .
% . 100 % .
iaa I
fdeobs D F D L
IC N
deobs D deobs D
D Datoque setomacomoreferencia paracalcular el porcentaje
Problemas Resueltos Problema 01.- De manera aleatoria se seleccionan las notas de 7 estudiantes de Estadística Instrumental del I. U. G. T., las cuales resultaron ser: 12 10 09 10 15 11 08 Se pide obtener: la Media Aritmética, la Media Geométrica, el Modo o Moda, la Mediana, el tercer Cuartil, sexto Decil y el Percentil 43. Número de datos Impares
12 7
8 9 2 10 11 12 15:
710,714
10: 8 9 10 11 12 15 ,510
xMedia Aritmética X
Media Geométrica G x x x x Gx
X
Para obtener el resto de la Medidas Estadísticas que son de posición lo primero que hacemos es ordenar los datos generalmente en orden creciente salvo que se diga lo contrario y se le asigna el respectivo lugar en la serie.
01 02 03 04 05 06 07 08 09 10 10 11 12 14
31
3
43
6
3
6 6
:
7 1: 4
2
3 7 13: 6
4
10
10 4
12 6
103 7 1
6: 4,8 10 0,8 11 1 ,805
4343:
o
DD
M El dato que más se repite
M Dato queocupa el lugar dela serie
Q Da
Modo
Mediana L M
Cuartil L to queocupa el lugaQ
Decil L D D
Percentil L P
r dela serie
D
43 43
7 13,44 10 0,44 10 10
10010PP
Si agregamos un nuevo dato, supongamos 16, entonces el número de datos serán impares
12 8
8 9 2 10 11 111,380
11
2 15
,0
16:
8
: 8 9 10 11 12 15 616 8
xMedia Aritmética X
Media Geométri
X
ca G x x x x x x G
Para obtener el resto de la Medidas Estadísticas que son de posición lo primero que hacemos es ordenar los datos generalmente en orden creciente salvo que se diga lo contrario y se le asigna el respectivo lugar en la serie.
01 02 03 04 05 06 07 08 08 09 10 10 11 12 14 16
3 3
6 6
43
6
43
3
:
8 1: 4,5 10 0,5 11 10
2
3 8 13: 6,75 1
10
10,5
13,5
11
2 0,75 14 124
3 8 16: 5,4 11 0,4 12 11
5
43 8 143: 3,87 10
1 0
,
0
4
D DD
oModo
Mediana L M M
Cuartil L Q Q
Decil L D D
Percen
M El dato que más se repite
M
Q
D
til L P P 430,87 10 10 10P
Problema 02.- Los siguientes datos corresponden a las ventas (En miles de bolívares) realizados por una comercial que vende materiales de oficinas en un lapso de 30 días. Se pide calcular: a) el Modo, la Mediana, Cuartil 1 y Cuartil 3, Decil 1 y Decil 9, y Percentil 83 y b) Porcentaje de valore que sean menores que el Modo de la distribución y mayores que 40
32
NIC LI LS fi Fi
1 09,5 16,5 5 5
2 16,5 23,5 7 12
3 23,5 30,5 6 18
4 30,5 37,5 3 21
5 37,5 44,5 3 24
6 44,5 51,5 6 30
30
Solución
a)
2 7: 16,5 21,1 7
16
2o o
xo M MM do
7: 23,5 15 12
627,000D DMedian Ma L M
3 1
71: 16,5 7,5 5
719,000Cuart Qil Q
3 3
73: 37,5 22,5 21
341,000Cuart Qil Q
1 6
71: 9,5 3 0
513,7D cil D De
9 6
79: 44,5 27 24
648,000DDecil D
8 63
783: 44,5 24,9 24
644,55,7Percent Dil P
b)
7 100% . 21,167 16,5 21,167 16,5
7 30
3 100% . 40 21,5 40 37,5
7 30
% . 40
% . 21,167 70,56%
% . 40 75,24%
% . 40 24100 75 6, 4 72 , %
o odeobs M
deobs D
deobs D
deobs M
deobs D
deobs D
Capítulo 05
Medidas de Desviación o de Dispersión 1. Medidas de Dispersión: Son medidas estadística que determinan, como se agrupan o
se alejan los datos alrededor de un promedio.
33
Desvío Medio (Dµ, Dx) Desvíos Desvío Mediano (DMd) Varianza (σ2, S2) y Desviación Estándar (σ, S) Medidas de Dispersión Rango propiamente dicho (R) de Desviación Rangos Rango Intercuartílico ( RQ ) Desvío o Amplitud Semi-intercuartílica (AQ) Rango Interdecílico (RD)
1.1.- Rango: Es la medida de dispersión que mide la oscilación o recorrido en una serie de datos desde el dato de menor valor al dato de mayor valor inclusive
R= DM – Dm + 1
1.2.- Desvío medio: Es la medida de dispersión que se determina a través de la media aritmética de los valores absolutos de los desvíos respecto a la media aritmética.
Conjunto Tipo de Datos
Población
Muestra
No Agrupados, Sueltos o Sencillos
i iX fD
N
i i
X
X X fD
n
Agrupados o Por Intervalos de Clases o Clases
mi iX fD
N
i i
X
X X fD
n
1.3.- Desvío Mediano: Es la medida de dispersión que se determina a través de la media aritmética de los valores absolutos de los desvíos respecto a la mediana.
Tipo de Datos Fórmula Datos No Agrupados, sueltos o
Sencillos d
i d i
M
i
X M fD
f
Datos Agrupados, Por Intervalos de Clases o Clases
d
mi d i
M
i
X M fD
f
34
1.4.- Varianza y Desviación Estándar o Típica: Son medidas de dispersión que
describe la cantidad de variación en una distribución de frecuencia o serie de datos. La desviación estándar o típica siempre será la raíz cuadrada de la Varianza poblacional o muestral de datos no agrupados o agrupados
Desviación Estándar o Típica: 2 2; ;En Población y en Muestra S S
1.5.- Rango Intercuartílico: Es la medida de dispersión que mide la oscilación o
recorrido en una serie de datos desde el Cuartil uno hasta el Cuartil tres.
1.6.- Desviación o Amplitud semi-Intercuartílica: Es la medida de dispersión que
toma como valor la mitad del Rango Intercuartílico.
1.7.- Rango Interdecílico: Es la medida de dispersión que mide la oscilación o
recorrido en una serie de datos desde el decil uno al Decil Nueve.
; RD = P90 – P10
Problemas Resueltos Problema 01.- De manera aleatoria se seleccionan las notas de 7 estudiantes de Estadística Instrumental del I. U. G. T., las cuales resultaron ser: 12 10 09 10 14 11 08
Conjunto Tipo de Datos
Población
Muestra
No Agrupados, Sueltos o Sencillos
2
2
2 22
22 2
i i
i i
i i
X f
N
X f N
N
X f
N
2
2
2 22
1
1
i i
i i
X X fS
n
X f NS
n
Agrupados o Por Intervalos de Clases o Clases
2
2
2 22
22 2
mi i
mi i
mi i
X f
N
X f N
N
X f
N
2
2
2 22
1
1
i i
mi i
Xm X fS
n
X f NS
n
35
Se pide obtener: la Varianza y la Desviación Estándar
22
2
22
2
2
8 9 2 10 11 12 15:
7
835 7 10,714:
1 6
64 81 200 121 144 225 835
: 5,2
10,714
5,245
2,295 04
i i
i i
xMedia Aritmética X
X f nXLa Varianza Muestral S
n
X f
La Desviación Estándar Muestral S
X
S
SS
Problema 02.- Los siguientes datos corresponden a las ventas mensuales (En miles de bolívares) realizados por una comercial que vende materiales de oficinas.
Se pide calcular: a) La Varianza y la Desviación Estándar o Típica, b) El Rango Intercuartílico y el Rango Interdecílico, y c) La Desviación o Amplitud Semi-intercuartílica.
Solución
NIC LI LS fi Fi Xmi Xmifi Xmi2fi
1 09,5 16,5 5 5 13 65 845
2 16,5 23,5 7 12 20 140 2800
3 23,5 30,5 6 18 27 162 4374
4 30,5 37,5 3 21 34 102 3468
5 37,5 44,5 3 24 41 123 5043
6 44,5 51,5 6 30 48 288 13824
30 880 30354
a) La Varianza.
880
39 3
02 ,33
2 2 230.35429,3 151,37533
30
La Desviación Estándar.
151,375 12,304
b) Rango Intercuartílico.
3 1
71: 16,5 7,5 5
719,000Cuart Qil Q
3 3
73: 37,5 22,5 21
341,000Cuart Qil Q
41 19 22D DR R
Rango Interdecílico.
1 6
71: 9,5 3 0
513,7D cil D De ;
9 6
79: 44,5 27 24
648,000DDecil D
36
48,000 13 34,3,7 DD RR
c) Desviación o Amplitud Semi-Intercuartílica
19
29,5Q QA A
Capítulo 06
Análisis de la curva originada por el Polígono de Frecuencias de una
Distribución de Frecuencias de Clases 1. Para el análisis de la curva originada por el polígono de frecuencias, se debe observar
su comportamiento hacia los lados (comportamiento lateral), así como también su comportamiento hacia su parte superior (comportamiento de agudeza o apuntamiento). 1.1 Análisis de simetría: Analiza el comportamiento lateral de la curva originada por
un Polígono de Frecuencias y se apoya en los coeficientes de asimetría de Pearson.
1 1
2 2
33
3 2
: , ; ,
3( ) 3( )mod : , ; ,
: . . , ; , ;
o o
d d
ii
M X MEn Distribuciones Modales Población CA Muestra ca
S
M X MEn Distribuciones Bi ales Población CA Muestra ca
S
X XXo por la fórmula del Sesgo D S Población Sg Muestra Sg
N ns3
3
3 2. . , ; ,
mimiX XX
D A Población Sg Muestra SgN ns
Una curva será simétrica o normal; cuando la media aritmética, la mediana y modo o moda sean iguales, la curva presenta una forma de campana. Una curva será asimétrica si presenta sesgo a los lados. Si sesga a la derecha, presenta asimetría o sesgo positivo, es decir
o Sg > 0. Esto ocurre cuando: la media aritmética es mayor
que la mediana. Si sesga a la izquierda, presenta asimetría o sesgo negativo, es decir
o Sg < 0. Esto ocurre cuando: la media es menor que la
mediana. 1.2 Análisis de la agudeza o el apuntamiento: Analiza la curva observando su
comportamiento hacia la parte superior; y para realizar el análisis nos apoyaremos en el coeficiente de Kurtosis.
K= ; =
37
Una curva será: a) Puntiaguda o Leptocúrtica si K>0,263 b) Normal o Mesocúrtica si K = 0,263 c) Achatada o Platicúrtica si K < 0,263
Problemas Resueltos Problema 01.- Los siguientes datos corresponden a las ventas mensuales (En miles de bolívares) realizados por una comercial que vende materiales de oficinas. Se pide calcular: analizar la curva originada por el Polígono de Frecuencias.
Solución En cálculos anteriores se obtuvo que:
29,333; 21,167; 12,304; 34,3 9,5o D QM R y A
Asimetría o Sesgo:
1 1
29,333 21,167
12,300 4 0
4,66CACA
Agudeza o Apuntamiento:
0,277 0,269,5
34,33K K
Conclusión: “La curva originada por el Polígono de Frecuencias de esta distribución presenta Asimetría Positiva ya que CA1 = 0,664 > 0, por lo tanto sesga a la derecha; y además es Puntiaguda o Leptocúrtica por cuanto K = 0,277 > 0,263” Problema 02.- La Distribución de Frecuencias anexa al final nos presenta el ingreso diario que paga la empresa “Constructora Mayor, C. A.” (MAYORCA) a sus trabajadores, tanto empleados administrativos como obreros. Se pide determinar: a) Ingreso diario a cancelar por la empresa antes del aumento a los trabajadores distribuido en el 40% central del total de ellos, b) El presupuesto anual original y el presupuesto modificado si los dueños de la empresa conceden un aumento de manera lineal del 15% a sus trabajadores, c) Diagramar el Histograma y el Polígono de Frecuencias de esta distribución y d) Analizar el comportamiento de la curva que origina el Polígono de Frecuencias.
Ingresos Diarios (Bs.)
Número de Trabajadores
150 200 6
200 250 8
250 300 20
300 350 12
350 400 4
Solución a) Si la parte central de la recta de los datos originada por el Rango representa el 40% de
ella, tanto la parte derecha como la parte izquierda de esa recta representan parte
iguales es decir: 100 40
302
; Ingreso Mínimo = P30 por lo que Ingreso Máximo =P70
30 30 70 70
50 50250 15 14 252,5; 300 35 34 304,167
20 12P P P P
38
N° de Trab. Con Ingresos < 252,50 = 14 +0,025x50 = 15,25 y N° de Trab. Con Ingresos < 304,167 = 34 + 0,04167x50 = 36,08. N° de Trab. en el 40% del sector central = (36,08 – 15,25) = aproximadamente 21 Ingreso Diario Sector Central = 21µ implica que: I. D. S. C= 21x275 = 6.775
b) 13.750
27550
Pr sup 365 50 365 50 275
sup od : ´ 0,15
275 0,15 275 316,25
Pr sup 365 50 ' 365 50 316,2
. . 5.018750 var
. . 5.775
e uesto Original
Para el Pre uesto M ificado la nueva Media Aritmética sería
e uesto Modific
P O Bolí es
P Mado 1.562,50
NIC LI LS Xmi fi Fi Xmifi Xmi2fi
1 150 200 175 6 6 1050 183750
2 200 250 225 8 14 1800 405000
3 250 300 275 20 34 5500 1512500
4 300 350 325 12 46 3900 1267500
5 350 400 375 4 50 1500 562500
50 13750 3931250
c) Histograma
0
5
10
15
20
Polígono de Frecuencias
39
0
5
10
15
20
25
d) Análisis de la curva originada por el Polígono de Frecuencias
2 2
3 1
9
12 50275; 250 280;
12 8
3.931.250275 3.000 3.000 54,772
50
275 280. .
54,7
12 3 50 8 1 50300 34 300,84; 200 6 201,04;
50 4 50 4
. . 0,0 0
3
91
00
o oM M
C A
Q Q
D
C A
9
12 9 50 6 1 5034 302,64; 150 0 150,60
50 4 50 4
300,84 201,040,327
2 302,64 150,60,32
07
D
K K
Conclusión: “La curva originada por el Polígono de Frecuencias de esta distribución de datos presenta Asimetría Negativa por cuanto CA1=-0,091<0, por lo tanto sesga a la Izquierda, y además por ser K=0,327>0,263 la curva es Puntiaguda o Leptocúrtica”
40
RESUMEN DE LAS FORMULAS DE LAS
MEDIDAS ESTADISTICAS 1.- Media Aritmética
Conjunto Tipo de Datos
POBLACION
MUESTRA
Datos No Agrupados, Sueltos o Sencillos
Datos Agrupados, Por Intervalos de Clases o Clases
Media Ponderada
2.- Media Geométrica
TIPOS DE DATOS FÓRMULAS
Datos No Agrupados, Sueltos o sencillos
1 2 1 2
1
1 2 1 2
1
1 2 1 2n n
n nn n
f ff f f fn nn n
G X X X X X X
G X X X X X X
Datos Agrupados, Por Intervalo de Clase o
Clases 1 2 1 2
1
1 2 1 2
1
1 2 1 2n n
n nm m mn m m mn
f ff f f fn nm m mn m m mn
G X X X X X X
G X X X X X X
3.- Modo
TIPOS DE DATOS FÓRMULAS
Datos No Agrupados, Sueltos o sencillos
Se toma definición del Modo o Moda como base para obtenerlo. No necesariamente es el hay un solo modo.
Datos Agrupados, Por Intervalo de Clase o Clases
1
1 2
1 2
, :
;o o
o I o
o Anterior a f o Siguientea f
q ICM L f Frecuencia Modal
q q
q f f q f f
4.- Mediana
TIPOS DE DATOS FÓRMULAS
Datos No Agrupados, Sueltos o sencillos . . .
: 0,5 1
. .
. .
d
d Menor del Int de Posición Mayor del Int de Posición Menor del Int de Posición
d
Obtención dela posición dela Mediana L M n
M D p d D D
p d Parte decimal del cálculo de L M
41
Datos Agrupados, Por Intervalo de Clase o Clases
2d I aa
i
IC NM L F
f
5.- Cuartil 01:
TIPOS DE DATOS FÓRMULAS
Datos No Agrupados, Sueltos o sencillos
1
1 . . .
1
01: 0,25 1
. .
. .
Menor del Int de Posición Mayor del Int de Posición Menor del Int de Posición
Obtención dela posición del Cuartil L Q n
Q D p d D D
p d Parte decimal del cálculo de L Q
Datos Agrupados, Por Intervalo de Clase o Clases
14
I aa
i
IC NQ L F
f
6.- Cuartil 03
TIPOS DE DATOS FÓRMULAS
Datos No Agrupados, Sueltos o sencillos 3 . . .
3
03: 0,75 1
. .
. .
d
Menor del Int de Posición Mayor del Int de Posición Menor del Int de Posición
Obtención dela posición del Cuartil L M n
Q D p d D D
p d Parte decimal del cálculo de L Q
Datos Agrupados, Por Intervalo de Clase o Clases
3
3
4I aa
i
IC NQ L F
f
7.- Decil 01
TIPOS DE DATOS FÓRMULAS
Datos No Agrupados, Sueltos o sencillos
1
1 . . .
1
01: 0,10 1
. .
. .
Menor del Int de Posición Mayor del Int de Posición Menor del Int de Posición
Obtención dela posición del Decil L D n
D D p d D D
p d Parte decimal del cálculo de L D
Datos Agrupados, Por Intervalo de Clase o Clases
110
I aa
i
IC ND L F
f
8.- Decil 09
42
TIPOS DE DATOS FÓRMULAS
Datos No Agrupados, Sueltos o sencillos
1
9 . . .
9
09 : 0,90 1
. .
. .
Menor del Int de Posición Mayor del Int de Posición Menor del Int de Posición
Obtención dela posición del Decil L D n
D D p d D D
p d Parte decimal del cálculo de L D
Datos Agrupados, Por Intervalo de Clase o Clases
9
9
10I aa
i
IC ND L F
f
9.- Fórmula para obtener el fractil luego de ubicado su lugar en una serie de Datos No Agrupados
.int. .int .int.. .i m M mD p d D D
.int.
.int.
;
;
;
. .
i
m
M
Fractil a calcular
D Dato menor delos valores entrelos cuales seubica la posición del fractil acalcular
D Dato mayor delos valores entrelos cuales seubica la posición del fractil acalcular
p d Parte decimal del valor que seobtuvo al obtener la posición dela serie de datos donde
seubica el fractil a calcular
10.- Obtención de porcentaje de valores de una Distribución de Frecuencias en Datos Agrupados por Intervalos de Clases o Clases
100% .
% . 100 % .
iaa I
fdeobs D F D L
IC N
deobs D deobs D
D Datoque setomacomoreferencia paracalcular el porcentaje
11.- Rango
1R Dato Mayor Dato Menor
12.- Desviación Media o Desvío Medio
43
Conjunto
Tipo de Datos
Población
Muestra
No Agrupados, Sueltos o Sencillos
i iX fD
N
i i
X
X X fD
n
Agrupados o Por Intervalos de Clases o Clases
mi iX fD
N
i i
X
X X fD
n
13.- Desviación Mediana o Desvío Mediano
Tipo de Datos Fórmula Datos No Agrupados, sueltos o
Sencillos d
i d i
M
i
X M fD
f
Datos Agrupados, Por Intervalos de Clases o Clases
d
mi d i
M
i
X M fD
f
14.- La Varianza
Conjunto Tipo de Datos
Población
Muestra
No Agrupados, Sueltos o Sencillos
2
2
2 22
22 2
i i
i i
i i
X f
N
X f N
N
X f
N
2
2
2 22
1
1
i i
i i
X X fS
n
X f NS
n
Agrupados o Por Intervalos de Clases o Clases
2
2
2 22
22 2
mi i
mi i
mi i
X f
N
X f N
N
X f
N
2
2
2 22
1
1
i i
mi i
Xm X fS
n
X f NS
n
44
15.- Desviación Estándar o Típica
2 2; ;En Población y en Muestra S S
16.- Rango Intercuartílico
17.- Desviación o Amplitud Semi – intercuartilica
18.- Rango Interdecílico
; RD = P90 – P10
DEFORMACION Y APUNTAMIENTO O AGUDEZA DE LA CURVA ORIGINADA POR EL
POLIGONO DE FRECUENCI Deformaciones laterales o sesgos: Coeficiente de Asimetría.
1 1
2 2
3
3
: , ; ,
3( ) 3( )mod : , ; ,
. : , ; ,
o o
d d
ii
M X MEn Distribuciones Modales Población CA Muestra ca
S
M X MEn Distribuciones Bi ales Población CA Muestra ca
S
X XXo por la fórmula del Sesgo D Sueltos Población Sg Muestra Sg
N
3
2
33
3 2
;
. : , ; ,mimi
ns
X XXD Agrupados Población Sg Muestra Sg
N ns
Xmi
> 0 (+) = 0 0 (-)
Sg > 0 (+) Sg = 0 (+) Sg < 0 (+)
> 0 (+) = 0 0 (-)
Asimetría Positiva Simétrica o normal Asimetría Negativa Sesgo a la derecha Sesgo a la izquierda
45
Apuntamiento o agudeza Coeficiente de Kurtosis
K ; K ; K ; K
Puntiaguda o Leptocúrtica K > 0,263 Normal o Mesocúrtica K = 0,263 0,263 Achatada o Platicúrtica K < 0263
Xmi
Problemas propuestos para los Capítulos tratados en el Título II
Problema 01.- Los directivos de una fábrica de refresco están pensando lanzar al mercado un nuevo
producto. Realizada una encuesta a objeto de medir la aceptación del producto, en una muestra de 30 niños y utilizando una escala de 0 a 10 puntos para medir el grado de aceptación; este fue el resultado
obtenido:2-6-8-7-4-5-10-6-6-7-6-7-3-8-7-6-8-6-5-4-7-8-5-7-6-7-2-7-2-7. La muestra tomó 15 niñas y
15 niños, con edades comprendidas entre los 5 y 12 años de edad, residentes en un barrio de la
ciudad de Caracas. Se pide: a) Estructurar una tabla de Distribución de Frecuencias y b) Calcular;
media aritmética, mediana, modo, cuartil uno y tres, decil uno y nueve, el percentil 42, la varianza y la
desviación estándar o típica Problema 02.- Leer el siguiente texto: “Una vez recolectados los datos en forma ordenada, es
necesario en forma tal que se facilite su comprensión y su posterior análisis y utilizaciones.
Para ello se ordenan en cuadro numéricos y luego se representan en gráficos, para variable
discreta mediante diagramas de frecuencias tanto para absolutas ó relativas”. Se pide: a)
Considerando a rr y ll como letra única, formar una tabla de Distribución de Frecuencias de Datos Agrupados en Clases ó Intervalos de Clases, tomando como base el número el número de letras que
forma cada palabra y b) Analizar la curva originada por el Polígono de Frecuencias. Problema 03.- (Modelo para datos sueltos).- Un grupo de productores de maíz del Estado Guárico
entrega su producción en toneladas, a una planta receptora del producto, y 20 de ellos entregaron el
siguiente tonelaje: 29 24 35 42 25 24 29 27 27 38 44 25 40 42 42 32 35 32 44 32.
Se pide: a) Elaborar una tabla de distribución de frecuencias. b) Calcular el porcentaje de productores que entregaron menos de 29 toneladas y el porcentaje de los productores que entregaron 32 o más
toneladas c) Calcular las medidas estadísticas más importantes de tendencia central, de posición y de
dispersión.
Problema 04.- (Modelo para datos agrupados).-Dentro de los televidentes del país se seleccionaron 50 que ven R.C.T.V. entre personas mayores de 18 años, a las cuales se le consultaron sus edades;
49 26 33 25 19 48 19 52 48 38
38 34 25 21 38 40 40 46 38 20
36 22 38 25 42 19 38 20 23 33
46
41 20 24 38 41 36 28 34 40 51
21 33 25 24 20 23 20 38 28 31.
Se pide: a) Elaborar la tabla estadística para La Distribución de Frecuencias, b) Calcular un
aproximado del número de personas que tienen menos de 28 años y el porcentaje de personas que
tienen 36 o más años, c) Calcular las medidas estadísticas más importantes de Tendencia Central, de
Posición y de Dispersión y f) Estudiar la curva originada por el Polígono de Frecuencias.
Problema 05.- Se seleccionaron 30 estudiantes del I.U.G.T. de acuerdo a sus edades y luego de realizados los cálculos, se presentaron las Marcas de Clases con sus respectivas Frecuencias
Absolutas:
Xmi 18 22 26 30 34
fi 6 7 10 5 2
Se pide: a) Calcular las Medidas Estadísticas y b) Analizar el comportamiento lateral y el apuntamiento o agudeza de la curva originada por el Polígono de Frecuencias.
Problema 06.- Un profesor de Estadística General para instruir a sus alumnos sobre todo lo
referente a la Distribución de Frecuencias en cuanto a Datos Sueltos o No Agrupado en Intervalos de
Clase, tomó las notas de un trabajo previo al primer examen parcial las cuales fueron: 16 08 14 10
07 11 11 14 10 11 14 13 12 11 10 08 13 12 07 12.Se pide: a) Tabla de Distribución de Frecuencias y b) Calcular las medidas de Tendencia Central, las medidas de Posición y las medidas
más usuales de Dispersión
Problema 07.- La tabla que se presenta anexa, representa los salarios diarios cancelados por una
empresa constructora a sus obreros. Se pide; A.- Determinar: a) Salario máximo y mínimo entre los cuales se encuentra 40% central de la cantidad de obreros de la empresa, b) El salario diario que
comprende el 50% de la cantidad de obreros de la empresa, c) El porcentaje de la cantidad de obreros
con salarios inferiores al Modo y el número de obreros con salarios superiores a la Media Aritmética de
la Distribución de Frecuencias representada por la Tabla Estadística, d) El presupuesto anual original
y el presupuesto anual modificado luego que los dueños de la empresa concedieran un aumento diario
del 10% sobre los salarios de los obreros; y B.- Analizar el comportamiento lateral y el apuntamiento o agudeza de la curva originada por el Polígono de Frecuencias, trazando un esbozo de misma sobre el
Histograma o Polígono de Frecuencias elaborados.
Ingresos
Diarios
Número
de Obreros
20 30
30 40
40 50
50 60
60 70
70 80 80 90
50
60
80
100
60
40 10
Total 400
Problema 08.- Obtenidas las Marcas de Clases de una Distribución de Frecuencias tomadas de la vida
de unas 40 baterías de automóviles, las cuales se presentan al final, se pide: a) Porcentajes del
número de baterías tomadas que son inferiores a la Media Aritmética y el número de las mismas que
son superiores al Modo, b) Límites entre los cuales se ubican el 50% y el 28% central de las baterías según su vida útil y c) Analizar el comportamiento lateral y el apuntamiento o agudeza de la curva
originada por el Polígono de Frecuencias trazando un esbozo de misma.
Años de vida útil (Xmi): 1,7 2,2 2,7 3,2 3,7 4,2 4,7
47
Número de baterías (fi): 2 1 4 10 15 5 3
Problema 09.- Una línea aérea a través de su departamento de control estadístico lleva una relación del número de pasajeros que se movilizaron durante los últimos 40 días entre Maiquetía y Maracaibo,
Distribución de Frecuencias la cual originó las Marcas de Clases que se presentan al final; se pide: a)
Porcentajes del número de pasajeros movilizados que son superiores a la Media Aritmética y el número
de las mismos que son inferiores al Modo, b) Límites entre los cuales se ubican el 30%y central de los
pasajeros movilizados durante los 40 días y c) Analizar el comportamiento lateral y el apuntamiento o
agudeza de la curva originada por el Polígono de Frecuencias trazando un esbozo de misma.
Movimiento de Pasajeros (Xmi): 56,5 64,5 72,5 80,5 88,5 96,5 104,5
Día en que se hizo el estudio (fi): 11 6 6 10 1 5 1
Problema 10.- A continuación se presenta número de obreros que laboran en 40 empresas de construcción que contratan con el sector público:
53 58 63 56 53 62 95 98 83 97
56 59 64 71 84 96 102 57 76 69
57 85 93 83 68 72 79 81 80 56
61 80 70 77 80 63 60 59 78 74
Se pide: a) Desarrollar la Distribución de Frecuencias y señalar, b) Calcular las Medidas Estadísticas
más usuales y c) Analizar el comportamiento lateral y el apuntamiento o agudeza de la curva originada
por el Polígono de Frecuencias.
Problema 11.- Un productor de cítricos hizo 60 entregas de sacos de naranjas californias en el
Mercado al por Mayor de Coche, relación de entregas que se presenta a continuación por sacos
entregados:
67 56 52 56 73 79 64 72 72 58 73 69 54 67 51 59 58 59 76 66 79 57 69 64 69 60 68 63 74 67
63 61 74 67 70 63 71 64 75 71 67 59 76 67 71
64 72 67 57 58 58 68 73 58 74 72 60 59 69 60
Se pide: a) Desarrollar la Distribución de Frecuencias y b) Calcular las Medidas Estadísticas para analizar el comportamiento lateral y el apuntamiento o agudeza de la curva originada por el Polígono
de Frecuencias, dar la conclusión de este análisis.
Problema 12.- Un matadero industrial estableció una clasificación de los frigoríficos a los cuales les
suministra sus productos, tomando como referencia el pesaje de los pedidos por mes. Luego de hacer
un estudio estadístico estableció sus Marcas de Clase con sus respectivas Frecuencias Absolutas:
Kilogramos despachados (Xmi): 216,5 256,5 296,5 336,5 376,5 416,5
Frigoríficos receptores del producto (fi) 10 15 30 25 15 05
Se pide: a) Desarrollar la Distribución de Frecuencias y b) Calcular las Medidas Estadísticas y con éstas analizar el comportamiento lateral y el apuntamiento o agudeza de la curva originada por el
Polígono de Frecuencias y dar la conclusión.
Problema 13.- Los estudiantes Pedro Pérez, Zulgrey González y Jenny Rodríguez hacen tres consultas
diferentes a un profesor de Estadísticas: a) Pedro Pérez, entrega al profesor las ponderaciones y las
notas obtenidas en los cinco exámenes parciales en la materia consultada, quiere saber si aprueba la
materia, b) Zulgrey González quiere saber cuánto debe obtener en el último examen parcial para aprobar con 12 puntos la materia consultada y c) Jenny Rodríguez, llegó a un acuerdo con el profesor
48
de la materia sometida a consulta para presentar al final del período el segundo examen parcial, y
quiere saber cuánto debe obtener en ese parcial para aprobarla. Dadas ponderaciones y notas de cada
uno de esos estudiantes se pide dar respuestas a sus interrogantes:
Pedro
Pérez
Zulgrey González
Jenny Rodríguez
Problema 14.- Los datos que se presentan al final, representan las exportaciones de determinado
producto en toneladas métricas (T.M.) en un lapso de 30 días: 5 6 5 8 9 9 7 6 4 3 2 1 6 5 4 8 9 3 2 2 5 4 6 7 1 2 8 9 7 6. Se pide: a) Agrupar los datos, b) Obtener la Media Aritmética y la
Mediana c) Calcular el porcentaje de días con exportaciones superiores a 3 T. M. y con exportaciones
inferiores a 6 T. M. y con exportaciones que estén entre 4 a 8 T. M. y c) Analizar el comportamiento
lateral y el apuntamiento o agudeza de la curva originada por el Polígono de Frecuencias
Problema 15.- Una empresa textilera posee 20 empleados los cuales se beneficiarán del Decreto Gubernamental que establece un aumento lineal del 10%. El Departamento de personal lleva una
relación de los ingresos mensuales de sus empleados los cuales se presentan en cuadro final. ¿Cuánto
recurso tendría que disponer la empresa en un año para satisfacer este aumento?, ¿cuánto sería el
presupuesto anual original y cuánto sería el presupuesto nuevo presupuesto modificado?
Ingresos Número de Mensuales Empleados
1.500-2.000 2
2.000-2.500 3
2.500-3.000 10
3.000-3.500 2 3.500-4.000 3
Problema 16.- Se dispone de los índices de precios del consumidor del área metropolitana de Caracas.
Si se pretende obtener un índice de precios promedio: a) Razonando su respuestas, ¿qué Medida
Estadística utilizaría? Y b) Determinarla.
Año: 1.977 1.978 1.979 1.980 1.981 1.982
Índice General 160,7 172,2 193,4 235,4 273,1 300,2
Problema 17.- El Profesor Scott tomó el promedio de sus cursos de Estadísticas del I. U.G T. el cual
dio como resultado 13 puntos. Él desea saber, ¿Cuál es el promedio de sus cursos de Estadística Instrumental, si conoce los promedios de las notas de sus estudiantes de Estadística I, Estadística II y
Estadística General (Ver cuadro)
Materia: Estadística I Estadística II Estadística Inst. Estadística Gral.
Estudiantes: 40 20 138 42
Promedios: 11 08 X 16
Problema 18.- Se observa un determinado déficit de viviendas para el año 2.010. Si se asume que el
25% de las familias demanda vivienda, y partiendo de la base que cada familia está formada por un
Parcial 01 02 03 04
Pond. 3/10 7/25 11/50 1/5
Nota 07 12 07 13
Parcial 01 02 03 04
Pond. 3/10 7/25 11/5 1/5
Nota 08 11 12 X
Parcial 01 02 03 04
Pond. 3/10 7/25 11/5 1/5
Nota 06 X 12 10
49
promedio de 6 miembros. Se pide determinar el déficit de viviendas para el año 2.010, si los datos
interanuales fueran los que se presentan en tabla anexa.
Año: 1.998 1.999 2.000 2.001 2.002 2.003
Población (Millones de habitantes): 19,7 19,9 20,4 20,8 21,6 22,2
Problema 19.- Se tiene pensado construir una edificación para una Unidad Educativa en Guayabal,
estado Guárico en el año 2.012. Las poblaciones estimadas se presentan al final. El porcentaje de
menores de edad que van de los 7 a los 13 años se conoce que es del 3%. De acuerdo a la norma cada aula debe tener una capacidad útil para 50 alumnos. ¿Cuántas aulas debe tener la edificación a
construir?
Años: 2.001 2.002 2.003 2.004 2.005 2.006
Población (Miles de habitantes): 10,1 10,3 10,6 10,9 11,5 11,9
Problema 20.- Una empresa de comida rápida desea determinarla tasa de crecimiento promedio en los
ingresos con base a las cifras dadas en la tabla anexa. Si la tasa de crecimiento promedio es menor
que el promedio industrial del 10%, entonces se realizará una campaña publicitaria para mejorar los
ingresos, ¿cuál será la decisión?
Año: 1.992 1.993 1.994 1.995 1.996
Ingresos: 1,10 1,13 1,18 1,23 1,48
Problema 21.- La recuperación de la inversión obtenida por una empresa de construcción durante
cuatro años fue: 30%, 20%, -40%, y 200%. ¿Cuál es la tasa media geométrica de recuperación?
Problema 22.- En el año 1.998 la población del Municipio Mellado se estimó en 38.000 y en el año 2.004 en 44.000. ¿Cuál será el aumento medio geométrico anual para el período?
Problema 23.-Una empresa grande de equipos deportivos está probando el efecto de dos publicitarios
planes sobre ventas en los primeros cuatro meses del año. Dadas las ventas que se ven en el cuadro
anexo; ¿cuál programa de publicidad parece producir el crecimiento promedio más alto en ventas
mensuales?
Mes Plan 1 Plan 2
Enero
Febrero
Marzo
Abril
5.251,05
6.293,70
7.141,05
10.810,80
14.915,25
15.878,00
17.258.85
17.605,50
Problema 25.- El Director Ejecutivo de una empresa de transporte aéreo desea determinar la tasa de
crecimiento promedio en los ingresos anuales en base a la información que se refleja en tabla anexa. Si la tasa promedio es menor al promedio industrial del 10% se asumirá una nueva campaña
publicitaria. Se pide: a) ¿Será necesaria una nueva campaña publicitaria?, b) Razonar ¿por qué? se
utiliza el promedio geométrico para este tipo de estudio comparándolo con el crecimiento aritmético.
Año Ingresos
(Bs)
1.992
1.993 1.994
1.995
1.996
500.000
550.000 660.000
600.000
780.000
Problema 26.- Dada las siguiente distribución de frecuencias de las notas tomadas de 01 a 40
a80obtenidas por 80 estudiantes de un liceo de Caracas, según se muestra en tabla anexa, se pide
responder: a) Porcentaje y número de estudiantes por encima de la mediana, b) Porcentaje y número
50
de estudiantes inferiores a la media aritmética, c) Las calificaciones entre las cuales se encuentra el
50% de la parte central de la distribución y d) Analizar la curva originada por el polígono de frecuencia
y comprobar con esbozo de la misma que el análisis se corresponde.
Xi XI XS fi Xi XI XS fi 1 01 04 4 6 21 24 15
2 05 08 7 7 25 28 12
3 09 12 9 8 29 32 6
4 13 16 10 9 33 36 2
5 17 20 14 10 37 40 1
51
TÍTULO III
Capítulo 07
ESTUDIO DE LAS PROBABILIDADES
Introducción.- Los orígenes en la utilización de las matemáticas para obtener una valoración de las probabilidades se remontan al siglo XVI. Fueron aplicaciones relacionadas básicamente con los juegos de azar. Los jugadores en la búsqueda de obtener ganancias utilizaron la experiencia en cuanto a llevar una secuencia de los resultados de los juegos de azar para desarrollar una estrategia que los ayudara en la realización de sus apuestas. Actualmente con el avance de las tecnologías sobre todo en el campo de la computación, se simplifica el trabajo en cuanto a la verificación de resultados tomando en cuenta una relación histórica de los mismos y que son utilizados para realizar predicciones o pronósticos de los posibles resultados en los sorteos de loterías, en casinos, carreras de caballo y en los deportes organizados. Sin embargo la dinámica actual ha impuesto que el uso de la probabilidad vaya más allá de los juegos de azar. En estos tiempos, los gobiernos, las empresas particulares y diversas organizaciones profesionales y sin fines de lucro utilizan la Teoría de la Probabilidad en su cotidiano proceso en la toma de decisiones. Cuando las instituciones como las mencionadas anteriormente recurren al uso de las probabilidades indica la existencia de algún elemento aleatorio o de incertidumbre relativa o no a la ocurrencia de algún evento futuro. En muchos por no decir todos lo casos, es imposible predecir qué sucederá, pero es posible establece lo que podría pasar. Sin embargo combinando el conocimiento, el instinto, la experiencia y llevando una relación histórica de la ocurrencia de determinados eventos, con frecuencia se podría aseverar cuan probable puede darse un suceso en el futuro. En consecuencia las probabilidades se presentan como una valiosa herramientas, muy útiles en el desarrollo de estrategias para ponerlas en práctica en el logro de fines y objetivos. Nuestro estudio nos llevará en todos los casos posible a desarrollar toda una teoría de análisis apoyada fundamentalmente en nuestros conocimientos matemáticos para tener la capacidad de cuantificar cuan probable es determinado evento. En este capítulo presentaremos unas series de definiciones, teoremas, reglas e instrumentos de apoyos útiles para obtener la valoración de las probabilidades. 1.- Definiciones Fundamentales
1.1.- Probabilidad: Es la posibilidad o viabilidad numérica medida entre cero y uno inclusive, de que ocurra un evento de manera relativa.
Interpretación y comentario: Puede ser interpretado como algo indefinible, pero utilizado para expresar, de algún modo, un grado de creencia que se tiene de la ocurrencia de un suceso o evento; evento que puede suceder con base en la experiencia que se tenga de la ocurrencia de uno similar en el pasado, o en base de la consecuencia de un experimento en particular. Por lo tanto las probabilidades se usan para expresar cuan probable es determinado evento.
52
Cuando la probabilidad es igual a uno (1) es una probabilidad de certeza absoluta; ejemplo, ¿Cuál es la probabilidad de que alguna persona muera? Cuando la probabilidad es igual a cero (0) es una probabilidad de imposibilidad absoluta; ejemplo, ¿Cuál es la probabilidad de que alguna persona atraviese nadando el océano atlántico? De toda la literatura desarrollada anteriormente podemos asumir la definición de los siguientes conceptos:
1.2.- Evento, Suceso o punto muestral: Es el conjunto de uno o más resultados de un experimento. Existen eventos simples o elementales, los cuales se especifican con una sola característica y eventos compuestos los cuales resultan de combinar dos o más eventos simples o elementales.
1.3.- Resultado: Es la consecuencia de un experimento en particular, es decir es la
respuesta a alguna prueba.
1.4.- Experimento o Prueba: Es el proceso que lleva a la ocurrencia de uno y solo uno de varias observaciones posibles.
1.5.- Experimento Aleatorio: Es un fenómeno empírico, caracterizado por la propiedad de que observado bajo determinado conjunto de condiciones idénticas no siempre arroja el mismo resultado. Propiedades: a) Se efectúa de acuerdo a un conjunto bien definido de supuestos, b) Es repetitivo y c) El resultado de cada repetición depende del azar; es decir no es posible predecir con certeza un resultado en particular.
1.6.- Espacio Muestral: Es el conjunto de todos los resultados posibles de un
experimento o muestra y lo designaremos por S. 1.7.- Espacio o Conjunto de Probabilidades: Es el conjunto de todas las
probabilidades posibles de un espacio muestral particular originado por un experimento, y lo designaremos por SP. De esta definición se desprende que SP siempre será igual a uno ( SP = 1)
1.8.- Resultados Posibles: Es la suma de todos los resultados de eventos que
pueden derivarse de un Espacio Muestral (EP0).
1.9.- Resultado Probable o Favorable: Son resultados que se derivan de la ocurrencia de eventos favorables en particular y que forman parte de un Espacio Muestral (EFA).
2.- Modelos para estudiar las probabilidades :
Modelo Objetivo Probabilidades Clásicas
Modelos Probabilidades Empíricas o Relativas Modelo Subjetivo 2.1 .- Modelo Objetivo: Establece un proceso para estudiar el cálculo de
probabilidades a través de experimentaciones con resultados reales y tangibles o tomando y llevando un control histórico de experiencias en la ocurrencia de
53
eventos en el tiempo para aplicarla a la ocurrencia de eventos similares en el presente. 2.1.1.- Enfoque Clásico o Teórico de la Probabilidad: Se obtiene el valor de la
probabilidad basándose en la suposición de que los resultados de un
experimento son igualmente probable.
EFEP E
EPO
EFA: Evento Favorable en el Experimento. EPO: Evento Posible
2.1.2.- Enfoque Empírico o Relativo de la Probabilidad: Se obtiene el valor de
la probabilidad basándose en la realización de experimentaciones
indefinidamente repetibles desde el punto de vista teórico, de manera tal, que
en la práctica cotidiana se pueda pensar que los resultados obtenidos en un
número grande de repeticiones, den una buena aproximación a los resultados
que se obtendrían en las indefinidas repeticiones, dentro de las cuales se
podría considerar la ocurrencia del evento en consideración y que presente
cierta similitud en las mismas condiciones a los eventos estudiados en esas
experimentaciones
EFOP E
ETO
EFO: Eventos Favorables Observados. ETO: Eventos Totales Observados
2.2 Modelo Subjetivo: Se sustenta en la evaluación personal de la posibilidad de que ocurra un evento, basados en la experiencia y las intuiciones
3.- Posibilidades.- Las posibilidades y las probabilidades están estrechamente vinculadas, pero no son lo mismo. Muchas veces se toma a las posibilidades como otra forma de expresar probabilidades. Sin embargo existe una diferencia; mientras las posibilidades comparan el número de eventos favorables con el número de eventos no favorables, las probabilidades comparan el número de eventos favorables con el número total de eventos posibles. En consecuencia definiremos a la Posibilidad a favor de un evento, a la razón del número de eventos favorables entre el número de eventos no favorables.
4.- Algunos eventos y sus respectivas probabilidades: 4.1.- Eventos Independientes: Son eventos en los cuales la ocurrencia o no
ocurrencia de ellos no tiene ningún efecto en la ocurrencia del otro o de los otros. 4.2.- Eventos Dependientes: Son eventos los cuales deben su ocurrencia a que
previamente haya ocurrido otro u otros. 4.3.- Evento Complementario: Son aquellos eventos que de no ocurrir; los otros si
deben ocurrir. 4.4.- Eventos Mutuamente excluyentes: Son eventos que al ocurrir da como
consecuencia que ninguno de los otros eventos ocurran en ese mismo experimento. 4.5.- Eventos Colectivamente exhaustivos: Por lo menos uno de los eventos de un
espacio muestral debe ocurrir al realizarse un experimento. 4.6.- Probabilidad a Priori: Se considera como la probabilidad inicial basada en un
nivel de información actual.
54
4.7.- Probabilidad a Posteriori: Se considera como una probabilidad revisada en base a información adicional.
4.8.- Probabilidad Conjunta: Es la probabilidad que mide la posibilidad de que dos o más eventos ocurran al mismo tiempo (Eventos no mutuamente excluyentes)
4.9.- Probabilidad Condicional: Es la probabilidad cuya ocurrencia depende a que previamente haya ocurrido otro evento (Eventos dependientes)
4.10.- Probabilidad Complementaria: Es la probabilidad que se obtiene restando a la unidad la ocurrencia del evento contrario.
5.- Axiomas de las probabilidades 5.1.- Las probabilidades no pueden ser mayor a 1 ni menor que 0 (No puede ser
negativa) si se expresa en tanto por 1. Si fuera en tanto por 100, no sería ni mayor a 100 ni menor a 0 (No ha probabilidad negativa)
0 ≤ P(E) ≤ 1 ó 0 ≤ P(E ) ≤ 100
5.2.- La suma de las probabilidades de los eventos posibles (Mutuamente Excluyentes y Colectivamente Exhaustivo) de un espacio muestra siempre será 1.
P(E1)+P(E2)+………+P(En)= S = 1 6.- Instrumentos Matemáticos de apoyo para el cálculo de Probabilidades
6.1.- Técnicas de conteo: Pudiendo contar todos los eventos posibles y
determinando a través de ciertos mecanismos el número de veces de la ocurrencia de algún evento, podemos determinar probabilidades en su enfoque clásico (A priori) a través de técnicas muy sencillas enriquecidas con la teoría combinatoria, que nos crea las técnicas del conteo.
6.1.1- Principio de la multiplicación: Las maneras posibles de llegar a un resultado final partiendo de un punto inicial, transitando por caminos diferentes y teniendo otros posibles puntos intermedios. En otras palabras si una tarea consta de pasos distinto y otra también, no siendo ambas excluyentes, sino que se da la posibilidad de realizarlas juntas o en sucesión entonces el total de pasos distintos o manera en que puedan concretarse es de:
EPO= a∙b.c……
Ejemplo 01.- Se tiene que la placa de un vehículo consta de dos letra y cuatro números. Calcular la cantidad total de autos diferente que se podrían emplacar. Datos: Letra del alfabeto español 25 (Desechando la ll y la ñ) Número de dígitos 10.
Desarrollo: EPO= 25.25.10.10.10.10=6.250.000 Ejemplo 02.- Un juego de barajas españolas tiene 40 naipes. Si extraemos cinco cartas sucesivamente cinco sin reposición; ¿Cuántos serían los eventos posibles? Datos: Los 40 naipes de las barajas españolas
Desarrollo: EPO=40.39.38.37.36=78.960.960
55
6.1.2- Principio del exponente: Se puede considerar como un caso especial del principio de la multiplicación y se da cuando existen más de una tarea de pasos iguales pudiendo las otras tareas presentar las mismas condiciones. Se puede considerar como una tarea a un instrumento de experimentación y los pasos el número de eventos que en si pueda posea ese instrumento de experimentación. Un dado se puede considerar como una tarea y cada una de sus caras los pasos a dar, así mismo sucedería con una moneda. Los eventos posibles se obtienen tomando como la base exponencial el número de pasos o eventos que presenta el instrumento de experimentación o tarea y como exponente el número de instrumentos de experimentación o tareas utilizados en el experimento aleatorio.
P nE O b
Ejemplo 01.- Se tiene que la placa de un vehículo consta de dos letra y cuatro números. Calcular la cantidad total de autos diferente que se podrían emplacar. Datos: Letra del alfabeto español 25 (Desechando la ll y la ñ) Número de dígitos 10.
Desarrollo: 2 4P 25 10 6.250.000E O
Ejemplo 02.- Un juego de barajas españolas tiene 40 naipes. Si extraemos sucesivamente cinco cartas con reposición; ¿Cuántos serían los eventos posibles? Datos: Los 40 naipes de las barajas españolas
Desarrollo: 5P 40 102.400.000E O
Ejemplo 03.- Una moneda se lanza cinco veces o en su defecto se lanzan cinco monedas Calcular los eventos posible para este experimento. Datos: Los 5 lanzamientos de las monedas o el lanzamiento de cinco monedas
Desarrollo: 5P 2 32E O
Ejemplo 04.- Un dado se lanza tres veces o en su defecto se lanzan tres dados calibrados. ¿Cuántos serían los eventos posibles? Datos: Los 3 lanzamientos de un dado o en su defecto tres dados calibrados
Desarrollo: 3P 6 216E O
Ejemplo 05.- Una moneda se lanza cinco veces o en su defecto se lanzan cinco monedas y un dado se lanza tres veces o en su defecto se lanzan tres dados calibrados. ¿Cuántos serían los eventos posibles? Datos: Los 5 lanzamientos de las monedas o el lanzamiento de cinco monedas y los 3 lanzamientos de un dado o en su defecto tres dados calibrados
Desarrollo: 5 3P 2 6 6.912E O
6.1.3- Permutaciones absolutas: Es una forma de arreglar u ordenar a la totalidad de
los elementos de un conjunto en posiciones previamente jerarquizadas. Se señala que es absoluta si las posiciones jerarquizadas coinciden con el número de elementos que se disponen para ser posicionadas u ocupadas.
P ! 1 2 3 ....... 2 1E O nPn n n n n
56
n=Número de elementos y número de posiciones jerarquizadas
n!=Número factorial
Axioma: 0! =1!= 1 Ejemplo 01.- Un automóvil solo tiene lugar para cinco pasajero incluyendo al chofer. Suponer que cinco amigos van a realizar un viaje y utilizarán el automóvil ¿De cuántas maneras se podrán ubicar los amigos si: a) Cualquiera de ellos pueden conducir? Y b) Sólo uno de los cinco puede conducir? Datos: Cinco lugares a ocupar y cinco amigos
Desarrollo: a) 5 5P 5! 5 4 3 2 1 120E O P
b) Al solo poder conducir uno de los amigos queda libre solo 4 lugares de asiento los cuatro amigos que no pueden conducir
4 4P 4! 4 3 2 1 24E O P
Ejemplo 02.- Se tiene un torneo de bolas criollas donde participan cuatro equipos. ¿De cuántas maneras pueden quedar las posiciones finales del torneo? Datos: Los equipos de bolas criollas y las cuatro posiciones del torneo
Desarrollo: 4 4P 4! 4 3 2 1 24E O P
6.1.4- Permutaciones Relativas o Variaciones: Es una forma de arreglar u ordenar
una parte preestablecidas de los elementos que componen un conjunto en posiciones previamente jerarquizadas. Se señala que es relativa si las posiciones jerarquizadas son menores al el número de elementos que se disponen para ser posicionadas u ocupadas.
!
Pr!
nEPO n
n r
n= totalidad de elementos
r = Posiciones jerarquizadas.
Ejemplo 01.- Un automóvil solo tiene lugar para cinco pasajero incluyendo al chofer. Suponer que siete amigos van a realizar un viaje y utilizarán el automóvil, se quedarán dos amigos pues todos no pueden ir ¿De cuántas maneras se podrán ubicar los amigos si: a) Cualquiera de ellos pueden conducir? Y b) Sólo uno de los siete puede conducir? Datos: Cinco lugares a ocupar y siete amigos
Desarrollo:
a) 7 5
7! 7 6 5 4 3 2 1P 7 6 5 4 3 2.520
7 5 ! 2 1E O P
b) Al solo poder conducir uno de los amigos queda libre solo 4 lugares de asiento los cuatro amigos que no pueden conducir
57
6 4
7! 6 5 4 3 2 1P 6 5 4 3 360
6 4 ! 2 1E O P
Ejemplo 02.- Se tiene un torneo de bolas criollas donde participan ocho equipos y solo se premiaran los equipos que ocupen la cuatro primeras posiciones. ¿De cuántas maneras pueden optar los equipos las cuatro primeras posiciones del torneo? Datos: Los equipos de bolas criollas y las cuatro posiciones del torneo Desarrollo:
8 4
8! 8 7 6 5 4 3 2 1P 8 7 6 5 1.680
8 4 ! 4 3 2 1E O P
6.1.5- Permutaciones con repetición: Es una forma de arreglar u ordenar una parte preestablecidas de los elementos que componen un conjunto en posiciones previamente jerarquizadas. Se señala que es con repetición si las posiciones jerarquizadas son mayores al el número de elementos que se disponen para ser posicionadas u ocupadas.
nEPO rRn r
Ejemplo 01.-Un jugador de basquetbol tiene cuatro balones para encestarlo en dos canastas. ¿De cuántas maneras pueden lo puede hacer? Datos: Los 4 balones y las 2 canastas
Desarrollo: 4
2 4P 2 16E O R
Ejemplo 02.-Una persona requiere realizar 7 llamadas telefónicas y dispone para ello de 3 celulares. ¿De cuántas maneras puede hacer las llamadas? Datos: Los 4 balones y las 2 canastas
Desarrollo: 7
3 7P 3 2.187E O R
6.1.6- Permutaciones indistinguibles: En ocasiones se presentan operaciones de permutaciones entre los cuales hay algunos elementos que, si bien son objetivamente diferentes, para loe efectos prácticos se pueden considerar iguales o idénticos. Este tipo de elementos se le conoce con el nombre de indistinguibles.
1 2. ......
1 2
!P
! ! .......kn n n
k
nEPO n
n n n
Ejemplo 01.- ¿De cuántas maneras es posible dividir un conjunto de 6 elementos en 2 subconjuntos que contengan respectivamente 4 y 2 de esos elementos?
58
Datos: Un conjunto de seis elementos y dos subconjuntos uno de 4 y otro de 2 de
esos elementos
Desarrollo: 6 4 2
6! 6 5 4 3 2 1 6 5P 15
4! 2! 4 3 2 1 2 1 2 1EPO
Ejemplo 02.-A una conferencia a realizarse en la ciudad capital de una organización benéfica la delegación de una de las provincias de un país cualquiera está integrada por 9 delegados a los cuales les asignas 3 habitaciones las cuales tienen 4, 3 y 2 camas respectivamente. ¿De cuántas maneras se podrán acomodar los integrantes de la delegación provincial? Datos: 9 delegados, 4, 3 y 2 camas
Desarrollo:
9 4 3 2
9! 9 8 7 6 5 4 3 2 1 9 8 7 6 5P 1.260
4! 3! 2! 4 3 2 1 3 2 1 2 1 3 2 1 2 1EPO
6.1.7- Combinaciones: Son arreglos de los elementos de un conjunto sin importar el
orden en que se dispongan, ya que no existen posiciones preestablecidas jerarquizadas y evitando que cada arreglo de las partes hagan igualdades.
!
r! !
nEPO nC
n r r
Propiedades de las combinaciones:
0 1 1) 1; ) ; ) ) 1n n n n nn
a b n c n y d
Ejemplo .- En un recipiente se introducen 6 bolitas azules, 7 blancas y 5 coloradas. Si se extraen en un solo puño 4 bolitas: a) ¿De cuántas maneras posibles se pueden arreglar las bolitas?, b) Maneras de que sean todas azules?, c) Todas blancas?, d) Todas coloradas? y e) Dos azules y dos blancas? Datos: 18 bolitas, 6 azules, 7 blancas y 5 coloradas
Desarrollo:
a) 18 4
18!3.060
18 4 ! 4!EPO C
b) 6 4
6!15
6 4 ! 4!Azules
EFE C
c) 7 4
7!35
7 4 ! 4!Blancas
EFE C
d) 5 4
5!5
5 4 ! 4!Coloradas
EFE C
59
e)
6 2 7 22 2
6! 7!15 21 315
6 4 ! 4! 7 4 ! 4!
Azules y BlancasEFE C C
6.2.- Reglas de la probabilidad
6.2.1.- Reglas de la Adición o Suma: Matemáticamente se define como la unión
de conjunto y gramaticalmente con la conjunción disyuntiva “o”.
6.2.1.1.- Regla General de la Adición o Suma: Aplica para eventos no
mutuamente excluyentes. Este tipo de eventos da origen a la probabilidad
conjunta, siendo ésta la probabilidad que se estudia cuando dos o más
eventos pueden ocurrir a la vez.
P (A U B)
= P (A) + P (B) – P (A y B)
P (A o B)
P (A U BUC)
= P (A) + P (B)+P(C) – P (A y B)-P(A y C)-P(B y C)+P(A y B y C)
P (A o B o C)
Ejemplo 01.- Un grupo de estudiantes se reúnen en una refresquería para conversar sobre los exámenes, un 22% consume una bebida refrescante de “Flor de Jamaica”, un 32% consume “Papelón con Limón” y un 13% consume ambas bebidas refrescantes. Si se elige uno de esos estudiantes de manera aleatoria; ¿Cuál será la probabilidad de que consuma la bebida refrescante “Flor de Jamaica” o “Papelón con Limón” Datos: El 22% toma “Flor de Jamaica”, el 32% toma “Papelón con Limón y el 13% ambas bebidas refrescantes. Desarrollo: Para identificar al evento “Flor de Jamaica” le asignamos la letra A y al evento “Papelón con Limón” la letra B
P (A)=0,22; P (B)=0,32; P (A∩B)=P (A y B)=0,13. (Probabilidad Conjunta)
P (A o B)=0,22+0,32-0,13 P (A o B)=0,41
Explicación.- La Interjección Disyuntiva “o” nos induce a interpretar el problema para aplicar una de las Reglas de la Suma, y al observar el vocablo “ambos” que establece la comunidad entre los dos eventos para dar origen a la Probabilidad Conjunta, concluiríamos en que es la Regla General de la Suma.
“Ambos” P(A∩B)=P(A y B);
“Ya sea……o” P(AUB)=P(A o B)
60
Interpretación gráfica del problema apoyándonos en un Diagrama de Venn
9% 13% 19%
Ejemplo 02.-Se realizó una encuesta entre mil ciudadanos seleccionados aleatoriamente para determinar cuáles son los centros comerciales más visitados en el área metropolitana, dando los siguientes resultados: 516 persona visitan el Centro Comercial A, 452 el Centro Comercial B y 393 el Centro Comercial C. Es posible que los entrevistados visiten otros centros comerciales, en este sentido se verificó que 182 visitan a los centros comerciales A y B, 148 a los centros comerciales A y C, 166 a los centros comerciales B y C y 74 visitan los tres centros comerciales. Si de manera aleatoria seleccionamos uno de los ciudadanos que fueron encuestados en este estudio;¿Cuál será la probabilidad de que visite al centro comercial A, al B, al C; al A y B, al A y C, al B y C o a todos los centros comercial? Datos: Visitas: A=516, B=452, C=393, (A y B)=182, (A y C)=166, (B y C)=166 y 74 a todos los centros comerciales
Desarrollo:
Siendo EPO=1.000, entonces las probabilidades de los eventos simples y conjuntos serían: P(A)=0,516; P(B)=0,452; P(C)=0,393; P(A y B)=0,182; P(A y C)=0,148; P(B y C)=0,166 y P(A y B y C)=0,074
P (A o B o C)=0516+0,452+0,393-0,182-0,148-0,166+0,074
P (AUBUC)=0,9390
Pap. con
Limon
61
Interpretación gráfica del problema apoyándonos en un Diagrama de Venn
A∩B=182 B∩C=166 A∩B∩C=74 A∩C=148
6.2.1.2.- Regla Especial de la Adición o Suma: Aplica para eventos
mutuamente excluyentes.
P (A U B)
= P (A) + P (B)
P (A o B)
P (A U BUC)
= P (A) + P (B) + P(C)
P (A o B o C)
Ejemplo.- En un recipiente se introducen 6 bolitas azules, 7 blancas, 5 coloradas y 8 doradas. Si se extrae una bolitas; ¿Cuál será la probabilidad de que: a) Sea azul o colorada?, b) Blanca o dorada?, c) Azul, blanca o dorada? y d) Colorada y dorada? Datos: 26 bolitas, 6 azules, 7 blancas, 5 coloradas y 8 doradas
Desarrollo:
26 1 26n rEPO . Cada grupo de bolitas representa un evento por lo
que: Bolitas Azules evento A, bolitas Blancas evento B, bolitas Coloradas evento C y bolitas Doradas D. Apoyándonos en el enfoque clásico de las
probabilidades donde ( ) EFEP EEPO
definimos cada una de las
probabilidades del Espacio Muestral de este experimente por lo tanto: P(A)=3/13; P(B)=7/26; P(C)=5/26 y P(D)=4/15. Sin entrar en extensas explicaciones, a las claras observamos que son eventos mutuamente excluyentes en una operación inducida por la conjunción disyuntiva “o”, por lo tanto se aplica la Regla Especial de la Suma.
a) 11
0,3 5
13 242
631
26P AC CP A o
62
b) 15
0,7 4
26 157
369
26P BD DP B o
c) 3 7 4
13 26 1
210,8077
23 6P Ao BP DA o B D
d) 0P CD DP C y Probabilidad imposible ya que no existe
una bolita que contenga en si misma el color colorado y el color dorado, a eso es a lo que nos induce la conjunción copulativa “y” es un vocablo inclusivo.
Probabilidad Complementaria.- Para que exista alguna Probabilidad Complementaria los eventos tienen que ser mutuamente excluyentes
pudiéndose considerar como un caso particular de la Regla Especial de la Suma, su expresión matemática sería:
1 ( );
" "
C
C
P E P E
Donde P E es la probabilidad del complemento de E
Supongamos que en el ejemplo anterior se nos incluya las preguntas: e) Colorada y f) Ninguna azul.
e) 21
1 ( ) 1 15
0,19232626
CP C P CP C P A B D
f) 3
1 ( ) 11
100
133,7692P P B C DB oC o D P A
Interpretación gráfica del problema apoyándonos en un Diagrama de Venn, como se puede observar no hay elementos comunes entre ninguno de los eventos, es decir
no hay intercepciones.
63
6.2.2.- Reglas de la Multiplicación: Matemáticamente se define como la intersección de conjuntos y gramaticalmente por la conjunción copulativa “y”.
6.2.2.1.- Regla General de la Multiplicación: Aplica para eventos dependientes. Este tipo de eventos son la consecuencia para que se produzcan las Probabilidades Condicionales las cuales por su importancia se le dedicará especial estudio.
P (A ∩ B)
= P(A) x P (B/A)
P (A y B)
P (A ∩ B∩C)
= CBP A P PA B
A
P (A y B y C)
Ejemplo.- En un recipiente se introducen 6 bolitas azules, 7 blancas, 5 coloradas y 8 doradas. Si se extraen tres bolitas una a una y sin reemplazo; ¿Cuál será la probabilidad de que en cada extracción las bolitas salgan de la siguiente manera: a) Azul, blanca y colorada?, b) Blanca, dorada y azul?, c) Azul, blanca y dorada?, d) Colorada, colorada y dorada? Y f) Azul, azul, y azul Datos: 26 bolitas, 6 azules, 7 blancas, 5 coloradas y 8 doradas
Desarrollo:
a) 6 7 5
26 25 20,013
45
CBP AA B
CP A
BA
BA
A
b) 7
0,0215325
7 8 6
26 25 24
ADP BB D
AP B
DB B
DB
c) 7
0,0135520
6 7 8
26 25 24
DBP AA B
DP A
BA A
BA
d) 2
0,0103195
5 4 8
26 25 24
DCP CC C
DP C
CC C
CC
e) 1
0,0077130
6 5 4
26 25 24
AAP AA A
AP A
AA A
AA
64
6.2.2.2.- Regla especial de la multiplicación: Aplica para eventos
independientes
P (A ∩ B)
= P(A) x P (B)
P (A y B)
P (A ∩ B∩C)
= P A P B P C
P (A y B y C)
Ejemplo 01.- En un recipiente se introducen 6 bolitas azules, 7 blancas, 5 coloradas y 8 doradas. Si se extraen tres bolitas una a una y con
reemplazo; ¿Cuál será la probabilidad de que en cada extracción las bolitas salgan de la siguiente manera: a) Azul, blanca y colorada?, b) Blanca, dorada y azul?, c) Azul, blanca y dorada?, d) Colorada, colorada y dorada? Y f) Azul, azul, y azul Datos: 26 bolitas, 6 azules, 7 blancas, 5 coloradas y 8 doradas
Desarrollo:
a) 6 7 5
26 2
1050,0119
826 8.786P AB CA BP C
b) 7 8 6
26 2
420,0191
2.196 76 2P BP B D D AA
c) 6 7 8
26 2
420,0191
2.196 76 2P AP A B B CD
d) 5 5 8
26 2
250,0114
2.196 76 2P CP C C C DD
e) 6 6 6
26 2
270,0123
2.196 76 2P AP A A A AA
Ejemplo 02.- Se lanzan dos dados y una moneda previamente calibrados para garantizar la pureza del experimento, los dados son uno azul y el
otro blanco; ¿Cuál será la probabilidad que: a) En el dado azul caiga un número par, en el dado blanco un tres y en la moneda el sello? y b) En el dado azul salga un número mayor que el cuatro, en el dado blanco un número menor o igual al tres y en la moneda una cara? Datos: Los seis eventos en un dado azul, los 6 eventos en un dado blanco y los eventos cara y sello de la moneda. Dado azul=A; dado blanco=B y moneda=C Desarrollo: Al ser evento independientes ya que lo que ocurra en
cualquiera de los instrumentos de experimentación no tienen incidencia
65
entre uno del otro por lo tanto se aplica la Regla Especial de la
Multiplicación
a) 3 1 1
6
10,0417
246 2P A B CP A B C
b) 2 3 1
6
10,0833
126 2P A B CP A B C
Probabilidad Condicional.- La Probabilidad Condicional es muy utilizada en el estudio de probabilidades, ya que en muchos estudios de las mismas requieren de la utilización de circunstancia adicionales. Son términos muy usuales en la utilización de Probabilidades Condicionales
el “si” condicional, o “dado que”
;( ) ( )
P A B P A y B P A B P A y BB AP o P
A BP A P A P B P B
Ejemplo 01.- en un curso de Estadística Aplicada de 44 estudiantes hay 11 que obtuvieron más de 14 puntos en Matemática Financiera, 8 más de 12 puntos en Matemática Instrumental y 5 de los contados anteriormente cumplieron con esas notas. Si seleccionamos aleatoriamente uno de esos estudiantes y se comprueba que aprobó Matemática Financiera con más de 15 puntos, ¿Cuál será la probabilidad de que haya aprobado Matemática Instrumental con más de 12 puntos
Datos: 11 estudiantes con más de 14 puntos, en Mat. Fin., 8 estudiantes con más de 12 puntos en Mat. Inst. y 5 estudiantes cumplieron con ambas condiciones Desarrollo: Evento A estudiantes con más de 14 puntos de Mat. Financiera, Evento B estudiantes con más de 12 puntos en Mat. Instrumental y evento A∩B estudiantes que cumplen con ambas condiciones.
11 8 2 5;
44 44 11 44
5
54411 11
50,4545
11
44
P A P B Y P A B
A BPA
BPA
Ejemplo 02.- En una empresa manufacturera dedicada a fabricar elementos eléctricos trabajan 1.150 personas 652 hombres y 498 mujeres. En los últimos años fueron ascendidos 426 trabajadores entre hombres y mujeres (Hombres 264 y mujeres 162). Si de manera aleatoria seleccionamos una persona de esos trabajadores, ¿Cuál será la probabilidad de que sea: a) Mujer si se sabe que está entre los ascendidos? y b) hombre si sabe que está entre los no ascendidos?
66
Datos: Hombres=652, mujeres=498; ascendidos=426, no ascendidos=724,
hombres no ascendidos=388 y mujeres ascendidas=162
Desarrollo: Evento ascendido=A, Evento no ascendidos=B, evento hombre=C, evento
mujer=D, hombres no ascendidos=(B∩C) y evento mujeres ascendidas=(A∩D).
P(A)=213/575; P(B)=362/575; P(A∩D)=81/575 y P(B∩C)=194/575
a)
8181575
213 213
57
270,3803
71
5
P A DD
PP
AA ADP
b)
194194575
362 362
57
970,5359
5
181D
P B CCP
P BB BP
6.3.- Instrumentos de apoyo a las probabilidades
6.3.1.- Tablas de contingencias: Tablas que se utilizan para clasificar las observaciones de la muestra de acuerdo con dos o más características que se puedan identificar. Estas tablas dan origen a las tablas de probabilidades y tablas de probabilidades condicionales, útiles en la elaboración del diagrama del árbol y en la aplicación para el cálculo del teorema de Bayes. Así mismo es una de las maneras más efectiva para estudiar las probabilidades de acuerdo al enfoque relativo o empírico.
Ejercicio 01.-.- Se realizarán los barajos suficientes a un juego de naípes
españoles que consta de 40 cartas, para garantizar la confiabilidad de las experimentaciones. Al extraer una carta del juego de naipes se quiere conocer la probabilidad de que ésta sea: a) Un cinco, b) Un Rey de Copas, c) Un basto, d) Una figura de Oros, e) Un siete o un As, f) Una Espada o una Figura y g) Si se selecciona un As; ¿Cuál será la probabilidad que sea de Oro?
TABLA DE CONTINGENCIA DE LOS NAÍPES
Palos
Pintas
1 (As)
( A1)
2
(A2)
3
(A3)
4
(A4)
5
(A5)
6
(A6)
7
(A7)
10(Sot)
(A8)
11(Cab)
(A9)
12(Rey)
(A10)
Total
Bastos (B1) 1 1 1 1 1 1 1 1 1 1 10
Copas (B2) 1 1 1 1 1 1 1 1 1 1 10
Espadas (B3) 1 1 1 1 1 1 1 1 1 1 10
Oros (B4) 1 1 1 1 1 1 1 1 1 1 10
Total 4 4 4 4 4 4 4 4 4 4 40
Figuras (F)=12
40 1 40EPO
67
a) Cinco = Evento A. Como no señalan ¿Cuál es el palo del cinco?, se consideran todos los cincos, es decir 4, por lo tanto:
10,100
0
4
400
1P PA A
b) Un Rey de Copas = Evento B. Solo existe un Rey de Copas, por lo tanto
1
0,0250
1
400
4P PB B
c) Basto = Evento C. Como no señalan ¿Cuál es la pinta de la copa?, por lo tanto se consideran todas las copas, es decir 10, por lo tanto:
10
40
10,2500
4PP CC
d) Una figura de Oro = Evento D. Solo existen tres figuras de oro por lo tanto:
30,075
0
3
400
4P PD C
e) Un Siete o un As = Evento E. Al observar la Tabla de Contingencia de los naipes españoles vemos que las columnas del Siete y del As no tienen elementos en común, es decir no se interceptan; por lo tanto se nos presenta la Regla Especial de la Suma, entonces:
1 7
4 4 8
40 40 40
10,2000
5P E P A A P C
f) Una Espada o una Figura = Evento F. Al observar la Tabla de Contingencia de
los naipesespañoles vemos que la fila de las Espadas tiene tres elementos comunes con la columnas de las figuras, es decir se interceptan en tres elementos; por lo tanto se nos presenta la Regla General de la Suma, entonces:
3
10 12 3 19
40 40 40
190,4750
4040PP P CF B F
g) Para que salga el Oro se está condicionando que tiene que ser el As, por lo tanto:
4 1
1
4 1
1
10,2500
4
1
4
B AP
A AB A
P
Ejemplo 02.- En una empresa manufacturera dedicada a fabricar
elementos eléctricos trabajan 1.150 personas 652 hombres y 498 mujeres. En los últimos años fueron ascendidos 426 trabajadores entre hombres y mujeres (Hombres 264 y mujeres 162). Si de manera aleatoria seleccionamos una persona de esos trabajadores, ¿Cuál será la probabilidad de que sea: a) Mujer si se sabe que está entre los ascendidos? y b) hombre si sabe que está entre los no ascendidos? Datos: Hombres=652, mujeres=498; ascendidos=426, no ascendidos=724, hombres no ascendidos=388 y mujeres ascendidas=162
Desarrollo:
68
Como podrá observarse es el mismo ejercicio 02 del punto referido a las Probabilidades Condicionales el cual vamos a resolver aplicando Tablas de Contingencias.
TABLA DE CONTINGENCIA
Sexo Condición
Hombres (C)
Mujeres (D)
Total
Ascendido (A) 264 162 426
No ascendido (B) 388 336 724
Total 652 498 1.150
a) Para que sea mujer la persona seleccionada se condiciona a que
ésta se encuentre entre las personas ascendidas, por lo tanto:
162
426
270,3803
71D
P A DDP P
AA P A
b) Para que sea hombre la persona seleccionada se condiciona a que
ésta se encuentre entre las personas no ascendidas, por lo tanto:
388
72
970,5359
1814DP
P B
B
CCP
B P B
6.3.2.- Diagrama del Árbol: Es una gráfica que se utiliza para organizar los cálculos que comprenden varias etapas, cada etapa se representa por ramas las cuales se ponderan por medio de probabilidades. Es una herramienta muy efectiva para el cálculo de probabilidades conjuntas. Tomemos la tabla de contingencia del problema anterior:
TABLA DE CONTINGENCIA
Sexo Condición
Hombres (C)
Mujeres (D)
Total
Ascendido (A) 264 162 426
No ascendido (B) 388 336 724
Total 652 498 1.150
Con esta tabla de contingencia elaboremos un diagrama del árbol tomando como tronco primario la condición de cada trabajador en cuanto a la mejora obtenida.
69
DIAGRAMA DEL ÁRBOL
Hombres
4471
CPA
Ascendido
213575
P A
Mujeres
2771
DPA
Cond. Hombres
97181
CPB
No ascendido
362575
P B
Mujeres
84181
DPB
213 44 1320,2296
575 71 575
CP A PA
213 27 810,1409
575 71 575
DP A PA
362 97 1940,3374
575 181 575
CP B PB
362 84 1680,2922
575 181 575
DP B PB
6.3.3.- Teorema de Bayes: Una probabilidad condicional a posteriori, se obtiene
partiendo de una probabilidad a priori inicial basada en un nivel de información en el momento la cual es revisada tomando como sustento información adicional. Es un teorema que permite verificar las probabilidades existentes en el momento actual basándose en información obtenida por muestreo. Una probabilidad a priori es regulada mediante evidencia empírica para obtener para obtener una probabilidad a posteriori, siguiendo el siguiente esquema:
Esquema Sugerido
Probabilidad a priori P(A) +
Probabilidad de Evidencia Empírica P(B/A)
Probabilidad a posteriori P(A/B)
Consideremos la Regla General de la Multiplicación y la propiedad conmutativa de
esta operación matemática que establece que el orden de los factores no altera el producto, por lo que:
1
BP A PAB A AP A B P B A P A P P B P P
A B B P B
Siendo ésta otra manera de expresar la Probabilidad Condicional. También sabemos que:
70
1 21 2 1
..........n
n in ii
B B B BP B P P A P P A P P A P P AA A A A
Sustituyendo en 1 y generalizando se tiene que:
1 21 2
1
..........
iii
nn
iii
n
iii
BP A PAA
PB
B B BP P A P P A P P AA A A
BP A PAA
PB
BP P AA
Esta es la expresión matemática del Teorema de Bayes
Ejemplo.- En la Tabla de Contingencia que se presenta al final resume los datos de la fabricación de un artículo mediante tres máquinas, donde se contabilizan la producción de artículos por cada máquina y la condición de cada artículo. Se pide: a) ¿Cuál será la probabilidad que al seleccionar de manera aleatoria un artículo defectuoso éste provenga de la Máquina 02? y b) ¿Cuál será la probabilidad de que al seleccionar de manera aleatoria un artículo sin defectos este provenga de la Máquina 01?
Estado
Equipo
Sin Defectos
1A
Defectuoso
2A
Total
Máquina 01 1B 36 5 41
Máquina 02 2B 43 7 50
Máquina 03 3B 21 3 24
Total 100 15
115
Desarrollo:
Del Diagrama del árbol que se encuentra al final podemos obtener los
valores para aplicar el Teorema de Bayes.
71
22
22
2 2 2 21 2 3
2
1
2
2 3
7
1151 7 3
23 115 1
7
15
15
AP B P
BBP
A A A AP P B P P B P P B
B B
BP
A
B
1
11
11
1 1 1 11 2 3
1 3
1
2
36
11536 43 21
115 1
25
15
9
115
AP B P
BBP
A A A AP P B P P B P P B
B B B
BP
A
Desarrollo:
DIAGRAMA DEL ÁRBOL
Sin Defectos
1
1
36
41
AP
B
11
1
41 36 360.3130
115 41 115
AP B P
B
Máquina 01
1
41
115P B
Defectuosos
2
1
5
41
AP
B
21
1
41 5 10,0435
115 41 23
AP B P
B
Sin Defectos
1
2
43
50
AP
B
12
2
10 43 430,3739
23 50 115
AP B P
B
Equipos
Máquina 02
2
10
23P B
Defectuosos
2
2
7
50
AP
B
22
2
10 7 70,0609
23 50 115
AP B P
B
Sin Defectos
1
3
7
8
AP
B
12
2
10 43 430,3739
23 50 115
AP B P
B
Máquina 03
3
24
115P B
Defectuosos
2
3
1
8
AP
B
23
3
24 1 30,0261
115 8 115
AP B P
B
72
Problemas Resueltos
PROBLEMA 01.- Una urna contiene tres bolas rojas y s ie te b lancas. Se extraen dos bolas al azar. Escr ib ir e l espacio muestral y hal lar la probabil idad de: a) Extraer las dos bolas con reemplazamiento.
b) Sin reemplazamiento.
PROBLEMA 02.- Se extrae una bola de una urna que contiene 4 bolas ro jas, 5 blancas y 6 negras, ¿cuál es la probabil idad de que la bola sea ro ja o blanca? ¿Cuál es la probabil idad de que no sea blanca?
PROBLEMA 03. - En una clase hay 10 alumnas rubias, 20 morenas, c inco alumnos rubios y 10 morenos. Un día as is ten 44 alumnos, encontrar la probabil idad de que el alumno que falta: a) Sea hombre.
b) Sea mujer morena.
c) Sea hombre o mujer.
PROBLEMA 04.- Un dado está trucado, de forma que las probabil idades de obtener las dis tintas caras son proporcionales a los números de estas. Hallar:
a) La probabil idad de obtener el 6 en un lanzamiento.
73
b) La probabil idad de conseguir un número impar en un lanzamiento.
PROBLEMA 05.-Se lanzan dos dados al aire y se anota la suma de los puntos obtenidos. Se pide: a) La probabil idad de que salga el 7.
b) La probabil idad de que el número obtenido sea par.
c) La probabil idad de que el número obtenido sea múlt ip lo de tre s.
PROBLEMA 06.- Se lanzan tres dados. Encontrar la probabil idad de que: a) Salga 6 en todos.
b) Los puntos obtenidos sumen 7.
PROBLEMA 07.- Hallar la probabil idad de que al levantar unas f ichas de dominó se obtenga un número de puntos mayor que 9 o que sea múltip lo de 4.
PROBLEMA 08.- Busca la probabil idad de que al echar un dado al aire, salga: a) Un número par.
b) Un múltip lo de tres.
74
c) Mayor que cuatro.
PROBLEMA 09.-
Hallar la probabil idad de que al lanzar al aire dos monedas, salgan: a) Dos caras.
b) Dos cruces.
c) Dos caras y una cruz.
PROBLEMA 10.- En un sobre hay 20 papeletas, ocho l levan dibujado un coche las restantes son blancas. Hallar la probabil idad de extraer al menos una papeleta con el dibujo de un coche: a) Si se saca una papeleta.
b) Si se extraen dos papeletas.
c) Si se extraen tres papeletas.
PROBLEMA 11.- Los estudiantes A y B tienen respectivamente probabil idades 1/2 y 1/5 de suspender un examen. La probabil idad de que suspendan el examen simultáneamente es de 1/10. Determinar la probabil idad de que al menos uno de los dos estudiantes suspenda el examen.
75
PROBLEMA 12.- Dos hermanos salen de caza. El pr imero mata un promedio de 2 piezas cada 5 disparos y el segundo una pieza cada 2 disparos. Si los dos disparan al mismo tiempo a una misma pieza, ¿cuál es la probabil idad de que la maten?
PROBLEMA 13.- Una c lase consta de 10 hombres y 20 mujeres; la mitad de los hombres y la mitad de las mujeres tienen los ojos castaños. Determinar la probabil idad de que una persona elegida al azar sea un hombre o tenga los ojos castaños.
Sexo T. Ojos
Hombre A1
Mujer A2
∑B i
Castaños B1 5 10 15
No Castaños B2 10 20 30
∑A i 15 30
PROBLEMA 14.- La probabil idad de que un hombre viva 20 años es ¼ y la de que su mujer v iva 20 años es 1/3. Se pide calcular la probabil idad: a) De que ambos vivan 20 años.
b) De que el hombre viva 20 años y su mujer no.
c) De que ambos mueran antes de los 20 años.
PROBLEMA 15.- En una clase en la que todos practican algún deporte, e l 60% de los alumnos juega al fútbol o al baloncesto y el 10% practica ambos deportes. Si además hay un 60% que no juega al fútbo l, ¿cuál será la probabil idad de que escogido al azar un alumno de la clase:
a) Juegue sólo al fútbol.
76
b) Juegue sólo al baloncesto.
c) Practique uno solo de los deportes.
d) No juegue ni al fútbol ni al baloncesto.
Problemas de Probabilidades Condicionales
PROBLEMA 16.- En un centro escolar los alumnos pueden optar por cursar como lengua extranjera inglés o f rancés. En un determinado curso, e l 90% de los alumnos estudia inglés y el resto f rancés. El 30% de los que estudian inglés son chicos y de los que estudian f rancés son chicos el 40%. El e legido un alumno al azar, ¿cuál es la probabil idad de que sea chica?
p(chica) = 0.9 · 0.7 + 0.1 · 0.6 = 0.69 PROBLEMA 17.- De una baraja de 48 cartas se extrae simul táneamente dos de el las. Calcular la probabil idad de que: a) Las dos sean copas.
77
b) Al menos una sea copas.
c) Una sea copa y la o tra espada
PROBLEMA 18.- Ante un examen, un alumno sólo ha estudiado 15 de los 25 temas correspondientes a la mater ia del mismo. Éste se real iza en trayendo al azar dos temas y dejando que el alumno escoja uno de los dos para ser examinado del mismo. Hal lar la probabil idad de que el alumno pueda elegir en el examen uno de los temas estudiados
PROBLEMA 19.-Una clase está formada por 10 chicos y 10 chicas; la mitad de las chicas y la mitad de los chicos han elegido f rancés como asignatura optativa. a) ¿Cuál es la probabil idad de que una persona elegida al azar sea chico o
estudio f rancés?
b) ¿Y la probabil idad de que sea chica y no estudié f rancés?
PROBLEMA 20.- Un tal ler sabe que por término medio acuden: por la mañana tres automóviles con problemas eléctr icos, ocho con problemas mecáni cos y tres con problemas de latoneríaa, y por la tarde dos con problemas eléctr icos, tres con problemas mecánicos y uno con problemas de chapa.
a) Hacer una tabla ordenando los datos anter iores.
Prob. T. Ojos
Elect. A1
Mecan. A2
Laton. ∑B i
Mañana B1 3 8 3 14
Tarde B2 2 3 1 6
78
∑A i 5 11 4 20
b) Calcular e l porcentaje de los que acuden por la tarde.
c) Calcular e l porcentaje de los que acuden por problemas mecánicos.
d) Calcular la probabil idad de que un automóvil con problemas eléctr icos
acuda por la mañana.
PROBLEMA 21.- Una c lase consta de 6 niñas y 10 niños. Si se escoge un comité de tres al azar, hallar la probabil idad de:
a) Seleccionar tres niños.
b) Seleccionar exactamente dos n iños y una niña.
79
c) Seleccionar por lo menos un niño.
d) Seleccionar exactamente dos niñas y un niño
PROBLEMA 22.- Una caja contiene tres monedas. Una moneda es corr iente, o tra t iene dos caras y la o tra está cargada de modo que la pro babil idad de obtener cara es de 1/3. Se selecciona una moneda lanzar y se lanza al aire. Hallar la probabil idad de que salga cara.
PROBLEMA 23.- Una urna contiene 5 bolas ro jas y 8 verdes. Se extrae una bola y se reemplaza por dos del otro color. A continuación, se extrae una segunda bola. Se pide: a) Probabil idad de que la segunda bola sea verde.
80
b) Probabil idad de que las dos bolas extraídas sean del mismo color .
PROBLEMA 24.- En una c iudad, e l 40% de la poblac ión t iene cabellos castaños, e l 25% tiene o jos castaños y el 15% tiene cabellos y ojos castaños. Se escoge una persona al azar: a) Si t iene los cabel los castaños, ¿cuál es la probabil idad de que tenga
también ojos castaños?
Cabellos Ojos
Castaño A1
No Castaño A2
∑Bi
Cataño B1 15 10 25
No castaño B2 25 50 75
∑Ai 40 60 100
b) Si tiene ojos castaños, ¿cuál es la probabil idad de que no tenga cabellos
castaños?
c) ¿Cuál es la probabil idad de que no tenga cabellos ni o jos castaños?
PROBLEMA 25.- En un aula hay 100 alumnos, de los cuales: 40 son hombres, 30 usan lentes, y 15 son varones y usan lentes. S i seleccionamos al azar un alumno de dicho curso: a) ¿Cuál es la probabil idad de que sea mujer y no use lentes?
Sexo Hombres Mujeres
81
Lentes A1 A2 ∑Bi
Usan B1 15 15 30
No Usan B2 25 45 70
∑Ai 40 60 100
b) Si sabemos que el alumno seleccionado no usa gafas, ¿qué probabil idad
hay de que sea hombre?
PROBLEMA 26.- Disponemos de dos urnas: la urna A contiene 6 bolas ro jas y 4 bolas blancas, la urna B contiene 4 bolas rojas y 8 bolas blancas. Se lanza un dado, s i aparece un número menor que 3; nos vamos a la urna A; s i e l resultado es 3 ó más, nos vamos a la urna B. A continuación extraemos una bola. Se pide: a) Probabil idad de que la bola sea roja y de la urna B.
b) Probabil idad de que la bola sea blanca.
PROBLEMA 27.- Un estudiante cuenta, para un examen con la ayuda de un despertador, e l cual consigue despertarlo en un 80% de los casos. Si oye el despertador, la probabil idad de que real iza el examen es 0.9 y, en caso contrar io, de 0.5
82
a) Si va a real izar el examen, ¿cuál es la probabil idad de que haya oído el despertador?
b) S i no real iza el examen, ¿cuál es la probabil ida d de que no haya oído el despertador?
PROBLEMA 28.- Se supone que 25 de cada 100 hombres y 600 de cada 1000 mujeres usan gafas. Si e l número de mujeres es cuatro veces superior al de hombres, se pide la probabil idad de encontrarnos: a) Con una persona sin gafas.
b) Con una mujer con gafas.
PROBLEMA 29.- En una estanter ía hay 60 novelas y 20 l ibros de poesía. Una persona A elige un l ibro al azar de la estanter ía y se lo l leva. A continuación otra persona B elige otro l ibro al azar
a) ¿Cuál es la probabil idad de que el l ibro selecc ionado por B sea una novela?
83
b) Si se sabe que B el ig ió una novela, ¿cuál es la probabil idad de que el l ibro seleccionado por A sea de poesía?
PROBLEMA 30.- En una casa hay tres l laveros A, B y C; e l pr imero con cinco l laves, e l segundo con sie te y el tercero con ocho, de las que sólo una de cada l lavero abre la puerta del trastero. Se escoge a Lázaro l lavero y, de él, una l lave intenta abr ir e l trastero. Se pide:
a)¿Cuál será la probabil idad de que se acier te con la l lave?
b) ¿Cuál será la probabil idad de que el l lavero escogido sea el tercero y la l lave no abra?
84
c) Y si la l lave escogida es la correcta, ¿cuál será la probabil idad de que pertenezca al pr imer l lavero A?
Capítulo 08
Distribución de Probabilidad
1. Distribución de probabilidad: Lista de todos los resultados de un experimento y la probabilidad relacionada con cada uno de ellos. Si se observaran las Frecuencias Relativas en una Distribución de Frecuencias de una población, se podría aceptar que la Distribución de Probabilidades guarda relación con la Distribución de Frecuencias Relativas
2. Variable Aleatoria: Resultado obtenido al azar de un experimento y que puede asumir diferentes valores. En otras palabras es una función de términos numéricos, cuyo valor está regido por factores en los cuales interviene el azar. 2.1.- Tipos de variable aleatoria.
2.1.1- Variable aleatoria discreta: Variable aleatoria que puede asumir solamente valores que claramente se puedan contar.
2.1.2- Variable aleatoria continua: Variable aleatoria que supone un número infinito de valores dentro de un rango o intervalo determinado, es decir puede asumir cualquier valor dentro de ese rango o intervalo
3. Esperanza matemática, valor esperado o media de una distribución de probabilidad discreta: Es un valor típico que se utiliza para representar la ubicación central de una distribución de probabilidad, es decir, es un valor esperado de una variable aleatoria a través de una media ponderada de todos los posibles resultados en los cuales lo pesos son las respectivas probabilidades de tales resultados. La Esperanza Matemática o Valor Esperado se obtiene de la siguiente manera:
1
; .
n
i ii
i i
x P x
x es el valor que toma la Variable Aleatoria y P x es la probabilidad relacionada con ella
4. Varianza y Desviación Estándar: La Varianza es un valor que describe la cantidad de
dispersión o variación de una distribución cualquiera, y la Desviación Estándar es la raíz cuadrada de la Varianza.
85
Varianza: 22
1
n
i ii
x P x
Desviación Estándar:
Problemas Resueltos
Problema 01 De manera aleatoria se seleccionan las notas de ocho estudiantes de Estadística Instrumental las cuales fueron: 11 09 12 12 15 09 11 12. Con estos datos se pide desarrollar una Distribución de Probabilidades y de allí obtener: a) La Esperanza Matemática o Valor Esperado, la Varianza y la Desviación Estándar o Desviación Típica; b) Si seleccionamos de manera aleatoria una de esas ocho notas; ¿Cuál es la probabilidad de que sea: i.- Exactamente 12? y ii.- No más de 11? Desarrollo
EFAP E
EPO
ix
if
iEFA
ix
iP x
ESPERANZ
A MATEMÁT.
VARIANZA DESVIAC.
ESTÁND.
i ix P x
2
2
i ix P x
2
09 2 09
EFA
3,234 11 2
11EFA 09 0,250 2,250 1,410
12 3 12
EFA 11 0,250 2,750 0,035
15 1 15
EFA 12 0,375 4,500 0,146
EPO 8
15 0,125 1,875 1,643
∑ 1,00 11,375
2 3,234 1,798
) 12 11
; ) 0,20,3 5 0,2575 0,50
b Evento B Exactamente igual a y Evento C no más de
y c P P CCP B
Problema 02.- Una moneda previamente calibrada se lanza 5 veces. Se pide: a) Desarrollar una Distribución de Probabilidades, y Calcular la Esperanza Matemática o Valor Esperado, la Varianza y la Desviación Estándar o Desviación Típica, b) ¿Cuál será la probabilidad que caigan exactamente 2 caras? y c) ¿ Cuál es la probabilidad de que caiga no menos de 4 caras?
86
Desarrollo5; 2 32
EFAP E EPO EPO
EPO a)
ix
if
iEFA
ix
iP x
ESPERANZ
A
MATEMÁT.
VARIANZA DESVIAC.
ESTÁND.
i ix P x
2
2
i ix P x
2
0 1 0
EFA
1,25
1 5 1
EFA 0 0,03125 0,000 0,195
2 10 2
EFA 1 0,15625 0,1563 0,352
3 10 3
EFA 2 0,31250 0,6250 0,078
4 5 4
EFA 3 0,31250 0,9375 0,078
5 1 5
EFA 4 0,15625 0,6250 0,352
EPO 32
5 0,03125 0,1562 0,195
∑ 1,00 2,500 2 1,250 1,118
) 2 4
; ) 0,15620,3125 0,15 0,03125 875P B
b Evento B Exactamente y Evento no menos de
y c P P CC
Problema 03.- Al final se presentan tres distribuciones diferentes. Diga: ¿Cuál de las tres es una Distribución de Probabilidades? Si alguna de ella resultarse ser de probabilidades calcular la Esperanza Matemática, la Varianza y la Desviación Típica
xi P(xi) xi P(xi) xi P(xi)
1 0,20 2 0,18 1 0,42
3 0,25 4 0,28 4 -0,20
5 0,18 6 0,20 6 0,38
7 0,36 8 0,34 9 0,40
Desarrollo Las probabilidades de la primera suma 0,99; la segunda 1 (Uno) con todos valores positivos y
la tercera 1 (Uno) pero con un valor negativo, como los valores probables de un espacio
muestral deben sumar 1 (Uno) con todos los valores positivos, se concluye que: la Distribución
de Probabilidades es la segunda.
87
ix
iP x
ESPERANZA MATEMÁT.
VARIANZA DESVIAC. ESTÁND.
i ix P x
2
2
i ix P x
2
5
2 0,18 0,36 2,081
4 0,28 1,12 0,549
6 0,20 1,20 0,072
8 0,34 2,72 2,298
∑ 1,00 5,400 2 5,000 2,236
Problema 04.- Pedro Iriarte vende carros usados en la empresa de su propiedad Inversiones
Iriarte C. A. Por lo general Pedro vende la mayor cantidad de automóviles el jueves. Él
desarrolló para la venta de automóviles en los días jueves de un año cualquiera la siguiente
Distribución de Probabilidades:
Cantidad de Carros
Vendidos
(xi)
Probabilidades P(xi)
0 0,15
1 0,35
2 0,30
3 0,10
4 0,10
Total 1,00
a) ¿Qué tipo de Distribución es? b) ¿Cuántos carros espera vender Pedro un jueves normal?
c) ¿Cuál será la Varianza y la Distribución Estándar de la distribución? Solución
,
.
2 ,)
1,
) Es una Distribución de Variable Aleatoria Discreta ya que los carros son elementos
claramente contables usandovalores enteros positivos
Pedro esperaría vender en un jueves normal carros ya que la Esperanza
Matemática es
a
b
65
)
2.
c
88
ix
iP x
ESPERANZA MATEMÁT.
VARIANZA DESVIAC. ESTÁND.
i ix P x
2
2
i ix P x
2
1,327
0 0,15 0,00 0,408
1 0,35 0,35 0,148
2 0,30 0,60 0,037
3 0,10 0,30 0,182
4 0,10 0,40 0,552
∑ 1,00 1,65 2 1,327 1,152
Capítulo 09
Distribución de Probabilidades de Variables Aleatorias Discretas Especiales
1. Distribución de Probabilidades Binomial Hablar de binomial en Distribución de Variable Discreta es hablar de solo dos eventos, que pueden ser agrupados en dos clases o categorías, por lo tanto los datos son nominales. Las categorías o clases deben ser mutuamente excluyentes, de manera que sea eminente establecer a que clase pertenece una observación en particular, por lo que las clases deben ser colectivamente exhaustivas, lo cual garantiza que los resultados no cambien, por lo tanto se concluye que una Distribución de Probabilidad Binomial: “Es una distribución de variable aleatoria discreta donde existe un número fijo de ensayos repetidos (n) y donde cada uno al experimentarlos concluye en sólo uno de dos resultados mutuamente excluyentes, favorables (éxito) o desfavorable (fracaso); el resultado de éxito de un evento es fijo, los ensayos se realizan con reemplazo, siendo independientes, interesándonos el número de éxito en n pruebas” Ejemplo de variables aleatorias que se podrían considerar como binomiales: repuestas de verdadero o falso de una evaluación, clasificación de los resultados de un examen entre aprobados y aplazados, productos observados con defectos o sin defectos, el resultado de una maternidad varón o hembra, son algunas de las consideraciones de la infinitas situaciones binomiales que se puedan presentar. Manera de calcular la probabilidad de este distribución;
89
x n x x n x
n x
nP x p q p q
x
Valor esperado: = ; Varianza:
= Operación de combinación
= Número de ensayos o pruebas
= Variable aleatoria definida como el número de éxito al que se le va a calcular la
probabilidad de su ocurrencia = Proporción que establece la probabilidad de éxito en cada ensayo o prueba
= Proporción que establece la probabilidad de fracaso en cada ensayo o prueba.
De lo anterior se concluye que:
1
1
q p
p q
p q
Esperanza Matemática o Valor Esperado: np
Varianza: 2 q npq
Desviación Estándar o Desviación Típica: 2 2 q npq
Problemas Resueltos
Problema 01.-Suponga que el 38% de las empanadas que vende en las noches la señora Yadira Gudiño que se ubica a media cuadra del IUGT son vegetarianas. Si aleatoriamente seleccionamos 7 de sus clientes; ¿Cuál será la Probabilidad de que: a) Todos las quieran vegetarianas? y b) No más de uno la quiera vegetarianas?
Solución
Datos: p=0,38 q=0,62; n=7.
Fórmulas: x n x
n xP x p q
a. 7 0
7 77 0,38 0,72P x P(x=7)=0,3186
b. 0 7 6
7 0 7 10 1 0,38 0,62 0,38 0,62 0,0352 0,1511 0,1863P x ó
P(x=1 ó 1)=0,1863
Problema 02.- Realizado un estudio de las calificaciones obtenidas en las evaluaciones por los estudiantes de Estadística Instrumental del Profesor Scott en el período de clases 2013-1N, se concluyó que aprobaron la materia el 62%. Si de manera aleatoria se seleccionan 6 de esos estudiantes; ¿Cuál será la probabilidad de qué: a) Exactamente 2 hayan aprobado la materia? b) Exactamente 3 ó 4 hayan aprobado la materia? c) No menos o al menos 2 hayan aproado la materia? y d) Calcular la Esperanza Matemática o Valor Esperado, la Varianza y la Desviación Típica o Desviación Estándar
90
2
2 6 2
6 2
3 6 3
6 3
4 6 4
6 4
: 0,62; 0,38; 6; : ; ; ;
:
) 2 2 0,62 0,38
) 3 4, 3 4 3 4 0,62 0,38
0,62 0,38 0,2616 0,32
2 0,1202
3 4 001
X n X
n XDatos p q n Fórmulas P X p q np npq
npq
Desarrollo
a Para X P X
b Para X
P
ó P X ó
P
P
X
P X X
X
ó
2 6 2 3 6 3 4 6 4
6 2 6 3 6 4
5 6 5 6 6 6
6 5 6 6
) 2 2,...,5 6 2,...,5 6 2 3 4
5 6 0,62 0,38 0,62 0,38 0,62 0,38
0,62 0,38 0,62 0,38 0,1202 0,2616 0,3201 0,2089 0,0
,5817
2,...
5
,5 6 0,
68
c Para al menos X ó P X ó P X P X P X
P X P
ó
X
P X
0 6 0 6 1
6 0 6
2 2
1
: 2,...,5 6 1 0 1 1 0 1
1 0,62 0,38 0,62 0,38 1 0,0030 0,0294
) 0,62 6 ; 0,38 3,72 ; 1,41
9676
2,...,5 6 0,9676
3,72 1,4136 1,3 1886 9
Por complemento sería P X ó P X ó P x P X
P
d
X ó
Para calcular probabilidades de Distribución Binomial se utiliza su fórmula de manera directa sobre cada problema o tablas las cuales provienen de la aplicación de la referida fórmula para los diversos casos posibles. Sin embargo si se aplica de manera acertada la fórmula resulta más práctica la utilización de la misma en la solución de problemas para calcular este tipo de probabilidades.
2. Distribución de probabilidades Hipergeométrica Si tomamos un conjunto de N elementos que pueden ser individuos u objetos y que una parte S de ellos tienen una determinada característica siendo esa parte la que vamos a tomar como elementos base para el cálculo de probabilidades, y si de ese conjunto de N elementos consideramos un subconjunto n de esos elementos debemos intuir que una parte x de ellos también obedecen a esa determinada característica, y es la probabilidad sobre la ocurrencia de x la que vamos a estudiar. La situación planteada en estos términos nos lleva a un tipo de
distribución de variable discreta a la cual se le ha asignado el nombre de Distribución Hipergeométrica y la definimos como: “Una distribución de variable discreta asociada generalmente con un proceso de muestreo sin reemplazo o sin reposición en una población finita conocida que contiene una proporción relativamente grande (0,05 N < n) de esa población, de tal manera que la probabilidad de éxito sea perceptible alterada de una prueba a la siguiente, lo que hace que el resultado de un ensayo dependa del anterior.
91
S x N S n x
N n
N S S
n x xP x P x
N
n
Valor Esperado:
Varianza:
Desviación Estándar o Típica: 2
1
nS N S N n
N N
N: Tamaño del conjunto seleccionado para el estudio n: Tamaño de la muestra o subconjunto tomado del conjunto x: Probabilidad de éxito en cada ensayo o prueba S: Tamaño de la parte del conjunto favorable o exitoso
Problema Resuelto
Problema 01 Se va a seleccionar una comisión de 25 estudiantes en una institución educativa que tiene una matrícula de 417 estudiantes para hacer una evaluación avanzada del sistema educativo del país y presentar una ponencia a objeto de mejorarla. Si en esa matricula están incorporadas 263 mujeres; ¿Cuál será la probabilidad de qué en la referida comisión sean seleccionadas: a) Exactamente 12 mujeres? b) Entre17 ó 20 mujeres inclusive? y c) Calcular la Esperanza Matemática o Valor Esperado, la Varianza y la Desviación Típica o Desviación Estándar.
2
263 12 417 263 25 12
417 25
1
: 417; 263; 25; : ;
; ;1 1
:
) 12 12 12
) 1
2
7 2
0,0470
0
S X N S n X
N n
Datos N S n Fórmulas P X
nS N S N n nS N S N nnS
N N N N N
Desarrollo
P Xa Para X P X P X
b Entre ó mujeres inclusive X
263 17 263 18417 263 25 17 417 263 25 18
417 25 417 25
17,18,19 20 17,..., 20 17 18
19 20 17,..., 20
ó P X P X P X
P X P X P X
92
263 17 263 18417 263 25 17 417 263 25 18
417 25 417 25
263 19 263 20417 263 25 19 417 263 25 20
417 25 417 25
19 20 17,..., 20
0,1510 0,1123 0,0685 0,033
17,..., 20 0
7
,3655
P X P X P X
P X
2
263 12 417 263 25 12
417 25
1
: 417; 263; 25; : ;
; ;1 1
:
) 12 12 12
) 1
2
7 2
0,0470
0
S X N S n X
N n
Datos N S n Fórmulas P X
nS N S N n nS N S N nnS
N N N N N
Desarrollo
P Xa Para X P X P X
b Entre ó mujeres inclusive X
263 17 263 18417 263 25 17 417 263 25 18
417 25 417 25
263 19 263 20417 263 25 19 417 263 25 20
417 25 417 25
17,18,19 20 17,..., 20 17 18
19 20 17,..., 20
0,1510 0,1
ó P X P X P X
P X P X P X
2 2
1
17,..., 20 0,3655
15,76
23 0,0685 0,0337
25 263 417 263 417 2525 263) ;
417 47 2.288,090
47,
17 417 1
2.288,09 834
P
c
X
3. Distribución de probabilidades de Poisson
“Es una distribución de probabilidades discreta que describe el número de veces
que ocurre un evento durante un intervalo especifico, el cual puede ser de tiempo,
distancia, área o volumen”.
!
x
P x ex
Valor esperado: Varianza:
Desviación Estándar Típica: 2 q npq
93
= Número de ocurrencias exitosas de la medida en un intervalo especifico. e= 2,718281; número base de los logaritmo neperianos x= número de éxitos.
Problema Resuelto Problema.- El número de accidentes que se producen en una empresa manufacturera sigue una distribución de Poisson con una media de 2,6 accidentes por mes. ¿Cuál será la probabilidad de qué: a) Menos de 2 accidentes en un mes dado? y b) Más de 3 accidentes en un mes dado?
0 22,6 2,6 2,6
: 2,6 ; : 1!
) 2 0,1 2 0,1 2 0 1
2,6 2,6 2,62 0,0743 0,1934 0,2510
0
0
!
,1
! 1! 2
X
Datos accidentes por mes Fórmulas P X eX
a Menos de accidentes diarios X ó P X ó P X P X
P
P X
X e e e
ó
0 2 32,6 2,6 2,6 2,6
) 3 4,5,......; : 4,5...
2,6 2,6 2,6 2,61 0,1,2 3 1
0! 1! 2! 3!
1 0,0743 01934 0,2510 0,2
2 0,5187
b Más de accidentes diarios X por complemento sería P X
P X ó e e e e
4,5...1 776 0,263P X
Capítulo 10
Distribuciones de Probabilidades de Variables
Aleatorias Continúas
1.- Distribución de Probabilidad Uniforme: Es el valor que asume una variable aleatoria en una escala continua entre dos puntos, de tal manera que todos los valores tengan la misma probabilidad. Su gráfica se puede representar como un rectángulo limitado por dos puntos extremos a y b los cuales se constituyen en el intervalo de los resultados pesebres. La altura del rectángulo se considera igual a la unidad y el área del mismo se puede considerar igual al 100%. En consecuencia, el área bajo el rectángulo entre dos puntos
cualesquiera c y d, es igual al porcentaje del intervalo total incluido entren c y d, por lo que:
d cP c x d
b a
La Media: 2
a b , La Varianza:
2
2
12
b a
Gráfica
94
f(x)
0 a
P(x) c d
b
Ejercicio.- Las ventas de calzados en una tienda de ropas para caballeros tienen una demanda media diaria de Bs. 25.000 y un máximo de Bs. 35.000. Suponer que para el cálculo es apropiada usar la Distribución Uniforme; a( Determinar las ventas mínimas diarias y b) ¿Cuál será la probabilidad de días en que la demanda excederá en Bs. 30.000? Datos: µ = 25.000; b = 35.000 y k 0 30.000 Desarrollo:
a) 2 2 25000 35000 15.000a b a
b) 35.000 30.000
15.000 35.00035.
15.000 15.00
000 35.000 0,250
P xP x
2.- Distribuciones de Probabilidad Normal:
Una distribución normal la define las características que muestra su gráfica, la cual presenta una forma de campana que tiene una sola cima o vértice en el centro de la gráfica de la distribución, por donde pasa un eje vertical que la divide en dos partes iguales para apoyarse en un punto sobre el eje horizontal que lo define la media. Esta condición la hace simétrica y estas partes se expanden o caen a ambos lados llegando a estar infinitamente cerca del eje horizontal por lo cual es una gráfica asintótica; la distribución normal se determina a través de la media, µ y la dispersión, variación o
extensión por medio de la desviación estándar
2.1.- Distribución Normal Estándar “Z”:
No existe solo una distribución de probabilidad normal, sino una familia de ellas. Cada situación en particular presenta su propia distribución normal, lo cual dificulta su uso. Sin embargo y por fortuna un miembro de la familia puede utilizarse para determinar las probabilidades de todas las distribuciones normales, la que conocemos con el nombre de Distribución Normal Estándar la cual es única ya que se define como: “La distribución normal que presenta una media de 0 y una desviación estándar de 1” Cualquier distribución normal puede llevarse a una distribución normal estándar a través del Valor Tipificado de Z o Variación Normal Estándar; el cual se define como “el numero de desviaciones estándar a los que una observación está por encima o por debajo de la media es decir mide la distancia entre un valor seleccionado x y la media
aritmética ( )x dividida entre la desviación estándar, σ
La razón de utilizar una campana (Gauss) con las características señaladas en la gráfica (grafica de una distribución continua estándar normal) para el cálculo de probabilidades de una distribución continua estriba en que el área encerrada por su gráfica se corresponde con una gran aproximación a la correspondiente probabilidad. El área total de la curva es igual a 1, distribuida en mitades simétricas de 0,5. el área igual a 1 coincide con el espacio muestral que es igual a 1 de todos los eventos posibles de un experimento.
95
Ilustración de la gráfica de una desviación estándar normal.
0,5 0,5
- Z +Z
Z=0, para µ y σ=1
Cola Izquierda Cola Derecha
Eje de Simetría=V
96
Valor Tipificado de z o Desviación Estándar Normal y Tabla Orientadora para obtener
las probabilidades de la Distribución Normal interpretando la media Campana de Gauss
xz
GRÁFICA EN LA
CAMPANA DE GAUSS
PROBABILIDAD
SOLICITADA
PARÁMETRO
RESPECTO A LA
MEDIA POBLACIONAL
SIGNO DE Z
OBTENCIÓN DEL
ÁREA EN LA
TABLA DE Z
Un solo acotamiento
(X<a; X>a)
P X a a Z 0,5 aA A
P X a a Z 0,5 aA A
P X a a Z 0,5 aA A
P X a a Z 0,5 aA A
Doble acotamiento (a<X<b; X<a ó X>b)
P a X b a b ;a bZ y Z b aA A A
P a X b a b ;a bZ y Z b aA A A
P a X a b Z aA A
P X b a b Z bA A
P a X b a b ;a bZ y Z a bA A A
P a X ó P X b a b ;a bZ y Z
1 a bA A A
97
Problemas Resueltos
Problema 01.-Suponiendo que la variable aleatoria Z sigue una Distribución Normal Estándar; se pide hallar: a) P (Z<-1,53), b) P (Z<1,15), c) P (-1,53<Z<1,15), d) P (1,15<Z<2,16)
a)
a) P(Z<-1,53)=0,5-0,4370
P(Z<-1;53)=0,0630
b)
b) P(Z<1,15)=0,5+0,3749
P(<1,15)=0,8749
c)
c) P(1,53<Z<1,15)=
0,4370+0,3749 P(-1,53<Z<1,15)=0,8119
d)
d) P(1,15<Z<2,16)=0,4846-0,3749 P(1,16<Z<2,16)=0,1097
Problema 02Una determinada marca de cauchos tiene desgaste que sigue una Distribución Normal que tiene una de duración promedio de 35.000 kilómetros y una Desviación Estándar de 4.000 kilómetros; ¿Cuál será la probabilidad de que: a) Estos cauchos tengan una duración de más de 38.000 kilómetros? y b) Estos cauchos tengan una duración que oscile entre 32.000 y 38.000 kilómetros?
98
Datos: µ = 35.000; σ = 4.000.
Fórmula: X
Z
a.- P(38.000<X) = 0,2266
38.000 35.0000,75
4.000Z
A = 0,5 – 0,2734 = 0,2266
b.-P(32.000<X<32.000) = 0,5468
38.000 35.0000,75
4.000Z
38.000 35.0000,75
4.000Z
A =0,2734+0,2734 = 0,5468
3.- Aproximación de la Distribución Normal a la Binomial:
Para calcular el éxito o el fracaso de una serie de n ensayos de una distribución binomial
recurrimos a su fórmula o su respectiva tabla; sin embargo si n es demasiado grande, que
exceda a los confines de cualquier tabla, debemos ir a la aplicación de una fórmula lo cual
resulta altamente engorrosa, y es por ello que se diseñó el método alternativo de usar la
distribución normal para aproximarse a la distribución binomial. Esta aproximación se
considera lo suficiente precisa si y Si está próximo a 0,50,
valor que se toma como factor de corrección de continuidad, f.c.c. = 0,5 y se define como
“el valor de 0,5 restado o sumado, según sea el caso, a un valor seleccionado cuando una
Distribución de Probabilidades Binomial (discreta) se calcula por medio de una
Distribución de Probabilidad Normal (continua)”
Manera de aplicar el f.c.c.
99
No. Probabilidad Vocablo Forma Consideraci
ón
1 Probabilidad De que al menos ocurra X ( x – 0,5 ) Ya que X >
2 Probabilidad De que a lo más que ocurra X ( x + 0,5 )
Ya que X <
3 Probabilidad De que por lo menos ocurra X ( x – 0,5 ) Ya que X <
4 Probabilidad De que por lo más ocurra X ( x + 0,5 )
Ya que X >
Problema.- Se sabe que el 10% de todos los artículos que salen de un determinado proceso de producción tienen un defecto. Aleatoriamente se eligen 400 artículos de un elevado volumen de producción en un día; ¿Cuál es la probabilidad de que: a) Al menos 35 de los artículos seleccionados presenten un defecto? y b) De que exactamente 48 presenten algún defecto?
2 2: 0,10; 0,90; 400; : ; ; ;
0,10 400 40; 0,90 40 6;
CXDatos p q n Fórmulas np npq Z
35 0,8212) P Xa
35 0,5 34,5
34,5 400,92
6
cX
Z
A = 0,5000 + 0,3212 = 0,8212
35 0,8212) P Xb
48 0,5 47,5
47,5 401,25
6
48 0,5 48,5
48,5 401,42
6
c
c
X
Z
X
Z
A = 0,4222 – 0,3944 = 0.0278
Problemas propuestos para los Capítulos tratados en el Título III
Problema 01.- Definir el espacio muestral en los siguientes experimentos: a) Lanzar un dado
previamente calibrado. b) Lanzar tres monedas y ver la manera como caen respecto a las caras, c)
Familia con tres hijos respecto al sexo, d) Lanzar dos dados previamente calibrado y e) Al extraer dos
bolitas que contiene: 4 azules, 3 blancas y 2 coloradas.
100
Problema 02.- Al lanzar un dado previamente calibrado, ¿cuál es la probabilidad de que aparezca en
su cara superior: a) Un valor par y b) Un número mayor que dos?
Problema 03 .- Al lanzar dos dados previamente calibrados, ¿cuál será la probabilidad de que salgan
en su caída valores tales que al sumarlos den como resultado: a) Exactamente 3. b) Mayor que 4. c)
Menor o igual a 9 y d) Un múltiplo de 3?
Problema 04.- Se tienen tres lápiz cuadrado, (azul, blanco y colorado) cuyos lados están numerados
del 1 al 4, determinando el respectivo espacio muestral se pide obtener la probabilidad de que: a) Una
de las caras expuestas presente exactamente el número 2. b) Dos de las caras expuesta presenten el número 2 y c) Las tres caras sea el número 2.
Problema 05.- Se introducen en una caja, 4 bolitas azules, 6 blancas, 5 coloradas y 8 doradas, ¿cuál
es la probabilidad de ganar o perder, si las premiadas son las azules y las doradas?
Problema 06.- Se tiene un juego de naipes españoles lo suficientemente barajados, ¿cuál es la
probabilidad de que al extraer del mazo una carta ésta sea: a) Un as o un rey. b) Una espada o una
sota. c) Un cinco de copa o un oro y d) Una figura o un basto?
Problema 07.-Una agencia de viaje con el fin de promover el turismo abre un plan vacacional para 90
personas para que visiten a Canaima y a Los Roques, 44 reservaron cupo con pasaje incluido para ir a Los Roques, 46 a Canaima y 30 a ambos lugares. Si de manera aleatoria seleccionamos una persona,
¿ cuál es la probabilidad de que viaje a Los Roques o a Canaima?
Problema 08.-Se tienen dos juegos de naipes españoles, calcular las siguientes probabilidades al
extraer dos barajas de manera conjuntas una de un juego y la otra del otro juego: a) ¿Qué las dos sean reyes? b) ¿Qué sean una sota y un basto? y c) ¿ Qué sean un caballo de oro o una espada.
Problema 09.- Se lanzan dos monedas y dos dados previamente calibrados, ¿cuál es la probabilidad
de caiga cara-sello y un múltiplo de 3 al sumar los dos números de las caras superiores de los dados?
Problema 10.- Se tiene un juego de naipes españoles y se realizan tres extracciones sin reposición o sin reemplazo estudiar, ¿cuál es la probabilidad de que en los experimentos siguientes se extraiga: a)
Un rey y una sota y un as. b) Un caballo y un siete y un caballo. c) Un as de oro y un oro y seis de
copa o de basto y d) Un oro y una espada y un rey de copas.
Problema 11.-En una caja se introducen 4 bolitas azules, 5 blancas y 6 coloradas y se realizan de la caja tres extracciones sin reposición o sin reemplazo, calcular la probabilidad en los experimentos
siguientes: a) De que salga una bolita blanca y una azul y una blanca. b) Todas coloradas. c) Una
colorada y colorada y azul y d) Colorada y blanca y azul.
Problema 12.- En una caja se introducen 4 bolitas azules, 3 blancas y 2 coloradas, si extraemos de la
caja dos bolitas, ¿Cuál es la probabilidad de que sean: a) Del mismo color. b) Las dos azules. c) Una blanca y la otra colorada y d) Una azul y la otra colorada?
Problema 13.- En una caja se introducen las mismas bolitas del problema anterior, si se extraen de la
caja tres bolitas, ¿cuál es la probabilidad de que sean: a) Del mismo color. b) Dos azules y una blanca.
c) Una azul y dos coloradas y d) todas azules.
Problema 14.- En una caja se introducen 9 bolitas azules y 6 blancas, si de la caja extraemos 3
bolitas, ¿cuál es la probabilidad de que sean: a) De igual color. b) De colores diferentes. c) Dos azules y
d) Dos blancas.
Problema 15.- Un juego de naipes españoles consta de 40 barajas y lo vamos a dividir de manera arbitraria en dos partes iguales. Determinar las probabilidades de los eventos siguientes: a) Cada
101
parte contenga dos caballos. b) Una parte no contiene ningún caballo, la otra parte contiene 4 caballos
y c) Una parte contiene un caballo, la otra parte contiene 3 caballos.
Problema 16.- En el torneo de baloncesto profesional local participan 10 equipos, de los cuales al
azar se forman dos grupos de 5 equipos cada uno. Entre los equipos se consideran 3 de de mayor
calidad. Determinar las probabilidades de los siguientes eventos: a) Los equipos considerados de
mayor calidad se encuentran en el mismo grupo y b) En un grupo se encuentran 2 de mayor categoría
y 1 en el otro.
Problema 17.- Un profesor lanza dos dados sobre una mesa, observa los números que salieron y los
tapa con la mano para que sus alumnos no los vean, y les formula las preguntas siguientes: a)
Probabilidad que uno de los dados muestre un seis o un dos y b) Suponiendo que el profesor les dijo a
los estudiantes que en uno de los dados salió el dos, probabilidad que el otro dado muestre el seis.
Problema 18.- En un grupo de 25 estudiantes del I.U.G.T. hay nueve que viajan a Valencia todos los
viernes y seis a Maracay y cuatro a ambas ciudades (incluidos entre los anteriores). Si seleccionamos
un estudiante al azar y se comprueba que viaja a Maracay, ¿Cuál es la probabilidad de que también
viaje a Valencia?
Problema 19.- Se realizó un estudio sobre el consumo de café en el área metropolitana y se seleccionaron de manera aleatoria 300 personas consumidoras del producto para ser encuestadas. Al
recibir el material del estudio realizado éste estaba incompleto, sin embargo con la información
obtenida se puede completar la tabla de datos, (Tabla incompleta al final).
Se pide: A.- a) Completar la Tabla de Contingencia. b) Elaborar la respectiva Tabla de Probabilidades
c) Elaborar las Tablas de Probabilidades Condicionales y d) Elaborar un diagrama del árbol. B.- Si de manera aleatoria se selecciona un consumidor, ¿cuál es la probabilidad: a) De que éste tenga
entre 40 y 50 años? b) De que tenga un consumo moderado de café? c)De que tenga un consumo bajo
de café y su edad sea menor de 30 años? d) De que tenga un consumo alto de café y cuya edad esté
comprendida entre los 30 y 40 años e) Consumidor moderado de café ó que su edad sea menor de 30
años y f) Consumidor bajo o alto de café
C.- Responder: a) ¿Cuál será la probabilidad de seleccionar un consumidor de café que lo consuma moderadamente si tiene más de 50 años? y b) ¿Cuál será la probabilidad de seleccionar un
consumidor de café cuya edad esté entre 40 y 50 si lo consume de manera alta?
Problema 20.- Se consultaron las opiniones de 500 economistas que laboran en la academia, la industria privada y el sector público sobre el futuro de la economía del país, si ésta sería estable, se
expandiría ó se contraería en un futuro próximo. Sin embargo parte de la información se extravió,
resultando la siguiente tabla de contingencia parcial:
Consumo de café
Edad (Años)
Bajo
(B1)
Moderado
(B2)
Alto
(B3)
Total
Menos de 30 (A1) 32 24 92
De 30 a 40 (A2) 75
De 40 a 50 (A3) 24 20
Más de 50 (A4) 26 24 79
Total 90 100
102
Se pide: A.- a) Completar la Tabla de Contingencia. b) Elaborar la Tabla de Probabilidades. c) Elaborar
las Tablas de Probabilidades Condicionales y d) Desarrollar el Diagrama del Árbol.
B.- Si de manera aleatoria seleccionamos un economista, ¿cuál es la probabilidad de que éste sea.: a)
Del sector privado? b) Que opine que la economía se va a contraer? c) Del sector público y que opine
que va a ver expansión en la economía? d) Del sector público ó del sector académico? y e) De la
opinión que la economía va estar estable ó es del sector privado?.
C.- Responder: a) ¿Cuál es la probabilidad de que la opinión sea de que la economía se expande si
esta opinión proviene del sector público? Y b) ¿Cuál es la probabilidad que una opinión provenga del
sector académico si se opina que la economía se contrae?
Problema 21.- El equipo de béisbol profesional Leones del Caracas, juega el 70,00% de sus partidos por la noche y el 30,00 durante le día; ganando el 60,00% de los juegos nocturnos y el 70,00% de los
juegos diurnos. Según las páginas deportivas de los periódicos ganaron el partido de ayer; ¿cuál es la
probabilidad de que el partido jugado haya sido nocturno?
Problema 22.- Una cuarta parte de los residentes de la Urbanización Las Abejitas de San Juan de los Morros dejan la puertas de sus garajes abiertas no estando en casa. El vigilante de la entrada a la
urbanización estima que el 5% de las casa con garajes con las puertas abiertas son robados y el 1%
de las casas con los garajes de puertas cerradas. Si hay un robo en un garaje; ¿cuál es la probabilidad
de que el garaje robado haya tenido la puerta abierta?
Problema 23 .- Se lanzan 3 monedas sobre una mesa, tomando como referencia como cae respecto a cara, se pide: a) Estructurar una Distribución de probabilidades. b) Obtener la Esperanza
Matemáticas ó Valor Esperado y c) Calcular la Varianza y la Desviación Estándar ó Desviación Típica.
Problema 24.- Un dado se lanza 50 veces, donde cada cara cayó como se muestra:
Cara 1 2 3 4 5 6
Veces 7 8 5 9 11 10 Se pide: a) Crear una Tabla de Distribución de Probabilidades. b) Obtener la Esperanza Matemática y
c) Calcular la Desviación Estándar.
Problema 25.-Pedro Martínez vende automóviles para una agencia concesionaria. Pedro vende el
mayor número de vehículos los días sábados y obtiene la Distribución de Probabilidad para el número
de automóviles que espera vender un día Sábado en particular: Vehículos vendidos 0 1 2 3 4
Probabilidad: P(x) 0,1 0,2 0,3 0,3 0,1
a) ¿Qué tipo de distribución es ésta?
b) ¿Cuántos automóviles espera vender Pedro en un Sábado típico
c) ¿Cuál es la Varianza y la Desviación Estándar de la distribución?
Problema 26 .- De las tres tablas que se presentan al final siendo de variables aleatoria solo una
responde a una Distribución de Probabilidad. a) Identificar la que responde a una Distribución de
Probabilidad y explicar el ¿por qué? De su respuesta y b) Obtener de la verdadera Distribución de
Probabilidad, su Esperanza Matemática o Valor Esperado, su Varianza y su Desviación Estándar.
Cuadro 01 Cuadro 02 Cuadro 03
x 5 10 15 20 x 5 10 15 20 x 5 10 15 20
Economistas Sector
Estable (B1)
Expansión (B2)
Contracción (B3)
Total
Academia (A1) 125 100
Sec. Privado (A2) 35 110
Sec. Público (A3) 25 40 65
Total 200
103
P(x) 0,3 0,3 0,2 0,4 P(x) 0,1 0,3 0,2 0,4 P(x) 0,5 0,3 -0,2 0,4
Problema 27.- El servicio de correspondencia de un banco informa que el 85% de los documentos
enviados dentro el área metropolitana se entregan en un período de 3 días a partir del momento en
que se envían. Se enviaron 7 cartas de manera aleatoria a diferentes partes de la ciudad. ¿Cuál será la probabilidad de que: a) Exactamente 7 lleguen en tres días? b) Exactamente 5 lleguen en tres días? c)
Al menos 5 lleguen en tres días? d) A lo sumo 4 lleguen en tres días? y e) Calcular la Esperanza
Matemática o Valor Esperado, la Varianza y la Desviación Estándar del número de documentos
enviados que llegarán en un plazo de tres días.
Problema 28.- Las normas de garantías establecida por la industria automotriz sugiere que 20% de los nuevos vehículos se les dé un plazo de garantía de año y medio. Una agencia de ventas de
vehículos del área metropolitana el día sábado vendió 9 vehículos los cuales están dentro de cualquier
tipo de garantías. ¿Cuál es la probabilidad de que: a) Ninguno de los vehículos vendidos tengan
garantía de año y medio? b) Exactamente uno tengan esta garantía? c) Menos de cuatro la requieran?
d) Cuatro o más la requieran y e) Calcular la Esperanza Matemática, Media o Valor Esperado; La Varianza y la Desviación Típica o Estándar de esta distribución.
Problema 29.- Sólo el 20% de los empleados de la población civil que presta sus servicios en una base
militar portan su carnet de identificación personal. Si llegan diez empleados, ¿cuál es la probabilidad
de el guardia de seguridad encuentre: a) Ocho empleados con carnet? b) Cuatro empleados con
carnet? c) Por lo menos cuatro con carnet? d) A lo sumo 5 empleados con carnet y e) Entre cuatro y siete empleados inclusive con carnet?
Problema 30.- Resolver el problema anterior pero partiendo de la base que sólo el 55% de los
empleados portan el carnet.
Problema.- 31 Al Jefe de Recursos Humanos de una empresa comercializadora de materias primas, la
Gerencia General lo autorizó par que contrataran 12 personas entre 35, de las cuales 24 tienen títulos
universitarios. ¿Cuál es la probabilidad de que 7 de las personas que se contraten tengan un título
universitario?
Problema 32.- Cuarenta trabajadores han recibido para su oficina nuevos computadores. Veintisiete trajeron incorporados quemadores de C.D. Si se seleccionan de manera aleatoria 10 trabajadores;
¿cuál es la de probabilidad de que el equipo de computación de 3 trabajadores tengan quemador de
C.D.? y ¿la probabilidad de que el equipo de 7 no lo tengan?
Problema 33.- En un curso de Estadística Instrumental que tiene una matrícula de 72 estudiantes se resuelve nombrar un equipo integrado por 7 estudiantes para que evalúe unas guías teóricas que
contienen los concepto que van a ser base de los exámenes parciales. Si el curso posee 46 mujeres;
¿cuál es la probabilidad de que 5 mujeres integren el equipo a nombrar? Y ¿ 3 hombres?
Problema 34.- Un promedio 16 automóviles cada dos minutos ingresan a la parroquia Coche desde la
autopista viniendo del centro de la ciudad. La distribución de ingreso responde a una Distribución de Poisson. ¿Cuál es la probabilidad de que: a) Ningún automóvil ingrese en 30 segundos? y b) Por lo
menos 2 ingresen en un minuto?
Problema 35.- La central telefónica del I.U.G.T. atiende un promedio de dos llamadas telefónicas por
minuto y se sabe que sigue una Distribución de Poisson. Si la operadora se distrae por un minuto; ¿cuál es la probabilidad de que: a) El número de llamadas no respondidas sea ninguna? b) Por lo
menos una? Y c) Entre 3 y 5 inclusive?
Problema 36.- En el problema anterior suponga que la operadora se distrae por cuatro minutos,
responder las mismas preguntas.
104
Problema 37.- Repuestos Pernía C.A. compra repuestos para motores de arranque a uno de sus
proveedores que presentan defectos de 3 por cada 100 repuestos. Saúl Pernía el dueño, necesita
comprar 150 repuestos pero no aceptará una probabilidad de más del 50% de que más de dos repuestos sean defectuosos. ¿Saúl Pernía le compraría a dicho proveedor?
Problema 38.- El peso medio de las cajas de frutas de un gran cargamento es de 15 Kgs., con una
desviación estándar de 1,62 Kgs.; si sus pesos están distribuidos normalmente, ¿Qué porcentaje
tendrá un peso: a) Entre 15 y18 Kgs.,b) Entre 17y 19 Kgs., c) Menos de 13 Kgs., d) Menos de 16 Kgs. y
e) Entre 14 y 17 Kgs.
Problema 39.- Una distribución normal tiene una media de 50 y una desviación estándar de 4. Se
pide calcular la probabilidad de un valor: a) Entre 44 y 55, b) Mayor que 55 y c) Entre 52 y 55.
Problema 40.- Una población normal tiene una media de 80 y una desviación estándar de 14. Se pide calcular la probabilidad de un valor: a) Entre 75 y 90, b) 75 o menos y c) Entre 55 y 70.
Problema 41.- Una máquina expendedora de refrescos está ajustada para servir un promedio de 250
gramos por vaso, con una desviación estándar de 3,57. La distribución de cantidades servidas sigue
una distribución normal. Se pide calcular la probabilidad de que la máquina sirva: a) Entre 253,57 y
258,93 gramos, b) 258,93 o más gramos y c) Entre 242,86 y 258,93 gramos.
Problema 42.- Un número reciente de una revista especializada sugirió que las parejas que están
planeando su boda saben que dos terceras partes de las personas que se les envía una invitación
respondan que si asistirán. Pedro y María tienen planeado casarse más adelante este año y piensan
enviar 197 invitaciones. Responder: a) ¿Cuántos invitados deben esperar que esperen la invitación?, b) ¿Cuál es la desviación estándar?, c) ¿Cuál es la probabilidad de que 140 o más acepten la invitación?
y d) ¿Cuál es la probabilidad de que exactamente 140 acepten la invitación?
Problema 43.- Según los últimos estudios realizados por una empresa especialista la tasa real de
desempleo está por el orden del 9,2%. Si se seleccionan de manera aleatoria 100 aptas para trabajar;
¿Cuál será: a) La cantidad esperada de desempleados?, b) La varianza y la desviación estándar de desempleados?, c) La probabilidad que exactamente 5 estén desempleados? y d) La probabilidad de
que cuando menos 4 estén desempleados?
Problema 44.- Un hotel del área metropolitana tiene 120 habitaciones. En los meses de poco
movimiento, alquila un promedio del 75% de sus habitaciones. Responder; ¿Cuál es la probabilidad de qué: a) Al menos se ocupe la mitad de las habitaciones de las habitaciones en cierto día?, b) 100 o más
habitaciones en cierto día? y c) 80 o menos habitaciones en cierto día?
Problema 45.- Se lanza una moneda 500 veces. Calcular la probabilidad de que el número de caras no
difiera de 250 por: a) Más de 10 veces y b) Más de 30.
Problema 46.- Los paquetes de cereal de Comercializadora Johan C.A vienen en cajas de 36 Kg, que
tienen una desviación estándar de 1,9 Kg. Se piensa que los pesos están distribuidos normalmente. Si
se selecciona una caja aleatoriamente, ¿Cuál es la probabilidad que la caja pese: a) Menos 34,8 Kg b)
Más 34,8 Kg c) Entre 34,3 Kg y 38,8 Kg d) Entre 39,5 Kg y 41,1 Kg?.
Problema 47.- El 45% de todos los empleados del Consorcio La China C.A tienen títulos
universitarios. ¿Cuál es la probabilidad de que de 150 empleados seleccionados aleatoriamente: a) 72
tengan título universitario y b) Más de 70?
Problema 48.- El Consejo Académico del I. U. G. T. designó un equipo de profesores para que
realizara un estudio del comportamiento en el rendimiento académico de los estudiantes que han hecho su vida estudiantil en la institución. Se observó que la estructura de los datos sigue una
distribución normal. El promedio de las notas de la población estudiantil en el tiempo fue de 13,45
105
con una desviación estándar de 1,93. Se quiere responder las siguientes interrogantes: a) ¿Porcentaje
de estudiantes que estarían por debajo 11 puntos?, b)¿Cuál sería la probabilidad de que un estudiante
seleccionado de manera de manera aleatoria obtenga una nota de 12 15 puntos?, c) De 500 estudiantes, ¿Cuántos aprobarían la materia con una nota de 14 a16 puntos y d) Si el Consejo
Académico resuelve otorgar becas estudiantiles al 10% de aquellos estudiantes que obtenga las
mayores notas, ¿Cuál sería la mínima nota a obtener para optar a esta beca?
Problema 49.- Un estudio realizado por el Instituto de Tierras de Venezuela ha concluido que las
precipitaciones diarias de los Andes Venezolanos parecen estar distribuidas normalmente con una media de 55,88 mms., durante la estación lluviosa. Se determinó que la desviación estándar era de
20,32mm. a) ¿Cuál es la probabilidad de que llueva más de 83,82 mm. en un día durante la estación
lluviosa?, b) que llueva más de 33,02 mm?, c) que las precipitaciones estén entre 68,58 y 76,20 y d)
¿Cuánta precipitación debe presentarse para exceder el 12% de las precipitaciones diarias?
Problema 50.- El 72% de los empleados entre obreros, administrativos y académicos que laboran en
el I. U. G.T. poseen títulos académicos. Se seleccionan de manera aleatoria 35 empleados: a) ¿Cuál es
la probabilidad de que exactamente 19 tengan títulos académicos?, b) Más de 28? y c) Menos de 22?
Problema 51.- Si se lanza una moneda equilibrada 160 veces, ¿Cuál será la probabilidad de que se
obtengan caras entre el 40% y el 55% de las veces?
106
TÍTULO IV
Capítulo 11
Teoría del Muestreo y Teorema del Limite Central
1. Definiciones Importantes 1.1. Estadística Inferencial: Estudia métodos y técnicas involucrando el uso de un
estadístico (muestra) para llegar a conclusión o inferencia sobre el parámetro (población) correspondiente.
1.2. Teoría del Muestreo: Estudio que nos enseña la técnica para analizar una población a través de una muestra representativa de la misma.
1.3. Distribución muestral de medias o distribuciones muestrales: Es una distribución de probabilidades de todas las medias posibles de muestras de un determinado tamaño de la población, es decir es una lista de todos los valores posibles para un estadístico (media) y las probabilidades relacionadas con cada valor.
2. Errores Dentro de un Estudio de Muestreo: 2.1. Error de Muestreo: Un error que se establece entre la muestra y población, definido
como, “la diferencia entre el estadístico muestral y el parámetro poblacional correspondiente”
Error de Muestreo: E x
2.2. Error Estándar de la Muestra: Es un error intrínseco de la propia muestra y depende de la normalización de cualquier distribución de probabilidad en estudio. “Es una medida de la dispersión de las medias muestrales alrededor de la media poblaciones (µ) por lo tanto mide la tendencia a sufrir del error de muestreo, en el esfuerzo por estimar a la media poblacional”.
2.3. Para definir este error debemos desarrollar el Teorema del Limite Central que nos señala: “Si todas las muestras de un particular tamaño se selecciona de cualquier población, la distribución muestral de medias se aproxima a una
distribución normal, es decir a medida que el tamaño de la muestra crece la
distribución de medias muestrales se aproximan a una distribución normal, donde la media de medias (Gran Media) es igual a la media poblacional y, y el
error estándar es igual a la desviación estándar o típica dividida entre la raíz cuadrada del tamaño de la muestra”
Error estándar de la muestra:
Gran media o media de media: i
X
X KX
N
Luego:
107
Varianza:
22
2 i i
X
X
X KX
NDesviación Estándar:
22
2 i i
X X
X
X KX
N
2.2.1Conclusiones Importantes del Teorema del Limite Central:
2.2.1.1 Población Grande n ≥30, para un estudio muestral se usa la
distribución Z (Distribución Normal).
2.2.1.2. Población Pequeña n <30, para un estudio muestral se usa la
distribución t (Distribución No Normal)
Distribución de probabilidades “t” de Student: Al igual que la distribución normal, la distribución “t” presenta en su gráfica
una forma de campana simétrica, pero más achatada y con mayor área en los
extremos o colas donde se encuentran las zonas críticas o de rechazo. No existe
una sola distribución “t”, sino una familia de ésta debido a que las desviaciones
estándar se modifican a medida que aumenta el tamaño de la muestra,
acercándose a la distribución normal.
Esta distribución se utiliza bajo las condiciones siguientes:
a) Muestra o Población Pequeña no normal, es decir n<30
b) Desviación Estándar Poblacional (σ) es desconocida, si fuera conocida se emplearía
la distribución normal estandarizada “Z” aun siendo la muestra pequeña
Mientras la distribución “Z” presenta una varianza (σ2) igual a uno (1), la varianza de
la distribución “t” es mayor que uno (1) y esto la hace más achatada, más alargada y
más dispersa que la distribución “Z” varianza:
2.1 Grados de libertad: En estudios posteriores realizados sobre la distribución “t” se
introdujo este término para mejorarla entendiéndose como: “el número de
observaciones menos el número de restricciones impuestas sobre tales observaciones”.
Observación: Si la población es normal aun cuando su tamaño sea pequeña
(n<30) se usa distribución Z
3. Factor de corrección para poblaciones finitas: La expresión es apropiada si el muestreo se realiza con reemplazo, o si la
muestra se toma de una población muy grande virtualmente infinita. Si el muestreo
se realiza sin reemplazo y si el tamaño de la muestra cumple que n>0,05N debe
aplicarse el factor de corrección para poblaciones finitas, en este caso:
108
4. Proporción muestral de la Distribución Muestral:
Valor esperado o esperanza matemática: p
p
pE
N
Error estándar; Población: 1
N; Muestra:
1p
p p
n
Error estándar corregido si n>0,05 N:
Población: 1
1
N n
N N; Muestra:
1p
p p
n 1
N n
N
Desviación Estándar para las Proporciones: p
p
pZ
5. Métodos de Muestreo:
5.1 Muestreo Aleatorio Simple: Método donde la muestra se selecciona de manera tal
que cada elemento o persona en la población tiene la misma oportunidad de ser
seleccionado.
5.2 Muestreo Aleatorio Sistemático: Método donde se selecciona un punto de inicio
aleatorio y después se elige cada K miembro de la población.
5.3 Muestreo Aleatorio Estratificado: Método donde la población a estudiar se divide
el sub-grupos, llamados estratos, y se selecciona de manera aleatoria un elemento de
cada estrato atendiendo al tamaño de cada uno.
5.2 Muestreo Aleatorio por Conglomerados: Método donde se divide la población en
grupos o conglomerados utilizando los límites naturales geográficos o de otros
tipos; seguidamente los grupos se seleccionan al azar y se recopila una muestra a
elegir en forma aleatoria de cada grupo.
109
RESUMEN DEL CAPÍTULO EN CUADROS
Cuadro de fórmulas y condiciones de z y de t para el estudio de parámetros
poblacionales.
Parámetro a estudiar Tipo de
Población
Fórmula a
utilizar
Media Poblacional
Grande (n≥30)
Pequeña (n<30)
(No Normal)
x
xz
x
xt
s
Proporción Poblacional
Grande (n≥30)
Pequeña (n<30)
(No Normal
p
pz
p
pt
s
Cuadro de fórmula y condiciones para obtener el error de muestreo.
Parámetro a estimar Fórmula
General
Tipo de
Población
Error máximo
permisible para
cualquier Nivel de
Confianza (N.C.)
Media Poblacional E x
Grande (n≥30)
Pequeña (n<30) (No Normal)
0 xE z .
0 xE t s
Proporción. Poblacional E p Grande (n≥30)
Pequeña (n<30)
(No Normal)
0 pE z
0 pE t s
110
Cuadro de fórmulas y condiciones para estudiar el error estándar de la muestra.
Error Estándar Fórmula para cada caso Tipo de Población
Media Muestral
,x
n
No Finita
1x
N n
Nn
Finita
Proporción Poblacional
1p
p p
n
No Finita
1
1p
p p N n
n N
Finita
Problemas Resueltos
Problema 01.- Los 7 empleados de una tienda de vender ropas tienen los siguientes ingresos mensuales en bolívares: 11.100; 10.800; 11.100; 15.000; 12.300; 10.800 y 13.500. Se pide; a) Desarrollar una Distribución de Frecuencias y obtener su Media Poblacional; b) Construir una Distribución de Medias Muestrales y obtener la Gran Media, comparar con la Media Poblacional y comentar y c) Calcular la Varianza y la Desviación Estándar de la Distribución de Medias Muestrales o Distribución Muestral Datos: En la serie de datos.
Fórmulas:
22
2 2, ; ; ;1
i ii i i i
N nX X X X
X X
X K XX f X KN X
N N N
Solución
iX if i iX f a)
84.60012.085,714
7
µ=12.085,714
10.800 2 21.600
11.100 2 22.200
12.300 1 12.300
13.500 1 13.500
15.000 1 15.000
7 84.600
b)
111
A=11.100; B=10.800; C=11.100; D=15.000; E=12.300; F=10.800 y G=13.500 {
iX iX
in iX
iX
in iX iX
01 ABC 33.000 11.000 16 BCD 36.900 12.300 31 CFG 35.400 11.800
02 ABD 36.800 12.300 17 BCE 34.200 11.400 32 DEF 38.100 12.700
03 ABE 34.200 11.400 18 BCF 32.700 10.900 33 DEG 40.800 13.600
04 ABF 32.700 10.900 19 BCG 35.400 11.800 34 DFG 39.300 13.100
05 ABG 35.400 11.800 20 BDE 38.100 12.700 35 EFG 36.600 12.200
06 ACD 37.200 12.400 21 BDF 36.600 12.200
07 ACE 34.500 11.500 22 BDG 39.300 13.100
423.00012.085,714
35X
12.085,714X
08 ACF 33.000 11.000 23 BEF 33.900 11.300
09 ACG 35.700 11.900 24 BEG 36.600 12.200
10 ADE 38.400 12.800 25 BFG 35.100 11.700
11 ADF 36.900 12.300 26 CDE 38.400 12.800
12 ADG 39.600 13.200 27 CDF 36.900 12.300
13 AEF 34.200 11.400 28 CDG 39.600 13.200
14 AEG 36.900 12.300 29 CEF 34.200 11.400
15 AFG 35.400 11.800 30 CEG 36.900 12.300
Comentario: “Ambas medias son iguales lo cual nos lleva a concluir que partiendo de una población pequeña aun cuando no sea normal, al transformarla en una Distribución Muestral, tomando un adecuado tamaño de muestra en la cual vamos a partir la población dada podemos transformarla en población grande y considerar esa Distribución Muestral como una que responde a una Distribución Normal
Distribución de Medias Muestrales
iX iK i iX K
2
i iX K
10.900 2 21.800 237.620.000
11.000 2 22.000 242.000.000
11.300 1 11.300 127.690.000
11.400 4 45.600 519.840.000
11.500 1 11.500 132.250.000
11.700 1 11.700 136.890.000
11.800 4 47.200 556.960.000
11.900 1 11.900 141.610.000
12.200 3 36.600 446.520.000
12.300 6 73.800 907.740.000
12.400 1 12.400 153.760.000
12.700 2 25.400 322.580.000
12.800 2 25.600 327.680.000
13.100 2 26.200 343.220.000
13.200 2 26.400 348.480.000
13.600 1 13.600 184.960.000
∑ 35 423.000 5.129.800.000
112
222 5.129.800.000 35 12.085,714
501.23 501.231,3951,395935
501.231,3959 707,9
9
707,7 977 7
X
X
X
X
Problema 02.- Los 314 0breros que trabajan en una empresa automotriz se observa que tienen un promedio de 32 años, con una desviación estándar de 10 años. Si la distribución de estos datos sigue una Distribución Normal; se pide: a) Probabilidad de que la media muestral de 25 de ellos resulte menor de 28 años y b) Probabilidad de que sobrepase los 31 años.
Datos: 314; 32; 10; 25N n Fórmulas: ;1x
x
N nXZ
Nn
314 25101,922
314 125x x
a) 28 0,0188P X
28
28 322,08
1,922Z
0,5 0,4812 0,0188A
b)
31 0,6985P X
28
31 320,52
1,922Z
0,1985 0,5 0,6988A
Ejercicio 03.- El promedio de notas de los estudiantes del IUGT es de 12,7 con una
desviación estándar de 6,2ptos. Si se toma una muestra de 36 estudiantes, ¿cuál será la
probabilidad que la media de esa muestra?:
a. Sea menor que 11
b. Sea menor que 14
c. Ese entre 11 y 14
d. Entre 14 y 15
Solución
Datos: μ =12,7; σ =6,2. Fórmulas: ;x
x
XZ
n
6,21,033
36x
113
a) P( X < 11) 0,0495
11
11 12,71,65
1,033Z
A = 0,5000 – 0,4505=0,0495
b) P( X < 14) 0,8962
14
14 12,71,26
1,033Z
A = 0,5000 + 0,3962=0,8962
c) P(11< X <14) 0,8467
11
14
1,65
1,26
Z
Z
A = 0,4505 + 0,3962=0,8467
d) P(14< X <15) 0,0909
14 1,26Z
15
15 12,72,23
1,033Z
A = 0,4871 – 0,3962=0,0909
Capítulo 12
ESTIMACION CON INTERVALO DE CONFIANZA
1. Estimación: Una estimación es el proceso mediante el cual se obtiene un estimador. 1.1 Estimador Puntual: Estadístico que se calcula a partir de la información de la
muestra y se utiliza para estimar el parámetro de la población, el cual es un único
valor. 1.2 Estimación por Intervalos de Confianza: Es el rango de valores creado a partir
de los datos de la muestra, de modo que el parámetro poblacional es probable que ocurra dentro de ese rango dentro de una probabilidad específica. Cuando se estima un Intervalo de Confianza, ese rango obtenido nos está señalando que la Media Poblacional o la Proporción Poblacional según sea el caso oscila entre eso valores extremos a los que se llama Límites de Confianza, es decir pueden existir infinitos valores que pueden ser asumidos por esos parámetros. Por eso es que se tiene que los mejores estimadores puntuales son los estadísticos que obtenemos de una muestra, los cuales combinados en operaciones sencillas con el
114
Error Estándar de la muestra y el Nivel de Confianza, nos permite obtener el error de muestreo que sumado o restado al Estimador Puntual que disponemos se obtiene los Límites de Confianza.
1.3 Nivel o Coeficiente de Confianza: Es la probabilidad específica que define el rango dentro del cual debe estar el parámetro poblacional desconocido.
2. Intervalos de Confianza para Medias Poblacionales ( ). 2.1 Población Grande (n≥30)
Se utiliza Z.
IC de =
LIC = Límite inferior de confianza
LSC = Límite superior de confianza
LIC = X – ; LSC = X +
2.2 Población Pequeña (n<30)
Se utiliza t.
LIC = X -
Debe cumplirse también para usar que la desviación estándar poblacional
sea desconocida entonces se usa la desviación estándar muestral y que además la población sea normal o casi normal.
3. Intervalos de Confianza para Proporciones Poblacionales
3.1 Población Grande (n≥30)
Se utiliza Zo.
LIC = X – ; LSC = X +
3.2 Población Pequeña (n<30)
Se utiliza to.
4. Determinación del tamaño apropiado de la muestra
Seleccionado todo el nivel de confianza, en el tamaño muestral dos factores
importantes influyen: a) la varianza de la población ( 2
x), expresa el grado de
variabilidad que presentan las unidades de la población, siendo para proporciones
poblacionales: 2
x= pq = π(1- π) y en el mejor de los casos 2
x= 0,25; b) el tamaño del
error tolerable (E) fijado por el investigador de acuerdo al estudio a realizar y c) el nivel de confianza (NC), tiene relación directa con el tamaño de la muestra a mayor nivel de confianza el tamaño de la muestra será mayor. De acuerdo a lo estudiado hasta ahora podemos obtener una conclusión importante, el tamaño de la muestra a determinar es el mínimo tamaño requerido para cumplir con el Nivel de Confianza establecido y el margen de Error estimado, es una cuestión de economía. Sin embargo esta conclusión nos lleva a afirmar que a mayor tamaño de la muestra, mayor es el Nivel de Confianza y menor el margen del Error de Muestreo lo cual sería mejor para cualquier estudio de investigación a realizar.
115
4.1 Tamaño de la muestra para estimar en poblaciones no finitas
4.2 Tamaño de la muestra para estimar en poblaciones no finitas
Eπ = p – π
Si se optimizara el tamaño de la muestra, haríamos más confiable la investigación; y esto se logra si obviamos la proporción que se nos suministre, y
asumimos la proporción óptima que sería = 0,5. Para el margen de error
estimado y el Nivel de Confianza establecido obtendríamos el tamaño de la
muestra óptimo, ya que 0,5 1 0,25 por lo que:
2
0,25Z
nE
4.3 Tamaño en el muestreo aleatorio simple para poblaciones finitas (N)
2
22
2 2
2 2 2 2
: ; Pr , :
1 0,25; 0,5
1 0,25
N ZPara Medias Poblacionales n para oporciones Poblacionales normal
NE Z
NZ NZn para que sea óptima se hace n
NE Z NE Z
5. Propiedades de un buen estimador: 6.
6.1 Estimador insesgado: Un estimador es insesgado, si la medias de su de distribución muestral es igual al parámetro correspondiente.
6.2 Estimador eficiente: Dado todo estimador insesgado, el más eficiente es aquel que tenga la menor varianza
6.3 Estimador consistente: Un estimador es consistente si, a medida que n aumenta el valor del estadístico se acerca al parámetro
6.4 Estimador suficiente: Un estimador es suficiente si ningún otro estimador puede proporcionar más información sobre el parámetro
RESUMEN DEL CAPÍTULO EN CUADROS
Intervalos de Confianza
Parámetro Intervalo de confianza
Media Poblacional I.C. de µ: L.I.C. ≤ µ ≤ L.S.C.
Proporción Poblacional I.C. de : L.I.C. ≤ ≤ L.S.C.
116
Cuadro de fórmulas y condiciones para determinar cualquier Intervalo de Confianza
Tipo de Población Parámetro Límite Determinación Tipo de Distribución
Grandes No-finitas
(n≥30)
Media
Poblacional
Inferior de
Confianza L.I.C.= x - 0 xZ
Distribución a utilizar. Sé
utiliza la Distribución
Normal Estándar (Z). Sin
embargo se utiliza también
en poblaciones pequeñas,
siempre y cuando ésta sea
una población
normal.Comentario.Para
conseguir el valor de Z0, se
debe conocer el Nivel de
Confianza (NC), y con ese
valor conseguir el valor del
área (A0) dentro de la tabla,
la cual nos define el valor
de Z0.
Superior de
Confianza L.S.C.= x + 0 xZ
Proporción
Poblacional
Inferior de
Confianza L.I.C.=p - 0 xZ
Superior de
Confianza L.S.C.= p+ 0 xZ
Grandes Finitas
(n≥30)
Media
Poblacional
Inferior de
Confianza L.I.C.= x - 0 xZ fcpc
Superior de
Confianza L.S.C.= x + 0 xZ fcpc
Proporción
Poblacional
Inferior de
Confianza L.I.C.= p - 0 xZ fcpc
Superior de
Confianza L.S.C.= p + 0 xZ fcpc
Pequeñas No-Finitas
(n<30)
Media
Poblacional
Inferior de
Confianza L.I.C.= x - 0 xt s
Distribución a utilizar. Se
utiliza la Distribución
Simétrica Platicúrtica de
Student (t), para
poblaciones pequeñas no
normales. Comentario.
Para conseguir el valor de
t0, se debe conocer el Nivel
de Confianza (NC), y ese
valor se combina con el
grado de libertad (g.l.),
ubicado en la primera
columna a la derecha de la
tabla t, ubicando en la
parte de la fila superior
donde se señalados colas
al N.C. g.l.= n –1
,n=tamaño de la muestra;
r=restricción que presenta
la población
Superior de
Confianza L.S.C.= x + 0 xt s
Proporción
Poblacional
Inferior de
Confianza L.I.C.= p - 0 xt s
Superior de
Confianza L.S.C.= p + 0 xt s
Pequeñas Finitas
(n<30)
Media
Poblacional
Inferior de
Confianza L.I.C.= x - 0 xt s fcpf
Superior de
Confianza L.S.C.= x + 0 xt s fcpf
Proporción
Poblacional
Inferior de
Confianza L.I.C.= p - 0 xt s fcpf
Superior de
Confianza L.S.C.= p + 0 xt s fcpf
Factor de corrección para poblaciones finitas: 1
N nfcpf
N
117
Determinación del tamaño adecuado de la muestra
Tipo de
Población
Parámetro Fórmula Ordinaria Fórmula
Óptima
Comentario
No finita
Media
Poblacional
2Z
nE
Seleccionado el N.C., en el
tamaño muestral 2 factores
importantes influyen: a) la
varianza de la pobl. (2
),
expresa el grado de
variabilidad que presentan
las unidades de la pobl.,
siendo para prop. Poblacs.:
2= π (1- π) y en el mejor
de los casos 2
x= 0,25; b) el
tamaño del error tolerable (E)
fijado por el investigador de
acuerdo al estudio a realizar
y c) el nivel de confianza
(NC), tiene relación directa
con el tamaño de la muestra
a mayor nivel de confianza el
tamaño de la muestra será
mayor.
Proporción
Poblacional
2
1Z
nE
2
0,25Z
nE
Finita
Media
Poblacional
2
22
N Zn
NE Z
Proporción
Poblacional
2
2 2
1
1
NZn
NE Z 2
2 2
0,25
0,25
NZn
NE Z
Problemas Resueltos
Problema 01.- Si la desviación estándar de las notas de los estudiantes de un curso de Estadística Instrumental del I. U. G. T. es de 1,6 puntos. Si se toma una muestra de 36 estudiantes de estos estudiantes, ¿Cuál es la probabilidad de que se presente un error de muestreo de 0,6 puntos o más?
Datos: 36; 0,6; 1,6n E
Fórmulas: ; ;x x
E Zn
1,6 0,60,267; : 2,2
0,6 0,
5;0,26736
0,6 0,5 0,4878 0,0122; :
0122
xluego Z como se nos pide que la probabilidad
sea igual o mayor que eso A luego
P X
Problema 02.- Una empresa de investigación realizó una encuesta para determinar la
cantidad media que los fumadores gastan en cigarrillos durante una semana. Una muestra
de 49 fumadores reveló que la media muestral es de Bs. 20 y una desviación estándar
118
muestral de Bs. 5. a) ¿Cuál es el estimador puntual de la media de la población? Explicar
que indica y b) Utilizando el nivel de confianza de 95%, determinar el intervalo de confianza
para la media poblacional. Explicar que indica.
Datos: 49; 20; 5; 95%n X S NC
Fórmulas: ;x x
SE Z S S
n
a) “El mejor estimador es la Media Muestral=20, ya que partiendo de ella se puede estimar el rango de valores donde puede ubicarse la Media Poblacional”
b)
50,7143; 95% 1,96 1,96 0,7143 1,4
7
20 1,4 18,6; 20 1,4 21,
: 18,6 21,4
" , 18,6 21,4"
4
x
IC de
Explica que la Media Poblacional con estos datos debe oscilar entre
S para NC Z E x
LIC X E LSC X E
a
Problema 03.- Para realizar un estudio de manera aleatoria se selecciona una muestra de
81 trabajadores cuyo ingreso mensual promedio fue de Bs. 3.890,00 conociéndose que para
condiciones similares la desviación estándar poblacional es de Bs. 998,00. Se toma un nivel
de confianza del 96%, para realizar un estudio de estimación. Se pide: a) ¿Cuál será la media
poblacional? b) ¿Cuál sería el mejor estimador puntual?, c) ¿Qué distribución de variable
continua se utilizaría para obtener el error estándar de la muestra, el error de muestro y un
intervalo de confianza? ¿Por qué?, d) Calcular el error estándar de la muestra y el error de
muestreo, e) Desarrollar el intervalo de confianza para este estudio e interpretar resultados y
f) ¿ Se podría afirmar que un ingreso de Bs. 3.800,00 es una media poblacional? ¿Qué tal un
ingreso de Bs. 3.650?
Datos: 81; 3.890,00; 998,00; 96%n X NC
Fórmulas: ;x x
SE Z S S
n a) “No se puede considerar una media poblacional como tal en virtud que en el
Intervalo de Confianza que se podría desarrollar con esta información existirían infinitos valores que podrían asumir la función de Media Aritmética Poblacional”.
b) “El mejor estimador es la Media Muestral (Bs. 3.890,00) , ya que partiendo de ella se puede estimar el rango de valores donde puede ubicarse la Media Poblacional”
c) “Se utilizará la Distribución Normal o Z, ya que n=81>30, Población Grande. d)
998; 96% 2,05
81
2
110,889
227,,05 110,889 322
x xpara NC Z
EE x
e)
119
: 3.662,678 4.117,322
3.890 227,322 3.662,678; 3.890 227,322 4.1
" ,
3.662,678 4.117,
17,3
322
2
"
2
IC de
Explica que la Media Poblacional con estos datos debe
LIC X E LSC
oscilar desde a inclusive
X E
f) Como Bs. 3.800,00 está dentro del Intervalo de Confianza se puede considerar como uno de los valores de la Media Aritmética Poblacional; no así Bs. 3.650,00 que está fuera de ese intervalo”
Problema 04.- Una agencia de turismo tomó muestras de las personas que en vacaciones participaban en cruceros por El Caribe y que visitaban a Puerto Rico. Dentro de un nivel de confianza de 96%, ¿Cuál será el intervalo de confianza para la proporción de vacacionistas venezolanos si de las 1822 personas encuestadas 531 eran venezolanos?
a) Datos: 531; 1.822; 96%n N NC
b) Fórmulas: 1
; ;p p
p pnp E Z
N n
c)
0,2914 1 0,29145310,2914; 0,0197; 96% 2,05
1.822 531
2,05 0,0197 0,0403
0,2914 0,0403 0,251
: 0,2511 0,33
1; 0.2914 0.0403 0,3317
17
pp para NC Z
E x
LIC p E LSC p E
IC de
Problema 05.- ¿Qué tan grande se requiere que sea el tamaño de una muestra para que proporcione una estimación del 90% del número promedio de graduados de las universidades nacionales con un error de muestreo de 2.000 estudiantes si una muestra piloto reporta una desviación estándar de 8.659?
Datos: 2000; 8.659; 90%E NC
Fórmulas:
2Z
nE
2
1,65 8.65990% 1,65; : 51,0321
2.
2
000
5n
xPara NC Z luego n
Problema 06.- Para realizar un estudio se requiere un nivel de confianza del 95% para la
tasa de rendimiento promedio de una empresa que gana sobre sus proyectos para
presupuestar capital. ¿Cuántos proyectos debe tener la muestra, si su supervisor especifica
un error máximo de sólo del 5% y una desviación estándar de 0,23?
Datos: 5%; 95%; 0,23E NC
Fórmulas:
2Z
nE
120
2
1,96 0,2395% 1,96 81,2
8
8830,05
2
xPara NC n
n
Z
Problema 07.- El comisionado para supervisar el funcionamiento de los institutos de educación universitaria requiere hacer un estudio sobre los graduandos de dichos institutos en esta parte del año. Solo sabe que el año pasado por esta época solo se graduó el 82% de los que tenían opción al grado. Se toma un nivel de confianza del 96%, y se estima un error de muestreo del 3%, para realizar una encuesta sobre la posibilidad que tiene cada estudiante de graduarse. Para hacerla se va a tomar una muestra de manera aleatoria de los 25.683 graduandos. ¿Cuál sería el tamaño mínimo de la muestra para realizar esta investigación?
Datos: 0,82; 0,03; 96%; 25.683E NC N Población Finita
Fórmula:
2
2 2
1
1
o
o
NZn
NE Z
2
2 2
0,82 0,18 25.683 2,05671,198
25.683 0,03 0,82 0,18 2,05672n graduandn os
Problema 08.- El comisionado para supervisar el funcionamiento de los institutos de educación universitaria requiere hacer un estudio sobre los graduandos de dichos institutos en esta parte del año. No teniendo una información referencial para un basamento en el muestreo de los graduandos actuales; se toma un nivel de confianza del 96%, y se estima un error de muestreo del 3%, para realizar una encuesta sobre la posibilidad que tiene cada estudiante de graduarse. Para hacerla se va a tomar una muestra de manera aleatoria de los 25.683 graduandos. ¿Cuál sería el tamaño mínimo de la muestra para realizar esta investigación?
Datos: 25.683; 0,03; 96%N E NC Población Finita
Fórmulas:
2
2 2
0,25
0,25
o
o
NZn
NE Z
2
2 2
0,25 25.683 2,051.116,608
25.683 0,03 0,251
2,05.117n graduandosn
Problema 09.- Para introducir un nuevo producto en el mercado una empresa de bebidas gaseosas requiere realizar una encuesta para estudiar el grado de aceptación del nuevo producto, la cual se realizaría tomando un Nivel de Confianza del 97% y un error permisible del 3% ¿Cuál será el tamaño de la muestra?
Datos: 3%; 97%E NC
Fórmulas:
2
0,25Z
nE
121
2
2,1797% 2,17 0,25 1.308,0278
0,0
1. 09
3
3
Para NC Z
n
n
Problema 10.- Si el nuevo producto de la empresa de bebidas gaseosas va dirigido a una
población de 458.564 consumidores de refrescos, para realizar la encuesta del problema
anterior se necesita conocer el tamaño de la muestra, dentro de un nivel de confianza del
97% y un margen de error del 3% ¿Cuál será el tamaño de la muestra?
Datos: 458.564; 0,03; 97%N E NC Población Finita
Fórmulas:
2
2 2
0,25
0,25
o
o
NZn
NE Z
2
2 2
0,25 458.564 2,171.304,3073
458.564 0,03 0,251.3
2,105
7n consumidon res
Capítulo 13 PRUEBA DE HIPOTESIS
1. Definiciones básicas 1.1. Hipótesis: Afirmación o enunciado acerca de un parámetro o población que se
desarrolla o elabora con el propósito de probar. 1.2. Prueba de Hipótesis: Procedimiento basado en la evidencia muestral y la
teoría de la probabilidad que se emplea para determinar si la hipótesis es una afirmación razonable.
2. Procedimiento de Hipótesis de cinco pasos para probar una hipótesis
2.1 Primer Paso: Establecer la hipótesis
2.1.1. Hipótesis Nula (Ho): Afirmación acerca del atributo numérico de un
parámetro poblacional.
2.1.2. Hipótesis Alternativa: Afirmación que se acepta si los datos de la
muestra proporciona suficiente evidencia de que la hipótesis nula es falsa.
2.2 Segundo paso: Seleccionar un nivel de significancia
2.2.1. Nivel de Significancia: Es la probabilidad de rechazar la hipótesis nula
siendo verdadera.
2.2.2. Error Tipo I: Rechazar la hipótesis nula siendo verdadera.
2.2.3. Error Tipo II: Aceptar la hipótesis nula siendo falsa
2.2.4. Tipos de Prueba
122
a) Prueba de dos colas:
Prueba de una cola
0Hipótesis Nula H AHipótesis Alternativaa H
a a
Zona de Aceptación
0 2 0Z 0Z Zona de Rechazo
c) Prueba de una cola: Se presenta cuando (cola a la derecha) ó cuando
(cola a la izquierda)
Prueba de una cola
0Hipótesis Nula H AHipótesis Alternativaa H
a
a
a
a
a
a
a
a
123
Cola a la derecha Cola a la izquierda
0Z 0 0Z
Zona de Aceptación Zona de Rechazo Zona de Aceptación
2.3. Tercer Paso: Determinar el estadístico de prueba
2.3.1 Estadístico de Prueba: Valor determinado a partir de la información de la
muestra que se utiliza para definir si se rechaza la o se acepta la hipótesis nula.
2.3.2 Casos que se presentan para probar hipótesis
A) Para una población (Muestra Grande; n≥30, µ y p)
En medias poblacionales (µ) En proporciones poblacionales (p)
Cuando no se conocen se asume la desviación estándar de la muestra S y
p.
B) Para una población (Muestra pequeña; n<30,
2.4 Cuarto Paso: Formular una regla de decisión
124
Si la prueba es de dos colas, para aceptar la hipótesis nula debe cumplirse que
(Muestra grande) ó – to< t < to (Muestra pequeña) de lo contrario
se rechaza Si la prueba es de una cola a la derecha, debe cumplirse que Z ≤ Zo
(Muestra grande) ó t < to (Muestra pequeña) ya
Si la prueba es de una cola a la izquierda, debe cumplirse que – Zo Z (muestra
grande) o t < to (muestra pequeña), ya que
2.5 Quinto Paso: La toma de decisión:
Estudiados y analizados los supuestos de los cuatro pasos anteriores, se toma
la decisión y se redacta en base a los resultados obtenidos.
3. Valores p: Uso e interpretación, en una prueba de hipótesis
3.1 Valor p: Es la probabilidad de observar un valor de muestra tan
extremo o más que el valor observado, dado que la hipótesis nula es verdadera
3.2 Uso e interpretación: El valor p se usa para probar hipótesis, y es un valor
del área según la tabla de distribución normal correspondiente a Z (A).
Si lo prueba es de dos colas se acepta la hipótesis nula, ya que A = 0,5 – A, de lo
contrario se rechaza.
Si la prueba es de una cola se acepta la hipótesis nula, de lo contrario se rechaza.
Problemas Resueltos
Problema 01.-Una embotelladora de salsa de tomates quiere comprobar que el producto contenido en cada botella tiene un peso promedio de 450 gramos. Para realizar la comprobación se tomó una muestra de 250 botellas, y se le calculó al producto, un peso promedio de 452,75 gramos, con una desviación estándar de 24,55 gramos. Para la comprobación se toma un nivel de significancia del 5%. ¿Será cierto lo que quiere comprobar la embotelladora de salsa de tomates?
Datos: µ =450 grs., n=250 botellas; =452,75 grs.; S=24,55 grs.; α=5%
Fórmulas: 0 0; ; 0,5
x
x
XZ A
n
Solución 01. Planteamiento de la Hipótesis:
Hipótesis Nula; H0: µ =450 grs. Hipótesis Alternativa; HA: µ 450 grs.
02. Seleccionar un nivel de significancia:
Como µ=450 grs., eso implica que la prueba es de dos colas, por lo que:
125
0
0,050,025
2 2
03. Determinar el estadístico de prueba:
Siendo n=250 > 30, muestra grande, se usa la Distribución Z; por lo que
24,55 452,75 450,001,553 1,77
1,5532501,77
xZ Z
04 Formular la regla de decisión:
Dos Colas Aceptación
-Z0=-1,96 0 Z=1,77 +Z0=+1,96
Por ser una prueba de dos colas para aceptar la Hipótesis Nula debe cumplirse que –Z0<Z<Z0, de lo contrario se rechaza. Se sabe que A0= 0,5 - α0, por lo tanto A0=0,5-
0,025=0,4750, buscando este valor en la tabla de Z, resulta que Z0 =1,96.
05 Toma de Decisión:
Cumpliéndose lo establecido en la regla de decisión, por cuanto –Z0=-1,96<1,77=Z<1,96=Z0, se acepta la hipótesis nula, es decir: “la embotelladora comprobó con esta prueba de hipótesis, que realmente el contenido de cada botella de salsa de tomate pesa un promedio de 450 gramos”
Ejercicio 02.-Una embotelladora de salsa de tomates quiere comprobar que el producto contenido en cada botella tiene un peso promedio mayor o igual a 450 gramos. Para realizar la comprobación se tomó una muestra de 250 botellas, y se le
calculó al producto, un peso promedio de 452,75 gramos, con una desviación estándar de 24,55 gramos. Para la comprobación se toma un nivel de significancia del 5%. ¿Será cierto lo que quiere comprobar la embotelladora de salsa de tomates?
Datos: 450 grs., n=250 botellas; =452,75 grs.; S=24,55 grs.; α=5% grs.,
Fórmulas: 0 0; ; 0,5
x
x
XZ A
n
126
01. Planteamiento de la Hipótesis:
Hipótesis Nula; H0: µ 450 grs. Hipótesis Alternativa; HA: µ 450 grs.
02. Seleccionar un nivel de significancia:
Como, 450, que la prueba es de una cola, como =452,75 > 450 = µ, y la cola
es a la derecha por lo que αo=α= 0,05
03. Determinar el estadístico de prueba: Siendo n=250 > 30, muestra grande, se usa la Distribución Z; por lo que
24,55 452,75 450,001,553 1,77
1,5532501,77
xZ Z
04. Formular la regla de decisión:
Cola Derecha Aceptación 0 +Z0=1,65 Z=1,77
Por ser una prueba de una cola y es a la derecha, para aceptar la Hipótesis Nula debe cumplirse que Z<Z0, de lo contrario se rechaza. Se sabe que A0= 0,5 - α0, por lo
tanto A0=0,5-0,05=0,4500, buscando este valor en la tabla de Z, resulta que Z0 =1,65.
05 Toma de Decisión:
No cumpliéndose lo establecido en la regla de decisión, por cuanto Z=1,77> 1,65=Z0, se rechaza la hipótesis nula, es decir: “la embotelladora comprobó con esta prueba de hipótesis, que realmente el contenido de cada botella de salsa de tomate pesa menos del promedio de 250 gramos”
Problema 03.-Una comercializadora de agua potable lleva botellones de agua a una zona del área metropolitana, donde el responsable de esa zona informa a la gerencia operativa que mensualmente por lo menos 386 botellones de agua se venden allí. El gerente de operaciones piensa que esa cifra puede estar abultada, y para varios meses cualquieras se consignaron 400 botellones de agua para esa zona, llegándose a vender un promedio de 380 botellones de agua por mes, con una desviación estándar de 110 botellones de agua. Se toma un nivel de significancia del 2%, para completar el estudio sobre la venta de los botellones de agua en esa zona de la ciudad. ¿Cuál será el destino del responsable de la venta de botellones de agua en esa zona del área metropolitana?
Datos: Datos: 386 grs., n=400 botellas; =380 grs.; σ=110 grs.; α=2% grs.,
127
Fórmulas: 0 0; ; 0,5
x
x
XZ A
n
01. Planteamiento de la Hipótesis: Hipótesis Nula; H0: µ 386 botellones Hipótesis Alternativa; HA: µ 386
botellones.
02. Seleccionar un nivel de significancia:
Como, 386, que la prueba es de una cola, como =380 < 386=µ , la cola
es a la izquierda por lo que αo=α= 0,02
03. Determinar el estadístico de prueba: Siendo n=400 > 30, muestra grande, se usa la Distribución Z; por lo que
110 380 3865,5 1,09
51,09
,5400x
Z Z
04. Formular la regla de decisión:
Cola Izquierda Z=-2,05 Z=-1,09 0 Aceptación
Por ser una prueba de una cola y es a la izquierda para aceptar la Hipótesis Nula debe cumplirse que –Z0<Z, de lo contrario se rechaza. Se sabe que A0= 0,5- α0, por lo tanto
A0=0,5-0,02=0,4800, buscando este valor en la tabla de Z, resulta que Z0 =2,05
05. Toma de Decisión:
Cumpliéndose lo establecido en la regla de decisión, por cuanto Z0=-2,05<-1,09=Z, se acepta la hipótesis nula, es decir: “El Gerente de Operaciones de la comercializadora de botellones de agua potable, comprobó que es cierta la información que le dio el responsable de la zona metropolitana que él atiende, por lo tanto su destino sería quedarse en la empresa trabajando”
Problema 04.-Una empresa chequeando el fondo de pensiones de sus empleados, llega a la conclusión, de que los empleados tienen un promedio de más de Bs. 99.200,00. Al tomar de manera aleatoria una muestra de 100 de sus empleados, y haciendo los respectivos cálculos en esta muestra, encuentra que la media es de Bs. 100.371,20 con una desviación estándar de Bs. 6.060,80. Para un nivel de significancia del 4%; ¿podrá tomarse como cierta la conclusión de la empresa?
Datos: Datos: 99.200,00 Bs., n=100 empleados; =100.371,20 Bs.; σ=6.060,80
Bs.; α=4% grs.,
128
Fórmulas: 0 0; ; 0,5
x
x
XZ A
n
01. Planteamiento de la Hipótesis:
Como, 450, que la prueba es de una cola, como =452,75 > 450 = µ, y la
cola es a la derecha por lo que αo=α= 0,04
Hipótesis Nula; H0: µ 99.200,00 Bs. Hipótesis Alternativa; HA: µ
99.200,00 Bs.
Seleccionar un nivel de significancia:
Como, 99.2000, que la prueba es de una cola, como =100.321,20,75 >
99.200,00 = µ, y la cola es a la derecha por lo que αo=α= 0,04
02. Determinar el estadístico de prueba:
Siendo n=100 > 30, muestra grande, se usa la Distribución Z; por lo que:
6.080,80 100.371,20 99.200,00608,08 1,93
608,01,
810093
xZ Z
03. Formular la regla de decisión:
Aceptación
Cola Derecha 0 +Z0=1,75 Z=1,926
129
Por ser una prueba de una cola y es a la derecha, para aceptar la Hipótesis Nula debe cumplirse que Z<Z0, de lo contrario se rechaza. Se sabe que A0= 0,5 - α0, por lo
tanto A0=0,5 - 0,04=0,4600, buscando este valor en la tabla de Z, resulta que Z0 =1,75.
05. Toma de Decisión:
No cumpliéndose lo establecido en la regla de decisión, por cuanto Z=1,93> 1,75=Z0, se rechaza la hipótesis nula, es decir: “La conclusión que tiene la empresa sobre el fondo de pensiones de sus empleados está errada, para este nivel de significancia”
Problema 05.-Un grupo de estudiantes de Estadística Instrumental del I.U.G.T., cuestionan
la afirmación de que las procesadoras de hamburguesas utilizan 115 grs. de carne en sus productos, algunos estudiantes piensan que contienen más carne. Para aclarar esta duda, cada uno de los 22 estudiantes del curso lleva una hamburguesa y la pesan en una balanza bien calibrada obteniéndose una media de 109,72 grs. con una desviación estándar de 22,5 grs. ¿Cuál sería la conclusión a que se llegaría para un nivel de significancia del 5%?
Datos: µ=115 grs. n=22 hamburguesas; =109,72 grs.; S= 22,5 grs.; α=5%
0 0; ; 0,5x
x
X St S A
S n
01. Planteamiento de la Hipótesis:
Hipótesis Nula; H0: µ =115grs. la Hipótesis Alternativa; HA: µ 115 grs.
02. Seleccionar un nivel de significancia:
Como µ =115 grs., que la prueba es de dos colas, y siendo una muestra
pequeña ya que: n = 22 < 30, y además no es normal se usará la Tabla de Distribución de Student, donde se contemplan los dos casos de las colas.
03. Determinar el estadístico de prueba: Siendo n=22 < 30, muestra pequeña y además no es normal, se usa la
Distribución t; por lo que
22,5 109,72 115,00
4,797 1,104,79722
1,10x
Z Z
04 Formular la regla decisión.
130
Aceptación
-t0 =-2,08 t=-1,10 0 +t0=2,08
Por ser una prueba de dos colas para aceptar la Hipótesis Nula debe cumplirse que
–t0<t<t0, de lo contrario se rechaza. Como es una sola población pequeña, r=1, por lo
que: g. l.=n - r=22 - 1=21, y entrando a la tabla t de Student en prueba de dos colas
para un a=5% y g.l. de 21, to = 2,080 05 Toma de Decisión:
Cumpliéndose lo establecido en la regla de decisión, por cuanto –t0=-2,08<-
1,10=t<2,08=t0, se acepta la hipótesis nula, es decir: “Se debe concluir que para un
nivel de significancia del 5%, el contenido de carnes de las hamburguesas no tienen un peso superior a los 115 gramos”
Problema 06.-El Director de Operaciones de una empresa de mercadeo, considera que el 60% de los clientes de la firma se han graduado en universidades. Se desea intentar una estructura de precios respecto a esta proporción. Una muestra de 800 clientes revela que 452 de ellos tienen grado universitario. ¿A qué conclusión se llegaría sobre la proporción de todos los clientes que tiene el Director de Operaciones de la empresa aceptando para el análisis un nivel de significancia del 5%?
Datos: =0,60 clientes., n=800 clientes; x = 452 clientes; α=5%;
Fórmulas: 0 0
1; ; 0,5 ;p
p
p pp xZ A p
n n
01. Planteamiento de la Hipótesis:
Hipótesis Nula; H0: =0,60 clientes la Hipótesis Alternativa; HA: 0,60
clientes
131
02. Seleccionar un nivel de significancia:
Como =0,60 clientes, eso la prueba es de dos colas, por lo que
0
0,050,025
2 2
03. Determinar el estadístico de prueba:
Siendo n=800 > 30, muestra grande, se usa la Distribución Z; por lo que:
0,565 1 0,5654520,565; 0,0175
800 800
0,565 0,6002,00
0,01752,00
pp
ZZ
04 Formular la regla de decisión:
Aceptación
Z=-2,00 -Z0 =-1,96 0 +Z0=1,96
Por ser una prueba de dos colas para aceptar la Hipótesis Nula debe cumplirse que –Z0<Z<Z0, de lo contrario se rechaza. Se sabe que A0= 0,5- α0, por lo tanto A0=0,5-
0,025=0,4750, buscando este valor en la tabla de Z, resulta que Z0 =1,96.
05 Toma de Decisión:
No cumpliéndose lo establecido en la regla de decisión, ya que Z = -2,00 no pertenece al intervalo definido, luego: “La consideración del Director de Operaciones de la
empresa de mercadeo no es cierta, el 60% de los clientes no tienen grado universitario”
Problema 07.- Una compañía desea comparar las expectativas sociales anuales de su personal de ventas, entre mujeres y hombres, según un nuevo plan de
compensaciones de ventas más comisión. Para que predijeran sus ingresos anuales se pidió n1= 42 vendedoras y n2= 40 vendedores, seleccionadas de manera aleatoria. Las medias muestrales y las desviaciones de las predicciones que se
formularon son: 1X =Bs. 31.083,00 y S1=Bs. 2.312,00; 2X =Bs. 29.745,00 y S2=Bs.
132
2.569,00; considerar un nivel de significancia del 1%. ¿Proporcionan los datos suministrados evidencias que indiquen una diferencia en el promedio del ingreso
anual esperado tanto entre las vendedoras como los vendedores?
Datos: 1X =Bs. 31.083 y
2X =Bs. 29.745; n1=42 mujeres y n2=40 hombres; S1=Bs. 2.312
y S2=Bs. 2569; α=5%
Fórmulas:1 2
2 2
1 2
1 2
S SS
x x n n;
1 2
1 2 1 2ZS
x x
x x
01. Planteamiento de la Hipótesis:
Hipótesis Nula; H0: µ1=µ2 la Hipótesis Alternativa HA: µ1 µ2
02. Seleccionar un nivel de significancia:
Como µ1=µ2, la prueba es de dos colas, por lo que 0,01
0,0052 2
o
03. Determinar el estadístico de prueba:
Siendo n1=42 y n2=40 > 30, muestra grande, se usa la Distribución Z; entonces:
1 2
1 2 1 2ZS
x x
x x;
31.083 29.745 02,48
540,6146Z
1 2
2 2
1 2
1 2
S SS
x x n n,
1 2
2 22.312 2.569540,6146
42 40S
x x
04 Formular la regla de decisión:
Aceptación
- Z0=- 2,58 0 Z= 2,48 Z0= 2,58
133
Por ser una prueba de dos colas para aceptar la Hipótesis Nula debe cumplirse que –Z0<Z<Z0, de lo contrario se rechaza. Se sabe que A0= 0,5- α0, por lo tanto A0=0,5-
0,005=0,4950, buscando este valor en la tabla de Z, resulta que Z0 =2,58.
05 Toma de Decisión:
Cumpliéndose lo establecido en la regla de decisión, por cuanto –Z0=-2,58<2,48=Z<2,58=Z0, se acepta la hipótesis nula, es decir: “Los datos obtenidos para el estudio dentro de un nivel de significancia del 1%, proporcionan las evidencias de que no existen diferencias en el promedio del ingreso anual esperado tanto en las vendedoras como en los vendedores”
Problema 08.- La Máxima Central Obrera discutiendo el Contrato Colectivo de ajustes salariales para nivelar los ingresos y las condiciones sociales de los
trabajadores de la salud y la construcción. El negociador laboral llega a un acuerdo con la representación patronal de establecer un nivel de significancia del 2%, para estimar la diferencia entre los niveles salariales promedio. Realizado un estudio
muestral que se presenta al final para realizar el ajuste para nivelar a ambos grupos de trabajadores. ¿Cuál sería el ajuste si es del caso?
SALUD CONSTRUCCIÓN
n1=23 n2=19
1.110 BsXDía
2
.98BsXDía
1.24,04 BsSDía
2
.22,69BsSDía
Datos: SALUD CONSTRUCCIÓN
n1=23 n2=19
1.110 BsXDía
2
.98BsXDía
1.24,04 BsSDía
2
.22,69BsSDía
α=2%;
Fórmulas:
2 2 2 2
1 2 1 1 2 21 2 2
1 2 1 2
1 ( 1); ;
2
p p
pp
p
S S S n S nt S S
S n n n n
x x
Solución 02. Planteamiento de la Hipótesis:
Hipótesis Nula; H0: µ1=µ2 HA: µ1 µ2
02. Seleccionar un nivel de significancia:
134
Como µ1=µ2, implica que la prueba es de dos colas, por lo que 0,02
0,012 2
o
03. Determinar el estadístico de prueba:
Siendo n1=23 y n2=19 < 30, muestra pequeña, se usa la Distribución t; entonces:
2 22 (24,04 )(22) (22,69 )(18)
549,533140
pS ;
549,5331 549,53317,2674
23 19pS
110 98
1,6517,2674
t ;
04 Formular la regla de decisión:
Aceptación
-t0=2,423 0 t=1,651 t0=2,423
Por ser una prueba de dos colas para aceptar la Hipótesis Nula debe cumplirse que
–t0<t<t0, de lo contrario se rechaza. Al usar la Distribución t de Student y teniendo en
cuenta que estamos estudiando dos poblaciones pequeñas no normales, entonces g.l.=n1+n2-
2= 23+19-2=40 y como la prueba es de dos colas para α=2%; t0=2,423
05 Toma de Decisión:
Cumpliéndose lo establecido en la regla de decisión, ya que –t0=-2,423<1,6512=t<2,423=t0,
se acepta la hipótesis nula, es decir: “Los ajuste establecidos en el estudio realizado cumple con lo convenido entre el negociador laboral y el representante patronal”
Problemas propuestos para los Capítulos tratados en el Título IV
Problema 01.- Una librería-papelería tiene 7 trabajadores y los ingresos mensuales en bolívares son:
900; 960; 1.020; 900; 1.050; 1.200 y 1.020. Se pide: a) Calcular la media poblacional, la varianza y la
desviación estándar; b) Con los ingresos mensuales dados elaborar una distribución muestral o
distribución de medias si organizamos los datos de la población a estudiar en muestras de tamaño
constante de tres (3) miembros, c) Calcular la gran media o media de medias, la varianza y la
desviación estándar de la distribución muestral o distribución de medias. Comentar y d) Elaborar la gráfica de barras de la distribución dada y la distribución muestral o distribución de medias
elaborada. Comentar
135
Problema 02.- Las ventas de una empresa de líneas blancas en miles de bolívares durante los últimos
cinco meses fueron: 176,7; 189,6; 168,0; 209,1 y 187,2. Asumiendo que estos cincos meses
constituyen la población, se pide: a) Calcular la media poblacional, la varianza y la desviación estándar; b) Con los movimientos económicos mensuales dados elaborar una distribución muestral o
distribución de medias si organizamos los datos de la población a estudiar en muestras de tamaño
constante de tres (3) miembros, c) Calcular la gran media o media de medias, la varianza y la
desviación estándar de la distribución muestral o distribución de medias. Comentar y d) Elaborar la
gráfica de barras de la distribución dada y la distribución muestral o distribución de medias
elaborada. Comentar. Problema 02.- Las latas de refresco vendidas en la refresquería Pedroso S.R.L tienen un promedio
16,11 onzas con una desviación estándar de 1,2 onzas. Si se tenía una muestra de 200 latas de
refresco ¿Cuál es la probabilidad de que la media sea: a) Menor que 16,27 b) Por lo menos 15,93 y c)
Entre 15,9 y 16,3.
Problema 04.- Una población normal tiene una media de 85 y una desviación estándar de 17. Si
selecciona una muestra de 16, calcular la probabilidad de que la media de las medias muéstrales sea:
a) Mayor que 90, b) Menor que 75 y c) Entre 75 y90.
Problema 05.- Una población cuya forma no se conoce tiene una media de 75 con una desviación
estándar de 5. Si se selecciona una muestra de 40, calcular la probabilidad de que la media de las medias muestrales sea: a) Mayor que 77, b) Menor que 74, c) Entre 74 y 76 y d) Entre 76 y 77.
Problema 06.- Según estudio realizado por SENIAT, las personas contribuyentes naturales tardan 330
minutos en promedio en preparar, copiar y archivar en un medio electrónico la planilla modelo para
este tipo de declaración. Una empresa gestora que orienta a los consumidores en el preparado de estas
planillas, seleccionó una muestra de 40 de sus clientes y comprobó que el tiempo requerido para preparar, copiar y archivar la planilla les llevó un promedio de 320 minutos. a) ¿Cuál es el error
estándar?, b) ¿Cuál es la probabilidad de que la media de las medias muestrales sea mayor que 325
minutos?, c) ¿Cuál es la probabilidad de que la media de las medias muestrales se encuentre entre
320 y 350? y d) ¿Cuál es la probabilidad de que la media de medias muestra esa mayor que 350?
Problema 07.- Una encuesta realizada por una empresa especializada reveló que los estudiantes de último año de secundaria ven televisión en un promedio de 37,2 horas por semana. Se asume una
desviación estándar de 5,4 horas. En una muestra de 500 estudiantes de secundaria, qué tan
probable es que la media muestral sea: a) ¿Más de 38 horas?, b) ¿Menos de 36,6 horas? Y c) ¿Entre
36,4 y 37,9?
Problema 08.- El consumo diario de agua en San Juan de los Morros, promedia 92,2 litros por hogar,
con una desviación estándar de 17,56 litros. El Alcalde de la ciudad desea estimar esta media no
conocida con una muestra de 100 hogares, ¿Qué tan probable es que el error de muestreo exceda los
1,89 litros?
Problema 09.- El 30% de los empleados tienen formación avanzada. Si una muestra de 500 empleados menos del 27% estaban preparados de forma adecuada, todos los nuevos empleados
contratados necesitarán inscribirse en un programa de formación. ¿Cuál es la probabilidad de que se
inicie el programa?
Problema 10.- La proporción de todos los clientes Pizza Spósito C. A. que comen en el sitio es del 75%. En una muestra de 100 clientes, ¿Cuál es la probabilidad de que menos del 20% lleven su comida a
casa?
Problema 11.- Una empresa elabora cables con una resistencia media de 800 Kgs. Y una desviación
estándar de 60 Kgs. ¿Qué probabilidad debe existir si se toma una muestra de 16 cables del mismo
tipo, de tengan resistencia: a) Más de 820 Kgs.? y b) Menos de 785?
136
Problema 12.- De 314 0breros que trabajan en una empresa automotriz se observa que tienen un
promedio de 32 años, con una desviación estándar de 10 años. Se pide: a) Probabilidad de que la
media muestral de 25 de ellos resulte menor de 28 años y b) Probabilidad de que sobrepase los 31 años.
Problema 13.- Si la desviación estándar de las notas de los estudiantes de un curso de Estadística
Instrumental del I. U. G. T. es de 1,6 puntos. Si se toma una muestra de 36 estudiantes de estos
estudiantes, ¿Cuál es la probabilidad de que se presente un error de muestreo de 0,6 puntos o más?
Problema 14.- Para estimar el gasto promedio de los clientes de un restaurant de comida rápida, los
estudiantes de una clase toman una muestra de 200 clientes y encuentran un gasto promedio de 5,67
Bs. con una desviación estándar del 1,10 Bs. ¿Cuál es el intervalo de confianza del 95% para los
gastos promedio de todos los clientes? Interpretar resultados.
Problema 15.-En una sala de conferencia, una tertulia estudiantil popular vende vasos de tizana de
16 onzas. Diez estudiantes compran un total de 22 vasos y utilizando su propia taza de medida
estiman los contenidos promedios, la media muestral es de 15,2 onzas con una desviación estándar
muestral de 0,86. ¿Con un nivel de confianza de 95% los estudiantes creen que su dinero vale?
Interprete el intervalo.
Problema 16.- Cien latas de 453,58 grs. de salsa de tomate de una reconocida marca nacional tienen un promedio de 430,91 grs. La desviación estándar poblacional en peso es de 27,22 grs. Dentro de un
nivel de confianza del 95%, ¿Las latas parecen estar llenas realmente con un promedio de 453,58?
Problema 17.- Las bonificaciones para 10 jugadores de la Liga Nacional de las Grandes Ligas se
utilizan para estimar la bonificación promedio para todos los nuevos jugadores. La media muestral es de $ 65.890,00 con S = $ 12.300,00. ¿Cuál es su estimación con un intervalo de confianza del 90%
para la media poblacional?
Problema 18.- Una empresa especializada informó que el 68% de todos los estudiantes de secundaria
tenían computadoras en su casa. Si una muestra de 1.020 estudiantes revela que 673 tienen
computadoras caseras. ¿Será que dentro de un intervalo del 99% apoya a esa empresa especializada?
Problema 19.- Una empresa de investigación realizó una encuesta para determinar la cantidad media
que los fumadores gastan en cigarrillos durante una semana. Una muestra de 49 fumadores reveló
que la media muestral es de Bs. 20 y una desviación estándar muestral de Bs. 5. a) ¿Cuál es el
estimador puntual de la media de la población? Explicar que indica y b) Utilizando el nivel de confianza de 95%, determinar el intervalo de confianza para la media poblacional. Explicar que indica.
Problema 20.- El dueño de una granja avícola quiere calcular el número medio de huevos que pone
una gallina. Una muestra de 20 gallinas indica que ponen un promedio de 20 huevos al mes con una
desviación estándar de 2 huevos por mes. a) ¿Cuál es el valor de la media poblacional? ¿Cuál es el
mejor estimador de este valor? b) Explicar ¿Por qué? se necesita usar la distribución t, ¿Qué suposición debe hacer?, c) Para un intervalo de confianza del 95%, ¿Cuál es el valor de t?, d)
Desarrolle el intervalo de confianza del 95% para la media poblacional y e) ¿Sería razonable llegar a la
conclusión de que la media de la población es 21 huevos, ¿Qué tal 25 huevos?
Problema 21.- Una embotelladora de agua potable proporciona el producto en botellones de 25 litros a
un sector de una parroquia caraqueña. El gerente desea estimar el número promedio de botellones que una casa consume en un mes. Se toma una muestra de 75 viviendas y se registra el número de
botellones consumidos, proporcionando una media de 3,2 botellones con una desviación estándar de
0,78. Se desea investigar: a) ¿Qué revelará un Nivel de Confianza del 92%? b) ¿Cuántas viviendas se
deben tomar en cuenta para estar el 97% seguro de que el Intervalo de Confianza no esté errado en
más de 0,10 de botellones de agua?, c) Al seleccionar una muestra más pequeña de 10 viviendas para
estimar el promedio de miembros de la familia por vivienda, arrojó los resultados siguientes: 1, 3, 4, 7, 2, 2, 3, 5, 6 y 6, personas por cada vivienda; ¿cuáles serán los resultados para un Nivel de
Confianza del 97% para el número promedio de miembros de la familia por viviendas donde la
137
Desviación Estándar es 4,1 botellones de agua. d) De las 75 viviendas de la muestra 22 tienen filtros
de agua en su vivienda, ¿cuál será el estimado para un Nivel de Confianza del 95% de la proporción de
todas las viviendas en el sector de la parroquia que tienen filtros de agua? y e) Con el Nivel de Confianza anterior de todas las viviendas que tienen filtros de agua y carece de precisión, ¿cuál será el
tamaño de la muestra para producir un Intervalo de Confianza del 10%?
Problema 22 .- Para estimar gastos promedio de los clientes de un local de Mc Donald s, los
estudiantes de estadística toman una muestra de de 200 clientes y encuentran un gasto promedio de
Bs16,25, con una desviación estándar de Bs 3,15. ¿Cuál es el intervalo de confianza para los gastos promedio de todos los clientes dentro de un nivel de confianza del 95%? Interpretar resultados.
Problema 23.- Una agencia de turismo tomó muestras de las personas que en vacaciones
participaban en cruceros por El Caribe y que visitaban a Puerto Rico. Dentro de un nivel de confianza
de 96%, ¿Cuál será el intervalo de confianza para la proporción de vacacionistas venezolanos si de las 1822 personas encuestadas 531 eran venezolanos?
Problema 24.- ¿Qué tan grande se requiere que sea el tamaño de una muestra para que proporcione
una estimación del 90% del número promedio de graduados de las universidades nacionales con un
error de muestreo de 2.000 estudiantes si una muestra piloto reporta una desviación estándar de 8.659?
Problema 25.- Para realizar un estudio se requiere un nivel de confianza del 95% para la tasa de
rendimiento promedio de una empresa que gana sobre sus proyectos para presupuestar capital.
¿Cuántos proyectos debe tener la muestra, si su supervisor especifica un error máximo de sólo del 5% y una desviación estándar de 2,3%?
Problema 26.- Un investigador está interesado en estimar la ganancia en peso total, en 0 a 4
semanas de 1.000 pollitos alimentados con una nueva ración. Obviamente, pesar cada ave sería
tedioso y llevaría demasiado tiempo. Por lo tanto, se debe determinar el número de pollitos a
seleccionar en una muestra, para estimar el total con un límite para el error de estimación igual a 1.000 gramos. Muchos estudios similares sobre nutrición de pollitos se han llevado a cabo en el
pasado. Usando datos de estos estudios, el investigador encontró que la varianza es,
aproximadamente de 36 gramos. Determinar el tamaño de muestra requerido, con un nivel de
confianza del 95%.
Problema 27.-Para una población de 123.318 electores se desea calcular el tamaño de una muestra
para una encuesta donde el nivel de confianza debe ser del 98% con un error permisible del 2%. ¿Cuál
es el tamaño de la muestra?
Problema 28 .- El fabricante de un nuevo auto compacto sostiene que este promediará un consumo
de 14Km./lit. en carreteras normales. En 40 corridas de prueba el auto promedió13,9 Km. /lit. de consumo con una desviación estándar de 0,933 Km. / lit. ¿Podrá rechazarse la afirmación del
fabricante dentro de un nivel de significancia del 5%?
Problema 29.- Doris de Comida C. A. construirá un nuevo establecimiento en una localidad propuesta
solo si durante ciertas horas pasa por ella más de 200 automóviles por hora. En 20 horas aleatoriamente muestreadas durante el horario establecido, el número promedio que pasan es de
208,5; con una desviación estándar muestral 30,0. Se supone que estadística es aproximadamente
normal. Dentro de un nivel de significancia del 5%, ¿Se podrá rechazar la hipótesis nula?.
Problema 30.- El encargado para colocar en el mercado de trabajo a los graduados del I. U. G. T.
sostuvo que al menos el 50% de los nuevos graduados habían cerrado un trato de empleo para el 1ro de Agosto. Supongamos que reúne una muestra aleatoria de 30 estudiantes próxima a graduarse y
que solo 10 de ellos señalan haber cerrado un trato de empleo para el 1ro de Agosto. Dentro de un
138
nivel de significancia del 5%; ¿Se podrá rechazar que sostiene el encargado del I. U. G T para la
colocación en el mercado de nuevos graduado?
Problema 31.- Se estudia la ubicación de un centro comercial y se consideran las alternativas de dos
localidades tomando en cuenta el ingreso económico mensual de los miembros de la comunidad. Se
desea probar la hipótesis de que no existe diferencia entre el ingreso económico medio de ambas
comunidades y se supone que la desviaciones estándar de ese ingreso medio también son iguales. En
una muestra de 30 hogares de la primera comunidad el ingreso mensual promedio es de Bs. 8.150,00
con una desviación estándar de Bs. 332. En una muestra de 40 hogares en la segunda comunidad, el ingreso mensual promedio es de Bs. 7.790,00 con una desviación estándar de Bs. 430. Para un nivel
de significancia del 5%, ¿Se cumplirá la hipótesis planteada?
Problema 32.- En problema anterior considere:
Comunidad 01 n1 = 16, X1 = Bs. 8.000,00; S1 = 0,326 Comunidad 02 n2 = 25; X2= Bs. 7.750,00; S2 = 0,428
α = 0,05
Problema 33.- Un fabricante evalúa dos tipos de equipos para la fabricación de un componente; los
datos de la investigación se presentan al final. El índice de fabricación de ambas marcas es el mismo. Sin embargo debido a que el costo de la
primera marca es sustancialmente menor, el fabricante le concede el beneficio de la duda y formula la
tesis de que π1 < π2. Para un nivel de significancia del 5% probar la hipótesis planteada.
n Defectuoso
Equipo 01 50 5
Equipo 02 80 6
Problema 34.- Un profesor de Estadística Instrumental del I. U. G. T. sugiere dos textos de estudios
para los cursos donde dicta la materia y quiere probar que el texto de estudio 01 da mejor rendimiento
que el texto de estudio 02, y toma apoyo un reciente estudio realizado, el cual se muestra en cuadro
anexo, donde se presenta el número de estudiantes aprobados según el texto utilizado. Dentro de un nivel de confianza del1%; ¿Será que el
profesor de estadística estará en lo cierto?
Problema 35.-En 1997 una empresa de inversiones informó que los empresarios en un país
desarrollado invierten un promedio de 18.600 Bs. cada mes en el mercado de títulos. Si esta
afirmación está apoyada en un nivel de significancia del 5% y tomamos una muestra de 36 meses que
nos presenta una media de inversión de Bs. 17.100 y una desviación estándar de 2.400 Bs. ¿Será que
la información que presenta la empresa de inversiones es cierta? Problema 36.-Un distribuidor de bebidas plantea la hipótesis que las ventas por mes se estiman en
más de Bs. 12 si seleccionamos una muestra de 10 meses donde se reporta una media de Bs 11,277 y
una desviación estándar de Bs 3,772. Para un nivel de significancia del 5% será cierta la aseveración
del distribuidor de bebidas.
Curso
Texto
1
2
3
4
5
6
7
8
9
Total
Equipo 01 12 10 15 09 14 15 14 14 11 114
Equipo 02 13 10 16 10 11 13 12 12 14 111
139
Problema 37.- Como gerente de compras la Señora Rosa María Cavero debe decidir si se actualizan o
no las computadoras de la oficina. A ella se le informado que el costo promedio de las computadoras
es de Bs 2.100,00. Una muestra de 64 minoristas revela un promedio de 2.251,00, con una desviación estándar de Bs 812,00. Si tomamos un nivel de significancia del 5%; ¿Será correcta la
Información?
Problema 38.- Debido a los retardos que se producen en el tiempo para que los estudiantes lleguen a
tiempo a clase en el I. U. G. T., el Director Académico desea plantear una revisión de los horarios de
clase. Él considera que el tiempo promedio de los estudiantes para llegar a clase es de 50 minutos.
Encuestados 70 estudiantes se constató que ellos tardan un promedio de 47,2 minutos con una desviación estándar de 18,9 minutos. Para un nivel de significancia del 1%, ¿Será que el Director
Académico está en lo cierto?
140
TÍTULO V Capítulo 14
ANALISIS DE VARIANZA
1. Análisis de varianza (ANOVA): Es un modelo estadístico diseñado específicamente para probar si dos o más poblaciones presentan la misma media. Sin embargo el propósito del ANOVA es realizar pruebas es hallar diferencias en las medias poblacionales, realizando un estudio en las varianzas muestrales. Partiendo de la base que el termino ANOVA define a la realización de un análisis de varianza para observar si al aplicar un tratamiento en particular a una población, éste tendrá un impacto significativo en su media 1.1. Definiciones básicas
1.1.1. Distribución F o de Fisher: Es la distribución de probabilidad utilizada como la distribución del estadístico de pruebas para diferentes casos, permitiendo, probar si dos muestras provienen de poblaciones que tienen varianzas iguales, siendo útil también cuando se desea comparar simultáneamente varias medias poblacionales, en este caso el proceso de comparación se llamará Análisis de Varianza (ANOVA)
1.1.1. Unidades experimentales: Es cada sub-grupo en los cuales se divide una población o muestra para realizar el estudio y que serán sometidos a los tratamientos
1.1.2. Tratamiento: Es la influencia o efecto que pueda tener los valores o datos externos sobre las medias de las unidades experimentales de las poblaciones examinadas.
1.1.3. Factor: Es la variable de cada unidad experimental que se desea medir en el estudio que se realiza.
1.1.4. La razón F tal y como se utiliza en ANOVA: La razón F es una razón de la variación entre muestras y la variación dentro de las muestras. Este factor aumentará al tener medias poblacionales diferentes, donde se presenta el efecto del tratamiento; siendo grandes las desviaciones entre las muestras comparadas con la desviación del error dentro de una muestra. En el desarrollo de este estudio estudiaremos la aplicación del ANOVA sobre modelos fijos, donde seleccionaremos tratamientos específicos o se fijan antes de comenzar a realizar el estudio.
1.2 Comparación de las varianzas de población: Teniendo las observaciones de dos
poblaciones se establece como estadística de pruebas:
La varianza mayor se toma en el numerador y la menor en el denominador 87+1.3 Análisis de varianza a una sola vía (Diseño completamente aleatorio) Para realizar el ANOVA a una sola vía se requiere obtener la gran media de todas las observaciones en último lugar:
iXX
K
y en primer lugar la media aritmética de cada subgrupo en la cual fue dividida la muestra o la población:
141
jiXX
n
1.3.1 Variación total: Es la suma de las diferencias elevadas al cuadrado entre cada observación y la media total o gran media es decir es el desvío elevado al cuadrado de la observación de la población o muestra respecto a la media total o gran media.
2
1j
j
K
i
i
SCT X X
1.3.2 Variación tratamiento: Es la suma de las diferencias elevadas al cuadrado entre la media aritmética de cada Unidad Experimental y la media total o gran media, es decir el desvió elevado al cuadrado de cada media aritmética de las Unidades Experimentales respecto a la media total o gran media.
2
1
j
j
n
ij
c
SCTR c X X
1.3.3. Variación de error o aleatoria: Es la suma de las diferencias elevadas al cuadrado entre las observaciones por Unidades Experimentales y sus respectivas medias (media de cada Unidad Experimental) o es el desvío al cuadrado de cada observación vinculada a la respectiva media o promedio de cada Unidad Experimental
2
1 1j
j
K n
i i
i j
SCE X X
Para comprobar resultado debe cumplirse que SCE= SCTR + SCE
1.3.4. Cuadrados Medios: Para obtener los cuadrados medios a cada variación obtenida, se le divide el valor de cada una entre sus respectivos grados de libertad.
a) Grado de libertad para la variación total; g.l. de SCT= n-1; n= número total de
observaciones de la población o muestra, y tienen una (1) sola restricción ya que
(gran media) es única. b) Grado de libertad para la variación de tratamiento; g.l. de SCTR = C-1, donde se tiene que C = número de Unidades Experimentales, y cada una de ellas solo tiene una
(1) restricción ya que iX (media de cada Unidad Experimental) es única para cada
Unidad Experimental. c) Grado de libertad para la variación de error o aleatoria; g.l. de SCE = n-c, ya que se estudia el error de todos las Unidades Experimentales y el error total de la población estudiada, en consecuencia tenemos que: 1.3.4.1. Cuadrado medio total
1.3.4.2. Cuadrado medio de tratamiento
1.3.4.3. Cuadrado medio del error o aleatoria
1.3.5. Estadístico de prueba para las conclusiones de ANOVA Razón de Fisher o F para una prueba de medias
142
Si F es menor que (F<Fo) se acepta la hipótesis nula de lo contrario (F>Fo) se
rechaza. 1.3.6. Suposiciones de ANOVA Se supone: a) Las poblaciones siguen la distribución normal b) las poblaciones presentan desviaciones típicas o estándares iguales c) las muestras se seleccionan de manera independiente.
Problemas Resueltos
Problema 01.-La siguiente es información de una muestra. Probar la hipótesis de que las medias de tratamientos son iguales, para un nivel de significancia del 5%.
Trat. 01 Trat. 02 Trat. 03
9 10 12
7 20 9
13 14 12
9 13 14
12 15
10
Datos: 5%; el restoestáenlatabla
Fórmulas: 2
2
1 1 1
2
1 1
: ; :
: ; :1
:
k
k
k
cf c
jij j
i j j
f c
ij j
i j
SumaCuadradoTotal SCT X X Suma deCuadrados deTratamientos SCTR f X X
SCTSumaCuadrado del Error SCE X X Cuadrado MedioTotal CMT
n
SCTRCuadrado Medio delTratamiento CMTR
c; : ; ;
1
; ; .
SCE CMTRCuadrado MedioTotal CMT F
n c CME
n Tamañototal dela población f Número de filas c Número decolumnas
Solución Primer Paso.- Plantear la hipótesis
" "
" ",
; :
;
La Hipótesis Nula H
La Hipótesis Alterna
Las medias delostratamientos son iguales
Las medias delostratamientos sondiferenttiva es
Segundo Paso.- Determinar el Estadístico de Prueba
143
XC1 XC1 XC1
9 10 12 8,6025 0,0045 22,419 1,000 0,160
7 20 9 24,3345 8,6025 21,474 9,000 11,560
13 14 12 1,1385 0,0045 1,0904 9,000 0,160
9 13 14 8,6025 4,2725 1,000 2,560 CMTR 22,492
12 15 0,0045 9,4065 4,000 6,760
10 3,7365 0,000
Mc1 Mc2 Mc3 3,7365 18,063 CME 8,163
10,000 14,250 12,400 65,0765 33,063
4,2725 0,063
1,1385 1,563
120,643 22,2904 76,750 21,200 F 2,76
SCT 142,933 SCTR 44,983 SCE 97,950
VALOR DE FISHER
MED. CUAD. ERROR
SCT SCTR SCE GRAN MEDIA
MED. CUAD. TRAT.
11,933
Tercer Paso.- Seleccionar el Nivel de Significancia, formular la Regla de decisión y tomar la decisión
Como es ANOVA, para probar la Hipótesis
Nula se usa la Didtribción de Fisher, la
prueba es de una sola cola y positiva, por
o= 5%. Para aceptar la
Hipótesis Nula debe cumplirse que:
. . . 2; . . 12; % 5%g l N g l DF F
Como . . . 2; . . 12; % 5%2,76 3,89
g l N g l DF F ,
Se acepta la hipótesis nula, es decir: “Las
medias de los tratamientos son iguales”
Problema 02.- Se emplean tres sistemas de inyección de aire y se quiere probar si existe una diferencia significativa entre ellos. Se eligen cinco elementos de cada sistema y se mide la eficiencia de cada uno de los elementos. Los resultados fueron tabulados y se presentan al final. Para un nivel de significancia del 2,5% probar si realmente existe una diferencia significativa entre ellos.
Muestra Eficiencia
A B C
1 35 21 35
2 24 27 17
3 46 17 21
4 30 37 20
5 29 29 28
144
Datos: 2,5%; el restoestáenlatabla
Fórmulas: 2
2
1 1 1
2
1 1
: ; :
: ; :1
:
k
k
k
cf c
jij j
i j j
f c
ij j
i j
SumaCuadradoTotal SCT X X Suma deCuadrados deTratamientos SCTR f X X
SCTSumaCuadrado del Error SCE X X Cuadrado MedioTotal CMT
n
SCTRCuadrado Medio delTratamiento CMTR
c; : ; ;
1
; ; .
SCE CMTRCuadrado MedioTotal CMT F
n c CME
n Tamañototal dela población f Número de filas c Número decolumnas
Solución Primer Paso.- Plantear la hipótesis
" "
" ",
; :
;
La Hipótesis Nula H
La Hipótesis Alterna
Existe una grandiferenciaentrelostres sistemas deinyeccióndeaire
Noexisteuna grandiferenciaentrelostres sistemas deinyeccióndeaitiva re
Segundo Paso.- Determinar el Estadístico de Prueba
XC1 XC1 XC1
35 21 35 72,812 72,812 200,534 4,840 213,160
24 27 17 6,086 89,624 0,356 77,440 11,560
46 17 21 381,538 29,888 184,042 174,240 0,360
30 37 14 12,482 155,426 7,840 40,960 CMTR 67,567
29 29 15 6,416 131,492 14,440 29,160
29,888 27,040
Mc1 Mc2 Mc3 0,284 0,640 CME 192,467
32,800 26,200 20,400 89,624 84,640
110,944 116,640
6,416 7,840
716,491 479,2424 515,600 295,200 F 2,85
SCT 1195,733 SCTR 384,933 SCE 810,800
MED. CUAD. ERROR
VALOR DE FISHER
SCT SCTR SCE GRAN MEDIA
MED. CUAD. TRAT.
26,467
Tercer Paso.- Seleccionar el Nivel de Significancia, formular la Regla de decisión y
tomar la decisión
Como es ANOVA, para probar la
Hipótesis Nula se usa la Didtribción de
Fisher, la prueba es de una sola cola y
o= 2,5%. Para
aceptar la Hipótesis Nula debe cumplirse
que: . . . 2; . . 12; % 2,5%g l N g l D
F F
Como:
. . . 2; . . 12; % 2,5%2,85 5,10
g l N g l DF F , Se
acepta la hipótesis nula, es decir: “Si existe
una gran diferencia entre los tres
sistemas de inyección de aíre”
145
Capítulo
LA PRUEBA NO PARAMETRICA DEL
CHI – CUADRADO
1. Definiciones básicas. 1.1. Pruebas no paramétricas: Son procedimientos estadísticos que pueden
utilizarse para contrastar hipótesis cuando no son posibles los supuestos respecto a los parámetros o a las distribuciones poblacionales.
1.2. CHI-CUADRADO (2) Es la suma de las fracciones que tienen por numerador
el cuadrado de las diferencias entre las frecuencias observadas o reales y las
frecuencias esperadas o teóricas y por denominador la frecuencia esperada 2
2 i i
i
O E
E
1.3. Aplicaciones más comunes de las prueba CHI-CUADRADO 1.3.1. Pruebas de Bondad de Ajuste: Medidas sobre qué tan cerca se ajustan los
datos muestrales observados a una forma de distribución particular planteada como hipótesis.
Para entrar a la tabla del CHI-CUADRADO y obtener , se necesita conocer
el nivel de significancia y el grado de libertad
donde K es el número de categorías o clases y m es el número de parámetros a estimar, sino se estima ningún parámetro m=0
1.3.1.1. Prueba para un ajuste uniforme: Cuando las frecuencias esperadas o teóricas se presentan iguales.
1.3.1.2. Prueba específica a un patrón específico: Es cuando las frecuencias esperadas o teóricas no son iguales.
i iE np ;
n= tamaño de la muestra ip = posibilidad de cada categoría.
1.3.1.3 Prueba de Normalidad: Apoyados en la distribución normal probar si esta se cumple para series abiertas.
Para cualquier prueba de bondad de ajuste la regla de decisión se establece de la
manera siguiente: si 2 2
0, se acepta la hipótesis nula.
1.3.2. Pruebas de independencia. La prueba del CHI-CUADRADO, también permite la comparación de dos atributos para determinar si existe una relación entre ellos. La mejor manera de probar la independencia entre dos atributos, es revisando esta independencia entre dos variables con escala nominal en una tabla de contingencia.
Ejercicios Ejercicio 01.- América Uzcátegui, Gerente General y dueña de la empresa mayorista, ”Uzcátegui de Alimentos C.A.”, asume la responsabilidad de tomar la decisión de comprar las cajas de mermeladas cada una de 24 envases, entre cuatro empresas productoras del artículo. América considera que las cuatro empresas productoras presentan la misma demanda del artículo. Ante la escasez de alimentos, se piensan comprar 106 cajas el total de
146
existencia del producto en los depósitos de la comercializadora y que se estima vender en la semana siendo la existencia de esas cuatro marcas de mermeladas la siguiente: Marca “A” 26 cajas, Marca “B” 23 cajas, Marca “C” 29 cajas, Marca “D” 28 cajas y de la Marca E 24. Para un nivel de significancia del 2,5%; ¿Será que el criterio de América Uzcátegui es válido?
Solución
Datos: 2,5%; el restoestáenlatabla
Fórmulas:
2
2
1
; ;
ki i
i i
i i
O E
E
E Frecuencias deeventosesperados O Frecuencias deeventosobservadosenlos datos muestrales
K Númerodecategoríasoclases
Desarrollo:
Pr .
; :"
" ";
Lasventas delos artículos demermeladasesuniforme según
imer Paso Plantear la Hipótesis
La Hipótesis Nula H
La Hip
lo
dicelaGerenteGeneral Lasventas delos artículos demermelaótesis Altern das
noesunifo
ati
rme
v
ont
a
c ",
. min PrSegundo Paso Dete
rario
r ar el
alodic
Estadí
eGerent
sticode
eGener
a
al
ueb
Marcas fO X fE (fO-fE)2
(fO-fE)2/fE
"A" 26 0,200 26,0 0 0,000
"B" 23 0,200 26,0 9 0,346
"C" 29 0,200 26,0 9 0,346
"D" 28 0,200 26,0 4 0,154
"E" 24 0,200 26,0 4 0,154
∑ 130 130,0 X2= 1,000
Tercer Paso.- Seleccionar el Nivel de Significancia, formular la Regla de Decisión y
Tomar la Decisión
Ejercicio 02.- Un laboratorio está procesando un fármaco para utilizarlo en una investigación médica. Se están probando cinco métodos para determinar cuál es el método que tiene menos probabilidad de contaminar el fármaco procesado. Los científicos que realizan el estudio consideran que la contaminación está distribuida normalmente. Se selecciona la producción durante 120 días para cada método de procesamiento, anotando el
Como es una prueba de Chi-Cuadrado es de una sola cola y
o= 2,5%. Para aceptar la Hipótesis Nula debe cumplirse que:
0
2 2
0 . . 4; 2,5%g l
0
2 2
0 . . 4; 2,5%1,000 11,143
g l, Se
acepta la hipótesis nula, es decir:
“La venta de los artículos de mermeladas se venden de manera
uniforme según lo afirma la Gerente General”
147
método que produce las ampollas menos contaminadas en ese día. Considerando las tasas de contaminación uniformes. Para un nivel de significancia del 1%, probar si realmente la contaminación es uniforme tomando lo datos de la tabla siguiente, donde se anotaron los resultados de los días donde no se encontraron ampollas no contaminadas
Solución
Datos: 1%; el restoestáenlatabla
Fórmulas:
2
2
1
; ;
ki i
i i
i i
O E
E
E Frecuencias deeventosesperados O Frecuencias deeventosobservadosenlos datos muestrales
K Númerodecategoríasoclases
Desarrollo:
Pr .
; : ;" min " "
m
. min Pr
in ",
imer Paso Plantear la Hipótesis
La Hipótesis Nula H La HipótesiLa conta ación es uniforme La
conta ación no es unifo
s Alternativa
Segundo Paso Deter ar el Estadísticode
r
ueba
me
Método fO X fE (fO-fE)2
(fO-fE)2/fE
"A" 36 0,2000 24 144 6,000
"B" 21 0,2000 24 9 0,375
"C" 19 0,2000 24 25 1,042
"D" 18 0,2000 24 36 1,500
"E" 26 0,200 24 4 0,167
120 96 X2= 8,917
Ejercicio 03.- El Gerente de una agencia bancaria, trata de seguir una política de conceder créditos de acuerdo a las siguientes actividades productivas: Actividad Comercial (A) un 35%, Actividad Agrícola (B) un 25%, para la Exportación un (C) 16%, para Comercialización al detal (D) un 13% y a Personas Naturales (E) el resto de la cartera crediticia. Se quiere evaluar si la política trazada por el gerente se está llevando a cabo, para lo cual selecciona aleatoriamente 165 créditos otorgados en el último mes y esto fue el resultado del inventario: “A” 61 créditos, “B” 45; “C” 26; “D” 18 y “E” 15. Para un nivel de significancia del 2%; ¿Será que se está siguiendo la política crediticia del gerente del banco?
Métodos de procesamiento A B C D E
Días en los cuales no hubo contaminación 36 21 19 18 26
Como es una prueba de Chi-Cuadrado es de una sola cola y
o= 1%. Para aceptar la Hipótesis Nula debe cumplirse que:
0
2 2
0 . . 4; 1%g l
0
2 2
0 . . 4; 1%8,917 13,277
g l, Se
acepta la hipótesis nula, es decir: “La contaminación es uniforme”
148
Solución
Datos: 2%; el restoestáenlatabla
Fórmulas:
2
2
1
; ;
ki i
i i
i i
O E
E
E Frecuencias deeventosesperados O Frecuencias deeventosobservadosenlos datos muestrales
K Númerodecategoríasoclases
Desarrollo:
Pr .
; :
;
. min
"
Pr
"
" "
imer Paso Plantear la Hipótesis
La Hipótesis Nula H La HipótesiSe siguela política del Gerentebancario
No se siguela política d
s
Alternativa
Segundo Pas
el Gerentebancari
o Deter ar el Estadístico
o
de ueba
Ac. Com. fO X fE (fO-fE)2
(fO-fE)2/fE
"A" 61 0,3500 57,750 10,56 0,183
"B" 45 0,2500 41,250 14,06 0,341
"C" 26 0,1600 26,400 0,16 0,006
"D" 18 0,1300 21,450 11,90 0,555
"E" 15 0,1100 18,150 9,92 0,547
165 165,000 X2= 1,631
Ejercicio 04.- Para un nivel de significancia del 2% probar si la distribución de frecuencia que se presenta al final constituye una Distribución Normal. Para una Media Poblacional:
Notas De 0 a 4 De 4 a 8 De 8 a12 De 12 a 16 De 16 a 20
Estudiantes 05 10 20 10 05
Solución
Datos: 1%; 10; 4,381; el restoestáenlatabla
Fórmulas:
Como es una prueba de Chi-Cuadrado es de una sola cola y
o= 1%. Para aceptar la Hipótesis Nula debe cumplirse que:
0
2 2
0 . . 4; 2%g l
0
2 2
0 . . 4; 2%1,631 11,668
g l, Se
acepta la hipótesis nula, es decir: “Se sigue la política del Gerente
Bancario”
149
2
2
1
; ;
ki i
i i
i i
O E
E
E Frecuencias deeventosesperados O Frecuencias deeventosobservadosenlos datos muestrales
K Númerodecategoríasoclases
Desarrollo:
Datos: % 2%; el restodelos datosenlatabla
Fórmula:
2
2
1
ki i
i i
O E
E
Desarrollo:
Primer Paso.- Planteamiento de la Hipótesis. Hipótesis Nula; H0: “Esta distribución responde a una Distribución Normal”
Hipótesis Alternativa; HA: “Esta distribución no responde a una Distribución Normal” Segundo Paso.- Determinar el Estadístico de Prueba.
Clases fO X fE (fO-fE)2
(fO-fE)2/fE
"A" 5 0,0853 4,265 0,54 0,127
"B" 10 0,2375 11,875 3,516 0,296
"C" 20 0,3544 17,720 5,198 0,293
"D" 10 0,2375 11,875 3,516 0,296
"E" 5 0,0853 4,265 0,54 0,127
50 50,000 X2= 1,012
4
4 101,37
4,381Z 4 0,5000 0,4147 0,0853MenosdeA
8
8 100,46
4,381Z
4 8 0,4147 0,1772 0,2375A
12
12 100,46
4,381Z
8 12 0,1772 0,1772 0,3544A
16
16 101,37
4,381Z
12 16 0,4147 0,1772 0,2375A
150
16
16 101,37
4,381Z
16 0,5 0,4147 0,0853MásdeA
Tercer Paso.- Seleccionar el Nivel de Significancia, formular la Regla de Decisión y
Tomar la Decisión
Como es una prueba de Chi-Cuadrado es de una sola cola y
o= 2%. Para aceptar la Hipótesis Nula debe cumplirse que:
0
2 2
0 ( . . 4, % 2%)g l
0
2 2
0( . . 4; % 2%): 1,12 11,668 g lComo ,
Se acepta la hipótesis nula, es decir:
“Esta distribución responde a una Distribución Normal”
Ejercicio 06.- Al final se presenta una distribución de frecuencias que refleja el número de sacos de naranjas recibidas por un comerciante del Mercado al por Mayor de Coche durante 100 días. Se obtuvo que la media era: 80,5; con una desviación estándar, 18,09, Para un nivel de significancia del 5%, probar si esta distribución es normal.
Sacos de naranjas Días
Menos de 10 De 10 a 50 De 50 a 90 De 90 a 130 Más de 130
15 20 30 20 15
Solución
Datos: 5%; 80,5; 18,09; el restoestáenlatabla
Fórmulas:
2
2
1
; ;
ki i
i i
i i
O E
E
E Frecuencias deeventosesperados O Frecuencias deeventosobservadosenlos datos muestrales
K Númerodecategoríasoclases
Desarrollo:
Pr .
; : ;
. min
" " "
",
Pr
imer Paso Plantear la Hipótesis
La Hipótesis Nula H La HipótesiEsta distribuciónes normal Esta
distribuciónnoes n
s Alternativa
Segundo Paso Deter ar el Estadísticode
orm
u
al
eba
151
Para x<10
10
10 70,52,01
30,09Z
A=0,5000 - 0,4778=0,0222
Para: 10<x<50
50
50 70,50,68
30,09Z
A=0,4778 - 0,2518=0,2230
Para 50<x<90
90
90 70,50,65
30,09Z
A=0,2518 + 0,2422 = 0,4940
Para 90<x<130
130
130 70,51,98
30,09Z
A=0,4762 – 0,2422 = 0,2340
Para 130<x
130
130 70,51,98
30,09Z
A= 0,5000 - 0,4762 = 0,0238
"A" 15 0,0222 2,220 163,3 73,571
"B" 20 0,2260 22,600 6,76 0,299
"C" 30 0,4940 49,400 376,4 7,619
"D" 20 0,2340 23,400 11,56 0,494
"E" 15 0,0238 2,380 159,3 66,918
100 100,000 X2= 148,901
Como es una prueba de Chi-Cuadrado es de una sola cola y
o= 2%. Para aceptar la Hipótesis Nula debe cumplirse que:
0
2 2
0 . . 4; 5%g l
0
2 2
0 . . 4; 5%148,901 9,488
g l, No se
acepta la hipótesis nula, es decir: “Esta distribución no responde a una
Distribución Normal”
Ejercicio 06.- Una compañía trabaja con cuatro máquinas en tres turnos diarios. La siguiente tabla de contingencia presenta las veces que fallaron y se pararon las máquinas durante un período de seis meses.
152
Tabla de contingencia de número de paros
Máquinas Turno
A B C D Total por turnos
Turno 01 10 12 06 07 35
Turno 02 10 24 09 10 53
Turno 03 13 20 07 10 50
Total por máquina 33 56 22 27 138
Para un nivel de significancia del 5% probar que para un paro arbitrario, la máquina que ocasiona ese paro es independiente del turno cuando ocurre.
Solución
Datos: % 5%; el restodelos datosenlatabla
Fórmula:
2
2
1
ki i
i i
O E
E
Desarrollo Primer Paso.- Planteamiento de la Hipótesis. Hipótesis Nula; H0: “Para un paro arbitrario la máquina que lo ocasiona, no tiene nada que ver con el
turno cuando ocurre” Hipótesis Alternativa; HA: “Para un paro arbitrario la máquina que lo ocasiona, si tiene nada que ver
con el turno cuando ocurre””
Segundo Paso.- Determinar el Estadístico de Prueba.
O E O E O E O E O E
T-01 10 8,370 12 14,203 6 5,580 7 6,848 35 35,00
T-02 10 12,674 24 21,507 9 8,449 10 10,369 53 53,00
T-03 13 11,956 20 20,290 7 7,971 10 9,783 50 50,00
T-MQ. 33 33,000 56 56,000 22 22,000 27 27 138 138,00
0,317 0,342 0,032 0,003
0,564 0,289 0,036 0,013
0,091 0,004 0,118 0,005
1,814
X2
X2
X2
X2
A B C D T-T
X2=
Tercer Paso.- Seleccionar el Nivel de Significancia, formular la Regla de Decisión y
Tomar la Decisión
Como es una prueba de Chi-Cuadrado es de una sola cola y
o= 5%. Para aceptar la Hipótesis Nula debe cumplirse que:
0
2 2
0 ( . . 6, % 5%)g l
0
2 2
0( . . 6; % 5%): 1,814 12,592 g lComo ,
Se acepta la hipótesis nula, es decir:
“Para un paro arbitrario la máquina que lo ocasiona, no tiene nada que
ver con el turno cuando ocurre”
153
Ejercicio 07.- Se registraron un total de 309 muebles defectuosos, se clasificaron los defectos en cuatro tipos (A; B; C; D). Al mismo tiempo el turno (1; 2; 3), cuando se produjo cada uno de los muebles. Esta información se presenta en la tabla de contingencia que se presenta al final. Para un nivel de significancia del 5%; ¿Proporciona los datos suficientes evidencias para concluir que las proporciones de los cuatro tipos de defectos varían de un turno a otro?
Turno
Tipo de defecto Total A B C D
1 15 21 45 13 94
2 26 31 34 05 96
3 33 17 49 20 119
Total 74 69 128 38 309
Solución
Datos: 5%; el restoestáenlatabla
Fórmulas:
2
2
1
; ;
ki i
i i
i i
O E
E
E Frecuencias deeventosesperados O Frecuencias deeventosobservadosenlos datos muestrales
K Númerodecategoríasoclases
Solución
Datos: % 2%; el restodelos datosenlatabla
Fórmula:
2
2
1
fO E
j E
f f
f
Desarrollo Primer Paso.- Planteamiento de la Hipótesis.
Hipótesis Nula; H0: “Las proporciones de los cuatro tipos de defectos varían de un turno a otro” Hipótesis Alternativa; HA: “Las proporciones de los cuatro tipos de defectos no varían de un turno a
otro” Segundo Paso.- Determinar el Estadístico de Prueba.
154
O E O E O E O E O E
T-01 15 22,511 21 20,990 45 38,939 13 11,560 94 94,00
T-02 26 22,990 31 21,437 34 39,767 5 11,806 96 96,00
T-03 36 28,499 17 26,573 49 49,294 20 14,634 119 119,00
T-DEFC. 74 74,000 69 69,000 128 128,000 38 38,000 309 309,00
2,560 0,000 0,943 0,179
0,394 4,266 0,836 3,924
2,447 3,449 0,002 1,968
20,968
X2
X2
X2
X2
A B C D T-T
X2=
Tercer Paso.- Seleccionar el Nivel de Significancia, formular la Regla de Decisión y
Tomar la Decisión
Problemas Propuestos para los Capítulos del Título V Problema 01.- Dadas las siguientes hipótesis:
2 2
0 1 2
2 2
1 2A
H
H
Una muestra aleatoria de 10 observaciones de la primera población resultó con una desviación estándar de 12. Una muestra aleatoria de observaciones de la segunda población resultó con una desviación estándar de 9. Con un nivel de significancia del 2%, ¿Existe alguna diferencia en la variación de las dos poblaciones? Problema 02.- Dadas las siguientes hipótesis:
2 2
0 1 2
2 2
1 2A
H
H
Una muestra aleatoria de 8 observaciones de la primera población resultó con una desviación estándar de 15. Una muestra aleatoria de 9 observaciones de la segunda población resultó con una desviación estándar de 10. Con un nivel de significancia del 1%, ¿Existe alguna diferencia en la variación de las dos poblaciones? Problema 03.- Se quiere saber si habrá igualdad en las medias de las poblaciones de las notas obtenidas por un grupo de estudiantes en las materias que se presenta en tabla anexa. Realizar el estudio para un nivel de significancia del 5%
Como es una prueba de Chi-Cuadrado es de una sola cola y
o= 5%. Para aceptar la Hipótesis Nula debe cumplirse que:
0
2 2
0 ( . . 6, % 2%)g l
0
2 2
0( . . 6; % 2%): 20,968 15,033 g lComo ,
No se acepta la hipótesis nula, es
decir: “ Las proporciones de los cuatro tipos de defectos no varían de un turno a otro”
155
Contabilidad Estadística Instrumental
Matemática Instrumental
15 16 15
13 13 08
16 07 09
07 15 16
09 14
13
Problema 04.- Un dado de seis caras se lanza 40 veces y aparecen los números del 1 al 6 según se muestra en la distribución de frecuencias a continuación. Con un nivel de significancia del 5%, ¿Podemos concluir que el dado está legal?
Cara 1 2 3 4 5 6
Resultado 5 7 8 5 9 6
Problema 05- Una empresa mayorista de de artículos de ferretería trata de utilizar una política de extender sus movimientos económicos, para lo cual decide establecer un cuadro de créditos que de manera porcentual sería: a) Empresas Comerciales de la Capital, 31%; b) Para Empresas Comerciales fuera de la Capital, 18%, c) Empresas de Construcción, 24%, d) Comerciales para la Venta al Detal,16% y a Personas Natrales, 11% . El dueño del negocio quiere demostrar si esta política se está cumpliendo y resolvió revisar 250 créditos otorgados de los cuales 74 fueron otorgados a Empresas Comerciales de la Capital, 38 a Empresas Comerciales fuera de la Capital, 64 a Empresas de Construcción, 45 a Comerciales para la Venta al Detal y 29 a Personas Naturales. Si a nivel de significancia del 2,5%; ¿Se mantuvo el patrón de la política de extender sus movimientos económicos? Problema 06.- A los consumidores de un centro comercial se le piden calificar un nuevo producto en una escala continua que comienza en cero. Con base a los datos presentados en cuadro anexo; ¿Se podrá concluir a un nivel de significancia del 1%, que los datos están distribuidos normalmente con una media de 51,25 y una desviación estándar de 11,18?
Problema 07.- A los consumidores de un centro comercial se le piden calificar un nuevo producto en una escala continua que comienza en cero. Con base a los datos presentados en cuadro anexo; ¿Se podrá concluir a un nivel de significancia del 1%, que los datos están distribuidos normalmente con una media de 51,25 y una desviación estándar de 11,18?
Calificación Frecuencia Calificación Frecuencia
Menos de 35 7 De 55 a 60 65
De 35 a 40 14 De 60 a 65 15
De 40 a 45 26 De 65 a 70 8
De 45 a 50 79 Más de 70 3
De 50 a 55 83
Calificación Frecuencia Calificación Frecuencia
156
Problema 08.- El Gerente de Producción de una empresa de equipos electrónicos desea comparar los tiempos medios empleados para instalar un equipo electrónico según tres métodos diferentes de montaje A, B y C. Se escogieron los seis más expertos técnicos para realizar el experimento, y cada uno de ellos montó el equipo usando los tres métodos los cuales se le suministraron de manera aleatoria, y en tabla anexa se muestran los tiempos
medios. Para un Nivel de Significancia del 5%; ¿Los datos presentados en la tabla proporcionan la información para indicar que existe diferencia en el tiempo medio de instalación para los tres métodos?
INSTALADOR
MÉTODO
1
2
3
4
5
6
A 20,2 22,6 19,2 22,5 18,7 21,5
B 23,7 24,1 22,6 24,3 20,2 21,5
C 21,4 23,0 22,9 22,0 19,8 20,1
Problema 09.- Se seleccionaron tres marcas de gasolina A, B y C, y se tomaron cuatro automóviles de la misma marca y modelo, para probar un experimento donde cada en cada automóvil vamos a usar las tres marca de gasolina de un solo tipo. Al utilizar cada marca de gasolina en un mismo automóvil, se elimina la variabilidad de un automóvil a otro. En tabla anexa se suministran los datos que arrojó el resultado de experimento, en Kilómetros por litros. Para un Nivel de Significancia del 2,5%, ¿Hay evidencia de una diferencia promedio para los cuatros automóvil?
Automóvil M. Gasolina
1
2
3
4
A 7,29 7,56 7,66 7,25
B 7,63 7,84 7,87 7,80
C 7,25 7,94 7,49 7,84
Problema 10.- Una empresa de construcción de viviendas tiene pensado realizar un desarrollo comercial en San Juan de los Morros. Se evalúan tres terrenos. Los ingresos diarios de los pobladores de la zona vecina al centro comercial es de especial importancia. Se selecciona aleatoriamente cuatro familias que habitan cerca de cada terreno. En tabla anexa se presentan los resultados muestrales de la investigación. Para un Nivel de Significancia del 5%; ¿Se puede concluir para la empresa que existe una diferencia en los ingresos promedios diarios?
Menos de 35 7 De 55 a 60 65
De 35 a 40 14 De 60 a 65 15
De 40 a 45 26 De 65 a 70 8
De 45 a 50 79 Más de 70 3
De 50 a 55 83
157
Vía
Fermín Toro
Avenida
Bolívar
Avenida
Fuerza Armada
505 725 805
450 665 980
655 645 755
475 655 925
Problema 11.- En un centro de juego de billar el encargado lleva una relación de las jugadas diaria de lunes a viernes que se realizan en las cuatro mesas que componen el conjunto y los resultados se anotan al final. Tomando un Nivel de Significancia del 5%; ¿Será que existe diferencias entre el número de jugadas diaria para las 610 jugadas que se hicieron en una semana determinada?
Día Lunes Martes Miércoles Jueves Viernes
Jugadas 145 87 122 115 141
Problema 12.- En la compra diaria realizada durante dos meses en una tienda el Gerente de Administración estableció que la compra por una persona podría contabilizarse por el número de veces que visite para comprar en la tienda. Por una visita el 35%, por dos visitas, el 22%, por tres visitas el 17%, por cuatro visitas el 12%, por cinco visitas el 9% y por seis visitas 5%. Al realizar un estudio sobre lo comprado por visita realizado por los clientes se determinó la siguientes compras en miles de bolívares promedio: en una visita Bs. 7,56; en una segunda visita Bs. 4,25; en una tercera visita Bs. 3,86; en una cuarta visita Bs. 3,36, en una quita visita 2,15 y en una sexta visita Bs1,88. Para un Nivel de Significancia del 2%, ¿Será que el Gerente de Administración de la tienda tiene una buena apreciación en su planteamiento? Problema 13.- En un estudio realizado por el Ingeniero Andrés Scott Velásquez, Coordinador del Departamento de Matemáticas y Estadística del Instituto Universitario de Gerencia y Tecnología, sobre los sueldos de los profesores de varios institutos universitarios recopiló la información que se presenta en cuadro anexo. Utilizando un sistema programático para estadística determinó que el pago promedio es de Bs. 53,94 con una desviación estándar de Bs 12,98. Para un Nivel de Significancia del 5%; ¿Coinciden las frecuencias observadas con las frecuencias esperadas, con base a la Distribución Pirobalística Normal?
10Sueldo (Miles de bolívares)
Menos de 30
De 30 a 40
De 40 a 50
De 50 a 60
De 60 a 70
De 70 a 80
De 80 a 90
Más de
100
∑
Número de
Institutos
2 10 21 22 14 8 1 2 80
Problema 14.- Para un Nivel de Significancia del 2%, verificar si en la Tabla de Contingencia que se presente al final existe relación entre los resultados presentados en las filas con los presentados en las columnas.
158
Columnas Filas
1 2 3 4
1 120 70 55 16
2 79 108 95 43
3 31 49 81 140
Problema 15.- Se han recolectado datos sobre 700 economistas en la Docencia Universitaria, el Sector Privado y el Sector Público respecto a sus opiniones sobre la economía podría ser estable, podría expandirse o podría entrar en un período de contracción en el futuro próximo. Para un Nivel de Significancia del 2,5%; ¿Se podría considerar que existe una relación entre lo que opinan los economistas sobre la situación de la economía y el sector donde ellos prestan servicios? (Ver Tabla de Contingencia)
Economía Economista
Estable Expansión Contracción Total
Docentes 80 100 115 295
Sector Privado 55 40 125 220
Sector Público 40 60 85 185
Total 175 200 325 700
159
TÍTULO VI Capítulo 16
ESTADISTICA INFERENCIAL PARA EL ESTUDIO DE DOS VARIABLES
CORRELACION Y REGRESION LINEAL
La estadística aborda el tema de la relación que puede concretarse entre dos variables estableciendo el comportamiento de una variable respecto a la otra en cuanto a su dependencia o independencia y en cuanto a su fortaleza. Lo cierto es que el estudio de esta relación es muy utilizado en el mundo de los negocios, y si se quiere nos da la herramienta más sencilla para la iniciación del estudio de los pronósticos o predicciones.
1. Correlación Lineal: Establece la relación existente entre dos variables 1.1 Análisis de correlación: Es el grupo de técnicas que nos permite medir la
asociación existente entre dos variables. 1.1.1 Variable Dependiente: Es una variable que se calcula o predice. 1.1.2 Variable Independiente: Es una variable que proporciona las bases para el
cálculo, es la variable de predicción. 1.2 Coeficiente de Correlación: Establece la medida de la magnitud de la relación
entre dos variables.
Correlación Correlación Correlación Negativa Nula Positiva Perfecta Perfecta
Correlación Correlación Negativa Positiva Moderada Moderada Correlación Correlación Correlación Correlación Negativa Negativa Positiva Positiva Fuerte Débil Débil Fuerte -1 -- 0,5 0 + 0,5 +1 Fuerza y dirección del coeficiente de correlación
Calculo del Coeficiente de correlación Lineal
Fórmula fundamentada en los Mínimos Cuadrados
Fórmula fundamentada en el concepto de la Desviación Estándar de cada variable
2 22 2
i i i i
i i i i
n X Y X Yr
n X X n Y Y
1
i ixy
x y x y
X X Y YSr
S S n S S
Recordando que: 2 22 2
2 2; ;1 1 1
i ii i
x y xy
X X Y YX nX Y nYS S S
n n n
160
Ejercicio resuelto
Dados los siguientes pares ordenados de (x, y) observados; {(2, 5), (5, 8), (3, 7), (1, 2), (8, 15)} aplicando la fórmula de los Mínimos Cuadrados calcular la Correlación Lineal y comprobar con la fórmula de las desviaciones estándar de ambas variables.
Solución
2 22 219 361; 37 1.369X Y
2 22 2
2 22 2
2 22 2
5 193 19 37
5 103 361 5 367 1.369
; ;1 1 1
103 5 3,8 367 5 7,47,7 2,775; 23,3 4,8
0,978
274 4
5
i i i i
i i i i
i ii i
x y xy
x x y y
xy
n X Y X Yr
n X X n Y Y
X X Y YX nX Y nYS S S
n n n
S S S S
S
r
2,4 13,113,1
4 2,775 4,0,
8978
27
xy
x y
Sr
S Sr
2. Regresión Lineal: Establece el análisis para desarrollar una ecuación que permite
expresar la relación lineal entre dos variables. 2.1 Análisis de Regresión Lineal: Es la técnica utilizada para desarrollar la ecuación lineal y proporcionar los estimados. Ecuación de Regresión Lineal: Es la ecuación que expresa la relación lineal entre dos variables. Forma General de la Ecuación de Regresión Lineal:
Y A BX
2.2. Determinación de los valores de A y B
Método de los Mínimos Cuadrados: Determina la ecuación de la recta de regresión minimizando la suma de los cuadrados de las distancias verticales entre los valores reales dependientes Y y dos valores pronosticados de la misma variable dependiente Y
Nº Xi Yi XiYi Xi2 Yi
2 Xi-MediaXi Yi-MediaYi (DesXi)x(DesYi)
1 2 5 10 4 25 -1,80 -2,4 4,32
2 5 8 40 25 64 1,20 0,6 0,72
3 3 7 21 9 49 -0,80 -0,4 0,32
4 1 2 2 1 4 -2,80 -5,4 15,12
5 8 15 120 64 225 4,20 7,6 31,92
∑ 19 37 193 103 367 52,4
161
Calculo de B
Método de los Mínimos Cuadrados Método Conceptual
22
i i i i
i i
n X Y X YB
n X X
y
x
SB r
S
Calculo de A
i iY XA B A Y BX
n n
2.3. El poder explicativo de una Ecuación de Regresión Lineal El estudio que se presenta sobre la Regresión Lineal intenta explicar los cambios que puede experimentar una Variable Dependiente Y provocado por
una Variable Independiente X. Si solo las observaciones que se tuvieran fueran de la Variable Dependiente Y, la tendencia central de Y se representaría por la
Media Aritmética Y y la variabilidad total en torno a Y se representa por el
numerador del estimador de la varianza muestral 2
iY Y . Cuando se tienen
las medidas de la Variable Independiente X, la tendencia central de Y se puede expresar en función de X, por lo tanto es de esperarse que la recta de la Ecuación de Regresión Lineal esté más cerca de los valores particulares de Y y que, por lo tanto, la variabilidad en torno a la Ecuación de Regresión Lineal sea menor que la variabilidad en torno a la Media Aritmética. Por lo tanto se han establecido condiciones que permite desarrollar medidas que señalen la eficacia con que la Variable Independiente X explica el comportamiento de la Variable Dependiente Y, siendo el Coeficiente de Determinación la medida que explican esta eficacia. Coeficiente de determinación: Es el porcentaje de la variación total en la variable dependiente Y que se explica o contabiliza por la variación en la variable independiente X. Realizando un análisis de varianza sobre la explicación del poder explicativo de la Ecuación de Regresión Lineal, donde la suma total de los cuadrados (STC); es igual a la suma del cuadrado de la regresión (SCR); más la suma de los cuadrados de los errores (SCE); donde:
2 2 2 22;i i iSTC Y Y SCR Y Y B X X y SCE Y Y
Por lo que STC = SCR + SCE y de allí tendríamos que:
2 1S C R S C E
D rS T C S T C
162
Problema Resuelto
Dados los siguientes pares ordenados de (x, y) observados; {(2, 5), (5, 8), (3, 7), (1, 2), (8, 15)} aplicando la fórmula de los Mínimos Cuadrados calcular: a) La Ecuación de la Recta de Regresión Lineal, b) El valor Y’ para X = 4 (Y’(X=4)) y c) El Coeficiente de Determinación y
demostrar que r D
Solución
a) 2 22
5 193 19 371,701
5 103 19
i i i i
i i
n X Y X YB B
n X X=
37 1,701 190,936
5 5
0,936 1,701
i iY XA A
n
X
Bn
Y
b) 44
7,70,936 1,701 , 4 0.936 1,701 4 4X X
Y X pa Yra X Y
c) Cálculo de D
2
iSTC Y Y 2 2 2
2 2
5 7,4 8 7,4 7 7,4
2 7,4 15 7,4
93,2
22SCR B X X
2 2 2
2
2 2
2 3,8 5 3,8 3 3,81,701
1 3,8 8 3,8
89,117
0,956 0,9789,117
0,95693,2
8S C R
D r D rS T C
D
Nº Xi Yi XiYi Xi2 Yi
2 Xi-MediaXi Yi-MediaYi (DesXi)x(DesYi)
1 2 5 10 4 25 -1,80 -2,4 4,32
2 5 8 40 25 64 1,20 0,6 0,72
3 3 7 21 9 49 -0,80 -0,4 0,32
4 1 2 2 1 4 -2,80 -5,4 15,12
5 8 15 120 64 225 4,20 7,6 31,92
∑ 19 37 193 103 367 52,4
163
2.4. Error Estándar de Estimación: Es una medida de la dispersión, o extensión, de los valores observados alrededor de la recta de regresión. Cálculo de Error Estándar de Estimación:
22
;2
y x y x
Y A Y B XYS S Y Y
n
2.5. Intervalos de Confianza e Intervalos de Predicción: Intervalos de Confianza, reporta el valor medio de una variable dependiente Y
para una variable independiente determinada X. Intervalo de Predicción, Reporta el rango de valores de la variable dependiente Y para un particular valor de la variable independiente X. Cálculo de ambos intervalos:
Tenemos que
2
2
2
1 E
i
i
X X
n XX
n
Intervalo de Confianza:
. . ;
;
y x
I C LIC LSC
tS
LIC Y LSC Y
Intervalo de predicción:
. . ;
1 ; 1y x y x
I P LIP LSP
LIP Y tS LSP Y tS
2.6 Consideraciones necesarias para aplicar la Regresión Lineal a) Para cada valor de X, una grupo de valores de Y que dependen de ese valor seguir una distribución normal. b) Las medias de estas distribuciones normales se ubican en la recta de regresión.
164
c) Todas las desviaciones estándar de estas distribuciones normales son iguales; siendo su mejor estimador d) Los valores de la variable dependiente Y son estadísticamente independiente X de manera particular, éste no depende de ningún otro valor de X.
3.- Graficas de la Correlación Lineal y de Regresión Lineal 3.1Diagrama de dispersión o nube de puntos. Es la gráfica que representa la correlación lineal, se hace a través de puntos que definen las variables cada X y cada Y definen un punto. 3.2 La recta de Regresión Lineal. Se puede obtener sobre el diagrama de dispersión definiendo analíticamente dos puntos correspondientes a esa recta.
Problemas Resueltos Problema 01.-Con la información suministrada en el ejercicio anterior y la obtenida por los respectivos cálculos desarrollar; a) los intervalos de: confianza y de pronósticos, para
98%4,541t y b) Elaborar el Diagrama de Dispersión y la gráfica de la recta de la Ecuación
de Regresión Lineal Solución
a)
2
367 0,936 37 1,701 191
3
2,165
3y xy x
Y A Y B XYS
nS
22
2
2
4 3,81 10,201
3615103
5
E
i
i
X X
n XX
n
. . ;
4,541 1,165 0,201 2,372
; 7,74 2,372 5,368; 7,74 2,372
: 5,368 10,
10 1 2
112
, 1
y x
I C LIC LSC
tS
LIC Y LSC Y LIC LS
IC Y
C
. . ;
1 4,541 1,165 1 0,201 5,798
7,74 5,798 1,942; 7,74 5,798 13,5
:5,798 13,5 8
3
3
8
y x
I P LIP LSP
tS
LIP Y LSP Y
IP Y
b) Gráficas Diagrama de Dispersión y gráfica de la Ecuación de Regresión Lineal
165
x
y
-30 -20 -10 0 10 20 30
-10
0
10
Problema 02.- Un economista de Departamento de Recursos Humanos del Estado Barinas está preparando un estudio sobre el comportamiento de consumidor. Él recolectó los datos que aparecen en cientos de Bolívares para determinar si existe una relación entre el ingreso mensual del consumidor y los niveles de consumo mensual. Los datos recolectados se muestran a continuación:
Consumidor 1 2 3 4 5 6 7 8 9 10 11 12
Ingreso 24,3 12,5 31,2 28,0 35,1 10,5 23,2 10,0 8,5 15,9 14,7 15,0
Consumo 16,2 8,5 15,0 17,0 24,2 11,2 15,0 7,1 3,5 11,5 10,7 9,2
a) Determinar cuál es la variable dependiente b) Calcular e interpretar el coeficiente de correlación y el coeficiente de determinación para
el estudio que realiza el economista. c) Calcular e interpretar el modelo de regresión lineal. ¿Qué refleja este modelo sobre la
relación ingreso consumo? d) ¿Qué consumo pronosticará este modelo de regresión lineal para alguna persona que
tenga un ingreso de Bs. 27,5? e) Calcular e interpretar el error estándar de estimación para el estudio que realiza el
economista y elaborar una gráfica y la interpretación de la misma sobrepuesta sobre el diagrama de dispersión.
f) El economista para su estudio desea un Intervalo de Estimación y de Predicción para un nivel de confianza del 95% donde t = 2,228.
g) Diagramar la Dispersión de Puntos o Nube de Puntos. Comentar y la Recta de la Ecuación de Regresión Lineal.
166
Solución
N° X Y XY X2 Y2
1 24,3 16,2 393,66 590,49 262,44
2 12,5 8,5 106,25 156,25 72,25
3 31,2 15,0 468,00 973,44 225,00
4 28,0 17,0 476,00 784,00 289,00
5 35,1 24,2 849,42 1232,01 585,64
6 10,5 11,2 117,60 110,25 125,44
7 23,2 15,0 348,00 538,24 225,00
8 10,0 7,1 71,00 100,00 50,41
9 8,5 3,5 29,75 72,25 12,25
10 15,9 11,5 182,85 252,81 132,25
11 14,7 10,7 157,29 216,09 114,49
12 15,0 9,2 138,00 225,00 84,64
∑ 228,9 149,1 3337,82 5250,83 2178,81
a. Determinación del Tipo de Variables.
La Variable Dependiente es el consumo mensual y le asignaremos la letra Y. El nivel de consumo mensual depende del nivel de ingreso mensual de cada ciudadano
b. Coeficiente de Correlación y Coeficiente de Determinación Lineal
2 22 2
2 2
12 3337,82 228,9 149,1
12 5250,83 52.395,21 12 2178,81 22.230,81
5924,850,9191
6446,0,9191
% 84
378
% % % 0,9191 % 84,47% ,47%
n XY X Yr
n X X n Y Y
x
r
D
xr
x x
D r D
“La relación existente entre la Variable Independiente X y la Variable Dependiente Y, presenta un Coeficiente de Correlación Fuerte Positivo ya que 0,5 < 0,919 < 1, y además proporciona una variación total del 84,47% en el Consumo Mensual que se explica o contabiliza, por la variación en el Ingreso Mensual”
c. Análisis de Regresión Lineal Y´ = A + BX
167
22
5924,85
10.614,70,558
1,781
1,781
5
149,1 228,90,558
12 12
0,558
n XY X YB
n X X
Y XA B A
n n
B
A
Y X
“El Modelo de la Regresión Lineal que origina los datos de este problema presenta una pendiente negativa lo cual equivale a decir que el Consumo Mensual siempre será menor que el Ingreso mensual”
d. Consumo Mensual para un Ingreso Mensual de X = 27,5.
27,5 27,51,781 0,558 2 17,1267,5 YY
e. Cálculo e interpretación del Error Estándar de Estimación. f.
22178,81 1,781 149,1 0,558 3.337,
2,25
822,253
2 2
3
12Y X
Y X
Y A Y B XY xS
n
S
“El Error Estándar de Estimación SY-X = 6,233; nos presenta un promedio entre los
alejamientos y los acercamientos de los valores de la relación de la Variable
Independiente y la Variable Dependiente respecto a la Recta de Regresión Lineal”
g. Intervalo de Confianza e Intervalo de Predicción.
27,5
27,5
2
95% 95%2
2
2
:
:
1; ; 1
27,5 19,07510,164; 2,228 2,253 0,164 2,033;
52.395,21125250,83
12
2,228 2,253 1 0,164 5,416
Y X Y X
IC LIC Y LSC
IP LIP Y LSP
X Xt S t S
n XX
n
168
27,
27,5
27,5
27,5
27,
7 5
5
5
2 ,
:15,093 19,159
:1
17,126 2,033, 15,093;
17,126 2,033 19,159
17,126 5,416 11,710;
17,126 5,416 22
1,710 2
,54
2,54
2
2
LIC Y LIC
LSC Y LSC
LIP Y LIP
LSP Y L
IC Y
IP
SC
Y
h. Gráfica del Diagrama de Dispersión o Nube de Puntos y la gráfica de la Recta de
la Ecuación de Regresión
x
y
-60 -40 -20 0 20 40 60
-20
0
20
Capítulo 17 Series Cronológicas, Temporales o de Tiempo
1. Series de Tiempo.- Conocidas también como Series Temporales o Series Cronológicas
son recolecciones de datos para alguna o un conjunto de variables durante varios períodos de tiempo, es decir es un conjunto de mediciones sometidas a un estudio en el tiempo. De esta definición se desprende que una de las variables corresponde a los lapsos de tiempos durante los cuales se hace el estudio En una concepción más
169
sencilla se le puede considerar como un conjunto de datos registrados durante un período, semanal, mensual, trimestral o anual.
2. Componentes de una Serie de Tiempo. Son elementos característicos que conforma su estructura y que permite visualizar su comportamiento en el tiempo, bien sea a corto, mediano o a largo plazo.
a. El Componente Tendencial, Componente Secular o Tendencia Secular.- Es la tendencia de la Serie de Tiempo a largo plazo sin que se presente ningún tipo de alteraciones.
b. El Componente de Variación Cíclica.- Son los ascensos y descensos en forma de onda en períodos mayores a un año que al presentarse producen alteraciones que se reflejarán en la tendencia secular que define a la Serie de Tiempo.
c. El Componente de Variación Estacional.- Patrones en los movimientos de la
Serie de Tiempo que reflejan cambio en un año, y que tienden a repetirse de año en año.
d. El Componente de Variación Irregular.- Son variaciones que puede presentar
una Serie de Tiempo producidas por sucesos inusuales que producen movimientos sin patrón discernibles, y según muchos analistas la dividen en Variaciones Episódicas, las cuales no son predecibles pero si identificables ( Guerras, fenómenos de la naturaleza, conflictos laborables etc.,), y Variaciones Residuales, pasadas la Variaciones Episódicas los coletazos que de ellas quedan ya identificados conllevan a la Variación Residual de la Serie de Tiempo.
3. Modelos de serie de tiempos.- Un modelo de serie de tiempos puede expresarse en
función de una combinación de estos cuatro componentes. Por lo general dos tipos de modelos se relacionan con las series de tiempo: a) El Modelo Aditivo y b) El Modelo Multiplicativo.
Modelo Aditivo: t t t t tST T E C I
Modelo Multiplicativo: t t t t tST T E C I
; ; ;
;
t t t
t t
ST Serie deTiempo T TendenciaSecular E TendenciaEstacional
C TendenciaCíclica I Tendencia Irregular
En el modelo aditivo todos los valores son expresados en unidades originales, mientras
que en el modelo multiplicativo solo se expresa el valor de tT en unidades originales y
el resto en valores porcentuales.
Problemas Resueltos Problema 01.-Desarrollar un el Modelo Aditivo de Serie de Tiempo para la venta en bolívares para una de una librería donde:
3.150,00; 630,00; 157,50 63,00T S C y I .
Solución
170
3.150,00 630,00 157,50 63,00 3.559,50TST
Es de observar que este modelo es inusual por cuanto considera que cada componente es independiente una de otro lo cual no es como se presenta en la vida real, por lo tanto el más usado es el Modelo Multiplicativo que de una u otra manera si relaciona entre sí a las componentes de la Serie Tiempo. Problema 02.- Los valores para la deuda morosa de una entidad bancaria puede
registrarse como 63.000.000,00; 170%; 91% 87%T S C e I
663 10 1,7 0,91 0 8,87 4.791.070,00TST
Observación.- Para una Serie de Tiempo de datos anuales, no se tomaría en cuenta la Componente Cíclica, por cuanto esta componente produce alteraciones en períodos
mayores aun año, por lo tanto se tendría que:
t t t tST T E I
4. Métodos de Ajustes o Técnicas de Suavizamiento.
a. El Método de los Promedios Móviles o el Método de los Semipromedios. En muchas ocasiones una Serie de Tiempo presenta muchos apuntamientos y/o muchas depresiones, y a través de este método se busca en lo más posible reducir estas situaciones irregulares que se presentan en algunas Series de Tiempo, lo cual es de un gran apoyo para sincerar lo mejor posible la tendencia para producir predicciones más apegadas a la realidad. Dependiendo de la situación como se presente se determina que promedio se debe utilizar, por lo general es más cómodo promediar entre valores impares, porque cuando se usan valores pares para promediar hay que establecer línea por medio entre valores.
Problemas Resueltos
Problema 01.- En la tabla anexa se presentan las ventas de una comercial durante los doce meses del año. Se pide calcular el Promedio Móvil de tres meses y el de cinco meses y presentar gráficas para los datos dados originalmente y para los promedios móviles calculados. Mes Ene. Feb. Mar. Abril Mayo Jun. Julio Agost. Sept. Oct. Nov. Dic.
Ventas 327,6 510,3 296,1 409,5 315,0 459,9 283,5 378,0 315,0 497,7 283,5 390,6
171
Solución
Meses Nº Ventas ∑(1+2+3)/3+ (2+3+4)/3…
P. Móvil (3)
∑(1+2+3+4+5)/5+ (2+3+4+5+6)/3+…
P. Móvil (5)
Enero 1 327,6
Febrero 2 510,3 378,0 378,0
Marzo 3 296,1 405,3 405,3 371,70 371,70
Abril 4 409,5 340,2 340,2 398,16 398,16
Mayo 5 315,0 394,8 394,8 352,80 352,80
Junio 6 459,9 352,8 352,8 369,18 369,18
Julio 7 283,5 373,8 373,8 350,28 350,28
Agosto 8 378,0 325,5 325,5 386,82 386,82
Septiembre 9 315,0 396,9 396,9 351,54 351,54
Octubre 10 497,7 365,4 365,4 372,96 372,96
Noviembre 11 283,5 390,6 390,6
Diciembre 12 390,6
358
510 378
296 405 372
410 340 398
315 395 353
460 359 369
284 374 350
378 326 387
315 397 352
498 365 373
284 391
3910
100
200
300
400
500
600
1 2 3 4 5 6 7 8 9 10 11 12
Series1 Series2 Series3
Como se puede observar en la gráfica la serie que corresponde a los datos originales presenta apuntamientos y depresiones muy pronunciadas, la cuales se comienzan a minimizar en el Promedio Móvil 3 como se ve en el gráfico de la serie 2 y ya en el Promedio Móvil 5 según se ve en la serie 3 la gráfica presenta un Suavizamiento con la cual se pueden realizar cálculos que nos puede llevar a mejores predicciones.
Problema 02.- En la tabla anexa se presentan las ventas de una comercial durante los últimos ocho trimestres de los dos años anteriores. Se pide calcular el Promedio Móvil de dos trimestres y él de cuatro trimestres y presentar gráficas para los datos dados originalmente y para los promedios móviles calculados.
172
Mes 1 2 3 4 5 6 7 8
Ventas 32 51 29 41 30 46 28 37
Solución
Nº Ventas ∑(1+2)/2+
(2+3)/2…
P. Móvil (2) ∑(1+2+3+4)/4+
(2+3+4+5)/4+…
P. Móvil (4)
1 32 41,5 41,5 38,25 38,25
2 51 40,0 40,0 37,75 37,75
3 29 35,0 35,0 36,50 36,50
4 41 35,5 35,5 36,25 36,25
5 30 38,0 38,0 35,25 35,25
6 46 37,0 37,0
7 28 32,5 32,5
8 37
32 41 38
51 40 38
29 35 37
41 36 36
30 38 36
46 37
28 32
37
0
10
20
30
40
50
60
1 2 3 4 5 6 7 8
Series1 Series2 Series3
Como se puede observar en la gráfica la serie que corresponde a los datos originales presenta apuntamientos y depresiones muy pronunciadas, la cuales se comienzan a minimizar en el Promedio Móvil 2 como se ve en el gráfico de la serie 2 y ya en el Promedio Móvil 4 según se ve en la serie 3 la gráfica presenta un Suavizamiento bastante uniforme con la cual se pueden realizar cálculos que nos puede llevar a mejores predicciones.
b. Suavizamiento Exponencial.- El Suavizamiento Exponencial además de suavizar una Serie de Tiempo, también proporciona un medio bastante efectivo de predicción. El Suavizamiento Exponencial de Primer Orden se utiliza cuando los datos no tienen ningún patrón de tendencia.
1: 1t t tSuavizamiento Exponencial F A F
173
1 Pr
Pr
tan , 0 1
t
t
t
F onóstico para el siguiente período
A Valor real observado para el períodocorriente
F oyección previa para el períodocorriente
Cons te de suavizamiento
Problemas Resueltos
Problema 01.- El dueño una librería quiere pronosticar el ingreso por ventas en el mes de Agosto, entendiendo que lo quiere hacer conociendo que al realizar balance del ingreso mensual en el último día del mes de Julio este fue de Bs. 17.465,00; suponemos que es la primera vez que al dueño de la librería se le ocurre calcular un pronóstico, se tiene que para
el mes de Junio hubo un ingreso de Bs. 16.670,00. Si asumimos que la constante de Suavizamiento es de
Solución Consideremos al ingreso del mes de Junio como Ft proyección previa para el período corriente, entonces:
1
16.908,5
1
0,3 17.465 1 0,3 16.670
0,3 16.908,50 1 0,3 17.
0
17.298,05465
t t t
Agosto
Se
A
ptiembre
gosto
Septiembre
F F
A
F
F F
F
Problema 02.- Las tasas mensuales de inflación para el año 2003 se presentan al final. Una oficina de análisis económico va a realizar un pronóstico cual podría ser el índice inflacionario para Enero del 2004 para lo cual debe: a) Producir un Suavizamiento utilizando un Promedio Móvil con cuatro períodos y b) Utilizar un modelo de Suavizamiento exponencial fijando
Mes En. Feb. Mar. Abril Mayo Jun. Julio Agos. Sept. Oct. Nov. Dic.
Inflación 5,4 5,1 5,0 5,2 5,3 5,3 5,4 5,5 5,2 5,5 5,1 5,4
Solución
1 1 1 ; 1 0,4 0,6
0,4 5,1 0,6 5,4 5,28; 0,4 5,0 0,6 5,28 5,17;
0,4 5,2 0,6 5,17 5,18; 0,4 5,3 0,6 5,18 5,23;
0,4 5,3 0,6 5,23 5,26; 0,4 5,4 0,6 5,26 5,32;
t t t
Marzo Abril
Mayo Junio
Julio Agosto
Sept
F A F de donde
F F
F F
F F
F
2004
0,4 5,5 0,6 5,32 5,39; 0,4 5,2 0,6 5,39 5,31;
0,4 5,5 0,6 5,31 5,39; 0,4 5,1 0,6 5,39 5,27;
0,4 5,4 0,6 5,39 5,32;
iembre Octubre
Noviembre Diciembre
Enero
F
F F
F
174
Mes Tasa PM (4) PM (Centrado) Ft
Enero (2003) 5,4
Febrero 5,1 5,40
5,175
Marzo 5,0 5,163 5,28
5,150
Abril 5,2 5,175 5,17
5,200
Mayo 5,3 5,250 5,18
5,300
Junio 5,3 5,338 5,23
5,375
Julio 5,4 5,363 5,26
5,350
Agosto 5,5 5,375 5,32
5,400
Septiembre 5,2 5,363 5,39
5,325
Octubre 5,5 5,313 5,31
5,300
Noviembre 5,1 5,39
Diciembre 5,4 5,27
Enero (2004) 5,32
Al final se observa, es decir para Enero del 2004 que el pronóstico en cuanto al Índice de Inflación es de 5,32%
5. Análisis de tendencia por el Método de los Mínimos Cuadrados. a. Tendencia Lineal.- La tendencia lineal se fundamenta en el trazado de una recta
que representa el comportamiento de una Serie de Tiempo, quien aporta la información para que aplicando la metodología de los Mínimos Cuadrados logremos la Ecuación de Regresión Lineal.
Método de los Mínimos Cuadrados Método Conceptual
22
i i i i
i i
n X Y X YB
n X X
y
x
SB r
S
Calculo de A
i iY XA B A Y BX
n n
Error Estándar de Estimación.
175
22
;2
y x y x
Y A Y B XYS S Y Y
n
Intervalo de Confianza:
Tenemos que
2
2
2
1 E
i
i
X X
n XX
n
. . ;
;
y x
I C LIC LSC
tS
LIC Y LSC Y
Problema Resuelto Problema.- La tabla anexa representa los ingresos anuales en millones de bolívares de una tienda minoritaria durante los últimos 6 años. Usando una Tendencia Lineal proyectar los Ingresos hacia el año 2015 y establecer el respectivo intervalo de confianza, para
. . 4; . . 98%3,747
g l N Ct . El dueño de la tienda estima que si el posible ingreso anual para el
2015 no supera en un 15% el mejor de los ingresos anuales que hasta ahora ha obtenido este negocio, piensa cerrarla; ¿Qué se le recomendaría al dueño?
Año 2007 2008 2009 2010 2011 2012
Ingresos 1,283 1,199 1,207 1,319 1,342 1,236
Solución
X Y XY X2 Y2
1 1,283 1,283 1,000 1,646
2 1,199 2,398 4,000 1,438
3 1,207 3,621 9,000 1,457
4 1,319 5,276 16,000 1,740
5 1,342 6,710 25,000 1,801
6 1,236 7,416 36,000 1,528
21 7,586 26,704 91,000 9,609
2 22
6 26,704 21 7,586
6 910,009
21
i i i i
i i
n X Y X YB
n XB
X
176
0,009 217,586
61 3
6,23i iY
AX
A Bn n
9 9
2015 2006 9
1,233 0,009
1,1,233 0,009 9 314
Y A BX
X
Y
Y X
Y
2
9,609 1,233 7,586 0,009 26,7040 1
26
40,
y y xx
Y A Y B XYS
nS
2
2
2 2
2
219
1 11,
6
6 2191
5
6
89E
i
i
X X
n XX
n
. . ;
3,747 0,061 1,895
1,314 0,315 0,999; 1,314 0,315 1,629
. . :0,999 1,629
0,315y x
II C LIC LS CC
tS
LIC Y LSC
Y
Y
Recomendación: “Tomados los ingreso anuales que aparecen en el cuadro del problema, él del año 2011 es el mejor, y uno superior al 15% sería 1,342x1,15 = 1,543. Del estudio realizado observamos que en el Nivel de Confianza obtenido el Límite de Confianza Superior es mayor que el requerimiento solicitado (LSC =1,629>1,543), por lo tanto se recomienda mantener abierta la tienda, pero realizando los ajustes a los que haya lugar asesorándose con empresas serias que se dedican a este tipo de trabajo para que no se llegue al LIC=0,999, lo cual sería un desastre, se debe hacer lo posible para salvar el negocio” b. Tendencia Parabólica.- La tendencia parabólica se fundamenta en el estudio de
una parábola que representa el comportamiento de una Serie de Tiempo, quien aporta la información para que aplicando la metodología de los Mínimos
Cuadrados logremos la Ecuación de la Parábola. Ecuación General de la Parábola:
2Y A BX CX
Para obtener los valores de A, B y C se resuelve el siguiente sistema de tres ecuaciones con tres incógnitas:
177
2
2 3
2 3 4 2
nA B X C X Y
A X B X C X XY
A X B X C X X Y
Problema Resuelto Problema.- La tabla anexa representa los ingresos anuales en millones de bolívares de una librería durante los últimos 5 años. Utilizando la Tendencia Parabólica proyectar los Ingresos
hacia el año 2015 y establecer el respectivo intervalo de confianza, para . . 4; . . 95%
2,776g l N C
t .
El dueño de la tienda estima que si el posible ingreso anual para el 2015 no supera en un 15% el mejor de los ingresos anuales que hasta ahora ha obtenido este negocio, piensa
cerrarla; ¿Qué se le recomendaría al dueño?
Año 2007 2008 2009 2010 2011 2012
Ingresos 1,293 1,299 1,287 1,309 1,332 1,329
Solución
X Y XY X2Y X2 X3 X4 Y2
1 1,293 1,293 1,293 1 1 1 1,672
2 1,299 2,598 5,196 4 8 16 1,687
3 1,287 3,861 11,583 9 27 81 1,656
4 1,309 5,236 20,944 16 64 256 1,713
5 1,332 6,660 33,300 25 125 625 1,774
6 1,329 7,974 47,844 36 216 1296 1,766
21 7,849 27,622 120,160 91 441 2275 10,270
2 2
3 4 2
21; 7,849; 27,622; 120,16; 91;
441; 2.275 10,27
X Y XY X Y X
X X y Y
2
2 3
2 3 4 2
nA B X C X Y
A X B X C X XY
A X B X C X X Y
6 21 91 7,849 Re
21 91 441 27,622 1,294; 0,003; 0,002
91 441 2.275 120,16
A B C solviendo el sistemadeecuaciones
A B C A B C
A B C
Luego: 20,002 0,003 1,294Y X X
178
2
9 9
2015 2006 9
0,002 9 0,003 9 1,421,294 9Y
X
Y
2
10,27 1,294 7,849 0,003 27,6222 1
22
40,
y y xx
Y A Y B XYS
nS
2
2
2 2
2
219
1 11,
6
6 2191
5
6
89E
i
i
X X
n XX
n
. . ;
2,776 0,221 1,895
1,429 0,885 0,544; 1,429 0,885 2,314
. . :0,544 2,314
0,885y x
II C LIC LS CC
tS
LIC Y LSC
Y
Y
Recomendación: “Tomados los ingreso anuales que aparecen en el cuadro del problema, él del año 2011 es el mejor, y uno superior al 15% sería 1,332x1,15 = 1,531. Del estudio realizado observamos que en el Nivel de Confianza obtenido el Límite de Confianza Superior es mayor que el requerimiento solicitado (LSC =2,314>1,531), por lo tanto se recomienda mantener abierta la tienda”
6. Descomposición de las Series de Tiempo.- Por lo general es de gran utilidad
descomponer una Serie de Tiempo desglosando cada uno de sus cuatros componentes. a. Aislamiento de la Componente Estacional.- En un estudio serio sobre una Serie
de Tiempo, lo primero que debe obtenerse es el Índice Estacional, la cual mide las fluctuaciones que la serie sufre en el lapso de un año, por lo tanto lo conveniente es estudiar una Serie de Tiempo en períodos de tiempos menores a un año, si se quiere observar la influencia de las estaciones en el movimiento económico de una empresa. Lo primero que debe calcularse es un Promedio Móvil Centrado. Como se mencionó anteriormente la Componente Estacional ocurren en un año, la obtención de este promedio nos permite eliminar la influencia de la Componente Cíclica y la
Componente Irregular las cuales por lo general se dan en períodos mayores a un año.
Como el Modelo Multiplicativo de una Serie de Tiempo es: ST T C E I , el
promedio móvil realizado elimina la influencia de la Componente Estacional y la
Componente Irregular, entonces PM T C , luego podemos señalar que la Razón
por Promedio Móvil sería:
. . . .
ST T C E I STE I
P M T C P M
179
Seguidamente se debe calcular una razón media por promedio móvil para cada mes. Esto se logra promediando la razón por promedio móvil para cada mes. Finalmente se procede para normalizar estas razones promedios para obtener el Índice Estacional, lográndose al dividir 12 (Meses del año) por la suma de las razones promedio por su respectivo promedio móvil
Problema Resuelto Problema.- Al final se presenta un cuadro estadístico que refleja el ingreso (miles de Bolívares) por mes durante los últimos 2 años de una empresa de construcción. Obtener el Índice Estacional.
Mes Ene. Feb. Mar. Abr. May. Jun. Jul. Ago. Sep. Oct. Nov. Dic.
2011 100 90 110 120 180 230 270 260 180 130 100 100
2012 90 110 100 120 190 250 280 310 220 150 110 120
Solución
Año Mes Ingresos (Y)
PM (12) PMC Y/PMC = E.I.
Razón Prom.*PM
Índice Estacional
2011 Enero 100 155,833
Febrero 90
Marzo 110 155,000
Abril 120
Mayo 180 156,667
Junio 230
Julio 270 155,833 155,417 1,7373 1,7373 1,7637
Agosto 260 155,834 1,6684 1,6684 1,6938
Septiembre 180 156,667 156,250 1,1520 1,1520 1,1695
Octubre 130 156,250 0,8320 0.8320 0,8446
Noviembre 100 158,333 157,500 0,6349 0,6349 0,6446
Diciembre 100 158,333 0,6316 0,6316 0,6412
2012 Enero 90 158,333 158,750 0,5669 0,5669 0,5755
Febrero 110 162,250 0,6780 0,6780 0,6883
Marzo 100 159,167 165.000 0,6061 0,6061 0,6153
Abril 120 167,500 0,7164 0,7164 0,7273
Mayo 190 163,333 168,750 1,1259 1.1259 1,1431
Junio 250 170,000 1,4706 1,4706 1,4931
Julio 280 166,667
Agosto 310
Septiembre 220 168,333
Octubre 150
Noviembre 110 169,167
Diciembre 120
170,833
Total 11,8201 12,0000
Al factor a emplear para obtener el Índice Estacional para Mes (f(IEM)):
12 12
Pr . .1
11,8201,0152
IEM IEMf
Razón omedi Mf
o P
Al aplicar este factor para obtener cada Índice Estacional por Mes estamos eliminando cualquier actividad irregular que se pueda presentar en la Serie de Tiempo sometida al estudio. Índice Estacional para cada mes:
180
Pr . .i IEMIEM f Razón omedio P M
Si tomamos el mes de Agosto del 2011 como ejemplo para verificarla influencia del Índice
Estacional, observando que: 260
153,3831,6951
; lo cual quiere decir que por ser una empresa
de construcción para ese mes su actividad es mayor y a lo mejor se debe a las emergencias causadas por las lluvias.
b. Aislamiento de la Variación Cíclica
El Componente Cíclico en una Serie de Tiempo puede identificarse primero obteniendo la
Tendencia Secular y luego el Componente Estacional. En un estudio serio sobre una Serie de Tiempo, lo primero que debe tenerse claro que el Componente Cíclico se observa cuando los movimientos económicos que se estudian se dan en lapsos mayores a un año, por lo tanto lo conveniente es estudiar una Serie de Tiempo en períodos de tiempos mayores a un año, si se quiere observar la influencia de fluctuaciones cíclicas en el movimiento económico de una empresa. Lo primero que debe calcularse es un Promedio Móvil Centrado. Como el Modelo
Multiplicativo de una Serie de Tiempo es: ST T C E I , el promedio móvil realizado
elimina la influencia de la Componente Cíclico y el Componente Irregular, entonces
PM T E , luego podemos señalar que la Razón por Promedio Móvil sería:
. . . .
ST T C E I STC I
P M T E P M
Seguidamente se debe calcular una razón media por promedio móvil para cada período de tiempo. Esto se logra promediando la razón por promedio móvil para cada período. Finalmente se procede para normalizar estas razones promedios para obtener el Índice Cíclico, siguiéndose el mismo esquema como logramos el Índice Estacional.
Problema Resuelto
Problema.- Al final se presenta un cuadro estadístico que refleja el ingreso (miles de Bolívares) por trimestre durante los últimos 4 años de una empresa de construcción. Obtener
el Índice Estacional y el Índice Cíclico. La recta de tendencia es: 231,419 0,061Y X
Año 2010 2011 2012
Trimestre I II II IV I II III IV I II III IV
Ingreso 240 310 210 420 27 32 25 41 20 27 18 39
181
Solución
Año Trimestre Ingreso PM (4) PMC Y/PMC
= E.I.
2010 2011 2012 Razón
Promedio Por PM
Índice
Estacional IE
2010 I 240 0,8710 0,7306 0,8008 0,8030
1,0199 1,0286 1,0243 1,0270
II 310 0,7029 0,8230 0,7630 0,7650
295,00 1,3827 1,4199 1,4013 1,4050
III 210 298,75 0,7029
302,50
IV 420 303,75 1,3827
305,00
2011 I 270 310,00 0,8710
315,00
II 320 313,75 1,0199
312,50
III 250 303,75 0,8230
295,00
IV 410 288,75 1,4199
282,50
2012 I 200 273,75 0,7306
265,00
II 270 262,50 1,0286
260,00
III 180
IV 390
Total 3,9894 4,000
12 4
Pr . . 3,1,00
927
98 4IIEM EM
fRazón omedio P M
f
Año Trimestre Ingreso Proyección
de
tendencia
Índice Estacional
IE
Norma
Estadística
Componente Cíclico
irregular
Componente Cíclico
CC
2010 I 240 231,480 0,8030 185,8784 129,12
II 310 231,541 1,0270 237,7926 130,37
126,77
III 210 231,602 0,7650 177,1755 118,53 128,77
130,76
IV 420 231,663 1,4050 325,4865 129,04 131,27
131,78
2011 I 270 231,724 0,8030 186,0744 145,10 134,58
137,38
II 320 231,785 1,0270 238,0432 134,43 136,98
136,58
III 250 231,846 0,7650 177,3622 140,95 131,87
127,15
IV 410 231,907 1,4050 325,8293 125,83 124,51
121,87
2012 I 200 231,968 0,8030 186,2703 107,37 116,92
111,97
II 270 232,029 1,0270 238,2938 113,31 111,19
110,41
III 180 232,090 0,7650 177,5489 101,38
IV 390 232,151 1,4050 326,1722 119,57
Total
182
PriNorma Estadística NE oyección de Tendencia IE
100Ingreso
Componente Cíclico Irregular CCINorma Estadística
Logrados los Componentes Cíclicos Irregulares en un valor común, se procede a aislar el Componente Cíclico obteniendo el respectivo Promedio Móvil (En nuestro problema es de 4) y luego se obtiene el Promedio Móvil Centrado (Valores en azul remarcados en amarillos), los valores obtenidos son los Índices Cíclicos obtenidos de manera porcentual.
c. Componente Irregular.- Como esta componente obedece al algún evento fortuito o episódico con las consecuencias residuales que origina, por su casualidad no existe un patrón a seguir para sus aislamiento, por lo que se considera que habiendo realizado un buen trabajo en el aislamiento del Componente Estacional y el Componente Cíclico se podría estimar que ya en esas componentes vienen incluidas las incidencias de una Variación Irregular.
Capítulo 18 NÚMEROS ÍNDICES
1. Definiciones Fundamentales: Los Números Índice relacionan valores en un período de tiempo, el cual se toma como período base, con valores en otros períodos llamados períodos referenciales. Es un valor relativo expresado en términos porcentuales para expresar la relación entre las variables. Por lo general en una serie pequeña o corta, el período base corresponde al valor que la inicia, en serie de períodos es recomendable tomar valores que se encuentren lo menos afectados por factores internos y/o externos, que son los que presentan mayor estabilidad. El uso de los Números Índices constituye una herramienta de trabajo para quienes toman las decisiones, ya que permite visualizar en el tiempo el comportamiento de variables económicas, permitiendo hacer comparaciones con períodos más
significativos. Para elaborar un Número Índice se debe tener muy en cuenta: su cobertura, el período base, el sistema de ponderación y el método de promediación de las observaciones 1.1 Número Índice: Es un número que expresa el cambio relativo formulado
porcentualmente en el precio, la cantidad o el valor de un período de tiempo cualquiera en comparación con el precio, la cantidad o valor de un periodo de tiempo tomado como base.
183
1.2 Índice de Precio Simple (IPs): Indica el cambio relativo, en el precio de un producto o servicio, en el periodo de referencia respecto al periodo base.
PR = Precio de referencia. PB = Precio base.
Se dice que un Número Índice es de base fija cuando para los cálculos de los índices de una serie, el período tomado como base permanece inalterado durante toda la duración del índice, mientras que cuando es de base variable el período base varía sistemáticamente tomando siempre el valor correspondiente al del período anterior. Veamos el siguiente cuadro donde hemos calculado los índices simples con una base fija y con bases variables.
Años Valor Base Fija Base Variable
Índice Variación (%)
Índice Variación (%)
2007 141 100,00 0,00 100,00 0,00
2008 126 89,36 -10,64 89,36 -10,64
2009 118 83,69 -16,31 93,65 -6,35
2010 148 104,96 4,96 125,42 24,42
2011 139 98,51 -1,49 93,92 -6,35
2012 162 114,89 14,89 116,55 16,35
Problema Resuelto En el cuadro anexo se presenta los promedios de precio anuales de tres productos que se vende en la Carnicería y Charcutería Don Antonio C. A. de San Juan de los Morros. Usemos esa tabla para hacer un estudio de variación de precios respecto al año base (2010) respecto a los otros años señalados y elaborar los respectivos números indicadores de precios de los períodos señalados.
Artículo Unidad Precio (Bs.)/ unidad
2010 2011 2012
Res 1 Kg 29,00 36,25 49,75
Cerdo 1 Kg 32,00 41,50 59,50
Pollo 1 Kg 14,00 20,25 29,25
Solución
Aplicando la fórmula de Índice de Precios Simple:
184
2010 2011 2012
2010 2011 2012
2010 2
100,00 125,86 171,55
100,00 129,69 185,94
1
100
29 36,25 49,75Re : 100 ; 100 ; 100
29 29 29
32 41,5 59,5: 100 ; 100 ; 100
32 32 32
14: 100 ;00
400
1,
RS
B
PIP
P
s IP IP IP
Cerdo IP IP IP
Pollo IP IP 011 2012144,620,25 29,25
100 ; 10014 14
4 208,93IP
Res: Del año 2010 al 2011 el precio varió en 25,86%, es decir 125,86 – 100,00 Del año 2010 al 2012 el precio varió en 71,55%, es decir 171,55 – 100,00 Cerdo: Del año 2010 al 2011 el precio varió en 29,69%, es decir129,69 – 100,00
Del año 2010 al 2012 el precio varió en 85,94% es decir185,94 – 100,00 Pollo: Del año 2010 al 2011 el precio varió en 44,64%, es decir144,64 – 100,00 Del año 2010 al 2012 el precio varió en 108,93%, es decir208,93 – 100,00
2. Tipo de números índices: 2.1 Número Índice No Ponderado: Son aquellos que son elaborados, tomando en
consideración un solo componente, precios o cantidades. a. Índice de Precios de Promedio Simple: Es el promedio que se obtiene
sumando los índices de precios de productos a estudiar en un año o periodo cualquiera, dividiendo este valor entre el número de productos estudiados.
N = Número de productos. Problema Resuelto
Tomemos el problema anterior y utilicemos los Números Índices Simples calculado para cada artículo y apliquemos la fórmula para el Índice de Precios Promedio Simple.
Solución
Artículo 2010 2011 2012
Res 100,00 125,86 171,55
Cerdo 100,00 129,69 185,94
Pollo 100,00 144,64 208,93
∑ 300,00 400,19 566,42
(∑IPS/n)=IPPS= 100,00 133,40 188,81
Números Índices de cada artículo
185
La variación del Índice Promedio Simple del año 2011 respecto al año base es de 33,40% y él del 2012 sería 88,81%
b. Índice agregado simple: Son números índices que se elaboran sumando los
precios de los productos a estudiar o de referencia, dividiéndolos luego entre la suma de los precios de estos productos en el año que se toma como base y este valor se multiplica por 100.
100R
AS
B
PIP
P
Problema Resuelto Tomemos el problema anterior y utilicemos los Números precios asignado a cada artículo y apliquemos la fórmula para el Índice de Precio Agregado Simple.
Solución
Artículo Unidad 2010 2011 2012
Res Kgs. 29,00 36,25 49,75
Cerdo Kgs. 32,00 41,50 59,50
Pollo Kgs. 14,00 20,25 29,25
∑ 75,00 98,00 138,5
(∑PR/∑PB)x100=IPAS= 100,00 130,67 184,67
2.2 Número Índice Ponderado: Son aquellos números índices que son elaborados,
tomando en consideración la intervención del componente precio y componente cantidad del producto estudiado.
a. Índice de Laspeyres: Es un índice ponderado que utilizan las cantidades
de productos vendidas en el periodo base, como factor de ponderación.
b. Índice de Paashe: Es un índice de precios ponderado que utiliza las
cantidades de los productos vendidas en el periodo de referencia como factor de producción.
186
c. Índice ideal de Fisher: Es un número índice elaborado tomando la Media
Geométrica de los Números Índices de Laspeyres y de Paashe.
Existen otros tipos de Números Índices Ponderados que son menos utilizados como:
d. Índice de Sigwick-Drobisch: Es un número índice elaborado tomando la
Media Aritmética de los Números Índices de Laspeyres y de Paashe.
2
L PSD
IP IPIP
e. Índice de Precios de Marsshall-Edgeworth: indica la variación en los
precios entre dos períodos, tomando como ponderaciones la suma de las cantidades del período base más las del período sometido a la investigación.
100R B R
ME
B B R
P Q QIP
P Q Q
f. Índice de Walsh: indica la variación en los precios entre dos períodos,
tomando como ponderaciones la raíz cuadrada del producto de las cantidades del período base y las del período sometido a la investigación
100R B R
W
B B R
P Q QIP
P Q Q
g. Índice de Precios de Keynes: Toma como información para las
ponderaciones los mínimos valores de las cantidades más pequeñas ya sean del período base o del período investigado.
. ;100
. ;
R B R
K
B B R
P mín Q QIP
p mín Q Q
Problema Resuelto En el cuadro anexo se presenta la variación de precios de cuatro productos de alimentos de consumo diario desde el año 2000 al 2005; y las cantidades vendidas en el año 2000 y el año 2003. si tomamos como base el año 2000, se pide obtener:
a) El índice simple de la azúcar en el año 2001 y del aceite de comer en el 2002.
187
b) Promedio simple de los índices de precio en el 2004. c) Índice de agregado simple en el 2005. d) Índice de precio de Laspeyres, Paasche e Ideal de Fisher, Sigwich-Drobisch,
Marshall-Edgeworth, Walsh y Keynes para el 2003. e) Estimar el costo de: leche en polvo hacia el 2008.
Año
Producto
2000 2001 2002 2003 2004 2005
UNID. Po Qo P1 P2 P3 Q3 P4 P5
Aceite Lit. 75 100 95 115 120 120 145 180
Azúcar Kgs. 50 120 55 82 95 160 110 135
Harina de Maíz Kgs. 45 150 60 89 98 200 105 145
Leche en Polvo Kgs. 25 80 115 190 210 120 225 280
Solución
188
P(00) P(01) P(02) P(03) P(04) P(05) P(3) Q(0) P(3)*Q(0) P(3) Q(3) P(3)*Q(3)
Aceite 75 95 115 120 145 180 120 100 12000 120 120 14400
Azucar 50 55 82 95 110 135 95 120 11400 95 160 15200
H. Maíz 45 60 89 98 105 145 98 150 14700 98 200 19600
L. Polvo 25 115 190 210 225 280 210 80 16800 210 120 25200
∑ 195 325 476 523 585 740 54900 74400
a) P(0) Q(0) P(0)*Q(0) P(0) Q(3) P(0)*Q(3)
110,00 75 100 7500 75 120 9000
153,33 50 120 6000 50 160 8000
b) 45 150 6750 45 200 9000
IP S(4) 25 80 2000 25 120 3000
193,33 IP PS(04) 386,67 22250 29000
220,00
233,33
900,00
1546,7
c) IP AS 379,49
d) IP L 246,74
IP P 256,55
IP F 251,60
P(00) Q(0) P(3) Q(3) PR(QB+QR) PB(QB+QR) Qmín QmínxPR PR(QRQB)1/2
PR(QRQB)1/2
Aceite 75 100 120 120 26400 16500 100 12000 13145,34 8215,84
Azucar 50 120 95 160 26600 14000 120 11400 13163,59 6928,20
H. Maíz 45 150 98 200 34300 15750 150 14700 16974,10 7794,23
L. Polvo 25 80 210 120 42000 5000 80 16800 20575,71 2449,49
∑ 195 129300 51250 54900 63858,74 25387,76
IPSD= 251,65 QmínxPB
IPME= 252,29 7500
IPW= 251,53 6000
IPK= 246,74 6750
2000
22250
e) X Y XY X2
B 46,43 A 11,67
IPS(AZÚCAR)
IPS(ACEITE)
189
e) X Y XY X2 B 46,43
A 11,67
1 25 25 1 MED. X 3,50
2 115 230 4 MED. Y 174,167
3 190 570 9
4 210 840 16
Y' = 11,67 +46,43X
5 225 1125 25 Y' (9) = 429,524
6 280 1680 36
∑ 21 1045 4470 91
2.3 Algunos Números Índices para fines Especiales. a. Índice de Valores.
Un Numero Índice de Valores mide los cambios de precios y las cantidades involucradas en el estudio. Establece la relación que debe existir entre las cantidades de los productos y sus precios en la actualidad con respecto a las cantidades de los productos y sus precios en una fecha de tiempo tomada como fecha base.
100R R
B B
P QIV
P Q
Problema Resuelto
En el problema anterior calcular el Índice de Valores.
74.400294
100100
22., 5%
506
2
R R
B B
P QIV IV
P Q
b. Número de Precios al Consumidor Este número índice nos permite observar la realidad de cómo se mueven los precios de productos y servicios de una cesta básicas relacionada directamente con el consumidor. Describe los cambios de precios de un de un período a otro de una canasta básica de productos y servicios. Este número Índice es el utilizado fundamentalmente para estudiar la inflación.
Problema Resuelto Supongamos que vamos a calcular la inflación en un país para lo cual vamos a tomar tres renglones fundamentales: a) Alimentación (Cesta Básica), b) Vestidos y calzados y Servicios Básicos (Agua, Electricidad, Aseo Urbano y Telefonía). Las variaciones durante los últimos tres años se muestran en tabla. Tomando como año base el 2010 calcular la inflación de los años 2011 y 2012
Solución
190
Con la información suministrada preparemos un cuadro para aplicar el cálculo del Número Índice Promedios Simple.
Renglones Períodos de tiempo
2010 2011 2012
Alimentación 5.292,10 7.205,14 8.315,55
Vestidos y Calzados 2.108,85 2.831,38 3.915,17
Servicios Básicos 1.099,05 1.267,14 1.919,28
Solución
Cálculo de los Números Índices simple.
Renglones Números Índices Simple
2010 2011 2012
Alimentación 100,00 136,15 157,13
Vestidos y Calzados 100,00 134,26 185,65
Servicios Básicos 100,00 115,29 174,63
∑PSx100 300,00 385,70 517,41
2010 2011 2012
300 385,70 517,41100,00; 128,57; 172,47;
3 3 3S S S
IP IP IP
IPPS (2010) = 100,00% IPPS (2011) = 128,57% IPPS (2012) = 172,47% La Inflación en el 2011 respecto al 2010 fue del 28,57%, (128,57 – 100,00) La Inflación en el 2012 respecto al 2010 fue del 72,47%, (172,47 – 100,00)
Problemas propuestos para los Capítulos tratados en el Título VI
Problema 01.- El centro de estudios laborales de una reconocida universidad desea determinar si los promedios puntuales en notas de los estudiantes puede explicar el número de ofertas laborales que ellos reciben después de graduarse. Al final se presenta tabla donde los datos de 10 recién graduados con notas ponderadas de acuerdo a un patrón establecido al efecto.
a) Hacer un diagrama de dispersión para los datos. b) Calcular e interpretar el coeficiente de correlación y el coeficiente de determinación
para el centro de estudios laborales de la universidad c) Calcular e interpretar el modelo de regresión. ¿Qué refleja este modelo sobre la
relación notas ponderadas y las ofertas de trabajo? d) Si un estudiante tiene una nota ponderada de 3,22; ¿Cuántas ofertas laborales
pronostica usted que él recibirá? e) Calcular e interpretar el error estándar de estimación para la reconocida universidad y
elaborar una gráfica en la interpretación. f) El centro de estudios laborales de la reconocida universidad desea un estimado para
un nivel de confianza del 95% d0nde t = 2,306
191
Estudiante 1 2 3 4 5 6 7 8 9 10
Notas Ponderadas
3,25 2,35 1,02 0,36 3,69 2,65 2,15 1,25 3,88 3,37
Ofertas
3 3 1 0 5 4 2 2 6 2
Problema 02.- Un economista de Departamento de Recursos Humanos del Estado de Florida está preparando un estudio sobre el comportamiento de consumidor. Él recolectó los datos que aparecen en miles de dólares para determinar si existe una relación entre el ingreso del consumidor y los niveles de consumo. Los datos recolectados se muestran a continuación:
Consumido 1 2 3 4 5 6 7 8 9 10 11 12
Ingreso 24,3 12,5 31,2 28,0 35,1 10,5 23,2 10,0 8,5 15,9 14,7 15,0
Consumo 16,2 8,5 15,0 17,0 24,2 11,2 15,0 7,1 3,5 11,5 10,7 9,2
h) Determinar cuál es la variable dependiente i) Hacer un diagrama de dispersión para los datos. j) Calcular e interpretar el coeficiente de correlación y el coeficiente de determinación para
el estudio que realiza el economista. k) Calcular e interpretar el modelo de regresión. ¿Qué refleja este modelo sobre la relación
ingreso consumo? l) ¿Qué consumo pronosticará el modelo para alguien US$ 27,5? m) Calcular e interpretar el error estándar de estimación para el estudio que realiza el
economista y elaborar una gráfica en la interpretación. n) El economista para su estudio desea un estimado para un nivel de confianza del 95%
donde t = 2,228
Problema 03.- Una entidad bancaria se especializa en créditos para la agricultura intenta analizar el mercado de finca raíz, midiendo el poder explicativo que las tasas de interés tienen sobre el número de crédito aprobados en el área. Los datos recopilados en 10 meses son:
Mes 1 2 3 4 5 6 7 8 9 10
Tasa de interés 12,3 10,5 15,6 9,5 10,5 9,3 8,7 14,2 15,2 12,0
Créditos 196 285 125 225 248 303 265 102 105 114
a) Determinar cuál es la variable dependiente b) Hacer un diagrama de dispersión para los datos. c) Calcular e interpretar el coeficiente de correlación y el coeficiente de determinación para
el análisis de mercado que realiza la entidad bancaria. d) Calcular e interpretar el modelo de regresión. ¿Qué refleja este modelo sobre la relación
tasa de interés créditos otorgados? e) ¿Cuántos créditos se aprobarían siguiendo este modelo, si la tasa de interés fuera del
9,5%? f) Calcular e interpretar el error estándar de estimación para el estudio que realiza el la
entidad bancaria y elaborar una gráfica en la interpretación. g) La entidad bancaria para su estudio desea un estimado para un nivel de confianza del
98% donde t = 2,896
192
Problema 04.- El profesor Urquía ha notado que transcurriendo este período de clases muchos estudiantes no están asistiendo a las mismas. Considera que puede explicar estas ausencias fundamentalmente, por las distancias a que viven los estudiantes del instituto. Se hace un estudio tomando al azar como muestra a 11 estudiantes, según se presenta a continuación:
Estudiante 1 2 3 4 5 6 7 8 9 10 11
Kilómetros 8,1 9,7 3,5 0,7 14,6 19,5 19,5 8,1 11,4 0,6 6,5
Ausencia 2 2 4 5 4 2 5 2 3 1 4
a) Determinar cuál es la variable dependiente b) Hacer un diagrama de dispersión para los datos. c) Calcular e interpretar el coeficiente de correlación y el coeficiente de determinación para
el análisis que realiza el Profesor Urquía. d) Calcular e interpretar el modelo de regresión. ¿Qué refleja este modelo sobre la relación
distancia ausencia? e) ¿A cuántas clases faltaría un estudiante que viviera a 5,2 Kilómetros? f) Calcular e interpretar el error estándar de estimación para el estudio que realiza el
Profesor Urquía y elaborar una gráfica en la interpretación. g) El Profesor Urquía para su estudio desea un estimado para un nivel de confianza del
98% donde t = 2,764
Problema 05- La tabla siguiente muestra presenta la recuperación anual media sobre el capital (utilidad) y el crecimiento porcentual anual medio de las ventas para ocho compañías de navegación aérea y defensa.
Compañía 1 2 3 4 5 6 7 8
Productividad 23,1 13,2 24,1 11,1 10,1 10,8 27,3 20,1
Crecimiento 8,0 15,6 31,2 2,5 35,4 6,0 8,7 3,2
a) Hacer un diagrama de dispersión para los datos. b) Calcular e interpretar el coeficiente de correlación y el coeficiente de determinación para
el análisis productividad crecimiento. c) Calcular e interpretar el modelo de regresión en base crecimiento. ¿Qué refleja este
modelo sobre la el valor de la pendiente? d) Siguiendo este modelo; ¿Cuál será la productividad para un crecimiento de
26.8?Comentar e) Calcular e interpretar el error estándar de estimación para la relación productividad-
crecimiento y elaborar una gráfica en la interpretación. f) Se desea un estimado productividad-crecimiento para un nivel de confianza del 95%
donde t = 2,447
Problema 06.- Los datos siguientes revelan el precio al detal para doce computadoras laptop seleccionadas al azar, además de la velocidades de su procesador.
Computadoras 1 2 3 4 5 6 7 8 9 10 11 12
Velocidad 2,0 1,6 1,6 1,8 2,0 1,2 2,0 1,6 2,0 1,6 1,0 1,4
Precio (Bs.) 12,4 5,7 6,5 11,9 13,1 6,2 13,5 8,5 13,0 12,3 5,7 5,3
193
a) Desarrollar una ecuación de regresión lineal que se pueda utilizar para describir el grado con el cual el precio depende de la velocidad del procesador.
b) Con base en la ecuación de la recta de regresión, ¿Existe algún equipo que parezca tener un precio más bajo del que le corresponde?
c) Calcule el coeficiente de correlación y de determinación entre las dos variables
Problema 07.- Se ha efectuado un estudio en que se relaciona los puntajes de aptitud con la productividad de una industria. Después de tres mese de entrenamiento del personal. Sus postulantes, elegidos al azar, obtuvieron los seis pares de puntajes de aptitud y productividad que se indican a continuación:
Par 1 2 3 4 5 6
Aptitud 9 17 20 19 20 23
Productividad 23 35 29 33 43 32
a) ¿Cuál es la productividad esperada de un trabajador, cuyo puntaje de aptitud fue de
16? b) Obtener el coeficiente de correlación y de determinación. c) Obtener el error estándar de estimación. d) Fijar una probabilidad del 95%, donde t = 2,776; la probabilidad estimada en el literal
Problema 08.- Al observar el número de sucursales y los costos mensuales en comunicación telefónica con la casa central, en millones de bolívares, se encontró:
Sucursales 3 5 3 2 4 1 5 2 6 3
Costos Mens. 2 3 5 4 6 2 5 1 3 5
a) Obtener el coeficiente de correlación y de determinación. Explicar que interpreta cada
uno. b) Obtener la ecuación de regresión lineal que muestre la relación de los costos en
función del número de sucursales. c) Estimar los costos de una empresa con 10 sucursales d) Obtener el error estándar de estimación para la estimación del literal.
Problema 09.- Con los ingresos y gastos de 10 familias tomadas al azar:
Familia 1 2 3 4 5 6 7 8 9 10
Ingreso (Cien miles Bs.)
6,5 7,0 8,0 10,0 11,0 7,5 8,0 9,0 10,8 8,3
Gastos (Cien miles Bs.)
6,3 6,7 7.0 8,2 9,0 7,3 7,9 8,5 8,6 7,7
a) Hacer un diagrama de dispersión para los datos. b) Calcular e interpretar el coeficiente de correlación y el coeficiente de determinación para
el análisis ingreso gasto.
194
c) Calcular e interpretar el modelo de regresión en base al ingreso en función de gastos, y en estas condiciones; ¿Cuál es la variable dependiente? y ¿Qué refleja este modelo sobre la el valor de la pendiente?
d) Siguiendo este modelo; ¿Cuál sería la gasto para un ingreso de 7,5 cien miles de bolívares? Comentar
e) Calcular e interpretar el error estándar de estimación para la relación ingresos gastos y elaborar una gráfica en la interpretación.
f) Se desea un estimado de ingreso-gastos del literal d para un nivel de confianza del 90% donde t = 1,860
Problema 10.- La solubilidad en el agua de cierto producto orgánico se hace más rápida con el auxilio de un agente químico. Según se presume de las siguientes observaciones efectuadas en seis muestras de 20 gramos del producto y diversas dosis del agente químico:
Muestra 1 2 3 4 5 6
Agente (grs.) 3 2 1 3 5 4
Solubilidad (seg.) 7 9 10 8 5 6
a) Calcular e interpretar, el coeficiente de correlación y el coeficiente de determinación. b) ¿Cuál es la rapidez de solución de 10 gramos del producto químico en ausencia del
agente químico? c) ¿Qué proporción del agente químico deberá contener el producto para que la solución
sea instantánea? Problema 11.- Con los ingresos y gastos de 10 familias tomadas al azar:
Familia 1 2 3 4 5 6 7 8 9 10
Ingreso (Cien miles Bs.)
6,5 7,0 8,0 10,0 11,0 7,5 8,0 9,0 10,8 8,3
Gastos (Cien miles Bs.)
6,3 6,7 7.0 9,0 7,3 7,9 8,5 8,6 7,7
¿Será que con esta información se podría estimar el gasto de la familia Nº 4?, y de ser posible, ¿Cuál sería el gasto estimado?
Problema 12.- Las importaciones realizadas por ARAUJO DE IMPORTACIÓN C.A. en millardo de bolívares desde los países asiático se presentan al final. Se pide calcular e interpretar los índices estacionales para cada trimestre.
Semestre 2009 Semestre 2010 Semestre 2011 Semestre 2012
I 5,16 I 6,45 I 4,30 I 5,16
II 6,45 II 7,74 II 6,45 II 6,02
III 7,74 III 9,03 III 6,02 III 6,45
IV 11,18 IV 15,48 IV 10,75 IV 10,75
Problema 13.- Los ingresos trimestrales en miles de Bolívares del establecimiento de comidas rápidas “MI BUENA COMIDA C.A.” se presentan al final. Comparar la recta de tendencia y los índices estacionales para cada trimestre.
195
Semestre 2009 Semestre 2010 Semestre 2011 Semestre 2012
I 215 I 366 I 587 I 621
II 253 II 471 II 571 II 655
III 351 III 451 III 569 III 687
IV 398 IV 652 IV 588 IV 699
Problema 14.- La sección de estadística de la CTV ha llevado una relación de los despedidos en el sector privado por trimestres en los últimos cuatro años según cuadro al final. Se pide:
a) Proyectar el número de posibles despidos para el primer y tercer trimestres del 2013 b) Desarrollar los índices estacionales para el número de despidos. c) Determinar los despidos eliminando los factores estacionales. d) Calcular los componentes cíclicos para cada período de tiempo.
e) Si los despidos para el primer trimestre del 2013 son 83; ¿Cuántos despidos se puede esperar para el año 2013?
f) Obtener cifras desestacionalizadas para cada período de tiempo.
Semestre 2009 Semestre 2010 Semestre 2011 Semestre 2012
I 45 I 51 I 63 I 69
II 49 II 58 II 67 II 76
III 58 III 61 III 67 III 79
IV 52 IV 69 IV 70 IV 81
Problema 15.- Con los siguientes datos:
Año 2000 2001 2002 2003 2004 2005 2006
Producción 360 383 337 390 406 459 480
Se pide:
a. Estimar la producción (Miles-Tons.) para el 2019 ajustando una recta y tomando como origen el año inicial
b. Estimar la producción (Miles-Tons.) para el 2014 ajustando una recta y tomando como origen el año más conveniente.
c. En la estimación anterior agregar el 2007, donde se obtuvo una producción de 600 Tons.
d. Fijar límites de confianza para un N.C. del 95%, donde t = 2,571 e. Calcular el coeficiente de correlación de Pearson.
Problema 16.-Con los índices de precios anuales:
Años 2000 2001 2002 2003 2004 2005 2006
Promedios 128 135 148 145 152 161 162
Se pide:
a. Estimar precio promedio para el 2008 b. Obtener el error estándar de estimación y fijar límites de confianza para un N.C. del
95% donde t = 2,571. c. Calcular el coeficiente de correlación de Pearson.
Problema 17.- Con los siguientes datos:
196
Años 2002 2003 2004 2005 2006
Yi Y1 Y2 550 600 750
Y 580’ 635
Se pide:
a. Estimar el valor de Y para el año 2006 mediante un ajuste rectilíneo. b. Calcular el valor de Y1 y Y2
Problema 18.- De acuerdo con los siguientes datos:
Años 2002 2003 2004 2005 2006
Yi 50 Y2 100 Y4 140
Y 90 148
Se pide:
a. Estimar el valor de Y para el 2016 mediante un ajuste rectilíneo. b. Calcular el valor de Y2 y Y4
Problema 19.- .- De acuerdo con los siguientes datos:
Años 2002 2003 2004 2005 2006 ∑
Yi 50 320 380
XiYi 0 3.260
Se sabe adicionalmente que la media de las observaciones es 280. Se pide reconstruir el cuadro anterior, y además estimar el valor de Y para el año 2013. Problema 20.- Los turistas extranjeros llegados a una ciudad X han sido, en los últimos cinco años:
Años 2002 2003 2004 2005 2006
Pasajeros 417.500 572.800 620.350 679.260 712.800
Se ha determinado que el 60% de estos turistas requieren alojamiento en establecimientos hoteleros y el resto en hoteles de cinco estrellas.
a. Determinar la demanda total de alojamientos en el 2012. b. Demanda de hoteles cinco estrellas en el 2012
Problema 21.- A continuación se presenta el número de llamadas telefónicas diarias que ingresan a un conmutador de una oficina muy ocupada. Calcular el promedio móvil para tres períodos.
Día 1 2 3 4 5 6 7 8 9 10 11
Llamadas 40 37 45 32 42 47 39 47 41 36 38
197
Problema 22.- Se presenta el número de empleados que se ausentan diariamente de sus trabajos en una fábrica grande. Calcular el promedio móvil de cuatro períodos relacionados con estos datos, centrando los promedios.
Día 1 2 3 4 5 6 7 8 9 10 11 12
Empleados 45 54 63 39 42 31 48 54 64 36 41 52
Problema 23.- Los créditos mensuales en miles de bolívares de una entidad bancaria local son:
Crédito 1 2 3 4 5 6 7 8 9
Monto 211 234 209 217 215 232 221 211 203
Utilizando el suavizamiento exponencial para proyectar los créditos al siguiente período, utilizando un valor α de 0,10. Calcular el cuadrado medio del error y compárelo con el cuadrado medio del error si α es 0,80. ¿Cuál valor α proporciona mejor pronóstico? Problema 24.- Las exportaciones desde 1995 a 1998 en miles de bolívares de accesorios para armar transformadores hacia los ´países del Caribe por parte de Trodica C.A., se presentan a continuación: Calcular e interpretar los índices estacionales para cada trimestre.
Trimestre y Año Bs.
I Bs.
II Bs.
III Bs.
IV Bs.
1995 12 15 10 12
1996 15 18 18 14
1997 18 21 14 15
1998 26 36 25 25
Problema25.- Los costos en cientos de bolívares de 1995 a 1998 en llamadas telefónicas internacionales realizadas desde las oficinas de Petróleos Nacionales Sociedad Anónima (PETNASA) aparecen a continuación. Calcular e interpretar los índices trimestrales
Trimestre y Año Bs.
I Bs.
II Bs.
III Bs.
IV Bs.
1995 14 21 21 26
1996 18 24 23 28
1997 26 29 38 48
1998 15 18 21 31
Problema 26.- Un supermercado está considerando ajustar los precios de sus servicios de carnicería, según se muestra en cuadro anexo:
198
Mes Enero Febrero Marzo Abril Mayo
Prec-Cant. Artículo
PB
Bs. QB
Kgs. P1
Bs. Q1
Kgs.
P2
Bs.
Q2
Kgs.
P3
Bs.
Q3
Kgs.
P4
Bs.
Q4
Kgs. Car. de res 21 700 21 720 25 680 24 620 26 760
Car. de cerdo 19 320 21 360 26 380 27 350 25 340
Car. de ternera 24 85 26 100 24 120 28 90 26 95
Pollo 12 850 15 880 13 850 13 890 14 950
Gallina 17 70 17 75 18 85 20 90 21 80
Se pide:
a. Índice de precio simple de la ternera en el mes de marzo. b. Índice de precios agregados de los productos considerados en el mes de abril. c. Índice ideal de Fisher de febrero. d. ¿En cuánto montó la inflación del 2007 al 2008?
Problema 27.- Un supermercado está considerando ajustar los precios de sus servicios de cosméticos (cantidades en miles de unidades), según se muestra en cuadro anexo:
Año 2006 2007 2008 2009 2010
Prec-Cant. Artículo
P0
Bs. Q0
Und. P1
Bs. Q1
Und.
P2
Bs.
Q2
Und.
P3
Bs.
Q3
Und.
P4
Bs.
Q4
Und.
Jabón 12,2 13 12,3 13 13,3 14 15,4 14 18,1 14
Champó 21,4 8 21,4 8 22,0 9 23,3 9 26,9 9
Enjuague 20,0 5 22,6 6 23,5 6 24,6 7 24,6 8
Pasta dental 19,1 10 22,5 11 22,7 11 26,5 13 31,7 14
Se pide:
a. Índice de precio simple de cada unidad de jabón en el año 2007. b. Índice de precios agregados de los productos considerados en el año 2009 c. Índice ideal de Fisher en el año 2008. d. ¿En cuánto se podría estimar el costo de la pasta dental para el 2013.
Problema 28.- Una ferretería está considerando ajustar los precios de sus ventas de equipos y herramientas (Precio por miles de bolívares), según se muestra en cuadro anexo
Año 2006 2007 2008 2009 2010
Prec-Cant. Artículo
P0
Bs. Q0
Und.
P1
Bs. Q1
Und.
P2
Bs.
Q2
Und.
P3
Bs.
Q
Und.
P4
Bs.
Q4
Und.
Martillo 22 103 23 112 24 123 24 136 32 132
Alicate 26 98 27 104 27 103 27 96 31 101
Destornillad. 13 148 14 158 14 138 16 146 18 152
Taladro 92 18 92 23 94 21 96 24 98 22
J. de llaves 38 15 40 17 42 18 45 18 51 20
Se pide:
199
a. Índice de precio simple de cada taladro en el año 2008. b. Índice de precios agregados de los productos considerados en el año 2007 c. Índice ideal de Fisher en el año 2009. d. ¿En cuánto se podría estimar el costo del destornillador para el 2015.
Problema 29.- Un supermercado está considerando ajustar los precios de tres de sus producto de leguminosas (cantidades en miles de toneladas, según se muestra en cuadro anexo:
Año 2006 2007 2008 2009 2010
Prec-Cant. Artículo
P0
Bs. Q0
Tn. P1
Bs. Q1
Tn.
P2
Bs.
Q2
Tn.
P3
Bs.
Q3
Tn.
P4
Bs.
Q4
Tn. Caraotas negr. 5,5 1,1 5,8 1,2 6,0 1,8 6,5 2,2 7,0 2,6
Frijoles 3,5 0,6 4,2 0,7 4,2 0,7 5,6 0,8 6,8 0,8
Lentejas 4,2 2,3 4,8 2,8 4,8 3,2 6,5 3,6 7,6 4,0
Se pide:
a. Índice de precio simple de una tonelada de caraotas negras en el año 2008. b. Índice de precios agregados de los productos considerados en el año 2007 c. Índice ideal de Fisher en el año 2009. d. ¿En cuánto se podría estimar el costo de las lentejas para el 2015? e. ¿En cuánto montó la inflación del 2008 al 2009?
Problema 30 .- Los números índices de la producción de un determinado bien de consumo desde el año 2000 al 2006 fueron los siguientes:
Años 2000 2001 2002 2003 2004 2005 2006
Índices 100,00 112,14 115,26 110,04 105,00 110,82 120,55
APÉNDICES
200
APÉNDICE “A”
DISTRIBUCIÓN DE PROBABILIDAD NORMAL O “Z” (Media Campana)
Z A Z A Z A Z A Z A Z A Z A Z A
0,00 0,0000 0,45 0,1736 0,90 0,3159 1,35 0,4115 1,80 0,4641 2,25 0,4878 2,70 0,4965 3,15 0,4992
0,01 0,0040 0,46 0,1772 0,91 0,3186 1,36 0,4131 1,81 0,4649 2,26 0,4881 2,71 0,4966 3,16 0,4992
0,02 0,0080 0,47 0,1803 0,92 0,3212 1,37 0,4147 1,82 0,4656 2,27 0,4884 2,72 0,4967 3,17 0,4992
0,03 0,0120 0,48 0,1844 0,93 0,3238 1,38 0,4162 1,83 0,4664 2,28 0,4887 2,73 0,4968 3,18 0,4993
0,04 0,0160 0,49 0,1879 0,94 0,3264 1,39 0,4177 1,84 0,4671 2,29 0,4890 2,74 0,4969 3,19 0,4993
0,05 0,0199 0,50 0,1915 0,95 0,3289 1,40 0,4192 1,85 0,4678 2,30 0,4893 2,75 0,4970 3,20 0,4993
0,06 0,0239 0,51 0,1950 0,96 0,3315 1,41 0,4207 1,86 0,4686 2,31 0,4896 2,76 0,4971 3,21 0,4993
0,07 0,0279 0,52 0,1985 0,97 0,3340 1,42 0,4222 1,87 0,4693 2,32 0,4898 2,77 0,4972 3,22 0,4994
0,08 0,0319 0,53 0,2019 0,98 0,3365 1,43 0,4236 1,88 0,4700 2,33 0,4901 2,78 0,4973 3,23 0,4994
0,09 0,0359 0,54 0,2054 0,99 0,3389 1,44 0,4251 1,89 0,4706 2,34 0,4904 2,79 0,4974 3,24 0,4994
0,10 0,0398 0,55 0,2088 1,00 0,3413 1,45 0,4265 1,90 0,4713 2,35 0,4906 2,80 0,4974 3,25 0,4994
0,11 0,0438 0,56 0,2123 1,01 0,3438 1,46 0,4279 1,91 0,4719 2,36 0,4909 2,81 0,4975 3,26 0,4994
0,12 0,0478 0,57 0,2157 1,02 0,3461 1,47 0,4292 1,92 0,4726 2,37 0,4911 2,82 0,4976 3,27 0,4995
0,13 0,0517 0,58 0,2190 1,03 0,3485 1,48 0,4306 1,93 0,4732 2,38 0,4913 2,83 0,4977 3,28 0,4995
0,14 0,0557 0,59 0,2224 1,04 0,3508 1,49 0,4319 1,94 0,4738 2,39 0,4916 2,84 0,4977 3,29 0,4995
0,15 0,0596 0,60 0,2258 1,05 0,3531 1,50 0,4332 1,95 0,4744 2,40 0,4918 2,85 0,4978 3,30 0,4995
0,16 0,0636 0,61 0,2291 1,06 0,3554 1,51 0,4345 1,96 0,4750 2,41 0,4920 2,86 0,4979 3,31 0,4995
0,17 0,0675 0,62 0,2324 1,07 0,3577 1,52 0,4357 1,97 0,4756 2,42 0,4922 2,87 0,4980 3,32 0,4996
0,18 0,0714 0,63 0,2357 1,08 0,3599 1,53 0,4370 1,98 0,4762 2,43 0,4925 2,88 0,4980 3,33 0,4996
0,19 0,0754 0,64 0,2389 1,09 0,3621 1,54 0,4382 1,99 0,4767 2,44 0,4927 2,89 0,4981 3,34 0,4996
0,20 0,0793 0,65 0,2422 1,10 0,3643 1,55 0,4394 2,00 0,4773 2,45 0,4929 2,90 0,4981 3,35 0,4996
0,21 0,0832 0,66 0,2454 1,11 0,3665 1,56 0,4406 2,01 0,4778 2,46 0,4931 2,91 0,4982 3,36 0,4996
0,22 0,0871 0,67 0,2486 1,12 0,3686 1,57 0,4418 2,02 0,4783 2,47 0,4932 2,92 0,4983 3,37 0,4996
0,23 0,0910 0,68 0,2518 1,13 0,3708 1,58 0,4430 2,03 0,4788 2,48 0,4934 2,93 0,4983 3,38 0,4996
0,24 0,0948 0,69 0,2549 1,14 0,3729 1,59 0,4441 2,04 0,4793 2,49 0,4936 2,94 0,4984 3,39 0,4997
0,25 0,0987 0,70 0,2580 1,15 0,3749 1,60 0,4452 2,05 0,4798 2,50 0,4938 2,95 0,4984 3,40 0,4997
0,26 0,1026 0,71 0,2612 1,16 0,3770 1,61 0,4463 2,06 0,4803 2,51 0,4940 2,96 0,4985 3,41 0,4997
0,27 0,1064 0,72 0,2642 1,17 0,3790 1,62 0,4474 2,07 0,4808 2,52 0,4941 2,97 0,4985 3,42 0,4997
0,28 0,0110 0,73 0,2673 1,18 0,3810 1,63 0,4485 2,08 0,4812 2,53 0,4943 2,98 0,4986 3,43 0,4997
0,29 0,1141 0,74 0,2704 1,19 0,3830 1,64 0,4495 2,09 0,4817 2,54 0,4945 2,99 0,4986 3,44 0,4997
0,30 0,1179 0,75 0,2734 1,20 0,3849 1,65 0,4505 2,10 0,4821 2,55 0,4946 3,00 0,4987 3,45 0,4997
0,31 0,1217 0,76 0,2764 1,21 0,3869 1,66 0,4515 2,11 0,4826 2,56 0,4948 3,01 0,4987 3,46 0,4997
0,32 0,1255 0,77 0,2794 1,22 0,3888 1,67 0,4525 2,12 0,4830 2,57 0,4949 3,02 0,4987 3,47 0,4997
0,33 0,1293 0,78 0,2823 1,23 0,3907 1,68 0,4535 2,13 0,4834 2,58 0,4951 3,03 0,4988 3,48 0,4998
0,34 0,1331 0,79 0,2852 1,24 0,3925 1,69 0,4545 2,14 0,4838 2,59 0,4952 3,04 0,4989 3,49 0,4998
0,35 0,1368 0,80 0,2881 1,25 0,3944 1,70 0,4554 2,15 0,4842 2,60 0,4953 3,05 0,4989 3,50 0,4998
0,36 0,1406 0,81 0,2910 1,26 0,3962 1,71 0,4564 2,16 0,4846 2,61 0,4955 3,06 0,4989 3,51 0,4998
0,37 0,1443 0,82 0,2939 1,27 0,3980 1,72 0,4573 2,17 0,4850 2,62 0,4956 3,07 0,4989 3,52 0,4998
0,38 0,1480 0,83 0,2967 1,28 0,3997 1,73 0,4582 2,18 0,4854 2,63 0,4957 3,08 0,4990 3,53 0,4998
0,39 0,1517 0,84 0,2996 1,29 0,4015 1,74 0,4591 2,19 0,4857 2,64 0,4959 3,09 0,4990 3,54 0,4998
0,40 0,1554 0,85 0,3023 1,30 0,4032 1,75 0,4599 2,20 0,4861 2,65 0,4960 3,10 0,4990 3,55 0,4998
0,41 0,1591 0,86 0,3081 1,31 0,4049 1,76 0,4608 2,21 0,4865 2,66 0,4961 3,11 0,4991 3,56 0,4998
0,42 0,1628 0,87 0,3079 1,32 0,4066 1,77 0,4616 2,22 0,4868 2,67 0,4962 3,12 0,4991 3,57 0,4998
0,43 0,1664 0,88 0,3106 1,33 0,4082 1,78 0,4625 2,23 0,4871 2,68 0,4963 3,13 0,4991 3,58 0,4998
0,44 0,1700 0,89 0,3133 1,34 0,4099 1,79 0,4633 2,24 0,4875 2,69 0,4964 3,14 0,4992 3,59 0,4998
201
Tabla Orientadora para obtener las probabilidades de la Distribución
Aplicando la Media Campana de Gauss APÉNDICE “B”
Valores notable de Z
N.C.
% A0 Z0 N.C.
% A0 Z0 N.C.
% A0 Z0 N.C.
% A0 Z0
80 0,400 1,28 85 0,425 1,44 90 0.450 1,65 95 0.475 1,96
81 0,405 1,31 86 0,430 1,48 91 0,455 1,72 96 0,480 2,05
82 0,410 1,34 87 0,435 1,51 92 0,460 1,75 97 0,485 2,17
83 0,415 1,37 88 0,440 1,56 93 0,465 1,81 98 0,490 2,33
84 0,420 1,41 89 0,445 1,60 94 0,470 1,88 99 0,495 2,58
GRÁFICA EN LA
CAMPANA DE GAUSS
PROBABILIDAD
SOLICITADA
PARÁMETRO
RESPECTO A LA MEDIA
POBLACIONAL
SIGNO DE Z
OBTENCIÓN DEL
ÁREA EN LA TABLA DE Z
Un solo acotamiento (X<a; X>a)
P X a a Z 0,5 aA A
P X a a Z 0,5 aA A
P X a a Z 0,5 aA A
P X a a Z 0,5 aA A
Doble acotamiento (a<X<b; X<a ó X>b)
P a X b a b ;a bZ y Z b aA A A
P a X b a b ;a bZ y Z b aA A A
P a X a b Z aA A
P X b a b Z bA A
P a X b a b ;a bZ y Z a bA A A
202
DISTRIBUCIÓN t DE STUDENT
APÉNDICE "C"
Intervalo de Confianza, IC
Intervalo de Confianza, IC
80% 90% 95% 98% 99% 99,9%
80% 90% 95% 98% 99% 99,9%
Nivel de significancia para prueba de una cola,
Nivel de significancia para prueba de una cola,
g.l. 0,100 0,050 0,025 0,010 0,005 0,0005
g.l. 0,100 0,050 0,025 0,010 0,005 0,0005
Nivel de significancia para prueba de dos colas,
Nivel de significancia para prueba de dos colas,
0,200 0,100 0,050 0,020 0,010 0,001
0,200 0,100 0,050 0,020 0,010 0,001
1 3,078 6,314 12,706 31,821 63,657 636,619
34 1,307 1,691 2,032 2,441 2,728 3,601
2 1,886 2,920 4,303 6,965 9,925 31,599
35 1,306 1,690 2,030 2,438 2,724 3,591
3 1,638 2,353 3,182 4,541 5,841 12,924
36 1,306 1,688 2,028 2,434 2,719 3,582
4 1,533 2,132 2,776 3,747 4,604 8,610
37 1,305 1,687 2,026 2,431 2,715 3,574
5 1,476 2,015 2,571 3,365 4,032 6,869
38 1,304 1,686 2,024 2,429 2,712 3,566
6 1,440 1,943 2,447 3,143 3,707 5,959
39 1,304 1,685 2,023 2,426 2,708 3,558
7 1,415 1,895 2,365 2,998 3,499 5,408
40 1,303 1,684 2,021 2,423 2,704 3,551
8 1,397 1,860 2,306 2,896 3,355 5,041
41 1,303 1,683 2,020 2,421 2,701 3,544
9 1,383 1,833 2,262 2,821 3,250 4,781
42 1,302 1,682 2,018 2,418 2,698 3,538
10 1,372 1,812 2,228 2,764 3,169 4,587
43 1,302 1,681 2,017 2,416 2,695 3,352
11 1,363 1,796 2,201 2,718 3,106 4,437
44 1,301 1,680 2,015 2,414 2,692 3,526
12 1,356 1,782 2,179 2,681 3,055 4,318
45 1,301 1,676 2,014 2,412 2,690 3,520
13 1,350 1,771 2,160 2,650 3,012 4,221
46 1,300 1,679 2,013 2,410 2,687 3,515
14 1,345 1,761 2,145 2,624 2,977 4,140
47 1,300 1,678 2,012 2,408 2,685 3,510
15 1,341 1,753 2,131 2,602 2,947 4,073
48 1,299 1,677 2,011 2,407 2,682 3,505
16 1,337 1,746 2,120 2,583 2,921 4,015
49 1,299 1,677 2,010 2,405 2,680 3,500
17 1,333 1,740 2,110 2,567 2,898 3,965
50 1,299 1,676 2,009 2,403 2,678 3,496
18 1,330 1,734 2,101 2,552 2,878 3,922
51 1,298 1,675 2,008 2,402 2,676 3,492
19 1,328 1,729 2,093 2,539 2,861 3,883
52 1,298 1,675 2,007 2,400 2,674 3,488
20 1,325 1,725 2,086 2,528 2,845 3,850
53 1,298 1,674 2,006 2,399 2,672 3,484
21 1,323 1,721 2,080 2,518 2,831 3,819
54 1,297 1,674 2,005 2,397 2,670 3,480
22 1,321 1,717 2,074 2,508 2,819 3,792
55 1,297 1,673 2,004 2,396 2,668 3,476
23 1,319 1,714 2,069 2,500 2,807 3,768
56 1,297 1,673 2,003 2,395 2,667 3,473
24 1,318 1,711 2,064 2,492 2,797 3,745
57 1,297 1,672 2,002 2,394 2,665 3,470
25 1,316 1,708 2,060 2,485 2,787 3,725
58 1,296 1,672 2,002 2,392 2,663 3,466
26 1,315 1,706 2,056 2,479 2,779 3,707
59 1,296 1,671 2,001 2,391 2,662 3,463
27 1,314 1,703 2,052 2,473 2,771 3,690
60 1,296 1,671 2,000 2,390 2,660 3,460
28 1,313 1,701 2,048 2,467 2,763 3,674
61 1,296 1,670 2,000 2,389 2,659 3,457
29 1,311 1,699 2,045 2,462 2,756 3,659
62 1,295 1,670 1,999 2,388 2,657 3,454
30 1,310 1,697 2,042 2,457 2,750 3,646
63 1,295 1,669 1,998 2,387 2,656 3,452
31 1,309 1,696 2,040 2,453 2,744 3,633
64 1,295 1,669 1,998 2,386 2,655 3,449
32 1,309 1,694 2,037 2,449 2,738 3,622
65 1,295 1,669 1,997 2,385 2,654 3,447
33 1,308 1,692 2,035 2,445 2,733 3,611
66 1,295 1,668 1,997 2,384 2,652 3,444
203
APÉNDICE “D”
FÓRMULAS PARA LA DETERMINACIÓN DEL TAMAÑO
ADECUADO DE LA MUESTRA
Tipo de
Población
Parámetro Fórmula Ordinaria Fórmula
Óptima
Comentario
No finita
Media
Poblacional
2Z
nE
Seleccionado el N.C., en el
tamaño muestral 2 factores
importantes influyen: a) la
varianza de la pobl. (2
),
expresa el grado de
variabilidad que presentan
las unidades de la pobl.,
siendo para prop. Poblacs.:
2= π (1- π) y en el mejor
de los casos 2
x= 0,25; b) el
tamaño del error tolerable (E)
fijado por el investigador de
acuerdo al estudio a realizar
y c) el nivel de confianza
(NC), tiene relación directa
con el tamaño de la muestra
a mayor nivel de confianza el
tamaño de la muestra será
mayor.
Proporción
Poblacional
2
1Z
nE
2
0,25Z
nE
Finita
Media
Poblacional
2
22
N Zn
NE Z
Proporción
Poblacional
2
2 2
1
1
NZn
NE Z 2
2 2
0,25
0,25
NZn
NE Z
204
(APÉNDICE “E”)
DISTRIBUCIÓN CHI-CUADRADO
α=20,0% α=10,0% α=5,0% α=2,5% α=2,0% α=1,0% α=0,5%
g.l. χ2 g.l χ2 g.l χ2 g.l χ2 g.l χ2 g.l χ2 g.l χ2
1 1,642 1 2,706 1 3,841 1 5,024 1 5,412 1 6,635 1 7,879
2 3,219 2 4,605 2 5,991 2 7,378 2 7,824 2 9,210 2 10,597
3 4,642 3 6,251 3 7,815 3 9,348 3 9,837 3 11,345 3 12,838
4 5,989 4 7,779 4 9,488 4 11,143 4 11,668 4 13,277 4 14,860
5 7,289 5 9,236 5 11,070 5 12,833 5 13,388 5 15,086 5 16,750
6 8,558 6 10,645 6 12,592 6 14,449 6 15,033 6 16,812 6 18,548
7 9,803 7 12,017 7 14,067 7 16,013 7 16,622 7 18,475 7 20,278
8 11,030 8 13,362 8 15,507 8 17,535 8 18,168 8 20,090 8 21,955
9 12,242 9 11,684 9 16,919 9 19,023 9 19,679 9 21,666 9 23,589
10 13,442 10 15,987 10 18,307 10 20,483 10 21,161 10 23,209 10 25,188
11 14,631 11 12,275 11 19,675 11 21,920 11 22,618 11 24,725 11 26,757
12 15,812 12 18,549 12 21,026 12 23,337 12 24,054 12 26,217 12 28,299
13 16,985 13 19,812 13 22,362 13 24,736 13 25,472 13 27,688 13 29,819
14 18,151 14 21,064 14 23,685 14 26,119 14 26,873 14 29,141 14 31,319
15 19,311 15 22,307 15 24,996 15 27,488 15 28,259 15 30,578 15 32,801
16 20,465 16 23,542 16 26,296 16 28,845 16 29,633 16 32,000 16 34,267
17 21,615 17 24,769 17 27,587 17 30,191 17 30,995 17 33,409 17 35,718
18 22,760 18 25,989 18 28,869 18 31,526 18 32,346 18 34,805 18 37,156
19 23,900 19 27,204 19 30,144 19 32,852 19 33,687 19 36,191 19 38,582
20 25,038 20 28,412 20 31,410 20 34,170 20 35,020 20 37,566 20 39,997
21 26,171 21 29,615 21 32,671 21 35,479 21 36,343 21 38,932 21 41,401
22 27,301 22 30,813 22 33,924 22 36,781 22 37,659 22 40,289 22 42,796
23 28,429 23 32,007 23 35,172 23 38,076 23 38,968 23 41,638 23 44,181
24 29,553 24 33,196 24 36,415 24 39,364 24 40,270 24 42,980 24 45,559
25 30,675 25 34,382 25 37,652 25 40,646 25 41,566 25 44,314 25 46,928
26 31,795 26 35,563 26 38,885 26 41,923 26 42,856 26 45,642 26 48,290
27 32,912 27 36,741 27 40,113 27 43,194 27 44,140 27 46,963 27 49,645
28 34,027 28 37,916 28 41,337 28 44,461 28 45,419 28 48,278 28 50,993
29 34,139 29 39,087 29 42,557 29 45,722 29 46,693 29 49,588 29 52,336
30 36,250 30 40,256 30 43,773 30 46,979 30 47,962 30 50,892 30 53,672
40 47,269 40 51,805 40 55,758 40 59,342 40 60,436 40 63,691 40 66,766
50 58,164 50 63,167 50 67,505 50 71,420 50 72,613 50 76,154 50 79,490
60 68,972 60 74,397 60 79,082 60 83,298 60 84,580 60 88,379 60 91,952
70 79,715 70 85,527 70 90,531 70 95,023 70 96,388 70 100,425 70 104,215
80 90,405 80 96,578 80 101,879 80 106,629 80 108,069 80 112,329 80 116,321
90 101,054 90 107,565 90 113,145 90 118,136 90 119,648 90 124,116 90 128,299
100 111,667 100 118,498 100 124,342 100 129,561 100 131,142 100 135,807 100 140,169
205
VALORES CRÍTICOS PARA LA DISTRIBUCIÓN F DE FISHER Nivel de significancia de 1,00% (N=Numerador; D=Denominador) APÉNDICE "F"
g.l. g.l. g.l. g.l. g.l. g.l. g.l. g.l.
D N F0 D N F0 D N F0 D N F0 D N F0 D N F0 D N F0 D N F0
1 1 4052 4 1 21,20 7 1 12,20 10 1 10,00 13 1 9,07 16 1 8,53 19 1 8,18 22 1 7,95
1 2 5000 4 2 18,00 7 2 9,55 10 2 7,56 13 2 6,70 16 2 6,23 19 2 5,93 22 2 5,72
1 3 5403 4 3 16,60 7 3 8,45 10 3 6,55 13 3 5,74 16 3 5,29 19 3 5,01 22 3 4,82
1 4 5625 4 4 16,00 7 4 7,85 10 4 5,99 13 4 5,21 16 4 4,77 19 4 4,50 22 4 4,31
1 5 5764 4 5 15,50 7 5 7,46 10 5 5,64 13 5 4,86 16 5 4,44 19 5 4,17 22 5 3,99
1 6 5859 4 6 15,20 7 6 7,19 10 6 5,39 13 6 4,62 16 6 4,20 19 6 3,94 22 6 3,76
1 7 5928 4 7 15,00 7 7 6,99 10 7 5,20 13 7 4,44 16 7 4,03 19 7 3,77 22 7 3,59
1 8 5981 4 8 14,80 7 8 6,84 10 8 5,06 13 8 4,30 16 8 3,89 19 8 3,63 22 8 3,45
1 9 6022 4 9 14,70 7 9 6,72 10 9 4,94 13 9 4,19 16 9 3,78 19 9 3,52 22 9 3,35
1 10 6056 4 10 14,50 7 10 6,62 10 10 4,85 13 10 4,10 16 10 3,69 19 10 3,43 22 10 3,26
1 12 6106 4 12 14,40 7 12 6,47 10 12 4,71 13 12 3,96 16 12 3,55 19 12 3,30 22 12 3,12
1 15 6157 4 15 14,20 7 15 6,31 10 15 4,56 13 15 3,82 16 15 3,41 19 15 3,15 22 15 2,98
1 20 6209 4 20 14,00 7 20 6,16 10 20 4,41 13 20 3,66 16 20 3,26 19 20 3,00 22 20 2,83
1 24 6235 4 24 13,90 7 24 6,07 10 24 4,33 13 24 3,59 16 24 3,18 19 24 2,92 22 24 2,75
1 30 6261 4 30 13,80 7 30 5,99 10 30 4,25 13 30 3,51 16 30 3,10 19 30 2,84 22 30 2,67
1 40 6287 4 40 13,70 7 40 5,91 10 40 4,17 13 40 3,43 16 40 3,02 19 40 2,76 22 40 2,58
2 1 98,50 5 1 13,30 8 1 11,30 11 1 9,65 14 1 8,86 17 1 8,40 20 1 8,10 23 1 7,88
2 2 99,00 5 2 13,30 8 2 8,65 11 2 7,21 14 2 6,51 17 2 6,11 20 2 5,85 23 2 5,66
2 3 99,20 5 3 12,10 8 3 7,59 11 3 6,22 14 3 5,56 17 3 5,18 20 3 4,94 23 3 4,76
2 4 99,20 5 4 11,40 8 4 7,01 11 4 5,67 14 4 5,04 17 4 4,67 20 4 4,43 23 4 4,26
2 5 99,30 5 5 11,00 8 5 6,63 11 5 5,32 14 5 4,69 17 5 4,34 20 5 4,10 23 5 3,94
2 6 99,30 5 6 10,70 8 6 6,37 11 6 5,07 14 6 4,46 17 6 4,10 20 6 3,87 23 6 3,71
2 7 99,40 5 7 10,50 8 7 6,18 11 7 4,89 14 7 4,28 17 7 3,93 20 7 3,70 23 7 3,54
2 8 99,40 5 8 10,30 8 8 6,03 11 8 4,74 14 8 4,14 17 8 3,79 20 8 3,56 23 8 3,41
2 9 99,40 5 9 10,20 8 9 5,91 11 9 4,63 14 9 4,03 17 9 3,68 20 9 3,46 23 9 3,30
2 10 99,40 5 10 10,10 8 10 5,81 11 10 4,54 14 10 3,94 17 10 3,59 20 10 3,37 23 10 3,21
2 12 99,40 5 12 9,89 8 12 5,67 11 12 4,40 14 12 3,80 17 12 3,46 20 12 3,23 23 12 3,07
2 15 99,40 5 15 9,72 8 15 5,52 11 15 4,25 14 15 3,66 17 15 3,31 20 15 3,09 23 15 2,93
2 20 99,40 5 20 9,55 8 20 5,36 11 20 4,10 14 20 3,51 17 20 3,16 20 20 2,94 23 20 2,78
2 24 99,50 5 24 9,47 8 24 5,28 11 24 4,02 14 24 3,43 17 24 3,08 20 24 2,86 23 24 2,70
2 30 99,50 5 30 9,38 8 30 5,20 11 30 3,94 14 30 3,35 17 30 3,00 20 30 2,78 23 30 2,62
2 40 99,50 5 40 9,29 8 40 5,12 11 40 3,86 14 40 3,27 17 40 2,92 20 40 2,69 23 40 2,54
3 1 34,10 6 1 13,70 9 1 10,60 12 1 9,33 15 1 8,68 18 1 8,29 21 1 8,02 24 1 7,82
3 2 30,80 6 2 10,90 9 2 8,02 12 2 6,93 15 2 6,36 18 2 6,01 21 2 5,78 24 2 5,61
3 3 29,50 6 3 9,78 9 3 6,99 12 3 5,95 15 3 5,42 18 3 5,09 21 3 4,87 24 3 4,72
3 4 28,70 6 4 9,15 9 4 6,42 12 4 5,41 15 4 4,89 18 4 4,58 21 4 4,37 24 4 4,22
3 5 28,20 6 5 8,75 9 5 6,06 12 5 5,06 15 5 4,56 18 5 4,25 21 5 4,04 24 5 3,90
3 6 27,90 6 6 8,47 9 6 5,80 12 6 4,82 15 6 4,32 18 6 4,01 21 6 3,81 24 6 3,67
3 7 27,70 6 7 8,26 9 7 5,61 12 7 4,64 15 7 4,14 18 7 3,84 21 7 3,64 24 7 3,50
3 8 27,50 6 8 8,10 9 8 5,47 12 8 4,50 15 8 4,00 18 8 3,71 21 8 3,51 24 8 3,36
3 9 27,30 6 9 7,98 9 9 5,35 12 9 4,39 15 9 3,89 18 9 3,60 21 9 3,40 24 9 3,26
3 10 27,20 6 10 7,87 9 10 5,26 12 10 4,30 15 10 3,80 18 10 3,51 21 10 3,31 24 10 3,17
3 12 27,10 6 12 7,72 9 12 5,11 12 12 4,16 15 12 3,67 18 12 3,37 21 12 3,17 24 12 3,03
3 15 26,90 6 15 7,56 9 15 4,96 12 15 4,01 15 15 3,52 18 15 3,23 21 15 3,03 24 15 2,89
3 20 26,70 6 20 7,40 9 20 4,81 12 20 3,86 15 20 3,37 18 20 3,08 21 20 2,88 24 20 2,74
3 24 26,60 6 24 7,31 9 24 4,73 12 24 3,78 15 24 3,29 18 24 3,00 21 24 2,80 24 24 2,66
3 30 26,50 6 30 7,23 9 30 4,65 12 30 3,70 15 30 3,21 18 30 2,92 21 30 2,72 24 30 2,58
3 40 26,40 6 40 7,14 9 40 4,57 12 40 3,62 15 40 3,13 18 40 2,84 21 40 2,64 24 40 2,49
206
VALORES CRÍTICOS PARA LA DISTRIBUCIÓN F DE FISHER Nivel de significancia de 2,50% (N=Numerador; D=Denominador) APÉNDICE "F"
g.l. g.l. g.l. g.l. g.l. g.l. g.l. g.l.
D N F0 D N F0 D N F0 D N F0 D N F0 D N F0 D N F0 D N F0
1 1 648 4 1 12,2 7 1 8,07 10 1 6,94 13 1 6,41 16 1 6,12 19 1 5,92 22 1 5,79
1 2 800 4 2 10,7 7 2 6,54 10 2 5,46 13 2 4,97 16 2 4,69 19 2 4,51 22 2 4,38
1 3 864 4 3 9,98 7 3 5,89 10 3 4,83 13 3 4,35 16 3 4,08 19 3 3,90 22 3 3,78
1 4 900 4 4 9,60 7 4 5,52 10 4 4,47 13 4 4,00 16 4 3,73 19 4 3,56 22 4 3,44
1 5 922 4 5 9,36 7 5 5,29 10 5 4,24 13 5 3,77 16 5 3,50 19 5 3,33 22 5 3,22
1 6 937 4 6 9,20 7 6 5,12 10 6 4,07 13 6 3,60 16 6 3,34 19 6 3,17 22 6 3,05
1 7 948 4 7 9,07 7 7 4,99 10 7 3,95 13 7 3,48 16 7 3,22 19 7 3,05 22 7 2,93
1 8 957 4 8 8,98 7 8 4,90 10 8 3,85 13 8 3,39 16 8 3,12 19 8 2,96 22 8 2,84
1 9 963 4 9 8,90 7 9 4,82 10 9 3,78 13 9 3,31 16 9 3,05 19 9 2,88 22 9 2,76
1 10 969 4 10 8,84 7 10 4,76 10 10 3,72 13 10 3,25 16 10 2,99 19 10 2,82 22 10 2,70
1 12 977 4 12 8,75 7 12 4,67 10 12 3,62 13 12 3,15 16 12 2,89 19 12 2,72 22 12 2,60
1 15 985 4 15 8,66 7 15 4,57 10 15 3,52 13 15 3,05 16 15 2,79 19 15 2,62 22 15 2,50
1 20 993 4 20 8,56 7 20 7,47 10 20 3,42 13 20 2,95 16 20 2,68 19 20 2,51 22 20 2,39
1 24 997 4 24 8,51 7 24 4,41 10 24 3,37 13 24 2,89 16 24 2,63 19 24 2,45 22 24 2,33
1 30 1001 4 30 8,46 7 30 4,36 10 30 3,31 13 30 2,84 16 30 2,57 19 30 2,39 22 30 2,27
1 40 1006 4 40 8,41 7 40 4,31 10 40 3,26 13 40 2,78 16 40 2,51 19 40 2,33 22 40 2,21
2 1 38,5 5 1 10,61 8 1 7,57 11 1 6,72 14 1 6,30 17 1 6,04 20 1 5,87 23 1 5,75
2 2 39,00 5 2 8,43 8 2 6,06 11 2 5,26 14 2 4,86 17 2 4,62 20 2 4,46 23 2 4,35
2 3 39,17 5 3 7,76 8 3 5,42 11 3 4,63 14 3 4,24 17 3 4,01 20 3 3,86 23 3 3,75
2 4 39,25 5 4 7,39 8 4 5,05 11 4 4,28 14 4 3,89 17 4 3,66 20 4 3,51 23 4 3,41
2 5 39,30 5 5 7,15 8 5 4,82 11 5 4,04 14 5 3,66 17 5 3,44 20 5 3,29 23 5 3,18
2 6 39,33 5 6 6,98 8 6 4,65 11 6 3,88 14 6 3,50 17 6 3,28 20 6 3,13 23 6 3,02
2 7 39,36 5 7 6,85 8 7 4,53 11 7 3,76 14 7 3,38 17 7 3,16 20 7 3,01 23 7 2,90
2 8 39,37 5 8 6,76 8 8 4,43 11 8 3,66 14 8 3,29 17 8 3,06 20 8 2,91 23 8 2,81
2 9 39,39 5 9 6,68 8 9 4,36 11 9 3,59 14 9 3,21 17 9 2,98 20 9 2,84 23 9 2,73
2 10 39,40 5 10 6,62 8 10 4,30 11 10 3,53 14 10 3,15 17 10 2,92 20 10 2,77 23 10 2,67
2 12 39,41 5 12 6,52 8 12 4,20 11 12 3,43 14 12 3,05 17 12 2,82 20 12 2,68 23 12 2,57
2 15 39,43 5 15 6,43 8 15 4,10 11 15 3,33 14 15 2,95 17 15 2,72 20 15 2,57 23 15 2,47
2 20 39,45 5 20 6,33 8 20 4,00 11 20 3,23 14 20 2,84 17 20 2,62 20 20 2,46 23 20 2,36
2 24 39,46 5 24 6,28 8 24 3,95 11 24 3,17 14 24 2,79 17 24 2,56 20 24 2,41 23 24 2,30
2 30 39,46 5 30 6,23 8 30 3,89 11 30 3,12 14 30 2,73 17 30 2,50 20 30 2,35 23 30 2,24
2 40 39,47 5 40 6,18 8 40 3,84 11 40 3,06 14 40 2,67 17 40 2,44 20 40 2,29 23 40 2,18
3 1 17,44 6 1 8,81 9 1 7,21 12 1 6,55 15 1 6,20 18 1 5,98 21 1 5,83 24 1 5,72
3 2 16,04 6 2 7,26 9 2 5,71 12 2 5,10 15 2 4,77 18 2 4,56 21 2 4,42 24 2 4,32
3 3 15,44 6 3 6,60 9 3 5,08 12 3 4,47 15 3 4,15 18 3 3,95 21 3 3,82 24 3 3,72
3 4 15,10 6 4 6,23 9 4 4,72 12 4 4,12 15 4 3,80 18 4 3,61 21 4 3,48 24 4 3,38
3 5 14,88 6 5 5,99 9 5 4,48 12 5 3,89 15 5 3,58 18 5 3,38 21 5 3,25 24 5 3,15
3 6 14,73 6 6 5,82 9 6 4,32 12 6 3,73 15 6 3,41 18 6 3,22 21 6 3,09 24 6 2,99
3 7 14,62 6 7 5,70 9 7 4,20 12 7 3,61 15 7 3,29 18 7 3,10 21 7 2,97 24 7 2,87
3 8 14,54 6 8 5,60 9 8 4,10 12 8 3,51 15 8 3,20 18 8 3,01 21 8 2,87 24 8 2,78
3 9 14,47 6 9 5,52 9 9 4,03 12 9 3,44 15 9 2,12 18 9 2,93 21 9 2,80 24 9 2,70
3 10 14,42 6 10 5,46 9 10 3,96 12 10 3,37 15 10 3,06 18 10 2,87 21 10 2,73 24 10 2,64
3 12 14,34 6 12 5,37 9 12 3,87 12 12 3,28 15 12 2,96 18 12 2,77 21 12 2,64 24 12 2,54
3 15 14,25 6 15 5,27 9 15 3,77 12 15 3,18 15 15 2,86 18 15 2,67 21 15 2,53 24 15 2,44
3 20 14,17 6 20 5,17 9 20 3,67 12 20 3,07 15 20 2,76 18 20 2,56 21 20 2,42 24 20 2,33
3 24 14,12 6 24 5,12 9 24 3,61 12 24 3,02 15 24 2,70 18 24 2,50 21 24 2,37 24 24 2,27
3 30 14,08 6 30 5,07 9 30 3,56 12 30 2,96 15 30 2,64 18 30 2,44 21 30 2,31 24 30 2,21
3 40 14,04 6 40 5,01 9 40 3,51 12 40 2,91 15 40 2,59 18 40 2,38 21 40 2,25 24 40 2,15
207
VALORES CRÍTICOS PARA LA DISTRIBUCIÓN F DE FISHER Nivel de significancia de 5,00% (N=Numerador; D=Denominador) APÉNDICE "F"
g.l. g.l. g.l. g.l. g.l. g.l. g.l. g.l.
D N Fo D N Fo D N Fo D N Fo D N Fo D N Fo D N Fo D N Fo
1 1 161,0 4 1 7,71 7 1 5,59 10 1 4,96 13 1 4,67 16 1 4,49 19 1 4,38 22 1 4,30
1 2 200,0 4 2 6,94 7 2 4,74 10 2 4,10 13 2 3,81 16 2 3,63 19 2 3,52 22 2 3,44
1 3 216,0 4 3 6,59 7 3 4,35 10 3 3,71 13 3 3,41 16 3 3.24 19 3 3,13 22 3 3,05
1 4 225,0 4 4 6,39 7 4 4,12 10 4 3,48 13 4 3,11 16 4 3,01 19 4 2,90 22 4 2,82
1 5 230,0 4 5 6,26 7 5 3,97 10 5 3,33 13 5 2,96 16 5 2,85 19 5 2,74 22 5 2,66
1 6 234,0 4 6 6,16 7 6 3,87 10 6 3,22 13 6 2,85 16 6 2,74 19 6 2,63 22 6 2,55
1 7 237,0 4 7 6,09 7 7 3,79 10 7 3,14 13 7 2,76 16 7 2,66 19 7 2,54 22 7 2,46
1 8 239,0 4 8 6,04 7 8 3,73 10 8 3,07 13 8 2,70 16 8 2,59 19 8 2,48 22 8 2,40
1 9 241,0 4 9 6,00 7 9 3,68 10 9 3,02 13 9 2,65 16 9 2,54 19 9 2,42 22 9 2,34
1 10 242,0 4 10 5,96 7 10 3,64 10 10 2,98 13 10 2,60 16 10 2,49 19 10 2,38 22 10 2,30
1 12 244,0 4 12 5,91 7 12 3,57 10 12 2,91 13 12 2,53 16 12 2,42 19 12 2,31 22 12 2,23
1 15 246,0 4 15 5,86 7 15 3,51 10 15 2,85 13 15 2,46 16 15 2,35 19 15 2,23 22 15 2,15
1 20 248,0 4 20 5,80 7 20 3,44 10 20 2,77 13 20 2,39 16 20 2,28 19 20 2,16 22 20 2,07
1 24 249,0 4 24 5,77 7 24 3,41 10 24 2,74 13 24 2,35 16 24 2,24 19 24 2,11 22 24 2,03
1 30 250,0 4 30 5,75 7 30 3,38 10 30 2,70 13 30 2,31 16 30 2,19 19 30 2,07 22 30 1,98
1 40 251,0 4 40 5,72 7 40 3,34 10 40 2,66 13 40 2,27 16 40 2,25 19 40 2,03 22 40 1,94
2 1 18,50 5 1 6,61 8 1 5,32 11 1 4,84 14 1 4,60 17 1 4,45 20 1 4,35 23 1 4,28
2 2 19,00 5 2 5,79 8 2 4,46 11 2 3,98 14 2 3,74 17 2 3,59 20 2 3,49 23 2 3,42
2 3 19,20 5 3 5,41 8 3 4,07 11 3 3,59 14 3 3,34 17 3 3,20 20 3 3,10 23 3 3,03
2 4 19,20 5 4 5,19 8 4 3,84 11 4 3,36 14 4 3,11 17 4 2,96 20 4 2,87 23 4 2,80
2 5 19,30 5 5 5,05 8 5 3,69 11 5 3,20 14 5 2,96 17 5 2,81 20 5 2,71 23 5 2,64
2 6 19,30 5 6 4,95 8 6 3,58 11 6 3,09 14 6 2,85 17 6 2,70 20 6 2,60 23 6 2,53
2 7 19,40 5 7 4,88 8 7 3,50 11 7 3,01 14 7 2,76 17 7 2,61 20 7 2,51 23 7 2,44
2 8 19,40 5 8 4,82 8 8 3,44 11 8 2,95 14 8 2,70 17 8 2,55 20 8 2,45 23 8 2,37
2 9 19,40 5 9 4,77 8 9 3,39 11 9 2,90 14 9 2,65 17 9 2,49 20 9 2,39 23 9 2,32
2 10 19,40 5 10 4,74 8 10 3,35 11 10 2,85 14 10 2,60 17 10 2,45 20 10 2,35 23 10 2,27
2 12 19,40 5 12 4,68 8 12 3,28 11 12 2,79 14 12 2,53 17 12 2,38 20 12 2,28 23 12 2,20
2 15 19,40 5 15 4,62 8 15 3,22 11 15 2,72 14 15 2,46 17 15 2,31 20 15 2,20 23 15 2,13
2 20 19,40 5 20 4,56 8 20 3,15 11 20 2,65 14 20 2,39 17 20 2,23 20 20 2,12 23 20 2,05
2 24 19,50 5 24 4,53 8 24 3,12 11 24 2,61 14 24 2,35 17 24 2,19 20 24 2,08 23 24 2,01
2 30 19,50 5 30 4,50 8 30 3,08 11 30 2,57 14 30 2,31 17 30 2,15 20 30 2,04 23 30 1,96
2 40 19,50 5 40 4,46 8 40 3,04 11 40 2,53 14 40 2,27 17 40 2,10 20 40 1,99 23 40 1,91
3 1 10,10 6 1 5,99 9 1 5,12 12 1 4,75 15 1 4,54 18 1 4,41 21 1 4,32 24 1 4,26
3 2 9,55 6 2 5,14 9 2 4,26 12 2 3,89 15 2 3,68 18 2 3,55 21 2 3,47 24 2 3,40
3 3 9,28 6 3 4,76 9 3 3,86 12 3 3,49 15 3 3,29 18 3 3,16 21 3 3,07 24 3 3,01
3 4 9,12 6 4 4,53 9 4 3,63 12 4 3,26 15 4 3,06 18 4 2,93 21 4 2,84 24 4 2,78
3 5 9,01 6 5 4,39 9 5 3,48 12 5 3,11 15 5 2,90 18 5 2,77 21 5 2,68 24 5 2,62
3 6 8,94 6 6 4,28 9 6 3,37 12 6 3,00 15 6 2,79 18 6 2,66 21 6 2,57 24 6 2,51
3 7 8,89 6 7 4,21 9 7 3,29 12 7 2,91 15 7 2,71 18 7 2,58 21 7 2,49 24 7 2,42
3 8 8,85 6 8 4,15 9 8 3,23 12 8 2,85 15 8 2,64 18 8 2,51 21 8 2,42 24 8 2,36
3 9 8,81 6 9 4,10 9 9 3,18 12 9 2,80 15 9 2,59 18 9 2,46 21 9 2,37 24 9 2,30
3 10 8,79 6 10 4,06 9 10 3,14 12 10 2,75 15 10 2,54 18 10 2,41 21 10 2,32 24 10 2,25
3 12 8,74 6 12 4,00 9 12 3,07 12 12 2,69 15 12 2,48 18 12 2,34 21 12 2,25 24 12 2,18
3 15 8,70 6 15 3,94 9 15 3,01 12 15 2,62 15 15 2,40 18 15 2,27 21 15 2,18 24 15 2,11
3 20 8,66 6 20 3,87 9 20 2,94 12 20 2,54 15 20 2,33 18 20 2,19 21 20 2,10 24 20 2,03
3 24 8,64 6 24 3,84 9 24 2,90 12 24 2,51 15 24 2,29 18 24 2,15 21 24 2,05 24 24 1,98
3 30 8,62 6 30 3,81 9 30 2,86 12 30 2,47 15 30 2,25 18 30 2,11 21 30 2,01 24 30 1,94
3 40 8,59 6 40 3,77 9 40 2,83 12 40 2,43 15 40 2,20 18 40 2,06 21 40 1,96 24 40 1,89
208
Bibliografía
Título Autores Editorial
Estadística para los Negocios y la Economía
Allen Webster Mc Graw Hill
Estadística para los Negocios y la Economía
Douglas Lind William Marchal Samuel Wathen
Mc Graw Hill
Estadística y Muestreo
Ciro Martínez Bencardino Ecoe- Ediciones
Fundamentos de Estadística
Armando Soto Negrín Panapo
Estadística para Administración y la Economía
David Ánderson Dennis Sweeney Thomas Willians
Thonson
Estadística para Administración y la Economía
Paúl Newbold Pearson Prentice Hill
Estadística para Administración y la Economía
Paúl Newbold William Carlson Berry Thorne
Pearson Prentice Hill