2015 separata

204
EPE AUTORES : Silvia Gutiérrez Flores Walter Luna Flores TÍTULO : Cuaderno de trabajo FECHA : Enero 2015 CURSO : Estadística Descriptiva CODIGO : MA147 y CE19 ÁREA : Ciencias CICLO : 2015-0

Upload: anthonyjoel

Post on 10-Dec-2015

162 views

Category:

Documents


0 download

DESCRIPTION

Separata de practica de Matlab, en la cual se puede encontrar ejercicios y teoría acerca de este pograma

TRANSCRIPT

Page 1: 2015 Separata

EPE

AUTORES : Silvia Gutiérrez Flores Walter Luna Flores

TÍTULO : Cuaderno de trabajo

FECHA : Enero 2015 CURSO : Estadística Descriptiva CODIGO : MA147 y CE19 ÁREA : Ciencias CICLO : 2015-0

Page 2: 2015 Separata

Contenido

EPE 2 Capítulo 1. Organización de datos 5

Subdivisión de la Estadística 5

Definiciones básicas 6

Métodos de recolección de datos 9

Variable 12

Escalas de medición 15

Organización y presentación de datos 25

Tabla de frecuencias para variables cualitativas 28

Representación gráfica de variables cualitativas 31

Representación gráfica de variables discretas 60

Representación gráfica de variables cuantitativas continuas 69

Capítulo 2. Resúmenes de datos 87

Medidas de tendencia central 87

El ingreso promedio mensual en Lima aumentó un 3,9% 87

Medidas de dispersión 111

Medidas de asimetría 120

Capítulo 3. Probabilidades 127

Definiciones básicas de probabilidad 127

Probabilidad condicional 137

Eventos independientes 141

Teorema de la probabilidad total 144

Teorema de Bayes 145

Capítulo 4. Variable aleatoria y distribución de probabilidad 151

Variable aleatoria 151

Variable aleatoria discreta 152

Variable aleatoria continua 161

Distribuciones discretas especiales 162

Distribuciones continuas especiales 174

Capítulo 5 Muestreo 183

Muestreo probabilístico 185

Page 3: 2015 Separata
Page 4: 2015 Separata

Capítulo 1. Organización de datos 5

Capítulo 1. Organización de datos

Subdivisión de la Estadística

Estadística

Es una ciencia que proporciona un conjunto de métodos,

técnicas y procedimientos para recopilar, organizar, presentar y

analizar datos.

La finalidad y utilidad es describir, numérica o gráficamente al conjunto de datos, así como

también realizar inferencias, entendidas como generalizaciones de lo observado, de manera que

se puedan obtener conclusiones adecuadas.

Estadística Descriptiva

Son métodos y técnicas de recolección,

caracterización, resumen y

presentación que permite describir apropiadamente las características de un conjunto de

datos.

Comprende el uso de gráficos, tablas,

diagramas y criterios para el análisis. Existen

diversos tipos de gráficos

adecuados a los distintos datos que se desean representar.

Estadística Inferencial

Son métodos y técnicas que hacen

posible estimar una o más

características de una población o

tomar decisiones referentes a la

población basados en el resultado de muestras elegidas adecuadamente.

Estas conclusiones no tienen que ser

totalmente válidas, pueden

tener cierto margen de error,

por eso se dan con una medida de confiabilidad o probabilidad.

Page 5: 2015 Separata

6 Estadística Básica con Aplicaciones en Excel 2010

Definiciones básicas

Población

•Es el conjunto de todas las unidades elementales de interés en un determinado estudio.

•Pueden ser personas, animales, objetos, conceptos, etc. de los cuales sacamos conclusiones a partir de una o más características observables de naturaleza cualitativa o cuantitativa.

Muestra

•Es una parte o un subconjunto de la población que se selecciona adecuadamente para obtener información acerca de la población de la cual proviene.

•Una muestra será representativa si es elegida de forma aleatoria.

Unidad elemental

•Es el objeto sobre el cual se hace la medición.

•También se le denomina unidad de análisis, unidad estadística o elemento.

•Por ejemplo, en estudios de poblaciones humanas, con frecuencia ocurre que la unidad elemental es cada individuo.

Dato

•Es el resultado de medir una característica de una unidad elemental.

•Los datos pueden ser cualitativos o cuantitativos ya que dependerán del tipo de variable.

Observación

•Es el conjunto de datos de una unidad elemental.

•La observación se tiene para cada unidad elemental.

Page 6: 2015 Separata

Capítulo 1. Organización de datos 7

Ejemplo 1 El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La gerencia general desea invertir en publicidad para incrementar la cantidad de huéspedes extranjeros en el hotel. Para conocer qué características del hotel es conveniente resaltar en la publicidad, se aplicó una encuesta a una muestra aleatoria de 56 mujeres y 59 hombres extranjeros que se hospedaron en-tre enero y mayo del presente año. A continuación, se presenta parte de la base de datos:

N° Edad Género País de proce-

dencia

Precio dispuesto a pagar por

habitación en dólares

Número de acompañantes

por viaje Criterio de selección del hotel

1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio

2 35 Femenino Argentina 60 2 Precio

3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas

4 65 Masculino Francia 45 0 Precio

5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados

6 28 Masculino Estados Unidos 65 2 Precio

7 45 Femenino Estados Unidos 60 1 Precio

8 85 Masculino China 70 2 Precio

9 25 Masculino Inglaterra 65 3 Limpieza del dormitorio

10 35 Femenino Francia 45 1 Precio

11 20 Masculino Estados Unidos 55 2 Amigable y cordial staff de empleados

a. Determine la población, la muestra y la unidad elemental. b. De la base de datos, proporcione un ejemplo de dato y uno de observación.

Solución

Población Todos los huéspedes extranjeros que se hospedaron en el hotel La Posada entre enero y mayo del presente año.

Muestra 115 huéspedes extranjeros que se hospedaron en el hotel La Posada entre enero y mayo del presente año.

Unidad elemental Un huésped extranjero que se hospedó en el hotel La Posada entre enero y mayo del presente año.

Dato X4 = 65 años

Observación X4 = 65 años, masculino, Francia, 45 dólares, 0 acompañantes, precio

Page 7: 2015 Separata

8 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 1

De los universitarios que estudian en la ciudad de Lima, se quiere estimar el porcentaje de universi-tarios que trabajan. Determine la población, la muestra y la unidad elemental.

Población

Muestra

Unidad elemental

Ejercicio 2

Se desea estimar el promedio diario de clientes que ingresan a un supermercado, para lo cual se eligieron cinco días al azar del presente mes y se registró el número de clientes que ingresó cada día al supermercado. Los resultados registrados fueron los siguientes: 554, 789, 487, 553 y 625 per-sonas. Determine la población, la muestra y la unidad elemental.

Población

Muestra

Unidad elemental

Ejercicio 3

La Oficina de Turismo de Cusco recopiló datos sobre los turistas que llegaron a la ciudad. Entre las 16 preguntas de un cuestionario que se entregó a los pasajeros que llegaron en el mes de enero del presente año, figuraban, entre otras, las siguientes preguntas:

Esta visita a Cusco es la: ………………… vez (primera, segunda, tercera, etc.).

El motivo principal de este viaje es: ………………… (16 categorías incluyendo vacaciones, trabajo).

Voy a estar alojado en: …………………… (10 categorías incluyendo hotel, apartamento, parientes).

Mi estadía en Cusco va a durar: …………………. días.

Población

Unidad elemental

Page 8: 2015 Separata

Capítulo 1. Organización de datos 9

Métodos de recolección de datos

La forma de obtener la información original de las unidades elementales por investigar puede ser efectuada a través de:

Censo

• Es una encuesta de todos los elementos de la población.

Encuesta muestral

• Es una encuesta de una parte de la población.

El uso de la encuesta ha ido en rápido aumento, debido a:

1. Que las instituciones que producen información

disponen de personal capacitado para efectuar su organización, diseño y análisis.

2. Su menor costo con respecto al censo que, en determinadas circunstancias, la información resulta más exacta que la de un censo. Esto se debe a que los errores en la recolección y procesamiento de los datos pueden ser reducidos a través de una mejor capacitación de los empadronadores y la utilización de métodos de captación de información más objetivos.

Page 9: 2015 Separata

10 Estadística Básica con Aplicaciones en Excel 2010

Ejemplo 2

Aprobación de Ollanta Humala cayó a 39% según reveló encuesta de Datum

ElComercio.pe lunes 8 de julio del 2013

La aprobación del jefe de Estado, Ollanta Humala, registró su por-centaje más bajo desde que se inició la gestión presidencial. En

una encuesta realizada por Datum, la popularidad de Humala apenas alcanzó 39%. Esto es siete puntos menos que el mes anterior y un retroceso de 21 unidades respecto de abril.

El estudio puntualizó además que el nivel de desconfianza hacia Humala Tasso aumentó de 69% a 81%, también tomando en cuenta las cifras del mes que pasó. La esposa del jefe de Estado, Nadine Heredia, obtuvo 47% de respaldo. Un 46% la desaprobó.

Page 10: 2015 Separata

Capítulo 1. Organización de datos 11

Registro administrativo

Existen oficinas públicas que llevan registros administrativos para sus propios fines. Por ejemplo:

los Registros Civiles registran nacimientos, casamientos o defunciones,

el Ministerio de Educación que lleva registros sobre matrícula de alumnos o deserción escolar,

la Aduana que registra las importaciones y exportaciones. Los registros administrativos constituyen la forma más económica de obtener información estadística. Sin embargo, esta información se obtiene tal como está disponible. Los fines del registro administrativo no siempre coinciden con los de nuestra investigación. Por ejemplo, se puede consultar las páginas web de las siguientes instituciones: • Ministerio de Educación http://minedu.gob.pe/ • Ministerio de Salud http://www.minsa.gob.pe/ • Superintendencia Nacional de Aduanas y de Administración Tributaria SUNAT

http://www.sunat.gob.pe/ • Registro Nacional de Identificación y Estado Civil http://www.reniec.gob.pe/ • Ministerio de Economía y Finanzas http://www.mef.gob.pe/ • Sistema Integrado de Información de Comercio Exterior http://www.siicex.gob.pe/ • Instituto Nacional de Estadística e Informática INEI. http://www.inei.gob.pe/

Ministerio de Trabajo y Promoción del Empleo. http://www.mintra.gob.pe/

Page 11: 2015 Separata

12 Estadística Básica con Aplicaciones en Excel 2010

Variable

Variable

Se define así a una característica que presentan los elementos de una población y que puede asumir diferentes valores cuando se realiza su medición

Variables cualitativas

Son aquellas variables que al ser medidas

quedan expresadas por etiquetas o nombres que se utilizan para

identificar una característica o atributo.

Variables cuantitativas

Son aquellas variables que al ser medidas quedan expresadas por números que se utilizan para

identificar una característica o atributo.

Estas a su vez pueden clasificarse en discretas o continuas.

Variable cuantitativa

discreta

Es aquella variable cuyo número de posible de

valores es finito o infinito numerable; es decir, que sólo puede tomar ciertos valores en un intervalo

determinado.

Variable cuantitativa

continua

Es aquella variable cuyo número posible de

valores es infinito no numerable, es decir, que puede tomar cualquier valor en un intervalo

determinado.

En una variable continua, para dos valores

cualesquiera, siempre se puede encontrar un tercer

valor entre los dos primeros.

Page 12: 2015 Separata

Capítulo 1. Organización de datos 13

Ejemplos de variables

Las siguientes variables corresponden a una encuesta aplicada a un postulante de una agencia pu-blicitaria:

Ejemplo 3 El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La Gerencia General desea invertir en publicidad para incrementar la cantidad de huéspedes extranjeros en el hotel. Para conocer qué características del hotel es conveniente resaltar en la publicidad se aplicó una encuesta a una muestra aleatoria de 56 mujeres y 59 hombres extranjeros que se hospedaron en-tre enero y mayo del presente año. A continuación se presenta parte de la base de datos:

N° Edad Género País de

procedencia

Precio dispuesto a pagar por

habitación, en dólares

Número de acompañantes

por viaje

Criterio de selección del hotel

1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio

2 35 Femenino Argentina 60 2 Precio

3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas

4 65 Masculino Francia 45 0 Precio

5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados

6 28 Masculino Estados Unidos 65 2 Precio

Identifique cada una de las variables que se presenta en la base de datos según su tipo.

Solución

Variable Tipo de variable

Edad Cuantitativa continua

Género Cualitativa

País de procedencia Cualitativa

Precio dispuesto a pagar por habitación, en dólares Cuantitativa continua

Número de acompañantes por viaje Cuantitativa discreta

Criterio de selección del hotel Cualitativa

Variable

Cualitativa

Lugar de nacimiento

Grado de instrucción

Cuantitativa discreta

Número de capacitaciones llevadas en el presente año

Número de hijos

Cuantitativa continua

Tiempo de demoran para trasladarse de

su casa al trabajo (en minutos)

Salario actual (en nuevos

soles)

Page 13: 2015 Separata

14 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 4

Los clientes que se suscriben a la revista “Economía al Día” deben llenar un formato con informa-ción personal. Identifique el tipo de variable.

Variable Tipo de variable

Género

Profesión

Distrito donde vive

Ingreso mensual familiar (en nuevos soles)

Grado de instrucción

Número de teléfono

Estado civil

Ejercicio 5

El gerente de una red de librerías, con sucursales en Santiago de Surco, San Borja y San Luis ha ob-servado que en los últimos meses las ventas han disminuido, y desea conocer los factores que ori-ginan este problema. Por ello, realizó una encuesta a 210 clientes seleccionados aleatoriamente de todas las sucursales. Algunas de las variables recolectadas mediante la encuesta son las siguientes:

Ingreso mensual familiar (en nuevos soles)

Distrito de residencia

Número de hijos en edad escolar

Nivel de satisfacción con la atención recibida (muy buena, buena, mala, muy mala)

a. Del enunciado anterior identifique la población en estudio, la muestra y la unidad elemental.

Población

Muestra

Unidad elemental

b. Identifique las variables en estudio con su respectivo tipo.

Variable Tipo de variable

Ingreso mensual familiar (en nuevos soles)

Distrito de residencia

Número de hijos en edad escolar

Nivel de satisfacción con la atención recibida

Page 14: 2015 Separata

Capítulo 1. Organización de datos 15

Escalas de medición

La medición de una variable consiste en asignar un valor a la

característica observada.

Por ejemplo, si la característica observada es el

género de las personas, hacemos una medición de la característica y le asignamos

un valor, el de femenino.

El proceso de medición utiliza las escalas: nominal, ordinal, intervalo y razón.

•Sólo permite asignar un nombre, etiqueta o valor al elemento sometido a medición.

•Los números que se puedan asignar a las propiedades de los elementos se utilizan sólo como etiquetas con la finalidad de clasificarlos.

•Con esta escala no tiene sentido realizar operaciones aritméticas.

Nominal

•Los datos son etiquetas y además el orden es significativo.

•Los datos se pueden ordenar en forma ascendente o descendente, de tal manera que puedan expresar grados de la característica medida.

Ordinal

•Además de asignar un nombre o etiqueta y establecer un orden entre los elementos, esta escala permite calcular diferencias entre los números asignados a las mediciones (el intervalo entre observaciones que se expresa en términos de una unidad fija de medida).

•Los datos son numéricos.

Intervalo

•Los datos tienen todas las propiedades de los datos de intervalo y el cociente de los dos valores es significativo.

•Tiene un punto cero absoluto, es decir, el cero indica la ausencia de la característica medida.

•Se puede realizar las operaciones aritméticas a los números asignados.

Razón

Page 15: 2015 Separata

16 Estadística Básica con Aplicaciones en Excel 2010

Ejemplos de variables y sus escalas de medición

•El género de las personas

•La marca de celular

•La línea aérea de su preferencia

•La religión que profesa una persona

•El número de DNI

•……………………………..........………………

•………………………………………..........……

Nominal

•El orden de mérito de los alumnos de la UPC

•El grado académico de los empleados de un banco

•La opinión sobre la atención en un supermercado (bueno, regular, malo)

•……………………………..….............................

Ordinal

•Las escalas de la temperatura. Por ejemplo, T(°F) = 1.8 x T(°C) + 32

•El año 2000 fue 2753 en el calendario romano, 2749 en el calendario babilónico, 6236 en el egipcio, 2544 en el budista, 5119 en el maya

•La ubicación en una carretera respecto de un punto de referencia

•………………………...........……………………

Intervalo

•El sueldo de los trabajadores de un banco

•La altura de una persona.

•La velocidad de un auto en la carretera

•……………………………………………………………

•………………………………………..…….………......

Razón

Page 16: 2015 Separata

Capítulo 1. Organización de datos 17

Ejemplo 4 El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La gerencia general desea invertir en publicidad para incrementar la cantidad de huéspedes extranjeros en el hotel. Para conocer qué características del hotel es conveniente resaltar en la publicidad se aplicó una encuesta a una muestra aleatoria de 56 mujeres y 59 hombres extranjeros que se hospedaron en-tre enero y mayo del presente año. A continuación se presenta parte de la base de datos:

N° Edad Género País de

procedencia

Precio dispuesto a pagar por

habitación, en dólares

Número de acompañantes

por viaje

Criterio de selección del hotel

1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio

2 35 Femenino Argentina 60 2 Precio

3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas

4 65 Masculino Francia 45 0 Precio

5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados

6 28 Masculino Estados Unidos 65 2 Precio

7 45 Femenino Estados Unidos 60 1 Precio

8 85 Masculino China 70 2 Precio

9 25 Masculino Inglaterra 65 3 Limpieza del dormitorio

10 35 Femenino Francia 45 1 Precio

11 20 Masculino Estados Unidos 55 2 Amigable y cordial staff de empleados

Identifique el tipo y la escala de medición de cada una de las variables que se presenta en la base de datos.

Solución

Variable Tipo de variable Escala de medición

Edad Cuantitativa continua Razón

Género Cualitativa Nominal

País de procedencia Cualitativa Nominal

Precio dispuesto a pagar por habitación, en dólares

Cuantitativa continua Razón

Número de acompañantes por viaje Cuantitativa discreta Razón

Criterio de selección del hotel Cualitativa Nominal

Page 17: 2015 Separata

18 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 6

Indique el tipo y la escala de medición que corresponde a cada una de las siguientes variables.

Variable Tipo de variable Escala de medición

Edad

Marca de automóvil

Número de personas a favor de la pena de muerte

Ventas anuales (en dólares)

Tamaño de bebida (pequeño, mediano, grande)

Ejercicio 7

La Oficina de Turismo de Cusco recopila datos sobre los turistas que llegan a la ciudad. Entre las 16 preguntas de un cuestionario que se repartió a los pasajeros en los vuelos de llegada durante el mes pasado figuraban, entre otras, las siguientes:

Esta visita a Cusco es la: ___________________ vez. (1°, 2°, 3°, etc.)

El motivo principal de este viaje es: _______________ (16 categorías incluyendo vacaciones, trabajo, etc.)

Voy a estar alojado en: ________________ (11 categorías incluyendo hotel, apartamento, pa-rientes, etc.)

Mi estadía en Cusco va a durar: ________ días. Identifique el tipo y la escala de medición de cada una de las variables:

Variable Tipo de variable Escala de medición

Page 18: 2015 Separata

Capítulo 1. Organización de datos 19

Parámetro y estimador

Algunos parámetros y estadísticos importantes

Nombre

Notación

Parámetro Estadístico

Media

N

xN

ii

1 n

x

x

n

i

i 1

Varianza

N

xN

ii

1

2

2

11

2

2

n

xx

s

n

i

i

Desviación estándar 2 2ss

Proporción N

Kp

n

kp ˆ

Moda Mo mo

Parámetro

Representa , en valor

numérico, la característica

de la población.

Para obtener su valor se

hace necesario contar con

toda la información que brindan

los elementos de una

población.

Estimador

Representa, en valor

numérico, la característica

de una muestra.

Para obtener su valor se

utiliza la información

muestral.

Al valor numérico del

estimador se le conoce como estimación.

Al estimador, se le llama

también estadígrafo o estadístico.

Page 19: 2015 Separata

20 Estadística Básica con Aplicaciones en Excel 2010

Ejemplo 5 Este fue el flash electoral de CPI para las elecciones presidenciales del 2011.

Identifique la variable en estudio, un estadístico para esta variable y el valor del estadístico.

Solución

Variable en estudio: candidato de preferencia

Estadístico para esta variable: proporción del candidato de preferencia

El valor del estadístico es: 52,5% prefiere a Ollanta Humala y 47,5% prefiere a Keiko Fujimori. Ejemplo 6 El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La gerencia general desea invertir en publicidad para incrementar la cantidad de huéspedes extranjeros en el hotel. Desea conocer qué características del hotel es conveniente resaltar en la publicidad, para ello apli-có una encuesta a una muestra aleatoria de 56 mujeres y 59 hombres extranjeros que se hospeda-ron entre enero y mayo del presente año. A continuación, se presenta parte de la base de datos:

N° Edad Género País de

procedencia

Precio dispuesto a pagar por

habitación en dólares

Número de acompañantes

por viaje

Criterio de selección del hotel

1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio

2 35 Femenino Argentina 60 2 Precio

3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas

4 65 Masculino Francia 45 0 Precio

5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados

6 28 Masculino Estados Unidos 65 2 Precio

7 45 Femenino Estados Unidos 60 1 Precio

8 85 Masculino China 70 2 Precio

9 25 Masculino Inglaterra 65 3 Limpieza del dormitorio

10 35 Femenino Francia 45 1 Precio

11 20 Masculino Estados Unidos 55 2 Amigable y cordial staff de empleados

Page 20: 2015 Separata

Capítulo 1. Organización de datos 21

Después de procesar la información se obtuvieron los siguientes resultados:

El 34% de los huéspedes extranjeros procede de los Estados Unidos.

La edad promedio de los huéspedes es de 35,2 años.

El número de acompañantes por huésped extranjero más frecuente es de dos personas.

El criterio de selección más frecuente es el precio. Identifique el estimador y el valor del estimador para cada una de las variables de la base de datos.

Solución

Variable Estimador Notación Valor del estimador

Lugar de procedencia Proporción EEUUp 0,34

Edad de los huéspedes Promedio x 35,2 años

Número de acompañantes Moda mo 2

Criterio de selección del hotel Moda mo Precio

Ejercicio 8

Un banco estatal ha estudiado la información que dieron sus clientes en el mes de marzo al solicitar un préstamo vehicular. Al seleccionar una muestra de 180 clientes algunos resultados fueron:

• El 12% declaró tener un trabajo independiente. • La edad promedio de los clientes al solicitar un préstamo fue de 41,3 años. • El 50% declaró ser casado. • El monto promedio de las solicitudes fue de 3025 nuevos soles. Identifique el estimador y el valor del estimador para cada una de las variables.

Solución

Variable Estimador Notación Valor

Page 21: 2015 Separata

22 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 9

Como parte de un estudio de mercado se aplicó este año una encuesta a un grupo de 245 estudian-tes de la universidad A. Se sabe que en esta universidad el 72% del alumnado pertenece al área de Humanidades y el resto al área de Ciencias. Después de procesar la información se obtuvo que 56% de los encuestados era de sexo femenino, el 33,2% de los encuestados prefiere el rock como género musical, el 45,7% gusta de la emisora 104.7 VIVA F.M. Se sabe, además, que la media del número de veces que un oyente llamó a la radio en el último mes fue de 2,86 llamadas y la moda de esa misma variable fue igual a uno. Identifique el estimador o parámetro y su valor para cada una de las variables.

Solución

Variable Parámetro o estimador Notación Valor

Page 22: 2015 Separata

Capítulo 1. Organización de datos 23

Ejercicios de aplicación

1. Conteste las siguientes preguntas justificando adecuadamente las respuestas:

a. ¿Qué diferencias existe entre la escala de intervalos y la escala de razón? Muestre ejemplos que sustenten su respuesta.

b. ¿Qué diferencia existe entre dato y observación? Muestre ejemplos que sustenten su res-puesta.

2. Se quiere estimar el ingreso mensual de los niños y adolescentes que viven en Iquitos. Identifi-que la población, la muestra, el elemento y la variable en estudio.

Población

Muestra

Elemento

Variable

3. La entidad bancaria Tubanco tiene presencia en Lima y Callao. Cuenta actualmente con 9 784 clientes distribuidos en diferentes agencias. Su gerente general desea determinar la situación de la entidad y la de sus clientes. Para ello, seleccionó una muestra de 120 clientes que solicita-ron préstamo durante el último semestre. Parte de la base de datos correspondiente a la muestra se presenta a continuación:

Número de

tarjetas

Edad del cliente (años)

Tipo de préstamo

Monto del préstamo

(en dólares)

Número de cuo-tas del préstamo

(meses)

Tipo de mone-da del présta-

mo

Giro del negocio

1 53 Capital trabajo 5000 6 Soles Bodega

3 36 Cuota fija 1500 12 Soles Restaurante

5 54 Cuota fija 4500 18 Soles Abarrotes

2 45 Mi local 12000 36 Soles Abarrotes

4 43 Mi local 6000 36 Dólares Mueblería

a. De acuerdo con el enunciado identifique la población, la muestra y la unidad elemental. b. Identifique un ejemplo de dato y uno de observación. c. Para cada una de las variables identifique su tipo y escala de medida. d. ¿Qué estadístico puede calcularse para la variable Monto del préstamo y cuál para la varia-

ble Tipo de préstamo?

4. Fernando, estudiante de administración, tiene la labor de conseguir información acerca de los turistas que llegaron a la ciudad del Cusco. En su búsqueda, encontró que la agencia de viajes Turismo Perú realizó un estudio a sus 15 000 turistas extranjeros que llegaron al Cusco el año pasado. Como parte de la información encontró que todos hablaban más de un idioma, el 35% eran americanos y el gasto promedio que hicieron en la ciudad fue de 2 000 nuevos soles.

Page 23: 2015 Separata

24 Estadística Básica con Aplicaciones en Excel 2010

De acuerdo con el enunciado anterior: a. Identifique la población, la muestra y la unidad elemental. b. Para cada una de las variables identifique su tipo y escala de medida. c. Mencione dos parámetros y un estadígrafo de utilidad para cada variable.

5. Una entidad estatal realizó un estudio para determinar algunos indicadores socioeconómicos de los inmigrantes peruanos en Estados Unidos. El estudio se llevó a acabo aplicando encuestas a una muestra de 400 inmigrantes peruanos. Algunas de las preguntas del cuestionario fueron las siguientes:

Nivel educativo alcanzado en el Perú.

Monto enviado (en dólares) el último mes a sus familiares en el Perú.

¿Presenta alguno de los siguientes problemas? (indocumentado, discriminado, vivienda no adecuada, salud y otros).

Número de veces que ha visitado el Perú desde que viajó por primera vez a los Estados Unidos.

a. De acuerdo con el enunciado anterior identifique la población y la muestra. b. Para las respuestas generadas por cada una de las preguntas mostradas identifique el tipo

de variable y su respectiva escala de medida. c. Para cada una de las variables, proponga el estadístico más adecuado.

6. Edificar es una empresa dedicada al rubro de la construcción que ha crecido notablemente durante el último año. El gerente de Recursos Humanos ha recibido algunas quejas de los tra-bajadores y antes este problema ha decidido estudiar la situación laboral de los trabajadores para obtener algunas medidas de interés que le permita tomar algunas decisiones. Al seleccio-nar una muestra de 115 trabajadores obtuvo la siguiente información:

Trabajador Género Edad

(en años) Número de hijos

Cargo Ingreso mensual (en nuevos soles)

Motivo de la queja

1 M 32 1 Maestro de obra 2862 Mal remunerado

2 M 32 2 Peón 742 Sin bonificación

3 M 25 0 Oficial 2256 Sin horas extras

4 F 21 0 Operario 1696 Mal trato

115 M 37 3 Oficial 1438 Mal remunerado

De acuerdo con el enunciado anterior: a. Identifique la población, la muestra y la unidad elemental. b. Para cada una de las variables, proponga el estadístico más adecuado que ayude al gerente. c. Complete la siguiente tabla:

Variable en estudio Tipo de variable Escala de medida

Ingreso mensual (en nuevos soles)

Razón

Nominal

Cuantitativa discreta

Page 24: 2015 Separata

Capítulo 1. Organización de datos 25

Organización y presentación de datos

Luego de aplicar una encuesta a una muestra de treinta empleados, una empresa obtiene la si-guiente base de datos. Se pide redactar un informe que resuma la información.

Tabla. Datos sobre satisfacción laboral

Género Función Edad

Tiempo en la empre-

sa

Ingreso anual

Número de promocio-

nes

Promoción posible

Número de capacitaciones

Relación con la gerencia

Femenino Obrero 19 1 11 400 0 Improbable 1 Buenas

Masculino Profesional 31 5 210 600 2 No está seguro 2 Buenas

Masculino Profesional 34 8 193 400 1 Probable 2 Buenas

Masculino Servicios 36 15 30 800 1 Improbable 0 Buenas

Masculino Obrero 44 4 9 850 0 Improbable 1 Regulares

Masculino Obrero 44 10 9 800 0 Improbable 1 Regulares

Masculino Técnico/ventas 31 5 40 840 0 Improbable 3 Buenas

Femenino Profesional 37 8 93 700 1 No está seguro 2 Buenas

Masculino Obrero 45 23 10 150 0 Improbable 1 Regulares

Masculino Obrero 54 18 9 050 0 Muy improbable 1 Regulares

Femenino Profesional 26 2 62 200 2 No está seguro 2 Buenas

Masculino Obrero 44 14 10 200 0 Probable 0 Regulares

Masculino Técnico/ventas 31 2 40 335 0 Muy improbable 2 Buenas

Femenino Producción 28 10 30 990 1 Muy improbable 1 Buenas

Femenino Obrero 23 5 9 360 1 Muy improbable 1 Buenas

Femenino Producción 38 20 33 800 0 Muy improbable 1 Buenas

Masculino Producción 38 9 35 500 1 Muy improbable 2 Buenas

Masculino Técnico/ventas 32 2 40 540 0 Improbable 2 Buenas

Masculino Servicios 36 18 27 500 1 Muy improbable 1 Buenas

Femenino Obrero 48 25 10 200 0 Muy improbable 1 Buenas

Masculino Obrero 45 20 9 650 0 Improbable 1 Regulares

Femenino Técnico/ventas 22 2 44 000 0 No está seguro 2 Buenas

Masculino Técnico/ventas 32 6 48 560 1 Improbable 2 Buenas

Masculino Obrero 46 20 10 300 0 Muy improbable 1 Regulares

Masculino Profesional 28 1 108 700 3 Improbable 5 Buenas

Femenino Producción 27 5 30 550 1 Muy improbable 2 Buenas

Masculino Producción 38 14 32 300 0 Muy improbable 1 Buenas

Masculino Obrero 40 20 9 130 0 No está seguro 0 Regulares

Masculino Profesional 24 1 70 000 1 Probable 3 Buenas

Masculino Obrero 56 30 9 740 0 Muy improbable 1 Regulares

¿Qué podemos hacer para resumir esta información?

Una vez recopilada la información, con las variables consideradas de mayor importancia, el siguiente paso es presentarla a través de una tabla de frecuencias o un gráfico que describa adecuadamente las características más importantes.

Page 25: 2015 Separata

26 Estadística Básica con Aplicaciones en Excel 2010

Distribución de frecuencias

Frecuencias absolutas, relativas y porcentuales

La frecuencia absoluta (fi ) de una clase es la cantidad de elementos que pertenecen a esa cla-se.

La frecuencia relativa (hi ) de una clase es la proporción de elementos que pertenecen a esa clase.

n

f

datos de número

absoluta frecuenciahrelativa Frecuencia i

i

La frecuencia porcentual (pi) de una clase es la frecuencia relativa multiplicada por 100%.

%100 ii hpporcentual Frecuencia

Ejemplo

Tomado de Revista Peruana de Epidemiología. Prácticas laborales de riesgo en cultivadores de arroz del valle del Alto Mayo, Región San Martín, Perú. Romina Tejada Caminiti, Franco Romaní Romaní, Paolo Wong Chero, Jorge Alarcón Villaverde. Junio 2011 http://rpe.epiredperu.net/rpe_ediciones/2011_V15_N01/AO8_Vol15_No1_2011_Tb1.gif.

Es el resumen de un conjunto de datos,

presentado en una tabla llamada la tabla de

distribución de frecuencias

Esta tabla muestra las frecuencias absolutas, las frecuencias relativas y los

porcentajes

Las categorías o clases no se traslapan.

Page 26: 2015 Separata

Capítulo 1. Organización de datos 27

Elementos de un cuadro estadístico

Una tabla de frecuencias o cuadro estadístico debe presentar los siguientes elementos básicos:

Elementos de un gráfico estadístico

La presentación gráfica de la información permite, en la mayoría de casos, obtener conclusiones descriptivas del comportamiento de la variable que se está analizando.

Page 27: 2015 Separata

28 Estadística Básica con Aplicaciones en Excel 2010

Tabla de frecuencias para variables cualitativas

La distribución de frecuencias es un cuadro que se calcula de la siguiente manera.

Título: ……………………………………………………………..…………….

Categorías Frecuencia absoluta fi Frecuencia relativa hi

Categoría 1 f1 n

fh 1

1

Categoría 2 f2 n

fh 2

2

… … …

Categoría k fk n

fh k

k

Fuente: ……………………………………..

Tabla de frecuencias para variables cualitativas en Excel

• Asegúrese que cada columna represente una variable en estudio.

• Ubique el cursor en cualquier celda de los datos.

• Haga clic en la opción Insertar de la barra de menú.

• Seleccione Tabla dinámica y haga clic en Aceptar,

• Arrastre la variable de la cual desea el cuadro a la zona de Etiquetas de fila y también a la zona de ∑ Valores.

• Copie la tabla sin incluir los títulos, en otra celda.

• Calcule la frecuencia relativa (hi)

Se deberá presentar en la tabla las diferentes categorías que asume la variable cualitativa y en la columna de las frecuencias absolutas la cantidad de veces que se repite esta categoría de la

variable.

Si la medición está hecha en escala nominal sólo deberá mostrarse las frecuencias

absolutas y relativas.

Para elaborar el gráfico de Pareto es necesario que la tabla de distribución de frecuencias presente los valores de las frecuencias acumuladas, absolutas y

relativas, con la finalidad de elaborar la curva creciente .

Si la variable cualitativa está medida en escala ordinal, tendrá sentido mostrar las

frecuencias acumuladas absolutas y relativas.

Page 28: 2015 Separata

Capítulo 1. Organización de datos 29

Ejemplo 7 La universidad América realizó una encuesta a 30 jóvenes que están terminando el colegio con la finalidad de conocer sus preferencias profesionales. Los datos obtenidos se presentan a continua-ción:

Derecho Periodismo Ingeniería Administración Derecho

Ingeniería Futbolista Chef Ingeniería Administración

Periodismo Ingeniería Periodismo Chef Periodismo

Administración Chef Futbolista Administración Ingeniería

Derecho Chef Ingeniería Derecho Futbolista

Ingeniería Ingeniería Chef Chef Administración

a. Obtenga la tabla de distribución de frecuencia. b. Interprete la frecuencia absoluta y la frecuencia relativa de la tercera categoría.

Solución

a. Obtenga la tabla de distribución de frecuencia.

Distribución de estudiantes de acuerdo a su preferencia profesional

Preferencia profesional fi hi pi

Administración 5 0,1667 16,67%

Chef 6 0,2000 20,00%

Derecho 4 0,1333 13,33%

Futbolista 3 0,1000 10,00%

Ingeniería 8 0,2667 26,67%

Periodismo 4 0,1333 13,33%

Total general 30 1,0000 100,00% Fuente: universidad América. 2013

b. Interprete la frecuencia absoluta y la frecuencia relativa de la tercera categoría.

f3 = de un total de treinta jóvenes, cuatro prefieren la carrera de Derecho.

p3 = el 13,3% de los jóvenes prefieren el Derecho como carrera profesional.

Page 29: 2015 Separata

30 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 10

Luego de aplicar una encuesta a una muestra de treinta empleados, la empresa Motores S.A. desea obtener información acerca de la distribución de sus trabajadores de acuerdo a su Función. Los datos se presentan a continuación:

Obrero Profesional Profesional Servicios Obrero Obrero

Profesional Obrero Técnico/ventas Producción Obrero Producción

Obrero Técnico/ventas Técnico/ventas Obrero Profesional Producción

Obrero Obrero Obrero Profesional Servicios Obrero

Técnico/ventas Obrero Técnico/ventas Producción Producción Profesional

a. Presente la tabla de distribución de frecuencias. b. Interprete la frecuencia absoluta y la frecuencia relativa de la primera categoría.

Solución

a. Presente la tabla de distribución de frecuencias.

Título: ……………………………………………………………………………………………….

Función fi hi pi

Obrero

Producción

Profesional

Servicios

Técnico/ventas

Total general

Fuente: ……………………………………………………………………………

b. Interprete la frecuencia absoluta y la frecuencia relativa de la primera categoría.

f1 = de un total de ……….……. trabajadores, ………………. son …………………………… p1 = el ……….……% de los trabajadores son ……………………………………………….……

Page 30: 2015 Separata

Capítulo 1. Organización de datos 31

Representación gráfica de variables cualitativas

Gráfico de barras

En el eje horizontal se representa las categorías de la variable y en el eje de ordenadas las frecuen-cias absolutas, relativas o porcentuales.

Gráfico de barras en Excel

• Seleccione las celdas de la variable y de la de frecuencia absoluta o relativa. Use la tecla Ctrl si necesita seleccionar celdas no contiguas.

• Haga clic en la opción Insertar de la barra de menú y active el icono Columnas. Seleccione la opción Columna y presione Aceptar.

• Elimine la leyenda que aparece en el lado derecho del gráfico.

• Haga doble clic en el área del gráfico, aparecerá una pestaña de Herramientas de gráficos con las opciones: Diseño, Presentación y Formato. Seleccione Presentación, luego escoja los boto-nes Título de gráfico, Rótulo del eje o Etiquetas de datos para darle el formato deseado a su gráfico.

• Para cambiar a porcentaje los valores del eje vertical haga doble clic en el eje vertical, seleccio-ne la opción Número y haga clic en Porcentaje.

Page 31: 2015 Separata

32 Estadística Básica con Aplicaciones en Excel 2010

Ejemplo 8

La universidad América realizó una encuesta a 30 jóvenes que están terminando el colegio con la finalidad de conocer sus preferencias profesionales. Los datos obtenidos se presentan a continua-ción:

Derecho Periodismo Ingeniería Administración Derecho

Ingeniería Futbolista Chef Ingeniería Administración

Periodismo Ingeniería Periodismo Chef Periodismo

Administración Chef Futbolista Administración Ingeniería

Derecho Chef Ingeniería Derecho Futbolista

Ingeniería Ingeniería Chef Chef Administración

Presente el gráfico de barras porcentuales para los datos.

Solución

Interpretación Del gráfico se puede observar que el 26,7% de los estudiantes prefieren la carrera de Ingeniería mientras que el 10% prefiere la carrera de futbolista.

26.7%

20.0%

16.7%

13.3% 13.3%

10.0%

0%

5%

10%

15%

20%

25%

30%

Ingeniería Chef Administración Derecho Periodismo Futbolista

Po

rce

nta

je d

e a

lum

no

s

Preferencia profesional

Distribución de estudiantes que culminan el colegio de acuerdo a su preferencia profesional

Fuente: Universidad América. 2013

Page 32: 2015 Separata

Capítulo 1. Organización de datos 33

Ejercicio 11

Luego de aplicar una encuesta a una muestra de treinta empleados, la empresa Motores S.A. desea obtener información acerca de la distribución de sus trabajadores de acuerdo a su función. Los datos se presentan a continuación:

Obrero Profesional Profesional Servicios Obrero Obrero

Profesional Obrero Técnico/ventas Producción Obrero Producción

Obrero Técnico/ventas Técnico/ventas Obrero Profesional Producción

Obrero Obrero Obrero Profesional Servicios Obrero

Técnico/ventas Obrero Técnico/ventas Producción Producción Profesional

Realice e interprete el gráfico de barras porcentuales.

Solución

Interpretación

0

2

4

6

8

10

12

14

Obrero Producción Profesional Servicios Técnico/ventas

Función

Cuenta de Preferencia

Fuente: ..........................................................

Page 33: 2015 Separata

34 Estadística Básica con Aplicaciones en Excel 2010

Gráfico circular

En este caso las categorías de la variable cualitativa ocupan un espacio en el círculo que es propor-cional a la frecuencia que representan. También se denomina diagrama de sector circular, gráfico tipo torta o pastel. Si la variable cualitativa es de escala ordinal se recomienda usar el gráfico de barras

Gráfico circular en Excel

• Seleccione las columnas de la variable y la de frecuencia absoluta o relativa . Use la tecla Ctrl si necesita seleccionar celdas no contiguas.

• Haga clic en la opción Insertar de la barra de menú y active el icono Circular. Seleccione la op-ción Circular y presione Aceptar.

• Haciendo doble clic en el área del gráfico, aparecerá una pestaña de Herramientas de gráficos

con las opciones: Diseño, Presentación y Formato. • Seleccione Presentación y escoja el botón Título de gráfico y Etiquetas de datos.

Page 34: 2015 Separata

Capítulo 1. Organización de datos 35

Ejemplo 9

La universidad América realizó una encuesta a 30 jóvenes que están terminando el colegio con la finalidad de conocer sus preferencias profesionales. Los datos obtenidos se presentan a continua-ción:

Derecho Periodismo Ingeniería Administración Derecho

Ingeniería Futbolista Chef Ingeniería Administración

Periodismo Ingeniería Periodismo Chef Periodismo

Administración Chef Futbolista Administración Ingeniería

Derecho Chef Ingeniería Derecho Futbolista

Ingeniería Ingeniería Chef Chef Administración

Presente el gráfico circular.

Solución

Interpretación Del gráfico se puede observar que el 26,7% de los estudiantes prefieren la carrera de Ingeniería y solo el 10% prefiere la carrera de Derecho.

Administración 17%

Chef 20%

Derecho 13%

Futbolista 10%

Ingeniería 27%

Periodismo 13%

Distribución de estudiantes de acuerdo a su preferencia profesional

Fuente: Universidad América. 2013

Page 35: 2015 Separata

36 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 12

Luego de aplicar una encuesta a una muestra de treinta empleados, la empresa Motores S.A. desea obtener información acerca de la distribución de sus trabajadores de acuerdo a su función. Los datos se presentan a continuación:

Obrero Profesional Profesional Servicios Obrero Obrero

Profesional Obrero Técnico/ventas Producción Obrero Producción

Obrero Técnico/ventas Técnico/ventas Obrero Profesional Producción

Obrero Obrero Obrero Profesional Servicios Obrero

Técnico/ventas Obrero Técnico/ventas Producción Producción Profesional

Realice e interprete el gráfico circular.

Solución

Interpretación

Fuente: ..........................................................

Page 36: 2015 Separata

Capítulo 1. Organización de datos 37

Diagrama de Pareto

El diagrama de Pareto permite ver que, en muchos casos, pocos factores pueden producir la mayo-ría de las consecuencias, lo que se podría resumir como “pocos factores son vitales y muchos son triviales”. Por ejemplo, en control de calidad, se puede mostrar que la mayoría de los defectos sur-gen de un número pequeño de causas.

Los pasos para realizar un diagrama de Pareto son los siguientes:

Diagrama de Pareto en Excel

Elija Insertar del menú principal y como tipo de gráfico Columna.

Haga clic derecho en cualquiera de las barras Hi y haga clic en Cambiar tipo de gráfico en serie y elija tipo de gráfico Líneas y presione Aceptar.

Haga clic derecho sobre el eje Y. Seleccione Dar formato a eje. Elija Opciones del eje y en Máxima ponga el valor 1 en Fija.

Haga clic derecho sobre cualquiera de los puntos de la línea y elija la opción Dar Formato de serie de datos... En el recuadro Opciones de serie, seleccione Eje secundario.

Haga clic derecho sobre el eje Y derecho. Seleccione Dar formato a eje. Elija Opciones del eje y en Máxima ponga el valor 1 en Fija.

Haga clic sobre el gráfico y seleccione Título de gráfico, Rótulos del eje y Etiquetas de datos para dar el formato al gráfico.

Construya la tabla de distribución de frecuencias, ordenando las categorías en forma descendente

respecto de la frecuencia absoluta o relativa.

De existir la categoría Otros colóquela en la última

posición.

Grafique dos ejes verticales

y un eje horizontal.

En el eje vertical

derecho, use una

escala de 0% a 100%.

En el eje vertical izquierdo, marque una escala de:

•0 hasta el número total de observaciones, si usa las frecuencias absolutas

•0 a 100%, si usa las frecuencias porcentuales

En el eje horizontal, marque los espacios donde estarán dibujadas las barras para cada una de las

categorías, incluida la categoría Otros.

Elabore el diagrama de barras y dibuje la línea de frecuencias acumuladas

(curva de Pareto).

Page 37: 2015 Separata

38 Estadística Básica con Aplicaciones en Excel 2010

Ejemplo 10 En el cuadro se muestran, según la página web de la Oficina Nacional de Procesos Electorales, los resultados de las elecciones presidenciales del 2011 en el Perú. Elabore el diagrama de Pareto co-rrespondiente. Agrupe en la categoría Otros a los candidatos que obtuvieron menos del 1%.

Organización política Votos Organización política Votos

Gana Perú 4,643,064 Despertar Nacional 21,574

Fuerza 2011 3,449,595 Adelante 17,301

Alianza por el Gran Cambio 2,711,450 Fuerza Nacional 16,831

Perú Posible 2,289,561 Justicia, Tecnología, Ecología 11,275

Alianza Solidaridad Nacional 1,440,143 Partido Descentralista Fuerza Social 9,358

Fonavistas del Perú 37,011

Solución

Ordene las categorías en orden decreciente. La categoría Otros siempre va al final independien-temente de su valor.

Calcule las frecuencias porcentuales (pi ) y las porcentuales acumuladas (Pi )

Distribución de los encuestados según organización política

Organización política Votos pi Pi

Gana Perú 4,643,064 31,70% 31,70%

Fuerza 2011 3,449,595 23,55% 55,25%

Alianza por el Gran Cambio 2,711,450 18,51% 73,76%

Perú Posible 2,289,561 15,63% 89,39%

Alianza Solidaridad Nacional 1,440,143 9,83% 99,23%

Otros 113,350 0,77% 100,00% Fuente: Web de la Oficina de Procesos Electores ONPE

El resultado debe ser:

Page 38: 2015 Separata

Capítulo 1. Organización de datos 39

Del gráfico, vemos que el 73,76% de las personas votó por las organizaciones políticas Gana Perú, Fuerza 2011 y Alianza por el gran cambio.

Ejercicio 13

Tito´s, empresa de venta de comida rápida por delivery, desea elevar el nivel de satisfacción de sus clientes. Para ello, llevó a cabo una encuesta por teléfono entre 100 clientes que realizaron pedidos durante el último mes. Las quejas manifestadas por estos clientes se resumen a continuación:

Quejas hi

Tiempo de entrega del pedido 0,40

Calidad del producto entregado 0,15

Error en el pedido 0,20

Otros 0,10

Cordialidad del empleado 0,10

No existe variedad 0,03

Precio 0,02

a. Presente la tabla de distribución de frecuencias. b. Complete el gráfico mostrado con los valores y títulos apropiados. c. ¿Qué recomendaría al gerente de esta empresa de venta de comida rápida por delivery según el

gráfico obtenido?

Solución

a. Presente la tabla de distribución de frecuencias.

Título: …………………………………………………………………………………………………………………………….

Quejas fi hi Hi

Tiempo de entrega del pedido

Error en el pedido

Calidad del producto entregado

Cordialidad del empleado

No existe variedad

Precio

Otros

Fuente: ………………………………………………………………………………………

Page 39: 2015 Separata

40 Estadística Básica con Aplicaciones en Excel 2010

b. Complete el gráfico mostrado con los valores y títulos apropiados.

Fuente: ………………………………………………………..…………………………………………………

c. ¿Qué recomendaría al gerente de esta empresa de venta de comida rápida por delivery según el

gráfico obtenido?

qqqq

qqqq

Page 40: 2015 Separata

Capítulo 1. Organización de datos 41

Tabulaciones cruzadas

Ejemplo 11 La siguiente tabla muestra el lugar de residencia y el giro de negocio que posee una muestra de clientes de la entidad bancaria Tubanco que solicitaron préstamo durante el primer trimestre año.

Distribución de clientes según lugar de residencia y giro del negocio

Giro del negocio Lugar de residencia

Total Lima Callao

Bodega 18 14 32

Frutería 15 8 23

Ferretería 7 6 13

Boutique 35 22 57

Otros 13 15 28

Total 88 65 153 Fuente: Entidad bancaria Tubanco. Primer trimestre

Complete adecuadamente los espacios en blanco:

a. El ………...….. % de los clientes de Tubanco en la muestra tienen ferretería.

b. El …………….. % de los clientes de Tubanco en la muestra que tienen bodega, son del Callao.

c. El ……..……… % de los clientes de Tubanco en la muestra tienen boutique y son de Lima.

Solución

Dividimos 13/153 = 0,084967, entonces el 8,5% de los clientes de Tubanco en la muestra tienen ferretería.

Dividimos 14/32 = 0,4375, entonces el 43,75% de los clientes de Tubanco en la muestra que tienen bodega, son de una de las agencias del Callao.

Dividimos 35/153 = 0,22875, entonces el 22,9% de los clientes de Tubanco en la muestra tienen boutique y son de una de las agencias de Lima.

Se usan para resumir de manera

simultánea los datos para dos variables.

También son llamadas tablas de contingencia o de

doble entrada.

Cuando hay dos variables, se suele estar interesado en observar si existe algún tipo

de dependencia entra las variables, de forma que una de ellas pudiera explicar el

comportamiento de la otra.

Page 41: 2015 Separata

42 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 14

La tabla que se presenta a continuación fue publicada el mes pasado por el diario Siglo XXI. La en-cuesta se aplicó a una muestra de 805 hogares según nivel socioeconómico (NSE) y área de residen-cia. Los resultados se presentan a continuación:

Distribución de hogares según área de residencia y nivel socioeconómico

Nivel socioeconómico Área de residencia

Total Área urbana Área rural

NSE A 15 2 17

NSE B 48 3 51

NSE C 105 145 250

NSE D 94 175 269

NSE E 38 180 218

Total 300 505 805 Fuente: Diario Siglo XXI

De la tabla anterior, complete los espacios en blanco:

El número de hogares que pertenecen al NSE C o D es de ………………………………

…………………………. hogares pertenecen al NSE C y son del área urbana.

Del total de hogares del área rural, el ………………….% son del NSE E.

Del total de hogares del NSE D, el ……………………..% son del área urbana.

Ejercicio 15

En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadística e Informática se preguntó a todos los peruanos la religión que profesa, obteniéndose los siguientes resultados

Perú. Cuadro sobre religión que se profesa y género

Sexo Religión que profesa

Católica Cristiana - Evangélica Otra Ninguna Total

Hombre 8 379 120 1 200 953 324 445 374 024 10 278 542

Mujer 8 577 602 1 405 102 354 846 234 410 10 571 960

Total 16 956 722 2 606 055 679 291 608 434 20 850 502

Fuente: INEI - Censos Nacionales 2007: XI de Población y VI de Vivienda

Complete los espacios en blanco.

a. El número de cristianos evangélicos en el Perú es …………………..……

b. Del total de peruanos, ………………………………………. son católicos.

c. De …………………………………….. de católicos, ………………………..……………….. son mujeres.

d. El ………….…….% de los hombres peruanos profesa la religión católica.

e. El ………………..% de las peruanas no son cristianas-evangélicas.

f. El ………………..% de los hombres peruanos no profesa religión alguna.

Page 42: 2015 Separata

Capítulo 1. Organización de datos 43

Recomendaciones sobre los títulos de tablas y gráficos

La tabla de doble entrada y su gráfico deben tener el mismo título.

Una manera ordenada de presentarlo es teniendo en cuenta si la tabla de doble entrada corres-ponde al total general o si ella corresponde al total de fila o al total de columna.

Tabulación cruzada en Excel

Ponga el cursor en cualquiera de las celdas de los datos y elija la opción Insertar y luego Tabla dinámica. Luego, seleccione los datos y haga clic en Aceptar

Arrastre una de las variables a la zona de Etiquetas de fila y la otra variable a la zona Etiquetas

de columna.

Luego, arrastre cualquiera de las variables, al campo ∑ valores.

Si la tabla o gráfico corresponde al total general entonces el título debe incluir las dos variables en estudio separadas por la letra y. El orden de

las variables es indistinto.

Si la tabla o gráfico corresponde al total de fila 100% o columna 100%, el título incluye dos

palabras claves: según y por, donde el según determina la variable que va en la leyenda y el

por la variable que totaliza el 100%.

Page 43: 2015 Separata

44 Estadística Básica con Aplicaciones en Excel 2010

Ejemplo 12 El área de Recursos Humanos de una empresa de servicios desea analizar la relación de los trabaja-dores con la gerencia. Después de aplicar una encuesta se obtuvieron los siguientes resultados:

Distribución de trabajadores según su función y relación con la gerencia

Función Relación con la gerencia

Total general Buena Regular Mala

Apoyo/adm. 18 2 0 20

Obrero 10 29 20 59

Profesional 11 6 0 17

Técnico/ventas 19 7 0 26

Total general 58 44 20 122 Fuente: Área de Recursos Humanos.

Solución

Para interpretar los valores de una tabla absoluta cruzada hay que tener en cuenta si el valor que se va a interpretar corresponde a un total de fila, a un total de columna o al valor de una celda. Si deseamos interpretar el valor de una celda hay que tener presente que la celda tiene tres inter-pretaciones dado que existen tres totales, con respecto a su total de fila, con respecto a su total de columna y con respecto al gran total. Para ilustrarlo, tomaremos como ejemplo la tabla anterior.

Interpretación

• Total de fila: valor 59

De un total de 122 trabajadores, 59 son obreros.

• Total de columna: valor 58

De un total de 122 trabajadores, 58 manifiestan tener una buena relación con la gerencia.

• Valor de celda: 10

Con respecto al gran total, de un total de 122 trabajadores, 10 son obreros y manifestaron tener una buena relación con la gerencia.

Con respecto al total de su fila, de un total de 59 obreros, 10 manifestaron tener una buena relación con la gerencia.

Con respecto al total de su columna, de un total de 58 trabajadores que manifestaron tener una buena relación con la gerencia, 10 son obreros.

Page 44: 2015 Separata

Capítulo 1. Organización de datos 45

Para obtener las frecuencias porcentuales respecto al total

Haga clic derecho sobre la celda Cuenta de Relación con la Gerencia.

En el menú despegable escoja Configuración de campo de valor.

Haga clic sobre Mostrar valores como y escoja la opción % del total general.

El resultado debe ser:

Distribución de trabajadores según su función y relación con la gerencia

Interpretación

Del total de trabajadores, - el 48,4% son obreros - el 47,5% manifestaron tener una buena relación con la gerencia. - el 23,8% son obreros y manifestaron tener una regular relación con la gerencia.

Fuente: Área de Recursos Humanos

Para obtener las frecuencias porcentuales respecto al total de filas

Haga clic derecho sobre la celda Cuenta de Relación con la Gerencia.

En el menú despegable escoja Configuración de campo de valor.

Haga clic sobre Mostrar valores como y escoja la opción % del total de filas.

El resultado debe ser:

Distribución de trabajadores según relación con la gerencia por función

Interpretación

Del total de obreros, el 49,2% tiene una regular relación con la gerencia.

Fuente: Área de Recursos Humanos

Para obtener las frecuencias porcentuales respecto al total de columnas

Haga clic derecho sobre la celda Cuenta de Relación con la Gerencia.

En el menú despegable escoja Configuración de campo de valor.

Haga clic sobre Mostrar valores como y escoja la opción % del total de columnas.

El resultado debe ser:

Distribución de trabajadores según función por tipo de relación con la gerencia

Interpretación Del total de trabajadores que tienen una relación regular con la gerencia, el 65,9% son obreros.

Fuente: Área de Recursos Humanos

Función Relación con la gerencia Total

general Buena Regular Mala

Apoyo/adm. 14,8% 1,6% 0,0% 16,4%

Obrero 8,2% 23,8% 16,4% 48,4%

Profesional 9,0% 4,9% 0,0% 13,9%

Técnico/ventas 15,6% 5,7% 0,0% 21,3%

Total general 47,5% 36,1% 16,4% 100,0%

Función Relación con la gerencia Total

general Buena Regular Mala

Apoyo/adm. 90,0% 10,0% 0,0% 100,0%

Obrero 16,9% 49,2% 33,9% 100,0%

Profesional 64,7% 35,3% 0,0% 100,0%

Técnico/ventas 73,1% 26,9% 0,0% 100,0%

Total general 47,5% 36,1% 16,4% 100,0%

Función Relación con la gerencia Total

general Buena Regular Mala

Apoyo/adm. 31,0% 4,6% 0,0% 16,4%

Obrero 17,2% 65,9% 100,0% 48,4%

Profesional 19,0% 13,6% 0,0% 13,9%

Técnico/ventas 32,8% 15,9% 0,0% 21,3%

Total general 100,0% 100,0% 100,0% 100,0%

Page 45: 2015 Separata

46 Estadística Básica con Aplicaciones en Excel 2010

Gráfico de barras comparativas

Gráfico de barras comparativas en Excel

• Seleccione solo las celdas correspondientes a las categorías de ambas variables. No incluya los totales.

• Haga clic en la opción Insertar de la barra de menú y elija Columna/Columna agrupada.

• Haga clic a cualquier línea horizontal del gráfico y observará que todas las líneas horizontales se seleccionan. Presione la tecla Supr de su teclado para eliminarlas.

• Haga clic en el área del gráfico y aparecerá la pestaña Herramientas de gráficos con las opcio-nes: Diseño, Presentación y Formato.

• Seleccione Diseño y elija el estilo que desee haciendo clic en el menú despegable. El estilo 26 (segunda columna fila 4) es el que se presenta como modelo en este material.

• Seleccione ahora la pestaña Presentación, y de ahí escoja los botones Título de gráfico, Rótulo del eje y Etiqueta de datos para darle el formato deseado.

• Haga clic derecho sobre cualquier valor del eje Y y del menú elija Dar formato al eje… /Número/Porcentaje/Posiciones decimales: 0/Cerrar.

• Elimine los valores porcentuales iguales a cero para una mejor presentación.

Page 46: 2015 Separata

Capítulo 1. Organización de datos 47

Gráfico porcentual con respecto al gran total

Distribución de trabajadores según su función y relación con la gerencia

Gráfico porcentual con respecto al total de filas

Distribución de trabajadores según relación con la gerencia por función

Gráfico porcentual respecto al total de columnas

Distribución de trabajadores según su función por tipo de relación con la gerencia

14.8%

8.2% 9.0%

15.6%

1.6%

23.8%

4.9% 5.7%

16.4%

0%

5%

10%

15%

20%

25%

Apoyo/adm. Obrero Profesional Técnico/ventas

Po

rce

nta

je d

e t

rab

ajad

ore

s

Función

Distribución de los trabajadores según su función y relación con la gerencia

Buenas Regulares Malas

90.0%

17.0%

64.7% 73.1%

10.0%

49.2%

35.3% 26.9%

33.9%

0%

20%

40%

60%

80%

100%

Apoyo/adm. Obrero Profesional Técnico/ventas

Po

rce

nta

je d

e t

rab

ajad

ore

s

Función

Distribución de los trabajadores según su relación con la gerencia por función

Buenas Regulares Malas

31%

4.6%

17.2%

65.9%

100%

19%

13.6%

32.8% 15.9%

0%

20%

40%

60%

80%

100%

Buenas Regulares Malas

Po

rce

nta

je d

e t

rab

ajad

ore

s

Relación con la gerencia

Distribución de los trabajadores según su función por tipo de relación con la gerencia

Apoyo/adm. Obrero

Profesional Técnico/ventas

Función Relación con la gerencia Total

general Buena Regular Mala

Apoyo/adm. 14,8% 1,6% 0,0% 16,4%

Obrero 8,2% 23,8% 16,4% 48,4%

Profesional 9,0% 4,9% 0,0% 13,9%

Técnico/ventas 15,6% 5,7% 0,0% 21,3%

Total general 47,5% 36,1% 16,4% 100,0%

Función Relación con la gerencia Total

general Buena Regular Mala

Apoyo/adm. 90,0% 10,0% 0,0% 100,0%

Obrero 17,0% 49,2% 33,9% 100,0%

Profesional 64,7% 35,3% 0,0% 100,0%

Técnico/ventas 73,1% 26,9% 0,0% 100,0%

Función Relación con la gerencia Total

general Buena Regular Mala

Apoyo/adm. 31,0% 4,6% 0,0% 16,4%

Obrero 17,2% 65,9% 100,0% 48,4%

Profesional 19,0% 13,6% 0,0% 13,9%

Técnico/ventas 32,8% 15,9% 0,0% 21,3%

Total general 100% 100% 100% 100,0%

Fuente: Área de Recursos Humanos

Fuente: Área de Recursos Humanos

Fuente: Área de Recursos Humanos

Fuente: Área de Recursos Humanos.

Fuente: Área de Recursos Humanos.

Fuente: Área de Recursos Humanos.

Page 47: 2015 Separata

48 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 16

La estratificación de la población capitalina ha ocasionado que algunos problemas afecten más a ciertos estatus sociales. Cierto S.A, una encuestadora de la capital, realizó durante el último trimes-tre un estudio acerca de los principales problemas que enfrenta la capital. La información resumida se presenta en la siguiente tabla:

Distribución de encuestados según principales problemas de Lima y estatus social

Estatus social Principales problemas de Lima

Total Tráfico Delincuencia Basura

Alto 70 38 12 120

Medio 52 80 14 146

Bajo 48 88 10 146

Total 170 206 36 412

Fuente: Cierto S.A.

a. Según lo mencionado, complete los siguientes espacios en blanco:

De 412 ciudadanos, 14 ...……………………………………………….…………………………………………....……..…

Del total de ciudadanos de clase baja, 88 ………………………………………………………….……………...…..

Del total de ciudadanos que opinan que el principal problema en Lima es la delincuencia, el

……………..…… % de ellos son de clase media.

Del total de ciudadanos, el …………..…….% de ellos son de clase alta y opinan que el principal

problema en Lima es la delincuencia.

b. Presente la tabla cruzada para el título: “Distribución porcentual de los ciudadanos según princi-pal problema de Lima y estatus social”

Estatus social Principales problemas de Lima

Total Tráfico Delincuencia Basura

Alto

Medio

Bajo

Total

Fuente: Cierto S.A.

c. Presente la tabla cruzada para el título: “Distribución porcentual de los ciudadanos según princi-pal problema de Lima por estatus social”

Estatus social Principales problemas de Lima

Total Tráfico Delincuencia Basura

Alto

Medio

Bajo

Total

Fuente: Cierto S.A.

Page 48: 2015 Separata

Capítulo 1. Organización de datos 49

d. Presente la tabla cruzada para el título: “Distribución porcentual de los ciudadanos según esta-tus social por principal problema de Lima”

Estatus social Principales problemas de Lima

Total Tráfico Delincuencia Basura

Alto

Medio

Bajo

Total

Fuente: Cierto S.A.

e. Elabore el gráfico de barras comparativas para el título: “Distribución porcentual de los ciudada-

nos según principal problema de Lima y estatus social”

Page 49: 2015 Separata

50 Estadística Básica con Aplicaciones en Excel 2010

f. Elabore el gráfico de barras comparativas para el título: “Distribución porcentual de los ciudada-nos según principal problema de Lima por estatus social”

g. Elabore el gráfico de barras comparativas para el título: “Distribución porcentual de los ciudada-

nos según estatus social por principal problema de Lima”

Page 50: 2015 Separata

Capítulo 1. Organización de datos 51

Gráfico de barras apiladas

Gráfico de barras apiladas en Excel

• Seleccione solo las celdas correspondientes a las categorías de ambas variables. No incluya los totales.

• Haga clic en la opción Insertar de la barra de menú y elija Columna/Columna apilada.

• Haga clic a cualquier línea horizontal del gráfico y observará que todas las líneas horizontales se seleccionan. Presione la tecla Supr de su teclado para eliminarlas.

• Haga clic en el área del gráfico y aparecerá la pestaña Herramientas de gráficos con las opcio-nes: Diseño, Presentación y Formato.

• Seleccione Diseño y elija el estilo que desee haciendo clic en el menú despegable. El estilo 26 (segunda columna fila 4) es el que se presenta como modelo en este material.

• Seleccione ahora la pestaña Presentación, y de ahí escoja los botones Título de gráfico, Rótulo del eje y Etiqueta de datos para darle el formato deseado.

• Haga clic derecho sobre cualquier valor del eje Y y del menú elija Dar formato al eje… /Número/Porcentaje/Posiciones decimales: 0/Cerrar.

• Elimine los valores porcentuales iguales a cero para una mejor presentación.

Los datos también pueden ser representados en barras apiladas de porcentajes donde la cantidad para cada

valor de la variable elegida para el eje horizontal representa el total parcial (o el 100%)

y las cantidades (o los porcentajes) de la segunda

variable van a dar lugar a dicha cantidad (o el 100%).

Page 51: 2015 Separata

52 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 17

La tabla que se presenta a continuación fue publicada el mes pasado por el diario Siglo XXI. La en-cuesta se aplicó a una muestra de 737 hogares según nivel socioeconómico (NSE) y área de residen-cia. Los resultados se presentan a continuación:

Distribución de los encuestados según nivel socioeconómico y área de residencia

Nivel socioeconómico Área de residencia

Total Área urbana Área rural

NSE C 105 145 250

NSE D 94 175 269

NSE E 38 180 218

Total 237 500 737 Fuente: Diario Siglo XXI

a. Presente la tabla de contingencia porcentual con respecto al total. b. A partir de la tabla anterior, elabore e interprete el gráfico apilado.

Solución

a. Presente la tabla cruzada porcentual con respecto al total. Coloque el título apropiado.

Distribución de encuestados según nivel socioeconómico y área de residencia

Nivel socioeconómico Área de residencia

Total Área urbana Área rural

NSE C 14,25% 19,67% 33,92%

NSE D 12,75% 23,74% 36,50%

NSE E 5,16% 24,42% 29,58%

Total 32,16% 67,84% 100% Fuente: Diario Siglo XXI

b. A partir de la tabla anterior elabore e interprete el gráfico apilado.

El 24,42% de los hogares son del área rural y pertenecen al nivel socioeconómico E, mientras que el 14,25% de los hogares son del área urbana y pertenecen al nivel socioeconómico C.

14.25% 12.75% 5.16%

19.67% 23.74%

24.42%

0%

5%

10%

15%

20%

25%

30%

35%

40%

NSE C NSE D NSE E

Po

rce

nta

je d

e e

ncu

est

ado

s

Nivel socioeconómico

Distribución de encuestados según nivel socioeconómico y área de residencia

Área Rural

Área Urbana

Fuente: Diario Siglo XXI

Page 52: 2015 Separata

Capítulo 1. Organización de datos 53

Ejercicio 18

Un productor musical de la empresa Creativa´s ha entrevistado a 200 personas haciéndolos oír una canción y pidiéndoles que la identifiquen.

Distribución de individuos según identificación de la canción y género musical

Género musical Plenamente Medianamente No identifica Total

Reggaetón 35% 3% 4% 42%

Vals 23% 7% 6% 36%

Cumbia 13% 8% 1% 22%

Total 71% 18% 11% 100% Fuente: Empresa Creativa´s

a. Presente la tabla de contingencia absoluta. Coloque el título apropiado. b. A partir de la tabla relativa elabore e interprete un gráfico apilado.

Solución

a. Presente la tabla de contingencia absoluta. Coloque el título apropiado.

Distribución de individuos …………………………………………………………………………………………….

Género musical Plenamente Medianamente No identifica Total

Reggaetón

Vals

Cumbia

Total Fuente: Empresa Creativa´s

b. A partir de la tabla relativa elabore e interprete el gráfico apilado.

Interpretación

Page 53: 2015 Separata

54 Estadística Básica con Aplicaciones en Excel 2010

Gráfico de barras apiladas al 100%

Gráfico de barras apiladas al 100% en Excel

• Seleccione solo las celdas correspondientes a las categorías de ambas variables. No incluya los totales.

• Haga clic en la opción Insertar de la barra de menú y elija Columna/Columna 100% apilada.

• Haga clic en el área del gráfico y aparecerá la pestaña Herramientas de gráficos con las opcio-nes: Diseño, Presentación y Formato.

• Seleccione Diseño y elija el estilo que desee haciendo clic en el menú despegable. El estilo 26 (segunda columna fila 4) es el que se presenta como modelo en este material.

• Seleccione ahora la pestaña Presentación, y de ahí escoja los botones Título de gráfico, Rótulo del eje y Etiqueta de datos para darle el formato deseado.

• Haga clic derecho sobre cualquier valor del eje Y y del menú elija Dar formato al eje… /Número/Porcentaje/Posiciones decimales: 0/Cerrar.

• Elimine los valores porcentuales iguales a cero para una mejor presentación.

Un gráfico de barras apiladas al 100% muestra todas las series apiladas en una

sola barra para cada categoría.

El alto de cada barra es el mismo para cada categoría.

Page 54: 2015 Separata

Capítulo 1. Organización de datos 55

Ejemplo 13 La tabla que se presenta a continuación fue publicada el mes pasado por el diario Siglo XXI. La en-cuesta se aplicó a una muestra de 737 hogares según nivel socioeconómico (NSE) y área de residen-cia. Los resultados se presentan a continuación:

Distribución de los encuestados según nivel socioeconómico y área de residencia

Nivel socioeconómico Área de residencia

Total Área urbana Área rural

NSE C 105 145 250

NSE D 94 175 269

NSE E 38 180 218

Total 237 500 737 Fuente: diario Siglo XXI

a. Presente la tabla cruzada porcentual por área de residencia. Coloque el título apropiado. b. A partir de la tabla anterior elabore e interprete un gráfico de barras apiladas al 100%.

Solución

a. Presente la tabla cruzada porcentual por área de residencia. Coloque el título apropiado.

Distribución de encuestados según nivel socioeconómico por área de residencia

Nivel socioeconómico Área de residencia

Área urbana Área rural

NSE C 35,00% 28,71%

NSE D 31,33% 34,65%

NSE E 12,67% 35,64%

Total 100,0% 100,0% Fuente: Diario Siglo XXI

b. A partir del cuadro anterior elabore e interprete un gráfico de barras apiladas al 100%.

Fuente: Diario Siglo XXI

Del total de encuestados cuya área de residencia es el área urbana, el 35% pertenece al NSE C mientras que el 12,67% pertenece al NSE E.

Del total de encuestados cuya área de residencia es del área rural, el 35,64% pertenece al NSE E mientras que el 28,71% pertenece al NSE C.

35.00% 28.71%

31.33%

34.65%

12.67% 35.64%

0%

20%

40%

60%

80%

100%

Área Urbana Área Rural

Po

rce

nta

je d

e e

ncu

est

ado

s

Área de residencia

Distribución de encuestados según nivel socioeconómico por área de residencia

NSE E

NSE D

NSE C

Page 55: 2015 Separata

56 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 19

Un productor musical de la empresa Creativa´s ha entrevistado a 200 personas haciéndolos oír una canción y pidiéndoles que la identifiquen.

Distribución de individuos según identificación de la canción por género musical

Género musical Plenamente Medianamente No identifica Total

Reggaetón 84% 7% 9% 100%

Vals 63% 19% 18% 100%

Cumbia 59% 37% 4% 100% Fuente: Empresa Creativa´s

Presente e interprete el gráfico de barras apiladas al 100% para la tabla anterior.

Solución

Presente el gráfico de barras apiladas al 100%.

Fuente: ……………………………………………………………………. Interpretación

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

Reggaetón Vals Cumbia

Tít ulo del eje

Título del gráfic o

Page 56: 2015 Separata

Capítulo 1. Organización de datos 57

Distribución de frecuencias de variables discretas

Título: …………………………………………………………………………………………….…………………….. Valores de la variable

discreta

Frecuencia absoluta fi

Frecuencia relativa hi

Frecuencia absoluta acumulada Fi

Frecuencia relativa acumulada Hi

x1 f1 n

fh 1

1 11 fF 11 hH

x2 f2 n

fh 2

2 122 FfF 122 HhH

… … … … …

xk fk n

fh k

k 1 kkk FfF 1 kkk HhH

Fuente:……………………………………………………………………………………..

Distribución de frecuencias de variables discretas en Excel

• Seleccione Insertar de la barra de menú y luego elija Tabla dinámica.

• Seleccione el rango de datos.

• Haga clic en Aceptar y arrastre Número de capacitaciones a la zona de Etiquetas de fila y a la zona de ∑ Valores. Coloque el cursor en la opción Suma de la variable y haga clic derecho, cambie Recuento en vez de Suma.

• Copie la tabla dinámica sin incluir la primera fila.

• Calcule la frecuencia relativa (h i) y las frecuencias acumuladas.

Es un resumen de un conjunto de datos que consiste en presentar para cada valor de la

variable el número de elementos (frecuencia) que la componen.

Es un cuadro que presenta además de las frecuencias absolutas y relativas las frecuencias acumuladas absolutas y

acumuladas relativas.

Page 57: 2015 Separata

58 Estadística Básica con Aplicaciones en Excel 2010

Ejemplo 14 Los siguientes datos corresponden al número de capacitaciones recibidas por los colaboradores de la empresa Creativa’s en lo que va del año.

1 2 2 0 1 1 3 2 1 1 2 0 2 1 1

1 2 2 1 1 1 2 2 1 5 2 1 0 3 1

a. Presente la tabla de distribución de frecuencias. b. Interprete f2 , F2 , h3 y H2

Solución

El resultado debe ser:

Distribución del número de capacitaciones recibidas

Número de capacitaciones fi hi Fi Hi

0 3 0,100 3 0,1000

1 14 0,467 17 0,5667

2 10 0,333 27 0,9000

3 2 0,067 29 0,9667

5 1 0,033 30 1,0000

Total 30 1,000 Fuente: Empresa Creativa´s

Interprete:

f2 = 14 De 30 empleados, 14 han recibido solo una capacitación al año

F2 = 17 De 30 empleados, 17 han recibido de una a menos capacitaciones al año

h3 = 0,467 El 46,7% de los trabajadores han recibido solo una capacitación al año

H2 = 0,567 El 56,7% de los trabajadores han recibido de una a menos capacitaciones al año

Page 58: 2015 Separata

Capítulo 1. Organización de datos 59

Ejercicio 20

Los siguientes datos corresponden a una encuesta realizada por un grupo de estudiantes de la uni-versidad San Vicente de Arequipa a una muestra de 40 aficionados al cine. Al formular la pregunta, ¿cuántas veces ha visto su película preferida? las respuestas fueron las siguientes:

1 2 3 4 3 3 2 3 5 3 3 4 5 5 2 3 3 2 4 1

2 3 4 3 1 1 2 4 1 2 2 3 1 3 4 2 1 4 5 2

a. Presente la tabla de distribución de frecuencias. b. Interprete f3 , h1, F2 y H4

Solución

a. Presente la tabla de distribución de frecuencias. TÍtulo: ………………………………………………………………………………………………………………………………………

fi hi Fi Hi

Fuente: …………………………………………………………………………………

b. Interprete:

f3 = …………...

F2 = ………..…

h1 = …………..

H4 = …………..

Page 59: 2015 Separata

60 Estadística Básica con Aplicaciones en Excel 2010

Representación gráfica de variables discretas

Gráfico de bastones o líneas

Gráfico de bastones o líneas en Excel

• Construya la tabla de distribución de frecuencias

• Seleccione las columnas Número de capacitaciones y frecuencia absoluta (fi) o relativa (hi).

• En la barra de menú, elija la opción Insertar, seleccione el tipo Dispersión sólo con marcadores.

• Elimine la leyenda.

• Seleccione el gráfico, elija la opción Presentación y elija la opción Barras de error. En esa opción seleccione Más opciones de las barras de error…

• En Barras de error verticales seleccione la opción Menos. Luego en Cuantía de error, elija Por-centaje y coloque el valor 100%. Borre las barras de error horizontales que aparecen automáti-camente.

• Haga clic sobre el gráfico y seleccione Título de gráfico, Rótulos del eje y Etiquetas de datos

para dar el formato al gráfico.

• De ser necesario, coloque los valores del eje Y en formato Porcentaje.

Por lo general, el gráfico de bastones es utilizado cuando la variable es discreta.

Su uso es adecuado cuando existen muchas observaciones pero pocos valores de la

variable.

Page 60: 2015 Separata

Capítulo 1. Organización de datos 61

Ejercicio 21

Los siguientes datos corresponden al número de capacitaciones recibidas por los colaboradores de la empresa Creativa’s en lo que va del año.

1 2 2 0 1 1 3 2 1 1 2 0 2 1 1

1 2 2 1 1 1 2 2 1 5 2 1 0 3 1

Presente e interprete el gráfico de bastones para los siguientes datos.

Solución

Distribución del número de capacitaciones recibidas

Número de capacitaciones fi hi Fi Hi

0 3 0,100 3 0,1000

1 14 0,467 17 0,5667

2 10 0,333 27 0,9000

3 2 0,067 29 0,9667

5 1 0,033 30 1,0000

Total 30 1,000 Fuente: Empresa Creativa´s

Fuente: Empresa Creativa´s

Interpretación

De un total de treinta empleados, catorce de ellos han recibido una capacitación y solo un colaborador ha recibido cinco capacitaciones en lo que va del año

3

14

10

2 1

0

2

4

6

8

10

12

14

16

0 1 2 3 4 5

me

ro d

e c

ola

bo

rad

ore

s

Número de capacitaciones

Distribución del número de capacitaciones recibidas

Page 61: 2015 Separata

62 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 22

Los siguientes datos corresponden a una encuesta realizada por un grupo de estudiantes de la uni-versidad San Vicente de Arequipa a una muestra de 40 aficionados al cine. Al formular la pregunta, ¿cuántas veces ha visto su película preferida? las respuestas fueron las siguientes:

1 2 3 4 3 3 2 3 5 3 3 4 5 7 2 3 3 2 4 1

2 3 4 3 1 1 2 4 1 2 2 3 1 3 4 2 1 4 5 2

Presente e interprete el gráfico de bastones para los siguientes datos.

Solución

Presente el gráfico de bastones para los siguientes datos.

Interpretación

Page 62: 2015 Separata

Capítulo 1. Organización de datos 63

Distribución de frecuencias de variables continuas

Cantidad de clases

Se recomienda usar entre 5 y 20 clases, inclusive.

La idea es emplear suficientes clases para mostrar la variación de los datos, pero no tantas, porque puede ocurrir que varias contengan ningún o pocos elementos.

Para determinar el número de clases se puede usar la regla de Sturges. Si la estimación tiene decimales, se toma el entero más próximo (redondeo simple).

Regla de Sturges: k = 1 + 3,322 x log n

Amplitud o ancho de cada clase

Usualmente se usa el mismo ancho para todas las clases.

Se calcula de la siguiente manera:

k

r

k

rangowAmplitud

La amplitud del intervalo debe tener la misma cantidad de cifras decimales que tienen los datos originales. El redondeo empleado es el redondeo a más. Por ejemplo:

Datos con

w

(redondeo a más)

Cero decimales w = 50,2387 w = 51

Una cifra decimal w = 12,1066 w = 12,2

Dos cifras decimales w = 125,4463 w = 125,45

Tres cifras decimales w = 587,9308 w = 587,931

Marcas de clase

Son los puntos medios de los límites de cada intervalo.

Su notación es 'iX

Se calcula de la siguiente manera:

22

supinf' LSLIeriorLímiteeriorLímiteXi

Es un resumen de un conjunto de datos que consiste en presentar para cada categoría el número de elementos

(frecuencia) que la componen.

Los tres pasos para elaborar una tabla de distribución de frecuencias para variables cuantitativas continuas son:

•Determinar la cantidad de clases

•Determinar el ancho de cada clase

•Determinar los límites de cada clase

Page 63: 2015 Separata

64 Estadística Básica con Aplicaciones en Excel 2010

Límites de cada clase

Los límites de clase se escogen de tal manera que cada valor de dato pertenezca a una clase y sólo a una.

El límite inferior de clase es el valor mínimo posible de los datos que se asigna a la clase y el límite superior de clase es el valor máximo posible de los datos que se asigna a la clase.

Distribución de frecuencias de variables continuas en Excel

En el menú principal elija la opción Datos/Análisis de datos/Estadística descriptiva

En Rango de entrada seleccione las celdas donde se encuentran los datos.

Marque Rótulo en la primera fila si los datos han sido seleccionados desde el nombre de la va-riable en la primera fila, caso contrario no seleccione esta opción.

A continuación, haga clic en Rango de salida y ubique el cursor en el recuadro del lado derecho haga clic en una celda en blanco, en donde saldrán los resultados.

Finalmente, haga clic a Resumen de estadísticas y dé Aceptar Cálculo de las frecuencias

• Seleccione el rango en el cual aparecerán las frecuencias respectivas.

• Haga clic en el icono de Insertar función, seleccione =Frecuencia y dé Aceptar.

Page 64: 2015 Separata

Capítulo 1. Organización de datos 65

• En la ventana de Frecuencia, en la opción Datos ingrese el rango de datos que se desea contar y en Grupos, ingrese solo el rango de celdas que corresponde a los límites superiores de los in-tervalos.

• A continuación mantenga presionadas las teclas Ctrl + Shift y a continuación presione Enter con lo cual aparecerán las frecuencias absolutas.

• Calcule las demás frecuencias y las marcas de clase para completar la tabla.

Ejemplo 15 El jefe de la Oficina de Rentas de una municipalidad ha realizado un estudio sobre los impuestos que pagan los vecinos del distrito. La tabla en Excel muestra los pagos de impuestos, en nuevos soles, de 48 viviendas elegidas al azar en el 2012.

A B C D E F G H I J K L

1 145,1 216,3 252,5 303,6 196,9 234,8 265,2 317,2 206,5 242,9 289,1 331,7

2 151,0 225,9 257,1 305,8 202,6 238,4 271,0 320,2 208,0 244,0 291,0 344,6

3 159,0 227,1 259,2 315,4 204,9 239,9 286,7 324,8 208,0 247,7 291,9 346,7

4 195,6 231,2 262,5 315,5 206,1 241,1 288,1 331,1 209,3 249,5 294,5 351,1

Elabore la tabla de frecuencias para la variable Pago por impuestos municipales año 2012.

Solución

El rango r se calcula con:

r = valor máximo – valor mínimo = 351,1 – 145,1 = 206 Siguiendo la regla de Sturges, el número de intervalos es:

7585,6)48(log322,31log322,31 1010 nk (Use redondeo simple)

La amplitud se calcula por:

5,29429,297

206

k

rw

Usamos redondeo por exceso a un decimal debido a que los datos tienen como máximo un deci-mal.

Page 65: 2015 Separata

66 Estadística Básica con Aplicaciones en Excel 2010

Usando las funciones del Excel 2010 sería:

A B

6 Máximo 351,1 =MAX(A1:L4)

7 Mínimo 145,1 =MIN(A1:L4)

8 Rango 206 =B6-B7

9 Cantidad de datos (n) 48 =CONTAR(A1:L4)

10 k (por regla de Sturges) 6,58508 =1+3,322*LOG10(B9)

11 k (entero) 7

12 w (Amplitud) 29,4286 =B8/B11

13 Número de decimales de los datos 1

14 w (redondeada) 29,5

Otra manera de hacerlo en Excel 2010 es:

Copie los datos en la columna A del Excel y en la fila 1 agregue el nombre de la variable; por lo tanto los datos estarán comprendidos en el rango A2:A49

En el menú principal elija la opción Datos/Análisis de datos/Estadística descriptiva

En Rango de entrada seleccione las celdas A2:A49

Dé clic a Rótulo en la primera fila dado que nuestros datos tienen en la primera fila el nombre de la variable

Dé clic a Rango de salida y ubique el cursor dentro del recuadro para dar a continuación clic en una celda en blanco, por ejemplo C2.

Finalmente, haga clic a Resumen de estadísticas y dé Aceptar

La salida obtenida en la celda C2 será:

Impuestos

Media 257,25625

Error típico 7,6183196

Mediana 251

Moda 208

Desviación estándar 52,7812664

Varianza de la muestra 2785,86209

Curtosis -0,68012624

Coeficiente de asimetría -0,07342341

Rango 206

Mínimo 145,1

Máximo 351,1

Suma 12348,3

Cuenta 48

Page 66: 2015 Separata

Capítulo 1. Organización de datos 67

Completamos los siguientes cálculos:

k (por regla de Sturges) 6,5851

k (entero) 7

w (Amplitud) 29,4286

Número de decimales de los datos 1

w (redondeada) 29,5

Cálculo de las frecuencias absolutas

• Seleccione el rango en el cual aparecerán las frecuencias absolutas.

• Haga clic en el icono de Insertar función, seleccione Frecuencia y de Aceptar.

• En la ventana de Frecuencia, ingrese en Datos el rango de los datos que se desea contar. En Grupos, ingrese el rango de celdas de los límites superiores de los intervalos.

• Manteniendo presionado Ctrl + Shift, presione Enter, con lo cual aparecerán las frecuencias absolutas.

• Calcule las demás frecuencias y las marcas de clase para completar la tabla. A continuación la tabla de distribución de frecuencias:

Distribución del pago de impuesto municipal (en nuevos soles)

Pago de impuestos Marca de clase fi hi Fi Hi

[145,1 ; 174,6] 159,85 3 0,0625 3 0,0625

]174,6 ; 204,1] 189,35 3 0,0625 6 0,1250

]204,1 ; 233,6] 218,85 10 0,2084 16 0,3334

]233,6 ; 263,1] 248,35 12 0,2500 28 0,5834

]263,1 ; 292,6] 277,85 7 0,1458 35 0,7292

]292,6 ; 322,1] 307,35 7 0,1458 42 0,8750

]322,1 ; 351,6] 336,85 6 0,1250 48 1,0000

Total 48

Fuente: Oficina de Rentas de la Municipalidad

Page 67: 2015 Separata

68 Estadística Básica con Aplicaciones en Excel 2010

Interprete:

f2 = 3 En tres viviendas pagaron más de 174,60 nuevos soles y hasta de 204,10 nuevos soles

F2 = 6 En seis viviendas pagaron hasta 204,10 nuevos soles

h3 = 0,2084 El 20,84% de las viviendas pagaron más de 204,10 nuevos soles y hasta 233,6 nuevos soles

H3 = 0,3334 El 33,34% de las viviendas pagaron hasta 233,60 nuevos soles

Ejercicio 23

A continuación, se muestra el tiempo de servicio, en meses, de los trabajadores de la empresa Óp-tima, Usando la regla de Sturges construya la tabla de distribución de frecuencias.

10 24 38 40 43 44 51 53 55 57

16 25 39 40 43 46 51 53 55 57

21 31 39 40 43 46 52 53 55 58

21 31 40 43 44 47 53 54 55 62

23 33 40 43 44 48 53 54 55 65

Solución

Cálculo de los límites de los intervalos

Máximo =MAX(datos)

Mínimo =MIN(datos)

Rango =MAX(datos) – MIN(datos)

Cantidad de datos (n) =CONTAR(datos)

k (por regla de Sturges) =1+3,322*LOG10(n)

k (entero)

w (amplitud) =Rango/k (entero)

Número de decimales de los datos w (redondeada por exceso)

Distribución del tiempo de servicio, en meses, de los trabajadores de la empresa Óptima

Tiempo de servicio Marca de clase fi hi Fi Hi

Fuente: Empresa Óptima

Page 68: 2015 Separata

Capítulo 1. Organización de datos 69

Interprete

f4 = …………..

F2 = ………….

h1 = …………..

H4 = ………….

Representación gráfica de variables cuantitativas continuas

Histograma de frecuencias

Histograma de frecuencias en Excel

Seleccione la columna de frecuencia absoluta o relativa, luego seleccione Insertar en la barra de menú, elija Columna, y luego Columna agrupada.

Este resumen gráfico se prepara a partir de una tabla de frecuencias

absolutas, relativas o porcentuales.

Se traza colocando la variable sobre el eje horizontal y las frecuencias sobre el eje vertical.

Cada frecuencia de clase se representa trazando un rectángulo, cuya base es el intervalo de clase sobre el eje

horizontal y cuya altura es proporcional a la frecuencia correspondiente.

Los rectángulos adyacentes se tocan entre sí.

Page 69: 2015 Separata

70 Estadística Básica con Aplicaciones en Excel 2010

Elimine la leyenda.

Para que se junten los rectángulos: haga clic en una barra y elija Dar formato a serie de da-tos…, luego ponga Ancho del intervalo igual a 0%.

Para cambiar los valores del eje X haga clic derecho y seleccione Seleccionar datos – Editar.

Haga clic sobre el gráfico y seleccione Título de gráfico, Rótulos del eje y Etiquetas de datos para dar el formato al gráfico.

Ejemplo 16 La gerencia de una compañía, que brinda servicios de llamadas por celulares, está preocupada por el poco monto de las llamadas realizadas por sus clientes. Para corroborarlo se encargó al área de administración que eligiera, del mes de enero, una muestra de clientes de Lima y registrara el mon-to que representan sus llamadas, en nuevos soles. El encargado mostró los resultados en una tabla de distribución de frecuencias:

Monto de las llamadas en Lima (en nuevos soles)

Tiempo de servicio Marca de clase fi hi Fi Hi

0 10 5 12 0,1000 12 0,1000

10 20 15 22 0,1833 34 0,2833

20 30 25 45 0,3750 79 0,6583

30 40 35 23 0,1917 102 0,8500

40 50 45 12 0,1000 114 0,9500

50 60 55 6 0,0500 120 1,0000

120 1

Fuente: Área de Administración

Grafique el histograma de frecuencias porcentuales.

Page 70: 2015 Separata

Capítulo 1. Organización de datos 71

Solución

Fuente: Área de Administración

Interpretación: A partir del gráfico podemos observar que el 37,5% de los clientes de Lima tienen montos superiores a 20 y como máximo de 30 nuevos soles y que solo el 5% de estos clientes tie-nen montos superiores a 50 y como máximo de 60 nuevos soles.

Ejercicio 24

A continuación, se muestra el tiempo de servicio, en meses, de los trabajadores de la empresa Óp-tima. Grafique el histograma de frecuencias relativas.

10 16 21 21 23 24 25 31 31 33 38 39 39 40 40 40 40

40 43 43 43 43 43 44 44 44 46 46 47 48 51 51 52 53

53 53 53 53 54 54 55 55 55 55 55 57 57 58 62 65

Solución

Título: ………………………………………………………………………………………………………………………………

Marca de clase fi hi Fi Hi

Fuente: ………………………………………………………………………………………………….

10.0%

18.3%

37.5%

19.2%

10.0%

5.0%

0%

5%

10%

15%

20%

25%

30%

35%

40%

0-10 10-20 20-30 30-40 40-50 50-60

Po

rce

nta

je d

e c

lien

tes

Monto de las llamadas

Distribución del monto de las llamadas en Lima (en nuevos soles)

Page 71: 2015 Separata

72 Estadística Básica con Aplicaciones en Excel 2010

Fuente: ……………………………………………………………………. Interpretación

0%

5%

10%

15%

20%

25%

30%

35%

40%

-5 5 15 25 35 45 55 65

Po

rce

nta

je d

e ..

....

....

....

....

....

...

..................................................

Título: .............................................................................

Page 72: 2015 Separata

Capítulo 1. Organización de datos 73

Polígono de frecuencias

Polígono de frecuencias en Excel

Antes de elaborar este gráfico deberá usar el siguiente artificio: agregue una primera marca de clase ficticia y una última marca de clase ficticia, con frecuencias relativas igual a cero, en am-bos casos. Su finalidad es obtener un polígono como figura geométrica cerrada.

A continuación, seleccione la columna de frecuencia absoluta o relativa.

Luego, seleccione Insertar en la barra de menú, elija Línea - Línea con marcadores.

Elimine la leyenda.

Para cambiar los valores del eje X haga clic derecho y seleccione Seleccionar datos –Editar.

Haga clic sobre el gráfico y seleccione Título de gráfico, Rótulos del eje y Etiquetas de datos para dar el formato al gráfico.

Coloque las etiquetas y los valores del eje Y en formato Porcentaje.

Es la representación de las frecuencias, absolutas,

relativas o relativas, mediante una figura

poligonal cerrada.

Se obtiene uniendo con segmentos de recta los

puntos de intersección de las marcas de clase con las

frecuencias.

Los polígonos de frecuencias se cierran creando dos marcas de

clase ficticias,

una antes de la primera marca de clase y la otra después de la

última marca de clase.

Las marcas de clase, creadas por el artificio pueden toman valores negativos.

La gráfica debe presentarse solo en el primer cuadrante aún las marcas de clase creadas por el

artificio sean negativas.

Page 73: 2015 Separata

74 Estadística Básica con Aplicaciones en Excel 2010

Ejemplo 17 La gerencia de la compañía Óptima, que brinda servicios de llamadas por celulares, está preocupa-da por el poco monto de las llamadas realizadas por sus clientes. Para corroborarlo se encargó al área de Administración que eligiera, del mes de enero, una muestra de clientes de Lima y registrara el monto que representan sus llamadas, en nuevos soles. El encargado mostró los resultados en la siguiente tabla de distribución de frecuencias.

Monto de las llamadas en Lima (en nuevos soles)

Tiempo de servicio Marca de clase fi hi Fi Hi

0 10 5 12 0,1000 12 0,1000

10 20 15 22 0,1833 34 0,2833

20 30 25 45 0,3750 79 0,6583

30 40 35 23 0,1917 102 0,8500

40 50 45 12 0,1000 114 0,9500

50 60 55 6 0,0500 120 1,0000

120 1

Fuente: Empresa Óptima

Grafique el polígono de frecuencias relativas.

Solución

Para cerrar el gráfico del polígono, emplearemos el siguiente artificio: agregue una primera marca de clase ficticia y una última marca de clase ficticia, con frecuencias relativas igual a cero, en ambos casos.

Marca de clase Xi hi

-5 0

5 0,1000

15 0,1833

25 0,3750

35 0,1917

45 0,1000

55 0,0500

65 0

A continuación, seleccione la columna de frecuencia absoluta o relativa.

Artificio: X1 - amplitud

Artificio: X7 + amplitud

Page 74: 2015 Separata

Capítulo 1. Organización de datos 75

Luego, seleccione Insertar en la barra de menú, elija Línea - Línea con marcadores.

Elimine la leyenda.

Para cambiar los valores del eje X haga clic derecho y seleccione Seleccionar datos –Editar.

Haga clic sobre el gráfico y seleccione Título de gráfico, Rótulos del eje y Etiquetas de datos para dar el formato al gráfico.

Si corresponde, coloque las etiquetas y los valores del eje Y en formato Porcentaje.

Fuente: Empresa Óptima

10.0%

18.3%

37.5%

19.2%

10.0%

5.0%

0%

5%

10%

15%

20%

25%

30%

35%

40%

-5 5 15 25 35 45 55 65

Po

rce

nta

je d

e c

lien

tes

Monto de las llamadas

Distribución del monto de las llamadas en Lima (en nuevos soles)

Page 75: 2015 Separata

76 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 25

A continuación, se muestra el tiempo de servicio, en meses, de los trabajadores de la empresa Óp-tima. Grafique el polígono de frecuencias relativas.

10 24 38 40 43 44 51 53 55 57

16 25 39 40 43 46 51 53 55 57

21 31 39 40 43 46 52 53 55 58

21 31 40 43 44 47 53 54 55 62

23 33 40 43 44 48 53 54 55 65

Solución

Fuente: …………………………………………………………………………

0%

5%

10%

15%

20%

25%

30%

35%

40%

-5 5 15 25 35 45 55 65

Po

rce

nta

je d

e ..

....

....

....

....

....

...

..................................................

Título: .............................................................................

Page 76: 2015 Separata

Capítulo 1. Organización de datos 77

Ojiva

Si se usa la frecuencia acumulada relativa, el valor máximo del eje Y debe ser igual a 1.

Si se usa el porcentaje acumulado, el valor máximo del eje Y debe ser igual a 100%.

Si se usa la frecuencia acumulada absoluta, el valor máximo del eje Y debe ser el tamaño de la muestra.

Ojiva en Excel

Para que la ojiva aplique el siguiente artificio: inserte una fila, escriba el mínimo valor de los datos en la celda correspondiente al límite superior y en la columna de frecuencias relativas acumuladas Hi coloque el valor cero.

A continuación, seleccione la columna de frecuencia acumulada absoluta o relativa.

Luego, seleccione Insertar en la barra de menú, elija Línea - Línea con marcadores.

Elimine la leyenda.

Elimine las líneas horizontales.

Para cambiar los valores del eje X haga clic derecho y seleccione Seleccionar datos –Editar.

Haga clic en Editar e indique la posición de los rótulos del eje.

Coloque las etiquetas y los valores del eje Y en formato Porcentaje.

Finalmente, coloque el título del gráfico y los rótulos de los ejes X e Y.

Es la gráfica de una distribución acumulada de frecuencias, absoluta o

relativa.

Con la ojiva se puede estimar el número o porcentaje de observaciones que corresponden a

un intervalo determinado.

Se obtiene uniendo con segmentos de recta los puntos de intersección del límite superior de cada

intervalo y la frecuencia acumulada respectiva.

La ojiva siempre es un gráfico creciente.

Page 77: 2015 Separata

78 Estadística Básica con Aplicaciones en Excel 2010

Ejemplo 18 La gerencia de una compañía Óptima, que brinda servicios de llamadas por celulares, está preocu-pada por el poco monto de las llamadas realizadas por sus clientes. Para corroborarlo se encargó al área de Administración que eligiera, del mes de enero, una muestra de clientes de Lima y registrara el monto que representan sus llamadas, en nuevos soles. El monto más pequeño que se registró fue de 5 nuevos soles. El encargado mostró los resultados en la siguiente tabla de distribución de frecuencias:

Monto de las llamadas en Lima (en nuevos soles)

Tiempo de servicio Marca de clase fi hi Fi Hi

0 10 5 12 0,1000 12 0,1000

10 20 15 22 0,1833 34 0,2833

20 30 25 45 0,3750 79 0,6583

30 40 35 23 0,1917 102 0,8500

40 50 45 12 0,1000 114 0,9500

50 60 55 6 0,0500 120 1,0000

120 1

Grafique la ojiva de frecuencias relativas.

Solución

Para que la ojiva comience a crecer desde el límite inferior del primer intervalo, inserte una fila, escriba el mínimo valor de los datos en la celda correspondiente al límite superior y en la co-lumna de frecuencias relativas acumuladas Hi coloque el valor cero.

Límite superior Hi

5 0

10 0,1000

20 0,2833

30 0,6583

40 0,8500

50 0,9500

60 1,0000

A continuación, seleccione la columna de frecuencia acumulada absoluta o relativa.

Luego, seleccione Insertar en la barra de menú, elija Línea - Línea con marcadores.

Límite superior = mínimo valor

Escriba Hi = 0

Page 78: 2015 Separata

Capítulo 1. Organización de datos 79

Elimine la leyenda.

Si lo desea, elimine las líneas horizontales.

Para cambiar los valores del eje X, haga clic derecho y seleccione Seleccionar datos –Editar.

Haga clic en Editar e indique la posición de los rótulos del eje.

Si corresponde, coloque las etiquetas y los valores del eje Y en formato Porcentaje.

Finalmente, coloque el título del gráfico y los rótulos de los ejes X e Y.

Fuente: Empresa Óptima

Interpretación A partir del gráfico podemos observar que el 85% de los clientes de Lima tienen montos de llamada como máximo de 40 nuevos soles y que solo el 10% de estos clientes tienen montos de llamadas como máximo de 10 nuevos soles.

10.0%

28.3%

65.8%

85.0%

95.0% 100.0%

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

5 10 20 30 40 50 60

Po

rce

nta

je d

e c

lien

tes

Monto de las llamadas

Distribución del monto de las llamadas en Lima (en nuevos soles)

Page 79: 2015 Separata

80 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 26

A continuación, se muestra el tiempo de servicio, en meses, de los trabajadores de la empresa Óp-tima. Presente la ojiva de frecuencias relativas para los siguientes datos.

10 24 38 40 43 44 51 53 55 57

16 25 39 40 43 46 51 53 55 57

21 31 39 40 43 46 52 53 55 58

21 31 40 43 44 47 53 54 55 62

23 33 40 43 44 48 53 54 55 65

Solución

Fuente: ……………………………………………………………….

Interpretación

0%

5%

10%

15%

20%

25%

30%

35%

40%

-5 5 15 25 35 45 55 65

Po

rce

nta

je d

e ..

....

....

....

....

....

...

..................................................

Título: .............................................................................

Page 80: 2015 Separata

Capítulo 1. Organización de datos 81

Ejercicios de aplicación

1. El gerente de un banco está interesado en estudiar el comportamiento del número de cuentas

de ahorros cerradas por día. La información disponible para este fin se muestra a continuación:

0 3 1 2 1 0 2 3 0 1

1 5 0 5 4 1 0 2 1 3

4 1 4 4 0 4 3 1 2 2

0 3 2 1 1 2 5 4 0 1

a. Construya la tabla de distribución de frecuencias para la variable en estudio. b. Construya el gráfico de bastones para representar la variable en estudio.

2. Una entidad estatal realizó un estudio para determinar algunos indicadores socioeconómicos

de los inmigrantes peruanos en Estados Unidos. El estudio se llevó a cabo aplicando encuestas a una muestra de 400 inmigrantes peruanos. Una de las preguntas buscaba identificar el pro-blema principal que estos inmigrantes presentaban. Con los datos recogidos se elaboró el si-guiente gráfico:

a. Construya el gráfico de Pareto. b. Presente sus conclusiones basándose en el gráfico de Pareto.

3. El departamento de logística de una aerolínea ha registrado el día 12 de marzo del 2006, en

cada uno de sus 20 vuelos, el número de asientos sobrantes (con negativos), esto es cuando se presentaron menos pasajeros que la capacidad total del avión y el número de asientos faltantes (con positivos), cuando se presentaron más pasajeros que la capacidad total del avión.

-2 0 0 1 1

0 -1 0 2 -1

0 -1 -2 -1 1

-1 2 1 -3 0

Elabore un gráfico para representar la información anterior.

Page 81: 2015 Separata

82 Estadística Básica con Aplicaciones en Excel 2010

4. Se realizó un estudio a los establecimientos dedicados a la venta de alimentos del distrito de San Miguel en Lima, para este propósito se han elegido aleatoriamente una muestra de 20 es-tablecimientos y se han considerado algunas variables como: número de empleados, condición del establecimiento e ingreso mensual, en miles de dólares.

Establecimiento Número de empleados

Condición del establecimiento

Ingreso Establecimiento Número de empleados

Condición del establecimiento

Ingreso

1 6 Buena 20,0 11 5 Regular 35,1

2 4 Buena 20,4 12 5 Mala 40,0

3 3 Regular 20,5 13 4 Buena 40,4

4 5 Regular 25,9 14 3 Buena 45,1

5 7 Mala 28,8 15 3 Mala 45,3

6 8 Buena 29,1 16 8 Muy buena 46,0

7 5 Regular 30,0 17 4 Buena 50,4

8 5 Regular 30,1 18 3 Muy buena 50,5

9 3 Muy buena 30,5 19 9 Buena 50,8

10 4 Buena 30,9 20 7 Muy buena 60,6

Elabore un gráfico que represente la información de la variable cualitativa. Además, elabore un cuadro que resuma la información de la variable cuantitativa continua.

5. En los X Censos Nacionales de Población y V de Vivienda de año 2005 se preguntó por el tipo de

alumbrado de la vivienda según área (urbana o rural).

Tipo de alumbrado del hogar Área Urbana Área Rural Total

Electricidad 3 875 390 353 544 4 228 934

Kerosene (mechero / lamparín) 148 084 817 581 965 665

Petróleo / gas (lámpara) 6 219 11 479 17 698

Vela 201 220 312 327 513 547

Generador 6 562 6 819 13 381

Otro 70 647 20 608 91 255

No tiene 17 949 9 720 27 669

Total 4 326 071 1 532 078 5 858 149

Elabore una gráfica de barras apiladas al 100% que permita ver la composición del tipo de alumbrado dentro de cada área.

6. Los siguientes datos corresponden a los ingresos de una muestra de 60 clientes del banco Nue-vo Horizonte, los montos están expresados en cientos de nuevos soles.

5,25 7,22 8,53 9,27 9,54 10,21 10,32 10,45 10,52 10,76

10,85 11,25 11,56 12,42 13,27 14,65 15,72 16,85 17,22 18,56

19,32 20,56 21,72 22,85 23,12 24,32 25,65 26,72 28,72 29,65

31,42 32,71 33,55 34,28 35,21 37,45 38,32 39,65 41,22 43,28

45,72 47,32 49,45 51,27 52,38 54,75 55,81 56,27 57,45 58,22

59,32 61,45 63,75 65,72 66,85 69,32 69,54 72,30 75,81 77,42

a. Construya una tabla completa de distribución de frecuencias usando la regla de Sturges. b. Interprete los valores de f2, h3 y H4. c. Elabore el gráfico de histograma de frecuencia absoluta. d. Elabore el gráfico de ojiva de frecuencia relativa.

Page 82: 2015 Separata

Capítulo 1. Organización de datos 83

7. Los directivos de una empresa solicitaron a los gerentes de cada una de sus dos locales de ven-tas, A y B, que informen sobre los sueldos de todos sus trabajadores correspondientes al mes de marzo del año en curso. La información proporcionada (en nuevos soles) por el gerente del local A se muestra a continuación.

i Sueldos fi

1 [ 1 000 – 2 000 2

2 2 000 – 3 000 3

3 3 000 – 4 000 14

4 4 000 – 5 000 15

5 5 000 – 6 000 5

6 6 000 – 7 000] 1

a. Complete la tabla anterior con la frecuencia relativa y las frecuencias acumuladas, absolu-

tas y relativas. b. Interprete los valores de f3, h4 y H2. c. Elabore el gráfico de la ojiva para los sueldos del local A. d. Los siguientes datos corresponden a los sueldos (en nuevos soles) del local B. Construya la

tabla de distribución de frecuencias usando la regla de Sturges.

Local B

58,7 99,3 118,1 173,3 177,5 205,3 206,2 206,3 222,9 224,4

242,9 245,7 260,9 262,0 265,9 272,9 273,2 274,0 275,9 295,0

299,8 319,7 319,9 324,5 328,1 330,0 332,3 338,9 342,1 364,1

372,3 373,0 381,3 393,8 394,5 419,2 432,4 435,0 436,1 441,6

454,1 459,7 463,3 501,2 503,3 505,7 518,8 522,2 544,8 602,7

e. Elabore el gráfico comparativo de la ojiva para los sueldos de los locales A y B.

8. A continuación, se presenta la información del número de veces que una muestra de clientes

elegidos al azar del banco América presentaron solicitudes de préstamo, así como el destino de dichos préstamos: V (vivienda), N (negocio), E (estudio) y D (viaje).

Número de solicitudes de préstamo

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2

2 2 2 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4

Destino del préstamo

V V E E E E E E D D D D D V V V D E E E V V V V N

N N N E E D D D E E D N N N V V V V V E E E E E D

a. Presente la tabla de distribución de frecuencias que resuma la información de la variable

cuantitativa. Interprete f3. b. Represente gráficamente la variable cuantitativa. Presente su conclusión. c. Presente la tabla de distribución de frecuencias que resuma la información de la variable

cualitativa. Interprete f2. d. Represente gráficamente la variable cualitativa. Presente su conclusión.

Page 83: 2015 Separata

84 Estadística Básica con Aplicaciones en Excel 2010

9. A un grupo de personas tomadas al azar entre aquellas que ayer ingresaron a una tienda de automóviles, se les preguntó sobre el color de carro que pensaban comprar. Los resultados ob-tenidos fueron:

Blanco Azul Verde Verde Verde Negro Rojo Negro Rojo Verde

Negro Rojo Rojo Azul Azul Azul Rojo Verde Negro Azul

Azul Blanco Verde Blanco Blanco Rojo Blanco Rojo Azul Verde

Negro Rojo Negro Rojo Rojo Verde Negro Negro Blanco Blanco

Blanco Blanco Negro Negro Azul Negro Azul Blanco Verde Blanco

a. Realice un gráfico circular b. Realice un gráfico de barras de frecuencia absoluta c. Con los gráficos obtenidos ¿Qué puede observar acerca del color de auto?

10. La gerente de la tienda de ropa Fashion Woman desea elaborar un gráfico que le permita iden-

tificar claramente las principales quejas de sus clientas. Además, desea mostrar en el mismo gráfico, las frecuencias acumuladas de las principales quejas. En el presente mes, la gerente realizó entre algunas de sus clientas una encuesta obteniendo los siguientes resultados:

Queja Número de clientas

Los precios son muy caros 10

La atención de las vendedoras no es cordial 30

Los diseños no son muy de moda 37

El horario de atención es muy restringido 5

Otras razones 18

¿A qué conclusión llegará el gerente con el gráfico obtenido?

11. Se tiene información de una muestra de 805 hogares según nivel socioeconómico y área de

residencia. Los resultados se presentan a continuación:

Nivel socioeconómico Área de residencia

Total Área urbana Área rural

NSE A 15 2 17

NSE B 48 3 51

NSE C 105 145 250

NSE D 94 175 269

NSE E 38 180 218

Total 300 505 805

a. ¿Cuál sería el título apropiado para la tabla anterior?

b. De la tabla anterior:

Calcule el número de hogares que pertenecen al NSE B o C.

Calcule el número de hogares que pertenecen al NSE B y son del área urbana.

Del total de hogares del área rural, calcule el porcentaje que son del NSE A.

Del total de hogares del NSE C, calcule el porcentaje que son del área urbana. c. Elabore una gráfica de barras apiladas al 100%. Interprete.

Page 84: 2015 Separata

Capítulo 1. Organización de datos 85

12. La siguiente tabla muestra el total de productos con quiebre de stock por sección y por motivo del quiebre en el supermercado El Regalón.

Sección Artículo

descontinuado

Problema comercial

Problema stock teórico

Quiebre logístico

Total

Bebidas 2 12 16 88 118

Comestibles 4 25 56 220 305

Cuidado personal 2 14 15 84 115

Total 8 51 87 392 538

Construya un gráfico de barras apiladas al 100% por motivo del quiebre según sección.

Page 85: 2015 Separata
Page 86: 2015 Separata

Capítulo 2. Resúmenes de datos 87

Capítulo 2. Resúmenes de datos

Medidas de tendencia central

Son aquellas medidas que localizan el centro de una distribución, indicando el valor alrededor del cual tienden a concentrarse o distribuirse las demás observaciones. El objetivo es conseguir un va-lor que sea representativo del conjunto total de datos que se está analizando.

Media aritmética

La media aritmética (media o promedio) de un conjunto de valores de una variable es la suma de dichos valores dividida entre el número de valores. Se denota por x , M(X)

Para su cálculo se usará la siguiente expresión n

x

x

n

i

i 1

El ingreso promedio mensual en Lima aumentó un 3,9%

Noviembre del 2012

El mayor crecimiento, de 7,2%, se observó entre la población con educación técnica.

El INEI informó que durante el tercer trimestre móvil (agosto-octubre) del 2012 el ingreso promedio mensual en Lima Metropolitana fue de S/.1 311,8; registrando un incremento de 3,9%(S/.49,3 nue-vos soles) en relación al año anterior.

El salario mensual de los hombres llegó a S/.1 536 y el de las mujeres, a S/. 1016,9; lo que represen-tó un aumento de 4,3% y 3,5%, respectivamente.

Fuente: http:// www.gestion.pe/

Media aritmética en Excel

Con Excel 2010, use la función =PROMEDIO(datos)

Medidas de tendencia central

Media Mediana Moda

Page 87: 2015 Separata

88 Estadística Básica con Aplicaciones en Excel 2010

Ejemplo 19 Los siguientes datos corresponden al número de visitas al mes que una muestra de 30 estudiantes realizó a la cafetería de la universidad.

4 2 4 2 1 3 3 1 3 3 4 1 1 4 1

5 5 5 3 1 3 1 4 1 1 2 4 1 4 1

Calcule e interprete la media de la variable en estudio.

Solución

Con Excel 2010, use la función =PROMEDIO(datos)

El promedio de los ingresos mensuales de una muestra de 2,6 visitas al mes. Esto significa que en promedio los estudiantes visitan la cafetería de la universidad 2,6 veces al mes.

Ejercicio 27

Los siguientes datos corresponden a la estatura, en metros, de una muestra aleatoria de hombres peruanos de 18 años. Calcule e interprete la media de la estatura de la muestra.

1,73 1,73 1,84 1,71 1,61 1,50 1,78 1,50 1,90 1,81 1,72 1,84 1,75 1,69 1,63

1,51 1,77 1,81 1,77 1,80 1,68 1,56 1,71 1,78 1,49 1,57 1,71 1,82 1,66 1,69

Calcule e interprete el promedio de la variable en estudio

Solución

Con Excel 2010, use la función =PROMEDIO(datos)

El promedio de la estatura de una muestra de hombres peruanos de 18 años es ………………………..…. Esto significa que………………………………………………………………………………………………………………….……………

Propiedades de la media aritmética

• La media aritmética de una cantidad constante es la misma constante.

M(k) = k

• La media de una variable a la que se le suma o resta una constante equivale a la media de la variable más o menos dicha constante.

M(X k) = M(X) k

• La media de una variable multiplicada por una constante equivale a la media de la variable mul-tiplicada por dicha constante.

M(kX) = kM(X)

• En general, para dos constantes a y b tenemos.

M(aX b) = aM(X) b

Page 88: 2015 Separata

Capítulo 2. Resúmenes de datos 89

Ejemplo 20 Se sabe que los ingresos mensuales que perciben los trabajadores de una empresa tienen un pro-medio de 2800 nuevos soles, determine el nuevo ingreso promedio que se obtendría luego de reali-zar los siguientes aumentos: a. los ingresos de los trabajadores se incrementan en 250 nuevos soles. b. los ingresos se incrementan en un 7,5%. c. los ingresos se incrementan en un 12,5% más una bonificación de 125 nuevos soles.

Solución

Definamos las variables: X := antiguo ingreso de un trabajador y Y = nuevo ingreso de un trabajador

a. Y = X + 250, entonces M(Y) = M(X) + 250 = 2800 + 250 = 3 050 nuevos soles. b. Y = X + 0,075X = 1,075X, entonces M(Y) = M(1,075X) = (1,075)(2 800) = 3 010 nuevos soles. c. Y = X + 0,125X + 125 = 1,125X + 125. Entonces, M(Y) = (1,125)(2 800) + 125 = 3 275 nuevos soles.

Page 89: 2015 Separata

90 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 28

En una negociación por aumento de salarios, la gerencia de una empresa ofrece a sus empleados dos alternativas. La primera consiste en un aumento general del 5%, mientras que, la segunda con-siste en un aumento general del 2% más un bono de 150 nuevos soles. Indique la alternativa que da a los empleados el mayor promedio de sueldos, si la media de los sueldos es actualmente de 1 800 nuevos soles.

Solución

Alternativa 1

Alternativa 2

Mejor alternativa

Page 90: 2015 Separata

Capítulo 2. Resúmenes de datos 91

Ejercicio 29

La siguiente base de datos muestra las respuestas obtenidas de una encuesta realizada a una mues-tra de 40 empleados de una empresa de servicios.

ID Género Edad

(años) Categoría

laboral Tiempo de servicio

(meses) Número de hijos

Estado Civil

Ingreso mensual (en soles)

1 Masculino 35 Técnico/ventas 94 1 Divorciado 4658

2 Masculino 74 Gerencial 274 2 Casado 5678

3 Femenino 36 Profesional 99 0 Divorciado 4818

4 Masculino 42 Obrero 109 1 Conviviente 2550

5 Masculino 46 Producción 127 1 Casado 3220

6 Femenino 54 Obrero 142 1 Casado 2918

7 Femenino 45 Servicios 124 1 Divorciado 2855

8 Masculino 38 Obrero 94 1 Casado 2500

9 Femenino 25 Servicios 62 2 Divorciado 1405

10 Femenino 29 Producción 61 3 Divorciado 2699

11 Masculino 49 Apoyo/adm. 132 3 Divorciado 3053

12 Masculino 48 Gerencial 132 1 Casado 5711

13 Masculino 41 Obrero 108 1 Casado 4957

14 Masculino 59 Gerencial 160 0 Divorciado 5784

15 Masculino 63 Gerencial 200 3 Casado 6316

16 Masculino 73 Profesional 200 2 Divorciado 4670

17 Masculino 35 Gerencial 94 1 Casado 5940

18 Masculino 43 Obrero 120 4 Casado 4860

19 Masculino 43 Gerencial 121 4 Casado 5315

20 Masculino 72 Obrero 280 2 Conviviente 5071

21 Masculino 45 Gerencial 124 3 Divorciado 5612

22 Masculino 35 Técnico/ventas 94 3 Casado 4956

23 Masculino 74 Obrero 192 4 Casado 4831

24 Masculino 57 Gerencial 146 3 Casado 6512

25 Masculino 72 Obrero 186 4 Divorciado 4892

26 Masculino 42 Gerencial 112 1 Casado 5599

27 Masculino 48 Gerencial 132 1 Conviviente 4978

28 Masculino 42 Obrero 111 2 Divorciado 4602

29 Masculino 36 Gerencial 100 1 Conviviente 5678

30 Masculino 57 Gerencial 145 1 Casado 5475

31 Masculino 59 Profesional 150 1 Casado 4313

32 Masculino 59 Profesional 160 3 Casado 4818

33 Masculino 63 Obrero 200 2 Divorciado 4892

34 Masculino 38 Profesional 99 1 Conviviente 4978

35 Masculino 42 Gerencial 112 4 Divorciado 6036

36 Femenino 65 Producción 171 2 Conviviente 4032

37 Masculino 52 Producción 139 4 Divorciado 3904

38 Masculino 42 Gerencial 112 1 Conviviente 5599

39 Masculino 72 Profesional 186 2 Divorciado 4670

40 Masculino 69 Profesional 182 2 Divorciado 3482

En una negociación por aumento de salarios, la gerencia de la empresa ofrece a sus empleados dos alternativas. La primera consiste en un aumento general del 6%, mientras que, la segunda consiste en un aumento general del 3% más un bono de 120 nuevos soles por concepto de refrigerio. Indi-que la alternativa que da a los empleados el mayor promedio de sueldos.

Page 91: 2015 Separata

92 Estadística Básica con Aplicaciones en Excel 2010

Solución

Alternativa 1

Alternativa 2

Mejor alternativa

Page 92: 2015 Separata

Capítulo 2. Resúmenes de datos 93

Mediana

La mediana de un conjunto de datos observados de una variable es el valor que ocupa la posición central una vez puestos los datos en orden de magnitud. La mediana es el valor tal que aproxima-damente el 50% de las observaciones son menores o iguales a su valor.

Características de la mediana

Se puede calcular para variables medidas en escala de ordinal, intervalo o razón.

La mediana es un estadístico robusto, es decir, no se ve afectada por valores extremos. Por eso se le utiliza cuando hay datos inusuales o la distribución de frecuencias no es simétrica.

Mediana en Excel

Con Excel 2010, use la función =MEDIANA(datos) Ejemplo 21 Los siguientes datos corresponden al número de visitas que realizó el presente mes una muestra de30 estudiantes a la cafetería de la universidad.

4 2 4 2 1 3 3 1 3 3

5 5 5 3 1 3 1 4 1 1

4 1 1 4 1 2 4 1 4 1

Calcule e interprete la mediana de la variable en estudio.

Solución

Con Excel 2010, use la función =MEDIANA(datos) La mediana del número de visitas es igual a tres veces al mes, esto significa que el 50% de los estu-diantes visitaron la cafetería de la universidad como máximo tres veces al mes.

Page 93: 2015 Separata

94 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 30

A continuación, se presenta la información de una muestra aleatoria de 15 profesionales egresados de la carrera de Administración.

Número Género Edad Estatura Número Género Edad Estatura

1 Hombre 15 154 9 Hombre 22 168

2 Hombre 19 154 10 Mujer 31 161

3 Hombre 21 156 11 Mujer 31 171

4 Hombre 34 184 12 Mujer 28 175

5 Hombre 21 173 13 Mujer 31 187

6 Hombre 24 170 14 Mujer 28 161

7 Hombre 30 176 15 Mujer 24 172

8 Hombre 26 188

Calcule e interprete el valor de la mediana de la edad para el grupo de hombres y para el grupo de mujeres.

Solución

Con Excel 2010, use la función =MEDIANA(datos) La mediana de la edad para el grupo de hombres es igual a 22 años, esto significa que el 50% de los hombres tiene una edad igual o menor a 22 años

La mediana de la edad para el grupo de mujeres es igual a ……………………………….. años, esto significa

que….………………………………………………………………………………………………………………………………………….……..

Ejercicio 31

La siguiente base de datos muestra las respuestas obtenidas de una encuesta realizada a una mues-tra de 40 empleados de una empresa de servicios.

ID Género Edad

(años) Categoría

laboral Tiempo de servicio

(meses) Número de hijos

Estado Civil

Ingreso mensual (en soles)

1 Masculino 35 Técnico/ventas 94 1 Divorciado 4658

2 Masculino 74 Gerencial 274 2 Casado 5678

3 Femenino 36 Profesional 99 0 Divorciado 4818

4 Masculino 42 Obrero 109 1 Conviviente 2550

5 Masculino 46 Producción 127 1 Casado 3220

6 Femenino 54 Obrero 142 1 Casado 2918

7 Femenino 45 Servicios 124 1 Divorciado 2855

8 Masculino 38 Obrero 94 1 Casado 2500

9 Femenino 25 Servicios 62 2 Divorciado 1405

10 Femenino 29 Producción 61 3 Divorciado 2699

11 Masculino 49 Apoyo/adm. 132 3 Divorciado 3053

12 Masculino 48 Gerencial 132 1 Casado 5711

13 Masculino 41 Obrero 108 1 Casado 4957

14 Masculino 59 Gerencial 160 0 Divorciado 5784

15 Masculino 63 Gerencial 200 3 Casado 6316

16 Masculino 73 Profesional 200 2 Divorciado 4670

Page 94: 2015 Separata

Capítulo 2. Resúmenes de datos 95

17 Masculino 35 Gerencial 94 1 Casado 5940

18 Masculino 43 Obrero 120 4 Casado 4860

19 Masculino 43 Gerencial 121 4 Casado 5315

20 Masculino 72 Obrero 280 2 Conviviente 5071

21 Masculino 45 Gerencial 124 3 Divorciado 5612

22 Masculino 35 Técnico/ventas 94 3 Casado 4956

23 Masculino 74 Obrero 192 4 Casado 4831

24 Masculino 57 Gerencial 146 3 Casado 6512

25 Masculino 72 Obrero 186 4 Divorciado 4892

26 Masculino 42 Gerencial 112 1 Casado 5599

27 Masculino 48 Gerencial 132 1 Conviviente 4978

28 Masculino 42 Obrero 111 2 Divorciado 4602

29 Masculino 36 Gerencial 100 1 Conviviente 5678

30 Masculino 57 Gerencial 145 1 Casado 5475

31 Masculino 59 Profesional 150 1 Casado 4313

32 Masculino 59 Profesional 160 3 Casado 4818

33 Masculino 63 Obrero 200 2 Divorciado 4892

34 Masculino 38 Profesional 99 1 Conviviente 4978

35 Masculino 42 Gerencial 112 4 Divorciado 6036

36 Femenino 65 Producción 171 2 Conviviente 4032

37 Masculino 52 Producción 139 4 Divorciado 3904

38 Masculino 42 Gerencial 112 1 Conviviente 5599

39 Masculino 72 Profesional 186 2 Divorciado 4670

40 Masculino 69 Profesional 182 2 Divorciado 3482

Calcule e interprete el valor de la mediana del tiempo de servicio para el grupo de hombres y para el grupo de mujeres.

Solución

Ubique el cursor en cualquier celda de la primera fila de la base de datos.

Del menú principal elija la opción Inicio/Ordenar y filtrar

Haga clic en el menú despegable de la variable Género, desactive la opción Seleccionar todo y active la opción Femenino.

Una vez obtenido el filtro seleccione el Rango de celdas de la variable Tiempo de servicio. Copie y pegue el filtro en una hoja nueva o por debajo de la base de datos pero nunca al costado.

Con Excel 2010, use la función =MEDIANA(datos)

Repita el mismo procedimiento para el caso del grupo Masculino.

Entonces el resultado será: La mediana del tiempo de servicio para el grupo de hombres es igual a ………………………… meses,

esto significa que el 50% de ………………………………………………………………………………………………………………

………………………………………………………………………………………………………………………………………………………….

La mediana del tiempo de servicio para el grupo de mujeres es igual a ………………………… meses, esto

significa que ………………………………………………………………………………………………………………………………………

Page 95: 2015 Separata

96 Estadística Básica con Aplicaciones en Excel 2010

Moda

La moda de un conjunto de datos observados de una variable es el valor que se presenta con mayor frecuencia. Características de la moda

La moda se puede calcular para cualquier escala de medición.

El valor de la moda no se ve afectada por valores extremos.

La moda no siempre es un valor único. Una serie de datos puede tener dos modas (bimodal) o más de dos modas (multimodal). Algunas series de datos no tienen moda.

Un conjunto de datos pudiera incluso no tener moda.

La moda es una medida menos importante que la mediana o la media debido a su ambigüe-dad.

Moda en Excel

En Excel 2010, existen dos funciones para calcular la moda .

use la función =MODA.UNO(datos) solo si los datos tuvieran una moda.

use la función =MODA.VARIOS(datos) si los datos tuvieran más de una moda. Recomendamos usar esta función pues de antemano no sabemos si el conjunto de datos con los cuales esta-mos trabajando tienen más de una moda.

Ejemplo 22 Los siguientes datos corresponden al número de visitas que realizó el presente mes una muestra de 30 estudiantes a la cafetería de la universidad.

4 2 4 2 1 3 3 1

5 5 5 3 1 3 1 4

4 1 1 4 1 2 4 1

3 1 1 3 1 4

Calcule e interprete la moda de la variable en estudio.

Solución

En este caso, el resultado es igual a una vez al mes. Esto significa que los estudiantes visitan con mayor frecuencia la cafetería de la universidad una vez al mes.

Page 96: 2015 Separata

Capítulo 2. Resúmenes de datos 97

Ejercicio 32

A continuación, se presenta la información de una muestra aleatoria de 15 profesionales egresados de la carrera de Administración.

Número Género Edad Estatura (en cm)

Número Género Edad Estatura (en cm)

1 Hombre 15 154 9 Hombre 22 168

2 Hombre 19 154 10 Mujer 31 161

3 Hombre 21 156 11 Mujer 31 171

4 Hombre 34 184 12 Mujer 28 175

5 Hombre 21 173 13 Mujer 31 187

6 Hombre 24 170 14 Mujer 28 161

7 Hombre 30 176 15 Mujer 24 172

8 Hombre 26 188

Calcule e interprete la moda de la estatura.

Solución

Primero, seleccione un rango de celdas donde aparecerá la moda o las modas.

A continuación, use la función =MODA.VARIOS(datos)

Finalmente, presione las teclas Ctrl, Shift y Enter En este caso, el resultado son dos modas, la primera moda es igual a ………………….. cm. y la segunda

moda es igual a ………………………….. cm. Esto significa que .………………………………………………………………..

…………………………………………………………………………………………………………………………………………………………..

Ejercicio 33

La siguiente base de datos muestra las respuestas obtenidas de una encuesta realizada a una mues-tra de 40 empleados de una empresa de servicios.

ID Género Edad

(años) Categoría

laboral Tiempo de servicio

(meses) Número de hijos

Estado Civil

Ingreso mensual (en soles)

1 Masculino 35 Técnico/ventas 94 1 Divorciado 4658

2 Masculino 74 Gerencial 274 2 Casado 5678

3 Femenino 36 Profesional 99 0 Divorciado 4818

4 Masculino 42 Obrero 109 1 Conviviente 2550

5 Masculino 46 Producción 127 1 Casado 3220

6 Femenino 54 Obrero 142 1 Casado 2918

7 Femenino 45 Servicios 124 1 Divorciado 2855

8 Masculino 38 Obrero 94 1 Casado 2500

9 Femenino 25 Servicios 62 2 Divorciado 1405

10 Femenino 29 Producción 61 3 Divorciado 2699

11 Masculino 49 Apoyo/adm. 132 3 Divorciado 3053

12 Masculino 48 Gerencial 132 1 Casado 5711

13 Masculino 41 Obrero 108 1 Casado 4957

14 Masculino 59 Gerencial 160 0 Divorciado 5784

15 Masculino 63 Gerencial 200 3 Casado 6316

16 Masculino 73 Profesional 200 2 Divorciado 4670

17 Masculino 35 Gerencial 94 1 Casado 5940

18 Masculino 43 Obrero 120 4 Casado 4860

Page 97: 2015 Separata

98 Estadística Básica con Aplicaciones en Excel 2010

19 Masculino 43 Gerencial 121 4 Casado 5315

20 Masculino 72 Obrero 280 2 Conviviente 5071

21 Masculino 45 Gerencial 124 3 Divorciado 5612

22 Masculino 35 Técnico/ventas 94 3 Casado 4956

23 Masculino 74 Obrero 192 4 Casado 4831

24 Masculino 57 Gerencial 146 3 Casado 6512

25 Masculino 72 Obrero 186 4 Divorciado 4892

26 Masculino 42 Gerencial 112 1 Casado 5599

27 Masculino 48 Gerencial 132 1 Conviviente 4978

28 Masculino 42 Obrero 111 2 Divorciado 4602

29 Masculino 36 Gerencial 100 1 Conviviente 5678

30 Masculino 57 Gerencial 145 1 Casado 5475

31 Masculino 59 Profesional 150 1 Casado 4313

32 Masculino 59 Profesional 160 3 Casado 4818

33 Masculino 63 Obrero 200 2 Divorciado 4892

34 Masculino 38 Profesional 99 1 Conviviente 4978

35 Masculino 42 Gerencial 112 4 Divorciado 6036

36 Femenino 65 Producción 171 2 Conviviente 4032

37 Masculino 52 Producción 139 4 Divorciado 3904

38 Masculino 42 Gerencial 112 1 Conviviente 5599

39 Masculino 72 Profesional 186 2 Divorciado 4670

40 Masculino 69 Profesional 182 2 Divorciado 3482

Calcule e interprete el valor de la moda del número de hijos para el grupo de hombres y para el grupo de mujeres.

Solución

Ubique el cursor en cualquier celda de la primera fila de la base de datos.

Del menú principal elija la opción Inicio/Ordenar y filtrar

Haga clic en el menú despegable de la variable Género, desactive la opción Seleccionar todo y active la opción Femenino.

Una vez obtenido el filtro seleccione el Rango de celdas de la variable Número de hijos. Copie y pegue el filtro en una hoja nueva o por debajo de la base de datos pero nunca al costado.

Con Excel 2010, use la función =MODA.VARIOS(datos)

Repita el mismo procedimiento para el caso del grupo Masculino.

Entonces el resultado será: La moda del número de hijos para el grupo de hombres es igual a ………………………… hijos, esto signi-

fica que ……………………………..………………………………………………………………………………………………………………

………………………………………………………………………………………………………………………………………………………….

La moda del número de hijos para el grupo de mujeres es igual a ………………………… hijos, esto signi-

fica que ……………………………..………………………………………………………………………………………………………………

………………………………………………………………………………………………………………………………………………………….

Page 98: 2015 Separata

Capítulo 2. Resúmenes de datos 99

Ejercicio 34

La siguiente base de datos muestra las respuestas obtenidas de una encuesta realizada a una mues-tra de 40 empleados de una empresa de servicios.

ID Género Edad

(años) Categoría

laboral Tiempo de servicio

(meses) Número de hijos

Estado Civil

Ingreso mensual (en soles)

1 Masculino 35 Técnico/ventas 94 1 Divorciado 4658

2 Masculino 74 Gerencial 274 2 Casado 5678

3 Femenino 36 Profesional 99 0 Divorciado 4818

4 Masculino 42 Obrero 109 1 Conviviente 2550

5 Masculino 46 Producción 127 1 Casado 3220

6 Femenino 54 Obrero 142 1 Casado 2918

7 Femenino 45 Servicios 124 1 Divorciado 2855

8 Masculino 38 Obrero 94 1 Casado 2500

9 Femenino 25 Servicios 62 2 Divorciado 1405

10 Femenino 29 Producción 61 3 Divorciado 2699

11 Masculino 49 Apoyo/adm. 132 3 Divorciado 3053

12 Masculino 48 Gerencial 132 1 Casado 5711

13 Masculino 41 Obrero 108 1 Casado 4957

14 Masculino 59 Gerencial 160 0 Divorciado 5784

15 Masculino 63 Gerencial 200 3 Casado 6316

16 Masculino 73 Profesional 200 2 Divorciado 4670

17 Masculino 35 Gerencial 94 1 Casado 5940

18 Masculino 43 Obrero 120 4 Casado 4860

19 Masculino 43 Gerencial 121 4 Casado 5315

20 Masculino 72 Obrero 280 2 Conviviente 5071

21 Masculino 45 Gerencial 124 3 Divorciado 5612

22 Masculino 35 Técnico/ventas 94 3 Casado 4956

23 Masculino 74 Obrero 192 4 Casado 4831

24 Masculino 57 Gerencial 146 3 Casado 6512

25 Masculino 72 Obrero 186 4 Divorciado 4892

26 Masculino 42 Gerencial 112 1 Casado 5599

27 Masculino 48 Gerencial 132 1 Conviviente 4978

28 Masculino 42 Obrero 111 2 Divorciado 4602

29 Masculino 36 Gerencial 100 1 Conviviente 5678

30 Masculino 57 Gerencial 145 1 Casado 5475

31 Masculino 59 Profesional 150 1 Casado 4313

32 Masculino 59 Profesional 160 3 Casado 4818

33 Masculino 63 Obrero 200 2 Divorciado 4892

34 Masculino 38 Profesional 99 1 Conviviente 4978

35 Masculino 42 Gerencial 112 4 Divorciado 6036

36 Femenino 65 Producción 171 2 Conviviente 4032

37 Masculino 52 Producción 139 4 Divorciado 3904

38 Masculino 42 Gerencial 112 1 Conviviente 5599

39 Masculino 72 Profesional 186 2 Divorciado 4670

40 Masculino 69 Profesional 182 2 Divorciado 3482

Calcule e interprete el valor de las medidas de tendencia central para el tiempo de servicio por ca-tegoría laboral.

Page 99: 2015 Separata

100 Estadística Básica con Aplicaciones en Excel 2010

Solución

Ubique el cursor en cualquier celda de la primera fila de la base de datos

Del menú principal elija la opción Inicio/Ordenar y filtrar

Haga clic en el menú despegable de la variable Estado civil, desactive la opción Seleccionar todo y active la opción Casado.

Una vez obtenido el filtro seleccione el Rango de celdas de la variable Tiempo de servicio. Copie y pegue el filtro en una hoja nueva o por debajo de la base de datos pero nunca al costado.

A continuación usaremos la opción Análisis de datos para obtener las medidas de tendencia central:

En el menú principal elija la opción Datos/Análisis de datos/Estadística descriptiva

En Rango de entrada seleccione el rango de celdas que contiene los datos de la variable fil-trada.

Dé clic a Rótulo en la primera fila dado que nuestros datos tienen en la primera fila el nombre de la variable.

Dé clic a Rango de salida y ubique el cursor dentro del recuadro y a continuación dé clic en una celda en blanco donde Excel le colocará los resultados del análisis.

Finalmente, dé clic a Resumen de estadísticas y Aceptar

Realice el mismo procedimiento para las categorías Conviviente y Divorciado.

La salida obtenida:

Estadísticos Tiempo de servicio

(meses) Casado

Tiempo de servicio (meses)

Conviviente

Tiempo de servicio (meses)

Divorciado

Media 141.823529 143.285714 135.75

Error típico 11.166927 24.6766849 11.4802366

Mediana 132 112 128

Moda 94 #N/A 124

Desviación estándar 46.0424197 65.2883713 45.9209466

Varianza de la muestra 2119.90441 4262.57143 2108.73333

Curtosis 3.26127103 3.8372381 1.06145333

Coeficiente de asimetría 1.61260652 1.95880668 0.05949087

Rango 180 181 139

Mínimo 94 99 61

Máximo 274 280 200

Suma 2411 1003 2172

Cuenta 17 7 16

Observaciones • Con la opción Análisis de datos Excel no puede identificar si los datos tienen más de una moda. • De existir más de una moda Excel solo le mostrará la primera que encuentre. • Se recomienda usar la función Moda. Varios vista anteriormente. • El valor #N/A significa que no existe moda para el conjunto de datos.

Page 100: 2015 Separata

Capítulo 2. Resúmenes de datos 101

Casado:

Media: ………….….

Mediana: ……….…

Moda: ……………..

Conviviente:

Media: ………….….

Mediana: ……….…

Moda: ……………..

Divorciado:

Media: ………….….

Mediana: ……….…

Moda: ……………..

Page 101: 2015 Separata

102 Estadística Básica con Aplicaciones en Excel 2010

Media ponderada

Se usará la siguiente expresión para su cálculo:

n

i

i

n

i

ii

w

w

wx

x

1

1

donde:

ix : Dato individual.

iw : Peso asignado a cada dato

Ejemplo 23 María y Pedro dedican ocho horas por semana a hacer deporte. Otros ocho estudiantes dedican cada semana cuatro horas a hacer deporte. María y Pedro dedican, además, una hora cada semana a escuchar música y los otros ocho estudiantes, tres horas. a. ¿Cuál es el número medio de horas que hacen deporte cada semana los 10 estudiantes? b. ¿Cuál es el número medio de horas que escuchan música los 10 estudiantes? c. ¿Cuál sería el número medio de horas que estos 10 estudiantes dedican, cada semana, entre las

dos actividades: hacer deporte y escuchar música? Solución a. ¿Cuál es el número medio de horas que hacen deporte cada semana los 10 estudiantes?

horasxDeporte 8,482

4882

b. ¿Cuál es el número medio de horas que escuchan música los 10 estudiantes?

horasxMúsica 6,282

3812

c. ¿Cuál sería el número medio de horas que estos 10 estudiantes dedican, cada semana, entre las

dos actividades: hacer deporte y escuchar música?

horasx músicay Deporte 7,31010

6,2108,410

Se utiliza cuando los datos a promediar no tienen la misma importancia relativa

dentro del conjunto total,

es decir, algunos datos tiene mayor importancia, peso o ponderación dentro del

conjunto de observaciones.

Page 102: 2015 Separata

Capítulo 2. Resúmenes de datos 103

Ejercicio 35

Las notas de un alumno de cierto curso son:

EC1 EC2 EC3 CL Trabajo EB

12 18 15 14 15 14

Si el peso de las evaluaciones continuas (EC) son 5%, 7% y 8% respectivamente, del control de lec-tura (CL) 20%, del examen final 35% y del trabajo final 25% ¿cuál es el promedio final del alumno?

Solución

En Excel 2010, construya la siguiente tabla:

Evaluación Nota Peso Nota x Peso

EC1 12

EC2 18

EC3 15

CL 14

Trabajo 15

EB 14

Multiplique cada nota por su peso.

Calcule los totales de las columnas Peso y Nota x Peso

Divida según la fórmula.

.............................................

...........................

1

1

n

i

i

n

i

ii

w

w

wx

x

El promedio final del alumno es ………………………

Page 103: 2015 Separata

104 Estadística Básica con Aplicaciones en Excel 2010

Medidas de posición o cuantiles

Las medidas de posición o cuantiles son los valores que determinan la posición de un dato respecto a todos los demás datos de una serie y que previamente ha sido ordenada de menor a mayor. Los cuantiles más importantes dividen a los datos ordenados de menor a mayor en 4, 10 y 100 can-tidades iguales de datos, denominándose cuartiles, deciles y percentiles, respectivamente.

Percentil k

Cuantiles

Cuartiles

(en 4)

Dividen el conjunto de datos en cuatro partes porcentualmente iguales

Se les denota como Q1, Q2 y Q3 respectivamente.

Se denomina así a cada uno de los tres percentiles: P25, P50, P75.

Deciles

(en 10)

Dividen el conjunto de datos en 10 partes porcentualmente iguales.

Se les denota como D1 , D2, D3, …, D9 respectivamente.

Se denomina así a cada uno de los nueve percentiles: P10, P20, ..., P90.

Percentiles

(en 100)

Dividen el conjunto de datos en 100 partes porcentualmente iguales.

El percentil k, Pk. es el valor numérico tal que aproximadamente el k por ciento de los datos ordenados está por debajo de ese valor y el (100 – k) por ciento de los datos está por encima de ese valor.

Page 104: 2015 Separata

Capítulo 2. Resúmenes de datos 105

Percentil en Excel

En Excel 2010, hay dos funciones para calcular un percentil:

Para calcular el percentil k use la función =PERCENTIL.EXC(datos,k/100)

Para calcular el percentil k use la función =PERCENTIL.INC(datos,k/100)

La diferencia entre las funciones =PERCENTIL.INC y =PERCENTIL.EXC es que, en la primera el valor de k es está dentro del rango de 0 a 1, ambos inclusive, y en la segunda, el valor de k está dentro del intervalo 0 a 1 exclusivo. Ejemplo 24 A continuación se presentan los ingresos mensuales (en nuevos soles) de 12 trabajadores.

2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325

a. Calcule el valor del percentil 25 b. Calcule el valor del percentil 85

Solución

a. Calcule el valor del percentil 25 Para calcular el percentil 25 en Excel 2010, use la función =PERCENTIL.EXC(datos,0.25) El valor del percentil 25 es 2857,50 nuevos soles; esto quiere decir que el 25% de los trabajadores tienen un ingreso mensual máximo de 2857,50 nuevos soles.

b. Calcule el valor del percentil 85 Para calcular el percentil 85 en Excel 2010, use la función =PERCENTIL.EXC(datos,0.85) El valor del percentil 85 es 3139,75 nuevos soles; esto quiere decir que el 85% de los trabajadores tienen un ingreso mensual máximo de 3139,75 nuevos soles.

Page 105: 2015 Separata

106 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 36

En muchos procesos de manufactura se utiliza el término “Trabajo en proceso” (TEM). En un taller que procesa libros, el TEM representa el tiempo que transcurre para que se doblen, junten, cosan, peguen por un extremo y encuadernen las hojas procedentes de la prensa. El tiempo de procesa-miento (TDP), se define de forma operacional como el tiempo, en días, transcurrido desde que las hojas salen de la prensa hasta que los libros se empacan en cajas. Para una muestra de 80 libros se ha registrado el TDP en la siguiente tabla:

10,4 11,6 7,1 8,1 10,4 11,7 10,3 8,1 11,6 10,4 11,6 9,7 8,9 7,9 9,8 7,4

6,8 11,1 6,5 5,4 8,0 13,7 12,3 9,6 13,3 10,6 14,1 11,5 9,5 13,6 7,4 8,7

10,2 14,7 10,3 10,0 13,9 9,3 7,4 12,1 8,7 12,6 6,9 10,8 9,6 6,0 10,2 8,0

11,7 7,2 10,9 6,1 13,0 10,8 9,9 10,0 14,3 9,8 9,2 11,5 11,5 10,9 8,5 11,1

9,8 9,0 9,6 9,8 10,8 11,1 10,3 10,1 9,8 12,8 7,4 9,4 8,8 9,6 11,2 9,8

a. Calcule e interprete el percentil 25 de los tiempos de procesamiento (TDP).

Solución

Para calcular el percentil 25 en Excel 2010, use la función =PERCENTIL.EXC(datos,0,25) El valor del percentil 25 es ……………………., esto quiere decir que ……………..

b. Calcule el tiempo de procesamiento (TDP) mínimo para estar en el 15% de los libros con mayo-

res tiempos de procesamiento (TDP).

Solución

Para cumplir con lo pedido debemos calcular el percentil ………….. cuyo valor es: …………..… c. Calcule el tiempo de procesamiento (TDP) máximo para estar en el 15% de los libros con meno-

res tiempos de procesamiento (TDP).

Solución

Para cumplir con lo pedido debemos calcular el percentil …………... cuyo valor es: …………..…

Page 106: 2015 Separata

Capítulo 2. Resúmenes de datos 107

Ejercicio 37

La siguiente base de datos muestra las respuestas obtenidas de una encuesta realizada a una mues-tra de 40 empleados de una empresa de servicios.

ID Género Edad

(años) Categoría

laboral Tiempo de servicio

(meses) Número de hijos

Estado Civil

Ingreso mensual (en soles)

1 Masculino 35 Técnico/ventas 94 1 Divorciado 4658

2 Masculino 74 Gerencial 274 2 Casado 5678

3 Femenino 36 Profesional 99 0 Divorciado 4818

4 Masculino 42 Obrero 109 1 Conviviente 2550

5 Masculino 46 Producción 127 1 Casado 3220

6 Femenino 54 Obrero 142 1 Casado 2918

7 Femenino 45 Servicios 124 1 Divorciado 2855

8 Masculino 38 Obrero 94 1 Casado 2500

9 Femenino 25 Servicios 62 2 Divorciado 1405

10 Femenino 29 Producción 61 3 Divorciado 2699

11 Masculino 49 Apoyo/adm. 132 3 Divorciado 3053

12 Masculino 48 Gerencial 132 1 Casado 5711

13 Masculino 41 Obrero 108 1 Casado 4957

14 Masculino 59 Gerencial 160 0 Divorciado 5784

15 Masculino 63 Gerencial 200 3 Casado 6316

16 Masculino 73 Profesional 200 2 Divorciado 4670

17 Masculino 35 Gerencial 94 1 Casado 5940

18 Masculino 43 Obrero 120 4 Casado 4860

19 Masculino 43 Gerencial 121 4 Casado 5315

20 Masculino 72 Obrero 280 2 Conviviente 5071

21 Masculino 45 Gerencial 124 3 Divorciado 5612

22 Masculino 35 Técnico/ventas 94 3 Casado 4956

23 Masculino 74 Obrero 192 4 Casado 4831

24 Masculino 57 Gerencial 146 3 Casado 6512

25 Masculino 72 Obrero 186 4 Divorciado 4892

26 Masculino 42 Gerencial 112 1 Casado 5599

27 Masculino 48 Gerencial 132 1 Conviviente 4978

28 Masculino 42 Obrero 111 2 Divorciado 4602

29 Masculino 36 Gerencial 100 1 Conviviente 5678

30 Masculino 57 Gerencial 145 1 Casado 5475

31 Masculino 59 Profesional 150 1 Casado 4313

32 Masculino 59 Profesional 160 3 Casado 4818

33 Masculino 63 Obrero 200 2 Divorciado 4892

34 Masculino 38 Profesional 99 1 Conviviente 4978

35 Masculino 42 Gerencial 112 4 Divorciado 6036

36 Femenino 65 Producción 171 2 Conviviente 4032

37 Masculino 52 Producción 139 4 Divorciado 3904

38 Masculino 42 Gerencial 112 1 Conviviente 5599

39 Masculino 72 Profesional 186 2 Divorciado 4670

40 Masculino 69 Profesional 182 2 Divorciado 3482

a. Calcule e interprete el valor de los percentiles P25 y P60 para el ingreso mensual por género.

b. Calcule e interprete el valor de los percentiles P20 y P90 para el tiempo de servicio por género.

Page 107: 2015 Separata

108 Estadística Básica con Aplicaciones en Excel 2010

Solución

a. Calcule e interprete el valor de los percentiles P25 y P60 para el ingreso mensual por género. Ingreso mensual del grupo de hombres:

P25 : ………….….

P60 : ……………..

Ingreso mensual del grupo de mujeres:

P25 : ………….….

P60 : ……………..

b. Calcule e interprete el valor de los percentiles P20 y P90 para el tiempo de servicio por género.

Tiempo de servicio para el grupo de hombres:

P20 : ………….….

P90 : ……………..

Tiempo de servicio para el grupo de mujeres:

P20 : ………….….

P90 : ……………..

Page 108: 2015 Separata

Capítulo 2. Resúmenes de datos 109

Ejercicios de aplicación

1. Una compañía vende cuatro tipos de vallas a los propietarios de locales. La instalación de la

valla del tipo A le cuesta a la compañía 20 nuevos soles por metro lineal, la tipo B le cuesta 12 nuevos soles por metro lineal, la tipo C le cuesta 8 nuevos soles por metro lineal y la tipo D le cuesta 6,5 nuevos soles por metro lineal. Ayer la compañía instaló 100 metros de A, 150 metros de B, 75 metros de C y 200 metros de D. ¿cuál fue el costo medio del metro de valla instalado ayer?

2. Una empresa de consultorías se especializa en leyes empresariales. Cobran 275 dólares la hora

de investigación de un caso, 180 dólares la hora de asesoría, y 200 dólares la hora de redacción de un expediente. La semana pasada uno de los consultores dedicó 12 horas a la investigación del caso, 10 horas de asesoría a un cliente, y 16 horas a la redacción del expediente. ¿Cuál fue el monto promedio de honorarios de este consultor por hora?

3. En la actualidad todos los vehículos que circulan en Lima Metropolitana deben pasar las revi-

siones técnicas con el fin de reducir el nivel de contaminación en la ciudad. Inicialmente la em-presa encargada de dichas revisiones contaba con dos plantas (Cono Norte y Cono Sur) y era de interés investigar si se necesitaba abrir más plantas analizando el tiempo de atención por vehículo. Los tiempos (en minutos) que se demoraron en ser atendidos una muestra aleatoria de vehículos particulares que asistieron a cada una de las plantas se presenta a continuación:

Cono Norte Cono Sur

Número de vehículo

Tiempo Número de

vehículo Tiempo

Número de vehículo

Tiempo Número de

vehículo Tiempo

1 9,0 12 13,1 1 10,2 12 11,8

2 11,9 13 13,2 2 10,2 13 11,8

3 12,6 14 13,5 3 10,3 14 12,2

4 12,6 15 13,5 4 10,8 15 12,2

5 12,6 16 13,7 5 10,8 16 12,3

6 12,8 17 13,8 6 10,9 17 13,3

7 12,8 18 13,8 7 10,9 18 13,3

8 12,8 19 14,1 8 10,9 19 13,4

9 12,9 20 14,1 9 11,2 20 13,4

10 12,9 21 14,3 10 11,6 21 13,4

11 13,1 22 15,1 11 11,8 22 21,3

a. ¿En cuál de las plantas el tiempo promedio de atención es mayor? b. ¿En cuál de las plantas se tiene una mayor mediana? Interprete. c. ¿Cuál es el tiempo de atención más frecuente en ambas plantas? Interprete. d. ¿Cuál de be ser el tiempo de atención mínimo en la planta del cono norte para pertenecer

al 25% de los clientes que esperan más? e. ¿Cuál debe ser el tiempo de atención máximo en la planta del cono sur para pertenecer al

52% de los clientes que esperan menos? 4. Un agente de compras puso a prueba una muestra de 20 baterías de calculadoras de bolsillo de

un cierto fabricante. Cada batería se probó en una calculadora que estaba programada para lle-var a cabo un ciclo de cálculos ordinarios. El tiempo de vida, en horas, de cada batería se mues-tra a continuación:

Page 109: 2015 Separata

110 Estadística Básica con Aplicaciones en Excel 2010

11,98 11,99 12,02 12,03 12,04 12,05 12,06 12,08 12,08 12,08

12,09 12,09 12,14 12,18 12,19 12,20 12,21 12,21 12,23 12,25

Si el agente de compras quiere encontrar un tiempo máximo para el 18% de las baterías que du-ran menos y un tiempo mínimo para el 23% de los que duran más, ¿cuál serían esos tiempos de vida? Justifique numéricamente su respuesta.

5. Los gastos semanales en transporte urbano (nuevos soles) que efectúan los habitantes de las

ciudades en Vista Grande y Pueblo Hermoso han sido estudiados mediante muestras aleatorias independientes. Los datos captados fueron:

Gastos semanales en movilidad en Vista Grande

Gastos semanales en movilidad en Pueblo Hermoso

22,0 22,0 22,1 23,2 23,2 23,2 23,6 23,6

18,1 18,5 18,7 19,9 20,4 20,5 21,1

24,0 24,1 24,1 24,2 24,2 24,5 24,7 25,5

21,3 21,3 21,5 22,0 22,0 22,2 22,4

a. Estime e interprete las siguientes medidas de tendencia central: media, mediana y moda

para los gastos semanales en movilidad en la ciudad de Vista Grande. b. Calcule e interprete Q3, P10 y P36 para los gastos semanales en movilidad en la ciudad de

Pueblo Hermoso. 6. Un fabricante desea adquirir una máquina empaquetadora para el llenado de bolsas de apro-

ximadamente 150 gramos. Se realizan 20 ensayos con la máquina obteniéndose los siguientes pesos, en gramos:

143 145 146 148 149 150 150 150 150 150

150 150 150 150 150 151 152 154 155 155

a. Calcule e interprete la media, mediana y moda del peso de las bolsas empaquetadas por la

máquina. b. Si el equipo de medición que se empleó para medir los pesos de las bolsas producidas por

la máquina estaba descalibrado y los verdaderos pesos serían 10% menores a los medidos y, además, con una constante de menos dos gramos, ¿cuál es el peso promedio verdadero de bolsas de la máquina?

Page 110: 2015 Separata

Capítulo 2. Resúmenes de datos 111

Medidas de dispersión

Rango

El rango (amplitud o recorrido) de un conjunto de datos observados es la diferencia entre el dato mayor y el dato menor.

R = Xmax - Xmin

Características del rango

Se puede calcular en variables medidas en escala de intervalo o razón

Se ve muy afectado por valores extremos.

Con las medidas de tendencia central es posible determinar el valor central de una distribución, pero no indican qué tan cercanos o lejanos están los

datos de dicho valor central.

Las medidas de variabilidad indican cuán alejados están los valores de una variable del valor que los representa y

por lo tanto permiten evaluar la confiabilidad de ese valor central.

Cuando la medida de dispersión tiene un valor pequeño, los datos están concentrados alrededor de la medida de tendencia central,

en cambio si la medida de dispersión tiene un valor grande, los datos no están concentrados alrededor de la medida de tendencia central.

Algunas medidas de dispersión

Rango Rango

intercuartil Varianza

Desviación estándar

Coeficiente de variación

Page 111: 2015 Separata

112 Estadística Básica con Aplicaciones en Excel 2010

Rango intercuartil

Es la diferencia entre el tercer y primer cuartil. Es el rango del 50% central de los datos. El rango intercuartil elimina la influencia de los valores extremos.

Rango intercuartil = RIC = Q3 – Q1= P75 – P25

donde:

Q1 es el primer cuartil o percentil 25 Q3 es el tercer cuartil o percentil 75

Características del rango intercuartil

Se puede calcular en variables medidas en escala de intervalo o razón

No se ve afectado por valores extremos.

Rango intercuartil en Excel

Excel no calcula directamente el rango intercuartil, por lo que es necesario usar las funciones:

=PERCENTIL.EXC(datos,0.75) para calcular el valor del percentil 75,

=PERCENTIL.EXC(datos,0.25) para calcular el valor del percentil 25,

Luego el valor del rango intercuartil es P75 – P25.

Ejemplo 25 Ante la pregunta sobre el número de hijos por familia, una muestra de 12 hogares marcó las res-puestas mostradas en la siguiente tabla:

2 1 2 4 1 3 2 3 2 0 5 1

Calcule e interprete los valores del rango y rango intercuartil.

Solución

El rango R = máximo – mínimo = 5 - 0 = 5. Esto significa, que el rango o amplitud para el número de hijos por familia en la muestra de 12 hogares es 5 hijos.

El rango intercuartil RIC = 3 – 1= 2. Esto significa que la dispersión en el 50% de los datos centra-les del número de hijos en las familias es igual a dos hijos.

Page 112: 2015 Separata

Capítulo 2. Resúmenes de datos 113

Ejercicio 38

FibraTex S.A. es una empresa exportadora de fibra textil, actualmente cuenta con 18 operarios. Los datos que se presentan a continuación corresponden al tiempo de horas extras semanales trabaja-dos por todos sus operarios.

2,8 2,0 3,2 4,0 4,0 4,4 1,3 2,9 3,9 2,1 2,3 1,6 1,5 2,2 2,4 1,2 2,5 2,7

Calcule e interprete el rango y el rango intercuartil.

Solución

Para calcular el rango, en Excel use la función =MAX(datos) y =MIN(datos) para calcular el valor del máximo y mínimo valor de los datos, respectivamente. El dato mayor es ……………………………y el dato menor es ………………………………., luego el valor del rango es igual a …………………………….………. Esto significa que ……………………………………………………………………………………………………………………….…….. ……………………………………………………………………………………………………….………………………………………….…….. Para calcular el rango intercuartil, en Excel use la función:

=PERCENTIL.EXC(datos,0.75) para calcular el valor del percentil 75,

=PERCENTIL.EXC(datos,0.25) para calcular el valor del percentil 25,

El percentil 75 es igual a …………………………………y el percentil 25 es igual a ……………………..……………., luego el valor del rango intercuartil es …………………………………..……. Esto significa que ……………………………………………………………………………………………………………………..…….. ……………………………………………………………………………………………………….………………………………………..……..

Page 113: 2015 Separata

114 Estadística Básica con Aplicaciones en Excel 2010

Varianza

Se define como el promedio de los cuadrados de las desviaciones de los datos respecto de su media aritmética.

La varianza mide el grado de dispersión o variación de los valores de una variable con respecto a su media aritmética.

Las unidades de la varianza son las unidades de los datos al cuadrado.

Se denota por V(X), 2 (varianza poblacional), 2s (varianza muestral). Se calcula usando la siguiente fórmula:

Varianza poblacional:

N

xN

i

i

1

2

2

Varianza muestral:

11

2

2

n

xx

s

n

i

i

Desviación estándar

Se define como la raíz cuadrada positiva de la varianza. Se denota por (desviación estándar po-blacional) o s (desviación estándar muestral).

Características de la varianza y la desviación estándar

La varianza y la desviación estándar son números reales no negativos.

Se pueden calcular para variables medidas en escala de intervalo o razón.

Se ven afectadas por valores extremos.

La varianza es expresada en unidades cuadráticas a las unidades de los datos, mientras que la desviación estándar es expresada en las mismas unidades de los datos.

Varianza y la desviación estándar en Excel

En Excel 2010, use la función:

=VAR.S para calcular la varianza muestral.

=DESVEST.M para calcular la desviación estándar muestral.

=VAR.P para calcular la varianza poblacional.

=DESVEST.P para calcular la desviación estándar poblacional.

Page 114: 2015 Separata

Capítulo 2. Resúmenes de datos 115

Ejemplo 26 Ante la pregunta sobre el número de hijos por familia, una muestra de 12 hogares marcó las res-puestas mostradas en la siguiente tabla:

2 1 2 4 1 3 2 3 2 0 5 1

Calcule la varianza y la desviación estándar de la variable en estudio.

Solución

En Excel 2010, use la función:

=VAR.S para calcular la varianza muestral, s2 = 1,9697 hijos2.

=DESVEST.M para calcular la desviación estándar muestral, s = 1,4035 hijos.

Ejercicio 39

FibraTex S.A. es una empresa exportadora de prendas de vestir. Los datos que se presentan a con-tinuación corresponden a la edad de todos los trabajadores de esta empresa.

41 45 49 46 52 42 39 49 44 39 47 49 40 43 51 41 58 59 49 44 41 48 50 44 51

40 37 38 40 41 50 54 41 40 45 37 40 36 36 42 39 55 45 44 38 40 37 47 33 48

44 50 51 41 47 56 44 41 59 38 41 44 49 45 37 40 28 49 45 39 59 51 40 43 44

40 38 44 43 39 45 43 44 43 40 42 29 37 48 49 51 46 39 43 56 44 60 57 47 49

Calcule la varianza y la desviación estándar de la variable en estudio.

Solución

En Excel 2010, use la función:

=VAR.P para calcular la varianza poblacional, σ2 = ………….…………...……. ……………………………….

(unidades)

=DESVEST.P para calcular la desviación estándar poblacional, σ = ……..………. .........................

(unidades)

Page 115: 2015 Separata

116 Estadística Básica con Aplicaciones en Excel 2010

Coeficiente de variación

Coeficiente de variación poblacional Coeficiente de variación muestral

%100

CV %100

x

scv

Coeficiente de variación en Excel

Excel no calcula directamente el coeficiente de variación, por lo que es necesario usar las funciones:

=PROMEDIO(datos) para calcular la media

=DESVEST.M(datos) para calcular la desviación estándar

Para luego, dividir la desviación estándar entre su respectiva media. Ejemplo 27 Los siguientes datos representan resúmenes del número de mediciones de resistencia de cierto artículo que realizaron dos grupos de técnicos.

Grupo 1: Media = 3 y desviación estándar = 1,10 Grupo 2: Media = 5 y desviación estándar = 1,66

¿En cuál de los grupos el número de mediciones es más disperso?

Solución

Como los promedios son diferentes, se usa como indicador el coeficiente de variación:

%67,36%1003

10,1%100

2

11

x

sCV

%207,33%1005

66,1%100

2

22

x

sCV

El número de mediciones es más disperso en el grupo 1, puesto que su coeficiente de variación es mayor.

Las medidas de dispersión estudiadas son medidas de variación absolutas pues estas se

expresan en las mismas unidades que la variable original, excepto la varianza que se

expresa en unidades al cuadrado.

El coeficiente de variación es una medida de dispersión relativa libre de unidades por lo que es

útil para comparar la variabilidad de dos o más grupos de datos aunque estén expresados en

distintas unidades de medida.

Es útil al comparar la variabilidad de dos o más series de datos que se expresan en distintas o iguales unidades, pero difieren a tal punto que

una comparación directa de las respectivas desviaciones estándar no es muy útil, por ejemplo, cuando las medias están muy distantes.

El coeficiente de variación se calcula en variables medidas en escala de

razón.

Page 116: 2015 Separata

Capítulo 2. Resúmenes de datos 117

Ejercicio 40

Los datos presentados a continuación corresponden a los montos y el tipo de pago realizados por una muestra de 100 clientes de una cadena de supermercados. Los directivos de esta empresa pi-dieron tomar la muestra para conocer el comportamiento de los pagos de los clientes. Cheque

5,00 17,87 18,77 21,11 22,67 25,96 30,60 31,07 31,74 34,67

35,38 36,09 36,48 37,20 37,60 37,94 38,58 39,55 40,51 41,10

41,58 42,69 42,83 43,14 48,95 49,21 50,58 51,66 52,04 52,87

54,84 55,40 57,59 58,11 58,64 58,75 59,78 69,22 72,46 78,16

Efectivo

1,09 1,27 1,85 2,44 2,87 2,96 3,31 3,65 4,34 4,75

5,08 5,15 5,91 5,98 6,93 7,02 7,17 7,22 7,40 7,41

7,88 8,81 8,85 9,00 11,17 11,54 11,77 12,07 13,09 14,28

15,07 15,10 15,57 16,28 16,38 16,69 18,09 20,48

Tarjeta

14,44 19,78 22,59 25,57 26,57 26,91 27,66 27,89 33,76 44,53

46,13 46,24 48,11 50,30 52,35 52,63 53,32 54,19 55,21 57,55

69,77 94,36

¿Cuál de las tres formas de pago presenta mayor homogeneidad?

Solución

Para calcular el coeficiente de variación use las funciones:

=PROMEDIO(datos) para calcular la media

=DESVEST.M(datos) para calcular la desviación estándar. Luego, divida cada desviación estándar entre su respectiva media. El resultado debe ser:

Forma de pago Promedio Desviación Estándar Coeficiente de variación

Cheque

Efectivo

Tarjeta

Por lo tanto, la forma de pago más homogénea es……………………………………………………………….. porque …………………………………………………………………………………………………………………………………………………………..

Page 117: 2015 Separata

118 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 41

La siguiente base de datos muestra las respuestas obtenidas de una encuesta realizada a una mues-tra de 40 empleados de una empresa de servicios.

ID Género Edad

(años) Categoría

laboral Tiempo de servicio

(meses) Número de hijos

Estado Civil

Ingreso mensual (en soles)

1 Masculino 35 Técnico/ventas 94 1 Divorciado 4658

2 Masculino 74 Gerencial 274 2 Casado 5678

3 Femenino 36 Profesional 99 0 Divorciado 4818

4 Masculino 42 Obrero 109 1 Conviviente 2550

5 Masculino 46 Producción 127 1 Casado 3220

6 Femenino 54 Obrero 142 1 Casado 2918

7 Femenino 45 Servicios 124 1 Divorciado 2855

8 Masculino 38 Obrero 94 1 Casado 2500

9 Femenino 25 Servicios 62 2 Divorciado 1405

10 Femenino 29 Producción 61 3 Divorciado 2699

11 Masculino 49 Apoyo/adm. 132 3 Divorciado 3053

12 Masculino 48 Gerencial 132 1 Casado 5711

13 Masculino 41 Obrero 108 1 Casado 4957

14 Masculino 59 Gerencial 160 0 Divorciado 5784

15 Masculino 63 Gerencial 200 3 Casado 6316

16 Masculino 73 Profesional 200 2 Divorciado 4670

17 Masculino 35 Gerencial 94 1 Casado 5940

18 Masculino 43 Obrero 120 4 Casado 4860

19 Masculino 43 Gerencial 121 4 Casado 5315

20 Masculino 72 Obrero 280 2 Conviviente 5071

21 Masculino 45 Gerencial 124 3 Divorciado 5612

22 Masculino 35 Técnico/ventas 94 3 Casado 4956

23 Masculino 74 Obrero 192 4 Casado 4831

24 Masculino 57 Gerencial 146 3 Casado 6512

25 Masculino 72 Obrero 186 4 Divorciado 4892

26 Masculino 42 Gerencial 112 1 Casado 5599

27 Masculino 48 Gerencial 132 1 Conviviente 4978

28 Masculino 42 Obrero 111 2 Divorciado 4602

29 Masculino 36 Gerencial 100 1 Conviviente 5678

30 Masculino 57 Gerencial 145 1 Casado 5475

31 Masculino 59 Profesional 150 1 Casado 4313

32 Masculino 59 Profesional 160 3 Casado 4818

33 Masculino 63 Obrero 200 2 Divorciado 4892

34 Masculino 38 Profesional 99 1 Conviviente 4978

35 Masculino 42 Gerencial 112 4 Divorciado 6036

36 Femenino 65 Producción 171 2 Conviviente 4032

37 Masculino 52 Producción 139 4 Divorciado 3904

38 Masculino 42 Gerencial 112 1 Conviviente 5599

39 Masculino 72 Profesional 186 2 Divorciado 4670

40 Masculino 69 Profesional 182 2 Divorciado 3482

a. ¿En qué categoría laboral el tiempo de servicio presenta mayor dispersión? b. ¿En qué categoría laboral el tiempo de servicio es más disperso en el 50% central?

Page 118: 2015 Separata

Capítulo 2. Resúmenes de datos 119

Solución Cuando se tiene una base de datos, una manera más rápida de obtener las medidas de dispersión es utilizando la opción de Datos/Análisis de datos tal como se muestra a continuación:

Estadísticos Casado Conviviente Divorciado

Media 141,823529 143,285714 135,75

Mediana 132 112 128

Moda 94 #N/A 124

Desviación estándar 46,0424197 65,2883713 45,9209466

Varianza de la muestra 2119,90441 4262,57143 2108,73333

Coeficiente de asimetría 1,61260652 1,95880668 0,05949087

Rango 180 181 139

Mínimo 94 99 61

Máximo 274 280 200

Cuenta 17 7 16

De la salida obtenida, Excel nos arroja solo los valores de la varianza, desviación estándar y rango. a. ¿En qué categoría laboral el tiempo de servicio presenta mayor dispersión?

Para dar respuesta a la pregunta completaremos la siguiente tabla:

Estado civil Promedio Desviación Estándar Coeficiente de variación

Casado

Conviviente

Divorciado

Por lo tanto, el tiempo de servicio es más disperso en el estado civil …………………………….…..... porque ………………………………………………………………………………………………………………………………………………………….. b. ¿En qué categoría laboral el tiempo de servicio es más dispersión en el 50% central?

Para dar respuesta a la pregunta completaremos la siguiente tabla:

Estado civil Q1 Q3 RIC

Casado

Conviviente

Divorciado

Por lo tanto, el tiempo de servicio es más disperso en el 50% central de los datos es en el estado

civil …………………………….. porque …………………………………………………………………………………………….…………

Page 119: 2015 Separata

120 Estadística Básica con Aplicaciones en Excel 2010

Medidas de asimetría

Relación entre media, mediana y moda

Para una distribución unimodal, es decir, que tenga una sola moda, se cumplen de manera general las siguientes relaciones.

Para una distribución simétrica: ModaMediana x

Para una distribución asimétrica positiva: ModaMediana x

Para una distribución asimétrica negativa: ModaMedianax

Además de las medidas de tendencia central y

dispersión, podemos estar interesados en saber la forma que presenta un conjunto unimodal de

datos.

Si los datos se distribuyen con igual frecuencia y

alejamiento por debajo y por encima de la media, se dice que la distribución es

simétrica.

Si los datos por debajo de la media son más frecuentes

que aquellos por encima de la media o viceversa, se

dice que la distribución es asimétrica.

Media < Mediana < Moda

Media = Mediana = Moda

Moda < Mediana < Media

Simetría o sesgo nulo

Sesgo izquierdo o negativo

Sesgo derecho o positivo

Page 120: 2015 Separata

Capítulo 2. Resúmenes de datos 121

Coeficiente de asimetría de Fisher

El coeficiente de asimetría de Fisher se define como:

3

121

n

i

i

s

xx

nn

nAs

Se tiene que:

Para una distribución simétrica As = 0

Para una distribución asimétrica positiva As > 0

Para una distribución asimétrica negativa As < 0

Coeficiente de asimetría de Fisher en Excel

En Excel 2010, use la función =COEFICIENTE.ASIMETRIA(datos).

Ejercicio 42

Los datos presentados corresponden a la cantidad de dinero gastado, en nuevos soles, para com-prar regalos navideños entre un grupo de hombres y de mujeres durante el diciembre pasado en Lima Metropolitana. Calcule e interprete el coeficiente de asimetría de Fisher en ambos grupos.

Mujeres

460 507 575 420 568 558 581 334 400 426 434 290 468 546 419 726 364 432 519 503

470 519 430 250 514 447 504 543 350 473 614 441 630 432 417 421 531 523 321 405

450 393 553 430 421 461 320 930 290 718 361 383 477 280 385 416 398 503 431 406

407 558 313 387 585 503 527 511 383 402 453 429 499 179 600 373 459 410 850 847

Hombres

498 349 185 80 324 616 680 355 352 648 696 308 581 481 297 205 285 175 447 603

626 368 275 149 100 254 540 279 275 200 538 604 575 600 137 734 436 284 198 610

767 80 266 537 358 624 120 244 341 724 425 305 75 688 253 514 236 475 606 475

271 230 466 120 398 60 429 517 268 580 431 173 612 317 529 647 542 544 464 610

Solución

En Excel 2010, para calcular el coeficiente de asimetría de Fisher, use la función: =COEFICIENTE.ASIMETRIA(datos).

Género Coeficiente de asimetría de Fisher

Femenino

Masculino

Por lo tanto,

el gasto de las mujeres presenta ………………………………………………….…………………..…

el gasto de los hombres presenta ………………………………………………………..………………

Page 121: 2015 Separata

122 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 43

La siguiente base de datos muestra las respuestas obtenidas de una encuesta realizada a una mues-tra de 40 empleados de una empresa de servicios.

ID Género Edad

(años) Categoría

laboral Tiempo de servicio

(meses) Número de hijos

Estado civil

Ingreso mensual (en soles)

1 Masculino 35 Técnico/ventas 94 1 Divorciado 4658

2 Masculino 74 Gerencial 274 2 Casado 5678

3 Femenino 36 Profesional 99 0 Divorciado 4818

4 Masculino 42 Obrero 109 1 Conviviente 2550

5 Masculino 46 Producción 127 1 Casado 3220

6 Femenino 54 Obrero 142 1 Casado 2918

7 Femenino 45 Servicios 124 1 Divorciado 2855

8 Masculino 38 Obrero 94 1 Casado 2500

9 Femenino 25 Servicios 62 2 Divorciado 1405

10 Femenino 29 Producción 61 3 Divorciado 2699

11 Masculino 49 Apoyo/adm. 132 3 Divorciado 3053

12 Masculino 48 Gerencial 132 1 Casado 5711

13 Masculino 41 Obrero 108 1 Casado 4957

14 Masculino 59 Gerencial 160 0 Divorciado 5784

15 Masculino 63 Gerencial 200 3 Casado 6316

16 Masculino 73 Profesional 200 2 Divorciado 4670

17 Masculino 35 Gerencial 94 1 Casado 5940

18 Masculino 43 Obrero 120 4 Casado 4860

19 Masculino 43 Gerencial 121 4 Casado 5315

20 Masculino 72 Obrero 280 2 Conviviente 5071

21 Masculino 45 Gerencial 124 3 Divorciado 5612

22 Masculino 35 Técnico/ventas 94 3 Casado 4956

23 Masculino 74 Obrero 192 4 Casado 4831

24 Masculino 57 Gerencial 146 3 Casado 6512

25 Masculino 72 Obrero 186 4 Divorciado 4892

26 Masculino 42 Gerencial 112 1 Casado 5599

27 Masculino 48 Gerencial 132 1 Conviviente 4978

28 Masculino 42 Obrero 111 2 Divorciado 4602

29 Masculino 36 Gerencial 100 1 Conviviente 5678

30 Masculino 57 Gerencial 145 1 Casado 5475

31 Masculino 59 Profesional 150 1 Casado 4313

32 Masculino 59 Profesional 160 3 Casado 4818

33 Masculino 63 Obrero 200 2 Divorciado 4892

34 Masculino 38 Profesional 99 1 Conviviente 4978

35 Masculino 42 Gerencial 112 4 Divorciado 6036

36 Femenino 65 Producción 171 2 Conviviente 4032

37 Masculino 52 Producción 139 4 Divorciado 3904

38 Masculino 42 Gerencial 112 1 Conviviente 5599

39 Masculino 72 Profesional 186 2 Divorciado 4670

40 Masculino 69 Profesional 182 2 Divorciado 3482

a. Determine la forma de la distribución del ingreso mensual, en soles, por género. b. Determine la forma de la distribución del tiempo de servicio, en meses, por género.

Page 122: 2015 Separata

Capítulo 2. Resúmenes de datos 123

Solución

a. Determine la forma de la distribución del ingreso mensual, en soles, por género.

Género Coeficiente de asimetría de Fisher

Femenino

Masculino

Por lo tanto,

el ingreso mensual de las mujeres presenta ……………………………………………………..…

el ingreso mensual de los hombres presenta ……………………………………………………… b. Determine la forma de la distribución del tiempo de servicio, en meses, por género.

Género Coeficiente de asimetría de Fisher

Femenino

Masculino

Por lo tanto,

el tiempo de servicio de las mujeres presenta ……………………………………………………..…

el tiempo de servicio de los hombres presenta ………………………………………………………

Page 123: 2015 Separata

124 Estadística Básica con Aplicaciones en Excel 2010

Ejercicios de aplicación

1. Una empresa tiene sucursales en dos países. En el primer país, el sueldo promedio mensual es

de 450 dólares, con una desviación estándar de 50 dólares, mientras que en el otro país el sueldo promedio es de 1500 nuevos soles y una varianza de 8500 nuevos soles2 ¿En qué país los sueldos presentan mayor variabilidad?

2. En la Bolsa de Valores de Lima se analiza la cotización de las acciones de dos empresas. En Las

acciones de C&M S.A. se cotizan en promedio a 4,50 nuevos soles con una desviación estándar de 0,50 nuevos soles, mientras que las acciones de Damis S.A se cotizan en promedio a 15 nuevos soles con una varianza de 0,85 nuevos soles2 ¿Qué empresa tiene las acciones más riesgosas (mayor variabilidad)?

3. Los gastos semanales en transporte urbano (nuevos soles) que efectúan los habitantes de las

ciudades Vista Grande y Pueblo Hermoso han sido estudiados mediante muestras aleatorias independientes. Los datos captados fueron:

Gastos semanales en movilidad en

Vista Grande

Gastos semanales en movilidad en Pueblo Hermoso

22,0 22,0 22,1 23,2 23,2 23,2 23,6 23,6

18,1 18,5 18,7 19,9 20,4 20,5 21,1

24,0 24,1 24,1 24,2 24,2 24,5 24,7 25,5

21,3 21,3 21,5 22,0 22,0 22,2 22,4

a. ¿En qué ciudad los gastos semanales en movilidad son más homogéneos? b. Evalúe la asimetría de los gastos semanales en movilidad en las dos ciudades usando el coe-

ficiente de simetría de Pearson. 4. En la actualidad todos los vehículos que circulan en Lima Metropolitana deben pasar las revi-

siones técnicas con el fin de reducir el nivel de contaminación en la ciudad. Inicialmente la em-presa encargada de dichas revisiones contaba con dos plantas (Cono Norte y Cono Sur) y era de interés investigar si se necesitaba abrir más plantas analizando el tiempo de atención por vehículo. Los tiempos (en minutos) que se demoraron en ser atendidos una muestra aleatoria de vehículos particulares que asistieron a cada una de las plantas se presenta a continuación:

Cono Norte Cono Sur

Número de vehículo

Tiempo Número de

vehículo Tiempo

Número de vehículo

Tiempo Número de

vehículo Tiempo

1 9,0 12 13,1 1 10,2 12 11,8

2 11,9 13 13,2 2 10,2 13 11,8

3 12,6 14 13,5 3 10,3 14 12,2

4 12,6 15 13,5 4 10,8 15 12,2

5 12,6 16 13,7 5 10,8 16 12,3

6 12,8 17 13,8 6 10,9 17 13,3

7 12,8 18 13,8 7 10,9 18 13,3

8 12,8 19 14,1 8 10,9 19 13,4

9 12,9 20 14,1 9 11,2 20 13,4

10 13,1 21 14,3 10 11,6 21 13,4

11 13,4 22 15,1 11 11,8 22 21,3

Page 124: 2015 Separata

Capítulo 2. Resúmenes de datos 125

a. Calcule las medidas de dispersión para el tiempo, en minutos, que demoraron en ser aten-

didos los vehículos particulares que asistieron a la planta del Cono Sur. b. Calcule las medidas de dispersión para el tiempo, en minutos, que demoraron en ser aten-

didos los vehículos particulares que asistieron a la planta del Cono Norte. c. ¿Es posible afirmar que el tiempo de atención es más homogéneo en el Cono Norte? Justi-

fique numéricamente su respuesta. d. ¿Es posible afirmar que en el Cono Sur el tiempo de atención es más homogéneo en el 50%

central? Justifique numéricamente su respuesta. e. Compare la simetría del tiempo que demoran en ser atendidos los vehículos particulares

que asistieron a las plantas del Cono Norte y cono sur usando el coeficiente de Fisher. Co-mente.

5. La siguiente información corresponde al tiempo de servicio (en meses) de una muestra de pu-

blicistas que laboran en dos conocidas agencias de la capital.

Agencia Omega

Media 18,93

Mediana 14,00

Moda 6,00

Desviación estándar 15,78

Muestra 15

Agencia Sigma

Media 19,64

Mediana 15,00

Moda 11,00

Varianza 94,2841

Muestra 25

a. ¿Qué tipo de asimetría presenta la distribución del tiempo de servicio de la agencia publici-

taria Omega? ¿Por qué? b. ¿En cuál de las agencias publicitarias el tiempo de servicio (en meses) es más homogéneo?

Justifique su respuesta. 6. Se han analizado los puntajes de un examen en un curso de capacitación en una empresa, y se

ha obtenido la siguiente información: el puntaje medio en la sección A es de 74, el puntaje modal es 83 y la mediana es 77, mientras que en la sección B, el puntaje medio es de 80, el puntaje modal es 71 y la mediana es 77. Indique el tipo de asimetría de la distribución de los puntajes para cada sección.

Page 125: 2015 Separata

126 Estadística Básica con Aplicaciones en Excel 2010

Resumen

Estadístico Fórmula Función en Excel

Media

n

x

x

n

i

i 1

=promedio(datos)

Mediana =mediana(datos)

Moda =moda.uno(datos) =moda.varios(datos)

Media ponderada

n

i

i

n

i

ii

w

w

wx

x

1

1

Rango r = Xmax - Xmin =max(datos)-min(datos)

Percentil k =percentil.exc(datos, k/100)

Rango intercuartil RIC = Q3 – Q1= P75 – P25 =percentil.exc(datos, 0.75) - per-centil.exc(datos, 0.25)

Coeficiente de variación muestral

%100x

scv

=desvest.m(datos)/promedio(datos)

Coeficiente de asimetría de Fisher

3

121

n

i

i

s

xx

nn

nAs

=coeficiente.asimetria(datos)

Page 126: 2015 Separata

Capítulo 3. Probabilidades 127

Capítulo 3. Probabilidades

Definiciones básicas de probabilidad

Experimento no aleatorio o determinístico

Un experimento determinista es aquel en el que se puede predecir el resultado de su realización y existe ley o fórmula matemática que permite explicarlo. Los experimentos de la física son determi-nistas. Por ejemplo, el movimiento de caída libre.

Experimento aleatorio, espacio muestral, evento y probabilidad

Los conceptos probabilísticos se aplican sobre experimentos aleatorios.

Experimento aleatorio

•Es un proceso que al ser realizado u observado repetidas veces, bajo las mismas condiciones, genera más de un posible resultado que no puede ser determinado de antemano.

Espacio muestral

•Es el conjunto de todos los posibles resultados que genera un experimento aleatorio.

Evento

•Es todo subconjunto de un espacio muestral.

Probabilidad

•Es una medida de la posibilidad de ocurrencia de un evento.

Page 127: 2015 Separata

128 Estadística Básica con Aplicaciones en Excel 2010

Espacio muestral

Se denota mediante el símbolo . Cada elemento del espacio muestral se denomina punto mues-tral.

Evento

Es todo subconjunto de un espacio muestral. Se denotan mediante letras mayúsculas, por ejemplo, A y B.

Evento simple: Es un evento formado por un solo punto muestral. No se puede descomponer.

Evento compuesto: Es un evento formado por más de un punto muestral.

Probabilidad

Es una medida de la posibilidad de ocurrencia de un evento.

Ejemplo de experimento aleatorio, espacio muestral, eventos y probabilidad

Experimento aleatorio

• Lanzar un dado

Espacio muestral

•Ω = 1, 2, 3, 4, 5, 6

Eventos

•A = 1

•B = 1, 2, 3

•C = 2, 4, 6, etc.

Probabilidad

•P(A) = n(A) / n(Ω) = 1 / 6 = 0,1667

•P(B) = n(B) / n(Ω) = 3 / 6 = 0,5

•P(C) = n(C) / n(Ω) = 3 / 6 = 0,5

Page 128: 2015 Separata

Capítulo 3. Probabilidades 129

Combinación de eventos

Con frecuencia se construyen eventos mediante la combinación de eventos más sencillos. Es usual emplear la notación de conjuntos para describir los eventos construidos de esta forma. Sea un experimento aleatorio y Ω el espacio muestral asociado. Si A y B son dos eventos definidos en Ω, se define:

Complemento (AC)

Para un evento A cualquiera se define su complemento, CA , como el evento consistente en todos los puntos de Ω que no están en A.

Unión (A B)

Para dos eventos A y B, la unión del evento A con el evento B es el evento que contienen todos los puntos de Ω que pertenecen a A o a B o a ambos.

Intersección (A∩B)

Para dos eventos A y B, la intersección de los eventos A y B es el evento que contienen todos los puntos de Ω que pertenecen tanto a A como a B.

Page 129: 2015 Separata

130 Estadística Básica con Aplicaciones en Excel 2010

Eventos mutuamente excluyentes Dos eventos son mutuamente excluyentes o disjuntos si no tienen puntos de Ω en común. Los

eventos A y B son mutuamente excluyentes si y solo si A B = .

Axiomas de la probabilidad Sea un experimento aleatorio, Ω el espacio muestral asociado a dicho experimento aleatorio y A un evento definido en Ω, entonces la probabilidad del evento A, denotada por P(A), es aquel número que cumple los siguientes axiomas:

Axioma 1: 0 P(A) 1

Axioma 2: P(Ω) = 1

Axioma 3: Si A y B son dos eventos mutuamente excluyentes entonces:

P(A B) = P(A) + P(B)

Definición clásica de probabilidad

Algunos autores definen la probabilidad como una medida de la posibilidad de ocurrencia de un evento. La definición clásica propone que si el espacio muestral es numerable y cada punto mues-tral tiene la misma posibilidad de ocurrencia, entonces la probabilidad de ocurrencia de un evento

A definido sobre es:

totalescasosdeNúmero

A eventoal favorablescasosdeNúmero

n

AnAP

Teoremas básicos de probabilidad

P() = 0, donde es el evento imposible.

P(AC) = 1 – P(A)

Si A y B son eventos cualesquiera, entonces:

P(A B) = P(A) + P(B) – P(A B)

Page 130: 2015 Separata

Capítulo 3. Probabilidades 131

Ejercicio 44

Se seleccionó una muestra aleatoria de trabajadores de la empresa Óptima para determinar sus planes de jubilación después de cumplir los 65 años de edad. Los trabajadores en la muestra se dividieron en: ejecutivos, empleados y obreros. Los resultados obtenidos fueron:

Trabajador Planes después de los 65 años

Se jubile No se jubile No ha decidido su jubilación

Ejecutivo 8 3 1

Empleado 20 10 5

Obrero 50 22 11

Si se selecciona un trabajador al azar. a. ¿Cuál es la probabilidad de que no se jubile del trabajo?

Solución

Sea el evento ……… : ……………………………………………………………. Se pide calcular:

P(…………….) = ………………………………………..

b. ¿Cuál es la probabilidad de que se jubile o no sea ejecutivo?

Solución

Sean los eventos ……… : ……………………………………………………………………………………………………………………. ……… : ……………………………………………………………………………………………………………………. Se pide calcular:

P(…………….) = ………………………………………..

c. ¿Cuál es la probabilidad de que sea obrero y no haya decidido su jubilación?

Solución

Sean los eventos ……… : ………………………………………………………………………………………………..…………………. ……… : ……………………………………………………………………………………..……………………………. Se pide calcular:

P(…………….) = ………………………………………..

Page 131: 2015 Separata

132 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 45

En la ciudad de Arequipa se realizó una encuesta a personas adultas para conocer la opinión que tienen respecto a una nueva ley del gobierno. La siguiente tabla muestra los resultados de la en-cuesta. Los entrevistados fueron clasificados según su género.

Género Opinión

Total A favor En contra Abstinencia

Masculino 11 29 9

Femenino 14 17 15

Total

Si se elige una persona al azar, a. ¿Cuál es la probabilidad de que no esté a favor de la nueva ley de gobierno y sea hombre?

Solución

Sea el evento ……… : …………………………………………………………………..……………………………. Sea el evento ……… : ……………………………………………………………………………..………………….

Se pide calcular:

P(…………….) = ………………………………………..

b. ¿Cuál es la probabilidad de que esté a favor o en contra de la nueva ley del gobierno?

Solución

Sea el evento ……… : ………………………………………………………………………………………………. Sea el evento ……… : ……………………………………………………………………………..……………….

Se pide calcular:

P(…………….) = ………………………………………..

c. ¿Cuál es la probabilidad de que esté en contra de la nueva ley de gobierno?

Solución

Sea el evento ……… : ……………………………………………………………………………………………….

Se pide calcular:

P(…………….) = ………………………………………..

Page 132: 2015 Separata

Capítulo 3. Probabilidades 133

Ejemplo 28 Un instituto de investigaciones académicas desea determinar si existe relación entre el interés de un estudiante en finanzas, su habilidad en matemáticas y su género. Se selecciona una muestra de 200 estudiantes y mediante una prueba se mide su habilidad matemática y su interés en finanzas. Los resultados fueron los siguientes:

Interés en finanzas

Género

Total Femenino (A1) Masculino (A2)

Habilidad en matemáticas Habilidad en matemáticas

Baja (C1) Media (C2) Alta (C3) Baja (C1) Media (C2) Alta (C3)

Bajo (B1) 25 9 6 35 6 10 91

Medio (B2) 4 22 7 11 21 3 68

Alto (B3) 2 5 15 3 7 9 41

Total 31 36 28 49 34 22 200

Si se selecciona un estudiante al azar, a. ¿Cuál es la probabilidad de seleccionar un estudiante con un interés alto en finanzas?

Solución

Sea el evento B3: Interés alto en finanzas

205,0200

413 BP

b. ¿Cuál es la probabilidad de que no tenga una alta habilidad en matemáticas y tenga un interés

medio en finanzas?

Solución

Sean los eventos:

C3: Habilidad alta en matemáticas B2: Interés medio en finanzas

29,0200

21112242

BCP C

3

c. ¿Cuál es la probabilidad de que sea hombre o tenga un bajo interés en finanzas?

Solución

Sean los eventos:

A2: Masculino B1: Interés bajo en finanzas

725,0200

51

200

91

200

22344912

121212

BAP

BAPBPAPBAP

Page 133: 2015 Separata

134 Estadística Básica con Aplicaciones en Excel 2010

Ejemplo 29 Una encuesta entre suscriptores de una revista local indicó que 45,8% de ellos habían rentado un automóvil por motivos de negocios, 54% por motivos personales y 30% por motivos de negocios y personales a la vez. a. ¿Cuál es la probabilidad de que un suscriptor rente un automóvil por motivos de negocios o

personales? b. ¿Cuál es la probabilidad de que un suscriptor rente un automóvil por motivos que no sean de

negocios ni personales? c. ¿Cuál es la probabilidad de que un suscriptor rente un automóvil por motivos exclusivamente

de negocios?

Solución

Definamos los eventos: A: Rentar un automóvil por negocios B: Rentar un automóvil por motivos personales Luego, hagamos un diagrama de Venn y completemos todos los espacios con las probabilidades respectivas. Del texto se tiene que 458,0AP , 54,0BP y 30,0BAP .

Con esta información completemos el diagrama.

Del diagrama se tiene que: a. 698,030,054,0458,0 BAPBPAPBAP

b. 302,0698,011 BAPBAPBAP CCC

c. 158,0 CBAP

Page 134: 2015 Separata

Capítulo 3. Probabilidades 135

Ejercicio 46

En una ciudad el 28% de los trabajadores toma vacaciones dos veces al año, el 45% de los trabaja-dores toma tres cursos de capacitación al año y el 7% de los trabajadores toma vacaciones dos ve-ces al año y toma tres cursos de capacitación al año. a. ¿Cuál es la probabilidad que al elegir un trabajador al azar solo tome vacaciones dos veces al

año? b. ¿Cuál es la probabilidad que al elegir un trabajador al azar solo tome vacaciones dos veces al año

o solo tome tres cursos de capacitación al año? c. ¿Cuál es la probabilidad que al elegir un trabajador al azar no tome vacaciones dos veces al año

ni tome tres cursos de capacitación al año?

Solución

Sean los eventos …… : …………………………………………………………………………………………………………… …… : ……………………………………………………………………………………………………………

a. ¿Cuál es la probabilidad que al elegir un trabajador al azar solo tome vacaciones dos veces al año?

Se pide calcular: ..................................................................................................................... P

b. ¿Cuál es la probabilidad que al elegir un trabajador al azar solo tome vacaciones dos veces al año

o solo tome tres cursos de capacitación al año?

Se pide calcular:

........................................................................................................... P

c. ¿Cuál es la probabilidad que al elegir un trabajador al azar no tome vacaciones dos veces al año

ni tome tres cursos de capacitación al año?

Se pide calcular: ........................................................................................................... P

Page 135: 2015 Separata

136 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 47

La probabilidad de que un alumno de administración lea la revista “Finanzas” es igual al 40% y la probabilidad de que lea la revista “Actualidad” es igual al 30%, además la probabilidad de que lea ambas revistas es igual al 10%. a. ¿Cuál es la probabilidad de que un alumno seleccionado al azar no lea ninguna de estas dos re-

vistas? b. ¿Cuál es la probabilidad de que un alumno seleccionado al azar lea al menos una de estas dos

revistas?

Solución

Sean los eventos

…… : ……………………………………………………………………

……. : ……………………………………………………………………

a. ¿Cuál es la probabilidad de que un alumno seleccionado al azar no lea ninguna de estas dos re-

vistas?

Se pide calcular:

..................................................................................................................... P

b. ¿Cuál es la probabilidad de que un alumno seleccionado al azar lea al menos una de estas dos

revistas?

Se pide calcular:

........................................................................................................... P

Page 136: 2015 Separata

Capítulo 3. Probabilidades 137

Probabilidad condicional

Sea un experimento aleatorio y el espacio muestral asociado. Sean A, B dos eventos definidos

en . La probabilidad de ocurrencia del evento A sabiendo que el evento B ha ocurrido se denota por P(A/B) y se llama probabilidad condicional de A dado B:

0;

BPBP

BAPA/BP

Ejemplo 30 La mayoría de las estaciones de servicio venden tres tipos de gasolina: 90 octanos, 95 octanos y 97 octanos que, a su vez, pueden estar enriquecidas con un aditivo. La tabla siguiente ilustra los por-centajes de clientes que prefieren cada tipo de gasolina.

Tipo de gasolina 90 octanos (B) 95 octanos (C) 97 octanos (D) Total

Con aditivo(A) 0,05 0,10 0,05 0,20

Sin aditivo (A/) 0,15 0,40 0,25 0,80

Total 0,20 0,50 0,30 1,00

Se selecciona al azar un cliente que ha comprado uno de estos tipos de gasolina: a. ¿Cuál es la probabilidad de que haya comprado gasolina con aditivo o no sea de 95 octanos?

60,0)05,005,0(50,020,0 CCC CAPCPAPCAP

b. Si el cliente no compró gasolina de 95 octanos, ¿cuál es la probabilidad de que hay comprado

gasolina de 97 octanos?

60,050,0

30,0)(

C

CC

CP

CDPCDP

c. Si el cliente no compró gasolina de 90 0ctanos, ¿cuál es la probabilidad de que haya comprado

gasolina sin aditivo?

8125,080,0

65,0

)(

)(

C

CCCC

BP

BAPBAP

Page 137: 2015 Separata

138 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 48

El administrador de una tienda de ropa de vestir para caballeros ha recopilado la siguiente informa-ción sobre el número de boletas de pago entregadas a sus clientes por la compra de camisas de manga corta, manga larga y manga tres cuartos durante el primer trimestre del año en curso.

Mes evaluado Manga corta Manga larga Manga tres cuartos Total

Enero 25 45 43

Febrero 35 25 35

Marzo 29 29 12

Total

a. Si se elige una boleta al azar, ¿cuál es la probabilidad que haya sido entregada por la venta de

una camisa de manga corta?

Sea el evento ……… : ………………………………………………………………………………….…………………. Se pide calcular:

.......................................P

b. Si se elige una boleta al azar y ésta fue del mes de febrero, ¿cuál es la probabilidad de que haya

sido por la compra de una camisa de manga corta?

Sea el evento ……… : ……………………………………………………………. Sea el evento ……… : ……………………………………………………………. Se pide calcular:

.............................

...............

....................

......................................... P

c. Si se elige una boleta al azar y ésta fue por la compra de una camisa de manga larga, ¿cuál es la

probabilidad de que haya sido entregada en el mes de enero?

Sea el evento ……… : ……………………………………………………………. Sea el evento ……… : ……………………………………………………………. Se pide calcular:

.............................

...............

....................

......................................... P

Page 138: 2015 Separata

Capítulo 3. Probabilidades 139

Ejercicio 49

En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadística e Informática se preguntó a todos los peruanos por los servicios de comunicación con los que contaba su hogar y su área de residencia, obteniéndose los siguientes resultados:

Servicios con que los cuenta el hogar Urbano Rural Total

Hogares sin ningún tipo de servicio 1 682 454 1 468 889 3 151 343

Solo tienen teléfono fijo 480 831 6 170 487 001

Solo tienen teléfono celular 1 299 037 138 721 1 437 758

Solo tienen Internet 3 336 275 3 611

Solo tienen TV por cable 56 343 2 688 59 031

Tienen teléfono fijo y teléfono celular 506 759 2 912 509 671

Tienen teléfono fijo e Internet 15 684 31 15 715

Tienen teléfono fijo y TV por cable 117 733 186 117 919

Tienen teléfono celular e Internet 9 970 84 10 054

Tienen teléfono celular y TV por cable 204 563 1 981 206 544

Tienen Internet y TV por cable 1 288 19 1 307

Tienen teléfono fijo, teléfono celular e Internet 93 103 110 93 213

Tienen teléfono fijo, teléfono celular y TV por cable 326 181 468 326 649

Tienen teléfono fijo, Internet y TV por cable 19 732 9 19 741

Tienen teléfono celular, Internet y TV por cable 15 424 49 15 473

Los cuatro servicios 298 911 133 299 044

Total 5 131 349 1 622 725 6 754 074

a. Indique el elemento y las variables estudiadas en esta investigación. b. Si se selecciona un hogar que no cuenta con ningún servicio, ¿cuál es la probabilidad de que sea

de zona rural? c. Si se selecciona un hogar de la zona urbana, ¿cuál es la probabilidad de que cuente con tres ser-

vicios por lo menos? d. Si se selecciona un hogar al azar, ¿cuál es la probabilidad de que sea de la zona rural y que tenga

todos los servicios?

Solución

a. Indique el elemento y las variables estudiadas en esta investigación.

Page 139: 2015 Separata

140 Estadística Básica con Aplicaciones en Excel 2010

b. Si se selecciona un hogar que no cuenta con ningún servicio, ¿cuál es la probabilidad de que sea de zona rural?

Sean los eventos

…… : ……………………………………………………………………

……. : ……………………………………………………………………

Se pide calcular:

................................................................................................................. P

c. Si se selecciona un hogar de la zona urbana, ¿cuál es la probabilidad de que cuente con tres ser-

vicios por lo menos?

Sean los eventos

…… : ……………………………………………………………………

……. : ……………………………………………………………………

Se pide calcular:

................................................................................................................. P

d. Si se selecciona un hogar al azar, ¿cuál es la probabilidad de que sea de la zona rural y tenga

todos los servicios?

Sean los eventos

…… : ……………………………………………………………………

……. : ……………………………………………………………………

Se pide calcular:

................................................................................................................. P

Page 140: 2015 Separata

Capítulo 3. Probabilidades 141

Eventos independientes

Dos eventos son independientes si la ocurrencia de uno de ellos no afecta la ocurrencia del otro. Lo anterior se traduce, usando probabilidades condicionales, en:

P(A/B) = P(A) P(B/A) = P(B)

Propiedad de los eventos independientes

Dos eventos cualesquiera A y B son independientes si y solo si

P(A B) = P(A) × P(B) Ejemplo 31 La probabilidad que Jorge dispare y de en el blanco es 0,25 y para Luis la probabilidad correspon-diente es 0,40. Suponga que Jorge y Luis disparan de forma independiente: a. ¿Cuál es la probabilidad de que ambos den en el blanco? b. ¿Cuál es la probabilidad de al menos uno de en el blanco?

Solución

Sean los eventos: A: Jorge dispara y da en el blanco. B: Luis dispara y da en el blanco. Se tiene que 25,0AP y 40,0BP

a. 10,040,025,0 BPAPBAP

b. 55,010,040,025,0 BAPBPAPBAP

Page 141: 2015 Separata

142 Estadística Básica con Aplicaciones en Excel 2010

Ejemplo 32 En una gran área metropolitana se seleccionó una muestra de 500 encuestados para determinar información diversa respecto al comportamiento de los consumidores. Entre las preguntas formu-ladas estaba “¿Disfruta comprar ropa?” De 240 hombres, 136 respondieron que sí, mientras que, de las 260 mujeres, 244 respondieron que sí. Se definen los eventos: A = El consumidor disfruta comprar ropa B = El consumidor es hombre ¿Son los eventos A y B independientes?

Solución

Para que los eventos sean independientes se debe cumplir que BPAPBP A . De acuerdo

con los datos, se tiene que:

Género Sí No Total

Hombres 136 104 240

Mujeres 244 16 260

Total 380 120 500

Calculamos:

272,0500

136BAP

3648,0500

240

500

380 BPAP

Por lo tanto, como BPAPBAP entonces A y B no son eventos independientes.

Ejercicio 50

Una empresa desea establecer dos negocios adicionales, una juguería y una heladería, en dos loca-les diferentes. Por experiencias pasadas sabe que la probabilidad de que tenga éxito en la juguería es del 60%, mientras que tenga éxito en la heladería es del 70%. Si podemos considerar a los dos negocios como independientes,

a. Calcule la probabilidad de que se tenga éxito en al menos uno de los negocios.

b. Calcule la probabilidad de que se tenga éxito solo en la juguería.

c. Calcule la probabilidad de que no tenga éxito en ninguno de los negocios.

Page 142: 2015 Separata

Capítulo 3. Probabilidades 143

Solución

Sean los eventos: ……. : ...……………………………………………………..……….. luego, ........................P

……. : ...……………………………………………………..……….. luego, ........................P

Se pide:

a. Calcule la probabilidad de que se tenga éxito en al menos uno de los negocios.

................................................................................................P

b. Calcule la probabilidad de que se tenga éxito solo en la juguería.

................................................................................................P

c. Calcule la probabilidad de que no tenga éxito en ninguno de los negocios.

................................................................................................P

Page 143: 2015 Separata

144 Estadística Básica con Aplicaciones en Excel 2010

Partición de un espacio muestral

Sean E1, E2, ... , Ek eventos definidos en Ω, tales que:

i. Ei Ej = , para todo i j (disjuntos dos a dos)

ii.

k

i

iE1

(eventos colectivamente exhaustivos)

Entonces se dice que los eventos E1, E2, ... , Ek definen una partición del espacio muestral Ω.

Teorema de la probabilidad total

Sea A un evento cualquiera definido sobre Ω y sea E1, E2,..., Ek una partición del espacio muestral entonces:

k

1i

ii EPEAPAP

Ejemplo 33 Una empresa de manufactura recibe embarques de una determinada pieza de dos proveedores. Actualmente el 65% de las piezas adquiridas por la empresa provienen del proveedor 1 y 35% res-tante del proveedor 2. La calidad de las piezas adquiridas varía con la fuente de suministro. Con base a los datos históricos se sabe que la probabilidad que una pieza del proveedor 1 sea defectuo-sa es 0,02 y la probabilidad de que una pieza del proveedor 2 sea defectuosa es 0,05. Si seleccio-namos al azar una de las piezas adquiridas por la empresa, ¿cuál es la probabilidad de que sea de-fectuosa?

Solución

Sean los eventos: E1 = La pieza proviene del proveedor 1, luego se tiene que P(E1) = 0,65 E2 = La pieza proviene del proveedor 2, luego se tiene que P(E2) = 0,35 A = Pieza defectuosa. Ac = Pieza no defectuosa.

Page 144: 2015 Separata

Capítulo 3. Probabilidades 145

P(A/E1) = 0,02 y consecuentemente P(Ac/E1) = 0,98. Asimismo, P(A/E2) = 0,05 y consecuentemente P(Ac/E2) = 0,95. Luego, el diagrama de árbol correspondiente es:

Entonces, P(A) = P(A/E1) P(E1) + P(A/E2) P(E2) = 0,02 × 0,65 + 0,05 × 0,35 = 0,0305

Teorema de Bayes

Sea un experimento aleatorio, A un evento cualquiera definido sobre Ω y E1, E2, ... , Ek una parti-ción del espacio muestral Ω, entonces

k

1i

ii

jjj

EPE/AP

EPE/AP/AEP para j = 1, 2,…, k

Diagrama de árbol

Es la representación gráfica de los resultados posibles de la realización de un experimento aleato-rio. Cada parte terminal representa un resultado posible del experimento aleatorio y las probabili-dades se indican en las ramas.

Page 145: 2015 Separata

146 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 51

El departamento de créditos de una tienda comercial sabe que sus ventas se pagan con dinero en efectivo, con cheque o al crédito, con probabilidades respectivas de 0,35; 0,25 y 0,4. La probabili-dad de que una venta sea por más de 50 dólares, es igual a 0,2 si ésta es en efectivo, es igual a 0,9 si ésta es con cheque y es igual a 0,6 si ésta es al crédito. a. ¿Cuál es la probabilidad de que una persona compre por más de 50 dólares? b. Si compra por más de 50 dólares, ¿cuál es la probabilidad de que la compra se haya realizado en

efectivo?

Solución

Sean los eventos:

E: La compra se realiza con dinero en efectivo CH: La compra se realiza con cheque C: La compra se realiza al crédito M: La compra es por más de 50 dólares MC: La compra no es por más de 50 dólares

Complete el diagrama del árbol.

Se pide calcular: a. .......................................................................................................................... P

b. ............................................................................................................../....... P

Page 146: 2015 Separata

Capítulo 3. Probabilidades 147

Ejercicio 52

Un banco comercial que opera en Lima ha estimado por experiencias anteriores, que el 15% de clientes a los que se les hizo préstamo resultaron morosos. Además, se sabe que el 27% de los clientes morosos utilizaron el préstamo para financiar ampliaciones en la vivienda y el 68% de los préstamos pagados a tiempo se hicieron para realizar ampliaciones en la vivienda. Si el día de hoy se hizo préstamo a un cliente, determine: a. La probabilidad de que dicho préstamo no se utilice para realizar ampliaciones en la vivienda. b. Si el préstamo se utilizó para ampliar la vivienda, ¿cuál es la probabilidad de que el cliente no

sea moroso? c. Si el préstamo no se utilizó para ampliar la vivienda, ¿cuál es la probabilidad de que el cliente

sea moroso?

Solución

Sean los eventos: ……….... : ………………………………………………………………………………………………………….………..

……….... : …………………………………………………………………………………………………………….……..

……….... : …………………………………………………………………………………………………….……………..

……….... : ………………………………………………………………………………………………….………………..

Elabore el diagrama del árbol.

Se pide calcular: a. .......................................................................................................................... P

b. ............................................................................................................../....... P

c. ............................................................................................................../....... P

Page 147: 2015 Separata

148 Estadística Básica con Aplicaciones en Excel 2010

Ejercicios de aplicación

1. La probabilidad de que María no apruebe su curso de Estadística es de 1/3, que apruebe María

o Pedro es 5/6 y que no apruebe Pedro es 1/2. Determine la probabilidad de que solo uno de ellos apruebe el curso. Rpta: 1/2

2. La probabilidad de que una empresa alemana invierta en minería en el departamento de Junín

es de 0,7; de que invierta en Cajamarca es de 0,4 y de que invierta en al menos una de ellas es de 0,8. Determine la probabilidad de que dicha empresa finalmente se localice: a. sólo en Cajamarca. Rpta: 0,4 b. en ninguno de los lugares mencionados. Rpta: 0,2

3. En una muestra de 2000 hogares de Lima Metropolitana se registró el nivel educativo alcanza-

do por el jefe de hogar y el nivel socioeconómico al cual pertenece.

Nivel educativo del jefe Nivel Socioeconómico (NSE) Total

de hogar A B C D E

Ningún nivel alcanzado 0 1 5 120 180 306

Primaria 2 5 200 220 120 547

Secundaria 20 150 300 280 95 845

Superior 78 44 95 80 5 302

Total 100 200 600 700 400 2000

Si se selecciona un hogar al azar, determine la probabilidad de que el jefe de hogar:

a. pertenezca al NSE A o D Rpta: 800/2000 b. tenga como mínimo un nivel educativo primario. Rpta: 1694/2000 c. tenga un nivel educativo secundario y no sea de NSE C. Rpta: 545/2000 d. tenga un nivel educativo primario o pertenezca al NSE D. Rpta: 1027/2000

4. En una encuesta de hogares realizada en la ciudad de Lima se entrevistó 248 hogares. La si-

guiente tabla muestra los hogares clasificados según sus ingresos familiares, tenencia de auto y tenencia de casa propia.

Hogares con ingresos de $1000 o menos Hogares con ingresos de más de $1000

Con casa propia Sin casa propia Con casa propia Sin casa propia

Con auto 37 14 37 8

Sin auto 48 40 49 15

Si elegimos un hogar encuestado al azar de esta ciudad, calcule la probabilidad de que: a. tenga casa propia. Rpta: 171/248 b. tenga un ingreso mayor a $1000. Rpta: 109/248 c. tenga un ingreso máximo de $1000 y tenga auto. Rpta: 51/248 d. tenga casa propia o no tenga auto. Rpta: 226/248 e. tenga un ingreso máximo de $1000 y que no tenga casa propia. Rpta: 54/248

5. La compañía de investigación de mercado “Seria Opinión”, realiza un estudio para evaluar la

aceptación de un nuevo producto que se desea lanzar al mercado. Por estudios previos en pro-ductos similares, se pronostica una probabilidad del 78% de que el producto resulte exitoso.

Page 148: 2015 Separata

Capítulo 3. Probabilidades 149

Sin embargo, se ha comprobado que sólo el 65% de los productos que se pronosticaban como exitosos lo fueron efectivamente, y que de los productos pronosticados como no exitosos por las encuestas, el 13% resultaron siendo exitosos.

a. ¿Cuál es la probabilidad de que el producto resulte realmente exitoso en el mercado?

Rpta: 0,5356 b. Si el producto no ha resultado exitoso. ¿cuál es la probabilidad de que se haya pronosticado

como tal? Rpta: 0,4121 6. En una empresa el 25% son mujeres y el 75% son hombres. Un día ha llegado tarde a trabajar el

3% de las mujeres y el 5% de los hombres. Si se elige, al azar, a un trabajador que ha llegado tarde, calcule la probabilidad de que sea elegida una mujer. Rpta: 0,1667

7. Una encuesta realizada en universidades privadas entre alumnos de maestría presenta los re-

sultados que se muestran en la siguiente tabla:

Modalidad de estudio

Principal motivo para solicitar ingreso a universidad Total

Calidad de la universidad Costo o comodidad Otros

Tiempo completo 421 393 76 890

Tiempo parcial 400 593 46 1039

Total 821 986 122 1929

Se elige al azar un alumno de maestría en una universidad privada, determine: a. ¿Cuál es la probabilidad de que sea de tiempo parcial y haya solicitado su ingreso conside-

rando la calidad de la universidad? b. Si el alumno es de tiempo completo, ¿cuál es la probabilidad de que la calidad de la institu-

ción no sea el motivo principal para elegirla? c. Sean los eventos: A = Alumno es de tiempo completo, B = El costo o comodidad es el prin-

cipal motivo de elección. ¿Son independientes los eventos A y B?

8. Se han llevado a cabo numerosos estudios de la planeación de los consumidores para la com-pra de bienes duraderos como televisores, refrigeradores, lavadoras, estufas, y automóviles. En uno de estos estudios se le preguntó a 1000 individuos elegidos al azar si estaban planeando comprar una nueva televisión en los siguientes 12 meses. Un año después se entrevistó a las mismas personas para ver si realmente hicieron la compra. La respuesta a ambas entrevistas se muestran en la siguiente tabla.

Planea comprar TV en los siguientes 12 meses

Finalmente compró una nueva TV

Finalmente no compró una nueva TV

Sí 200 50

No 100 650

Si de la muestra anterior se selecciona un individuo aleatoriamente: a. ¿Cuál es la probabilidad de que en el último año haya planeado comprar o finalmente haya

comprado una nueva televisión? b. Si el encuestado planeó comprar una nueva televisión, ¿cuál es la probabilidad de que fi-

nalmente haya comprado una?

Page 149: 2015 Separata

150 Estadística Básica con Aplicaciones en Excel 2010

9. Debido al auge de la comunicación en línea, las empresas colocan cada vez más órdenes elec-

trónicas. Una empresa de estudios socioeconómicos ha recopilado información acerca de las órdenes llenadas correctamente por cuatro tipos de empresas. Los resultados obtenidos se muestran en la siguiente tabla:

Orden Industria

Farmacéutica Consumo Computadoras Telecomunicaciones

Correcta 207 136 151 178

Incorrecta 3 4 9 12

Si elegimos al azar una empresa de los rubros mencionados. a. ¿Cuál es la probabilidad de que se elija una empresa de consumo y haya solicitado su orden

de manera incorrecta? Rpta: 4/700 b. Si la empresa elegida es de telecomunicaciones, ¿cuál es la probabilidad de que la orden

haya sido llenada de manera correcta? Rpta: 178/190

10. Un joven estima, por experiencias pasadas, que en una gran fiesta la probabilidad de que en una chica acepte bailar con él es del 4%. Si en una fiesta saca a bailar a 40 chicas. Asuma inde-pendencia entre la decisión de una chica y otra. Calcule la probabilidad de que baile por lo me-nos con una de ellas. Rpta: 0,8046

11. La investigación de mercados es el proceso de recopilación, procesamiento y análisis de infor-mación, respecto a temas relacionados con el marketing, como: clientes, competidores y mer-cado. En una compañía hay dos bases de datos sobre clientes, en la primera el 4,1% de los da-tos están equivocados, mientras que en la segunda el 3,4% de los datos están equivocados. De la primera base de datos, se saca el 75% de los datos de los clientes y el 25% restante viene de la segunda. Si se elige un cliente al azar y sus datos están equivocados, calcule la probabilidad de que provengan de la segunda base de datos. Rpta: 0,2166

12. Una empresa necesita aportaciones de sus socios para dos proyectos. La probabilidad de que

sus socios aporten para el proyecto de pago anticipado de deuda es 0,3 y que aporten para el proyecto de expansión de la capacidad productiva es de 0,6; la probabilidad de que aporten para ambos proyectos es de 0,08. a. ¿Cuál es la probabilidad de que los socios solamente aporten para uno de los proyectos?

Rpta: 0,74 b. ¿Cuál es la probabilidad de que los socios aporten para la expansión, si no aportaron para el

pago anticipado de deuda? Rpta: 0,7429

Page 150: 2015 Separata

Capítulo 4. Variable aleatoria y distribución de probabilidad 151

Capítulo 4. Variable aleatoria y distribución de probabilidad

Variable aleatoria

Sea un experimento aleatorio y el espacio muestral asociado. Una variable aleatoria asocia un valor numérico a cada uno de los resultados experimentales. El valor numérico de la variable alea-toria depende del resultado del experimento. Las variables aleatorias se designan por letras mayúsculas (X, Y, Z, etc.), y a sus valores por letras latinas minúsculas.

Ejemplo de variable aleatoria discreta

Sea el experimento aleatorio consistente en lanzar dos monedas, entonces este experimento determina el espacio muestral Ω = C1C2, C1S2, S1C2, S1S2. Si se define la variable aleatoria X como número de caras obtenidas, entonces el rango o recorrido es RX = 0, 1, 2

Ejemplo de variable aleatoria continua

Sea el experimento aleatorio consistente en registrar el tiempo en que se mete el primer gol de un partido de fútbol durante los 90 minutos de juego, 900/ xx . Si se define la varia-

ble aleatoria X como el tiempo registrado, entonces el rango o recorrido es 900/ xxRX .

Variable aletoria

Una variable aleatoria es una descripción numérica

del resultado de un experimento.

Rango o recorrido de una variable aleatoria

Se denomina así al conjunto de valores posibles que puede asumir la variable aleatoria X. Se denota por RX.

Discreta

Si el rango está determinado por un conjunto finito o infinito numerable de valores.

Continua

Si el rango está determinado por un conjunto infinito no numerable de valores.

Page 151: 2015 Separata

152 Estadística Básica con Aplicaciones en Excel 2010

Variable aleatoria discreta

Una variable aleatoria es discreta si el conjunto de valores que puede tomar es finito o infinito nu-merable. Una variable aleatoria discreta asume cada uno de los valores con cierta probabilidad que se deno-ta por P(X = x)

Distribución de probabilidad de una variable aleatoria discreta

La distribución de probabilidad de una variable aleatoria discreta X se describe como una función de probabilidad representada por f(x) que asigna a cada valor de la variable aleatoria, la probabili-dad de que X asuma ese valor, esto es:

f(x) = P(X = x) Toda función de probabilidad debe cumplir que:

f(x) 0

n

i

ixf1

1

Ejemplo 34 Sea el experimento aleatorio : lanzar una moneda dos veces. El espacio muestra es Ω = C1C2, C1S2, S1C2, S1S2 y n(Ω) = 4 Sea la variable aleatoria X: número de caras obtenidas, entonces el rango de X es RX = 0, 1, 2 Donde: La probabilidad de no obtener cara: f(0) = P(X = 0) = ¼ = 0,25 La probabilidad de obtener una cara: f(1) = P(X = 1) = ¼ + ¼ = 2/4 = 0,50 La probabilidad de obtener dos caras: f(2) = P(X = 2) = ¼ = 0,25 La tabla de función de probabilidad sería:

x 0 1 2

f(x) = P(X = x) 0,25 0,50 0,25

Esta tabla cumple con las siguientes condiciones:

f(x) 0 cada probabilidad es positiva y mayor o igual que cero

n

i

ixf1

1 la suma de todas las probabilidades es igual a uno

Page 152: 2015 Separata

Capítulo 4. Variable aleatoria y distribución de probabilidad 153

Ejemplo 35 La distribución de probabilidad de la variable aleatoria X definida como número de defectos por cada 10 metros de una tela sintética en rollos continuos de ancho uniforme, es:

x 0 1 2 3 4

f(x) = P(X = x) 0,41 0,37 k 0,05 0,01

a. Determine la constante k.

b. Calcule las siguientes probabilidades: P(X > 3), P(X > 1 / X < 3) y P(1 < X 4)

Solución

a. Para hallar la constante k, usamos la condición que

4

i

ixf1

1

4

0

i 143210xi

ffffff , por lo tanto k = 0,16

b. Calcule las siguientes probabilidades:

01,043 fXP

1702,016,037,041,0

16,0

3210

2

)3

231

ffff

f

XP

XPXXP

22,001,005,016,043241 fffXP

Ejercicio 53

La solicitud de préstamo que presentan los clientes de un banco está compuesta por cinco rubros. El gerente de préstamos desea realizar un estudio sobre la distribución de la cantidad de rubros rechazados por cada solicitud. La siguiente tabla muestra la distribución de probabilidad de la va-riable aleatoria X definida como el número de rubros rechazados por solicitud.

X = x 0 1 2 3 4 5

xXPxf 0,79 2k k 0,03 0,02 0,01

a. Determine la constante k y grafique la función f(x)

Si se elige una solicitud al azar: b. Calcule la probabilidad de que tengan dos rubros rechazados. c. Calcule la probabilidad de que tenga más de un rubro rechazado. d. Calcule la probabilidad de que tenga menos de tres rubros rechazados. e. Calcule la probabilidad de que tenga más de uno pero menos de cuatro rubros rechazados.

Solución

a. Para hallar la constante k, usamos la condición que

4

i

ixf1

........., por lo tanto, k =……………

Remplazando tenemos:

X = x 0 1 2 3 4 5

xXPxf 0,79

0,03 0,02 0,01

Page 153: 2015 Separata

154 Estadística Básica con Aplicaciones en Excel 2010

Si se elige una solicitud al azar: b. Calcule la probabilidad de que tenga dos rubros rechazados.

......................................................................................................... P

c. Calcule la probabilidad de que tenga más de un rubro rechazado.

......................................................................................................... P

d. Calcule la probabilidad de que tenga menos de tres rubros rechazados.

......................................................................................................... P

e. Calcule la probabilidad de que tenga más de uno pero menos de cuatro rubros rechazados.

......................................................................................................... P

Valor esperado de una variable aleatoria discreta

El valor esperado o esperanza matemática de una variable aleatoria X o media de una distribución de probabilidad de X se denota E(X).

nn

n

i

iiX xfxxfxxfxxfxXE

...22

1

11

Propiedades del valor esperado

Sean a, b y k constantes numéricas y X una variable aleatoria, entonces:

E(k) = k

E(aX+b) = aE(X)+b

0.0

0.2

0.4

0.6

0.8

1.0

1.2

0 1 2 3 4 5

f(x

)

X

Page 154: 2015 Separata

Capítulo 4. Variable aleatoria y distribución de probabilidad 155

Varianza de una variable aleatoria discreta

La varianza V(X) de una variable aleatoria discreta X con distribución de probabilidad f(x) se calcula por:

22 XEXEXV

La varianza de la variable aleatoria X, V(X), también se denota por 2X , o simplemente como 2 .

Propiedades de la varianza

Sean a, b y k constantes numéricas y X una variable aleatoria, entonces:

V(k) = 0

V(aX+b) = a2V(X)

Desviación estándar

Se denota por o DE(X). Sea X una variable aleatoria discreta con función de probabilidad f(x). La desviación estándar de X es dada por la siguiente expresión:

)XV(

Ejemplo 36 Uno de los mayores errores cometidos por la mayoría de las empresas es la ausencia de planifica-ción. Los negocios han de tener en cuenta que abrir un perfil en las redes sociales no significa ha-blar solo de la empresa o de sus productos y/o servicios sino que es vital la elaboración de una es-trategia adecuada a las necesidades y en la que se determine el público al que se quiere llegar me-diante estos medios. En el siguiente gráfico se muestra la distribución de la variable aleatoria X, definida como número de veces que la empresa actualiza su perfil a la semana.

k

0,12

0,20

6k

0,14 0,16

0,10

0.00

0.05

0.10

0.15

0.20

0.25

0.30

1 2 3 4 5 6 7

Pro

bab

ilid

ad

Número de veces que actualiza su perfil

Distribución de probabilidad del número de veces que actualiza su perfil a la semana

Page 155: 2015 Separata

156 Estadística Básica con Aplicaciones en Excel 2010

a. En base a la información mostrada en el gráfico, obtenga el valor de la constante k y complete la tabla de distribución de probabilidades:

Para hallar la constante k, usamos la condición que

4

i

ixf1

1 , por lo tanto, k =0,04

Remplazando tenemos:

b. Calcule las veces que se espera que las empresas actualicen su perfil a la semana. Interprete

2,410,07...12,0204,01 XE veces por semana

Si el experimento se repitiera muchas veces, a la larga las veces que se espera que las empresas actualicen su perfil a la semana es de 4,2 veces. Ejemplo 37 Según un reporte histórico de ventas de la empresa Kallpa, se ha podido determinar que el número de días transcurrido hasta la venta de un auto presenta la siguiente distribución de probabilidades:

X = número de días hasta la venta 2 3 4 5 6 7

xXPxf 0,1 0,2 0,4 0,15 0,1 0,05

Cada auto vendido, le reporta a la empresa una ganancia fija de $800; sin embargo, si el tiempo para la venta es menos de cuatro días gana adicionalmente $120, pero si el tiempo para la venta está entre 4 y 5 días gana adicionalmente $80, en otro caso no obtiene ganancia adicional. a. Determine el tiempo esperado para la venta de un auto y su desviación estándar.

1,405,071,0615,054,042,013,02 XE días

4,1805,071,0615,054,042,031,02 2222222 XE

Luego, calculamos la varianza 59,11,44,18 2 XV días2 siendo el valor de la desviación es-

tándar 26,159,1 días.

b. Calcule la ganancia que espera obtener la empresa.

G = ganancia en dólares 800 880 920

f(G) = Probabilidad 0,15 0,55 0,30

E(G) = 800 x 0,15 + 880 x 0,55 + 920 x 0,30 = $880

X = veces que actualiza su perfil a la semana 1 2 3 4 5 6 7

xXPxf 0,04 0,12 0,2 0,24 0,14 0,16 0,10

Page 156: 2015 Separata

Capítulo 4. Variable aleatoria y distribución de probabilidad 157

Ejercicio 54

La demanda diaria de un producto es una variable aleatoria X cuya distribución probabilidades está dada por la siguiente tabla:

x 1 2 3 4 5

f(x) 1/16 4/16 6/16 4/16 1/16

La empresa obtiene por cada unidad demandada de producto 100 nuevos soles de utilidad. Si la cantidad demanda en un día es mayor a dos unidades, se obtiene una utilidad adicional de 15 nue-vos soles por unidad demandada de producto. Calcule el valor esperado de la utilidad por la de-manda diaria de productos.

Solución

Completamos la tabla calculando primero la utilidad:

Utilidad (U) f(U) U x f(U)

Esperado de la utilidad E(U)

Por lo tanto, el valor esperado de la utilidad por la demanda diaria de productos es………………...

Ejercicio 55

La siguiente tabla muestra la distribución de probabilidad de la variable aleatoria X: Número de cuentas de correo que tiene un estudiante universitario.

X:= número de cuentas de correo 1 2 3 4

Probabilidad f(x) 2k + 0,03 0,30 0,40 k

a. Determine el valor de k para que f(x) sea función de probabilidad

Page 157: 2015 Separata

158 Estadística Básica con Aplicaciones en Excel 2010

b. Obtenga la probabilidad de que un estudiante universitario tenga al menos uno pero menos de cuatro cuentas de correo.

c. Determine e interprete el valor esperado del número de cuentas de correo.

d. Si por cada cuenta de correo le demanda al alumno 15 minutos diarios revisar cada cuenta

¿cuántos minutos esperaría un estudiante dedicar a sus cuentas de correo diariamente?

Ejercicios

1. El número de días necesario para que un obrero procese cierta pieza se modela con una varia-

ble aleatoria X con la siguiente función de probabilidad:

X:= número de días 2 3 4 5 6 7

f(x) 0,1 0,1 0,3 0,2 0,2 0,1

a. Calcule el tiempo medio de procesamiento de una pieza y la varianza. Rpta: 4,6 y 2,04

b. Para cada pieza procesada el obrero gana una cantidad fija de S/.5, pero si utiliza menos de

seis minutos gana S/.1,20 por cada minuto ahorrado. Determinar la media y la varianza de

la variable aleatoria ganancia obtenida por pieza ensamblada. Rpta: 6,8 y 2,38

2. La siguiente tabla muestra la distribución de probabilidad de la variable aleatoria X:= número

de papeletas impuestas a un taxista por exceso de velocidad en las zonas restringidas de una ciudad durante el último año.

X:= número de papeletas 0 1 2 3 4

Probabilidad f(x) 0,40 b 2b 0,07 0,08

Page 158: 2015 Separata

Capítulo 4. Variable aleatoria y distribución de probabilidad 159

a. Determine el valor de b para que f(x) sea función de probabilidad. Rpta: 0,15 b. Calcule la probabilidad que un taxista tenga por lo menos una pero menos de cuatro pape-

letas por exceso de velocidad. Rpta: 0,52 c. Si el costo de una papeleta por exceso de velocidad es de 430 nuevos soles, calcule el valor

esperado que paga un taxista por este tipo de papeletas durante el último año. Rpta: 550,40 nuevos soles

d. Si a la municipalidad le genera una utilidad por papeleta impuesta por exceso de velocidad

con la siguiente función 220150)( xxxU . Obtenga la utilidad que espera tener la muni-

cipalidad por taxista. Rpta: 126,80 nuevos soles 3. La siguiente tabla muestra la distribución de probabilidad de la variable aleatoria X: Número de

cuentas de correo que tiene un estudiante universitario.

X:= número de cuentas de correo 1 2 3 4

Probabilidad f(x) 2k+0,03 0,30 0,40 k

a. Determine el valor de k para que f(x) sea función de probabilidad

Rpta: 0,09 b. Obtenga la probabilidad que un estudiante universitario tenga al menos uno pero menos

de cuatro cuentas de correo. Rpta: 0,91

c. Determine e interprete el valor esperado del número de cuentas de correo. Rpta: 2,37 cuentas

d. Si por cada cuenta de correo le demanda al alumno15 minutos diarios revisar cada cuenta ¿cuántos minutos espera un estudiante dedicar a sus cuentas de correo diariamente?

Rpta: 35,55 min. 4. Uno de los mayores errores cometidos por la mayoría de las empresas es la ausencia de planifi-

cación. Los negocios han de tener en cuenta que abrir un perfil en las redes sociales no significa hablar solo de la empresa o de sus productos y/o servicios sino que es vital la elaboración de una estrategia adecuada a las necesidades y en la que se determine el público al que se quiere llegar mediante estos medios. En el siguiente gráfico se muestra la distribución de la variable aleatoria X: Número de veces que la empresa actualiza su perfil a la semana.

a. Si seleccionamos una empresa al azar, calcule la P(X 2 / X < 6) Rpta: 0,9459

k

0.12

0.2 6k

0.14 0.16

0.1

0.00

0.05

0.10

0.15

0.20

0.25

0.30

1 2 3 4 5 6 7

Pro

bab

ilid

ad

Número de veces que actualiza su perfil

Distribución de probabilidad del número de veces que actualiza su perfil a la semana

Page 159: 2015 Separata

160 Estadística Básica con Aplicaciones en Excel 2010

b. Si el coeficiente de variación de la variable aleatoria X es mayor o igual al 15% entonces la distribución de probabilidades es heterogénea. ¿Esta distribución es heterogénea?

Rpta: 38,97%

c. Si cada actualización de perfil demora 35 minutos, calcule el tiempo que se espera dedicar a la actualización del perfil a la semana. Rpta: 147 min.

5. La solicitud de préstamo que presentan los clientes de un banco puede ser aceptada o negada

por el gerente de préstamos. Se desea realizar un estudio sobre la distribución de la cantidad de solicitudes aceptadas por el gerente de préstamos. La siguiente tabla muestra la distribu-ción de probabilidad de la variable aleatoria X: Número de solicitudes aceptadas por día por el gerente de préstamos.

a. Determine el valor de k para que f(x) sea función de probabilidad. Rpta: 0,20 b. Si se sabe que el gerente puede aceptar al menos una solicitud al día, ¿cuál sería la probabi-

lidad que tenga que aceptar a lo más cuatro solicitudes al día? Rpta: 0,79 c. Determine e interprete el valor esperado de la variable X. Rpta: 3,05 solicitudes d. Calcule el coeficiente de variación de X. Rpta: CV(X)= 46,91%

X:=número de solicitudes aceptadas por día 0 1 2 3 4 5

Probabilidad f(x) 0,05 0,15 0,05 2k 0,15 k

Page 160: 2015 Separata

Capítulo 4. Variable aleatoria y distribución de probabilidad 161

Variable aleatoria continua

Función de densidad de probabilidad

Es la función que cumple las siguientes condiciones:

i. f(x) 0, para todo x de RX

ii. 1)( XR

dxxf

Esta función no asigna probabilidades en un punto como si lo hace la función de probabilidad de una variable aleatoria discreta. Para determinar probabilidades en un intervalo [a, b] contenido en el rango de X se usa:

b

a

dxxfbXaP )(

Valor esperado de una variable aleatoria continua

El valor esperado de una variable aleatoria continua definida en RX está dado por:

XR

dxxfxXE

Varianza de una variable aleatoria continua

La varianza para una variable aleatoria continua definida en RX está dada por:

22 XEXEXV , donde XR

2 dx)x(fxXE 2

Page 161: 2015 Separata

162 Estadística Básica con Aplicaciones en Excel 2010

Distribuciones discretas especiales

Distribución binomial

Entonces, si se tiene un experimento binomial con n intentos y la probabilidad p de éxito en cual-quier intento, la probabilidad de tener x éxitos en los n intentos está dada por:

xnxnx ppCxXPxf

1 x = 0, 1, 2,... , n

Se dice que la variable aleatoria X sigue una distribución binomial con parámetros n y p

Se denota X ~ B (n, p)

Características

Es simétrica si p = 0,5. Para valores de p < 0,5 la distribución tiene sesgo derecho y para valores p>0,5 tiene sesgo izquierdo, independientemente de los valores de n.

Para valores de n suficientemente grandes (n > 50), y sólo tomando en cuenta los valores rele-vantes de probabilidad, la distribución es prácticamente simétrica.

El esperado de una variable binomial es npXE

La varianza de una variable binomial es pnpXV 12

Un experimento binomial consiste en una serie de n pruebas o ensayos, donde n se fija antes de realizar el

experimento.

Las pruebas son idénticas y cada una de ellos puede resultar en uno de dos

posibles resultados que denotan éxito o fracaso.

Las pruebas son independientes entre sí por lo

que el resultado de un intento en particular no

influye en el resultado de cualquier otro.

La probabilidad de éxito es constante de una prueba a

otra y la denotamos como p.

Page 162: 2015 Separata

Capítulo 4. Variable aleatoria y distribución de probabilidad 163

Distribución binomial en Excel

En Excel 2010, use la función =DISTR.BINOM.N(Núm_éxito, Ensayos, Prob_éxito, acumulado) Ejemplo 38

La probabilidad de obtener éxito en un negocio de exportación de productos naturales es igual a 0,4. Un empresario está interesado en invertir en cinco sucursales de este rubro de manera inde-pendiente. a. Defina la variable, su distribución y rango o recorrido. b. ¿Cuál es la probabilidad que el empresario tenga éxito en al menos una sucursal? c. Determine el número esperado de sucursales en el que tendrá éxito. d. Determine la probabilidad de que no tenga éxito en al menos cuatro sucursales.

Solución

a. Defina la variable, su distribución, parámetros y rango o recorrido.

Definamos la variable aleatoria X = Número de sucursales con éxito.

Su distribución y parámetros: X B (n = 5, p = 0,4) Rango o recorrido: RX = 0, 1, 2, 3, 4, 5

b. ¿Cuál es la probabilidad que el empresario tenga éxito en al menos una sucursal?

En Excel 2010, use la función =DISTR.BINOM.N(Núm_éxito, Ensayos, Prob_éxito, acumulado)

En la ventana que aparece realice lo siguiente:

Núm_éxito: digite o haga clic a la celda que contiene el menor valor del rango de la variable, en este caso A5

Ensayos: se refiere al tamaño de muestra. Digite 5 o haga clic a la celda B2. Presione F4 para fijar la celda.

Prob_éxito: se refiere a la probabilidad de éxito. Digite 0.4 o haga clic a la celda B1. Presione F4 para fijar la celda.

Acumulado: Como vamos a obtener la tabla de función de probabilidad digitamos el valor 0. Colocamos el valor cero porque lo que se va a obtener son probabilidades puntuales.

Finalmente, compruebe que la suma de las probabilidades debe darle uno. Con esta tabla esta-remos listos para obtener cualquier valor de probabilidad.

Page 163: 2015 Separata

164 Estadística Básica con Aplicaciones en Excel 2010

La probabilidad solicitada será:

9222,00102,00768,02304,03456,02592,01 XP

c. Determine el número esperado de sucursales en el que tendrá éxito.

24,05 pnXE

d. Determine la probabilidad de que no tenga éxito en al menos cuatro sucursales.

Debemos observar que en esta pregunta la variable ha cambiado, ahora estamos interesados en las que no tienen éxitos; por lo tanto, ha cambiado también la probabilidad de éxito. Realice los pasos mostrados en la pregunta a. para dar respuesta a la pregunta. Definamos la variable aleatoria Y= Número de sucursales sin éxito.

Su distribución y parámetros: Y B (n = 5, p = 0,6) Rango o recorrido: Ry =0, 1, 2, 3, 4, 5

La probabilidad solicitada será: 33696,04 YP

Ejercicio 56

Una empresa especializada en proyectos de inversión tiene en cartera 10 proyectos elaborados y expeditos para ser sometidos a la evaluación de concursos de licitación pública estatal. De acuerdo con su experiencia, el gerente de la empresa sabe que el 20% de los proyectos ganan la buena pro. Suponga que en un concurso de licitación pública se presentan estos diez proyectos. a. Calcule la probabilidad de que dos proyectos ganen la licitación.

b. Calcule la probabilidad de que por lo menos ocho proyectos ganen la licitación.

c. Calcule la probabilidad de que a lo más cuatro proyectos ganen la licitación.

d. Calcule la probabilidad de que más de tres pero como máximo 7 proyectos ganen la licitación.

Page 164: 2015 Separata

Capítulo 4. Variable aleatoria y distribución de probabilidad 165

Solución

La variable en estudio es ………………….…………………………………………………….. Sus parámetros son: n = ………………………..………. y p = …………………….………….. El rango de la variable X es ………………………………………………………………..…… En Excel 2010, use la función =DISTR.BINOM.N(…………, …………, ……..…, …….…) a. Calcule la probabilidad de que dos proyectos ganen la licitación. La probabilidad pedida es: …………………........ cuyo valor es: ………..………………… b. Calcule la probabilidad de que por lo menos ocho proyectos ganen la licitación. La probabilidad pedida es: …………………........ cuyo valor es: ………..………………… c. Calcule la probabilidad de que a lo más cuatro proyectos ganen la licitación. La probabilidad pedida es: …………………........ cuyo valor es: ………..………………… d. Calcule la probabilidad de que más de tres pero como máximo siete proyectos ganen la licita-

ción. La probabilidad pedida es: …………………........ cuyo valor es: ………..…………………

Page 165: 2015 Separata

166 Estadística Básica con Aplicaciones en Excel 2010

Distribución hipergeométrica

La probabilidad de obtener de x éxitos en la muestra de n elementos es:

,Nn

rNxn

rx

C

CCxf

x = máximo0, n+r- N,…,mínimon, r

Se dice que la variable X sigue una distribución hipergeométrica con parámetros N, r y n.

Se denota X ~ H (N, n, r)

Características

El esperado de una variable hipergeométrica es N

rnXE

La varianza de una variable hipergeométrica es

112

N

nN

N

r

N

rnXV

Consideremos N elementos, de los cuales r son

considerados éxitos y por lo tanto N - r como fracasos.

Como en el caso de la distribución binomial se desea

calcular la probabilidad de obtener x éxitos en una

muestra de n elementos.

El experimento hipergeométrico consiste en

extraer al azar y sin reemplazo n elementos de un conjunto

de N elementos, r de los cuales son éxitos y (N - r )son

fracasos.

0.00

0.10

0.20

0.30

0.40

0.50

0 1 2 3 4 5

f(x

)

X

Page 166: 2015 Separata

Capítulo 4. Variable aleatoria y distribución de probabilidad 167

Distribución hipergeométrica en Excel

En Excel 2010, use la función =DISTR.HIPERGEOM.N(Muestra_éxito, Núm_de_muestra, Pobla-ción_éxito,Núm_de_población, Acumulado) Ejemplo 39 La SUNAT tiene en su almacén diversos artículos producto de la incautación por evasión tributaria. Entre los productos incautados se encuentran 11 camionetas, de las cuales cinco son de marca ja-ponesa y el resto de procedencia china. Si el encargado selecciona al azar siete camionetas para un remate, a. Determine la probabilidad de que se encuentren a lo más tres camionetas de procedencia chi-

na. b. Determine la probabilidad de que se encuentren más de tres camionetas de procedencia china. c. Determine la probabilidad de que se encuentren más de tres pero como máximo cinco camio-

netas de procedencia china.

Solución

Definimos la variable aleatoria X: número de camionetas de procedencia china.

Su distribución y parámetros: X H (N = 11, n = 7, r = 6) Rango o recorrido: RX = máximo0, 7+6-11,…, mínimo7, 6, luego RX = 2, 3, 4, 5, 6 En Excel 2010, use la función =DISTR.HIPERGEOM.N(Muestra_éxito, Núm_de_muestra, Pobla-ción_éxito, Núm_de_población, acumulado) En la ventana que aparece realice lo siguiente:

Muestra_éxito: digite o haga clic a la celda que contiene el menor valor del rango de la variable. En este caso la celda A6 contiene al menor valor del rango de la variable.

Núm_de_muestra: se refiere al tamaño de muestra. Digite 7 o haga clic a la celda B2. Presione F4 para fijar la celda.

Población_éxito: se refiere al número de éxitos en la población. Digite 6 o haga clic a la celda B3. Presione F4 para fijar la celda.

Núm_de_población: se refiere al tamaño de la población. Digite 11 o haga clic a la celda B1. Presione F4 para fijar la celda.

Acumulado: Como vamos a obtener la tabla de función de probabilidad digitamos el valor 0. Colocamos el valor cero porque lo que vamos a obtener son probabilidades puntuales.

Page 167: 2015 Separata

168 Estadística Básica con Aplicaciones en Excel 2010

Finalmente, compruebe que la suma de las probabilidades debe darle uno. Con esta tabla estare-mos listos para obtener cualquier valor de probabilidad.

a. Determine la probabilidad de que se encuentren a lo más tres camionetas de procedencia chi-

na.

3485,0)3()2(3 XPXPXP

b. Determine la probabilidad de que se encuentren más de tres camionetas de procedencia china.

6515,0)6()5()4(3 XPXPXPXP

c. Determine la probabilidad de que se encuentren más de tres pero como máximo cinco camio-netas de procedencia china.

6364,0)5()4(53 XPXPXP

Page 168: 2015 Separata

Capítulo 4. Variable aleatoria y distribución de probabilidad 169

Ejercicio 57

Una florería tiene 10 vehículos de reparto que se utilizan principalmente para llevar flores y arre-glos florales en la ciudad. Suponga que dos de los 10 camiones tienen problemas con los frenos. Si se seleccionan al azar cuatro vehículos al azar para probarlos, ¿cuál es la probabilidad de que dos de los camiones probados no tengan frenos defectuosos?

Solución

La variable en estudio es ………………………….…………………………………………………………………………….….…….. Sus parámetros son: N = ………………. , n = …………………. y r = ……………………….. El rango de la variable X es ……………………………………………………………………… En Excel 2010, use la función =DISTR.HIPERGEOM.N(………., ………., ………., ………., ) La probabilidad pedida es: …………………........ cuyo valor es: ……………………………

Page 169: 2015 Separata

170 Estadística Básica con Aplicaciones en Excel 2010

Distribución de Poisson

La probabilidad de tener x resultados en un intervalo dado o en una región específica es:

!)(

x

exf

x , donde RX = 0, 1, 2, 3,…

x = número de éxitos por unidad de tiempo o región.

= número esperado de éxitos por unidad de tiempo o región o razón promedio de ocurrencia. t = periodo de evaluación e = 2,71828…

Se dice que la variable aleatoria X sigue una distribución de Poisson con parámetro

Se denota X ~ P()

Siempre es una distribución sesgada a la derecha. A medida que aumenta y tomando en cuenta sólo los valores relevantes de probabilidad, la distribución tiende a hacerse simétrica.

El experimento que origina una variable aleatoria que sigue una distribución de Poisson se denomina proceso de Poisson y posee las siguientes propiedades:

El número de resultados que ocurre en un intervalo o

región de espacio cualquiera es independiente

del número que ocurre en cualquier otro intervalo o

región del espacio disjunto.

La probabilidad de que ocurra un solo resultado durante el intervalo muy

corto o región muy pequeña es proporcional a la longitud del intervalo o al tamaño de la región y no depende del número de resultados que ocurren fuera del intervalo

o región.

La probabilidad de que ocurra más de un resultado

en tal intervalo corto o caiga en tal región pequeña es

insignificante.

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

0.16

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

f(x

)

X

Page 170: 2015 Separata

Capítulo 4. Variable aleatoria y distribución de probabilidad 171

El esperado de una variable Poisson es tXE

La varianza de una variable Poisson es tXV 2

Distribución de Poisson en Excel

En Excel 2010, use la función =POISSON.DIST(x, media, acumulado) Ejemplo 40 Entre las 10:00 am. y 11:00 am. en promedio ocho personas hacen uso de un cajero automático, ubicado al lado de la puerta de entrada de un banco. Asimismo, el número de clientes que ingresan al banco entre las 10:00 am. y 11:00 am. en promedio es 15 clientes. Considere que el número de clientes que hacen uso del cajero es independiente del número de clientes que ingresan al banco y ambos siguen un proceso de Poisson.

a. ¿Cuál es la probabilidad de que menos de 10 pero más de 8 usen el cajero en ese horario? b. ¿Cuál es la probabilidad de que entre las 10:00 am y las 10:30 am, ingresen al banco menos de

tres clientes?

Solución

a. Definamos la variable aleatoria X = Número de clientes que hacen uso del cajero entre las 10 y

11 am. X P( = 8) En Excel 2010, use la función =POISSON.DIST(x, 8, 0) La probabilidad pedida es P(8 < X < 10) = P(X = 9) = 0,1241

b. Definamos la variable aleatoria:

X = Número de clientes que ingresan al banco entre las 10 y 10:30 am. X P( = 7,5) En Excel 2010, use la función =POISSON.DIST(x, 7.5, 0) La probabilidad pedida es: P(X < 3) = 0,0203

Ejercicio 58

El número de barcos que llegan a un puerto cada semana (siete días) es una variable aleatoria que tiene distribución de Poisson con media igual a 14 barcos. ¿Cuál es la probabilidad de que en tres días lleguen más de dos barcos?

Solución

La variable en estudio es ……………………………………………………………….…….. La razón promedio es ………………………………………………………………………… El periodo de evaluación t = ………………………………………………………………….. Por lo tanto, la media es …………………………………………………………………..….

Page 171: 2015 Separata

172 Estadística Básica con Aplicaciones en Excel 2010

En Excel 2010, use la función =POISSON.DIST(……..…………, …..…………., …..………….) La probabilidad pedida es: …………………………………......... cuyo valor es: ……………………………………………

Ejercicio 59

El banco Credibank ha planificado abrir una agencia frente a una universidad. Asumiendo que lle-gan a la agencia en promedio tres personas por minuto. Calcule la probabilidad de que en dos mi-nutos lleguen como mínimo dos y como máximo cuatro personas a la agencia.

Solución

La variable en estudio es ……………………………………………………………………………………………….………….……..

La razón promedio es …………………………………………………………………………..…… El periodo de evaluación t = …………………………………………………………….……….. Por lo tanto, la media es ………………………………………………………………………..…. En Excel 2010, use la función =POISSON.DIST(……..…………, …..…………., …..………….) La probabilidad pedida es: ………………………………….…........ cuyo valor es: …………………………………………

Ejercicios de aplicación

1. La empresa textil Pima sabe por experiencias previas que el porcentaje de pedidos que cumple

con la entrega en el plazo establecido con sus clientes del exterior es del 92%. a. Si se eligen al azar cinco pedidos, calcule la probabilidad de tres pedidos se entreguen en el

plazo establecido. Rpta: 0,0498 b. Si se eligen al azar cinco pedidos, calcule la probabilidad de que por lo menos cuatro pedi-

dos no se entreguen en el plazo establecido. Rpta: 0,0002 2. Un fabricante de piezas garantiza que una caja de sus piezas contendrá como máximo un defec-

tuoso. Si la caja contiene 10 piezas, y la experiencia ha demostrado que ese proceso de fabrica-ción produce 5% de piezas defectuosas, ¿cuál es la probabilidad de que una caja elegida al azar satisfaga la garantía? Rpta: 0,9139

3. La empresa Copimix alquila máquinas fotocopiadoras usadas, debido a que tiene muchas solici-

tudes de sus clientes no se abastece a darle un mantenimiento efectivo, por lo que algunos de sus clientes devuelven las fotocopiadoras por mal funcionamiento. Entre ocho fotocopiadoras usadas que se suministraron, tres funcionan mal. Un cliente desea alquilar cuatro máquinas rá-pidamente y se le envían sin verificarlas. Calcule la probabilidad que el cliente reciba, por lo menos una de las máquinas que trabajan mal.

4. Los tipos de usuarios que frecuentan las redes sociales son:

Los usuarios creadores, aquellos que crean blogs y comparten información

Los usuarios críticos, que comentan en blogs y escriben opiniones.

Page 172: 2015 Separata

Capítulo 4. Variable aleatoria y distribución de probabilidad 173

Si de un total de 14 usuarios, de los cuales 11 son creadores se seleccionan al azar a cinco usuarios, ¿cuál es la probabilidad de encontrar por lo menos tres usuarios creadores?

Rpta: 0,9725 5. A una garita de peaje en promedio llegan 240 autos por hora según un proceso de Poisson. El

administrador de la garita ordena atender inicialmente solamente una caseta, pero si en el lap-so de dos minutos llegan como mínimo 10 autos (considera que se produce una congestión), entonces ordena inmediatamente atender en otra caseta más hasta que se produzca el des-congestionamiento. ¿Cuál es la probabilidad que el administrador tenga que ordenar atender en otra caseta?

6. La llegada de reclamos a una oficina reguladora sigue un proceso Poisson con media de dos

reclamos cada cuatro minutos. a. Calcule la probabilidad que en un minuto se reciba 2 reclamos. b. Determine la probabilidad que en 10 minutos se presenten por lo menos dos reclamos. c. Calcule la probabilidad de que en 1 hora se reciba exactamente 28 reclamos.

7. Una florería tiene quince camiones de reparto que se utilizan principalmente para llevar flores y

arreglos en una ciudad. Supóngase que seis de los quince camiones tienen frenos defectuosos. Se seleccionaron cinco camiones al azar para probarlos. ¿Cuál es la probabilidad que menos de dos de los camiones probados tengan frenos defectuosos?

8. Al pintar planchas de acero con cierto tipo de pintura ocurren pequeños defectos que se distri-

buyen aleatoriamente en la superficie según una distribución de Poisson con un promedio de 2,5 defectos por cada 100 cm2. Calcule la probabilidad de que presente por lo menos dos defec-tos en una plancha de acero de 20 cm2.

9. En un almacén de una empresa importadora de electrodomésticos se tienen 23 equipos de

sonido para su comercialización, 15 de estos equipos de sonido son de la marca Sonyc y el resto son de la marca Power. El gerente de ventas de la empresa le ha encargado a uno de los em-pleados que seleccione al azar 5 equipos de sonido para llevarlos a la tienda para la venta del día. Calcule la probabilidad que el empleado lleve más de dos equipos de sonido de la marca Power.

10. Una empresa especializada en proyectos de inversión tiene en cartera 10 proyectos elaborados y expeditos para ser sometidos a la evaluación de concursos de licitación pública estatal. De acuerdo con su experiencia, el gerente de la empresa sabe que el 20% de los proyectos ganan la buena pro. Suponga que en un concurso de licitación pública se presentan estos diez proyectos. Calcule la probabilidad de que dos o tres proyectos ganen la licitación.

Page 173: 2015 Separata

174 Estadística Básica con Aplicaciones en Excel 2010

Distribuciones continuas especiales

Distribución de probabilidad uniforme

Función de densidad

casootroen

bxaabxf

0

1

Se dice que X tiene una distribución uniforme con parámetros a y b.

Se denota X ~ U (a, b)

Características

Es simétrica respecto al eje 2

baX

El esperado de una variable uniforme es 2

baXE

La varianza de una variable uniforme es

12

22 ab

XV

Page 174: 2015 Separata

Capítulo 4. Variable aleatoria y distribución de probabilidad 175

Ejemplo 41 Las ventas semanales (en miles de nuevos soles) en un restaurante tiene distribución uniforme entre 2,5 y 12,5 a. Si el restaurante necesita vender como mínimo 5000 nuevos soles para cubrir sus gastos, de-

termine la probabilidad de que en una semana cualquiera no pueda cubrir sus gastos. b. ¿Cuál es la probabilidad de que en la siguiente semana las ventas se desvíen del promedio a lo

más en 800 nuevos soles?

Solución

Sea la variable aleatoria X = Las ventas semanales (en miles de nuevos soles) en un restaurante.

5,12;5,2~ b aUX

a. Si el restaurante necesita vender como mínimo 5000 nuevos soles para cubrir sus gastos, de-termine la probabilidad de que en una semana cualquiera no pueda cubrir sus gastos.

La probabilidad pedida es 25,00,10

5,25 XP

b. ¿Cuál es la probabilidad de que en la siguiente semana las ventas se desvíen del promedio a lo

más en 800 nuevos soles?

La probabilidad pedida es: 16,00,10

6,13,87,6 XP

Ejercicio 60

La empresa Almacenes Unidos se encarga de la distribución de cierto producto a los supermercados de Lima. El tiempo que transcurre entre la recepción del pedido y su entrega es una variable aleato-ria que se distribuye uniformemente entre 18 y 36 minutos. a. Determine la probabilidad de que el tiempo que transcurre entre la recepción del pedido y su

entrega sea a lo más en de media hora. b. Determine la probabilidad de que el tiempo que transcurre entre la recepción del pedido y su

entrega esté comprendido entre 20 y 30 minutos. c. Determine la probabilidad de que el tiempo que transcurre entre la recepción del pedido y su

entrega sea por más de 25 minutos.

Solución

La variable en estudio es ……………………………………………………………….…..….. Sus parámetros son: a = ……………………..………. , b = ………………………………….

Page 175: 2015 Separata

176 Estadística Básica con Aplicaciones en Excel 2010

a. Determine la probabilidad de que el tiempo que transcurre entre la recepción del pedido y su

entrega sea a lo más media hora.

La probabilidad pedida es …………………........ cuyo valor es ………………..…………… b. Determine la probabilidad de que el tiempo que transcurre entre la recepción del pedido y su

entrega esté comprendido entre 20 y 30 minutos.

La probabilidad pedida es …………………........ cuyo valor es ………………..…………… c. Determine la probabilidad de que el tiempo que transcurre entre la recepción del pedido y su

entrega sea por más de 25 minutos.

La probabilidad pedida es …………………........ cuyo valor es ………………..……………

Page 176: 2015 Separata

Capítulo 4. Variable aleatoria y distribución de probabilidad 177

Distribución normal

Función de densidad

2

2

1

2

1

x

exf

Se dice que la variable aleatoria X sigue una distribución normal con parámetros media y va-

rianza 2.

Se denota X N (, 2)

Características

La función de densidad tiene forma de campana y es simétrica, por lo que las medidas de ten-dencia central coinciden.

El rango de la variable normal es toda la recta real, esto es, de – a + .

Estandarización

Se toma como referencia una distribución normal estándar ( = 0 y 2 = 1). Se trabaja con la distan-

cia entre x y en función de la desviación estándar, tal como se muestra.

XZ

Page 177: 2015 Separata

178 Estadística Básica con Aplicaciones en Excel 2010

Distribución normal en Excel

En Excel 2010, use la función:

P(X ≤ x)=DISTR.NORM.N(x, media, desviación estándar, acumulado)

k =INV.NORM(α, media, desviación estándar), tal que P(X ≤ k) = α Ejemplo 42 En un proceso fotográfico, el tiempo de revelado de las impresiones puede considerarse una varia-ble aleatoria con distribución normal con media 16,28 segundos y desviación estándar de 0,12 se-gundos. a. Si se elige una impresión al azar, calcule la probabilidad de que el tiempo de revelado sea me-

nor de 16,55 segundos. b. Calcule el tiempo máximo de impresión para ser considerada en el grupo del 10% con los me-

nores tiempos de revelados.

Solución

a. Sea la variable aleatoria X =tiempo de revelado de las impresiones (en segundos), entonces

X N( = 16,28; 2 = 0,122)

En Excel 2010, use la función =DISTR.NORM.N(16,55, 16.28, 0.12, 1) = 0,9878

La probabilidad pedida es 9878,055,16 XP

b. El tiempo máximo de impresión para ser considerada en el grupo del 10% con los menores

tiempos de revelados cumple que 10,0 kXP

En Excel 2010, use la función =INV.NORM(0,1, 16.28, 0.12); de donde, k = 16,13 segundos.

Ejercicio 61

El consumo mensual de energía eléctrica en KW de una ciudad tiene distribución normal con media

de 140 KW, con una desviación estándar de 20 KW.

a. ¿Cuál es la probabilidad que un hogar tenga un consumo menor de 150 KW? b. ¿Qué porcentaje de hogares registran un consumo entre 115 y 160 KW? c. Calcule el consumo mínimo de energía eléctrica para pertenecer al 15% de los mayores consu-

midores.

Solución

La variable en estudio es …...…………………………………………………………………….……..

Sus parámetros son: = ……………………..………. y 2 = ………………………………..……. a. La probabilidad pedida es …………………..……........ cuyo valor es …………….……

b. La probabilidad pedida es …………………..……........ cuyo valor es …………….…… c. El percentil a calcular es …………………..………...... cuyo valor es ……………………

Page 178: 2015 Separata

Capítulo 4. Variable aleatoria y distribución de probabilidad 179

Distribución Función de probabilidad o

función de densidad Rango E(X) V(X)

Binomial xnxnx ppCxf

1 0, 1, 2, . . ., n np pnp 1

Hipergeométrica Nn

rNxn

rx

C

CCxf

)(

,min,...,

)(,0max

rn

rNn

N

rn

11

N

nN

N

r

N

rn

Poisson !

)(x

exf

x 0, 1, 2, 3, ... .t .t 2

Uniforme ab

xf

1

a ≤ x ≤ b 2

ba

12

2ab

Normal

2

2

1

2

1

x

exf Toda la recta real 2

Page 179: 2015 Separata

180 Estadística Básica con Aplicaciones en Excel 2010

Ejercicios de aplicación

1. La llegada de cada uno de los empleados a su centro de labores se produce independiente-

mente, de acuerdo con la distribución uniforme en el intervalo de 8:00 a 8:25 am.

a. Calcule la probabilidad de que un empleado llegue a su centro de labores después de las 8:17 am. Rpta: 8/25

b. Si le informan que un empleado llegó después de 8:17 am, calcule la probabilidad de que haya llegado entre las 8:18 y las 8:20 am. Rpta: 2/8

2. La cantidad de productos (demanda diaria de cierto producto) que se vende en una distribui-

dora tiene distribución uniforme en el intervalo [5000, 8000]. Para la venta diaria esta distri-

buidora debe almacenar el producto al inicio del día. Determine la cantidad que se debe alma-

cenar de modo que el 1% de días esta distribuidora no pueda satisfacer la demanda.

Rpta: 7 970

3. Asuma que los ingresos mensuales, en nuevos soles, de los trabajadores del sector público

están distribuidos uniformemente con parámetros a y b. Si se sabe que el ingreso promedio

mensual es 1350 nuevos soles y la varianza es 123002 nuevos soles2.

a. Determine los parámetros de la distribución. Rpta: a = 1200, b = 1500 b. Calcule la probabilidad de que un trabajador elegido al azar tenga un ingreso mensual entre

1350 y 1520 nuevos soles. Rpta: 170/300 4. Actualmente se está realizando una auditoria a los dos bancos financieros que operan en una

ciudad norteña a los que llamaremos Alfa y Beta. Se ha determinado que el banco Alfa tiene el

65% de clientes y Beta el resto. Además, los depósitos bancarios de Alfa tienen distribución uni-

forme entre 1500 y 5000 dólares mensuales, mientras que los depósitos bancarios de Beta tie-

nen distribución normal con media de 3000 dólares y desviación estándar 1800 dólares por mes.

Si los auditores encargados tienen a disposición los depósitos bancarios de ambos bancos y eli-

gen uno al azar, determine:

a. La probabilidad de que dicho depósito exceda los 3500 dólares. Rpta: 0,4153 b. Si el depósito bancario elegido excede los 3500 dólares, determine la probabilidad de que

dicho depósito pertenezca al banco Beta. Rpta: 0,3292

5. Una máquina llena recipientes con determinado producto. Se sabe que la media y desviación

estándar para los pesos de llenado, de acuerdo con datos históricos, son 18,123 onzas y 0,6 on-

zas. El peso de llenado se modelo mediante una variable aleatoria normal.

a. Si se selecciona un recipiente al azar, ¿cuál es la probabilidad que su peso sea mayor a 16 onzas pero menor o igual que 20 onzas? Rpta: 0,9989

b. ¿Cuál es el peso máximo de un recipiente para estar considerado dentro del 25% de los re-cipientes menos pesados? Rpta: 17,72 onzas

6. El salario semanal que percibe un trabajador de una empresa dedicada a la construcción civil se

distribuye normalmente con una media de 900 nuevos soles y desviación estándar de 100 nue-

vos soles.

a. ¿Cuál es la probabilidad de que un trabajador elegido al azar tenga un salario semanal me-nor de 910 nuevos soles? Rpta: 0,5398

b. El 10% de los trabajadores de esta empresa son jefes de cuadrillas y son los mejores paga-dos. ¿Cuál es salario mínimo de un jefe de cuadrilla? Rpta: 1028,16 nuevos soles

Page 180: 2015 Separata

Capítulo 4. Variable aleatoria y distribución de probabilidad 181

7. Perubank, es una institución bancaria que proporciona una amplia gama de servicios financieros,

que comprende todo tipo de depósitos, prestamos, hipotecas, seguros, entre otros servicios de inversión, todos dentro del marco de una estrategia única. Se ha determinado que un cliente de Perubank con una buena historia crediticia tiene una deuda que se distribuye normalmente con promedio de 15015 soles y una desviación estándar de 3540 soles. a. Si se selecciona a un cliente con buena historia crediticia, ¿cuál es la probabilidad de que el

monto de su deuda se encuentre entre 12000 y 18000 soles? Rpta: 0,6033 b. La gerencia de Perubank ha determinado amonestar a los clientes que hayan alcanzado

deudas muy altas al final del mes. Determine el valor de la deuda mínima a partir del cual se amoneste al 11% de los clientes con deudas muy altas. Rpta: 19357

8. Suponga que el tiempo utilizado en revisar sugerencias y comentarios de los clientes tiene dis-tribución normal con media de 8,5 horas y una desviación estándar de 2,5 horas.

a. Calcule la probabilidad de que el tiempo sea mayor a 7,5 horas Rpta: 0,65542 b. Determine el tiempo mínimo que emplea un ejecutivo para atender al 15,38% de los

clientes que tienen muchas dudas, lo que implica que dedican más tiempo en consultas. Rpta: 11,05 minutos

9. El tiempo que demoran en atender a un cliente en la ventanilla de una empresa financiera se

considera una variable aleatoria que tiene distribución uniforme con media 6,5 minutos y va-rianza 3 minutos2. Calcule la probabilidad de demorar en atender a un cliente entre 5 y 7 minu-tos. Rpta: 0,33

10. Así como el uso de redes sociales tiene ventajas para las empresas, también se presentan ries-

gos. El valor medio de las pérdidas se estima en 15 mil soles. Si esta variable se considera uni-

formemente distribuida con varianza

mil soles2. Determine la probabilidad de que una em-

presa haya registrado una pérdida superior de 14,2 miles de soles. Rpta: 0,66

Page 181: 2015 Separata
Page 182: 2015 Separata

Capítulo 5. Muestreo 183

Capítulo 5 Muestreo

Unidad elemental

Es el objeto sobre el cual se hace la medición. También es llamada unidad de observación, unidad de análisis, unidad estadística, caso o elemento. Por ejemplo, en estudios de poblaciones humanas, con frecuencia ocurre que la unidad elemental es cada individuo.

Población muestreada

Es el conjunto de todas las unidades de elementales posibles que podrían extraerse en una mues-tra; es decir, es la población de donde se extrae la muestra.

Unidad de muestreo

Es la unidad donde realizamos la muestra. Por ejemplo, podríamos querer estudiar a las personas, pero no tenemos una lista de todos los individuos que pertenecen a la población objetivo. En vez de eso, la unidad de muestreo es cada familia y la unidad elemental es cada individuo que vive en una familia.

Marco muestral

Es una lista de las unidades de muestreo que están disponibles para elección.

Ejemplo

Para las encuestas telefónicas el marco de muestreo podría ser una lista de todos los números tele-fónicos residenciales de la ciudad; para las entrevistas personales una lista de las direcciones de todas las calles; para una encuesta de agricultura una lista de todas las granjas o un mapa con todas las áreas que contienen granjas.

Ejemplo

Page 183: 2015 Separata

184 Estadística Básica con Aplicaciones en Excel 2010

Censo

Es el estudio completo de todas unidades elementales de la población.

Muestreo

Un estudio estadístico se inicia con la selección de una muestra, este proceso recibe el nombre de muestreo el cual comprende por lo menos dos etapas:

La selección de las unidades

El registro de las observaciones.

Ejemplo

Niveles socioeconómicos en Lima Metropolitana y Callao Asociación Peruana de Empresas de Investigación de Mercados (APEIM)

Miraflores, Abril de 2005 Ficha técnica Universo de estudio Se consideró como universo de estudio a todos los hogares pertenecientes a Lima Metropolitana entendi-da como los distritos de Lima ubicados en el núcleo urbano (sin considerar balnearios) y la Provincia Consti-tucional del Callao. Se definió como hogar, al conjunto de personas que, habitando en la misma vivienda, preparan y consu-men sus alimentos en común. La persona informante fue el jefe de familia, definido como aquella persona que más aporta económica-mente en el hogar. Marco muestral Para el desarrollo de la investigación se consideró como marco muestral:

La base de datos de viviendas del Instituto Nacional de Estadística e Informática (INEI).

Actualización mediante aplicación de rastreo de campo efectuada por APEIM en las zonas de mayor crecimiento de la ciudad (conos)

Tamaño de la muestra Se entrevistó a un total de 3 598 hogares distribuidos en 41 distritos. El margen de error máximo probable con un nivel de confianza del 95,1 % y considerando el máximo de dispersión (p = q = 50%) fue de ± 1,63%. Dentro de esta muestra se realizaron 200 entrevistas en Distritos con predominio de los N.S.E. Muy Al-to/Alto con el propósito de obtener una submuestra estadísticamente significativa para este segmento. El total de entrevistas fue desagregado proporcionalmente a la distribución poblacional de cada uno de los distritos de Lima Metropolitana. Selección de la muestra Determinada la cantidad de entrevistas a aplicar por distrito, se procedió a sortear tantas manzanas como entrevistas se requerían. Dentro de cada manzana se seleccionó por un sistema aleatorio simple cinco viviendas: una titular y cuatro reemplazos o suplentes. Los hogares originalmente seleccionados (titulares), fueron visitados hasta en tres oportunidades antes de proceder al reemplazo. Se controló que la tasa de reemplazo no excediera el 10% del total de entrevistas originalmente sorteadas.

Page 184: 2015 Separata

Capítulo 5. Muestreo 185

Muestreo probabilístico

En el muestreo probabilístico, la selección de cada elemento de la muestra se hace siguiendo reglas matemáticas de decisión. Todos los elementos de la población tienen una probabilidad real y cono-cida de ser seleccionados. Existen diversos métodos de muestreo probabilístico, como por ejemplo:

Muestreo aleatorio simple

En este procedimiento, se selecciona una muestra en forma aleatoria y sin reemplazo a n unidades de muestreo de una población que contiene un total de N unidades. Se garantiza que cada una de las muestras posibles tiene la misma probabilidad de ser elegida.

Pasos a seguir para seleccionar una muestra simple aleatoria

1. Enumere las unidades del marco muestral con números sucesivos.

2. Seleccione tantos elementos del marco muestral como sea el tamaño requerido de la muestra, usando una tabla de números aleatorios.

El muestreo aleatorio simple presenta dos propiedades:

Representativa: Cada unidad tiene las mismas posibilidades de ser escogida.

Independencia: La selección de una unidad no influye en la selección de otras unidades.

Pero en el mundo real es difícil encontrar muestras completamente independientes y representati-vas. Por ejemplo, hacer una encuesta a los votantes marcando números de teléfono al azar es un método no representativo pues no tiene en cuenta a los votantes que no disponen de teléfono y cuenta varias veces a los que tienen varios números.

Muestreo aleatorio simple

•Se selecciona una muestra en forma aleatoria y sin reemplazo a n unidades de muestreo de una población que contiene un total de N unidades.

•Se garantiza que cada una de las muestras posibles tiene la misma probabilidad de ser elegida.

Muestreo sistemático

•Se selecciona un primer elemento aleatoriamente y, luego, los demás elementos que conformarán la muestra cada cierto intervalo.

•Este muestreo supone que se cuenta con una enumeración completa de los elementos de la población.

Muestreo estratificado

•Se selecciona la muestra de los diversos estratos. Un estrato es una parte de la población, cuyos elementos tienen características similares.

•El objetivo de estratificar la población es buscar homogeneidad entre los estratos.

Page 185: 2015 Separata

186 Estadística Básica con Aplicaciones en Excel 2010

Ejercicio 62

Una empresa de consumo tiene un total de 150 trabajadores y ha registrado en el cuadro siguiente, información acerca del ingreso mensual (en nuevos soles) y años cumplidos en la empresa de cada uno de sus trabajadores.

Trabajadores registrados

Nº Ingreso

(en soles) Años en la empresa

Nº Ingreso

(en soles) Años en la empresa

Nº Ingreso

(en soles) Años en la empresa

1 2300 5

51 2100 13

101 2400 16

2 2800 11

52 2100 9

102 1700 0

3 2400 4

53 1800 1

103 2500 12

4 2500 2

54 2000 9

104 1700 3

5 2300 3

55 2100 10

105 2400 17

6 2100 2

56 1900 4

106 2400 16

7 1700 2

57 2000 10

107 1900 7

8 2000 0

58 2300 11

108 1700 1

9 2200 7

59 2000 7

109 2100 6

10 2100 4

60 1700 1

110 2000 5

11 1700 0

61 1900 6

111 2000 3

12 2500 2

62 2000 9

112 2500 13

13 2800 13

63 2400 17

113 1700 0

14 2400 9

64 1700 0

114 2500 19

15 1700 1

65 1700 2

115 1700 3

16 2400 9

66 2400 17

116 2600 19

17 2200 10

67 2500 13

117 1600 1

18 2200 4

68 2600 16

118 1800 6

19 2300 10

69 2100 14

119 2100 10

20 2800 11

70 1900 7

120 1700 0

21 2100 7

71 2000 9

121 2400 16

22 1700 1

72 1800 7

122 2600 17

23 2500 6

73 2100 10

123 2100 10

24 2400 9

74 2300 12

124 2100 8

25 2700 17

75 2700 20

125 2400 17

26 1700 0

76 2800 20

126 1700 1

27 1600 2

77 1800 3

127 2600 20

28 2600 17

78 1700 5

128 2400 16

29 2500 13

79 1700 4

129 2700 17

30 2500 16

80 1700 0

130 2100 12

31 2700 17

81 1700 1

131 1600 0

32 1700 1

82 2100 6

132 2100 15

33 1600 1

83 2600 17

133 1900 5

34 2400 11

84 2400 9

134 2100 12

35 1900 3

85 2600 19

135 2200 12

36 1800 5

86 1900 7

136 2400 13

37 1800 3

87 1600 0

137 1800 4

38 2400 14

88 1900 3

138 2600 17

39 2600 16

89 2100 14

139 2700 20

40 2700 18

90 1700 0

140 2500 16

41 2100 11

91 2100 15

141 2500 16

42 2300 14

92 1700 1

142 1900 6

43 1700 0

93 2300 14

143 2100 15

44 2200 13

94 2500 16

144 1700 9

45 2900 20

95 2600 18

145 1500 0

46 1800 5

96 1900 3

146 1800 18

47 2100 16

97 2500 19

147 2100 10

Page 186: 2015 Separata

Capítulo 5. Muestreo 187

48 2000 12

98 1800 6

148 2700 19

49 2000 12

99 1700 2

149 1800 9

50 2900 20

100 2000 10

150 2100 15

a. Seleccione una muestra de 15 trabajadores usando muestreo simple aleatorio. Use las colum-nas C4, C8, C11 y C15 de la tabla de números aleatorios.

Solución

Seleccionemos tantos elementos del marco muestral como sea el tamaño requerido de la muestra. Como el marco muestral tiene 150 elementos usemos las columnas C4, C5 y C6, para elegir números de tres cifras y luego C8, C9 y C10.

Tabla de números aleatorios C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4 9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4 1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7 6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7 1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8 4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9 0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6 7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4 4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4 6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5 9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8 1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5 0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5 3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0 9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1 5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1 8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8 0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3 9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8 6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8 7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7 3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0 9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6 4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0 8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8 4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8 6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4 2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6 2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6 5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0 9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4 8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3 1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9 5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3 8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1 3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8

Los elementos seleccionados son:

Posición 114 81 134 148 39 97 105 98 126 64 109 122 142 145 149

Page 187: 2015 Separata

188 Estadística Básica con Aplicaciones en Excel 2010

b. Seleccione una muestra de diez trabajadores usando muestreo simple aleatorio. Use las colum-nas C11, C6, C1 y C9 de la tabla de números aleatorios.

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4 9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4 1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7 6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7 1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8 4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9 0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6 7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4 4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4 6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5 9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8 1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5 0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5 3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0 9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1 5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1 8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8 0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3 9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8 6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8 7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7 3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0 9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6 4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0 8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8 4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8 6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4 9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4 1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3 3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7 9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4 1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3 2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6 6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0 3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8 0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8 4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8 7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5 2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6 2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6 5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0 9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4 8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3 1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9 5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3 8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1 3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8

Los elementos seleccionados son: Posición

Page 188: 2015 Separata

Capítulo 5. Muestreo 189

Muestreo sistemático

En el muestreo sistemático se elige un elemento del marco muestral cada cierto intervalo. Este muestreo supone que se cuenta con una enumeración completa de los elementos de la población.

Procedimiento para seleccionar una muestra sistemática

1. Calcule el valor de k, donde n

Nk . El valor de k se redondea al valor del entero menor.

2. Seleccione aleatoriamente un número entero entre 1 y k llamado arranque aleatorio (A) 3. A partir de este número elegido, seleccione el siguiente que ocupa la posición (A + k) del lista-

do del marco muestral y así sucesivamente hasta completar la muestra.

Ejemplo 43 Se tiene una población de 12 personas y se desea elegir a cuatro de ellas mediante un muestreo sistemático. ¿Cuál es el arranque aleatorio para este ejemplo? Use la columna C3, C6 y C12

Solución

Calculemos el valor de k, donde 34

12

n

Nk . El valor de k se redondea al valor del entero menor,

luego k = 3. Seleccionemos aleatoriamente un número entero entre 1 y k = 3, llamado arranque aleatorio (A). Observando la columna C3 de la tabla de números aleatorios tenemos que A = 2.

Tabla de números aleatorios

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4

A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k), es decir la quinta posición (3 + 2 = 5) del listado del marco muestral y así sucesivamente hasta completar la muestra. Es decir, elegiremos los datos de las posiciones 2, 5, 8 y 11.

Page 189: 2015 Separata

190 Estadística Básica con Aplicaciones en Excel 2010

Ejemplo 44 Se tiene una población de 15 personas y se desea elegir a seis de ellas mediante un muestreo sis-temático. ¿Cuál es el arranque aleatorio para este ejemplo? Use la columna C4, C8 y C1

Solución

Calculemos el valor de k, donde 5,26

15

n

Nk . El valor de k se redondea al valor del entero me-

nor, luego k = 2. Seleccionemos aleatoriamente un número entero entre 1 y k = 2, llamado arranque aleatorio (A). Observando la columna C4 de la tabla de números aleatorios tenemos que A = 1.

Tabla de números aleatorios C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4 9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4 1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7

A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k), es decir la tercera posición (1 + 2 = 3) del listado del marco muestral y así sucesivamente hasta completar la muestra. Es decir, elegiremos los datos de las posiciones 1, 3, 5, 7, 9 y 11. Ejemplo 45 Se tiene información de 40 personas de un barrio de Lima Metropolitana. Obtenga una muestra aleatoria de ocho personas usando el muestreo sistemático y elabore una tabla con los elementos seleccionados. Utilice las columnas C8; C10; C11 de la tabla de números aleatorios.

Individuos registrados Nº Sexo Edad Estatura Nº Sexo Edad Estatura Nº Sexo Edad Estatura

1 Mujer 15 154 15 Mujer 19 178 29 Hombre 33 147

2 Hombre 16 154 16 Mujer 30 163 30 Hombre 17 167

3 Hombre 21 156 17 Hombre 29 180 31 Mujer 34 69

4 Mujer 31 184 18 Mujer 25 174 32 Mujer 20 76

5 Hombre 21 173 19 Hombre 29 137 33 Mujer 26 74

6 Mujer 24 170 20 Hombre 25 153 34 Hombre 25 90

7 Hombre 32 176 21 Mujer 16 168 35 Mujer 23 164

8 Hombre 26 188 22 Hombre 31 161 36 Hombre 20 164

9 Mujer 21 169 23 Hombre 18 270 37 Mujer 34 176

10 Mujer 22 173 24 Hombre 21 173 38 Hombre 35 188

11 Hombre 18 177 25 Hombre 31 187 39 Mujer 30 155

12 Hombre 25 181 26 Mujer 28 161 40 Mujer 29 141

13 Mujer 29 164 27 Mujer 19 172

14 Hombre 25 159 28 Hombre 31 162

Solución

Calculemos el valor de k, donde 58

40

n

Nk

El valor de k se redondea al valor del entero menor, luego k = 5.

Page 190: 2015 Separata

Capítulo 5. Muestreo 191

Seleccionemos aleatoriamente un número entero entre 1 y k = 5, llamado arranque aleatorio (A). Observando la columna C8 de la tabla de números aleatorios tenemos que A = 5.

Tabla de números aleatorios C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4 9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4 1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7

A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k), es decir la décima posición (5+5 = 10) del listado del marco muestral y así sucesivamente hasta completar la muestra. Es decir, elegiremos los datos de las posiciones 5, 10, 15, 20, 25, 30, 35 y 40. Los elementos seleccionados son:

Posición 5 10 15 20 25 30 35 40

Ejercicio 63

Una empresa de telecomunicaciones tiene un total de 150 empleados y ha registrado en la tabla que se muestra a continuación información acerca de las variables: ingreso mensual (en soles), nivel de educación y años cumplidos en la empresa.

Trabajadores registrados

Nº Ingreso (soles)

Nivel de Educación

Años en empresa

Nº Ingreso (soles)

Nivel de Educación

Años en empresa

Nº Ingreso (soles)

Nivel de Educación

Años en empresa

1 2300 Secundaria 5

51 2100 Técnica 13

101 2400 Técnica 16

2 2800 Secundaria 11

52 2100 Técnica 9

102 1700 Técnica 0

3 2400 Secundaria 4

53 1800 Técnica 1

103 2500 Técnica 12

4 2500 Secundaria 2

54 2000 Técnica 9

104 1700 Técnica 3

5 2300 Secundaria 3

55 2100 Técnica 10

105 2400 Técnica 17

6 2100 Secundaria 2

56 1900 Técnica 4

106 2400 Técnica 16

7 1700 Secundaria 2

57 2000 Técnica 10

107 1900 Técnica 7

8 2000 Secundaria 0

58 2300 Técnica 11

108 1700 Técnica 1

9 2200 Secundaria 7

59 2000 Técnica 7

109 2100 Técnica 6

10 2100 Secundaria 4

60 1700 Técnica 1

110 2000 Técnica 5

11 1700 Secundaria 1

61 1900 Técnica 6

111 2000 Superior 3

12 2500 Secundaria 2

62 2000 Técnica 9

112 2500 Superior 13

13 2800 Secundaria 13

63 2400 Técnica 17

113 1700 Superior 0

14 2400 Secundaria 9

64 1700 Técnica 0

114 2500 Superior 19

15 1700 Secundaria 1

65 1700 Técnica 2

115 1700 Superior 3

16 2400 Secundaria 9

66 2400 Técnica 17

116 2600 Superior 19

17 2200 Secundaria 10

67 2500 Técnica 13

117 1600 Superior 1

18 2200 Secundaria 4

68 2600 Técnica 16

118 1800 Superior 6

19 2300 Secundaria 10

69 2100 Técnica 14

119 2100 Superior 10

20 2800 Secundaria 11

70 1900 Técnica 7

120 1700 Superior 0

21 2100 Secundaria 7

71 2000 Técnica 9

121 2400 Superior 16

22 1700 Secundaria 1

72 1800 Técnica 7

122 2600 Superior 17

23 2500 Secundaria 6

73 2100 Técnica 10

123 2100 Superior 10

24 2400 Secundaria 9

74 2300 Técnica 12

124 2100 Superior 8

25 2700 Secundaria 17

75 2700 Técnica 20

125 2400 Superior 17

26 1700 Secundaria 0

76 2800 Técnica 20

126 1700 Superior 1

Page 191: 2015 Separata

192 Estadística Básica con Aplicaciones en Excel 2010

27 1600 Secundaria 2

77 1800 Técnica 3

127 2600 Superior 20

28 2600 Secundaria 17

78 1700 Técnica 5

128 2400 Superior 16

29 2500 Secundaria 13

79 1700 Técnica 4

129 2700 Superior 17

30 2500 Secundaria 16

80 1700 Técnica 0

130 2100 Superior 12

31 2700 Secundaria 17

81 1700 Técnica 1

131 1600 Superior 0

32 1700 Secundaria 1

82 2100 Técnica 6

132 2100 Superior 15

33 1600 Secundaria 1

83 2600 Técnica 17

133 1900 Superior 5

34 2400 Secundaria 11

84 2400 Técnica 9

134 2100 Superior 12

35 1900 Secundaria 3

85 2600 Técnica 19

135 2200 Superior 12

36 1800 Secundaria 5

86 1900 Técnica 7

136 2400 Superior 13

37 1800 Secundaria 3

87 1600 Técnica 0

137 1800 Superior 4

38 2400 Secundaria 14

88 1900 Técnica 3

138 2600 Superior 17

39 2600 Secundaria 16

89 2100 Técnica 14

139 2700 Superior 20

40 2700 Secundaria 18

90 1700 Técnica 0

140 2500 Superior 16

41 2100 Técnica 11

91 2100 Técnica 15

141 2500 Superior 16

42 2300 Técnica 14

92 1700 Técnica 1

142 1900 Superior 6

43 1700 Técnica 0

93 2300 Técnica 14

143 2100 Superior 15

44 2200 Técnica 13

94 2500 Técnica 16

144 1700 Superior 9

45 2900 Técnica 20

95 2600 Técnica 18

145 1500 Superior 0

46 1800 Técnica 5

96 1900 Técnica 3

146 1800 Superior 18

47 2100 Técnica 16

97 2500 Técnica 19

147 2100 Superior 10

48 2000 Técnica 12

98 1800 Técnica 6

148 2700 Superior 19

49 2000 Técnica 12

99 1700 Técnica 2

149 1800 Superior 9

50 2900 Técnica 20

100 2000 Técnica 10

150 2100 Superior 15

Aplique el muestreo sistemático para seleccionar una muestra de ocho empleados. Elabore un lis-tado con el número seleccionado. Utilice la columna C7, C10, y C15 de la tabla de números aleatorios.

Solución

Calculemos el valor de k, donde n

Nk ………………………...

El valor de k se redondea al valor del entero menor, luego k = ……………..…….. Seleccionemos aleatoriamente un número entero entre 1 y k, llamado arranque aleatorio (A). Observando la columna C7 y C8 de la tabla de números aleatorios tenemos que A = …………….....

Tabla de números aleatorios C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4 9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4 1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7 6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7 1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8

A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k) del listado del marco muestral y así sucesivamente hasta completar la muestra. Los elementos seleccionados son:

Posición

Page 192: 2015 Separata

Capítulo 5. Muestreo 193

Tabla de números aleatorios

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4 9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4 1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7 6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7 1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8 4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9 0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6 7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4 4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4 6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5 9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8 1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5 0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5 3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0 9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1 5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1 8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8 0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3 9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8 6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8 7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7 3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0 9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6 4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0 8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8 4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8 6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4 9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4 1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3 3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7 9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4 1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3 2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6 6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0 3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8 0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8 4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8 7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5 2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6 2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6 5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0 9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4 8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3 1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9 5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3 8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1 3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8

Page 193: 2015 Separata

194 Estadística Básica con Aplicaciones en Excel 2010

Muestreo estratificado

Estratificar significa dividir a la población en varias partes de acuerdo con ciertas características de sus elementos. El objetivo de estratificar la población es buscar homogeneidad entre los estratos.

Pasos a seguir para seleccionar una muestra estratificada

1. Divida a la población en estratos que sean mutuamente excluyentes. Esto es, que incluyan a

todos los elementos de la población y que cada elemento pertenezca solamente a un estrato.

2. Calcule la cantidad de elementos a seleccionar en cada estrato.

3. Seleccione muestras aleatorias simples para cada uno de los estratos.

Recomendaciones para el uso de muestras estratificadas

Si se tiene que usar más de una variable para formar los estratos, cuidar que estas no estén relacionadas entre sí.

No se deben considerar la formación de muchos estratos, generalmente se usan entre tres y ocho estratos.

Los estratos pequeños no contribuyen mucho a la reducción del error, por lo tanto pueden no ser considerados.

Page 194: 2015 Separata

Capítulo 5. Muestreo 195

Ejemplo 46 La empresa de telecomunicaciones RTV tiene 120 empleados de los cuales tiene información de las variables: ingreso en soles, nivel de educación y años en la empresa.

Nº Ingreso

(en soles)

Nivel de educación

Años cumplidos

en la empresa Nº

Ingreso (en

soles)

Nivel de educación

Años cumplidos

en la empre-sa

Nº Ingreso

(en soles)

Nivel de educación

Años cumplidos

en la empresa

1 2300 Secundaria 5

41 2100 Técnica 13

81 2000 Superior 3

2 2800 Secundaria 11

42 2100 Técnica 9

82 2500 Superior 13

3 2400 Secundaria 4

43 1800 Técnica 1

83 1700 Superior 0

4 2500 Secundaria 2

44 2000 Técnica 9

84 2500 Superior 19

5 2300 Secundaria 3

45 2100 Técnica 10

85 1700 Superior 3

6 2100 Secundaria 2

46 1900 Técnica 4

86 2600 Superior 19

7 1700 Secundaria 2

47 2000 Técnica 10

87 1600 Superior 1

8 2000 Secundaria 0

48 2300 Técnica 11

88 1800 Superior 6

9 2200 Secundaria 7

49 2000 Técnica 7

89 2100 Superior 10

10 2100 Secundaria 4

50 1700 Técnica 1

90 1700 Superior 0

11 1700 Secundaria 0

51 1700 Técnica 1

91 2400 Superior 16

12 2500 Secundaria 2

52 2100 Técnica 6

92 2600 Superior 17

13 2800 Secundaria 13

53 2600 Técnica 17

93 2100 Superior 10

14 2400 Secundaria 9

54 2400 Técnica 9

94 2100 Superior 8

15 1700 Secundaria 1

55 2600 Técnica 19

95 2400 Superior 17

16 2400 Secundaria 9

56 1900 Técnica 7

96 1700 Superior 1

17 2200 Secundaria 10

57 1600 Técnica 0

97 2600 Superior 20

18 2200 Secundaria 4

58 1900 Técnica 3

98 2400 Superior 16

19 2300 Secundaria 10

59 2100 Técnica 14

99 2700 Superior 17

20 2800 Secundaria 11

60 1700 Técnica 0

100 2100 Superior 12

21 2100 Secundaria 7

61 2100 Técnica 15

101 1600 Superior 0

22 1700 Secundaria 1

62 1700 Técnica 1

102 2100 Superior 15

23 2500 Secundaria 6

63 2300 Técnica 14

103 1900 Superior 5

24 2400 Secundaria 9

64 2500 Técnica 16

104 2100 Superior 12

25 2700 Secundaria 17

65 2600 Técnica 18

105 2200 Superior 12

26 1700 Secundaria 0

66 1900 Técnica 3

106 2400 Superior 13

27 1600 Secundaria 2

67 2500 Técnica 19

107 1800 Superior 4

28 2600 Secundaria 17

68 1800 Técnica 6

108 2600 Superior 17

29 2500 Secundaria 13

69 1700 Técnica 2

109 2700 Superior 20

30 2500 Secundaria 16

70 2000 Técnica 10

110 2500 Superior 16

31 2100 Técnica 11

71 2400 Técnica 16

111 2500 Superior 16

32 2300 Técnica 14

72 1700 Técnica 0

112 1900 Superior 6

33 1700 Técnica 0

73 2500 Técnica 12

113 2100 Superior 15

34 2200 Técnica 13

74 1700 Técnica 3

114 1700 Superior 9

35 2900 Técnica 20

75 2400 Técnica 17

115 1500 Superior 0

36 1800 Técnica 5

76 2400 Técnica 16

116 1800 Superior 18

37 2100 Técnica 16

77 1900 Técnica 7

117 2100 Superior 10

38 2000 Técnica 12

78 1700 Técnica 1

118 2700 Superior 19

39 2000 Técnica 12

79 2100 Técnica 6

119 1800 Superior 9

40 2900 Técnica 20

80 2000 Técnica 5

120 2100 Superior 15

Aplique el muestreo estratificado para seleccionar una muestra de 16 empleados. Use como varia-ble de estratificación el nivel educacional. Elabore un listado identificando el número de dato selec-cionado. Para el estrato 1 use las columnas C1, C3 y C5, para el estrato 2 use las columnas C8, C9, C10 y C11 y para el estrato 3 use las columnas C4, C3, C5 y C7.

Page 195: 2015 Separata

196 Estadística Básica con Aplicaciones en Excel 2010

Solución

Se divide a la población en estratos que sean mutuamente excluyentes, luego los estratos 1, 2 y 3 son: secundaria, técnica y superior, respectivamente. Para cada uno de los estratos, seleccionamos muestras aleatorias simples.

Estratos Números de elemen-tos en el estrato Nh

Posiciones (desde – hasta)

Cantidad seleccionada por estrato nN

Nn h

h

1. Secundaria N1 = 30 1 – 30 416120

3011 n

N

Nn

2. Técnica N2 = 50 31 – 80 767,616120

5022 n

N

Nn

3. Superior N3 = 40 81 – 120 533,516120

4033 n

N

Nn

Total N = 120 n = 16

Para el estrato Secundaria, realizamos un muestreo aleatorio simple usando las columnas C1, C3 y C5. Observemos que las posiciones de los elementos a elegir están entre el 1 y el 30.

Tabla de números aleatorios

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4 9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4 1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7 6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7 1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8

Luego, el cuadro con los datos elementos seleccionados para el estrato Secundaria es:

Estrato Secundaria Posición 2 16 29 13

Para el estrato Técnica, realizamos un muestreo aleatorio simple usando las columnas C8, C9, C10 y C11. Observemos que las posiciones de los elementos a elegir están entre el 31 y el 80.

Tabla de números aleatorios

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4 9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4 1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7

Luego, el cuadro con los datos elementos seleccionados para el estrato Técnica es:

Estrato Técnica Posición 54 62 66 77 48 67 44

Page 196: 2015 Separata

Capítulo 5. Muestreo 197

Para el estrato Superior, realizamos un muestreo aleatorio simple usando las columnas C4, C3, C5 y C7. Observemos que las posiciones de los elementos a elegir están entre el 81 y el 120.

Tabla de números aleatorios

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4 9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4 1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7 6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7 1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8 4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9 0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6 7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4

Luego, el cuadro con los datos elementos seleccionados para el estrato Superior es:

Estrato Superior Posición 114 81 97 105 83

Ejercicio 64

La siguiente tabla muestra a los 120 alumnos de la especialidad de Administración, de la universi-dad El Saber, a quienes se les preguntó por su emisora radial preferida y por la cantidad de horas a la semana que la escucha. Posición Radio Horas Posición Radio Horas Posición Radio Horas

1 Estudio 92 6 41 Oxígeno 6 81 Oxígeno 4

2 Estudio 92 10 42 Oxígeno 6 82 Oxígeno 3

3 Estudio 92 4 43 Oxígeno 8 83 Oxígeno 3

4 Estudio 92 2 44 Oxígeno 9 84 Oxígeno 5

5 Estudio 92 3 45 Oxígeno 4 85 Oxígeno 5

6 Estudio 92 6 46 Oxígeno 6 86 Oxígeno 8

7 Estudio 92 7 47 Oxígeno 7 87 Planeta 7

8 Estudio 92 6 48 Oxígeno 9 88 Planeta 6

9 Estudio 92 8 49 Oxígeno 8 89 Planeta 9

10 Estudio 92 9 50 Oxígeno 10 90 Planeta 9

11 Estudio 92 11 51 Oxígeno 12 91 Planeta 4

12 Estudio 92 3 52 Oxígeno 9 92 Planeta 2

13 Estudio 92 4 53 Oxígeno 9 93 Planeta 11

14 Estudio 92 2 54 Oxígeno 8 94 Planeta 2

15 Estudio 92 6 55 Oxígeno 4 95 Planeta 3

16 Estudio 92 4 56 Oxígeno 6 96 Planeta 8

17 Estudio 92 9 57 Oxígeno 7 97 Planeta 6

18 Estudio 92 5 58 Oxígeno 8 98 Planeta 7

19 Estudio 92 2 59 Oxígeno 7 99 Planeta 9

20 Estudio 92 7 60 Oxígeno 3 100 Planeta 4

21 Estudio 92 4 61 Oxígeno 6 101 Planeta 8

22 Estudio 92 6 62 Oxígeno 9 102 Planeta 7

23 Estudio 92 7 63 Oxígeno 2 103 Planeta 7

Page 197: 2015 Separata

198 Estadística Básica con Aplicaciones en Excel 2010

24 Estudio 92 8 64 Oxígeno 5 104 Planeta 9

25 Estudio 92 9 65 Oxígeno 1 105 Planeta 6

26 Estudio 92 10 66 Oxígeno 4 106 Planeta 7

27 Estudio 92 5 67 Oxígeno 7 107 Planeta 9

28 Estudio 92 4 68 Oxígeno 6 108 Planeta 8

29 Estudio 92 7 69 Oxígeno 7 109 Planeta 3

30 Estudio 92 8 70 Oxígeno 8 110 Planeta 11

31 Estudio 92 4 71 Oxígeno 4 111 Planeta 13

32 Oxígeno 6 72 Oxígeno 5 112 Planeta 14

33 Oxígeno 7 73 Oxígeno 3 113 Planeta 9

34 Oxígeno 5 74 Oxígeno 6 114 Planeta 8

35 Oxígeno 8 75 Oxígeno 5 115 Planeta 6

36 Oxígeno 9 76 Oxígeno 8 116 Planeta 5

37 Oxígeno 4 77 Oxígeno 7 117 Planeta 7

38 Oxígeno 5 78 Oxígeno 9 118 Planeta 3

39 Oxígeno 2 79 Oxígeno 10 119 Planeta 6

40 Oxígeno 9 80 Oxígeno 3 120 Planeta 5

Seleccione una muestra aleatoria de tamaño 12 mediante muestreo estratificado. Use la variable radio de su preferencia como variable de estratificación. Elabore un listado con el alumno seleccionado. Para el estrato 1 use las columnas C6, C4 y C2, para el estrato 2 use las columnas C15, C10, C2 y C11 y para el estrato 3 use las columnas C6, C17, C12; C4, C1, y C7.

Estrato Nh Posición

(desde – hasta) n

N

Nn h

h

Estudio 92

N1=

n1=

Oxígeno

N2=

n2=

Planeta

N3=

n3=

Total

Estrato 1: Estudio 92

Posición

Estrato 2: Oxígeno

Posición

Estrato 3: Planeta

Posición

Page 198: 2015 Separata

Capítulo 5. Muestreo 199

Tabla de números aleatorios

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4 9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4 1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7 6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7 1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8 4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9 0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6 7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4 4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4 6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5 9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8 1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5 0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5 3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0 9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1 5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1 8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8 0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3 9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8 6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8 7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7 3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0 9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6 4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0 8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8 4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8 6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4 9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4 1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3 3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7 9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4 1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3 2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6 6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0 3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8 0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8 4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8 7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5 2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6 2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6 5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0 9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4 8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3 1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9 5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3 8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1 3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8

Page 199: 2015 Separata

200 Estadística Básica con Aplicaciones en Excel 2010

Ejercicios de aplicación

1. La empresa de telecomunicaciones R&M tiene un total de 140 empleados, de los cuales tiene información sobre: el ingreso mensual (en nuevos soles) y años cumplidos en la empresa.

Nº Ingreso Años Nº Ingreso Años Nº Ingreso Años Nº Ingreso Años

1 2300 5 36 1800 5 71 2000 9 106 2400 16

2 2800 11 37 1800 3 72 1800 7 107 1900 7

3 2400 4 38 2400 14 73 2100 10 108 1700 1

4 2500 2 39 2600 16 74 2300 12 109 2100 6

5 2300 3 40 2700 18 75 2700 20 110 2000 5

6 2100 2 41 2100 11 76 2800 20 111 2500 16

7 1700 2 42 2300 14 77 1800 3 112 1900 6

8 2000 0 43 1700 0 78 1700 5 113 2100 15

9 2200 7 44 2200 13 79 1700 4 114 1700 9

10 2100 4 45 2900 20 80 1700 0 115 1500 0

11 1700 0 46 1800 5 81 1700 1 116 1800 18

12 2500 2 47 2100 16 82 2100 6 117 2100 10

13 2800 13 48 2000 12 83 2600 17 118 2700 19

14 2400 9 49 2000 12 84 2400 9 119 1800 9

15 1700 1 50 2900 20 85 2600 19 120 2100 15

16 2400 9 51 2100 13 86 1900 7 121 2400 16

17 2200 10 52 2100 9 87 1600 0 122 2600 17

18 2200 4 53 1800 1 88 1900 3 123 2100 10

19 2300 10 54 2000 9 89 2100 14 124 2100 8

20 2800 11 55 2100 10 90 1700 0 125 2400 17

21 2100 7 56 1900 4 91 2100 15 126 1700 1

22 1700 1 57 2000 10 92 1700 1 127 2600 20

23 2500 6 58 2300 11 93 2300 14 128 2400 16

24 2400 9 59 2000 7 94 2500 16 129 2700 17

25 2700 17 60 1700 1 95 2600 18 130 2100 12

26 1700 0 61 1900 6 96 1900 3 131 1600 0

27 1600 2 62 2000 9 97 2500 19 132 2100 15

28 2600 17 63 2400 17 98 1800 6 133 1900 5

29 2500 13 64 1700 0 99 1700 2 134 2100 12

30 2500 16 65 1700 2 100 2000 10 135 2200 12

31 2700 17 66 2400 17 101 2400 16 136 2400 13

32 1700 1 67 2500 13 102 1700 0 137 1800 4

33 1600 1 68 2600 16 103 2500 12 138 2600 17

34 2400 11 69 2100 14 104 1700 3 139 2700 20

35 1900 3 70 1900 7 105 2400 17 140 2500 16

a. Seleccione una muestra de ocho empleados utilizando el muestreo aleatorio simple. Elabore

un listado con los trabajadores seleccionados. Utilice las columnas: C7, C5, C10 y C15 de la tabla de números aleatorios.

b. Seleccione una muestra sistemática de tamaño 11 empleados. Elabore un listado con los tra-

bajadores seleccionados. Use las columnas C4, C10 y C6 de la tabla de números aleatorios.

Page 200: 2015 Separata

Capítulo 5. Muestreo 201

2. La siguiente tabla muestra el registro de todos los clientes de una empresa de señal por cable del distrito de Los Olivos. Las variables consideradas fueron: ingreso semanal (en dólares), nú-mero de televisores en el hogar y nivel educativo alcanzado por el jefe de familia.

N° Ingreso semanal

Número de televi-

sores

Nivel educativo

N° Ingreso semanal

Número de televi-

sores

Nivel educativo

N° Ingreso semanal

Número de televi-

sores

Nivel educativo

1 100 3 Primaria

35 190 1 Primaria

69 430 3 Secundaria

2 80 2 Primaria

36 250 2 Primaria

70 400 3 Secundaria

3 100 3 Primaria

37 205 2 Primaria

71 220 2 Secundaria

4 85 1 Primaria

38 220 3 Primaria

72 230 2 Secundaria

5 105 2 Primaria

39 285 4 Primaria

73 300 2 Secundaria

6 110 2 Primaria

40 220 2 Primaria

74 340 3 Superior

7 102 4 Primaria

41 400 3 Primaria

75 420 2 Superior

8 110 2 Primaria

42 350 2 Primaria

76 550 2 Superior

9 90 2 Primaria

43 400 2 Primaria

77 430 2 Superior

10 130 3 Primaria

44 540 2 Primaria

78 690 3 Superior

11 180 1 Primaria

45 250 3 Primaria

79 500 2 Superior

12 90 3 Primaria

46 295 4 Primaria

80 430 2 Superior

13 104 3 Primaria

47 230 1 Primaria

81 620 3 Superior

14 100 2 Primaria

48 240 2 Primaria

82 400 3 Superior

15 90 2 Primaria

49 400 3 Primaria

83 630 2 Superior

16 80 1 Primaria

50 270 5 Primaria

84 585 1 Superior

17 120 1 Primaria

51 320 2 Secundaria

85 350 2 Superior

18 85 1 Primaria

52 200 1 Secundaria

86 520 2 Superior

19 100 2 Primaria

53 335 1 Secundaria

87 402 2 Superior

20 98 3 Primaria

54 250 2 Secundaria

88 220 3 Superior

21 120 2 Primaria

55 250 3 Secundaria

89 690 1 Superior

22 105 2 Primaria

56 120 2 Secundaria

90 420 2 Superior

23 120 1 Primaria

57 130 2 Secundaria

91 450 2 Superior

24 250 3 Primaria

58 235 2 Secundaria

92 530 2 Superior

25 300 4 Primaria

59 500 3 Secundaria

93 300 3 Superior

26 120 2 Primaria

60 200 1 Secundaria

94 335 1 Superior

27 195 3 Primaria

61 395 2 Secundaria

95 330 1 Superior

28 120 3 Primaria

62 330 3 Secundaria

96 380 2 Superior

29 250 2 Primaria

63 310 3 Secundaria

97 230 2 Superior

30 300 3 Primaria

64 300 3 Secundaria

98 385 1 Superior

31 250 2 Primaria

65 530 3 Secundaria

99 303 2 Superior

32 230 2 Primaria

66 540 2 Secundaria

100 540 2 Superior

33 150 2 Primaria

67 200 2 Secundaria

101 490 3 Superior

34 200 3 Primaria

68 285 1 Secundaria

102 495 2 Superior

Seleccione una muestra de 12 clientes aplicando el muestreo sistemático. Elabore un listado con el número. Utilice la columna C4, C9 y C15 de la tabla de números aleatorios.

Page 201: 2015 Separata

202 Estadística Básica con Aplicaciones en Excel 2010

3. Los siguientes datos han sido extraídos de una investigación realizada por La Defensoría del Pueblo, Comisión de la Verdad y Reconciliación, Comité Internacional Cruz Roja y Coordinadora Nacional de Derechos Humanos sobre un total de 150 personas extraviadas en el Perú entre los años 1980 y 1996 en los tres principales departamentos donde hubo el brote terrorista: Ayacu-cho, Huánuco y San Martín.

Nº Lugar de

procedencia Sexo

Edad al momento de la

desaparición

Nº Lugar de

procedencia Sexo

Edad al momento de la desaparición

Nº Lugar de

procedencia Sexo

Edad al momento de la desaparición

1 Ayacucho M 12 51 Ayacucho M 44 101 Huánuco M 24

2 Ayacucho M 40 52 Ayacucho M 39 102 Huánuco M 28

3 Ayacucho M 20 53 Ayacucho M 17 103 Huánuco F 4

4 Ayacucho M 43 54 Ayacucho F 19 104 Huánuco F 2

5 Ayacucho M 28 55 Ayacucho M 24 105 Huánuco M 33

6 Ayacucho M 12 56 Ayacucho F 15 106 Huánuco M 25

7 Ayacucho F 15 57 Ayacucho M 17 107 Huánuco M 21

8 Ayacucho M 28 58 Ayacucho M 22 108 Huánuco M 21

9 Ayacucho M 13 59 Ayacucho M 50 109 Huánuco M 30

10 Ayacucho M 45 60 Ayacucho M 42 110 Huánuco M 21

11 Ayacucho M 10 61 Ayacucho M 19 111 Huánuco M 21

12 Ayacucho F 25 62 Ayacucho M 21 112 Huánuco M 54

13 Ayacucho M 24 63 Ayacucho M 15 113 Huánuco M 38

14 Ayacucho M 32 64 Ayacucho M 43 114 Huánuco M 16

15 Ayacucho M 48 65 Ayacucho M 16 115 Huánuco M 28

16 Ayacucho M 23 66 Ayacucho M 30 116 Huánuco M 36

17 Ayacucho F 7 67 Ayacucho M 48 117 Huánuco M 27

18 Ayacucho F 5 68 Ayacucho M 45 118 Huánuco M 24

19 Ayacucho M 4 69 Ayacucho M 41 119 Huánuco M 45

20 Ayacucho F 9 70 Ayacucho M 23 120 Huánuco M 21

21 Ayacucho M 6 71 Ayacucho M 22 121 Huánuco M 66

22 Ayacucho M 66 72 Ayacucho M 20 122 Huánuco F 70

23 Ayacucho M 18 73 Ayacucho M 22 123 Huánuco F 26

24 Ayacucho F 36 74 Ayacucho M 16 124 Huánuco M 26

25 Ayacucho M 26 75 Ayacucho M 45 125 Huánuco M 14

26 Ayacucho M 17 76 Ayacucho F 56 126 Huánuco M 18

27 Ayacucho M 28 77 Ayacucho M 33 127 Huánuco M 28

28 Ayacucho M 30 78 Ayacucho M 22 128 San Martín M 25

29 Ayacucho F 19 79 Ayacucho M 70 129 San Martín M 32

30 Ayacucho M 17 80 Ayacucho M 34 130 San Martín M 22

31 Ayacucho F 20 81 Ayacucho M 69 131 San Martín M 21

32 Ayacucho M 21 82 Ayacucho F 31 132 San Martín M 28

33 Ayacucho M 37 83 Huánuco M 21 133 San Martín M 18

34 Ayacucho M 58 84 Huánuco M 27 134 San Martín M 29

35 Ayacucho M 18 85 Huánuco F 19 135 San Martín M 20

36 Ayacucho F 18 86 Huánuco M 27 136 San Martín M 18

37 Ayacucho M 19 87 Huánuco M 20 137 San Martín M 21

38 Ayacucho M 18 88 Huánuco M 25 138 San Martín M 26

39 Ayacucho M 22 89 Huánuco M 18 139 San Martín M 23

40 Ayacucho F 23 90 Huánuco M 47 140 San Martín M 35

41 Ayacucho M 50 91 Huánuco M 28 141 San Martín M 17

Page 202: 2015 Separata

Capítulo 5. Muestreo 203

42 Ayacucho M 26 92 Huánuco M 32 142 San Martín M 32

43 Ayacucho F 19 93 Huánuco M 18 143 San Martín F 32

44 Ayacucho M 54 94 Huánuco M 22 144 San Martín M 41

45 Ayacucho M 13 95 Huánuco M 28 145 San Martín M 26

46 Ayacucho M 46 96 Huánuco M 31 146 San Martín M 20

47 Ayacucho M 28 97 Huánuco M 34 147 San Martín M 21

48 Ayacucho M 46 98 Huánuco M 25 148 San Martín M 15

49 Ayacucho M 42 99 Huánuco M 27 149 San Martín M 22

50 Ayacucho M 40 100 Huánuco M 19 150 San Martín M 45

a. Aplique el muestreo sistemático para obtener una muestra de 10 personas desaparecidas. Elabore un listado con el número seleccionado. Utilice las columnas C14, C2 y C8 de la tabla de números aleatorios.

b. Aplique el muestreo aleatorio simple para obtener una muestra de 14 personas desaparecidas.

Elabore un listado con el número seleccionado. Utilice las columnas C7, C12, C5, C16 y C3 de la tabla de números aleatorios.

c. Aplique el muestreo estratificado para obtener una muestra de 10 personas desaparecidas. Elabore un listado con el número seleccionado. Utilice como variable de estratificación: Lugar de procedencia.

Estrato 1: Ayacucho C3, C5, C7

Estrato 2: Huánuco C5; C9, C10, C12

Estrato 3: San Martín C4, C8, C11,C15

Page 203: 2015 Separata

204 Estadística

204

TABLA DE NÚMEROS ALEATORIOS

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4 9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4 1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7 6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7 1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8 4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9 0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6 7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4 4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4 6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5 9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8 1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5 0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5 3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0 9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1 5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1 8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8 0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3 9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8 6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8 7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7 3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0 9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6 4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0 8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8 4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8 6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4 9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4 1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3 3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7 9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4 1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3 2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6 6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0 3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8 0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8 4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8 7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5 2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6 2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6 5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0 9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4 8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3 1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9 5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3 8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1 3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8

Page 204: 2015 Separata

Anexos 205

205

Índice Axiomas de la probabilidad 128 Censo 182 Coeficiente de asimetría

de Fisher 119 Coeficiente de variación 114 Cuantiles 102 Desviación estándar 112

de una variable aleatoria 153 Diagrama de árbol 143 Distribución

binomial 160 de frecuencias 26, 57, 63, 64 hipergeométrica 164 normal 176 Poisson 168 t-Student 208 uniforme 173

Escalas de medición 15 Espacio muestral 126

Partición de un 142 Estimación

por intervalo 203 puntual 203

Estimador 19 Evento 126

Complemento 127 Eventos

independientes 139 Intersección de 127 mutuamente excluyentes 128 Unión de 127

Gráfico circular 34 de barras 31 de barras apiladas 46, 51 de barras apiladas al 100% 46, 54 de Pareto 37 Histograma 69 Ojiva 76 Polígono de frecuencias 72, 73

Intervalo de confianza para la media poblacional 204 proporción poblacional 218

Marco muestral 181 Margen de error 203 Media aritmética 85

propiedades 86 Media ponderada 100 Mediana 91 Medidas de asimetría 118 Medidas de dispersión 109 Medidas de tendencia central 85 Moda 94 Muestreo 182

aleatorio simple 183 estratificado 192 probabilístico 183 sistemático 187

Nivel de confianza 203 Interpretación 204

Población muestreada 181 Probabilidad

condicional 135 Definición clásica de 128 Teoremas básicos de 128

Rango de una variable 109

Rango intercuartil 110 Registro administrativo 11 Tabulaciones cruzadas 41 Tamaño de muestra

para estimar la media 215 para estimar la proporción poblacional 222

Teorema de Bayes 143 Teorema de la probabilidad total 142 Unidad de muestreo 181 Unidad elemental 181 Valor esperado

de una variable aleatoria continua 159 de una variable aleatoria discreta 152

Variable definición 12

Variable aleatoria continua 159 definición 149 discreta 150 Función de densidad de probabilidad 159 Función de probabilidad 150

Varianza 112 de una variable aleatoria continua 159 de una variable aleatoria discreta 153