manual de estadistica_v2

Upload: jean-romero-yampul

Post on 07-Jul-2018

218 views

Category:

Documents


1 download

TRANSCRIPT

  • 8/18/2019 Manual de Estadistica_v2

    1/132

    Maria Teresa Villalobos

    Estudios Generales Letras

    Marzo 2016

    Manual de EstadísticaEST-103

  • 8/18/2019 Manual de Estadistica_v2

    2/132

    PresentaciónLa presente guía resume la teoría necesaria para llevar el curso Estadística

    de Estudios Generales Letras de la Pontificia Universidad Católica del Perú. Se harealizado con la finalidad de brindar a los alumnos una ayuda en su proceso educa-tivo y una herramienta que colabore en el dictado de las clases.

    Es muy importante resaltar que este material no sustituye la clase del pro-fesor y ni tampoco equivale a un libro de texto.

    Esta guía está basada en el trabajo de los profesores: Ana Valdivia, SergioPavletich y Walter Luna.

    Se agradece que los usuarios de esta guía hagan llegar sus críticas y comen-tarios a esta publicación.

    Maria Teresa Villalobos.

    Pando, marzo del 2016

  • 8/18/2019 Manual de Estadistica_v2

    3/132

    Contenido

    Capítulo 1. Nociones de Estadística Descriptiva ................................................................. 3

    1.1. Conceptos básicos .............................................................................................................. 3

    1.2. Organización y tratamiento de datos ................................................................................ 14

    1.3. Gráficos y tablas estadísticas ............................................................................................ 16

    1.4. Tablas de contingencia ..................................................................................................... 26

    1.5. Gráficos a partir de tablas de contingencia ........................................................................ 27

    1.6. Estadísticos de posición .................................................................................................... 31

    1.7. Medidas de tendencia central .......................................................................................... 36

    1.8. Medidas de dispersión ..................................................................................................... 44

    1.9. Indicadores de asimetría .................................................................................................. 52

    1.10. Estadística descriptiva bidimensional: Regresión lineal simple ......................................... 61 Capítulo 2. Nociones de probabilidad .............................................................................. 69

    2.1. Conceptos básicos ............................................................................................................ 69

    2.2. Definición clásica de probabilidad..................................................................................... 76

    2.3. Definición axiomática de probabilidad .............................................................................. 79

    2.4. Probabilidad condicional .................................................................................................. 82

    2.5. Eventos independientes ................................................................................................... 87

    Capítulo 3. Variables aleatorias y modelos o distribuciones de probabilidad .................... 93

    3.1. Variable aleatoria............................................................................................................. 93

    3.2. Variable aleatoria discreta ................................................................................................ 94

    3.3. Algunos modelos discretos importantes ........................................................................... 98

    3.4. Algunos modelos continuos importantes ......................................................................... 107

    3.5. Teorema central del límite .............................................................................................. 115

    Capítulo 4. Introducción a la Estadística Inferencial ........................................................ 121

    4.1. Muestra aleatoria ........................................................................................................... 121

    4.2. Estimación de parámetros ............................................................................................... 121 Tablas estadísticas ................................................................................................................. 130

  • 8/18/2019 Manual de Estadistica_v2

    4/132

    Estadística EEGGLL 3

    Notas

    Capítulo 1. Nociones de Estadística Descriptiva

    1.1. Conceptos básicos

    Definición de EstadísticaLa Estadística se ocupa de la recolección, organización, presentación y análisis de datos que correspon-den a fenómenos o situaciones en donde está presente la variabilidad.

    Subdivisión de la Estadística

    Ejercicio 1

    Indique si las siguientes afirmaciones son de tipo descriptiva o inferencial.

    Afirmación Tipo de afirmación

    El 32% de los encuestados cuenta con servicio de Internet encasa.

    El 46% de todos los alumnos de EEGGLL son hombres.

    La edad media de los estudiantes seleccionados es 19 años.

    El 47% de las personas encuestadas es de sexo femenino.

    El 23% de los peruanos ha visitado Machu Picchu por lo me-nos una vez.

    Recolección Organización Presentación Análisis

    EstadísticaDescriptiva

    Son métodos y técnicas de recolección, caracterización y presentación quepermiten describir, apropiadamente, las características de un conjunto dedatos. Comprende el uso de gráficos, tablas y medidas resumen ademásde otras técnicas.

    EstadísticaInferencial

    Son métodos y técnicas que hacen posible estudiar una o máscaracterísticas de una población o tomar decisiones sobre la poblaciónbasados en el resultado de muestras. La generalización de los resultadosmuestrales a toda la población cae en el dominio de la EstadísticaInferencial; en dicha generalización juega un papel muy importante lateoría de la Probabilidad.

  • 8/18/2019 Manual de Estadistica_v2

    5/132

    Capítulo 1. Nociones de Estadística Descriptiva 4

    Notas

    PoblaciónEs el conjunto de todos los elementos de interés en determinado estudio.Los elementos que forman la población pueden ser personas, cosas, animales, instituciones, etc.A cada elemento de la población se le llama unidad estadística.

    MuestraEs un subconjunto de elementos de la población.

    Cuando el objetivo es hacer inferencia estadística es necesario que la muestra sea seleccionada deacuerdo a un diseño aleatorio, es decir, que sus elementos sean escogidos al azar.

    Ejemplo 1

    Cada año, el Departamento de Salud y Servicios Humanos de Estados Unidos examina a miles de esta-dounidenses. Médicos, dentistas, nutricionistas y técnicos de salud realizan la Encuesta Nacional deExamen de Salud y Nutrición (NHANES). Cada participante representa unos 50.000 personas.

    Ejercicio 2

    En el Perú, se desea determinar el porcentaje de mujeres en edad fértil que usa algún método anti-conceptivo. Defina la población.

    Conjunto de todoslos elementos deinterés endeterminadoestudio.

    PoblaciónUn subconjunto deelementos de lapoblación.

    Muestra

    1.• NHANES divide los Estados Unidos en comunidades.

    2.• Las comunidades son divididas en vecindades.

    3.• Las vecindades son seleccionadas al azar.

    4.• De cada vecindad, las unidades de vivienda son seleccionadas al azar.

    5.• Las viviendas seleccionadas son visitadas por los entrevistadores que hacen unas preguntas cortasa los a residentes para determinar si su familia es elegible para el estudio.

    6.• Las personas son seleccionadas en base a su edad, género, y origen racial/étnico.

  • 8/18/2019 Manual de Estadistica_v2

    6/132

    Estadística EEGGLL 5

    Notas

    Ejercicio 3

    En el Perú se desea determinar la media de las edades de las mujeres en edad fértil que usan algúnmétodo anticonceptivo. Defina la población.

    Ejercicio 4

    Se desea determinar el porcentaje de agencias del Banco de Crédito con menos de 25 trabajadores.Defina la población.

    Ejercicio 5

    Tomado del folleto “Lo que debes saber de Pisa 2015” Ministerio de Educación.

    Defina la población del estudio para el caso peruano.Resultados del estudio PISA 2013 por países

    Puesto País Comprensión lectora Matemática Ciencias 1 Shanghai-China 613 570 5802 Singapur 573 542 5513 Hong Kong-China 561 545 5554 Taipei 560 523 523

  • 8/18/2019 Manual de Estadistica_v2

    7/132

    Capítulo 1. Nociones de Estadística Descriptiva 6

    Notas

    65 Indonesia 375 396 38266 Perú 368 384 373

    Fuente: OECD PISA 2013 database

  • 8/18/2019 Manual de Estadistica_v2

    8/132

    Estadística EEGGLL 7

    Notas

    Variable estadísticaUna variable es una característica que interesa observar o medir en las unidades estadísticas y quepuede asumir al menos dos valores diferentes.Una variable estadística es una función que a cada elemento de la población le asigna un número.Los números se asignan de acuerdo con una escala y representan la medición de una determinadacaracterística en cada unidad estadística.En una población se pueden definir muchas variables estadísticas.

    Rango de la variable estadísticaEs el conjunto formado por todos los valores que puede asumir la variable estadística.

    DatoEs el valor de la medición de una variable, realizada en una unidad estadística.

    Ejercicio 6

    Indique la población, variables a medir y rangos y un posible dato de las siguientes investigaciones:Se quiere estimar el porcentaje de personas, por sexo y por grupos de edades, que votarían por ciertocandidato a la presidencia del Perú.Población: ……………………………………………………………………………………………………………………………………

    Variable Rango Un dato posible

    Se quiere estimar el gasto promedio semanal en fotocopias de un alumno de EEGGLL.Población: ……………………………………………………………………………………………………………………………………

    Variable Rango Un dato posible

    Ejercicio 7

    En una investigación, se quiere estimar el ingreso promedio semanal de la fotocopiadora que está enEEGGLLPoblación: ……………………………………………………………………………………………………………………………………

    Variable Rango Un dato posible

    Característica amedir

    Variable Conjunto detodos los valoresque puedeasumir

    RangoValor de lamedición

    Dato

  • 8/18/2019 Manual de Estadistica_v2

    9/132

    Capítulo 1. Nociones de Estadística Descriptiva 8

    Notas

    ParámetroEs un valor que describe una característica de la población. Para calcular un parámetro se requieremedir la característica de interés en todos los elementos que conforman la población.

    EstadísticoEs un valor que describe una característica de la muestra. Para calcular el estadístico se usan las medi-ciones de la característica de interés en los elementos que conforman la muestra de estudio.

    Ejercicio 8

    Ejercicio 9

    El 13 de marzo del 2016, la empresa Ipsos, para el diario El Comercio, presentó los resultados de unaencuesta sobre intención de voto. Indique si estos valores son parámetros o estadísticos.

    (Fuente: El Comercio)

    Población

    Parámetro

    Muestra

    Estadístico

    Población: Alumnos regularesmatriculados en la Facultad deCiencias e Ingeniería en el semestre2016 01.

    Parámetro: Edad media (en años), calculada con todas lasedades de los alumnos que conforman la población.

    Muestra : Un conjunto de 100alumnos regulares matriculados enla Facultad de Ciencias e Ingenieríaen el semestre 2016 01,seleccionados al azar.

    Estadístico: Edad media (en años), calculada con las edadesde los alumnos que conforman la muestra.

  • 8/18/2019 Manual de Estadistica_v2

    10/132

    Estadística EEGGLL 9

    Notas

    Ejercicio 10

    Ejercicio 11

    Ejercicio 12

    Según los Censos Nacionales X de Población y V de Vivienda 2007 ejecutados por el INEI, el 50,06% delos peruanos es mujer. Indique si este valor es un parámetro o un estadístico.

    Ejercicio 13

    En octubre del 2011, Ipsos Apoyo presentó los resultados de una encuesta sobre sexualidad, repro-ducción y desigualdades de género, en la cual se indica que el 55% de los entrevistados afirma que laviolencia física es el principal problema de la mujer peruana. Indique si este valor es un parámetro oun estadístico.

    Ejercicio 14

    En una muestra de viviendas del área urbana de Ica se observó que en el 35% de los casos, el materialpredominante de las paredes era adobe. Indique si este valor es un parámetro o un estadístico.

    Población: Vacas en la regiónCajamarca.

    Parámetro:....................................................................................................................................................................................................

    Muestra :..............................................................................................................................................................................

    Estadístico:..................................................................................................................................................................................................

    Población: Días de los mesesenero, febrero y marzo de 2016.

    Parámetro:....................................................................................................................................................................................................

    Muestra :..............................................................................................................................................................................

    Estadístico:..................................................................................................................................................................................................

  • 8/18/2019 Manual de Estadistica_v2

    11/132

    Capítulo 1. Nociones de Estadística Descriptiva 10

    Notas

    Tipos de variablesLas variables se pueden clasificar en cualitativas o cuantitativas.

    Son ejemplos de variables cualitativas las siguientes:- Sector industrial al que pertenece una empresa,

    - Tipo de material de construcción de una vivienda.Son ejemplos de variables discretas las siguientes:- Número de llamadas que ingresan a una central telefónica por minuto,- Número de trabajadores de una agencia de bancos en una empresa.Son ejemplos de variables continuas las siguientes:- Tiempo, en minutos, que demora un estudiante en resolver un examen- Área de terreno construida de una vivienda en Lima, en m2.

    Ejercicio 15

    Indique el tipo de las siguientes variables.Variable Tipo de variable

    Nivel socioeconómico de una persona (bajo, medio, alto)

    Cantidad de dinero gastado en una semana, en nuevos soles

    Estatura, en centímetros, de una persona

    Número de DNI

    Escala de pagos de un alumno de la PUCP

    Tipo de empresa (privada, pública, otro)

    Variablescualitativas

    Son las variables quemiden una cualidad.Son de carácter nonumérico y por logeneral clasifican a lasunidades estadísticasen categorías.

    Variablescuantitativas

    Son variables quemiden una cantidad.Son de carácternumérico. A su vez, lasvariables cuantitativasse pueden clasificar endiscretas y continuas.

    Variable cuantitativadiscreta

    Es una variable cuyo rangoes un conjunto finito oinfinito numerable, esdecir, que en un intervalodeterminado, solo puedetomar ciertos valores.

    Variable cuantitativacontinua

    Es una variable cuyo rangoes un conjunto continuo ypuede asumir un númeroinfinito no numerable devalores diferentes; esdecir, que en un intervalodeterminado, puedentomar cualquier valor.

  • 8/18/2019 Manual de Estadistica_v2

    12/132

    Estadística EEGGLL 11

    Notas

    Escalas de medición de las variables

    MediciónEs el proceso de observación de una característica de interés (variable), sobre una unidad estadística.

    Escala de mediciónAsigna números a las mediciones realizadas en las unidades estadísticas. Los números asignados porlas escalas deben informar lo más precisamente posible acerca de las características de cada unidadobservada.

    Tipos de escalas de medición

    Stanley Smith Stevens (1906 – 1973) profesor de la Universidad de Harvard, en la revistaScience de junio de 1946, presentó su artículo “Sobre la Teoría de las Escalas de Medi-ción” . La clasificación de Stevens considera cuatro tipos de escala: nominal, ordinal, deintervalo y de razón.Tomado de http://www.nasonline.org/publications/biographical-memoirs/memoir-pdfs/Stevens_Stanley.pdf

    Las variables de tipo cualitativo se miden en escalas nominal u ordinal; las variables de tipo cuantitativose miden en escalas de intervalo y de razón.

    Nominal

    Una variable está medida en escala nominal cuando los valores de la variable clasifican a las unidadesestadísticas en iguales o diferentes.Por ejemplo:- Sexo: 1 = femenino; 2 = masculino- Estado civil: 1 = casado; 2 = soltero; 3 = viudo; 4 = otro- Especialidad de un alumno de Psicología: social = 1; educacional = 2; clínica = 3

    OrdinalUna escala ordinal es una escala nominal cuyos valores reflejan el orden existente entre los valores dela variable, según el mayor o menor grado en el que se encuentre presente la característica.Por ejemplo:- Escala de pagos de un alumno de la PUCP: 1, 2, 3, 4, 5- Grado de instrucción: 1 = primaria completa; 2 = secundaria completa; 3 = superior completa- Grado de satisfacción de un cliente: 1 = muy insatisfecho; 2 = insatisfecho; 3 = satisfecho; 4 = muy

    satisfecho.

  • 8/18/2019 Manual de Estadistica_v2

    13/132

    Capítulo 1. Nociones de Estadística Descriptiva 12

    Notas

    - La consultora Mercer elabora este ranking cada año. Justificaque es importante disponer de una análisis actualizado de la ca-lidad de vida en las ciudades, sobre todo para poder fijar suel-dos o condiciones para la plantilla y los ejecutivos. Se elabora apartir del análisis 10 variables —entre ellas el entorno social,político, económico y cultural, así como los servicios sanitarios

    y educativos, la disponibilidad de bienes de consumo y el en-torno natural — para definir cuáles son los mejores lugares paravivir.

    IntervaloUna escala de intervalo es una escala ordinal en la que, además, las diferencias entre los valores asig-nados proporcionan información acerca de la diferencia en el grado en que se presenta la característicaobservada.Esta escala no tiene un cero real sino un cero relativo, definido arbitrariamente y que no indica ausen-cia de la característica medida.Por ejemplo:- Temperatura, en grados centígrados.

    - Altura de una ciudad, en metros sobre el nivel del mar.

    RazónEs una escala de intervalos en la que además los números asignados representan las cantidades de lacaracterística que se mide.La proporción entre dos números corresponde a la misma proporción entre las cantidades de la carac-terística medida.El cero es real e indica ausencia total de la característica que mide la variable.Por ejemplo:- Sueldo bruto mensual, en nuevos soles, de los empleados de una empresa.

    - Tiempo, en minutos, que tarda un alumno en terminar una prueba de agilidad mental.- Peso, en kilogramos, de una persona.- Velocidad, en metros por segundo.- Velocidad, en Km por hora.- Productividad del mes, en piezas producidas en un mes.

  • 8/18/2019 Manual de Estadistica_v2

    14/132

    Estadística EEGGLL 13

    Notas

    Ejercicio 16

    Indique el tipo y la escala de medición adecuada para las siguientes variables.

    Variable Tipo de variable Escala de medición

    Código de una alumna o alumno de la PUCP

    Costo de una licencia del software SPSS

    Número de aplicaciones en un celular

    Material de una tubería (cobre, pvc, etc.)

    Año de nacimiento de una persona

    Facultad (Letras y CCHH; Ciencias Sociales,Derecho, Gestión y Alta Dirección, otras)

    Nota en la primera práctica de Estadística

    Número de teléfono

    Acceso a Internet en casa (sí, no)

  • 8/18/2019 Manual de Estadistica_v2

    15/132

    Capítulo 1. Nociones de Estadística Descriptiva 14

    Notas

    1.2. Organización y tratamiento de datos

    Distribución de frecuenciasEs la representación estructurada, en forma de tabla, de los datos que se han recolectado sobre unavariable en estudio.Es útil para resumir grandes volúmenes de datos.Permite que quienes toman decisiones puedan extraer directamente la información relevante.

    Frecuencias simples

    Lafrecuencia absoluta n i de una clase es la cantidad de datos que pertenecen a esa clase.Lafrecuencia relativa f i de una clase es la proporción de datos que pertenecen a esa clase.

    n

    n

    datosdetotal número

    i claseladeabsoluta frecuencia f relativa frecuencia i i

    Lafrecuencia porcentual p i de una clase es el porcentaje de datos que pertenecen a esa clase.

    Ejercicio 17

    Distribución de visitantes extranjeros al Perú, según zona geográfica, 2012Zona geográfica Número de visitantes extranjeros Porcentaje

    Sudamérica 2 590 766 74,29%

    Norteamérica 459 413 13,17%

    Europa 294 440 8,44%Centroamérica 138 654 3,98%

    Asia 797 0,023%

    África 79 0,002%

    Oceanía 184 0,005%

    Otros 3 013 0,086%

    Total 3 487 346Fuente: Ministerio del Interior - Dirección General de Migraciones y NaturalizaciónElaboración: Instituto Nacional de Estadística e Informática

    Interprete los valores n1, f 2 y p3

  • 8/18/2019 Manual de Estadistica_v2

    16/132

    Estadística EEGGLL 15

    Notas

    Ejercicio 18

    La empresa IGK tomó una muestra de personas y les preguntó por su bebida gaseosa preferida. Losresultados se muestran a continuación. Construya la distribución de frecuencias de la variable en es-tudio.

    Inca Kola Otras Coca Cola Coca Cola Inca Kola Kola Real Sprite Coca Cola Kola Real

    Kola Real Kola Real Inca Kola Inca Kola Sprite Inca Kola Inca Kola Otras Coca Cola Kola Real Kola Real Sprite Inca Kola Inca Kola Inca Kola Otras Kola Real Coca Cola Inca Kola Coca Cola Otras Kola Real Coca Cola Coca Cola Coca Cola Inca Kola Kola Real Inca Kola Coca Cola Inca Kola Inca Kola Coca Cola Inca Kola Inca Kola Sprite Coca Cola

    Distribución de …………………………………………………………………………………………………………………………….

    Marca de gaseosa n i : Número de personas f i : Proporción de personas p i: Porcentaje de personas

    Total

    Fuente: …………..………………………………………………….………………………..

    Frecuencias acumuladas

    Dado un conjunto de n datos cuantitativos, organizados en k clases, se define:

    - La frecuencia acumulada absoluta N i de una clase es la cantidad de datos que pertenecen hastaesa clase.

    Se tiene que:i

    j j i k i nN

    1

    ,...,2,1,

    Luego, 11 nN k i nNN i i i ,...,3,2,1

    - Lafrecuencia acumulada relativa F i de una clase es la proporción de datos que pertenecen hastaesa clase.

    nNdatosdetotal número i acumuladaabsoluta frecuenciaF acumuladarelativa frecuencia i i

    - Lafrecuencia acumulada porcentual P i de una clase es el porcentaje de datos que pertenecen hastaesa clase.

  • 8/18/2019 Manual de Estadistica_v2

    17/132

    Capítulo 1. Nociones de Estadística Descriptiva 16

    Notas

    Ejercicio 19

    Los siguientes datos muestran el número de veces que fueron al cine el último mes un grupo de alum-nos de Estudios Generales Letras.

    2 3 4 0 0 8 1 0 5 3 2 1 2 2 3 2 1 2 1 4 3 4 0 1 0 0 2 2 3 41 0 0 2 1 1 2 0 4 3 5 3 5 1 4 1 4 0 2 1 5 1 2 2 0 0 0 2 2 0

    Construya la tabla de distribución de frecuencias de la variable en estudio.

    1.3. Gráficos y tablas estadísticasTodo gráfico debe tener, por lo menos, lo siguiente:- un título que lo describa lo mejor posible

    - unidades y rótulos en todos los ejes- fuente de los datos.

    Número de vecesque fue al cine el

    último mes

    n i : Número dealumnos

    p i : Porcentaje dealumnos

    N i : Número acu-mulado de alum-

    nos

    P i : Porcentajeacumulado de

    alumnos

    Total

  • 8/18/2019 Manual de Estadistica_v2

    18/132

    Estadística EEGGLL 17

    Notas

    Gráficos para datos de variables cualitativas

    Gráfico de barrasSe usa para representar gráficamente la distribución de un conjunto de datos cualitativos.En uno de los ejes, se representan las categorías o clases de la variable; para el otro eje, se puede usaruna escala de frecuencias absolutas, relativas o porcentuales. Se traza una barra sobre cada indicadorde clase de una altura proporcional a la frecuencia correspondiente.Las barras deben ser del mismo ancho y deben estar separadas para enfatizar el hecho de que cadaclase es diferente de otra.

    Por ejemplo, investigadores analizaron 28 tipos de cáncer en 188 países entre 1990 y 2013 a partir deregistros de cáncer, informes de autopsias y otras fuentes sobre las causas de muerte, obteniendo estegráfico de barras para el número de casos de cáncer diagnosticados en el mundo.

    Gráfico circular o de pastel

    Cuando se utiliza el gráfico circular, cada sector circular representa la frecuencia observada de unaclase o categoría.El sector circular que representa a una determinada clase o categoría de la variable tiene un ángulo enel centro proporcional a la frecuencia relativa de dicha clase. El ángulo que le corresponde a cada clasese obtiene multiplicando 360º por la respectiva frecuencia relativa.

    Distribución porcentual de nuevos casos de cáncer según continente.

    Fuente: Globocan

  • 8/18/2019 Manual de Estadistica_v2

    19/132

    Capítulo 1. Nociones de Estadística Descriptiva 18

    Notas

    Gráficos para datos de variables cuantitativas discretas

    Gráfico de bastónEs un gráfico que muestra la frecuencia de ocurrencia de cada valor observado de la variable discretamediante un segmento (bastón) cuya altura es proporcional a la frecuencia correspondiente.

    Ejercicio 20

    Los siguientes datos muestran el número de veces que fueron al cine el último mes un grupo de alum-nos de Estudios Generales Letras.

    2 3 4 0 0 8 1 0 5 3 2 1 2 2 3 2 1 2 1 4 3 4 0 1 0 0 2 2 3 41 0 0 2 1 1 2 0 4 3 5 3 5 1 4 1 4 0 2 1 5 1 2 2 0 0 0 2 2 0

    Construya el gráfico de bastones correspondiente.

  • 8/18/2019 Manual de Estadistica_v2

    20/132

    Estadística EEGGLL 19

    Notas

    Distribución de frecuencias por intervalos para variables cuantitativas continuas

    Cuando se realiza mediciones de una variable continua, por lo general, los datos observados tienenmuchos valores diferentes, por ello, para presentarlos en una tabla de forma tal que se facilite su aná-lisis, estos datos deben agruparse primero en clases o intervalos.Tres pasos previos para la construcción de una distribución de frecuencias por intervalos son los si-guientes:Determinar la cantidad de intervalos o clases.Determinar el ancho o amplitud de cada intervalo o clase.Determinar los límites de cada intervalo o clase.

    Cantidad de clases: k Se recomienda usar entre 5 y 20 intervalos o clases.La idea es emplear suficientes clases para mostrar la variación de los datos, pero no tantas que variascontendrían muy pocos o ningún elemento.

    Hay algunas reglas que sugieren el número de clases o intervalos que se deben usar que dependen delnúmero de datos disponibles, sin embargo en la práctica la decisión generalmente se toma atendiendoa una necesidad específica o por experiencia.

    Amplitud de cada clase: A Por lo general, se usa la misma amplitud o ancho para todas las clases.

    Se calcula de la siguiente manera:

    k Rango

    k x x

    k mínimodatomáximodato

    Ampli tud mínmáx

    La amplitud se aproxima por exceso de acuerdo con la cantidad de decimales que tienen los datos osegún la precisión con que se desea trabajar.Se usa la aproximación por exceso para asegurar que el mayor de los datos pertenezca a alguna de lasclases.

    Límites de cada clase o intervaloLos intervalos deben ser disjuntos y deben cubrir todo el rango de variación de los datos.Los límites de cada clase se escogen de tal manera que cada dato pertenezca a una clase y sólo a una.

    Por lo general, el límite inferior de la primera clase es el mínimo valor observado.Marca de claseLa marca de clase es el punto medio de cada intervalo. Se obtiene calculando la semisuma de los límitesde cada intervalo o clase.La marca de clase se considera un valor que representa a cada uno de los datos que pertenecen alintervalo o clase correspondiente. Por eso es importante que los intervalos no sean demasiado grandesporque la marca de clase no sería un buen representante, ni demasiado pequeños como para compli-car la construcción de la tabla o para que hayan varias clases sin datos.La marca de clase de la clase i se denota m i .

  • 8/18/2019 Manual de Estadistica_v2

    21/132

    Capítulo 1. Nociones de Estadística Descriptiva 20

    Notas

    Ejemplo 2

    Construya una distribución de frecuencias de siete intervalos o clases para los siguientes datos querepresentan los tiempos (en minutos), que demoraron 48 alumnos en resolver una prueba.

    8,8 8,7 10,2 10,3 8,2 11,7 7,8 9,8 11,1 8,9 9,3 8,3 8,2 9,0 9,2 8,58,9 12,4 9,6 10,1 9,6 9,7 9,6 11,3 10,9 9,8 9,5 12,0 10,9 12,4 9,3 9,4

    12,7 8,4 10,5 10,9 11,9 9,9 9,5 10,7 12,6 10,8 8,6 9,2 8,5 9,6 10,0 9,8

    SoluciónEl rangoR se calcula con:

    R = dato máximo – dato mínimo = x max – x min = 12,7 - 7,8 = 4,9

    De acuerdo a lo indicado, el número de clases o intervalos a usar es k = 7.

    La amplitud de cada intervalo es:

    7,079,4

    k

    R A

    En el curso usaremos intervalos abiertos a la izquierda, pero también puede usarse intervalos abiertosa la derecha. Los intervalos o clases para los datos de este ejemplo son:I1: [ x min ; x min + A] = [7,8 ; 7,8 + 0,7] = [7,8 ; 8,5]I2: ] x min + A ; xmin + 2 A] = ]8,5 ; 9,2]...I7: ] x min + 6 A ; x min + 7 A] = ]12,0 ; 12,7]

    Título: _____________________________________________________________________________

    Tiempo (min.) Marca de clase(m i )n i : Númerode alumnos

    f i : Proporciónde alumnos

    N i : Númeroacumuladode alumnos

    F i : Proporciónacumulada de

    alumnos

    [7,8 8,5] 8,15 7 0,1458 7 0,1458]8,5 9,2] 8,85 8 0,1667 15 0,3125]9,2 9,9] 9,55 14 0,2917 29 0,6042]9,9 10,6] 10,25 5 0,1042 34 0,7083]10,6 11,3] 10,95 7 0,1458 41 0,8542]11,3 12,0] 11,65 3 0,0625 44 0,9167]12,0 12,7] 12,35 4 0,0833 48 1,0000

    Distribución de frecuencias por intervalos para datos de una variable cuantitativa discretasSi los datos que se quiere organizar en una distribución de frecuencias corresponden a mediciones deuna variable discreta pero se han observado muchos valores diferentes, entonces también podemosutilizar una distribución de frecuencias por intervalos para facilitar el análisis de estos datos.

  • 8/18/2019 Manual de Estadistica_v2

    22/132

    Estadística EEGGLL 21

    Notas

    Ejercicio 21

    La manzana delicia (manzanaRed Delicious ), tiene piel o cáscara color rojo brillante, pulpa blanquecina,es algo arenosa y con un sabor algo ácido, de esta variedad procede la variedad Royal Red Delicious .Se ha tomado una muestra de estas manzanas obteniéndose los siguientes pesos, en gramos.

    130 158 163 166 168 170 171 174 178 180 183 185 186 187 189

    190 190 192 192 193 193 193 193 194 195 196 198 198 199 203

    205 211 214 215 217 218 222 224 226 227 233 235 238 239 305

    Construya una distribución de frecuencias usando seis intervalos para las manzanas de la muestra.

    Título: _____________________________________________________________________________

    m i n i p i N i P i

    [ ]] ]] ]

    ] ]] ]] ]

    TotalInterprete el valor de n4

    Interprete el valor de p2

    Interprete el valor de P3

    Interprete el valor de m 3

  • 8/18/2019 Manual de Estadistica_v2

    23/132

    Capítulo 1. Nociones de Estadística Descriptiva 22

    Notas

    Gráficos de variables cuantitativas continuas

    Para presentar estos gráficos usaremos los datos correspondientes a la experiencia laboral de losobreros de una fábrica que han sido organizado previamente en la siguiente distribución de frecuen-cias por intervalos.

    Título:……………………………………………………………………………………………………………………………………… Experiencia

    laboral(en años)

    m i :marca de

    clase

    n i : número deobreros

    f i : proporción deobreros

    N i : Número acu-mulado de obre-

    ros

    F i : proporciónacumulada de

    obreros

    [ 0 ; 4 ] 2 57 0,2780 57 0,2780] 4 ; 8 ] 6 78 0,3805 135 0,6585

    ] 8 ; 12 ] 10 43 0,2098 178 0,8683] 12 ; 16 ] 14 25 0,1220 203 0,9903

    ]16 ; 20 ] 18 2 0,0098 205 1Total - 205 1 -

    HistogramaEste gráfico se construye a partir de una distribución de frecuencias por intervalos.Cada frecuencia de clase se representa trazando un rectángulo, cuya base es el intervalo de clase sobreel eje horizontal y cuya altura es proporcional a la frecuencia correspondiente (absoluta, relativa oporcentual).Los rectángulos adyacentes se tocan entre sí.

  • 8/18/2019 Manual de Estadistica_v2

    24/132

    Estadística EEGGLL 23

    Notas

    Polígono de frecuenciasEs la representación por medio de una figura poligonal cerrada de una distribución de frecuencias ab-solutas, relativas o porcentuales.Se obtiene uniendo con segmentos de recta los puntos con la marca de clase como abscisa y la corres-pondiente frecuencia absoluta o relativa como ordenada.

    Los polígonos de frecuencias se cierran en los puntos del eje horizontal correspondientes al límite in-ferior del primer intervalo y al límite superior del último intervalo.

    OjivaEs la gráfica de una distribución de frecuencias acumuladas (absolutas, relativas o porcentuales).La ojiva parte del punto que tiene al límite inferior del primer intervalo como abscisa y a cero comoordenada.Se obtiene uniendo con segmentos de recta los puntos con el límite superior de cada intervalo comoabscisa y la frecuencia acumulada respectiva como ordenada.Con la ojiva se puede estimar el número o porcentaje aproximado de observaciones que correspondena un intervalo determinado.

    27.80%65.85%

    86.63%99.02%

    100.00%

    0%

    20%

    40%

    60%

    80%

    100%

    0 4 8 12 16 20 P o r c e n t a j e a c u m u

    l a d o

    Experiencia laboral (en años)

    Experiencia laboral de los obreros de laempresa A

    Fuente: Empresa A. Encuesta RRHH 2013

  • 8/18/2019 Manual de Estadistica_v2

    25/132

    Capítulo 1. Nociones de Estadística Descriptiva 24

    Notas

    Ejercicio 22

    La anchoveta es el pez más importante del ecosistema de la Corriente de Humboldt. Su abundancia hapermitido el desarrollo y sustento de muchas otras especies de peces, aves, mamíferos e invertebradosque hoy en día habitan en nuestro mar. Una muestra de 250 anchovetas de un año de edad ha dadouna longitud mínima de 6 cm. Los datos se muestran organizados en la tabla siguiente.Complete la distribución de frecuencias por intervalos de las longitudes de las anchovetas.

    Título: _______________________________________________________________________

    Tamaño(centímetros)

    mi:Marca de clase

    n i : f i : N i : F i :

    0,10

    65

    180

    30

    0,96

    17 0,04

    Total

    Grafique el histograma, polígono de frecuencias y la ojiva de frecuencias relativas.

  • 8/18/2019 Manual de Estadistica_v2

    26/132

    Estadística EEGGLL 25

    Notas

    Calcule el porcentaje aproximado de anchovetas de la muestra que midieron 13 centímetros o menos.

    Calcule el porcentaje aproximado de anchovetas de la muestra que entre 12 y 15,5 centímetros.

    Determine, aproximadamente, la longitud mínima que debería tener una de estas anchovetas paraestar considerada dentro de las 10% más grandes.

  • 8/18/2019 Manual de Estadistica_v2

    27/132

    Capítulo 1. Nociones de Estadística Descriptiva 26

    Notas

    1.4. Tablas de contingenciaTambién llamadas tablas cruzadas o tablas de doble entrada.Se usan para resumir de manera simultánea los datos para dos variables.

    Ejercicio 23

    En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadística e Informática se pre-guntó a las peruanas de 12 a más años por la cantidad de hijos que han tenido vivos, obteniéndose lossiguientes resultados.

    Tabla 1. Perú. Edad de la madre y número de hijos nacidos vivosNúmero total de hijos/a que ha tenido nacidos vivos

    Edad de la madre Cero hijos Un hijo Dos hijos Tres hijos Cuatro hijos Total12 años 298,985 1,028 300,01313 años 284,650 1,162 285,81214 años 285,732 1,638 734 288,104

    15 años 283,045 4,909 994 288,94816 años 247,888 12,358 922 576 261,74417 años 231,839 24,243 2,280 636 258,99818 años 216,999 38,938 5,089 586 481 262,09319 años 193,952 52,797 9,273 1,118 496 257,636

    Total 2,043,090 137,073 19,292 2,916 977 2,203,348Fuente: INEI - Censos Nacionales 2007: XI de Población y VI de Vivienda

    Identifique las variables usadas en la realización de esta tabla de doble entrada.

    Rellene los espacios en blanco de acuerdo a la información contenida en la tabla.

    El número de peruanas menores de 15 años de la muestra, que han tenido hijos es …………………

    En la muestra, el número de peruanas de 18 años que han tenido dos o más hijos es …………………

    En la muestra, el número de menores de edad que han tenido hijos es …………………

    En la muestra, el ………….…….% de las menores de edad ha tenido hijos.

    El………………..% de mujeresde 17 años, en la muestra, ha tenido hijos.

    El……………….% de …………………………………………………………………….

  • 8/18/2019 Manual de Estadistica_v2

    28/132

    Estadística EEGGLL 27

    Notas

    1.5. Gráficos a partir de tablas de contingencia

    Son realizados a partir de tablas de contingencia.

    Por ejemplo, según una encuesta realizada por la agencia Euromonitor, los brasileños pueden llegar aducharse hasta doce veces de media a la semana. A la cola de este sondeo se encuentran los chinos,

    quienes al parecer solo se duchan una vez cada dos días.

    Tomado de http://elpais.com/elpais/2015/06/28/actualidad/1435483359_779060.html

    Gráfico de barras apiladasUn gráfico de barras apiladas muestra todas las series apiladas en una sola barra para cada categoría.El alto de cada barra es proporcional a la frecuencia de cada categoría.

  • 8/18/2019 Manual de Estadistica_v2

    29/132

    Capítulo 1. Nociones de Estadística Descriptiva 28

    Notas

    Gráfico de barras apiladas al 100%Un gráfico de barras apiladas al 100% muestra todas las series apiladas en una sola barra para cadacategoría. El alto de cada barra es el mismo para cada categoría.

  • 8/18/2019 Manual de Estadistica_v2

    30/132

    Estadística EEGGLL 29

    Notas

    Ejercicio 24

    En el II Censo Nacional Universitario del año 2010 realizado por el INEI se preguntó a los alumnos depregrado de todo el Perú por su tipo de universidad y su género. Los datos se muestran en el siguientecuadro.

    Perú. Distribución de alumnos censados en pregrado por género y tipo de universidad. 2010

    Género Pública Privada Total

    Femenino 135 082 247 743 382 825

    Masculino 174 093 226 052 400 145

    Total 309 175 473 795 782 970

    Fuente: INEI. Censo Universitario. 2010

    a) Interprete el valor “135 082” de la tabla.

    b) Elabore un gráfico que permita ver la composición porcentual por género y tipo de universidad .Título ……………………………………………………………………………………………….……………………..…………………

    Género Pública Privada Total

    Femenino

    Masculino

    Total 100%

    Fuente: ………………………………………………………………………

    Título ……………………………………………………………………………………………….……………………..…………………

    Interprete el valor ………………………….. de la tabla.

  • 8/18/2019 Manual de Estadistica_v2

    31/132

    Capítulo 1. Nociones de Estadística Descriptiva 30

    Notas

    c) Elabore un gráfico que permita ver la composición porcentual según tipo de universidad por género.Título ……………………………………………………………………………………………….……………………..…………………

    Género Pública Privada Total

    Femenino 100%

    Masculino 100%

    Fuente: INEI. Censo Universitario. 2010

    Título ……………………………………………………………………………………………….……………………..…………………

    d) Elabore un gráfico apilado al 100% que permita ver la composición porcentual según género portipo de universidad .

    Título ……………………………………………………………………………………………….……………………..…………………

    Género Pública Privada

    Femenino

    Masculino

    Total 100% 100%

    Fuente: INEI. Censo Universitario. 2010

    Título ……………………………………………………………………………………………….……………………..…………………

    ¿Parece haber relación entre el género del estudiante y el tipo de universidad en que estudia?

  • 8/18/2019 Manual de Estadistica_v2

    32/132

    Estadística EEGGLL 31

    Notas

    1.6. Estadísticos de posición

    PercentilElk -ésimo percentil, denotado Pk , es el menor de los datos tal que por lo menos el k % de los datos sonmenores o iguales que este valor.

    CuartilSe denomina así a cada uno de los tres percentiles: P25, P50, P75 y se les denota como Q1, Q2 y Q3 res-pectivamente.

    QuintilSe denomina así a cada uno de los cuatro percentiles: P20, P40, P60, P80 y se les denota como Q1, Q2, Q3,Q4 respectivamente.

    DecilSe denomina así a cada uno de los diez percentiles: P10, P20, … yP90 y se les denota como D1, D2 , …, D10 respectivamente.

    Ejemplo 3

    La Encuesta de Caracterización Socioeconómica Nacional, Casen, en Chile, es realizada con el objetivode disponer de información que permita conocer periódicamente la situación de los hogares.Por ejemplo: una familia compuesta por cinco personas (padre, madre y tres hijos), si el padre tieneingresos de $400.000 mensuales y la madre de $350.000, el cálculo sería así: ($400.000+$350.000)/5= $150.000, la familia estaría en el decil 5.

    Ejercicio 25

    En los últimos 150 años, los holandeses han pasado a ser los habitantes más altos del mundo, y segúnlos expertos siguen creciendo. El estudio de la altura de los holandeses a lo largo de los siglos ofreceun panorama sobre la salud y riqueza de la nación. No siempre fue así, en 1848, uno de cada cuatro

    varones era rechazado del servicio militar porque no alcanzaba la estatura de 1,57 metro. Actual-mente, el percentil 1 de la estatura de los varones holandeses es 1,57 metro y el percentil 70 es 1,88metro. Indique el significado de estos percentiles. Fuente http://www.ap.org/ Associated Press.

    http://www.ap.org/http://www.ap.org/

  • 8/18/2019 Manual de Estadistica_v2

    33/132

    Capítulo 1. Nociones de Estadística Descriptiva 32

    Notas

    Percentil k para un conjunto de n datos

    Ejercicio 26

    Dadas las siguientes edades de una muestra de personas asistentes al Túnel de la Ciencia, calcule einterprete el percentil 30 y el percentil 50.

    10 12 15 14 8 25 19 10 7 14 12 6 18 13 11 15 13 15 16 14 13 15

    Ejercicio 27 En la tabla siguiente se muestra la distribución de los trabajadores de una empresa según el número detardanzas en el mes pasado. Calcule e interprete el percentil 30 y el percentil 75.

    x i : Número detardanzas

    n i : Número de traba- jadores

    f i : Proporción de tra-bajadores

    N i : F i :

    0 48

    1 80

    2 57

    3 15

    Total

    Ordene los n datos de

    manera ascendente: x 1 ≤ x 2 ≤ x 3 ≤ …≤ x n

    Calcule la posición i delpercentil k -ésimo, P k.

    Si el valor calculado de i esun entero, el percentil k -ésimo P k es el dato x i quetiene la posición igual a i .

    Si el valor calculado de i noes entero, el percentil k -

    ésimo P k es el dato x i +1 quetiene la posición inmediata

    superior a i .

  • 8/18/2019 Manual de Estadistica_v2

    34/132

    Estadística EEGGLL 33

    Notas

    Percentil de datos organizados en una distribución de frecuencia por intervalosCuando no conocemos los valores exactos de cada uno de los datos y sólo los tenemos organizados enuna distribución de frecuencias por intervalos, no es posible calcular el valor exacto del percentil k -ésimo, Pk , en ese caso, hallaremos un valor aproximado de este percentil usando la información con-tenida en la tabla.- Primero, identificamos el intervalo Ii = ]Li ; Ui ] en el que se encuentra el percentil Pk mirando en la

    columna de frecuencias relativas acumuladas. Se debe cumplir que:

    i i F k

    F 1001

    .

    - El valor del percentilPk se determina por la siguiente expresión:

    11 100100 i i i i

    i i k N

    nk

    n

    ALF

    k

    f

    ALP

    donde:Li = límite inferior del intervalo que contiene al percentil k

    f i = frecuencia relativa del intervalo que contiene al percentil k F i-1 =Frecuencia relativa acumulada del intervalo anterior al que contiene al percentil k

    A = Amplitud del intervalo.Para deducir la fórmula para percentiles de datos agrupados en intervalos, podemos establecer unasemejanza de triángulos usando la ojiva de frecuencias relativas acumuladas.

    1

    1

    100 i

    i i

    i k

    i i

    F k

    F F

    LP

    LU

    De donde se tiene que:

    1100 i

    i

    i k

    F k

    f

    LP

    A

    Despejando se obtiene la fórmula del percentil k .

    1100 i i i k F

    k f A

    LP

    CuartilesPrimer cuartil: Q1 = P25 Segundo cuartil: Q2 = P50 Tercer cuartil: Q3 = P75

  • 8/18/2019 Manual de Estadistica_v2

    35/132

    Capítulo 1. Nociones de Estadística Descriptiva 34

    Notas

    Ejercicio 28

    Según la definición oficial de la Organización Meteorológica Mundial, la lluvia es la precipitación deagua en forma de gotas, cuando éstas alcanzan un diámetro superior a los 0,5 mm. La cantidad delluvia que cae en un lugar se mide con pluviómetros. La intensidad de la precipitación es medida enmilímetros por hora (mm/h), es decir, la altura medida en milímetros, del agua caída en una hora enuna superficie plana de 1 m 2.

    Las lluvias se categorizan en: débiles : cuando su intensidad es menor o igual a 2 mm/h, moderadas : intensidad mayor a 2 mm/h y menor o igual a 15 mm/h, fuertes : intensidad mayor a 15 mm/h y menor o igual a 30 mm/h, muy fuertes : intensidad mayor a 30 mm/h y menor o igual a 60 mm/h torrenciales : intensidad mayor a 60 mm/h

    En la ciudad A se realizaron 120 mediciones de una hora de la cantidad de lluvia, en una muestra de120 días del año pasado, obteniéndose los siguientes resultados.

    Ciudad A: Distribución de precipitaciones según su intensidad (en mm/h)Intensidad (mm/h) m i : marca de

    clasen i : Número deprecipitaciones

    f i : N i : F i :

    [ 0 16] 8 30 0,2500 30 0,2500

    ] 16 32] 24 55 0,4583 85 0,7083

    ] 32 48] 40 21 0,1750 106 0,8833

    ] 48 64] 56 9 0,0750 115 0,9583

    ] 64 80] 72 5 0,0417 120 1,0000

    Fuente: Dirección de Saneamiento Ambiental. Ciudad A.

    a. Calcule e interprete el P80 de las mediciones.

    b. Calcule la cantidad de precipitación máxima para estar en el 15% de las precipitaciones más bajasde las 120 medidas.

  • 8/18/2019 Manual de Estadistica_v2

    36/132

    Estadística EEGGLL 35

    Notas

    c. Calcule la cantidad de precipitación mínima para estar en el 15% de las precipitaciones más altasde las 120 medidas.

    d. Calcule el porcentaje de mediciones que fueron clasificadas como lluvia débil o moderada.

    e.

    Calcule el porcentaje de mediciones que fueron clasificadas como lluvia fuerte o muy fuerte.

  • 8/18/2019 Manual de Estadistica_v2

    37/132

    Capítulo 1. Nociones de Estadística Descriptiva 36

    Notas

    1.7. Medidas de tendencia centralLas medidas de tendencia central son medidas resumen que se usan como valores que representan alconjunto de datos de una variable.

    Existen varias medidas de tendencia central, como por ejemplo:

    ModaLa moda de un conjunto de datos observados de una variable es el valor que se presenta con mayorfrecuencia.

    Características de la moda

    - La moda se puede calcular para datos medidos en cualquier escala de medición.- El valor de la moda no se ve afectado por valores extremos.- La moda no siempre es un valor único. Una serie de datos puede tener dos modas (bimodal) o más

    modas (multimodal).

    Moda de un conjunto de n datosAgrupe los datos de acuerdo con sus frecuencias, el dato con mayor frecuencia es la moda.

    Ejercicio 29

    La moda de nombre en el Perú es ……………………………………… Esto significa que …………………………………

    …………………………………………………………………………………………………………………………………………………

    Moda Mediana Media MediaponderadaMedia

    geómetricaMedia

    armónica

  • 8/18/2019 Manual de Estadistica_v2

    38/132

    Estadística EEGGLL 37

    Notas

    Ejercicio 30

    Calcule e interprete la moda de los siguientes datos, que representa el número de artículos compradospor 14 clientes de cierto supermercado.

    2 2 2 4 2 5 5 4 5 2 5 5 5 4

    Calcule e interprete la moda de los siguientes datos, que representa el número de artículos compradospor 14 clientes de cierto supermercado.

    2 2 6 4 3 4 6 3 5 80 7 80 5 7

    Ejercicio 31

    En la empresa A, se midió el número de errores por día que cometieron 158 obreros al ensamblar undeterminado producto. Calcule e interprete la moda del número de errores por obrero.

    Empresa A. Distribución de obreros por el número de errores al ensamblar el producto

    xi : Número de errores n i : Número de obreros

    0 25

    3 45

    5 60

    8 28

    Fuente: Gerencia de Producción. Empresa A

  • 8/18/2019 Manual de Estadistica_v2

    39/132

    Capítulo 1. Nociones de Estadística Descriptiva 38

    Notas

    MedianaEs el percentil 50, también llamado segundo cuartil.

    Características de la mediana

    Se puede calcular para variables medidas en escala de ordinal, intervalo o razón.La mediana es un estadístico que no se ve afectado por valores extremos. Por eso se le utiliza cuandohay datos inusuales o el polígono de frecuencias no es muy simétrico.

    Ejercicio 32

    El tiempo, en horas, que se tarda un grupo de obreros, capacitados y no capacitados, en realizar unatarea se muestra en la siguiente tabla.

    Capacitados 4,5 4,3 2,7 8,2 8,3 6,4 5,4 3,4 2,7 5,6

    No capacitados 8,3 7,4 8,5 8,5 9,0 8,4 18

    Calcule e interprete la mediana del tiempo para cada grupo. Compare los valores hallados y comente.

  • 8/18/2019 Manual de Estadistica_v2

    40/132

    Estadística EEGGLL 39

    Notas

    Ejercicio 33

    En la empresa A se tomó una muestra aleatoria de 560 trabajadores y se les preguntó por su ingresomensual, en dólares, obteniéndose los siguientes resultados.

    Distribución de trabajadores por sus ingresos mensuales (en dólares)

    Ingresos (en dólares) m i : Marca declase n i f i N i F i

    30

    ] , ] 77170000 0,1339

    275 , 275 190

    275 , 325

    325 , 325 130

    , 22500 25

    Fuente: Gerencia de Recursos Humanos. Empresa A

    Complete la tabla de distribución de frecuencias y calcule aproximadamente la mediana de los ingresosde los trabajadores de la muestra. Interprete.

  • 8/18/2019 Manual de Estadistica_v2

    41/132

    Capítulo 1. Nociones de Estadística Descriptiva 40

    Notas

    Media aritméticaLa media aritmética es el valor que se obtiene al dividir la suma total de los datos entre el número dedatos.

    Características de la media

    - Se puede calcular para datos medidos en escala de intervalo o razón.- El cálculo de la media es sencillo y es la medida de tendencia central más conocida.- El valor de la media depende de todos los datos, por lo que la presencia de valores muy grandes o

    muy pequeños con respecto a los demás pueden cambiar drásticamente su valor.

    -

    x n x

    n

    i i 1

    - 01

    n

    i i x x

    - Si cada uno de los n valores x i es transformado en: y i = a x i + b, siendo a y b constantes, entonces,la media de los n valores y i es:

    b x ay Ejercicio 34

    Un comerciante ha comprado 30 computadores y ha pagado un precio medio de 450 dólares por cadacomputadora. El comerciante planea revender estas computadoras para obtener ganancias.Si decide fijar el precio de venta de tal manera que gane 80 dólares sobre el costo de cada compu-tadora, ¿cuál sería el precio medio de venta de las computadoras?

    Si decide fijar el precio de venta aumentando un 10% sobre el costo de cada computadora más un

    monto fijo de 50 dólares, ¿cuál sería el precio medio de venta de las computadoras?

  • 8/18/2019 Manual de Estadistica_v2

    42/132

    Estadística EEGGLL 41

    Notas

    Media aritmética para un conjunto de n datos no agrupadosSean x 1, x 2, …, x n un conjunto de n datos de una variable cuantitativa X . La media aritmética de estos n datos es:

    n

    x

    x

    n

    i i

    1

    Ejercicio 35

    Calcule la media de los siguientes datos que representan el número de papeletas pendientes de pagode cada uno de 11 choferes de vehículos de transporte público seleccionados al azar.

    12 13 25 20 17 19 15 14 28 5 4

    Media aritmética para datos en una distribución de frecuencias para variable discretaSean x 1, x 2,…, x k los valores observados de una variable discreta X con frecuencias absolutas respectivasn1, n2,…, nk . La media aritmética de estos datos es:

    k

    i i i

    k

    i i i

    f x n

    n x

    x 1

    1

    Ejercicio 36

    En la empresa A, se midió el número de errores que cometieron 158 obreros al ensamblar un deter-minado producto. Calcule la media del número de errores por obrero.

    Empresa A. Número de errores al ensamblar un producto

    x i : Número de errores n i : Número de obreros f i : Proporción de obreros

    0 25

    3 45

    5 60

    8 28

    Fuente: Gerencia de Recursos Humanos. Empresa A

  • 8/18/2019 Manual de Estadistica_v2

    43/132

    Capítulo 1. Nociones de Estadística Descriptiva 42

    Notas

    Media aritmética para datos en una distribución de frecuencias por intervalosCuando solamente se cuenta con los datos organizados en una distribución de frecuencias por inter-valos no es posible calcular la media aritmética usando la definición porque no se conoce el valorexacto de cada dato. En ese caso, se obtiene un valor aproximado de la media aritmética de los datosusando las marcas de clase de los intervalos.El valor aproximado de la media aritmética para n datos organizados en una distribución de frecuenciascon k intervalos o clases, con marcas de clase m 1, m 2,…, m k y frecuencias absolutas n1, n2, …, nk respec-tivamente es:

    k

    i i i

    k

    i i i

    f mn

    nm

    x 1

    1

    Ejercicio 37

    En el distrito A se tomó una muestra aleatoria de jóvenes y se les preguntó por su estatura, en centí-metros, obteniéndose los siguientes resultados.

    Distrito A. Distribución de una muestra de 800 jóvenes según estatura

    Estatura (en centímetros)m i : n i : f i : N i : F i :

    150 , 0,48

    , 166 0,32

    , 0,95

    , 800

    Fuente: Gerencia de Desarrollo Humano. Municipalidad del distrito A

    Complete la tabla de distribución de frecuencias y calcule la estatura media para la muestra de jóvenes.

    Ejercicio 38

    En los reportes estadísticos de una empresa, correspondientes al período de los últimos 100 días, selee la siguiente información sobre el número de facturas diarias emitidas por la empresa en dicho pe-ríodo.

    Número de facturas Proporción de días

    [30 ; 60] 0,25

    ]60 ; 90] 0,40

    ]90 ; 120] 0,20

    ]120 ; 150] 0,10

    ]150 ; 180] 0,05

  • 8/18/2019 Manual de Estadistica_v2

    44/132

    Estadística EEGGLL 43

    Notas

    Calcule el valor aproximado de la media y la mediana del número de facturas diarias emitidas por laempresa en dicho período, compare los valores y comente cuál le parece más adecuado para repre-sentar este conjunto de datos.

    Calcule aproximadamente el porcentaje de días en los que fueron emitidas más facturas que la media.

    Media aritmética ponderadaDados n datos x 1, x 2,…, x n con pesos w 1, w 2,…,w n la media aritmética ponderada de los datos es:

    n

    i i

    n

    i i i i

    p

    w

    x w x

    1

    Si todos los pesos son iguales, entonces x x p

    Ejercicio 39

    Calcule la nota final de un alumno del curso de Estadística de Estudios Generales Letras que tiene lassiguientes notas: práctica calificada 1 = 18, práctica calificada 2 = 10, práctica calificada 3 = 12, prácticacalificada 4 = 15, examen parcial = 14 y examen final = 9. Los pesos del promedio de prácticas, examenparcial y examen final son 3, 3 y 4, respectivamente. La práctica con menor nota se anula.

  • 8/18/2019 Manual de Estadistica_v2

    45/132

    Capítulo 1. Nociones de Estadística Descriptiva 44

    Notas

    1.8. Medidas de dispersiónCon las medidas de tendencia central es posible determinar el valor que representa a los datos de unconjunto, pero no indica qué tan cercanos o lejanos están los datos de dicho valor central.Las medidas de variabilidad indican cuán alejados están los datos del valor que los representa.

    Tomado de http://gastronomiaycia.republica.com/2010/08/06/manzanas-tamano-xl/

    Ejercicio 40

    Calcule la media, mediana y moda de los siguientes grupos de datos:Grupo 1

    1 3 5 5 5 7 9

    Grupo 2

    -20 5 5 5 5 5 30

    Grupo 3

    5 5 5 5 5 5 5

    ¿Qué conclusión deduce de los cálculos?

    Varianza (s2)Dados n datos cuantitativos x 1, x 2,…, x n la varianza de los datos se define como la media de las distancias

    al cuadrado de cada dato a la media aritmética .

    21

    2

    1

    2

    2 x n

    x

    n

    x x

    s

    n

    i i

    n

    i i

    Desviación estándar ( s)Dados n datos cuantitativos x 1, x 2,…, x n la desviación estándar de los datos se define como la raíz cua-drada de la varianza.

    http://gastronomiaycia.republica.com/2010/08/06/manzanas-tamano-xl/http://gastronomiaycia.republica.com/2010/08/06/manzanas-tamano-xl/

  • 8/18/2019 Manual de Estadistica_v2

    46/132

    Estadística EEGGLL 45

    Notas

    Ejemplo 5

    Las notas de cuatro alumnos son x 1 = 6, x 2 = 11, x 3 = 15, x 4 = 16.

    Luego la media aritmética de las notas es 124

    1615116 x puntos

    Las diferencias o desvíos de cada dato con respecto a la media son d 1 = 6 – 12 = -6,d 2 = 11 - 12 = -1,d 3 = 15 - 12 = 3,d 4 = 16 - 12 = 4.

    Luego, la desviación estándar de las notas es: 937,34

    43)1()6( 2222s puntos.

    Ejercicio 41

    Calcule e interprete la media y la desviación estándar de los siguientes datos que representan el nú-mero de personas atendidas por día en la caseta de información de un proyecto inmobiliario, en unamuestra de 15 días.

    18 5 2 4 2 6 2 10 5 8 11 4 5 6 7

    Desviación estándar de datos agrupados. Variable cuantitativa discreta

    k

    i i i

    k

    i i i

    x x f n

    x x n

    s1

    21

    2

    Ejercicio 42

    Calcule la desviación estándar de los siguientes datos que representan el número artículos defectuososencontrados en cada uno de 122 lotes recibidos la semana pasada. Cada lote tiene 1000 artículos.

    x i : número de defectuosos n i : número de lotes

    2 8

    4 58

    8 26

    10 30

  • 8/18/2019 Manual de Estadistica_v2

    47/132

    Capítulo 1. Nociones de Estadística Descriptiva 46

    Notas

    Desviación estándar de datos organizados en una distribución por intervalos

    k

    i i i

    k

    i i i

    x m f n

    x mn

    s1

    21

    2

    Ejercicio 43 Calcule la media y la desviación estándar de los siguientes datos que corresponden a los pesos de losequipajes de los pasajeros de un vuelo Lima - Arequipa

    Peso (kg.) Marca de clase n i : número de pasajeros

    [10,0 - ] 9

    - 17,5 75

    - 56

    - 10

    Propiedades de la varianza y la desviación estándar- La varianza y la desviación estándar son números no negativos.- Se calculan para datos medidos en escala de intervalo o de razón.

    - Son sensibles a la existencia de valores atípicos.- La varianza se expresa en las unidades de los datos elevadas al cuadrado. La desviación estándar en

    las mismas unidades que los datos. Por ejemplo, si los datos están expresado en kilos, la varianzaestará expresada en kilos 2 y la desviación estándar en kilos.

    - Si cada uno de los n valores x i es transformado en y i = a x i + b, siendo a y b constantes, entonces, lavarianza de los n valores y i es

    222 x y sas , de donde x y sas

    Ejercicio 44

    En una muestra de ferreterías se ha registrado el precio de las varillas de acero de 12 mm, encontrán-dose un precio medio de 19,80 nuevos soles y una desviación estándar de 0,85 nuevos soles.Si los precios se redujeran en un 5% en todas las tiendas, calcule el nuevo precio medio y la nuevadesviación estándar de los precios.

  • 8/18/2019 Manual de Estadistica_v2

    48/132

    Estadística EEGGLL 47

    Notas

    Coeficiente de variaciónEl coeficiente de variación (CV ) de un conjunto de datos indica qué proporción de la media es la des-viación estándar.El coeficiente de variación se determina calculando el cociente de la desviación estándar de los datosentre la media de los datos

    x

    sCV x

    Es útil al comparar la variabilidad de dos o más series de datos que se miden en distintas o igualesunidades, pero difieren a tal punto que una comparación directa de las respectivas desviaciones es-tándar no es muy útil, por ejemplo, cuando las medias están muy distantes.Un valor mayor del coeficiente de variación indica mayor dispersión del conjunto de datos.

    Ejercicio 45

    En una tienda, el precio medio y la desviación estándar del precio de los jeans es de 74 y 15,4 nuevossoles, respectivamente. Si se rebaja 10 nuevos soles a todos los precios, calcule e interprete el nuevo

    coeficiente de variación de los precios. Después del descuento, ¿los precios de los jeans son más ho-mogéneos que antes?

    Ejercicio 46

    El coeficiente de variación de los salarios un grupo de trabajadores es 0,12. Si se aprueba un aumentodel 20% más una bonificación especial de S/.115, el nuevo coeficiente de variación será igual a 0,06.Determine el valor de la media y la varianza de los salarios de los obreros, antes y después del aumento.

  • 8/18/2019 Manual de Estadistica_v2

    49/132

    Capítulo 1. Nociones de Estadística Descriptiva 48

    Notas

    RangoEl rango (alcance, amplitud o recorrido) de un conjunto de datos observados se define como:

    R = dato máximo – dato mínimo

    Características del rango

    - Se puede calcular en variables medidas en escala de intervalo y de razón.- Solo depende del valor máximo y mínimo de los datos e ignora cómo están distribuidos los demás.- Se ve afectado por valores extremos.- El rango es la longitud del intervalo de variación de los datos.

    Rango intercuartilEs la diferencia entre el tercer y primer cuartil.

    Rango intercuartil = RIC = Q3 – Q1= P75 – P25

    Características del rango intercuartilSe puede calcular en variables medidas en escala de intervalo y de razón.No se ve afectado por valores extremos.

  • 8/18/2019 Manual de Estadistica_v2

    50/132

    Estadística EEGGLL 49

    Notas

    Diagrama de cajasEs una gráfica que describe la distribución de un conjunto de datos tomando como referencia los va-lores de los cuartiles como medidas de posición, la mediana como medida de tendencia central y elvalor del rango intercuartil como medida de dispersión. Además, permite apreciar la forma de la dis-tribución de los datos (simétrica o asimétrica).

    Dato atípicoEs un dato inusualmente grande o pequeño con respecto a los otros datos. Se considera un dato atípicoa cualquier dato que esté:- a más de 1,5(RIC ) por arriba (o a la derecha) del tercer cuartil- a más de 1,5(RIC ) por debajo (o a la izquierda) del primer cuartil.

    Pasos para trazar un diagrama de cajas- Determinar los cuartiles Q1, Q2, y Q3

    - Calcular el rango intercuartil RIC = Q3 - Q1 - Calcular los límites máximo y mínimo para la longitud de los bigotes:

    o Límite inferior =Linf = Q1 – 1,5RIC o Límite inferior =Lsup = Q3 + 1,5RIC

    - Detectar los datos atípicos que son aquellos que no pertenecen al intervalo [ Linf ; Lsup ]. A los datosque sí pertenecen al intervalo anterior se les llama datos típicos.

    - Sobre un eje horizontal, se traza un rectángulo con los extremos en el primer cuartil ( Q1) y tercercuartil (Q3).

    - En la caja rectangular se traza un segmento vertical en el lugar de la mediana.- Se traza el bigote izquierdo desde el primer cuartil hasta el mínimo de los datos típicos y el bigote

    derecho desde el tercer cuartil hasta el máximo de los datos típicos.- Se marcan con un asterisco (*) las localizaciones de los datos atípicos.

    Diagramas de caja comparativosUna ventaja de los diagramas de cajas es que se pueden presentar varios juntos, ello permite la fácilcomparación visual de las características de varios conjuntos de datos.Los diagramas de caja permiten comparar las distribuciones de los valores de una variable cuantitativaen los diferentes niveles de otra variable cualitativa.

  • 8/18/2019 Manual de Estadistica_v2

    51/132

    Capítulo 1. Nociones de Estadística Descriptiva 50

    Notas

    Ejercicio 47

    Se desea comparar los resultados de la primera práctica en tres horarios de Estadística de EEGGLL,para lo cual se ha registrado las notas de una muestra de alumnos de cada horario.

    H1 0 2 3 11 11 11 12 12 12 12 12 12 12 13 13 13 14 14 15 15 15 15 15 15 15 20H2 11 11 11 12 12 12 13 14 14 14 14 14 15 15 16 16 16 16 16 17 17 18 18 18 18H3 0 1 8 8 8 9 10 10 11 11 12 12 13 13 13 14 15 15 16 16 16 17 17 17

    Construya un diagrama de cajas que permita comparar las distribuciones de notas en los tres horarios.

    Título: …………………………………………….……………………………………………………

    El horario que tiene la mayor mediana de notas es ……………..

    El horario con mayor rango intercuartil es ………………

    Existen valores atípicos en ………………………………………………

  • 8/18/2019 Manual de Estadistica_v2

    52/132

    Estadística EEGGLL 51

    Notas

    Puntuación estandarizada Z

    Si los datos son x 1 x 2, …. , x n entonces los datos estandarizados son:

    x

    i i s

    x x z

    i = 1, 2,…, n

    Se cumple que 0z y que 1zs EL valor estandarizado del dato x i indica a cuántas desviaciones estándar, por arriba o por debajo de lamedia, se encuentra este dato.

    Ejemplo 6

    Tomado de “Encuesta Nacional de Salud y Nutrición 2012” México

    Ejercicio 48

    Un conjunto de alumnos rindió dos exámenes. En el primer examen, la nota media fue 13,4 y la des-viación estándar de 2,3, mientras que en el segundo examen la nota media fue 15,4 y la desviaciónestándar 4,3. Una persona obtuvo 14 en el primer examen y 16 en el segundo examen. En términosrelativos a los resultados de los exámenes, ¿en cuál de ellos la nota fue mejor?

  • 8/18/2019 Manual de Estadistica_v2

    53/132

    Capítulo 1. Nociones de Estadística Descriptiva 52

    Notas

    1.9. Indicadores de asimetríaMide si los datos están ubicados simétricamente o no respecto a una medida de tendencia central.

    Distribución de frecuencias simétricaUna distribución de frecuencias de k clases es simétrica, si se cumple que ,

    1 k f f

    ...,, 2312 k k f f f f

    Coeficiente de asimetría de Pearson para datos agrupados o no agrupadosEl coeficiente de asimetría para datos simples o agrupados se calcula con la siguiente fórmula:

    x s

    Q x As 23

    Si el coeficiente de asimetría ( As) es- igual a cero, la distribución es simétrica alrededor de la media.- positivo, indica sesgo a la derecha (cola derecha).- negativo, indica sesgo a la izquierda (cola izquierda).

    Ejercicio 49

    El salario, en cientos de nuevos soles, de los trabajadores una empresa se presenta a continuación:

    25 14 19 14 15 16 15 15 18 15 52 24 36 15 15 23 24

    Calcule e interprete el coeficiente de asimetría de Pearson.

  • 8/18/2019 Manual de Estadistica_v2

    54/132

    Estadística EEGGLL 53

    Notas

    Ejercicio 50

    El siguiente cuadro muestra la distribución del sueldo mensual de los empleados de dos empresas A yB en julio del 2015.

    Empresas A y B. Sueldos mensuales en julio del 2015

    Sueldos (en nuevos soles) Empleados de la empresa A Empleados de la empresa B

    [1 500 – 2 500] 2 1]2 500 – 3 500] 40 6

    ]3 500 – 4 500] 12 25

    ]4 500 – 5 500] 3 6

    ]5 500 – 6 500] 1 1

    Fuente: Gerencias de Recursos Humanos Empresa A y B.

    a) En un solo gráfico muestre los dos polígonos de frecuencias para los sueldos de los trabajadores delas empresas A y B. Comente comparativamente las distribuciones de los sueldos mensuales.

    b) Calcule la media, desviación estándar y coeficiente de variación de los sueldos para los trabajadores

    de las empresas A y B. ¿En cuál de las dos empresas los sueldos son más homogéneos?c) Compare la simetría de las distribuciones de los sueldos en las empresa A y B gráficamente (use el

    gráfico de la parte a) y usando el coeficiente de asimetría de Pearson. Comente.

  • 8/18/2019 Manual de Estadistica_v2

    55/132

    Capítulo 1. Nociones de Estadística Descriptiva 54

    Notas

    Ejercicios

    1. Un auditor, luego de revisar las declaraciones juradas de impuesto a la renta de 50 personas na-turales, hace un informe de los montos omitidos. El informe lo presenta con una distribución defrecuencias de 6 intervalos de la misma longitud. Los montos omitidos varían de 0 soles a 3000soles, y las frecuencias acumuladas del primero al sexto intervalo son respectivamente: 5, 15, 35,

    43, 48, 50.a. Encuentre e interprete la mediana y el coeficiente de variación.b. Halle el porcentaje de declaraciones en las que el monto omitido supera la media.

    2. Hay 10 personas en un ascensor, 4 mujeres y 6 hombres. El peso medio de las mujeres es de 60kilos con una desviación estándar de 8 kilos y el peso medio de los hombres es de 80 kilos conuna varianza de 25 kilos2.a. ¿Cuál es el peso medio de las 10 personas en el ascensor?b. Si el peso de cada una de las mujeres aumentara al doble ¿cuáles serían el nuevo peso medio

    y la nueva varianza de los pesos de las mujeres?

    c.

    Suponga que cada uno de los hombres se pesa en una balanza que no está bien calibrada yque aumenta 2,5 kilos en cada medición. ¿Cuál sería el coeficiente de variación que se ob-tendría con esas mediciones de los pesos de los hombres?

    3. A continuación, se presenta la distribución de los tiempos totales, en minutos, que diferentesestaciones de radio dedicaron a los avisos comerciales entre las 8:00 a. m. y las 12:00 m. de undía de la semana pasada.

    Tiempo (minutos) [0 - 6] ]6 - 12] ]12 - 18] ]18 - 24] ]24 - 30] ]30 - 36] ]36 - 42] ]42 - 48] ]48 - 54] ]54 - 60]

    Número de radios 1 3 17 2 1 10 0 0 2 14

    a. Calcule e interprete el coeficiente de variación del tiempo dedicado a los avisos comerciales.b. Halle e interprete los cuartiles de la distribución.c. Grafique el histograma, el polígono de frecuencias y la ojiva de la distribución. Comente la

    simetría de la distribución de tiempos.

    4. Los salarios que ofrece una empresa a los practicantes varían entre $180 y $300. Si los salarios seagrupan en cuatro intervalos de clase de longitudes iguales de manera que el 40% de los practi-cantes tienen salarios menores o iguales que $225, el 80% tienen salarios menores o iguales que$255 y el 15% tiene salarios mayores que $262,50.a. Hallar el porcentaje de practicantes en cada intervalo.b. Si el ingreso mínimo se fija en $265 y la empresa aumenta una misma cantidad a todos los

    practicantes de modo que el 25% supere el ingreso mínimo, ¿cuánto sería el aumento?

    5. El porcentaje de grasa corporal es el método más fiable para establecer el peso ideal de una per-sona pero es el más difícil y complicado de medir. En un grupo de hombres adultos se midió elporcentaje de grasa corporal obteniendo la tabla siguiente.

    Porcentaje de grasa [ 3 , 7 ] ]7 , 11] ]11,15] ]15,19] ]19,23] ]23,27]

    Frecuencia absoluta 16 66 44 60 10 4

    a. Grafique el polígono de frecuencias y la ojiva de la distribución.b. Calcule e interprete el coeficiente de variación.c. Halle e interprete los cuartiles de la distribución.

  • 8/18/2019 Manual de Estadistica_v2

    56/132

    Estadística EEGGLL 55

    Notas

    d. Se considera que un hombre tiene sobrepeso si tiene un porcentaje de grasa corporal mayora 18%. ¿Qué porcentaje de entrevistados tuvo sobrepeso?

    6. La anchoveta es el pez más importante del ecosistema de la Corriente de Humboldt. Su abundan-cia ha permitido el desarrollo y sustento de muchas otras especies de peces, aves, mamíferos einvertebrados que hoy en día habitan en nuestro mar. Una muestra de 250 anchovetas de un añode edad ha dado una longitud media de 11,24 cm. Los datos se muestran en la tabla.

    Tamaño (centí-metros)

    Marca declase

    Frecuenciaabsoluta

    Frecuenciarelativa

    Frecuencia absolutaacumulada

    Frecuencia relativaacumulada

    0,10

    65

    180

    30

    0,96

    17 0,04

    a. Determine de manera aproximada el porcentaje de anchovetas que miden entre 11 y 13centímetros.

    b. Calcule e interprete la mediana y el rango intercuartil de los tamaños de las anchovetas.c. Realice el diagrama de cajas del tamaño de las anchovetas.

    7. El porcentaje de germinación es uno de los principales factores para decidir la calidad de las se-millas. Un fabricante afirma que el porcentaje de germinación de sus semillas de maíz es del 85%.Para verificar tal afirmación, una cooperativa de agricultores seleccionó 120 muestras de 100 se-millas cada una y anotó el porcentaje de germinación en cada muestra. Los valores observadosse organizaron en la siguiente tabla.

    Germinación(%)

    Frecuencia abso-luta

    Frecuencia rela-tiva

    Frecuencia absolutaacumulada

    Frecuencia relativa acu-mulada

    [ 70 ; ] 10

    0,20

    0,70

    22

    ] ; 95 ] 2

    a. Complete la tabla y construya el histograma, el polígono y la ojiva correspondiente.b. Calcule la media, la mediana, y el coeficiente de variación de los porcentajes observados.c. Comente la afirmación del fabricante.

    8. En dos ríos de determinada región se han soltado crías de truchas marcadas y se han recogidomuestras de las mismas después de cierto periodo de tiempo. Se ha medido el peso (en gramos)

    de esos ejemplares resultando la tabla siguiente:

  • 8/18/2019 Manual de Estadistica_v2

    57/132

    Capítulo 1. Nociones de Estadística Descriptiva 56

    Notas

    Peso (en gramos) Número de peces del río 1 Número de peces del río 2

    [0 , 50] 14 11

    ]50 , 100] 31 23

    ]100, 150] 25 29

    ]150, 200] 18 22

    ]200, 250] 12 15a. ¿En qué río la distribución del peso resulta más homogénea?b. Calcule la mediana de los pesos de las truchas del río 1. Interprete el resultado.c. Grafique el polígono de frecuencias relativas de los pesos de las truchas del río 2.

    9. En los reportes estadísticos de una empresa, correspondientes al período de los últimos 100 días,se lee la siguiente información sobre el número de facturas diarias emitidas por la empresa endicho período.

    Número de facturas Frecuencia relativa

    [30 ; 60] 0,25 ]60 ; 90] 0,40

    ]90 ; 120] 0,20

    ]120 ; 150] 0,10

    ]150 ; 180] 0,05

    a. Graficar el polígono y la ojiva de la distribución. Además, calcule la media y la desviaciónestándar del número de facturas diarias emitidas por la empresa en dicho período.

    b. Calcule aproximadamente el porcentaje de días en los que fueron emitidas más facturas quela media.

    10. Se realizó una prueba de destreza manual entre los obreros de una fábrica. Se midió el númerode errores cometidos en la prueba, obteniéndose los siguientes resultados:

    Número de errores Número de obreros

    0 8

    2 16

    3 24

    5 12

    7 20

    a. Calcule el rango intercuartil y el coeficiente de variación del número de errores en la prueba.b. Grafique el diagrama de cajas correspondiente.

    11. En agosto del 2005, la empresa LibroOnLine dictó un curso sobre redes en computadoras me-diante dos sistemas: presencial y a distancia. Con el objetivo de comparar las notas promedio, lavariabilidad de los valores centrales y el rango de las notas, se tomó un examen final y se registrólos resultados en la siguiente distribución de frecuencias.

    Notas del examen final 3,5 9,5

    Frecuencia relativa (Sistema presencial) 0,14 0,10 0,12 0,23 0,27 a

    Frecuencia relativa (Sistema a distancia) 0,19 0,26 0,24 0,15 0,13 b

  • 8/18/2019 Manual de Estadistica_v2

    58/132

    Estadística EEGGLL 57

    Notas

    a. Realizar un gráfico que permita llegar al objetivo deseado y realizar dos conclusiones sobreel gráfico.

    b. Encontrar, en cada uno de los dos sistemas, el porcentaje de notas que son mayores que surespectiva media.

    12. Los pesos de una muestra de estudiantes se organizan en una distribución de frecuencias simé-

    trica:

    Intervalos Frecuencias absolutas Frecuencias relativas acumuladas

    5 0,96]60 ; 70]

    n = 50

    a. Graficar el histograma y el polígono de frecuencias.b. Calcular la media, la mediana, la moda y la desviación estándar.

    13. Se aplicó un cuestionario a 16 trabajadores de una gran empresa y se obtuvieron los datos pre-sentados en la siguiente tabla:

    Código deltrabajador

    Gé-nero

    Año de naci-miento

    Nivel educa-tivo (años)

    Categoría la-boral

    Salario anual ac-tual en S/.

    Salario anual ini-cial en S/.

    9534 F 1966 10 Empleado 27,900 12,750

    2041 F 1960 12 Empleado 26,250 11,550

    1187 F 1952 16 Ejecutivo 41,500 18,750

    1842 F 1980 12 Empleado 24,000 12,750 1813 F 1960 12 Empleado 27,450 10,200

    2519 F 1979 12 Empleado 23,100 11,250

    3338 F 1985 16 Ejecutivo 37,050 18,000

    3012 F 1973 12 Empleado 24,450 12,450

    1056 M 1980 8 Empleado 28,350 12,000

    2087 M 1960 19 Directivo 95,000 56,980

    1004 M 1967 12 Empleado 30,900 15,000

    6589 M 1975 12 Empleado 26,700 14,500

    1723 M 1962 20 Directivo 69,250 42,800

    2013 M 1968 16 Directivo 48,200 21,000

    1096 M 1981 12 Empleado 27,900 16,500

    2873 M 1979 16 Ejecutivo 40,350 19,500

    (Género: F = Femenino, M = Masculino)a. Clasifique cada una de las variables e indique la escala de medición adecuada para cada caso.b. Calcule la moda, la media y la mediana de la variable nivel educativo y comente su simetría.c. Haga un gráfico que permita comparar el rango y los cuartiles de los salarios iniciales de los

    hombres y mujeres. Comente el gráfico.

  • 8/18/2019 Manual de Estadistica_v2

    59/132

    Capítulo 1. Nociones de Estadística Descriptiva 58

    Notas

    14. Se ha encuestado a un grupo de alumnos de una facultad de ingeniería sobre la cantidad de mi-nutos que usan al día la Internet obteniéndose los siguientes resultados.

    i Intervalo f i 1 [0 ; 18] 0,05482 0,19053 0,25004 0,28575 0,10716 0,07627 0,0357

    a. Calcule el tiempo mínimo para estar en el quinto superior de los que usan la Internet.b. Calcule el porcentaje de alumnos que usan una hora o menos la Internet.c. Encuentre la media y la varianza del número de minutos diarios que usan la Internet.

    15. En la siguiente tabla se muestra la distribución de frecuencias del número de hojas impresas porun grupo de impresoras durante un día:

    Intervalo Marca de clase Frecuencia relativa Frecuencia relativa acumulada

    [20 ; ] 0,20

    0,45

    0,60

    125

    0,10

    a. Complete la tabla de distribución de frecuencias y presente gráficamente la distribución defrecuencia relativa y de frecuencia relativa acumulada.

    b. Encontrar la media, mediana, la moda y la desviación estándar de la distribución.c. Hallar el porcentaje de impresoras que imprimen entre 70 y 115 hojas.

    16. Los siguientes datos representan la cantidad de bebida gaseosa en una muestra de 25 botellas dedos litros.

    1,928 1,946 1,984 2,013 2,045

    1,928 1,957 1,996 2,014 2,0661,938 1,969 1,997 2,014 2,0751,941 1,971 1,999 2,015 2,0861,941 1,973 2,003 2,034 2,088

    a. Las especificaciones del proceso de llenado de las botellas establecen que el contenido me-dio debe estar entre 1,950 y 2,050 litros y que la desviación estándar del contenido debe sermenor a 0,050 litros. A partir de los datos de la muestra, ¿diría usted que el proceso cumplelas especificaciones?

    b. Determine e interprete el rango y los cuartiles para la muestra de contenidos de gaseosa.

  • 8/18/2019 Manual de Estadistica_v2

    60/132

    Estadística EEGGLL 59

    Notas

    c. Construya un diagrama de cajas y comente la simetría de la distribución de los contenidosde gaseosa observados.

    17. En un estudio sobre consumo de petróleo en una gran ciudad se eligió dos grifos y se tomó unamuestra de 100 camiones en cada uno de ellos y se observó el número de galones que consumíanen un día, obteniéndose la siguiente distribución de frecuencias.

    Grifo A Grifo B

    Número de galones Número de camiones Número de galones Número de camiones

    1 ; 5 4 10 20

    5 ; 9 8 15 37

    9 ; 13 35 20 25

    13 ; 17 30 25 10

    17 ; 21 20 30 8

    21 ; 25 3

    a.

    ¿En cuál de los dos grifos el consumo de petróleo presenta mayor variabilidad?b. Realice un diagrama de cajas que permita comparar el consumo de petróleo de los dos grifos.

    18. Se tomó una muestra aleatoria de 80 viajes de la empresa de transporte interprovincial A y unamuestra aleatoria de 20 viajes de la empresa B. Las tablas siguientes muestran los datos del nú-mero de pasajeros por viaje de esas muestras.

    Número de pasajeros por viaje Empresa A

    [10 ; 14] 20

    ]14 ; 18] 30

    ]18 ; 22] 15 ]22 ; 26] 10

    ]26 ; 30] 5

    Número de pasajeros por viaje en la empresa B

    12 13 14 17 17 18 19 23 23 25

    26 26 27 27 30 31 32 32 34 34

    a. Grafique el polígono y la ojiva de las frecuencias relativas de la distribución del número de

    pasajeros por viaje de la empresa A.b. ¿Cuál empresa presenta mayor variabilidad en el número de pasajeros por viaje?

  • 8/18/2019 Manual de Estadistica_v2

    61/132

    Capítulo 1. Nociones de Estadística Descriptiva 60

    Notas

    19. La ojiva de los ingresos mensuales, en miles de nuevos soles, de una empresa se muestran en elsiguiente gráfico.

    a. Grafique el polígono de frecuencias relativas de los ingresos mensuales.b. Hallar la mediana y coeficiente de variación de los ingresos mensuales.c. Calcule e interprete el tercer cuartil de los ingresos mensuales.

    20. Se muestra la distribución de los asistentes a una charla informativa sobre un nuevo programa deespecialización ofrecido por cierta escuela de posgrado, según su profesión.

    Profesión Número de asistentes

    Ingeniería 24

    Administración 8

    Contabilidad 10

    Economía 15

    Derecho 3

    Total 60

    a. Construya un gráfico que permita observar la composición porcentual de los asistentes, se-gún sus profesiones, a la charla informativa. El gráfico debe tener un título adecuado.

    b. Calcule una medida de tendencia central para la variable cualitativa.

    21. Una compañía requiere los servicios de un técnico especializado. De los expedientes presentados,se han seleccionado 2 candidatos: A y B, los cuales reúnen los requisitos mínimos requeridos. Paradecidir cuál de los 2 se va a contratar, los miembros del jurado deciden tomarles 7 pruebas. Todas

    las pruebas se calificaron utilizando una escala de 0 a 80, donde 80 es el máximo puntaje posible.Los resultados se dan a continuación:

    Prueba 1 2 3 4 5 6 7

    Puntaje obtenido por A 57 55 54 52 62 55 59

    Puntaje obtenido por B 80 40 62 72 46 80 40

    a. Calcule e interprete la media y mediana de los puntajes de los