estadÍstica bÁsica i · estadÍstica bÁsica i mena, r. escobar, t. haro, e. córdova, m. merino,...

ESTADÍSTICA BÁSICA I

Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.

Página 1


AUTORES:

Ing. Rómulo Eduardo Mena Campaña, MBA.

Ing. Tania Eslavenska Escobar Erazo, MSc.

Ing. Edwin Ramiro Haro Haro, MBA.

Dra. Mayra Alexandra Córdova Alarcón, Mgst.

Ing. Víctor Marcelo Merino Castillo, Mgst.



Página 2

Rómulo Eduardo Mena Campaña

Tania Eslavenska Escobar Erazo

Edwin Ramiro Haro Haro

Mayra Alexandra Córdova Alarcón

Víctor Marcelo Merino Castillo


ISBN-978-9942-21-953-4



Página 3

CONTENIDO

1 CAPÍTULO I: LA ESTADÍSTICA Y LA DESCRIPCIÓN DE

DATOS ................................................................................ 10

OBJETIVOS ........................................................................... 10

1.1 CONCEPTOS BÁSICOS. ................................................... 10

1.1.1 ESTADISTICA ..................................................................... 10

1.1.2. IMPORTANCIA Y ÁMBITO ...................................................... 11

1.1.3. DATOS ESTADÍSTICOS ........................................................ 12

1.1.4 MÉTODOS ESTADÍSTICOS .................................................... 15

Recolección (medición) ______________________________ 15

Recuento (cómputo) ________________________________ 16

Presentación ______________________________________ 16

Síntesis __________________________________________ 16

Análisis. _________________________________________ 17

1.2. POBLACIÓN Y MUESTRA ................................................ 17

1.2.1. POBLACIÓN ........................................................................ 17

1.2.2. MUESTRA ........................................................................... 18

1.3. CLASIFICACIÓN ESTADÍSTICA ....................................... 19

1.3.1. ESTADÍSTICA DESCRIPTIVA ................................................. 19

1.3.2. ESTADÍSTICA INFERENCIAL.................................................. 19

1.4 LA INVESTIGACIÓN ESTADÍSTICA ................................. 19

1.4.1 PLANEAMIENTO................................................................... 20

El objeto de la investigación __________________________ 20

La finalidad. ______________________________________ 20



Página 4

La fuente de información. ____________________________ 21

Los procedimientos de investigación. ___________________ 22

Sistemas de investigación ___________________________ 22

El material estadístico ______________________________ 24

El costo y su financiación. ___________________________ 25

1.4.2 RECOLECCIÓN .................................................................... 25

1.4.3 CRÍTICA Y CODIFICACIÓN .................................................... 25

1.4.4 TABULACIÓN Y PROCESAMIENTO .......................................... 26

1.4.5 ANÁLISIS E INTERPRETACIÓN .............................................. 27

1.4.6 PUBLICACIÓN ..................................................................... 27

1.5 TABLAS ESTADÍSTICAS .................................................. 28

1.5.1 PARTES DE UNA TABLA ........................................................ 29

Numeración de las tablas ____________________________ 29

Títulos de tablas ___________________________________ 30

Cuerpo de una tabla: _______________________________ 30

Notas de la tabla. __________________________________ 30

Tablas de otras fuentes. _____________________________ 31

1.5.2 TIPOS DE TABLAS ............................................................... 31

Tablas de una entrada. ______________________________ 31

Tablas de dos entradas. _____________________________ 32

Tablas complejas: __________________________________ 32

1.6 GRÁFICOS ESTADÍSTICOS ............................................. 34

1.6.1 GRÁFICAS LINEALES............................................................ 35

1.6.2 GRÁFICOS DE SUPERFICIE ................................................... 36

1.6.3 OTROS ............................................................................... 37



Página 5

Gráficos XY (de dispersión): __________________________ 37

Gráficos de área ___________________________________ 38

1.7 DISTRIBUCIONES UNIDIMENSIONALES DE FRECUENCIAS

39

1.7.1 DISTRIBUCIONES DE FRECUENCIAS PARA DATOS

CUANTITATIVOS ....................................................................................... 40

Pasos para elaborar una distribución de frecuencias _______ 41

1.8 DIAGRAMAS DE FRECUENCIAS ....................................... 49

1.8.1 DATOS CORRESPONDIENTES A UN CARÁCTER CUALITATIVO .... 49

Diagrama de barras. ________________________________ 50

Gráficas en forma de pastel. _________________________ 50

1.8.2 DATOS CORRESPONDIENTES A UN CARÁCTER CUANTITATIVO

DISCRETO 51

Diagrama de barras ________________________________ 51

Diagrama en forma de pastel _________________________ 52

1.8.3 DATOS CORRESPONDIENTES A UN CARÁCTER CUANTITATIVO

CONTINUO 53

Histograma _______________________________________ 54

Polígono _________________________________________ 55

Ojiva ____________________________________________ 55

2 CAPÍTULO II: ANÁLISIS ESTADÍSTICO SIMPLE ....... 57

OBJETIVOS ........................................................................... 57

2.1 INTRODUCCIÓN ............................................................. 57

2.2 TIPOS DE ESTADÍGRAFOS .............................................. 57



Página 6

2.3 ESTADÍGRAFOS DE TENDENCIA CENTRAL ...................... 58

2.3.1 MEDIA ARITMÉTICA ............................................................. 59

Media aritmética con datos no agrupados _______________ 59

Media aritmética con datos agrupados __________________ 63

2.3.2 MEDIA PONDERADA ............................................................. 67

2.3.3 LA MEDIANA ....................................................................... 68

Mediana de datos no agrupados _______________________ 68

Mediana de datos agrupados _________________________ 71

2.3.4 MODA ................................................................................ 75

Moda de datos no agrupados _________________________ 75

Moda de datos agrupados ___________________________ 77

2.3.5 MEDIA GEOMÉTRICA ........................................................... 79

2.3.6 MEDIA ARMÓNICA ............................................................... 83

2.4 FORMA DE LA DISTRIBUCIÓN ........................................ 85

2.4.1 RELACIÓN ENTRE MEDIA ARITMÉTICA, MEDIANA Y MODA ........ 85

2.5 CUARTILES, DECILES Y PERCENTILES ............................ 90

2.5.1 Medidas de posición relativa ................................................. 91

Los Cuartiles ______________________________________ 91

Los Deciles _______________________________________ 91

Los Percentiles ____________________________________ 91

2.6 ESTADÍGRAFOS DE DISPERCIÓN ................................... 99

2.6.1 DISPERCIÓN ABSOLUTA ....................................................... 99

Rango ___________________________________________ 99

Desviación media _________________________________ 101

Varianza ________________________________________ 104



Página 7

Desviación estándar _______________________________ 108

2.6.2 DISPERCIÓN RELATIVA ...................................................... 110

Coeficiente de variabilidad __________________________ 110

2.7 MEDIDAS DE ASIMETRÍA ............................................. 113

2.8 MEDIDAS DE APUNTAMIENTO O CURTOSIS ................. 116

3 CAPÍTULO III: NÚMEROS ÍNDICES ........................ 120

OBJETIVOS ......................................................................... 120

3.1 INTRODUCCIÓN ........................................................... 120

3.2 CARACTERÍSTICAS ...................................................... 120

3.3 CLASIFICACIÓN DE LOS NÚMEROS ÍNDICES................ 120

3.3.1 NÚMEROS ÍNDICES DE PRECIOS ......................................... 120

3.3.2 NÚMEROS ÍNDICES DE CANTIDAD ...................................... 121

3.3.3 NÚMEROS ÍNDICES DE VALOR ............................................ 121

3.4 NÚMEROS ÍNDICES SIMPLES ....................................... 121

3.5 NÚMEROS ÍNDICES NO PONDERADOS ........................ 122

3.5.1 PROMEDIO SIMPLE DE LOS ÍNDICES DE PRECIOS ................. 122

3.5.2 ÍNDICE AGREGADO SIMPLE ................................................ 124

3.6 NÚMEROS ÍNDICES PONDERADOS .............................. 124

3.6.1 ÍNDICE DE LAYSPEYRES ..................................................... 125

3.6.2 ÍNDICE DE PAASCHE ......................................................... 126

3.6.3 ÍNDICE DE FISHER ............................................................ 127

3.7 ÍNDICES DE VALOR ...................................................... 127



Página 8

4 CAPÍTULO IV: REGRESIÓN. CORRELACIÓN Y SERIES

DE TIEMPO ....................................................................... 129

OBJETIVOS ......................................................................... 129

4.1 ANÁLISIS DE CORRELACIÓN ........................................ 129

4.1.1 VARIABLE DEPENDIENTE: .................................................. 129

4.1.2 VARIABLE INDEPENDIENTE: ............................................... 129

4.1.3 COEFICIENTE DE CORRELACIÓN ......................................... 129

4.1.4 CÁLCULO DE COEFICIENTE DE DETERMINACIÓN ................... 133

4.2 ANÁLISIS DE REGRESIÓN ............................................ 134

4.2.1 PRINCIPIO DE LOS MÍNIMOS CUADRADOS ........................... 134

4.2.2 TRAZO DE LA LÍNEA DE REGRESIÓN .................................... 137

4.2.3 EL ERROR ESTÁNDAR DE LA ESTIMACIÓN ............................ 138

4.3 FUNDAMENTOS PARA EL ANÁLISIS DE UNA SERIE DE

TIEMPO ................................................................................... 139

4.4 COMPONENTES DE UNA SERIE DE TIEMPOS ................. 139

4.4.1 TENDENCIA SECULAR ........................................................ 139

4.4.2 VARIACIÓN CÍCLICA .......................................................... 141

4.4.3 VARIACIÓN ESTACIONAL ................................................... 142

4.4.4 VARIACIÓN IRREGULAR ..................................................... 143

4.5 MEDICIÓN DE TENDENCIAS ......................................... 143

4.5.1 TENDENCIA LINEAL ........................................................... 143

Método de libre ajuste _____________________________ 143

Método de mínimos cuadrados _______________________ 145



Página 9

4.5.2 MÉTODO DEL PROMEDIO MÓVIL ......................................... 147

4.5.3 MÉTODO DEL PROMEDIO MÓVIL PONDERADO ...................... 151



Página 10

1 CAPÍTULO I: LA ESTADÍSTICA Y LA

DESCRIPCIÓN DE DATOS

OBJETIVOS

1. Saber qué significa estadística.

2. Exponer el ámbito de aplicación y la importancia de la estadística.

3. Diferenciar entre una variable cualitativa y una variable cuantitativa.

4. Distinguir entre una variable discreta y una variable continua.

5. Diferenciar entre niveles de medición nominal, ordinal, por intervalo y de razón.

6. Explicar qué es estadística descriptiva y estadística inferencial. 7. Realizar pequeñas investigaciones estadísticas, aplicando las

etapas del proceso de investigación. 8. Aplicar la metodología en la elaboración de tablas de distribución

de frecuencias. 9. Seleccionar y elaborar figuras que visualicen la información de

las tablas. 10. Analizar y obtener conclusiones sobre la información

contenida en las tablas y gráficas.

1.1 CONCEPTOS BÁSICOS.

1.1.1 ESTADISTICA

En esta unidad revisaremos algunos conceptos útiles los cuales le servirá al estudiante formarse una idea de los términos más

usados en el estudio de la estadística.

Una definición clara y sencilla señala que, la estadística es la

ciencia que recoge, organiza, presenta, analiza e interpreta datos con el fin de propiciar una toma de decisiones más eficaz (Lind,

Marchal, & Wathen, 2012).

Ciro Martínez, al presentar el significado de la palabra estadística

señala que, es un sistema o método usado para la recolección,

organización, análisis y descripción numérica de la información.



Página 11

También se puede decir que la estadística estudia el comportamiento de hechos o fenómenos de grupo (Martínez,

2012).

Otra definición muy sucinta indica que, la estadística es el arte y

la ciencia de recolectar, analizar, presentar e interpretar datos (Anderson, Sweeney, & Williams, 2008).

El término estadística proviene del latín statisticum collegium (“consejo de Estado”) y de su derivado italiano statista (“hombre

de Estado o político”). En 1749, el alemán Gottfried Achenwall

comenzó a utilizar la palabra alemana statistik para designar el análisis de datos estatales. Por lo tanto, los orígenes de la

estadística están relacionados con el gobierno y sus cuerpos administrativos (Definición.de, 2015).

Por lo anterior, teniendo en cuenta las bondades que aportó la estadística a la gestión de los estados; las empresas y personas, la

han aprovechado y en la actualidad no existe campo de estudio en la que la estadística se encuentre ausente.

1.1.2. IMPORTANCIA Y ÁMBITO

En nuestra vida cuotidiana, cuando revisamos periódicos, revistas, internet, al mirar los noticieros en televisión, nos

encontramos con tablas, gráficos, medidas, análisis e interpretaciones que nos dan cuenta de lo que pasa en nuestro

contexto y en distintos lugares del planeta. Podemos enterarnos, que está ocurriendo en el campeonato nacional de futbol, qué

equipos ocupan las primeras posiciones en la tabla, cuáles ocupan las últimas posiciones; en el ámbito artístico, cuáles son las

preferencias musicales de los jóvenes de 10 a 15 años, o de 16 a 25 años, por supuesto, se encontrarán diferencias; en el ámbito

profesional, cuáles son las tendencias de estudios universitarios

más demandadas, cuáles son las profesiones más rentables; en los dispositivos tecnológicos, cuáles son las necesidades actuales de

equipos, las preferencias de un grupos de jóvenes, las necesidades de los universitarios, de las amas de casa, de los hombres y

mujeres de negocios, etc.

Pero no solo podemos encontrar necesidades de personas

naturales; las personas jurídicas, esto es negocios y empresas, pequeñas y grandes, también necesitan información para enrumbar

su actividad a aquello que les permita producir más, cubrir mayores



Página 12

mercados, incrementar su patrimonio, incrementar su utilidad, cómo se encuentra evolucionando la demanda el mercado de los

bienes que producen, cuál es la evolución de los precios, cuál es la participación de la empresa o producto en el mercado, si existen

posibilidades de expansión, si las ventas en cantidad y en dólares se encuentran en franco ascenso o descenso, si existirá la

posibilidad de aplicar estrategias que mejoren las ventas, la apertura para nuevos mercados, para nuevos productos, etc.

Pero la estadística no solo es útil para el desempeño de la vida

cuotidiana y de los negocios; sino que ésta va más allá de ellos, las diferentes ciencias se han desarrollado mediante la utilización de la

estadística como: las médicas, que nos da cuenta de la evolución de las enfermedades, la eficacia de los medicamentos y

tratamientos, el porcentaje de éxito en determinado tipo de cirugía, la frecuencia de las enfermedades, sus índices de

mortalidad, etc.; las ciencias sociales la cual involucra a los ámbitos: educativo, que nos permite conocer los índices de estudio

escolarizado, alfabetismo, analfabetismo; la psicología, que contribuye al conocimiento del comportamiento de los individuos y

sus aptitudes, la sociología en la evolución y desarrollo de las culturas y sociedades, la economía contribuye con estudios tanto

microeconómicos como macroeconómicos; y más ámbitos tales como demografía, administración pública, historia, geografía,

antropología, etc.

Como se habrá dado cuenta, el ámbito de aplicación de la estadística es extenso, por su muy diverso uso y su necesaria

actualización. La toma de decisiones acertadas son realizadas con información, su validez y confiabilidad se sujetan a los instrumentos

y técnicas estadísticas utilizadas en la investigación de interés.

1.1.3. DATOS ESTADÍSTICOS

Los datos son hechos, informaciones y cifras que se recogen,

analizan y resumen para su presentación e interpretación. A todos los datos reunidos para un determinado estudio se les llama

conjunto de datos para el estudio (Anderson, Sweeney, & Williams, 2008).Como por ejemplo si considera:

Variable Conjunto de datos Edad (en años) {1, 2, 3, ⋯ } Número de hijos {0, 1, 2, ⋯ }



Página 13

Estatura (en centímetros) {150, 162,173, ⋯ } Estado civil {𝑠𝑜𝑙𝑡𝑒𝑟𝑜, 𝑐𝑎𝑠𝑎𝑑𝑜, 𝑑𝑖𝑣𝑜𝑟𝑐𝑖𝑎𝑑𝑜, ⋯ } Grupo sanguíneo {𝐴, 𝐵, 𝐴𝐵, 𝑂}

VARIABLE. Una variable es una característica de los elementos que es de interés (Anderson, Sweeney, & Williams, 2008). Las

cifras o información que conforma un conjunto de datos, son obtenidas cuando se averigua una variable, a los elementos o

individuos sujetos en un estudio de investigación.

Como se observa en los ejemplos de: edad, número de hijos,

estatura, estado civil, grupo sanguíneo; se tienen variables de dos clases de datos, los cuantitativos y cualitativos.

1. Datos cuantitativos. Son expresados numéricamente y nos dan una idea de cantidad, dimensión, duración, distancia, etc.

2. Datos cualitativos. Son conocidos también como datos de atributo, agrupan a una población o muestra en características

semejantes, pero no tienen medidas numéricas; se encuentran comprendidas por etiquetas o nombres que identifican el atributo

de cada elemento, Como en el caso de la variable estado civil, el

dato de respuesta podría ser: soltero, casado, viudo, divorciado, etc.

De acuerdo a la naturaleza de los datos se debe escoger el método apropiado para resumir la información, determinar las

medidas adecuadas y realizar sus correspondientes análisis. Para ello es necesario clasificar a las variables en dos tipos.

1. Variables cuantitativas. Se encuentran en este grupo aquellas que pueden medirse, cuantificarse, permiten una descripción o

representación numérica. Estas variables atendiendo a los valores que pueden tomar se clasifican en variables discretas y

continuas.

a. Variable discreta. Se refiere a aquella que sólo puede tomar valores enteros, esto es: 1, 2, 3, etc., tal es el caso del

número de hijos por familia, número de televisores en un

hogar, etc. b. Variable continua. Toma todos los valores posibles en un

intervalo, es decir, se admiten valores fraccionarios, como el número de años de una persona: 20 años, tres meses, cinco



Página 14

días, valor pagado por impuesto a la renta de un profesional o empresa, etc.

2. Variables cualitativas. Estas variables agrupan cualidades o

atributos, en la que los casos de estudio pueden formarse dos grupos como: hombre – mujer, estudiante – no estudiante, con

empleo – sin empleo, etc. Pero también estas variables pueden conformar más de dos grupos como; al estudiar el grupo

sanguíneo de los individuos se tendrá: A, B, AB y O (cuatro

grupos); el estado civil de las personas se tendrá soltero (a), casado (a), divorciado (a), viudo (a) y unión de hecho, etc.

Según sea de un tipo u otro, la variable podrá medirse de distinta manera, esto es, tendrán distintas escalas o niveles de

medición.

En las variables cualitativas los datos son de nivel nominal y

ordinal.

a. Datos de nivel nominal. Los datos de los elementos sujetos de

análisis se encuentran representados por nombres, admiten una clasificación, sin que ello signifique un orden lógico. Como

ejemplos serían: Países que integran el pacto andino, género de los estudiantes de un curso de estadística, marca de

automóviles, etc. b. Datos de nivel ordinal. Los datos de los elementos sujetos de

análisis se disponen de acuerdo a un orden que se encuentra

especificado, razón por lo que los datos se pueden clasificar y ordenar. Como ejemplo, las calificaciones cualitativas asignadas

por el profesor de estadísticas a los trabajos presentados por los estudiantes serían: excelente, muy bueno, bueno, regular y

malo. Tabla de posiciones de los equipos que intervienen en el campeonato ecuatoriano de futbol de la serie A, se tendría

primero, segundo, tercero, … ,etc.

En las variables cuantitativas los datos son de nivel de intervalo

y de razón.

a. Datos de nivel de intervalo. Identifica la posición ordinal de cada

elemento sujeto de análisis y las diferencias entre intervalos es la misma. Ejemplos de datos de intervalo son la temperatura

ambiental observada en la escala de grados centígrados, las tallas de las diferentes prendas de vestir, etc.



Página 15

b. Datos de nivel de proporción: Identifica la posición ordinal de cada elemento sujeto de análisis, las distancias de cada intervalo

es la misma, se basa en un sistema numérico en la que el cero es significativo y las operaciones de multiplicación y división

tienen un resultado racional. Ejemplos de esto se tiene a: las ventas en dólares de un establecimiento comercial, en donde el

cero representa que en ese día no ha existido ventas, costos, rentabilidad, participación en el mercado, etc.

1.1.4 MÉTODOS ESTADÍSTICOS

El método estadístico según se le atribuye a Jesús Reynaga, profesor de Salud Pública de la Facultad de Medicina, UNAM,

consiste en una serie de procedimientos para el manejo de los datos cualitativos y cuantitativos de la investigación.

Las características que adoptan los procedimientos propios del

método estadístico dependen del diseño de investigación seleccionado para la comprobación de la consecuencia verificable en

cuestión.

El método estadístico tiene las siguientes etapas:

Recolección (medición) Recuento (cómputo)

Presentación Descripción

Análisis

Tales etapas siempre se encuentran en el orden descrito y cada una de ellas consiste de manera resumida en lo siguiente:

Recolección (medición)

En esta etapa se recoge la información cualitativa y cuantitativa señalada en el diseño de la investigación.

La recolección o medición puede realizarse de diferentes maneras: a veces ocurre por simple observación y en otras

ocasiones requiere de complejos procedimientos de medición

La calidad técnica de esta etapa es fundamental ya que de ella depende que se disponga de datos exactos y confiables en los

cuales se fundamenten las conclusiones de toda la investigación.



Página 16

En ocasiones, la recolección de la información debe ocurrir en grupos tan grandes de individuos que se hace imposible tratar de

abarcar a todos ellos; entonces es cuando se pone en práctica procedimientos de muestreo.

Tales procedimientos de muestreo están subordinados a la consecuencia verificable que se desea comprobar y al diseño de

investigación seleccionado.

Recuento (cómputo)

En ésta etapa del método estadístico, la información recogida es

sometida a revisión clasificación y cómputo numérico.

A veces el recuento puede realizarse de manera muy simple, por ejemplo con rayas o palillos; sin embargo, puede requerirse el

empleo de computadoras y programas especiales para el manejo de base de datos.

En términos generales puede decirse que el recuento consiste en la cuantificación de la frecuencia con que aparecen las diferentes

características medidas de los elementos en estudio; por ejemplo, el número de personas de sexo femenino y el de personas de sexo

masculino; o, el número de niños con peso menor de 3 kilos y el número de niños con peso igual o mayor a dicha cifra.

Presentación

En esta etapa del método estadístico, se elaboran las tablas y figuras, las cuales permiten una inspección precisa y rápida de los

datos. La elaboración de tablas tiene por propósito acomodar los datos de manera que se pueda efectuar una revisión numérica

precisa de los mismos. La elaboración de figuras tiene por propósito facilitar la inspección visual rápida de la información.

Síntesis

En esta etapa la información, es resumida en forma de medidas

que permiten expresar de manera sintética las principales propiedades numéricas de grandes series o agrupamiento de datos.

Tales medidas de resumen, al ser comunicadas, permiten a los interlocutores evocar de una misma esencia de los datos; por

ejemplo, cuando alguien informa que el promedio de un grupo de alumnos es de 9.6 puntos en una escala que va del 0 al 10, la



Página 17

imagen que se transmite es de un grupo con buen aprovechamiento escolar.

Entre las principales medidas para sintetizar los datos cuantitativos se encuentra la moda y la amplitud, la mediana y los

percentiles y el promedio y la desviación estándar.

Análisis.

En esta etapa mediante fórmulas estadísticas apropiadas y el

uso de tablas específicamente diseñadas, se efectúa la comparación de las medidas de resumen previamente calculada. El análisis

estadístico de los datos consiste en la comparación.

Existen procedimientos bien establecidos para la comparación de las medidas de resumen que se hayan calculado en la etapa de

descripción. Tales procedimientos, conocidos como pruebas de análisis estadísticos cuentan con sus fórmulas y procedimientos

propios.

Cada prueba de análisis estadístico debe utilizarse siempre en

función del tipo de diseño de investigación que se haya seleccionado para la comprobación de cada consecuencia verificable

o deducible, a partir de la hipótesis general de la investigación.

Por lo anterior, puede considerarse a la estadística como una

disciplina que posee su propio método. Tal disciplina emplea conocimientos de otras ciencias como la lógica y la matemática; y

por eso, se dice que la estadística es una forma razonable de emplear el sentido común y la parte aritmética la complementa con

el manejo de datos de la investigación (Reynaga, 2015).

1.2. POBLACIÓN Y MUESTRA

1.2.1. POBLACIÓN

Es un conjunto de medidas o recuento de todos los elementos

que presentan una característica común (Martínez, 2012).

Un estudio poblacional equivale a una investigación total,

ejemplo de ello, en el Ecuador se realizó en noviembre del 2010 el Censo de Población y Vivienda, el cual consistió en un recuento de

la población y las viviendas para generar información estadística



Página 18

confiable, veraz y oportuna acerca de la magnitud, estructura, crecimiento, distribución de la población y de sus características

económicas, sociales y demográficas, que sirva de base para la elaboración de planes generales de desarrollo y la formulación de

programas y proyectos a cargo de organismos de los sectores público y privado (Instituto Nacional de Estadísticas y Censos,

2015).

1.2.2. MUESTRA

Es un conjunto de medidas o recuento de una parte de

elementos que pertenecen a la población de interés.

Para que una muestra sea representativa de una población, los

elementos deben ser seleccionados aleatoriamente, esto es, los elementos que se encuentran en la población, todos tienen la

misma oportunidad de ser elegidos en la muestra.

Un estudio muestral se justifica cuando el estudio poblacional se ve imposibilitado porque:

Las poblaciones son muy grandes o infinitas. El tiempo requerido es demasiado grande.

Los costos son elevados que imposibilita la ejecución de la investigación.

Existe limitación en la disponibilidad del recurso humano. Debido a la naturaleza destructiva de los elementos sujetos a

estudio. La homogeneidad de la característica.

Parámetro. Es una característica medida de una población

completa, por ejemplo: la proporción de alumnos de más de 21 años que ingresan a la universidad. En estadística se asignan

símbolos del alfabeto griego para designar un parámetro

(Slideshare, 2015).

Estimador. Es la medida de una característica relativa a la

muestra, al valor promedio de los datos y la imagen de éstos; la mayoría de los estadísticos muestrales se encuentran por medio de

fórmulas y suelen asignárseles símbolos del alfabeto latino (Slideshare, 2015).



Página 19

1.3. CLASIFICACIÓN ESTADÍSTICA

1.3.1. ESTADÍSTICA DESCRIPTIVA

Es el conjunto de técnicas que se encargan de organizar,

resumir, presentar y describir los datos de manera informativa. Los medios útiles para la presentación y descripción de datos son: las

tablas de frecuencia, los gráficos, el cálculo de medidas de tendencia central, de posición, de variabilidad, etc.

1.3.2. ESTADÍSTICA INFERENCIAL

Es el conjunto de técnicas que se encargan de estimar los parámetros poblacionales a partir de una muestra. La exactitud de

la estimación depende de las técnicas estadísticas usadas y del cuidado con que se tomó la muestra. La diferencia entre el

estadístico de la muestra y el parámetro de la población se denomina error muestral.

1.4 LA INVESTIGACIÓN ESTADÍSTICA

En nuestra vida cuotidiana o laboral nos encontramos en la

necesidad de contar con información estadística para una adecuada toma de decisiones. En una variedad de ocasiones podremos

encontrar la información requerida y elaborada usualmente por instituciones estatales (información secundaria) que para el caso

ecuatoriano lo realiza el Banco Central del Ecuador, Instituto Ecuatoriano de Estadísticas y Censos, Registro Civil, Identificación y

Cedulación, los diversos Ministerios que elaboran estadísticas en su ámbito de acción (educación, salud, vivienda, trabajo, etc.); así

también, se puede obtener información de entidades privadas como periódicos, revistas y páginas web especializadas (economía,

finanzas, educación, industrial, empresarial, emprendimientos, etc.).

En otras ocasiones, habrá la necesidad de realizar una investigación con el objeto de obtener la información necesaria para

el conocimiento y toma de decisiones adecuadas al interés

personal, laboral o empresarial. A la hora de realizar una investigación, el método estadístico es la herramienta adecuada

para la recolección de la información mediante registros, que se ordenan, clasifican, cuantifican y se muestran mediante tablas y



Página 20

gráficos, de forma clara, resumida y fácil de interpretar grandes cantidades de información (Martínez, 2012).

Otras necesidades de información, son aquellas que se obtienen en orden cronológico, tales como las temperaturas registradas en

las diferentes ciudades del Ecuador a una hora determinada de cada día, número de accidentes de tránsito por provincia y periodo

mensual, precio promedio mensual de la canasta básica para el consumidor, exportaciones e importaciones en periodos mensuales

del Ecuador, ventas diarias registradas en determinado negocio o

empresa, inventarios o utilidades al finalizar el año, etc.

Ciro Martínez, señala que el proceso de investigación estadística

consta de seis fases.

1.4.1 PLANEAMIENTO

Un plan de investigación debe contemplar lo siguiente:

El objeto de la investigación

Es el hecho o fenómeno que se va a observar o registrar

numéricamente. Ejemplo. Una investigación sobre los salarios. El

objeto de la investigación responde a la pregunta ¿qué se va a investigar?

La finalidad.

Al analizar que se va a investigar se propone definir el objeto de investigación, determinar la naturaleza cuantitativa y cualitativa,

determinar la posibilidad de su investigación y limitar el objeto investigable, con los que se responde el por qué:

Definir el objeto de la investigación. Es la fijación precisa del concepto de o que se aspira indagar. Decir con claridad y

exactitud lo que la estadística va a recoger. La unidad o elemento de investigación debe ser: clara, adecuada,

mensurable y comparable. Determinar su naturaleza cuantitativa o cualitativa del objeto de

la investigación. Esto es, establecer si la variable investigada es de naturaleza numérica (cuantitativa) o de atributo (cualitativa).

Determinar la posibilidad de investigación. Es necesario

examinar si el objeto de la investigación pueden ser conocidas



Página 21

con precisión, si se exteriorizan, si pueden contarse si admiten su existencia y su intensidad.

Limitar el objeto investigable. Por imposibilidad o por ser innecesaria la observación completa, la estadística reduce sus

trabajos a un doble aspecto. El primero limitando el objeto de la investigación y segundo limitando el campo de la investigación.

La limitación de la investigación puede darse de manera coordinada en función del tiempo, espacio, número, etc.

La fuente de información.

A continuación es necesario identificar en dónde se obtener

información de la investigación y si aquellas fuentes son de naturaleza directa o indirecta.

Las investigaciones directas se recogen los datos de un acontecimiento de cualquier índole, cuando acudimos a él, lo

observamos y anotamos su presencia o su ausencia y su intensidad mediante números. Por tanto se llamará fuente de información

estadística directa allí donde el hecho sujeto de la investigación se produce, como por ejemplo, la familia, la empresa, la fábrica, los

costos, los precios, etc.

Las investigaciones indirectas son cuando se recurren a un

hecho distinto del que se está interesado, para después deducir de éste el valor del que en definitiva se desea conocer. Son

inducciones lógicas, cálculos aproximados, estimaciones que constantemente se realizan en los negocios. Ejemplos de estos

pueden ser: la estimación de la cosecha en base a la siembra de un

producto agrícola, el cálculo poblacional en una fecha intermedia se determina en base a dos censos, las necesidades de llantas se

calculan en base a la cantidad de autos en circulación en un estado o región, etc. Las fuentes de información indirectas son aquellas

donde el hecho investigado se manifiesta indirectamente o donde se refleja.

También pueden clasificarse a las fuentes de información como primaria, cuando se obtiene directamente de la investigación,

realizada usualmente a través de una encuesta, y secundaria, cuando se trata de información complementaria, publicada por la

misma institución o cualquier otra.



Página 22

Los procedimientos de investigación.

Señala las normas que determinan el cómo debe realizarse la

investigación; estas se resumen en los siguientes puntos.

Claridad y publicidad. Toda investigación debe ser clara y

conocida por observadores y observados. La claridad debe estar presente en todo el proceso de investigación.

Sencillez. Debe estar presente en: los formularios, las instrucciones, en el proyecto, en la finalidad, en las tablas, en los

gráficos, en los comentarios y análisis, operaciones de cálculo, etc.

Utilidad. Toda estadística que se inicie debe tener alguna aplicación práctica de interés.

Las investigaciones pueden ser:

Ocasional. Si se da la recolección de datos en circunstancias

extraordinarias, cuando eventualmente se presenta un problema, o se agita su solución. Por ejemplo cuando se realiza

una investigación del costo de vida o de salarios cuando se plantea una huelga.

Periódica. Aquellas investigaciones que se repiten de tiempo en tiempo, en lapsos regulares. Ejemplos de ello se tiene los censos

en periodos decenales, las estadísticas de las industrias con periodicidad anual, los boletines de comercio exterior en forma

mensual, etc. Continua. Son estadísticas que se produce sin interrupción,

ejemplos de ellas se tiene a las demográficas como: la natalidad, la mortalidad, los matrimonios, tráfico por carreteras, etc.

Registro permanente. Aquellas que se registra a medida que el hecho tiene lugar. Por ejemplo los accidentes de tránsito,

suicidios, etc.

Sistemas de investigación

Se distinguen varios procedimientos de investigación, entre ellos

se tiene:

Las recopilaciones automáticas de datos por declaración espontánea del sujeto de la investigación, como inscripciones

obligatorias en los casos de natalidad, matrimonios, mortalidad, migración, comercio exterior, edificaciones, recaudación de

impuestos, etc.



Página 23

Las recopilaciones intencionales de datos, obtenidas mediante empleo de un agente que ex profeso vaya a la fuente de

información para registrar los datos, como en los casos de los censos de población y vivienda, encuestas de hogares sobre

ingresos y gastos, sobre las condiciones de una determinada industria, etc.

Investigaciones completas, son aquellas que recogen todos los datos, indagan todo el campo de observación, como todos los

balances de la banca, la producción de sal, la de cemento, de

transporte aéreo, que tiene lugar en una región o estado. Investigaciones incompletas, son las que sólo atienden a una

parte de las unidades estadísticas, bien por no ser posible recoger la totalidad de los datos, por no ser necesario para el fin

que se persigue. Si la estadística incompleta no es representativa del conjunto, no es típica para generalizar los

resultados parciales al conjunto de los casos. En caso contrario, cuando el círculo estudiado numéricamente puede sustituir al

total, la estadística incompleta es de extraordinaria utilidad. Las recopilaciones voluntarias de datos, frecuentemente se

llevan a cabo por las instituciones privadas y se refieren comúnmente a las monografías y encuestas científicas. La radio,

prensa y las revistas suelen invitar a sus lectores a opinar sobre algunos problemas candentes o a declarar un dato de su vida o

negocio particular.

Pues bien, de estos sistemas, el proyecto, para el caso

particular, tendrá que decir cuál interesa más y cuál debe emplearse.

Sobre la recolección de información, puede ser por correo, entrega personal del cuestionario y la entrevista; otros sistemas de

menor importancia corresponden a: internet, teléfono y panel. Todos estos presentan ventajas y desventajas, por ejemplo la

entrevista resulta más ventajosa por que proporciona un mayor número de cuestionarios recolectados, mayor número de

respuestas, permite aclarar el objetivo de la investigación y las dudas del informante; entre sus desventajas se tiene mayor costo,

más tiempo de recolección, alto número de encuestadores, etc.



Página 24

El material estadístico

Está constituido por los útiles, documentos o instrumentos

necesarios para llevar adelante la investigación. El material puede dividirse en impreso e instrumental.

Material impreso. Se refiere a los formularios o cuestionarios, boletines, hojas de inscripción, registros, circulares, pliegos de

instrucciones, etc.

Las normas de diseño y redacción de un formulario que se

someterá a discusión, pruebas y aprobación, son las siguientes.

Debe ser sucinto, limitado a las preguntas esenciales, las

necesarias para los fines de la investigación y que efectivamente pueda obtenerse de la fuente informativa.

Debe prescindirse de toda pregunta indiscreta que levante suspicacias y temores, o que moleste al investigado.

Debe ser claro, fácilmente comprensible, no ofrecer dudas en la

forma de contestar cada pregunta, que admita una sola interpretación.

Debe evitarse los juicios personales del investigador y del investigado, como cuando se deje a criterio del calificador juzgar

la importancia o la bondad de un hecho (grande, mediano o pequeño); (bueno, regular, malo).

También debe tenerse en cuenta, la clase de papel, su tamaño, la distribución de las partes del cuestionario, su impresión,

colores, el tiempo de llenado, etc.

Equipos. La recolección de datos y la elaboración posterior requieren de varios instrumentos, aparatos, máquinas y útiles, que

quien proyecta debe tener en cuenta, en su número y clase. Existen investigaciones que requieren de instrumentos especiales, sin los

que no se podrían recoger datos. En una investigación de

antropometría, requiere de escalas cromáticas de la piel, del pelo, de los ojos, cinta métrica, balanza, etc. Si se trata de llevar

estadísticas de una empresa sobre los horarios de entrada y salida del personal que labora o el de un aparcadero de autos, será

necesario contar con un reloj marcador. En un almacén, la estadística de ventas e ingresos se lleva en una caja registradora.



Página 25

El costo y su financiación.

La estimación previa de gastos y su financiamiento, constituye el

último punto del proyecto de investigación estadística. Estos gastos pueden ser atribuidos a estudios preliminares, asesorías, trabajos

geográficos, formulación del plan, plan de propaganda, impresión del formulario, selección y adiestramiento del personal,

contratación de servicios auxiliares, materiales y equipos, trabajo de campo, sistematización de la información y publicación.

Todo proyecto de esta clase debe ser discutido y aprobado por un grupo de técnicos en estadística y por peritos en la materia que

va a investigarse.

La consecución del financiamiento no debe dejarse para más

tarde de la etapa de preparación, su previsión debe abarcar la cantidad de dinero necesario hasta el final de la investigación.

Aprobado el plan con las modificaciones del grupo de técnicos y

peritos, se continúa con la ejecución del mismo.

1.4.2 RECOLECCIÓN

Preparado el proyecto de investigación es posible comenzar con la recolección de la información. La etapa de recolección comprende

aspectos tales como:

Distribución del material o instrumento de recolección.

La recolección propiamente dicha.

Control del número de formularios recolectados Control sobre la calidad de la información recolectada.

1.4.3 CRÍTICA Y CODIFICACIÓN

Es un conjunto de operaciones de revisión y corrección de la

información recolectada, que nos permita agruparla y procesarla,

de tal manera que se facilite la elaboración de tablas, gráficos y análisis, necesarios en su publicación.

El objeto de la crítica, es clasificar el material primario que precede de la misma investigación, en tres grupos: material bueno,

material incorrecto pero corregible y material incorregible o desechable.



Página 26

La necesidad de procesar la información recogida en los cuestionarios, ha obligado a traducir las respuestas en códigos. Por

ejemplo, el código para la pregunta estado civil, podría establecerse de la siguiente manera.

Tabla 1.

CÓDIGO DE ESTADO CIVIL DE LOS CIUDADANOS

ESTADO

CIVIL CÓDIGO

ESTADO

CIVIL CÓDIGO

Soltero 1 Viudo 4

Casado 2 Separado 5

Divorciado 3 Otro 6

Cuando el número de respuestas sobrepasa de 9, es preciso

utilizar cifras de dos dígitos, tal como:

Tabla 2.

CÓDIGO DE PROFESIONES DE LOS CIUDADANOS

PROFESIONES CÓDIGO

Abogado/a 01

Actor /Actriz 02

Agente de viaje 03

Arquitecto/ a 04

Astrónomo/a 05

⋮

Veterinario/a 35

1.4.4 TABULACIÓN Y PROCESAMIENTO

Puede ser manual, mecánica o computarizada y su elección

dependerá:

De la cantidad de formularios que se van a utilizar.

Del número de preguntas que tenga el formulario. Del tiempo y los recursos, ya sean financieros o de equipo

disponible.

Cuando la tabulación se acuerda desde el principio como parte integrante de la planeación general de la investigación, es de

suponer que todo el proceso será totalmente satisfactorio, sin

embargo, es necesario que sea revisado a fin de detectar inconsistencias que se presenten en el presente proceso o en



Página 27

procesos anteriores. Una vez elaboradas las correcciones, se procede a elaborar las tablas, gráficos, análisis, conclusiones y

recomendaciones, de ser el caso.

1.4.5 ANÁLISIS E INTERPRETACIÓN

El análisis de los datos tiene que ver con la formulación del

objetivo de la investigación y de las hipótesis establecidas; sin embargo, este proceso de análisis tendrá menos dificultad, si el

investigador tiene pleno conocimiento de los problemas que son inherentes al planteamiento de la investigación.

En este proceso, se debe considerar la elaboración de distribuciones o tablas de frecuencia obtenidas a través de una

sistematización de la información para poder ser presentada en forma de tablas y gráficos. Con los resultados anteriores se procede

a realizar un resumen y aplicar las diferentes medidas, a las que se

ha denominado estadígrafos cuando son aplicados a las características de las unidades de la muestra o como parámetros

aplicados a las características de la población, entre los que se tendrá en cuenta las medidas de dispersión, promedios, porcentajes

y proporciones.

Con las cifras resultantes, se pueden hacer comparaciones con

otros estudios o estudios anteriores, para llegar a mejores conclusiones.

1.4.6 PUBLICACIÓN

La publicación propone llegar a las personas interesadas, el resultado total del estudio, teniendo en cuenta todos los aspectos

considerados en el proceso, de tal forma que los datos sean comprensibles, con la correspondiente validez que merezcan las

conclusiones.

En términos generales se puede decir que un informe deberá

contener:

Planteamiento del problema.

Objetivo de la información. Hipótesis que se quiere probar.

Breve exposición de la metodología utilizada, diseño y tamaño de la muestra. Proceso de selección de las unidades de

información y recolección.



Página 28

Se podrá incluir en el informe, copia del formulario utilizado en la recolección de la información, aún relacionando y justificando,

en forma sucinta, las preguntas que se consideran más importantes dentro de la investigación.

Descripción de resultados en forma de tablas y gráficos, acompañados del análisis y comparaciones obtenidas a través de

los datos. Conclusiones y recomendaciones. Estas últimas cuando así lo

exija la investigación.

En algunos casos, el informe tiene una parte final, denominada apéndice, en donde se incluyen tablas más generales, que

permiten aclarar o comprobar rápidamente cualquier información más detallada. también puede incluir información

complementaria al informe.

1.5 TABLAS ESTADÍSTICAS

Al realizar una investigación estadística, lo más probable es que

se cuente con una gran cantidad de datos correspondientes a una variable de interés, por lo que será necesario tabularlos; es decir,

hay que confeccionar con ellos una tabla en la que aparezcan ordenadamente. Esto es los valores de la variable de interés o

estudio y el número de elementos o individuos de cada valor; es decir, su frecuencia.

En la sección 1.1.3 se realizó la distinción entre variables

cualitativas y cuantitativas. Recordando, la variable cualitativa o atributo, es de naturaleza no numérica, la cual puede clasificarse en

distintas categorías, no hay un orden particular en estas categorías. Ejemplos de datos cualitativos incluyen la afiliación política a los

distintos partidos existentes en el Ecuador como: Partido Renovador Institucional Acción Nacional, Partido Avanza, Partido Movimiento

Popular Democrático, Partido Sociedad Patriótica, Partido Socialista, Partido Social Cristiano, etc., el método de pago al comprar en

Supermercados La Favorita (SUPERMAXI): efectivo, cargo a tarjeta de débito, crédito, etc. Por otra parte, las variables cuantitativas

son de índole numérica. Ejemplos de datos cuantitativos relacionados con estudiantes universitarios incluyen: el precio de

los libros de texto, edad y horas que pasan estudiando a la semana, etc.



Página 29

1.5.1 PARTES DE UNA TABLA

Según el documento Introducción al estilo APA, 6ta. Ed.,

preparado por el Lic. Manuel De La Vega Miranda, de la Universidad Nacional abierta y a Distancia, enuncia a continuación los

elementos e instrucciones que se debe tener en cuenta para la elaboración de tablas estadísticas (De La Vega, 2012).

Las normas APA, generalmente las tablas, exhiben valores numéricos exactos y los datos están dispuestos de forma

organizada en líneas y columnas, facilitando su comparación.

Las tablas son eficientes para presentar una gran cantidad de datos en un pequeño espacio. Si la tabla es corta (dos o menos

columnas y/o filas) se debe presentar textualmente la información.

De manera general la estructura de una tabla está conformada

por las partes señaladas en la figura 1.

Las tablas para su adecuada construcción debe observase los

siguientes puntos.

Numeración de las tablas

Las tablas deben ser enumeradas con números arábigos

secuencialmente dentro del texto y en su totalidad). Ej.: Tabla 1, Tabla 2, Tabla 3, etc. No utilice subíndices (3, 3a y 3b). Si la tabla

está dentro de un apéndice, use letras mayúsculas y números (Tabla B2)

Figura 1. Identificación de las partes que conforma una tabla estadística



Página 30

Títulos de tablas

El título de la tabla debe ser breve, claro y explicativo. Debe ser

puesto arriba de la tabla, en el margen superior izquierdo, debajo de la palabra Tabla (con la inicial en mayúscula) y acompañado del

número con que la designa. Si es necesario puede explicarse las abreviaturas dentro del mismo título [i.e., falsa alarma (FA)]

Relación entre tablas y texto. Las tablas complementan, no duplican el texto. Se escribe en el texto los elementos destacados de la

tabla. Al citar tablas en el cuerpo del texto, se escribe el número específico de la tabla. (ej.: como se muestra en la Tabla 1, Tabla 2,

Tabla3, etc. (la palabra Tabla inicia con mayúscula). No se escribe, “la tabla que se muestra arriba o abajo”, tampoco, “la tabla de la

página43”.

Relación entre tablas. Evite combinar tablas que repitan datos. Para

facilitar comparaciones, se debe ser consistente en la presentación

de todas las tablas. Se debe usar la misma terminología para todos los casos.

Encabezado. Establece la lógica para la organización de los datos. Identifica las columnas de datos debajo de ellos. Debe ser corto, no

más ancho que la columna que abarca.

Cuerpo de una tabla:

a. Valores enteros y/o decimales.

b. Celdillas vacías. Deje en blanco si no hay datos.

Inserte una raya (guion) si no se obtuvieron o no se informaron los datos.

c. Concisión. No incluya columnas de datos que puedan calcularse con

facilidad a partir de otras.

Notas de la tabla.

Las tablas presentan tres tipos de notas: generales, específicas y de

probabilidad.

Las notas son útiles para eliminar la repetición en el cuerpo de

una tabla. Se ubican en el margen izquierdo (sin sangría) debajo de

la tabla (entre la tabla y la nota se insertan dos espacios). Y deben ser ordenadas en esta secuencia: nota general, nota específica y



Página 31

nota de probabilidad, y cada tipo de nota debe ir en una línea nueva.

Nota general. Explica u ofrece informaciones relacionadas a la tabla como un todo, explica las abreviaturas, símbolos y afines

Nota específica. Se refieres a una columna, fila o ítem especifico. Debe ser indicada por letra minúscula sobrescrita (a, b, c).

Nota de probabilidad. Indica los resultados de pruebas significativos y se indican con asterisco sobrescrito (*). *p < .05,

**p < .01.

Tablas de otras fuentes.

Debe obtener la autorización de la fuente que posee la propiedad literaria (derecho de autor), para reproducir o adaptar una parte o

toda una tabla de otro autor.

Las tablas reproducidas de otra fuente, deben presentar debajo

de la tabla, la referencia del autor original, aunque se trate de una adaptación.

1.5.2 TIPOS DE TABLAS

Tablas de una entrada.

Se denominan de una entrada o de entrada simple, cuando

representan una sola variable o característica de la realidad. En la columna matriz van las clases en que se presenta las variaciones de

la característica en estudio.

Tabla 3.

ESTUDIANTES DE LA MODALIDAD A DISTANCIA DE LA FACULTAD DE

CIENCIAS ADMINISTRATIVAS DE LA UCE, SEGÚN EDAD DEL PERIODO ABR –

SEP DEL 2015.

EDAD (AÑOS

CUMPLIDOS) NÚMERO

18 – 27 1,146

28 – 37 573

38 – 47 291

48 – 57 113

MAS DE 57 52

TOTAL 2,175



Página 32

Tablas de dos entradas.

Son tablas en las que se presentan dos variables de la realidad,

las clases de una de ellas van en la columna matriz (vertical) y las clases de la segunda en el encabezado (horizontal).

Tabla 4.


CIENCIAS ADMINISTRATIVAS DE LA UCE, SEGÚN EDAD Y GÉNERO, DEL

PERIODO ABR – SEP DEL 2015.

EDAD (AÑOS CUMPLIDOS)

NÚMERO DE ESTUDIANTES TOTAL

Masculino Femenino

18 – 27 478 668 1146 28 – 37 243 330 573 38 – 47 158 133 291 48 – 57 67 46 113

MÁS DE 57 32 20 52

TOTAL 2,175

Tablas complejas:

Son tablas que presentan en forma simultánea tres o más

variables o características de la realidad en estudio, una va en la columna matriz y las otras en el encabezado. El uso de estas tablas

debe ser restringido, porque puede ser complicada su interpretación si representan muchas variables.

Tabla 5.


CIENCIAS ADMINISTRATIVAS DE LA UCE, SEGÚN EDAD, TIPO DE COLEGIO Y

GÉNERO, DEL PERIODO ABR – SEP DEL 2015.

EDAD (AÑOS CUMPLIDOS)

BACHILLERATO EN COLEGIO

TOTAL Fiscal Fisco misional Particular

Masculino Femenino Masculino Femenino Masculino Femenino

18 – 27 259 297 82 112 137 259 1,146

28 – 37 163 154 57 55 23 121 573

38 – 47 87 66 22 22 49 45 291

48 – 57 29 23 14 7 24 16 113

MÁS DE 57 15 12 9 3 8 5 52

TOTAL 553 552 184 199 241 446 2,175



Página 33

Ejemplo de aplicación 1

En el feriado del 10 de agosto del 2015, se preguntó a un total

de 1,000 residentes de la sierra ecuatoriana, ¿qué playa para vacacionar preferían? Los resultados fueron que a 200 les gustaba

más alguna de las playas de le provincia de Esmeraldas; a 300, alguna de las playas de la provincia de Manabí; a 400, alguna de

las playas de la provincia de del Guayas y a 100, alguna de las playas de la provincia de El Oro. Elabore una tabla con los puntos

sugeridos.

Solución Tabla 6

PREFERENCIA DE LOS CIUDADANOS DE LA SIERRA ECUATORIANA, SOBRE

LAS PLAYAS POR PROVINCIA EN LAS QUE LES GUSTA VACACIONAR, EN AGOSTO

DEL 2015.

PROVINCIA NÚMERO

Playas de Esmeraldas 200 Playas de Manabí 300 Playas de Guayas 400 Playas de El Oro 100

TOTAL 1,000


Se preguntó a 500 viajeros (as) de negocios frecuentes que

llegaron a la ciudad Quito, ¿qué hotel era de su preferencia?, los resultados fueron los siguientes: Casa Gangotena, 25; Swissotel,

100; Hilton Colón, 80; Best Western Premier, 120; Casa San Marcos Hotel, 45; el resto prefería JW Marriott Hotel. El 30% son

mujeres. a. Elabore una tabla de frecuencias la distribución por hotel y

género. b. Elabore una tabla de frecuencias la distribución por hotel,

género y región de origen (Porcentaje aproximado: costa

45%, sierra 35% y oriente 20%; aproxime al entero más cercano).

Solución

a) La tabla estará dispuesta por la primera columna con los

nombres de los hoteles que frecuentan los viajeros de negocios a



Página 34

la ciudad de Quito; las siguientes dos columnas identificarán el género de los viajeros; y una última columna por el total.

Tabla 7.

PREFERENCIA DE HOTELES DE VIAJEROS (AS) DE NEGOCIOS QUE LLEGAN A

QUITO, SEGÚN GENERO, EN AGOSTO DEL 2015.

HOTEL GÉNERO

TOTAL Femenino Masculino

Casa Gangotena 9 21 30 Swissotel 30 70 100 Hilton Colón 24 56 80 Best Western Premier 36 84 120 Casa San Marcos Hotel 12 28 40 JW Marriott Hotel 39 91 130

TOTAL 150 350 500

b) La tabla estará dispuesta al igual que la tabla 7, y además se

adicionará columnas que identifiquen las regiones del Ecuador continental.

Tabla 8

PREFERENCIA DE HOTELES DE VIAJEROS (AS) DE NEGOCIOS QUE LLEGAN A

QUITO, SEGÚN GENERO Y REGIÓN DE PROCEDENCIA, EN AGOSTO DEL 2015.

HOTEL

GÉNERO

TOTAL Femenino Masculino

Costa Sierra Oriente Costa Sierra Oriente

Casa Gangotena 4 3 2 10 7 4 30 Swissotel 14 11 5 31 25 14 100 Hilton Colón 11 8 5 25 20 11 80 Best Western Premier 16 13 7 38 29 17 120 Casa San Marcos Hotel 5 4 3 13 10 5 40 JW Marriott Hotel 18 14 7 41 32 18 130

TOTAL 68 53 29 158 123 69 500

1.6 GRÁFICOS ESTADÍSTICOS

En las investigaciones estadísticas, comúnmente se tendrá una gran cantidad de datos numéricos, con los que se tendrá elaboradas

tablas que resumen la información recolectada. A más de esto, es



Página 35

necesario contar con gráficas estadística, las cuales permiten tener información clara y rápida de lo obtenido en el estudio.

Existen varias gráficas para describir un conjunto de datos; dependiendo de lo que se requiera representar, cada una de ellas

es adecuada para un estudio determinado, ya que no siempre se puede utilizar la misma para todos los casos.

1.6.1 GRÁFICAS LINEALES

Se compone de una serie de datos representados por puntos, unidos por segmentos lineales. Mediante esta gráfica se puede

comprobar rápidamente el cambio de tendencia de los datos.

Los diagramas o gráficas lineales son de aplicación en las

denominadas series de tiempo o series cronológicas, donde una de las variables, por defecto, corresponde al tiempo (𝑋) (años, meses,

días, etc.) y la segunda es la variable investigada (Y) (Martínez,

2012).

Un ejemplo de gráficas lineales podría obtenerse con los datos

de la empresa ABC, en la que se señala los ingresos y costos anuales, que se muestran a continuación

Tabla 9.

INGRESOS Y COSTOS DE LA EMPRESA ABC EN LOS AÑOS 2004 A 2010.

AÑOS INGRESOS EN MILES

COSTOS EN MILES

2004 260 110 2005 380 200 2006 300 150 2007 620 420 2008 470 360 2009 720 510 2010 870 620

3,620 2,370

Si solo se quiere observar la evolución de los ingresos de la

empresa ABC, en una gráfica lineal, se presentaría de la siguiente manera.



Página 36

Figura 2. Evolución de los ingresos de la empresa ABC en los años 2004 a 2010

Si se representa, tanto los ingresos como los costos, en una

gráfica lineal, estos se representan en la misma forma que la gráfica anterior; además que se observarán las diferencias para

cada uno de los años; el espacio entre las líneas de costos e ingresos, representa la utilidad bruta anual. Observe las diferencias

que existen para los años 2008 y 2010, es claro que en el 2010, la utilidad es mayor.

Figura 3. Evolución de los ingresos y costos de la empresa ABC de los años

2004 a 2010.

1.6.2 GRÁFICOS DE SUPERFICIE

Este tipo de gráficos puede comparar varias series de datos, como novedad respecto al resto de gráficos. En este caso se

emplean distintos colores para diferenciar cada valor que

0

200

400

600

800

1000

2004 2005 2006 2007 2008 2009

E

N

M

I

L

E

S

$

AÑOS

0

100

200

300

400

500

600

700

800

900

1000

2004 2005 2006 2007 2008 2009 2010

E

N

M

I

L

E

S

$

AÑOS

INGRESOSEN MILES

COSTOSEN MILES

UTIL

IDAD



Página 37

corresponde a una unidad mayor. Si los datos están muy dispersos el gráfico será muy difícil de interpretar (Recursos para trabajos

administrativos, 2013).

Tabla 10.

INVENTARIO DE ARTÍCULOS PARA LA VENTA DE ALMACENES 1, 2 Y 3.

ALMACÉN 1 ALMACÉN 2 ALMACÉN 3

Tijeras 4 6 8

Bolígrafos 2 4 6

Carpetas 1.4 3 6

Lapiceros 4 6 8

Figura 4. Inventario de artículos para la venta de almacenes 1, 2 y 3.

1.6.3 OTROS

Gráficos XY (de dispersión):

Presentan la peculiaridad de que los dos ejes muestran valores

(no hay un eje de categorías). Se emplean para reflejar la relación

entre dos variables. Ejemplo: relación entre la Renta y la Inversión, las dos variables están correlacionadas, a mayor renta mayor

inversión (Recursos para trabajos administrativos, 2013).



Página 38

Tabla 11.

RELACIÓN ENTRE LA RENTA Y LA INVERSIÓN EN MILES DE DÓLARES.

Renta en miles $ Inversión en miles $

1 1.5 2 2.1 3 3.2

Figura 5. Relación entre la renta y la inversión en miles de dólares.

Gráficos de área

Son como los gráficos de líneas, pero con colores debajo de las líneas para ayudar a su identificación, ya que apilar las series contribuye a

verlas más claramente (Recursos para trabajos administrativos, 2013).

Tabla 12.

VENTAS ANUALES POR TIPO DE ORDENADORES.

AÑOS SOBREMESA PORTÁTILES

2008 32 12

2009 32 12

2010 28 12

2011 12 21

2012 15 28

0

0,5

1

1,5

2

2,5

3

3,5

0 1 2 3 4

I

N

V

E

R

S

I

Ó

N

E

N

M

I

L

E

S

$

RENTA EN MILES $



Página 39

Figura 6. Ventas anuales por tipo de ordenadores de los años 2008 a 2012.

1.7 DISTRIBUCIONES UNIDIMENSIONALES DE

FRECUENCIAS

La tabla formada por las distintas modalidades (valores o

intervalos) del carácter X y por las frecuencias absolutas, absolutas acumuladas, relativas o relativas acumuladas, recibe el nombre de

distribución de frecuencias: absolutas, absolutas acumuladas, relativas y relativas acumuladas, respectivamente (García & Japón ,

2015).

Por lo anterior, se tiene cuatro distribuciones de frecuencias,

obteniéndose a partir de una cualquiera de ellas, las tres restantes,

supuesto que se conoce la frecuencia total. Las cuatro distribuciones de frecuencias se expresan en tablas como las que se

presentan a continuación.

a. Carácter cualitativo.

𝑴𝒊 𝒇𝒊 𝑭𝒊 𝒉𝒊 𝑯𝒊

𝐂𝐮𝐚𝐥𝐢𝐝𝐚𝐝𝟏 𝑓1 𝐹1 ℎ1 𝐻1

𝐂𝐮𝐚𝐥𝐢𝐝𝐚𝐝𝟐 𝑓2 𝐹2 ℎ2 𝐻2

⋮ ⋮ ⋮ ⋮ ⋮

𝐂𝐮𝐚𝐥𝐢𝐝𝐚𝐝𝐢 𝑓𝑖 𝐹𝑖 ℎ𝑖 𝐻𝑖

⋮ ⋮ ⋮ ⋮ ⋮

𝐂𝐮𝐚𝐥𝐢𝐝𝐚𝐝𝐤 𝑓𝑘 𝐹𝑘 = 𝑛 ℎ𝑘 𝐻𝑘 = 1

n 1

0

10

20

30

40

50

2008 2009 2010 2011 2012

PORTÁTILES

SOBREMESA



Página 40

b. Carácter cuantitativo sin agrupar

𝑿𝒊 𝒇𝒊 𝑭𝒊 𝒉𝒊 𝑯𝒊

𝒙𝟏 𝑓1 𝐹1 ℎ1 𝐻1

𝒙𝟐 𝑓2 𝐹2 ℎ2 𝐻2

⋮ ⋮ ⋮ ⋮ ⋮

𝒙𝒊 𝑓𝑖 𝐹𝑖 ℎ𝑖 𝐻𝑖

⋮ ⋮ ⋮ ⋮ ⋮

𝒙𝒌 𝑓𝑘 𝐹𝑘 = 𝑛 ℎ𝑘 𝐻𝑘 = 1

n 1

c. Carácter cuantitativo agrupado en intervalos

𝑰𝒊 𝒇𝒊 𝑭𝒊 𝒉𝒊 𝑯𝒊

𝑰𝟏 𝑓1 𝐹1 ℎ1 𝐻1

𝑰𝟐 𝑓2 𝐹2 ℎ2 𝐻2

⋮ ⋮ ⋮ ⋮ ⋮

𝑰𝒊 𝑓𝑖 𝐹𝑖 ℎ𝑖 𝐻𝑖

⋮ ⋮ ⋮ ⋮ ⋮

𝑰𝒌 𝑓𝑘 𝐹𝑘 = 𝑛 ℎ𝑘 𝐻𝑘 = 1

n 1

Para la preparación de una tabla de distribución de frecuencias de carácter cuantitativo agrupado en intervalos, tenga en cuenta lo

siguiente.

1.7.1 DISTRIBUCIONES DE FRECUENCIAS PARA

DATOS CUANTITATIVOS

Las variables cuantitativas tales como número de hermanos,

número de goles marcados por un equipo de fútbol, valor de ventas diarias, producción de un bien en la semana, pago de sueldos

mensuales, número de turistas anuales que han ingresado al Ecuador durante una década, etc. son idóneas para realizar

distribuciones de frecuencias de datos cuantitativos.

Distribución de frecuencias. Agrupación de datos en clases

mutuamente excluyentes, que muestra el número de observaciones que hay en cada clase.



Página 41

Pasos para elaborar una distribución de

frecuencias

Los pasos para elaborar una distribución de frecuencias son:

1. Determinar el número de clases que se desea tener. 2. Determinar la amplitud o intervalo de clase.

3. Determinar los límites de cada una de las clases. 4. Distribuir los datos originales en las distintas clases o tabular.

5. Contar el número de elementos en cada clase que corresponde al

valor de la frecuencia.

Paso 1. Determinar el número de clases

Es usar suficientes grupos o clases, que indiquen la forma de la

distribución, por lo que se recomienda un número de clase no menor a 5 ni mayor a 15. El objetivo es usar un número suficiente

de clases que indiquen la forma de la distribución.

Para determinar el número de clases se utiliza la regla “2 k n”,

la misma que sugiere utilizar como número de clases el menor número (k) tal que 2 k(en palabras 2 elevado a la potencia k) sea

mayor que el número de observaciones (n).

Donde:

𝑛 = 𝑒𝑠 𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠.

𝑘 = 𝑒𝑠 𝑢𝑛 𝑛ú𝑚𝑒𝑟𝑜 𝑒𝑛𝑡𝑒𝑟𝑜 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜 𝑜, 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 𝑎 𝑢𝑡𝑖𝑙𝑖𝑧𝑎𝑟.

Por ejemplo, si se realizaron 30 llamadas telefónicas para la

venta de computadores y se desea saber cuántas clases se debe utilizar;

𝑛 = 30

2 = 𝑛ú𝑚𝑒𝑟𝑜 𝑏𝑎𝑠𝑒

𝑘 = 𝑑𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑎 𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠.

Utilizando la regla tenemos:

2𝑘𝑛

25 30



Página 42

32 30

Al ser 32 mayor que 30, la regla para calcular el número de

clases, se recomienda que sean 5 clases en la tabla de frecuencias.

Paso 2. Determinar la amplitud o intervalo de clase.

Para determinar la amplitud se resta del límite superior, el inferior de un conjunto de datos y se divide para el número de

clases.

Al conocer el ancho del intervalo o intervalo de clase a utilizar,

se puede aplicar la siguiente fórmula para encontrar el número de clases a utilizarse; en caso de que se manejen datos agrupados.

𝑖 ≥𝐻 − 𝐿

𝐾

Donde:

𝑖 = 𝑒𝑠 𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒

𝐻 = 𝑒𝑠 𝑒𝑙 𝑚𝑎𝑦𝑜𝑟 𝑣𝑎𝑙𝑜𝑟 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜

𝐿 = 𝑒𝑠 𝑒𝑙 𝑚𝑒𝑛𝑜𝑟 𝑣𝑎𝑙𝑜𝑟 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜

𝑘 = 𝑒𝑠 𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒

El primer procedimiento a estudiar para organizar y resumir un

conjunto de datos es realizar una tabla de frecuencias.

TABLA DE FRECUENCIAS O FRECUENCIA ABSOLUTA (𝑓𝑖).

Se agrupa datos cualitativos y cuantitativos en clases

mutuamente excluyentes que muestra el número de observaciones en cada clase. Por ejemplo, en la venta de vehículos marca Toyota

se identifica cinco modelos SUV'S, la identificación por modelo es una variable cualitativa. Suponga que Toyota Ecuador desea

resumir las ventas del año pasado por modelo de vehículo. El resumen en una tabla de frecuencia se presentaría de la siguiente

manera.



Página 43

Tabla 13.

Tabla de frecuencias absolutas de vehículos Toyota, modelos Suv's vendidos

en el ecuador en el año 2014.

Modelos SUV'S (𝑿𝒊) Número de vehículos. (𝒇𝒊)

4RUNNER 300

FJ CRUISER 200

FORTUNER 400

LAND CRUISER 200

RAV4 500

FRECUENCIA ABSOLUTA ACUMULADA (𝐹𝑖).

Esta frecuencia tiene sentido calcularla para variables cuantitativas o cualitativas ordenables, en los demás casos no tiene

mucho sentido el cálculo de esta frecuencia. La frecuencia absoluta acumulada es el número de veces que ha aparecido en la muestra o

población un valor menor o igual que el de la variable.

El cálculo de la frecuencia absoluta acumulada está dado por la fórmula

𝐹𝑖 = 𝐹𝑖−1 + 𝑓𝑖

La frecuencia absoluta acumulada de las operaciones de microcréditos de la Cooperativa de Ahorro y Crédito La Dura, se

presenta en la tabla 14.

Tabla 14.

Tabla de frecuencias absolutas acumuladas de operaciones de microcrédito de

la C.A.C. La Dura, correspondiente al año 2014.

(𝑴𝒊) (𝒇𝒊)

Frecuencia

absoluta

acumulada (𝑭𝒊)

Microcrédito minorista 300 300

Microcrédito de acumulación

simple

200 500

Microcrédito de acumulación

ampliada

400 900

TOTAL 900



Página 44

FRECUENCIAS RELATIVAS DE CLASE (ℎ𝑖).

Es la fracción del número total de observaciones en cada clase;

esto es, la frecuencia relativa capta la relación entre la totalidad de elementos de una clase y el número total de observaciones. En el

ejemplo de la venta de vehículos Toyota, busca conocer el porcentaje de vehículos modelos SUV'S vendidos en el Ecuador en

el año 2014.

La fórmula de cálculo para las frecuencias relativas de clase está

dada por

ℎ𝑖 =𝑓𝑖

𝑁 , o

ℎ𝑖 =𝑓𝑖

𝑛

Donde

𝑁 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛

𝑛 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎

Tabla 15.

Tabla de frecuencias absolutas y relativas de vehículos Toyota, modelos Suv's

vendidos en el ecuador en el año 2014.

𝑿𝒊 𝒇𝒊 Frecuencia relativa (𝒉𝒊).

Frecuencia relativa (𝒉𝒊).

4RUNNER 300 300 1,600⁄ 0.19

FJ CRUISER 200 200 1,600⁄ 0.12

FORTUNER 400 400 1,600⁄ 0.25

LAND CRUISER 200 200 1,600⁄ 0.13

RAV4 500 500 1,600⁄ 0.31

TOTAL 𝑵 = 𝟏, 𝟔𝟎𝟎 𝟏, 𝟔𝟎𝟎 𝟏, 𝟔𝟎𝟎⁄ 1.0000

Frecuencia relativa acumulada (𝐻𝑖). Es el cociente entre la frecuencia acumulada de una clase

determinada y el número total de datos.

La fórmula de cálculo de las frecuencias relativas acumuladas se

obtiene al calcular



Página 45

𝐻𝑖 =𝐹𝑖

𝑁 , o

𝐻𝑖 =𝐹𝑖

𝑛

Tabla 16.

Tabla de frecuencias absolutas, absolutas acumuladas, relativas y relativas

acumulada de vehículos Toyota, modelos Suv's vendidos en el Ecuador en el año

2014.

𝑿𝒊 𝒇𝒊 (𝑭𝒊) (𝒉𝒊). Frecuencia

relativa

acumulada(𝑯𝒊)

4RUNNER 300 300 0.188 0.19

FJ CRUISER 200 500 0.125 0.31

FORTUNER 400 900 0.250 0.56

LAND CRUISER

200 1,100 0.125 0.69

RAV4 500 1,600 0.313 1.00

TOTAL 1,600 1.0000


Se ha investigado el número de hijos correspondientes a 25 familias, los resultados se muestran a continuación.

1 2 2 0 1 3 2 3 4 0 2 1 3

4 1 4 2 2 0 1 3 5 1 2 3

a. Elabore una tabla de frecuencias absolutas. b. Otra con frecuencias absolutas, absolutas acumuladas, relativas

y relativas acumuladas.

Solución

a. Se elabora una tabla resumen, la cual contendrá en el presente

caso, en la primera columna, la variable cuantitativa (número de hijos por familia) y para la segunda columna, el conteo

correspondiente de acuerdo al número de hijos obtenido en los datos.



Página 46

Tabla 17.

Conteo de número de hijos por familia

NÚMERO DE HIJOS CONTEO

0 III

1 IIIII I

2 IIIII II

3 IIIII

4 III

5 I

TOTAL 25

Una vez elaborado el conteo se procede a llenar la nueva tabla con números arábigos.

Tabla 18.

Distribución de frecuencias absolutas del número de hijos por familia.

NÚMERO DE HIJOS 𝑿𝒊

FRECUENCIA 𝒇𝒊

0 3

1 6

2 7

3 5

4 3

5 1

TOTAL 25

b. La tabla anterior contiene la frecuencia absoluta, por lo que le llamaríamos distribución de frecuencias absolutas. A partir de

esta tabla se puede construir las demás frecuencias (absolutas acumuladas, relativas y relativas acumuladas).

Tabla 19.

Distribuciones de frecuencias (absoluta, absoluta acumulada, relativa, relativa

acumulada) del número de hijos por familia.

𝑿𝒊 𝒇𝒊 𝑭𝒊 𝒉𝒊 𝑯𝒊 0 3 3 0.12 0.12

1 6 9 0.24 0.36

2 7 16 0.28 0.64

3 5 21 0.20 0.84

4 3 24 0.12 0.96

5 1 25 0.04 1.00

TOTAL 25

1



Página 47


Se ha investigado la estatura de 50 estudiantes de estadística,

los resultados que se muestran han sido previamente ordenados en forma ascendente.

151 151 152 152 153 154 154 154 155 156

158 158 158 159 161 161 163 164 164 164

166 168 170 170 170 170 170 171 171 172

173 174 174 175 176 177 177 177 177 178

178 180 182 183 184 184 184 185 185 185

a. Elabore una tabla de frecuencias absolutas.

b. Otra con frecuencias absolutas, absolutas acumuladas, relativas y relativas acumuladas.

Solución

a. Tenga en cuenta los pasos señalados en la preparación de una tabla de distribución de frecuencias de carácter cuantitativo

agrupado en intervalos.

PASO 1. Determinar el número de clases que se desea tener.

2𝑘𝑛

Donde 𝑛 = 50,

Entonces 2𝑘 > 50

Por tanto

26 > 50

64 > 50

Si 𝑘 = 6, entonces se tendrá seis intervalos de clase.

PASO 2. Determinar la amplitud o intervalo de clase.

𝑖 ≥𝐻 − 𝐿

𝐾

Donde:

𝑖 =?



Página 48

𝐻 = 186

𝐿 = 151

𝑘 = 6

𝑖 ≥186 − 151

6= 5.83 ≅ 6

186 − 151 = 35

6 × 6 = 36 ∗

* El rango del problema es 35, sin embargo, se dispone de 36, lo que da lugar para mover en una unidad en uno de los extremos,

sea este, superior o inferior.

PASO 3. Determinar los límites de cada una de las clases.

𝑋𝑖−1

′ − 𝑋𝑖′

150 – 156

156 – 162

162 – 168

168 – 174

174 – 180

180 – 186

PASO 4. Distribuir los datos originales en las distintas clases o tabular.

𝑋𝑖−1

′ − 𝑋𝑖′ 𝑓𝑖

150 – 156 IIIII IIIII

156 – 162 IIIII I

162 – 168 IIIII I

168 – 174 IIIII IIIII I

174 – 180 IIIII IIII

180 – 186 IIIII III

TOTAL 50

PASO 5. Contar el número de elementos en cada clase que corresponde al valor de la frecuencia.



Página 49

Tabla 20.

Frecuencias absolutas de alturas de estudiantes de estadística del periodo

2015 – 2015.

𝑿𝒊−𝟏′ − 𝑿𝒊

′ 𝒇𝒊

150 – 156 10

156 – 162 6

162 – 168 6

168 – 174 11

174 – 180 9

180 – 186 8

TOTAL 50

b. La tabla anterior contiene la frecuencia absoluta, por lo que le llamaríamos Distribución de frecuencias absolutas. A partir de

esta tabla se puede construir las demás frecuencias (absolutas acumuladas, relativas y relativas acumuladas).

Tabla 21.

Frecuencias: absolutas, relativas, absolutas acumuladas y relativas

acumuladas de alturas de estudiantes de estadística del periodo 2015 – 2015.


′ 𝒇𝒊 𝑭𝒊 𝒉𝒊 𝑯𝒊

150 – 156 10 10 0.20 0.20

156 – 162 6 16 0.12 0.32

162 – 168 6 22 0.12 0.44

168 – 174 11 33 0.22 0.66

174 – 180 9 42 0.18 0.84

180 – 186 8 50 0.16 1.00

50

1.00

1.8 DIAGRAMAS DE FRECUENCIAS

1.8.1 DATOS CORRESPONDIENTES A UN CARÁCTER

CUALITATIVO

Comúnmente las gráficas de datos cualitativos son en forma de

barras y de pastel. Sin embargo en situaciones especiales pueden ser útiles para datos cuantitativos.



Página 50

Diagrama de barras.

Se representa en el primer cuadrante de un sistema coordenado

rectangular, aquí las clases se representan en el eje horizontal y la frecuencia de clase en el eje vertical. Las frecuencias de clase son

proporcionales a las alturas de las barras. El eje horizontal muestra la variable de interés y el eje vertical la cantidad, número o fracción

de cada uno de los posibles resultados. Una característica distintiva de la gráfica de barras es que existe una distancia o espacio entre

las barras.

Figura 7. Gráfica de barras de vehículos Toyota, modelos Suv's vendidos en el ecuador en el año 2014.

Gráficas en forma de pastel.

Es una gráfica que muestra la parte o porcentaje que representa cada clase del total de números de frecuencia. Para elaborar una

gráfica de pastel consiste en registrar los porcentajes 0, 10, 20, … , 100 uniformemente alrededor de la circunferencia (véase la figura

8). Para indicar la parte de 19% destinada a 4RUNNER, trace una línea del centro del círculo al 0, y otra línea del centro del círculo al

19%. Tome el punto cero del círculo y constitúyalo como punto de

partida, girando en sentido a las manecillas del reloj, señale los valores constantes en las frecuencias relativas acumuladas, en su

orden; ello le permitirá distribuir los porcentajes correspondientes de cada una de las características de la variable.

0

100

200

300

400

500

300

200

400

200

500

Nú

mero

de v

eh

ícu

los

Modelos SUV'S



Página 51

Figura 8. Gráfica de pastel de vehículos Toyota, modelos Suv's vendidos en

el ecuador en el año 2014.


CUANTITATIVO DISCRETO

Diagrama de barras

En el ejemplo del número de hijos por familia, la variable

número de hijos, es cuantitativa discreta, por tanto, recordando la distribución de frecuencias absolutas del número de hijos por

familia de la tabla 15, se tiene

NÚMERO DE

HIJOS 𝑿𝒊 FRECUENCIA

𝒇𝒊

0 3

1 6

2 7

3 5

4 3

5 1

TOTAL 25

El diagrama de barras correspondiente, se representa a

continuación.

4RUNNER

19%

FJ

CRUISER

12%

FORTUNER

25%LAND

CRUISER

13%

RAV4

31%

4RUNNER

FJ CRUISER

FORTUNER

LAND CRUISER

RAV4



Página 52

Figura 9. Diagrama de barras del número de hijos por familia

Diagrama en forma de pastel

Recordando la distribución de frecuencias absolutas y relativas del número de hijos por familia de la tabla 16, se tiene

𝑿𝒊 𝒇𝒊 𝒉𝒊

0 3 0.12

1 6 0.24

2 7 0.28

3 5 0.20

4 3 0.12

5 1 0.04

TOTAL 25 1

El diagrama en forma de pastel correspondiente a la frecuencia

absoluta 𝑓𝑖, se representa a continuación.

Figura 10. Frecuencias absolutas del número de hijos por familia.

3

6

7

5

3

1

0

1

2

3

4

5

6

7

8

0 1 2 3 4 5

F

R

E

C

U

E

N

C

I

A

NÚMERO DE HIJOS

3

6

7

5

31

0

1

2

3

4

5



Página 53

El diagrama en forma de pastel correspondiente a la frecuencia relativa ℎ𝑖, se representa a continuación.

Figura 11. Frecuencias relativas del número de hijos por familia.


CUANTITATIVO CONTINUO

Son de común aplicación en datos agrupados cuantitativo

continuo. El histograma, el polígono y la ojiva, son gráficas usualmente usadas para datos cuantitativos continuos, en los que,

como se observará a continuación, se representa las frecuencias: absolutas, absolutas acumuladas, relativas y relativas acumuladas.

Para la representación gráfica, tenga en cuenta la Tabla 18, que se observa a continuación.


′ 𝒇𝒊 𝑭𝒊 𝒉𝒊 𝑯𝒊

150 – 156 10 10 0.20 0.20

156 – 162 6 16 0.12 0.32

162 – 168 6 22 0.12 0.44

168 – 174 11 33 0.22 0.66

174 – 180 9 42 0.18 0.84

180 – 186 8 50 0.16 1.00

50

1.00

0,12

0,24

0,28

0,20

0,12

0,04

0 1

2 3

4 5



Página 54

Histograma


rectangular, aquí las clases se representan en el eje horizontal y la frecuencia de clase en el eje vertical. Las frecuencias de clase son

proporcionales a las alturas de las barras. El eje horizontal muestra la variable de interés y el eje vertical la cantidad, número o fracción

de cada uno de los posibles resultados. Una característica distintiva de la gráfica de barras es que no existe una distancia o espacio

entre las barras.

El histograma es útil para representar las frecuencias absolutas y

relativas de una variable continua.

Figura 12. Histograma de frecuencias absolutas de las alturas de 50

estudiantes de estadística, del periodo 2015 – 2015.

Figura 13. Histograma de frecuencias relativas de las alturas de 50


10

6 6

11

98

0

2

4

6

8

10

12

150 – 156 156 – 162 162 – 168 168 – 174 174 – 180 180 – 186

F

R

E

C

U

E

N

C

I

A

A

B

S

O

L

U

T

A

ESTATURAS

0,2

0,12 0,12

0,22

0,180,16

0

0,05

0,1

0,15

0,2

0,25

150 – 156 156 – 162 162 – 168 168 – 174 174 – 180 180 – 186

F

R

E

C

U

E

N

C

I

A

R

E

L

A

T

I

V

A

ESTATURAS



Página 55

Polígono


rectangular, aquí las clases se representan en el eje horizontal y la frecuencia de clase en el eje vertical. Las frecuencias se

representan por las alturas correspondientes en los extremos superiores de cada intervalo. Una característica distintiva del

polígono es que las alturas correspondientes a los extremos superiores se unen mediante segmentos.

El Polígono es útil para representar las frecuencias absolutas y relativas de una variable continua.

Figura 14. Polígono de frecuencias absolutas de las alturas de 50 estudiantes

de estadística, del periodo 2015 – 2015.

Figura 15. Polígono de frecuencias relativas de las alturas de 50 estudiantes de

estadística, del periodo 2015 – 2015.

Ojiva

Se representa en el primer cuadrante de un sistema coordenado rectangular, aquí las clases se representan en el eje horizontal y la

10

6 6

11

98

0

2

4

6

8

10

12

150 – 156 156 – 162 162 – 168 168 – 174 174 – 180 180 – 186

F

R

E

C

U

E

N

C

I

A

A

B

S

O

L

U

T

A

ALTURAS

0,2

0,12 0,12

0,22

0,180,16

0

0,05

0,1

0,15

0,2

0,25

150 – 156 156 – 162 162 – 168 168 – 174 174 – 180 180 – 186

F

R

E

C

U

E

N

C

I

A

R

E

L

A

T

I

V

A

ALTURAS



Página 56

frecuencia de clase en el eje vertical. Las frecuencias acumuladas se representan por las alturas correspondientes en los extremos

superiores de cada intervalo, dando una altura cero al extremo inferior del primer intervalo y siendo constante a partir del extremo

superior del último. El eje horizontal muestra la variable de interés y el eje vertical la cantidad, número o fracción de cada uno de los

posibles resultados. Una característica distintiva de la ojiva es que las alturas correspondientes a los extremos superiores se unen

mediante segmentos.

La ojiva es útil para representar las frecuencias absolutas acumuladas y relativas acumuladas de una variable continua.

Figura 16. Ojiva de frecuencias absolutas acumuladas de las alturas de 50


Figura 17. Ojiva de frecuencias relativas acumuladas de las alturas de 50


0

1016

22

33

42

50 50

0

10

20

30

40

50

60

144 –

150

150 –

156

156 –

162

162 –

168

168 –

174

174 –

180

180 –

186

186 –

192

F

R

E

C

U

E

N

C

I

A

A

B

S

O

L

U

T

A

S

A

C

U

M

U

L

A

D

A

S

ALTURAS

0

0,20,32

0,44

0,66

0,84

1 1

0

0,2

0,4

0,6

0,8

1

1,2

144 –

150

150 –

156

156 –

162

162 –

168

168 –

174

174 –

180

180 –

186

186 –

192

F

R

E

C

U

E

N

C

I

A

R

E

L

A

T

I

V

A

A

C

U

M

U

L

A

D

A

ALTURAS



Página 57

2 CAPÍTULO II: ANÁLISIS ESTADÍSTICO

SIMPLE

OBJETIVOS

1. Calcular la media aritmética, la media ponderada, la mediana, la moda y la media geométrica.

2. Conocer las características, uso, ventajas de las Medidas de

Tendencia Central. 3. Identificar la ubicación de las Medidas de Tendencia Central.

4. Calcular la amplitud de variación, desviación media, la varianza y la desviación estándar de datos originales.

5. Calcular la amplitud de variación, desviación media, la varianza y la desviación estándar de datos agrupados.

6. Conocer las ventajas y desventajas de las Medidas de Dispersión.

7. Calcular y analizar los cuartiles, deciles y centiles, la amplitud cuartílica e intecuartílica.

8. Elaborar el diagrama de caja. 9. Calcular y analizar el coeficiente de variación y asimetría.

2.1 INTRODUCCIÓN

En el capítulo anterior se presentó algunas definiciones útiles

para el estudio de la estadística, la recolección de la información, su forma de resumir, tanto en tablas como en gráficos para variables

cualitativas y cuantitativas. En el presente capítulo se considera medidas resúmenes, tales como; las medidas de centralización, de

posición, de dispersión, de asimetría y apuntamiento.

Resumir un conjunto de datos es pasar de una visión detallada a

una generalización simple e informativa tratando de preservar las características esenciales. ¿Por qué resumir? Para simplificar la

comprensión y la comunicación de los datos.

2.2 TIPOS DE ESTADÍGRAFOS

Después de haber ordenado y descrito un conjunto de datos,

aún el análisis resulta un tanto incompleto; es necesario entonces resumir la información y facilitar así su análisis e interpretación

utilizando ciertos indicadores. A estos indicadores se les denomina



Página 58

también estadígrafos o medidas de resumen, permiten hallar un valor numérico, el mismo que representa a toda la población o

muestra en el estudio; estas son:

1. Medidas de tendencia central

a. Media aritmética b. Media ponderada

c. Mediana d. Moda

e. Media geométrica

f. Media armónica

2. Medidas de tendencia no central a. Deciles

b. Cuartiles c. Percentiles

3. Medidas de dispersión

a. Rango b. Desviación media

c. Desviación estándar d. Varianza

e. Coeficiente de variación

4. Medidas de asimetría, y

5. Medidas de apuntamiento o curtosis.

2.3 ESTADÍGRAFOS DE TENDENCIA CENTRAL

Al recolectar y organizar los datos, el objetivo es encontrar un

punto central en función de sus frecuencias. En estadística las medidas de tendencia central, varían de acuerdo con lo que se

desea o que se requiera encontrar del conjunto de datos recolectados.

Estas medidas serán estudiadas en dos formas:

1. Datos no agrupados, y

2. Datos agrupados en una tabla de frecuencias.

Las fórmulas difieren para calcular en vista de que depende si



Página 59

son datos de población o datos de muestras, pero el procedimiento es el mismo.

Una medida de tendencia central es un valor único que resume un conjunto de datos, señalando el centro de los valores.

2.3.1 MEDIA ARITMÉTICA

Es la medida de tendencia central que más se utiliza en Estadística, se calcula sumando todos los valores de las

observaciones y se divide para el total de las mismas.

Características

1. Es una medida totalmente numérica o sea sólo puede calcularse en datos de características cuantitativas.

2. En su cálculo se toman en cuenta todos los valores de la variable.

3. Es lógica desde el punto de vista algebraico.

4. La media aritmética es altamente afectada por valores extremos.

5. No puede ser calculada en distribuciones de frecuencia que tengan clases abiertas.

6. La media aritmética es única, o sea, un conjunto de datos numéricos tiene una y solo una media aritmética.

7. Esta medida es muy útil para analizar y comparar dos o más

poblaciones.

Media aritmética con datos no agrupados

La media aritmética poblacional y muestral de datos no

agrupados, es la suma de todos los valores de la población o muestra, dividido para el número total de los datos.

Fórmula poblacional

La fórmula está dada por:

μ =∑ 𝑥𝑖

N

donde:



Página 60

μ Es la representación de la media de la población, con

letra griega “mu” minúscula.

N Indica el número total de elementos de la población.

𝑥𝑖 Es cualquier valor en particular.

La letra griega “sigma” mayúscula, es para sumar los datos.

∑ 𝑥𝑖 Indica que es la sumatoria total de los valores de 𝑥.

La característica que mide a la población, está representada

por el parámetro. Es una característica de una población.


Las edades de un equipo titular de básquet de la liga ecuatoriana es: 22, 28, 19, 25 y 26. Calcular la media de edad de los

jugadores.

Solución

El equipo titular de básquet contiene cinco jugadores, en consecuencia, se trata de la población o equipo titular.

𝑁 = 5, equipo titular

∑ 𝑥𝑖 = 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + 𝑥5 = 22 + 28 + 19 + 25 + 26 = 120

μ =∑ 𝑥𝑖

N=

120

5= 24 𝑎ñ𝑜𝑠

μ =∑ 𝑥𝑖

N=

120

5

μ = 24 𝑎ñ𝑜𝑠

Interpretación del resultado

El equipo titular de básquet está conformado con una media de edad de 24 años.



Página 61


El bufete de abogados Emily’s Asociados tiene 10 socios, el día

de hoy estos socios atendieron el siguiente número de clientes.

Bufete de

Abogados

No. de clientes 𝒙𝒊

Socio 1 5

Socio 2 10

Socio 3 8

Socio 4 6

Socio 5 7

Socio 6 6

Socio 7 12

Socio 8 11

Socio 9 10

Socio 10 5

a. ¿Esta información es una muestra o una población?

b. ¿Cuál es el número medio de clientes atendidos por los 10 socios del bufete?

Solución

Es una población, puesto que se toma en cuenta a todos los

socios del bufete de abogados Emily’s Asociados y para sacar la media aritmética poblacional, se debe sumar todos los valores y

dividir para el número total de los socios atendidos.

𝑁 = 10

∑ 𝑥𝑖 = 80

μ =∑ 𝑥𝑖

N=

80

10

μ = 8


El valor medio de clientes atendidos por socio es 8.



Página 62

Fórmula muestral


�̅� =∑ 𝑥𝑖

𝑛

donde

�̅� Media aritmética de la muestra

𝑛 Número de elementos de la muestra

∑ 𝑥𝑖 Indica que es la sumatoria total de los valores de 𝑥.


Un equipo de básquet de la liga ecuatoriana está conformado

por 12 jugadores, de los cuales se toma una muestra aleatoria de 5 de ellos, con el propósito de calcular la estatura promedio. Si sus

estaturas en centímetros son: 190, 208, 196, 205 y 206. ¿Cuál es la media en centímetros?

Solución

El equipo completo de básquet contiene 12 jugadores, si se

considera a cinco de ellos, tomados de manera aleatoria, entonces se tiene una muestra, ya que se ha considerado una parte del total.

𝑛 = 5, muestra aleatoria

∑ 𝑥𝑖 = 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + 𝑥5 = 190 + 208 + 196 + 205 + 206 = 1,005

�̅� =∑ 𝑥𝑖

n=

1,005

5

�̅� = 201 𝑐𝑒𝑛𝑡í𝑚𝑒𝑡𝑟𝑜𝑠


La estatura promedio de la muestra de los jugadores de básquet

es de 201 centímetros.



Página 63

Media aritmética con datos agrupados

En datos agrupados se pueden presentar dos grupos de tablas

de frecuencia.

Cuando una serie simple se le agrupa con frecuencias para

obtener la media aritmética, se multiplica la variable 𝑥𝑖 por la

frecuencia respectiva fi , se obtiene la suma de todos estos

productos y luego a este valor se lo divide para el número de

elementos 𝑛 (Suárez, 2015). La fórmula de cálculo está dada por:


𝜇 =𝑓1𝑥1 + 𝑓2𝑥2 + ⋯ + 𝑓𝑛𝑥𝑛

𝑓1 + 𝑓2 + ⋯ + 𝑓𝑛=

∑ 𝑓𝑖𝑥𝑖

∑ 𝑓=

∑ 𝑓𝑥

𝑁

Donde ∑ 𝑓 = 𝑁 que es el número total de elementos de una

población.


En una fiesta infantil se encuentran 20 niños (as) de edades de 4 a 10 años, las edades en años están distribuidas de acuerdo a la

información siguiente.

𝒙𝒊

en años

𝒇𝒊

frecuencia

4 3

5 2

6 3

7 1

8 6

9 1

10 4

Total 20

Se requiere calcular la media aritmética.

Solución

Como

𝜇 =∑ 𝑓𝑖𝑥𝑖

∑ 𝑓=

∑ 𝑓𝑥

𝑁



Página 64

Entonces, de acuerdo a la información prevista en la tabla del problema, se tiene

𝜇 =(3)(4) + (2)(5) + (3)(6) + (1)(7) + (6)(8) + (1)(9) + (4)(10)

3 + 2 + 3 + 1 + 6 + 1 + 4=

144

20

𝜇 = 7.2 𝑎ñ𝑜𝑠


El promedio de edad de los 20 niños y niñas que se encuentran

en la fiesta infantil es de 7.2 años.

Cuando una serie se la agrupa en intervalos para obtener la media aritmética, se multiplica la marca de clase de intervalo 𝑥𝑖 por

la frecuencia respectiva 𝑓𝑖 , se obtiene la suma de todos estos

productos y luego a este valor se lo divide para el número de

elementos (Suárez, 2015). La fórmula de cálculo está dada por:

𝜇 =𝑓1𝑥1 + 𝑓2𝑥2 + ⋯ + 𝑓𝑛𝑥𝑛

𝑓1 + 𝑓2 + ⋯ + 𝑓𝑛=

∑ 𝑓𝑖𝑥𝑖

∑ 𝑓=

∑ 𝑓𝑥

𝑁

Donde 𝑥𝑖 es la marca de clase de los intervalos.

La fórmula para el cálculo de la marca de clase es:

𝑥𝑖 =𝑥𝑖−1

′ + 𝑥𝑖′

2

Donde

𝑥𝑖−1′ = 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜

𝑥𝑖′ = 𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜


La edad de los estudiantes de la modalidad a distancia de la Facultad de Ciencias Administrativas de la UCE, matriculados en el

periodo abr – sep del 2015, arrojaron los resultados siguientes.



Página 65

EDAD (AÑOS CUMPLIDOS) 𝒙𝒊−𝟏

′ +𝒙𝒊

′

MARCA DE CLASE 𝒙𝒊

NÚMERO

[𝟏𝟖 – 𝟐𝟖) ᴬ 18 + 28

2= 23

1,146

[𝟐𝟖 – 𝟑𝟖) 28 + 38

2= 33

573

[𝟑𝟖 – 𝟒𝟖) 38 + 48

2= 43

291

[𝟒𝟖 – 𝟓𝟖) 48 + 58

2= 53

113

MÁS DE 57 52

TOTAL 2,175

ᴬ El símbolo “[18”, significa que incluye el 18; y “28)”, significa

que el 28 no está incluido, pero si incluye los valores cercanos al 28 por la izquierda.

Se requiere calcular la media de edad en años.

Solución

Se ha considerado a todos los estudiantes de la modalidad a distancia de la Facultad de Ciencias Administrativas de la UCE, se

trata de toda la población.

En consecuencia


∑ 𝑓=

∑ 𝑓𝑥

𝑁

Entonces, de acuerdo a la información prevista en la tabla del problema y a la característica cinco de la media aritmética, no es

posible el cálculo de 𝑓𝑖𝑥𝑖 , en razón que el quinto intervalo es

abierto.

Fórmula muestral

�̅� =∑ 𝑓𝑖𝑥𝑖

∑ 𝑓=

∑ 𝑓𝑥

𝑛


Si de los estudiantes de la modalidad a distancia de la Facultad

de Ciencias Administrativas de la UCE, se toma como muestra a 50



Página 66

matriculados de manera aleatoria en el periodo abr – sep del 2015, para determinar la media de estatura en centímetros. Entonces, de

acuerdo a las mediciones correspondientes se tiene.


′ 𝒙𝒊 𝒇𝒊

[150 – 156) 153 10

[156 – 162) 159 6

[162 – 168) 165 6

[168 – 174) 171 11

[174 – 180) 177 9

[180 – 186) 183 8

∑ = 50

Solución

Como

�̅� =∑ 𝑓𝑖𝑥𝑖

∑ 𝑓=

∑ 𝑓𝑥

𝑛

Entonces, adecuando la tabla de información del problema y obteniendo la marca de clase 𝒙𝒊 , se tendría:


′ 𝒙𝒊 𝒇𝒊 𝒙𝒊𝒇𝒊

[150 – 156) 153 10 1,530

[156 – 162) 159 6 954

[162 – 168) 165 6 990

[168 – 174) 171 11 1,881

[174 – 180) 177 9 1,593

[180 – 186) 183 8 1,464

∑ = 50 8,412

Reemplazando en la fórmula, queda:

�̅� =8,412

50= 168.24 𝑐𝑒𝑛𝑡í𝑚𝑒𝑡𝑟𝑜𝑠



Página 67

2.3.2 MEDIA PONDERADA

En ocasiones es necesaria la obtención de una media aritmética

de variables cuyos valores observados tienen distinta importancia y por tanto se deben ponderar de distinta manera para obtener la

media.

En el caso que la ponderación sea distinta, se habla de una

media ponderada y los valores por los cuales se ponderan los distintos valores se llaman pesos o ponderaciones (𝑤𝑖).


�̅�𝑤 =𝑤1𝑥1 + 𝑤2𝑥2 + 𝑤3𝑥3 + ⋯ + 𝑤𝑛𝑥𝑛

𝑥1 + 𝑥2 + 𝑥3 + ⋯ + 𝑥𝑛

A la fórmula se le resume de la siguiente forma:

�̅�𝑤 =∑ 𝑤𝑖𝑥𝑖

𝑛𝑖=1

∑ 𝑤𝑖𝑛𝑖=1

Siendo:

�̅�𝑤 = 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑝𝑜𝑛𝑑𝑒𝑟𝑎𝑑𝑎

Que se lee: “X barra subíndice W”


A continuación se muestran las ponderaciones de las

evaluaciones en los cursos de estadística y las calificaciones de un estudiante durante el semestre.

Evaluación Nota 𝒙𝒊 Porcentaje

𝒘𝒊

Parcial 1 9 30

Parcial 2 7 30

Examen final 8 20

Tema especial 9 10

Otras evaluaciones 8.4 10

Determine la calificación promedio del estudiante.



Página 68

Solución

Como

�̅�𝑤 =𝑤1𝑥1 + 𝑤2𝑥2 + 𝑤3𝑥3 + ⋯ + 𝑤𝑛𝑥𝑛

𝑥1 + 𝑥2 + 𝑥3 + ⋯ + 𝑥𝑛

Entonces

�̅�𝑤 =(30)(9) + (30)(7) + (20)(8) + (10)(9) + (10)(8.4)

30 + 30 + 20 + 10 + 10

�̅�𝑤 =814

100

�̅�𝑤 = 8.14 𝑝𝑢𝑛𝑡𝑜𝑠

La calificación promedio del estudiante de los cinco ítems

evaluados es de 8.14 puntos.

2.3.3 LA MEDIANA

La mediana de un conjunto finito de valores, es aquel valor que

divide al conjunto en dos partes iguales, de forma que el número de valores mayor o igual a la mediana es igual al número de valores

menores o igual a estos. Su aplicación se ve limitada ya que solo considera el orden jerárquico de los datos y no alguna propiedad

propia de los datos, como en el caso de la media.

Mediana de datos no agrupados

Los criterios necesarios para calcular la mediana, son los

siguientes:

a. Se requiere es ordenar los datos en forma ascendente o descendente, cualquiera de las ordenaciones conducen al mismo

resultado. Esto es: 𝑥1, 𝑥2, 𝑥3, ⋯ , 𝑥𝑛.

b. Si N es Impar, hay un término central, el término 𝑋𝑁

2+1

, que será el valor

de la mediana. c. Si N es Par, hay dos términos centrales, 𝑋𝑁

2

y 𝑋𝑁

2+1

, la mediana será la

media de esos dos valores



Página 69

Características:

Para el cálculo de la mediana interesa que los valores estén

ordenados de menor a mayor o viceversa.

La mediana no es afectada por valores extremos.

Puede ser calculada en distribuciones de frecuencia con clases abiertas.

La notación más usual que se utiliza para representar a la

mediana son 𝑀𝑒, 𝑀𝑑, �̃�

Fórmula para población y muestra impar

𝑀𝑒 = 𝑋𝑁+1

2

𝑀𝑒 = 𝑋𝑛+1

2

Donde 𝑋𝑁+1

2

y 𝑋𝑛+1

2

, es la posición que ocupa el valor de la

mediana.


El contenido de cinco botellas de gaseosas denominadas personal son seleccionadas de forma aleatoria de un lote de

producción en ml, al medir sus contenidos se tiene: 235.4, 236.3, 234.9, 236.4, y 236.0. ¿Cuál es la mediana de las observaciones

muestreadas?

Solución

Primero se ordena de mayor a menor, entonces:

234.9, 235.4, 236.0, 236.3, 236.4

Aplicando la regla para el cálculo de la mediana de datos no

agrupados de un conjunto de elementos impar, se tiene:

𝑀𝑒 = 𝑋𝑛+1

2

𝑛 + 1

2=

5 + 1

2= 3



Página 70

El tres es la posición de la serie de elementos ordenados y contados de izquierda a derecha, por lo que se tendría que:

𝑀𝑒 = 236.0

234.9, 235.4, 236.0, 236.3, 236.4

Fórmula para población y muestra par

𝑀𝑒 =𝑋𝑁

2

+ 𝑋𝑁

2+1

2

𝑀𝑒 =𝑋𝑛

2+ 𝑋𝑛

2+1

2

Donde 𝑋𝑁

2

+𝑋𝑁2

+1

2 y

𝑋𝑛2

+𝑋𝑛2

+1

2, es la posición que ocupa el valor de la

mediana.


El contenido de seis botellas de gaseosas denominadas personal son seleccionadas de forma aleatoria de un lote de producción en

ml, al medir sus contenidos se tiene: 235.4, 236.3, 234.9, 236.4, 237.2 y 236.0. ¿Cuál es la mediana de las observaciones

muestreadas?

Solución

Primero se ordena de mayor a menor, entonces:

234.9, 235.4, 236.0, 236.3, 236.4, 237.2

Aplicando la regla para el cálculo de la mediana de datos no agrupados de un conjunto de elementos impar, se tiene:

𝑛

2 +

𝑛

2 + 1

2=

6

2+

6

2+ 1

2=

7

2= 3.5

El tres punto cinco, es la posición de la serie de elementos ordenados y contados de izquierda a derecha, por lo que cuando la

serie contiene un número de elementos par, se contará con dos elementos medios y se tendrá:

234.9, 235.4, 236.0, 236.3, 236.4, 237.2



Página 71

𝑀𝑒 =236.0 + 236.3

2= 236.15

𝑀𝑒 == 169.64 𝑐𝑒𝑛𝑡í𝑚𝑒𝑡𝑟𝑜𝑠

Mediana de datos agrupados

Cuando los datos se encuentran agrupados en una distribución de frecuencia, no conocemos los datos originales, por lo tanto es

necesario estimar la mediana mediante los siguientes pasos:

1. Calcular el valor 𝑛/2 o 𝑁 2⁄ , según se trate.

2. Localizar el intervalo de clase donde se encuentra la mediana

(intervalo mediano). Esto se hace encontrando el primer intervalo de clase donde la frecuencia acumulada es igual o

mayor que 𝑛/2.

3. Aplicar la siguiente fórmula de la mediana para datos

agrupados con respecto al intervalo mediano.

Fórmula de la mediana para una población.

𝑀𝑒 = 𝐿𝑖−1 + (𝑐)

𝑁

2− 𝐹𝑖−1

𝑓𝑖

Fórmula de la mediana para una muestra.

𝑀𝑒 = 𝐿𝑖−1 + (𝑐)

𝑛

2− 𝐹𝑖−1

𝑓𝑖

Donde:

𝑀𝑒 = 𝑀𝑒𝑑𝑖𝑎𝑛𝑎

𝐿𝑖−1 = 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎

𝑐 = 𝑙𝑎 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎

𝐹𝑖−1 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎

𝑓𝑖 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎

Características:

Existe una mediana para un conjunto de datos.



Página 72

Para el cálculo de la mediana interesa que los valores estén ordenados de menor a mayor o viceversa.

Al existir valores extremadamente grandes o muy pequeños la mediana no se ve afectada.

Se calculará la mediana para una distribución de frecuencias con una clase de extremo abierto. Cuando la mediana no se

encuentra en esa clase.


La edad de los estudiantes de la modalidad a distancia de la Facultad de Ciencias Administrativas de la UCE, matriculados en el

periodo abr – sep del 2015, arrojaron los resultados siguientes.

EDAD (AÑOS

CUMPLIDOS) 𝒙𝒊−𝟏′ +

𝒙𝒊′


NÚMERO

[𝟏𝟖 – 𝟐𝟖) ᴬ 18 + 28

2= 23

1,146

[𝟐𝟖 – 𝟑𝟖) 28 + 38

2= 33

573

[𝟑𝟖 – 𝟒𝟖) 38 + 48

2= 43

291

[𝟒𝟖 – 𝟓𝟖) 48 + 58

2= 53

113

MÁS DE 57 52

TOTAL 2,175

ᴬ El símbolo “[18”, significa que incluye el 18; y “28)”, significa

que el 28 no está incluido, pero si incluye los valores cercanos al 28

por la izquierda.

Se requiere calcular la mediana de edad en años de los estudiantes de la modalidad a distancia.

Solución

Se ha considerado a todos los estudiantes de la modalidad a distancia de la Facultad de Ciencias Administrativas de la UCE, se

trata de toda la población.

En consecuencia



Página 73

𝑀𝑒 = 𝐿𝑖−1 + (𝑐)

𝑁

2− 𝐹𝑖−1

𝑓𝑖

Donde

𝑁

2=

2,175

2= 1,087.5

Completando la tabla para la aplicación de la fórmula, se tiene:

EDAD (AÑOS CUMPLIDOS) 𝒙𝒊−𝟏

′ +𝒙𝒊

′


FRECUENCIA 𝒇𝒊

FRECUENCIA

ACUMULADA 𝑭𝒊

[18 – 28) 18 + 28

2= 23

1,146 1,146

[28 – 38) 28 + 38

2= 33

573 1,719

[38 – 48) 38 + 48

2= 43

291 2,010

[48 – 58) 48 + 58

2= 53

113 2,123

MÁS DE 57 52 2,175

TOTAL 2,175

𝐿𝑖−1 =18

𝑐 = 10

𝐹𝑖−1 = 0

𝑓𝑖 = 1,146

Reemplazando

𝑀𝑒 = 18 + (10)

2,175

2− 0

1,146= 18 + 9.49

𝑀𝑒 = 27.49 𝑎ñ𝑜𝑠



de Ciencias Administrativas de la UCE, se toma como muestra a 50 matriculados de manera aleatoria en el periodo abr – sep. del 2015,

para determinar la mediana de estatura en centímetros. Entonces, de acuerdo a las mediciones correspondientes se tiene.



Página 74


′ 𝒙𝒊 𝒇𝒊

[150 – 156) 153 10

[156 – 162) 159 6

[162 – 168) 165 6

[168 – 174) 171 11

[174 – 180) 177 9

[180 – 186) 183 8

Σ 50

Solución

Se ha considerado a una parte de los estudiantes de la

modalidad a distancia de la Facultad de Ciencias Administrativas de la UCE, se trata de una muestra.

En consecuencia

𝑀𝑒 = 𝐿𝑖−1 + (𝑐)

𝑛

2− 𝐹𝑖−1

𝑓𝑖

Donde

𝑛

2=

50

2= 25

𝐿𝑖−1 =168

𝑐 = 6

𝐹𝑖−1 = 22

𝑓𝑖 = 11

Completando la tabla para la aplicación de la fórmula, se tiene:

𝑿𝒊−𝟏

′ − 𝑿𝒊′ 𝒙𝒊 𝒇𝒊 𝑭𝒊

[150 – 156) 153 10 10

[156 – 162) 159 6 16

[162 – 168) 165 6 22

[168 – 174) 171 11 33

[174 – 180) 177 9 42

[180 – 186) 183 8 50

∑ = 50



Página 75

Reemplazando

𝑀𝑒 = 168 + (6)

50

2− 22

11= 168 + 1.64

𝑀𝑒 = 169.64

2.3.4 MODA

La moda es el valor de la variable que tiene mayor frecuencia

absoluta o la que más se repite.

Características

1. Es la única medida de centralización que tiene sentido estudiar en una variable cualitativa, pues no precisa la realización de

ningún cálculo. 2. En su determinación no se incluyen todos los valores de la

variable.

3. El valor de la moda puede ser afectado grandemente por el método de designación de los intervalos de clases.

4. Puede ser calculada en distribuciones de frecuencia que tengan clases abiertas.

5. No es afectada por valores extremos. 6. Por su propia definición, la moda no es única, pues puede haber

dos o más valores de la variable que tengan la misma frecuencia, siendo esta máxima; en cuyo caso se tendrá una

distribución bimodal o polimodal, según el caso.

Moda de datos no agrupados

La moda es una medida que se relaciona con la frecuencia con

que se presenta el dato o los datos con mayor incidencia; por lo que se considera la posibilidad de que exista más de una moda para

un conjunto de datos.

La notación más frecuente es la siguiente: 𝑀𝑜 y �̂�. Esta medida

es aplicable tanto para datos cualitativos como cuantitativos.



Página 76

Forma de cálculo

𝑀𝑜 = 𝑓𝑖 𝑚á𝑥𝑖𝑚𝑎

𝑓𝑖 máxima, quiere decir que es la de mayor frecuencia absoluta

Tipos de moda

1. Unimodal. La moda es única. 2. Polimodal. Por su propia definición, la moda puede no ser

única, pues puede haber dos o más valores de la variable que tengan la misma frecuencia, siendo esta máxima; en cuyo caso se

tendrá una distribución bimodal o polimodal según el caso (Universidad Michoacana de San Nicolás de Hidalgo, 2015).


Determinar la moda del siguiente conjunto de datos:

1, 2, 3, 3, 4, 5, 6, 7, 7, 3, 1, 9, 3.

Solución

Para mayor facilidad, si se ordena de manera ascendente se

tiene:

1, 1, 2, 3, 3, 3, 3, 4, 5, 6, 7, 7, 9.

Se identifica el elemento que más se repite, por lo cual

𝑀𝑜 = 3

Por tanto, la moda del conjunto de datos es igual a 3 y si considera unimodal.


Determinar la moda del siguiente conjunto de datos: 1, 2, 3, 4,

4, 5, 2, 1, 3, 4, 2, 3, 4, 6, 3, 3, 4.

Solución

Para mayor facilidad, si se ordena de manera ascendente se tiene: 1, 1, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 6,

Se identifica los elementos que más se repite, por lo cual



Página 77

𝑀𝑜 = 3, y

𝑀𝑜 = 4

Las modas de este conjunto de datos son 3 y 4, ya que ambas tienen la más alta frecuencia y se determina que es bimodal.


Determinar la moda del siguiente conjunto de datos: 1, 2, 3, 4,

5, 6, 7, 8, 9

Solución

La muestra no contiene dato o datos repetidos, por lo que se considera que la muestra es amodal.

Moda de datos agrupados

Para determinar la moda de datos agrupados se debe utilizar intervalos con igual amplitud.

Fórmula

La fórmula de cálculo para la moda de datos agrupados está

dada por:

𝑀𝑜 = 𝐿𝑖−1 + (𝑐)∆𝑓𝑖

∆𝑓𝑖 + ∆𝑓𝑠

Nomenclatura

𝑀𝑜 = 𝑀𝑜𝑑𝑎

𝐿𝑖−1 = 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙

𝑐 = 𝑙𝑎 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙

∆𝑓𝑖 = 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑚𝑜𝑑𝑎𝑙 𝑠𝑜𝑏𝑟𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 𝑖𝑛𝑚𝑒𝑑𝑖𝑎𝑡𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟

∆𝑓𝑠 = 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑚𝑜𝑑𝑎𝑙 𝑠𝑜𝑏𝑟𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 𝑖𝑛𝑚𝑒𝑑𝑖𝑎𝑡𝑎 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟

∆𝑓𝑖 = 𝑓𝑖 − 𝑓𝑖−1

∆𝑓𝑠 = 𝑓𝑖 − 𝑓𝑖+1



Página 78


La edad de los estudiantes de la modalidad a distancia de la

Facultad de Ciencias Administrativas de la UCE, matriculados en el periodo abr – sep del 2015, arrojaron los resultados siguientes.

EDAD (AÑOS

CUMPLIDOS) 𝒙𝒊−𝟏

′ + 𝒙𝒊′

FRECUENCIA 𝒇𝒊

[𝟏𝟖 – 𝟐𝟖) ᴬ 1,146

[𝟐𝟖 – 𝟑𝟖) 573

[𝟑𝟖 – 𝟒𝟖) 291

[𝟒𝟖 – 𝟓𝟖) 113

MÁS DE 57 52

TOTAL 2,175

ᴬ El símbolo “[18”, significa que incluye el 18; y “28)”, significa que el 28 no

está incluido, pero si incluye los valores cercanos al 28 por la izquierda.

Se requiere calcular la moda de edad en años de los estudiantes de la modalidad a distancia.

Solución

Se ha considerado a todos los estudiantes de la modalidad a

distancia de la Facultad de Ciencias Administrativas de la UCE, se trata de toda la población.

En consecuencia

𝑀𝑜 = 𝐿𝑖−1 + (𝑐)∆𝑓𝑖


Donde

∆𝑓𝑖 = 𝑓𝑖 − 𝑓𝑖−1

𝑓𝑖−1 = 0

𝑓𝑖 = 1,146

∆𝑓𝑖 = 1,146 − 0 = 1,146

∆𝑓𝑠 = 𝑓𝑖 − 𝑓𝑖+1



Página 79

𝑓𝑖+1 = 573

𝑓𝑖 = 1,146

∆𝑓𝑠 = 1,146 − 573 = 573

𝐿𝑖−1 =18

𝑐 = 10

Reemplazando

𝑀𝑜 = 18 + (10)573

1,146 − 573= 18 + 10

𝑀𝑜 = 28 𝑎ñ𝑜𝑠

2.3.5 MEDIA GEOMÉTRICA

La media geométrica nos permite encontrar el promedio de porcentajes, razones, índices o tasas de crecimiento, es utilizada

ampliamente en los negocios y la economía, ya que frecuentemente permite determinar el cambio porcentual en ventas, sueldos, o

cifras económicas, como el Producto Interno Bruto.

La media geométrica al ser un conjunto de n números positivos

se realiza como la raíz n-enésima del producto de n valores.

Características

1. Se toman en cuenta todos los valores de la variable 2. Se utiliza cuando se quiere dar importancia a valores pequeños

de la variable 3. Su valor no es muy influenciable por datos extremos grandes.

4. No puede ser calculada en distribuciones con clase abiertas.

5. Es usada para promediar razones, tasas de cabio, interés compuesto y números índices. Es recomendada para datos de

progresión geométrica

Fórmula de la media geométrica de datos no agrupados.

Está dada por:



Página 80

𝑀𝑜 = 𝐺 = 𝑀𝑔 = √∏ 𝑥𝑖

𝑛

𝑖=1

𝑛

= √𝑥1 ∗ 𝑥2 ∗ 𝑥3 ∗ ⋯ ∗ 𝑥𝑛𝑛

Nomenclatura

𝑀𝑜 = 𝐺 = 𝑀𝑔 = 𝑚𝑒𝑑𝑖𝑎 𝑔𝑒𝑜𝑚é𝑡𝑟𝑖𝑐𝑎

𝑥𝑖 = 𝑙𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑜 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑠𝑢𝑗𝑒𝑡𝑜𝑠 𝑎 𝑙𝑎 𝑜𝑏𝑡𝑒𝑛𝑐𝑖ó𝑛 𝑑𝑒 𝐺.

𝑖 = 1, 2, 3, ⋯ , 𝑛

Usando logaritmos la fórmula queda como:

log 𝑀𝑔 =∑ 𝑙𝑜𝑔 𝑥𝑖

𝑛

𝑀𝑔 = 𝑎𝑛𝑡𝑖𝑙𝑜𝑔∑ 𝑙𝑜𝑔𝑥𝑖

𝑛


Si los precios por acción de uno de los supermercados de la

cuidad en los últimos cuatro meses fueron; 4.75, 5.23, 4.78 y 6.32 dólares por unidad. Calcular el factor de crecimiento promedio y el

crecimiento porcentual promedio.

Solución

Se considera el factor de crecimiento mes a mes, esto es 𝑥𝑖+1

𝑥𝑖,

por lo que el primer factor se tendría 5.23

4.75, el segundo sería

4.78

5.23, y así

sucesivamente. Para el cálculo de la media geométrica se tienen

dos formas de solución, de acuerdo a las fórmulas dadas.

Primer método.

Aplicando la fórmula radical, se tiene:

𝑀𝑔 = √5.23

4.75×

4.78

5.23×

6.32

4.78

3

= √1.330533

= 1.0999

El 1.0999 es factor de crecimiento promedio y para obtener el crecimiento se aplica la siguiente formula:



Página 81

𝐶𝑟𝑒𝑐𝑖𝑚𝑖𝑒𝑛𝑡𝑜 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑢𝑎𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 = (𝑀𝑔 − 1) × 100 = (1.0999 − 1) × 100

𝐶𝑟𝑒𝑐𝑖𝑚𝑖𝑒𝑛𝑡𝑜 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑢𝑎𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 = 9.99%

Segundo método.

Aplicando la fórmula logarítmica se tiene:

𝒙𝒊 𝒍𝒐𝒈𝒙𝒊 5.23

4.75= 1.101053

0.041808

4.78

5.23= 0.913958

-0.039074

6.32

4.78= 1.322176

0.121289

0.124023

𝑀𝑔 = 𝑎𝑛𝑡𝑖𝑙𝑜𝑔∑ 𝑙𝑜𝑔𝑥𝑖

𝑛

𝑀𝑔 = 𝑎𝑛𝑡𝑖𝑙𝑜𝑔0.124023

3


𝑀𝑔 = 1.0999

El 1.0999 es factor de crecimiento promedio y el crecimiento porcentual promedio es:

𝐶𝑟𝑒𝑐𝑖𝑚𝑖𝑒𝑛𝑡𝑜 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑢𝑎𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 = (𝑀𝑔 − 1) × 100 = (1.0999 − 1) × 100

𝐶𝑟𝑒𝑐𝑖𝑚𝑖𝑒𝑛𝑡𝑜 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑢𝑎𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 = 9.99%

Fórmula de la media geométrica de datos agrupados.

Está dada por:

log 𝑀𝑔 =∑ 𝑓𝑖 𝑙𝑜𝑔 𝑥𝑖

𝑛

𝑀𝑔 = 𝑎𝑛𝑡𝑖𝑙𝑜𝑔∑ 𝑓𝑖 𝑙𝑜𝑔𝑥𝑖

𝑛



Página 82



de Ciencias Administrativas de la UCE, se toma como muestra a 10 matriculados de manera aleatoria en el periodo abr – sep del 2015,

para determinar la media geométrica de estatura en centímetros. Entonces, de acuerdo a las mediciones correspondientes se tiene.

ESTATURA (EN CENTÍMETROS)

𝒙𝒊−𝟏′ + 𝒙𝒊

′


FRECUENCIA 𝒇𝒊

[𝟏𝟓𝟎 – 𝟏𝟔𝟎)

155

5 [𝟏𝟔𝟎 – 𝟏𝟕𝟎) 165 3 [𝟏𝟕𝟎 – 𝟏𝟖𝟎) 175 2

TOTAL 10

Solución

Se ha considerado a una parte de los estudiantes de la modalidad a distancia de la Facultad de Ciencias Administrativas de

la UCE, se trata de una muestra.

En consecuencia

𝑀𝑔 = 𝑎𝑛𝑡𝑖𝑙𝑜𝑔∑ 𝑓𝑖 𝑙𝑜𝑔𝑥𝑖

𝑛

Adecuando la tabla de datos a para la aplicación de la fórmula de

𝑀𝑜, se tiene:

ESTATURA (EN CENTÍMETROS)


′


FRECUENCIA 𝒇𝒊

𝒍𝒐𝒈 𝒙𝒊 𝒇𝒊𝒍𝒐𝒈𝒙𝒊

[𝟏𝟓𝟎 – 𝟏𝟔𝟎)

155

5

2.19033 10.95165

[𝟏𝟔𝟎 – 𝟏𝟕𝟎) 165 3 2.21748 6.65244

[𝟏𝟕𝟎 – 𝟏𝟖𝟎) 175 2 2.24303 4.48606

TOTAL 10 22.09015


10



Página 83

𝑀𝑔 = 𝑎𝑛𝑡𝑖𝑙𝑜𝑔 2.209015

𝑀𝑔 = 161.81 𝑐𝑒𝑛𝑡í𝑚𝑒𝑡𝑟𝑜𝑠

2.3.6 MEDIA ARMÓNICA

La Media Armónica, se representa como 𝑀𝐻 y 𝑀−1.

Dada una serie de datos 𝑥1, 𝑥2, 𝑥3, ⋯ , 𝑥𝑛, el inverso de la media

armónica de la variable 𝑥 es igual a la media aritmética del inverso

de los valores de la variable (Martínez, 2012).

Características

Es de gran utilidad cuando la variable está dada en forma de tasa.

La media armónica se basa en todas las observaciones por lo que está afectada por todos los valores de la variable.

Un valor de la variable de cero, invalida su cálculo. La media armónica está rígidamente definida y su resultado no

puede ser usado en cálculos posteriores.

Fórmula de datos no agrupados

1

𝑀−1= 𝑀 (

1

𝑥𝑖) 𝑠𝑖𝑒𝑛𝑑𝑜 → 𝑀−1 =

𝑛

∑1

𝑥𝑖

Fórmula de datos agrupados

𝑀𝐻 = 𝑀−1 =𝑛

∑𝑓𝑖

𝑥𝑖

Se adapta para tasas medias de velocidad, tiempo, rendimiento,

precio, etc.

Nomenclatura

𝑀𝐻 = 𝑀−1 = 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑚ó𝑛𝑖𝑐𝑎

𝑛 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒


Suponga que se tiene seis observaciones con los siguientes valores:

2, 8, 6, 3, 5, 4 y se quiere calcular la media armónica.



Página 84

Solución

Al aplicar la fórmula de datos no agrupados, se tiene

𝑀𝐻 = 𝑀−1 =𝑛

∑1

𝑥𝑖

𝑀𝐻 = 𝑀−1 =6

1

2+

1

8+

1

6+

1

3+

1

5+

1

4

=663

40

𝑀𝐻 = 𝑀−1 =240

63

𝑀𝐻 = 𝑀−1 = 3.81 𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠


Con los datos de la siguiente tabla de frecuencias, de una

distribución continua, calcular la media armónica.


′ 𝒙𝒊 𝒇𝒊 𝒇𝒊

𝒙𝒊

2.1 – 6 4 1 0.25

6.1 - 10 8 3 0.38

10.1 - 14 12 4 0.33

14.1 - 18 16 2 0.13

Σ 10 1.08

Solución

Al aplicar la fórmula de datos no agrupados, se tiene

𝑀𝐻 = 𝑀−1 =𝑛

∑𝑓𝑖

𝑥𝑖

𝑀𝐻 = 𝑀−1 =10

1.08

𝑀𝐻 = 𝑀−1 = 9.26 𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠



Página 85

2.4 FORMA DE LA DISTRIBUCIÓN

2.4.1 RELACIÓN ENTRE MEDIA ARITMÉTICA,

MEDIANA Y MODA

En distribuciones totalmente simétricas, la media, la mediana y

la moda coinciden, localizándose en un mismo valor. En cambio, en

distribuciones moderadamente asimétricas, la siguiente relación se mantiene aproximadamente:

Posiciones relativas de la media, la mediana y la moda para curvas de frecuencias asimétricas a derecha e izquierda

respectivamente, para curvas simétricas los tres valores coinciden (Cabrera, 2015)


Una granja ganadera registro durante febrero el nacimiento de

29 terneros, cuyos pesos al nacer (en kilogramos) fue el siguiente:

22 31 33 34 35 36 37 38 38 39

40 40 40 41 41 42 42 42 42 42 43 43 44 45 46 46 46 46 50

Los datos anteriores al ser dispuestos en una tabla de distribución de frecuencias se obtuvo la siguiente tabla resultante.



Página 86

Clases 𝒙𝒊−𝟏

′ + 𝒙𝒊′

Frecuencia 𝒇𝒊

21.5 – 26.5 1

26.5 – 31.5 1

31.5 – 36.5 4

36.5 – 41.5 9

41.5 – 46.5 13

46.5 – 51.5 1

Total 29

Calcule en las dos variantes (datos no agrupados y datos

agrupados) la media aritmética, la mediana y la moda.

Solución

Datos no agrupados:

Los nacimientos registrados en el mes de febrero es de 29

terneros, razón por la que se trata de un valor poblacional

22 31 33 34 35 36 37 38 38 39

40 40 40 41 41 42 42 42 42 42

43 43 44 45 46 46 46 46 50

Media aritmética.

La fórmula de cálculo es

μ =∑ 𝑥𝑖

N

Reemplazando los datos, se tiene

μ =22 + 31 + 33 + ⋯ + 46 + 50

29

μ =1,164

29= 40.14 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠

Mediana


𝑀𝑒 = 𝑋𝑁+1

2



Página 87

𝑋𝑁+1

2

= 𝑋29+1

2

= 𝑋30

2

= 𝑋15

Sustituyendo 𝑋15, se tiene

𝑀𝑒 = 𝑋15 = 41 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠

Moda


𝑀𝑜 = 𝑓𝑖 𝑚á𝑥𝑖𝑚𝑎

La frecuencia mayor se encuentra en el número 42, donde

𝑓𝑖 = 5.

Por tanto, se tiene que

𝑀𝑜 = 42 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠

Al comparar 𝜇, 𝑀𝑒 𝑦 𝑀𝑜, se tiene:

μ = 40.14 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠

𝑀𝑒 = 41 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠

𝑀𝑜 = 42 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠

Como

𝝁 < 𝑴𝒆 < 𝑴𝒐

Entonces, la distribución es asimétrica hacia la izquierda.



Página 88

Datos agrupados:

Para el cálculo de la media, mediana y moda, es necesario adecuar la tabla proporcionada, por la siguiente.

Clases 𝐱𝐢−𝟏

′ + 𝐱𝐢′

Marca de clase 𝒙𝒊

Frecuencia 𝒇𝒊

𝒙𝒊𝒇𝒊 Frecuencia

acumulada 𝑭𝒊

21.5 – 26.5 24 1 24 1

26.5 – 31.5 29 1 29 2

31.5 – 36.5 34 4 136 6

36.5 – 41.5 39 9 351 15

41.5 – 46.5 44 13 572 28

46.5 – 51.5 49 1 49 29

Σ 29 1,161

Media aritmética.



∑ 𝑓=

∑ 𝑓𝑥

𝑁

Reemplazando los datos, se tiene

𝜇 =1,161

29

𝜇 = 40.03 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠

Mediana


𝑀𝑒 = 𝐿𝑖−1 + (𝑐)

𝑁

2− 𝐹𝑖−1

𝑓𝑖

Para la aplicación de la fórmula, es necesario identificar el renglón de la clase mediana, para lo cual el número de elementos

se divide para dos.

𝑁

2=

29

2= 14.5



Página 89

Como 14.5 es la mitad del total, buscamos en la columna de 𝐹𝑖

el valor más cercano mayor a 14.5, obteniéndose el renglón

36.5 – 41.5 39 9 351 15

En base a este renglón y sus relacionados en la tabla, se procede a su reemplazo.

𝑀𝑒 = 36.5 + (5)

29

2− 6

9

𝑀𝑒 = 36.5 + (5)(0.94444) = 36.5 + 4.7222

𝑀𝑒 = 41.22 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠

Moda


𝑀𝑜 = 𝐿𝑖−1 + (𝑐)∆𝑓𝑖


Para la aplicación de la fórmula, es necesario identificar el renglón de la clase modal, la cual está dada por el intervalo de

clase con mayor frecuencia, esto es

41.5 – 46.5 44 13 572 28

En base a este renglón y sus relacionados en la tabla, se procede a su reemplazo.

Entonces

∆𝑓𝑖 = 𝑓𝑖 − 𝑓𝑖−1 = 13 − 9 = 4

∆𝑓𝑠 = 𝑓𝑖 − 𝑓𝑖+1 = 13 − 1 = 12

Reemplazando en la fórmula, se tiene

𝑀𝑜 = 41.5 + (5)4

4 + 12

𝑀𝑜 = 41.5 + (5)(0.25) = 41.5 + 1.25



Página 90

𝑀𝑜 = 42.75 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠

Al comparar 𝜇, 𝑀𝑒 𝑦 𝑀𝑜, se tiene:

μ = 40.03 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠

𝑀𝑒 = 41.22 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠

𝑀𝑜 = 42.75 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠

Como

𝝁 < 𝑴𝒆 < 𝑴𝒐

La gráfica de la distribución, sería aproximadamente así.

2.5 CUARTILES, DECILES Y PERCENTILES

Está claro que para localizar cuál es el valor que se encuentra al

centro de un grupo de datos utilizamos la mediana y que ésta es el valor que divide al grupo de datos en mitades. Pues bien, para

ciertos fines puede ser de mucha utilidad saber qué valor se encuentra al primer cuarto del grupo de datos, o al tercer cuarto

del grupo de datos.

De esta forma:

Los cuartiles dividen a la distribución en cuartos Los deciles en décimos, y

Los percentiles en 100 partes

Los cuales se obtienen con fórmulas que modifican la de la

mediana como en los siguientes ejemplos:



Página 91

2.5.1 Medidas de posición relativa

Estas medidas son también llamadas cuantilas, cuantiles o

fractiles y cuyo objetivo es describir el comportamiento de una variable dividiendo la serie de valores en diferente número de

partes porcentualmente iguales, las más usadas son: los cuartiles (cuartas partes), los deciles (decimas partes) y los centiles o

percentiles (centésimas partes).

Los Cuartiles

Son aquellos números que dividen a éstas en cuatro partes

porcentualmente iguales. Hay tres cuartiles 𝑄1, 𝑄2 𝑦 𝑄3 . El primer

cuartil 𝑄1 , es el valor en el cual o por debajo del cual queda

aproximadamente un cuarto (25%) de todos los valores de la

sucesión (ordenada); El segundo cuartil 𝑄2 es el valor por debajo

del cual queda el 50% de los datos (Mediana), el tercer cuartil 𝑄3

es el valor por debajo del cual quedan las tres cuartas partes (75%)

de los datos.

Los Deciles

Son ciertos números que dividen el conjunto de observaciones (ordenadas) en diez parte porcentualmente iguales. Los deciles se

denotan por 𝐷1, 𝐷2, ⋯ , 𝑄9 . El decil 5 corresponde al cuartil 2

(mediana).

Los Percentiles

Son ciertos números que dividen el conjunto de datos ordenados en cien partes porcentualmente iguales. El percentil 50 equivale a

la mediana.

Considerando la definición de la mediana, esta será el segundo

cuartil, el quinto decil o el 50avo percentil o centil. En cualquiera de

estas medidas el valor matemático que se obtenga será representativo del número de datos o menos que corresponde al

valor relativo planteado. (Ejemplo: el primer cuartil es un valor representativo del 25% o menos de los valores de una distribución,

es decir, los valores inferiores de la distribución).

Cuantiles para datos no agrupados

Para ubicar los cuartiles, deciles y percentiles, se aplica la siguiente fórmula, siendo este valor la posición donde se ubican.



Página 92

Ubicación de un centil:

𝐿𝑐 = (𝑛 + 1)𝑃

100

donde:

𝐿𝑐, 𝑒𝑠 𝑙𝑎 𝑟𝑒𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎𝑐𝑖ó𝑛 𝑑𝑒𝑙 𝑐𝑢𝑎𝑟𝑡𝑖𝑙, 𝑑𝑒𝑐𝑖𝑙 𝑜 𝑐𝑒𝑛𝑡𝑖𝑙.

𝑛, 𝑒𝑠 𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠.

𝑃, 𝑒𝑠 𝑙𝑎 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒𝑙 𝑐𝑢𝑎𝑟𝑡𝑖𝑙, 𝑑𝑒𝑐𝑖𝑙 𝑜 𝑐𝑒𝑛𝑡𝑖𝑙.

Para calcular los cuartiles, deciles y centiles primero se debe

ordenar los datos.


Con la información que siguiente:

18 23 38 41 43 45 50 51 52 53 54 54 58

58 58 59 60 62 63 63 66 71 77 83 84 95

Se pide:

a. Calcular el primer y tercer cuartil.

b. Calcular el sexto decil.

c. Calcular el ochenta percentil.

Solución

a. Calcular el primer y tercer cuartil.

Primer cuartil. Donde 𝑄1 = 𝑃25

𝐿𝑐 = (𝑛 + 1)𝑃

100

Reemplazando los datos del problema en la fórmula general, se

tiene

𝐿𝑐 = (26 + 1)25

100



Página 93

𝐿𝑐 = 6.75 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛

El valor observado indica la posición del primer cuartil.

En el conjunto de datos la posición del primer cuartil, ocupa la posición 6 y 7, siendo 45 y 50 y se calcula de la siguiente manera:

6 45

7 50

Restamos el valor mayor del menor, es decir,

50 − 45 = 5

Se resta la posición del primer cuartil y el inmediato anterior

entero.

6.75 − 6 = 0.75

Se procede a multiplicar

5 ∗ 0.75 = 3.75

El resultado obtenido de la multiplicación más el valor menor, es el primer cuartil; es decir,

45 + 3.75 = 48.75

A los cuartiles se les abrevia con la letra 𝑄, entonces el 𝑄1, es:

𝑄1 = 48.75

Tercer cuartil. Donde 𝑄3 = 𝑃75

𝐿𝑐 = (𝑛 + 1)𝑃

100

Reemplazando los datos del problema en la fórmula general, se

tiene

𝐿𝑐 = (26 + 1)75

100


El valor observado indica la posición del tercer cuartil.



Página 94

En el conjunto de datos la posición del tercer cuartil, ocupa la posición 20 y 21 siendo 63 y 66 y se calcula de la siguiente

manera:

20 63

21 66

Restamos el valor mayor del menor, es decir,

66 − 63 = 3

Se resta la posición del tercer cuartil y el inmediato anterior

entero.

20,25 – 20 = 0,25


3 ∗ 0.25 = 0,75

El resultado obtenido de la multiplicación más el valor menor es

el tercer cuartil, es decir,

63 + 0.75 = 63.75

Por tanto,

𝑄3 = 63.75

b. Calcular el sexto decil.

𝐿𝑐 = (𝑛 + 1)𝑃

100

El sexto decil es igual a 60 percentil, por tanto:

𝐿𝑐 = (26 + 1)60

100


Realizando la interpolación correspondiente, se tiene:

16 59

17 60



Página 95

Restamos el valor mayor del menor, es decir:

60 − 59 = 1

Se resta la posición del sexto decil y el inmediato anterior entero.

16.2 – 16 = 0.2


1 ∗ 0.2 = 0.2

El resultado obtenido de la multiplicación más el valor menor, es el sexto decil, es decir:

59 + 0.2 = 59.20

Por tanto

𝐷6 = 59.20

c. Calcular el ochenta percentil.

𝐿𝑐 = (𝑛 + 1)𝑃

100

Reemplazando percentil 80, en P, entonces:

𝐿𝑐 = (26 + 1)80

100


Realizando la interpolación correspondiente, se tiene:

21 66

22 71

Restamos el valor mayor del menor, es decir:

71 − 66 = 5

Se resta la posición del percentil 80 y el inmediato anterior

entero.



Página 96

21.16 – 21 = 0.16

Se procede a multiplicar los resultados obtenidos

5 ∗ 0.16 = 0.8

El resultado obtenido de la multiplicación más el valor menor, es el percentil 80, es decir:

66 + 0.8 = 66.80

Por tanto

𝑃80 = 59.20

Cuantiles para datos agrupados

Para calcular los cuartiles 𝑄𝑘, deciles 𝐷𝑘 y percentiles 𝑃𝑘, se

aplica las fórmulas que siguen.

𝑄𝑘 = 𝐿𝑖−1 +

𝑘𝑛

4− 𝐹𝑖−1

𝑓𝑖 ∗ 𝑐𝑖

donde 𝑘 = 1,2,3

𝐷𝑘 = 𝐿𝑖−1 +

𝑘𝑛

10− 𝐹𝑖−1


donde 𝑘 = 1,2,3, … , 9

𝑃𝑘 = 𝐿𝑖−1 +

𝑘𝑛

100− 𝐹𝑖−1


donde 𝑘 = 1,2,3, … , 99

Nomenclatura

𝐿𝑖−1 = 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑐𝑢𝑎𝑟𝑡𝑖𝑙 𝑜 𝑑𝑒𝑐𝑖𝑙 𝑜 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙

𝑐 = 𝑙𝑎 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 𝑐𝑢𝑎𝑟𝑡𝑖𝑙 𝑜 𝑑𝑒𝑐𝑖𝑙 𝑜 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙

𝐹𝑖−1 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑐𝑢𝑎𝑟𝑡𝑖𝑙 𝑜 𝑑𝑒𝑐𝑖𝑙 𝑜 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙

𝑓𝑖 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑐𝑢𝑎𝑟𝑡𝑖𝑙 𝑜 𝑑𝑒𝑐𝑖𝑙 𝑜 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙



Página 97


Para la tabla de salarios de la compañía P&R, encontrar:

a. Los cuartiles 𝑄1, 𝑄2 𝑦 𝑄3.

b. Decil 𝐷6.

c. Percentil 𝑃80.

Salarios Frecuencia

𝒇𝒊

Frecuencia

acumulada 𝑭𝒊

250.00 - 259.99 8 8

260.00 - 269.99 10 18

270.00 - 279.99 16 34

280.00 - 289.99 14 48

290.00 - 299.99 10 58

300.00 - 309.99 5 63

310.00 - 319.99 2 65

Σ 65

Solución

a. Los cuartiles 𝑄1, 𝑄2 𝑦 𝑄3.

𝑄𝑘 = 𝐿𝑖 +

𝑘𝑛

4− 𝐹𝑖−1


Para la aplicación de 𝑄1, tenga en cuenta que 𝑘 = 1, por

consiguiente

𝑄1 = 260 +

1∗65

4− 8

10(10)

𝑄1 = 260 +16.25 − 8

10(10)

𝑄1 = 268.25




Página 98

consiguiente

𝑄2 = 270 +

2∗65

4− 18

16(10)

𝑄2 = 270 +32.5 − 18

16(10)

𝑄2 = 279.06


consiguiente

𝑄3 = 290 +

3∗65

4− 48

10(10)

𝑄3 = 289.995 +48.75 − 48

10(10)

𝑄3 = 290.75

b. Decil 𝐷6.

𝐷𝑘 = 𝐿𝑖−1 +

𝑘𝑛

10− 𝐹𝑖−1


Para la aplicación de 𝐷6, tenga en cuenta que 𝑘 = 6, por

consiguiente

𝐷6 = 280 +

6∗65

10− 34

14 ∗ 10

𝐷6 = 280 + 3.57

𝐷6 = 283.57

c. Percentil 𝑃80.

𝑃𝑘 = 𝐿𝑖−1 +

𝑘𝑛

100− 𝐹𝑖−1


Para la aplicación de 𝑃80, tenga en cuenta que 𝑘 = 80, por

consiguiente



Página 99

𝑃80 = 290 +52 − 48

10 ∗ 10

𝑃80 = 290 + 4

𝑃80 = 294

2.6 ESTADÍGRAFOS DE DISPERCIÓN

Los métodos numéricos que describen a los conjuntos de observaciones tienen como objetivo dar una imagen mental de la

distribución de frecuencias. Una vez localizado el centro de la distribución de un conjunto de datos, lo que procede es buscar una

medida de dispersión de los datos (García Pérez, 2015).

La dispersión o variación es una característica importante de un

conjunto de datos porque intenta dar una idea de cuán esparcidos se encuentran éstos. Se puede diferenciar dos tipos de dispersión,

las absolutas y relativas.

2.6.1 DISPERCIÓN ABSOLUTA

Se toma como punto central de referencia la media aritmética,

aunque puede considerarse además a la mediana. Entre las medidas de dispersión absoluta se tiene al rango, desviación media,

varianza y desviación estándar.

Rango

Se obtiene sacando la diferencia entre el valor mayor y el valor

meno de un conjunto de datos.

Características

El rango es la medida de dispersión más sencilla de calcular e

interpretar. Se basa en los valores extremos por lo que puede ser errática

El recorrido solo se encuentra influenciado por los valores extremos y no considera el resto de valores de la variable.

Existe el peligro que el recorrido ofrezca una descripción distorsionada de la dispersión cuando existe valores muy

pequeños o muy grandes.



Página 100

Fórmula

𝑅 = 𝑣𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 – 𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜.

𝑅 = 𝑥𝑛 − 𝑥1

Nomenclatura

𝑅 = 𝑟𝑎𝑛𝑔𝑜

𝑥1 = 𝑝𝑟𝑖𝑚𝑒𝑟 𝑡é𝑟𝑚𝑖𝑛𝑜

𝑥𝑛 = ú𝑙𝑡𝑖𝑚𝑜 𝑡é𝑟𝑚𝑖𝑛𝑜


El número de pacientes atendidos en emergencias en una clínica privada de la ciudad, en un periodo de 8 días del mes pasado fue:

3 1 5 8 2 4 8 3

Calcule e interprete el rango.

Solución:

La fórmula del rango es:

𝑅 = 𝑥𝑛 − 𝑥1

Ordenando la serie,

1 2 3 3 4 5 8 8

El número de elementos está dado por

𝑛 = 8

Por tanto

𝑅 = 𝑥8 − 𝑥1

Reemplazando valores en la fórmula, se tiene

𝑅 = 8 − 1 = 7



Página 101

Desviación media

La desviación media es el promedio de los valores absolutos de

las desviaciones en relación de la media aritmética.

Características

Con datos no agrupados, guarda el mismo número de dimensiones y observaciones.

La suma de valores absolutos es relativamente sencilla de

calcular. Es engorroso trabajar con ella cuando se trata de poblaciones o

muestras grandes en datos no agrupados.

Cuanto mayor sea el valor de la desviación media, mayor es la dispersión de los datos.

La desviación media al tomar los valores absolutos mide una observación sin mostrar si la misma está por encima o por

debajo de la media aritmética.

Fórmula para datos no agrupados

𝐷𝑀 =|𝑥𝑖 − �̅�|

𝑛

Nomenclatura

𝑥𝑖 = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛

�̅� = 𝑚𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎.

𝑛 = 𝑐𝑜𝑛𝑗𝑢𝑛𝑡𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠

|𝒙𝒊 − �̅�| = 𝐸𝑠 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑜 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑢𝑛𝑎 𝑑𝑒 −

𝑙𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑐𝑜𝑛 𝑟𝑒𝑠𝑝𝑒𝑐𝑡𝑜 𝑎 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎



3 1 5 8 2 4 8 3

Calcule e interprete la Desviación Media.



Página 102

Solución.

Para la aplicación de la fórmula de 𝐷𝑀, primero se debe calcular

la media aritmética. Por tanto

X̅ =∑ 𝑥𝑖

n

X̅ =3 + 1 + 5 + 8 + 2 + 4 + 8 + 3

8=

34

8

�̅� = 4.25

Para una mejor comprensión se ha preparado una tabla en la

que se notará las operaciones necesarias y el valor absoluto correspondiente.

𝒙𝒊 |𝒙𝒊 − �̅�| Desviación Absoluta

3 |3 − 4,25| = |− 1.25| 1.25

1 |1 − 4,25| = |− 3.25| 3.25

5 |5 − 4,25| = |0.75| 0.75

8 |8 − 4,25| = |3.75| 3.75

2 |2 − 4,25| = |− 2.25| 2.25

4 |4 − 4,25| = |− 0.25| 0.25

8 |8 − 4,25| = | 3.75| 3.75

3 |3 − 4,25| = |−1.25| 1.25

34 16.5

Con estos datos se calcula la desviación media en base a la siguiente fórmula:

𝐷𝑀 =|𝑥𝑖 − �̅�|

𝑛

Reemplazando valores, se tiene:

𝐷𝑀 =16.50

8

𝐷𝑀 = 2.06

Se observa que la desviación media es de 2.06 pacientes por

día, es decir que el número varía, en promedio, en 2.06 pacientes por día respecto de la media de 4.25 enfermos diarios.



Página 103

Fórmula para datos agrupados.

Se emplea la ecuación:

𝐷𝑀 =𝛴𝑓𝑖|𝑥𝑚 − �̅�|

𝑛

Nomenclatura

𝑓𝑖 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜

𝑥𝑚 = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑚𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒

�̅� = 𝑚𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎.

𝑛 = 𝑐𝑜𝑛𝑗𝑢𝑛𝑡𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠


Calcular la desviación media de las calificaciones finales en la asignatura de matemáticas, de un curso de 40 estudiantes, según

datos de la tabla que sigue.

Calificación Cantidad de

estudiantes

(0 − 2] (2 − 4]

2

4 (4 − 6] 8 (6 − 8] 16

(8 − 10] 10

Total 40

Solución:

Para calcular la media aritmética se llena la siguiente tabla:


estudiantes 𝒇𝒊

Marca de clase 𝒙𝒎

𝒇𝒊𝒙𝒎

(0 − 2] (2 − 4]

2

4

1 2

3 12 (4 − 6] 8 5 40 (6 − 8] 16 7 112

(8 − 10] 10 9 90

Σ 40 Σ 256



Página 104

Calculando la media aritmética se obtiene:

�̅� =∑ 𝑓𝑖𝑥𝑖

𝑛

�̅� =256

40

�̅� = 6.4

Para calcular la desviación media es necesario adecuar la tabla de la siguiente forma:



Marca de

clase 𝒙𝒎 |𝒙𝒎 − �̅�| 𝒇𝒊|𝒙𝒎 − �̅�|

(0 − 2] (2 − 4]

2

4

1 5.4 10.8

3 3.4 13.6

(4 − 6] 8 5 1.4 11.2

(6 − 8] 16 7 0.6 9.6

(8 − 10] 10 9 2.6 26.0

Σ 40 Σ 71.2

𝐷𝑀 =𝛴𝑓𝑖|𝑥𝑚 − �̅�|

𝑛

𝐷𝑀 =71.2

40

𝐷𝑀 = 1.78

Varianza

La varianza de un conjunto de datos se define como el cuadrado

de la desviación típica y viene dada en consecuencia por 𝜎2 .

Cuando sea necesario distinguir la desviación típica de una población y de una muestra, se usará 𝜎2 o 𝑠2 ,

correspondientemente.

La varianza no puede ser negativa.

Características

Para su cálculo se utilizan todos los valores.

No se ve influenciada por valores extremos.



Página 105

La varianza indica el grado en que están dispersos los datos en una distribución. A mayor medida, mayor dispersión.

La varianza es un número muy grande con respecto a las observaciones, por lo que con frecuencia se vuelve difícil para

trabajar. Debido a que la varianza siempre se expresa en términos de los

datos originales elevados al cuadrado, el resultado tiene unidades de medida al cuadrado, lo cual no permite una

apreciación lógica.

Para solucionar las complicaciones que se tiene con la varianza, se halla la raíz cuadrada de la misma, es decir, se calcula la

desviación estándar.

Fórmulas

Para el cálculo de la varianza poblacional y muestral se debe

tener en cuenta si se trata de datos agrupados o no agrupados.

Datos no agrupados

𝜎2 =∑(𝑥𝑖 − 𝜇)2

𝑁

𝑠2 =∑(𝑥𝑖 − �̅�)2

𝑛 − 1

Datos agrupados

𝜎2 =∑ 𝑓𝑖(𝑥𝑖 − 𝜇)2

𝑁

𝑠2 =∑ 𝑓𝑖(𝑥𝑖 − �̅�)2

𝑛 − 1

Nomenclatura

𝜎2 = 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛

𝑥𝑖 = 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎

𝑓𝑖 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜



Página 106

𝜇 = 𝑚𝑒𝑑𝑖𝑎 𝑎𝑟𝑡𝑖𝑚é𝑡𝑖𝑐𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙

𝑁 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛

𝑠2 = 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎

�̅� = 𝑚𝑒𝑑𝑖𝑎 𝑎𝑟𝑡𝑖𝑚é𝑡𝑖𝑐𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎

𝑛 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎



3 1 5 8 2 4 8 3

Calcule e interprete la varianza.

Solución.

Para la aplicación de la fórmula de 𝑠2, primero se debe calcular

la media aritmética. Por tanto

X̅ =∑ 𝑥𝑖

n

X̅ =3 + 1 + 5 + 8 + 2 + 4 + 8 + 3

8=

34

8

�̅� = 4.25

La fórmula de la varianza muestral

𝑠2 =∑(𝑥𝑖 − �̅�)2

𝑛 − 1

Reemplazando los datos en la fórmula, se tiene.

𝑠2 =

(3 − 4.25)2 + (1 − 4.25)2 + (5 − 4.25)2 + (8 − 4.25)2

+(2 − 4.25)2 + (4 − 4.25)2 + (8 − 4.25)2 + (3 − 4.25)2

8 − 1

𝑠2 =1.5625 + 10.5625 + 0.5625 + 14.0625 + 5.0625 + 0.0615 + 14.0625 + 1.5625

8 − 1



Página 107

𝑠2 =47.50

8 − 1

𝑠2 = 6.79 𝑝𝑎𝑐𝑖𝑒𝑛𝑡𝑒𝑠2


Calcular la varianza de las calificaciones finales en la asignatura

de matemáticas, de un curso de 40 estudiantes, según datos de la

tabla que sigue.


estudiantes (0 − 2] (2 − 4]

2

4 (4 − 6] 8 (6 − 8] 16

(8 − 10] 10

Total 40

Solución:

Para calcular la varianza es necesario primero calcular la media aritmética, la siguiente tabla permite su cálculo.



Marca de

clase 𝒙𝒊 𝒇𝒊𝒙𝒊

(0 − 2] (2 − 4]

2

4

1 2

3 12 (4 − 6] 8 5 40 (6 − 8] 16 7 112

(8 − 10] 10 9 90

Σ 40 Σ 256

La media aritmética es:

�̅� =∑ 𝑓𝑖𝑥𝑖

𝑛

�̅� =256

40

�̅� = 6.4



Página 108

Para calcular la varianza es necesario adecuar la tabla de la siguiente forma:



Marca de

clase 𝒙𝒊 (𝒙𝒊 − �̅�)𝟐 𝒇𝒊(𝒙𝒊 − �̅�)𝟐

(0 − 2] (2 − 4]

2

4

1 29.16 58.32

3 11.56 46.24

(4 − 6] 8 5 1.96 15.68

(6 − 8] 16 7 0.36 5.76

(8 − 10] 10 9 6.76 67.6

Σ 40 Σ 193.6

La fórmula para el cálculo de la varianza del problema, es

𝑠2 =∑ 𝑓𝑖(𝑥𝑖 − �̅�)2

𝑛 − 1

𝑠2 =193.6

40 − 1

𝑠2 = 4.96 𝑝𝑢𝑛𝑡𝑜𝑠2

Desviación estándar

Es la medida más frecuentemente usada de variabilidad y se calcula

como la raíz cuadrada de la varianza.

Características

Expresa la cantidad de variabilidad promedio en una distribución. Permite determinar cómo se distribuyen los valores en relación

con la media Su fórmula es indistinta para distribuciones de datos originales o

agrupados.

Para solucionar las complicaciones que se tiene con la varianza,

se halla la raíz cuadrada de la misma, es decir, se calcula

la desviación estándar es un número pequeño expresado en

unidades de los datos originales y que tiene un significado

lógico.

A pesar de lo anterior, es difícil describir exactamente qué es lo

que mide la desviación estándar. Sin embargo, el teorema de



Página 109

Chebyshev establece que para todo conjunto de datos en una distribución, se cumple lo siguiente.

𝜇 ± 𝜎 ≅ 𝑎𝑙 68% 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑑𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛

𝜇 ± 2𝜎 ≅ 𝑎𝑙 95% 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑑𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛

𝜇 ± 3𝜎 ≅ 𝑎𝑙 99.74% 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑑𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛


𝜎 = √𝜎2

Fórmula muestral

𝑠 = √𝑠2

Nomenclatura

𝜎 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙

𝑠 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙


Calcule las desviaciones estándar de los ejemplos de aplicación

26 y 27.

Ejemplos aplicación 26



Página 110

Se tiene que


Aplicando la fórmula de la desviación estándar

𝑠 = √6.79

𝑠 = 2.61 𝑝𝑎𝑐𝑖𝑒𝑛𝑡𝑒𝑠

Ejemplos de aplicación 27

Se tiene que


Aplicando la fórmula de la desviación estándar

𝑠 = √4.96

𝑠 = 2.23 𝑝𝑢𝑛𝑡𝑜𝑠

2.6.2 DISPERCIÓN RELATIVA

Cuando el objetivo es realizar comparaciones, no resulta adecuado comparar magnitudes absolutas, ya que las unidades no

son siempre comparables.

Cuando se pretende comparar la dispersión de variables

medidas en distintas unidades o variables con distinto orden de magnitud, es necesario relativizar.

Coeficiente de variabilidad

Una forma de relativizar es considerar la dispersión en relación al valor absoluto de la media, consiguiendo así el coeficiente de

variación, que suele ser interpretado en términos de proporción o porcentaje:

El coeficiente de variación es la razón (cociente) de la desviación estándar y la media aritmética expresada con un porcentaje.

Características

Se utiliza cuando no es posible una comparación directa de dos

o más medidas de dispersión y muy útil cuando:



Página 111

Los datos están en unidades diferentes (como dólares y días de inasistencia)

Los datos están en las mismas unidades, pero los valores medios están muy distantes (como sucede con los ingresos de

ejecutivos superiores, y el ingreso de empleados no calificados)

Fórmula

Se calcula con la siguiente fórmula:

𝐶𝑉 =𝑠

|�̅�|

Nomenclatura

𝐶𝑉 = 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛

𝑠 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟

|�̅�| = 𝑣𝑎𝑙𝑜𝑟 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎



3 1 5 8 2 4 8 3

Calcule e l coeficiente de variación.

Solución.

La media aritmética es

�̅� = 4.25

La varianza es


La desviación estándar es


La fórmula para el cálculo del coeficiente de variación es



Página 112

𝐶𝑉 =𝑠

|�̅�|

Reemplazando valores, se tiene

𝐶𝑉 =2.61

|4.25|

𝐶𝑉 = 0.61 𝑝𝑎𝑐𝑖𝑒𝑛𝑡𝑒𝑠


Calcular el coeficiente de variación de las calificaciones finales en

la asignatura de matemáticas, de un curso de 40 estudiantes, según datos de la tabla que sigue.

Calificación Cantidad

de estudiantes

(0 − 2] (2 − 4]

2 4

(4 − 6] 8 (6 − 8] 16

(8 − 10] 10

Total 40

Solución:


�̅� = 6.4

La varianza es




La fórmula para el cálculo del coeficiente de variación es

𝐶𝑉 =𝑠

|�̅�|




Página 113

𝐶𝑉 =2.23

|6.4|

𝐶𝑉 = 0.35

2.7 MEDIDAS DE ASIMETRÍA

Mide la desviación de la simetría, expresada la diferencia entre la media y la mediana con respecto a la desviación estándar del

conjunto de mediciones de la población o muestra.

En un conjunto de datos con asimetría positiva, la parte

alargada de la gráfica está a la derecha y cuando un conjunto de datos con asimetría negativa, la parte alargada de la gráfica está a

la izquierda.

Características

Definiremos asimetría positiva, cuando 𝑀𝑑 ≤ 𝑀𝑒 ≤ �̅� . Esto

queda reflejado en el diagrama de barras o en un histograma

presentando la distribución de los datos una cola a la derecha.

Definiremos asimetría negativa, cuando �̅� ≤ 𝑀𝑒 ≤ 𝑀𝑑 . Esto

queda reflejado en el diagrama de barras o en un histograma

presentando la distribución de los datos una cola a la izquierda.

Fórmula

𝐶𝐴 =3(�̅� − 𝑀𝑒)

𝑠



Página 114

Tomando en cuenta esta relación, el coeficiente de asimetría puede variar desde −3 hasta +3. Un valor cercano a −3, como por

ejemplo −2.57 indica una considerable asimetría negativa; un valor

como +1.63 indica una asimetría positiva moderada. El valor de 0

que se presenta cuando la media y la mediana son iguales, señala que la distribución es simétrica.

Nomenclatura

𝐶𝐴 = 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑎𝑠𝑖𝑚𝑒𝑡𝑟í𝑎

�̅� = 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎

𝑀𝑒 = 𝑚𝑒𝑑𝑖𝑎𝑛𝑎

𝑠 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟



3 1 5 8 2 4 8 3

Calcule el coeficiente de asimetría.

Solución.

El ejemplo tiene una media aritmética de

�̅� = 4.25

Una mediana de

𝑀𝑒 = 3.5

Una desviación estándar de


La fórmula de coeficiente de variación es

𝐶𝐴 =3(�̅� − 𝑀𝑒)

𝑠




Página 115

𝐶𝐴 =3(4.25 − 3.5)

2.61

𝐶𝐴 =2.25

2.61

𝐶𝐴 = 0.86

Definiremos asimetría positiva, cuando 𝑀𝑒 ≤ �̅� . Presenta la

distribución de los datos una cola a la derecha.


Calcular el coeficiente de asimetría de las calificaciones finales en la asignatura de matemáticas, de un curso de 40 estudiantes, según

datos de la tabla que sigue.

Calificación Cantidad de estudiantes

(0 − 2] (2 − 4]

2 4

(4 − 6] 8 (6 − 8] 16

(8 − 10] 10

Total 40

Solución:


�̅� = 6.4 𝑝𝑢𝑛𝑡𝑜𝑠

La mediana es

𝑀𝑒 = 6.75 𝑝𝑢𝑛𝑡𝑜𝑠



La fórmula para el cálculo del coeficiente de asimetría es

𝐶𝐴 =3(�̅� − 𝑀𝑒)

𝑠



Página 116

𝐶𝐴 =3(6.4 − 6.75)

2.23

𝐶𝐴 = −0.47

Definiremos asimetría negativa, cuando �̅� ≤ 𝑀𝑒 . Presenta la

distribución de los datos una cola a la izquierda.

2.8 MEDIDAS DE APUNTAMIENTO O CURTOSIS

La curtosis mide el grado de agudeza o achatamiento de una

distribución con relación a la distribución normal, es decir, mide cuán puntiaguda es una distribución.

Se definen 3 tipos de distribuciones según su grado de curtosis:

1. Distribución mesocúrtica: presenta un grado de concentración

medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).

2. Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores centrales de la variable.

3. Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable

(Aula Fácil, 2015).

Características

𝑔2 = 0 ; 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑚𝑒𝑠𝑜𝑐ú𝑟𝑡𝑖𝑐𝑎



Página 117

𝑔2 > 0 ; 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑙𝑒𝑝𝑡𝑜𝑐ú𝑟𝑡𝑖𝑐𝑎

𝑔2 < 0 ; 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑝𝑙𝑎𝑡𝑖𝑐ú𝑟𝑡𝑖𝑐𝑎

Fórmula

El coeficiente de curtosis viene definido por la siguiente fórmula:

𝑔2 =𝑚4

𝑠4− 3 =

1

𝑛∑ (𝑥𝑖 − �̅�)4𝑚

1

𝑠4− 3

𝑔2 =

1

𝑛∑ 𝑓𝑖(𝑥𝑖 − �̅�)4𝑚

1

𝑠4− 3



Página 118


Calcular el coeficiente de apuntamiento o curtosis de las

calificaciones finales en la asignatura de matemáticas, de un curso de 40 estudiantes, según datos de la tabla que sigue.

Calificación Cantidad

de estudiantes

(0 − 2] (2 − 4]

2 4

(4 − 6] 8 (6 − 8] 16

(8 − 10] 10

Total 40

Solución:


�̅� = 6.4 𝑝𝑢𝑛𝑡𝑜𝑠



La fórmula para el cálculo del coeficiente de apuntamiento es

𝑔2 =𝑚4

𝑠4− 3 =

1

𝑛∑ 𝑓𝑖(𝑥𝑖 − �̅�)4𝑚

1

𝑠4− 3

𝑔2 =

1

40[2(1 − 6.4)4 + 4(3 − 6.4)4 + 8(5 − 6.4)4 + 16(7 − 6.4)4 + 10(9 − 6.4)4]

(2.23)4− 3

𝑔2 =

1

40[2(−5.4)4 + 4(−3.4)4 + 8(−1.4)4 + 16(−0.6)4 + 10(−2.6)4]

(2.23)4− 3

𝑔2 =

1

40[1,700.61 + 534.53 + 30.73 + 2.07 + 456.98]

24.73− 3

𝑔2 =2,724.93

989.2− 3

𝑔2 = 2.7547 − 3

𝑔2 = −0.2453



Página 119

Como

𝑔2 < 0

Entonces la distribución es platicúrtica.



Página 120

3 CAPÍTULO III: NÚMEROS ÍNDICES

OBJETIVOS

El estudiante podrá:

1. Expresar las características y definir un número índice. 2. Calcular e interpretar los números índices de precios, cantidad y

valor. 3. Calcular e interpretar los números índices simples, ponderados y

no ponderados.

3.1 INTRODUCCIÓN

Número índice es una medida estadística diseñada para poner de relieve cambios en una variable o en un grupo de variables

relacionadas con respecto al tiempo, situación geográfica, ingresos, o cualquier otra característica. (Spiegel, 1997)

Número índice es un número que expresa el cambio relativo en

precio, cantidad o valor comparado con un periodo base. (Lind, Marchal, & Wathen, 2006).

3.2 CARACTERÍSTICAS

Es un porcentaje, pero generalmente se omite el signo porcentual.

Tiene un período base.

La mayor parte de los índices se aproximan al décimo más próximo de un porcentaje .

La base de la mayor parte de los índices es 100.

3.3 CLASIFICACIÓN DE LOS NÚMEROS ÍNDICES

3.3.1 NÚMEROS ÍNDICES DE PRECIOS

Es un número que expresa el cambio relativo de precio comparando con un periodo base. El índice de este tipo más

conocido es Índice de precios al consumidor (IPC), el cual mide el

costo de vida en los países.



Página 121

3.3.2 NÚMEROS ÍNDICES DE CANTIDAD

Es un número que expresa el cambio relativo de cantidad de una

variable comparando con un periodo base.

3.3.3 NÚMEROS ÍNDICES DE VALOR

Es un número que expresa el cambio relativo de valor

comparando con un periodo base. Es decir mide los cambios en el valor monetario total. (Levin & Rubin, 2004)

3.4 NÚMEROS ÍNDICES SIMPLES

Son los que se refieren a una sola magnitud, y por lo tanto nos

proporcionan la variación que ha sufrido esa magnitud en dos periodos distintos.

Se calcula hallando el cociente del valor del año determinado entre el valor del año base por 100, así:

𝑃 =𝑝𝑡

𝑝𝑜∗ 100

Donde:

𝑃 = í𝑛𝑑𝑖𝑐𝑒 𝑠𝑖𝑚𝑝𝑙𝑒

𝑝𝑡 = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝑎ñ𝑜 𝑑𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑎𝑑𝑜

𝑝𝑜 = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝑎ñ𝑜 𝑏𝑎𝑠𝑒


El salario básico unificado en enero del 2012 fue de $292, el salario básico unificado en enero del 2015 fue de $354. Cuál es el

índice correspondiente para los trabajadores en enero del 2015, con base en los datos de enero del 2012?

𝑃 =𝑝𝑡

𝑝𝑜∗ 100 =

354

292 100 = 121.23

Durante este periodo aumento en 121.23 − 100 = 21.23 el salario

básico unificado.



Página 122


En el 2013 la población de hombres en Ecuador fue de 7,868,368 y el de mujeres fue de 7,869,510 ¿Cuál fue la proporción

de la población de hombres comparada con la de mujeres?

𝑃 =𝑝𝑡

𝑝𝑜∗ 100 =

7,868,368

7,869,510 100 = 99.98

El índice de hombres es de 99.98 de la población de mujeres o la población de hombres es 100 − 99.98 = 0.02 menor que la de

mujeres


Los siguientes datos, se tomaron de los informes anuales de la

empresa Johnson & Johnson, de la misma que sus acciones comunes se enlistan en la Bolsa de Valores con el símbolo de JNJ.

Tomando como base el año 1991, calcular el Índice Simple.

Regla de tres : 5.43 ---- 100 %

6.25 ---- x = 115,10

Años

Ventas

Nacionales

(miles de

dólares)

Cálculo del Índice Índice

Simple %

1991 5.43 5.43 /5.43 =1 100

1992 6.25 6.25 /5.43 =1.15101289 115.1

1993 6.9 6.90 /5.43 =1.2071823 127.07

1994 7.2 7.20 /5.43 =1.32596685 132.6

1995 7.81 7.81 /5.43 =1.43830571 143.83

1996 9.19 9.19 /5.43 =1.69244936 169.24

3.5 NÚMEROS ÍNDICES NO PONDERADOS

3.5.1 PROMEDIO SIMPLE DE LOS ÍNDICES DE

PRECIOS

Este índice se obtiene sumando los índices simples de cada

producto y dividiendo para el número de productos.



Página 123

Así:

𝑃 = ∑ 𝑃𝑖

𝑛

𝑃𝑖 = Í𝑛𝑑𝑖𝑐𝑒𝑠 𝑠𝑖𝑚𝑝𝑙𝑒𝑠 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑢𝑛𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑝𝑟𝑜𝑑𝑢𝑐𝑡𝑜𝑠

𝑛 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑝𝑟𝑜𝑑𝑢𝑐𝑡𝑜𝑠


Tomando como base los siguientes datos se calcula el promedio

simple de los índices de precios relativos.

𝑃 =100 + 115.1 + 127.07 + 132.60 + 143.83 + 169.24

6

𝑃 =787.85

6

𝑃 = 131.31


Un administrador estudia la evolución de los precios de un artículo que produce su empresa en los 5 últimos años, los valores

se registran en la siguiente tabla. Calcule el promedio simple de los índices de precios, tomando como periodo de referencia el año 1.

Años 1 2 3 4 5

Precio del producto 4 5.5 6 5 8

Primero calculo los índices simples

Años Precio del

producto

Índice

Simple

1 4 100

2 5.5 137.5

3 6 150

4 5 125

5 8 200

𝑃 = ∑ 𝑃𝑖

𝑛 =

100 + 137.5 + 150 + 125 + 200

5 = 142.5



Página 124

Esto indica que el precio del producto a incrementado en 42.5%

3.5.2 ÍNDICE AGREGADO SIMPLE

Un índice agregado simple se calcula sumando todos los

elementos de un periodo dado y luego dividiendo este resultado entre la suma de los mismos elementos durante el periodo base.

Así:

𝑃 = ∑ 𝑃𝑖

∑ 𝑃0∗ 100

𝑃𝑖 ∶ Cantidad de elementos del periodo que se desea el índice

𝑃0: Cantidad de elementos en el año base


Determine el índice agregado simple de precios para el año 2015

y 2012 de tres productos considerados, usando como año base 2012.

Tabla 3:

PRODUCTOS DE PRIMERA NECESIDAD

Producto 2012 2015

Leche $/lt 0.84 0,86

Pan $/und 0.14 0.16

Huevos$/doc 1.44 1.50

∑ = 2.42 ∑ = 2.52

𝑃 = ∑ 𝑃𝑖

∑ 𝑃0∗ 100 =

2.52

2.42∗ 100

𝑃 = 104.13

3.6 NÚMEROS ÍNDICES PONDERADOS

Dos métodos para calcular el índice de precios compuestos o

ponderado son el método de Laspeyres y el de Paasche. Difieren sólo en el periodo para la ponderación. En el método de Laspeyres

se utilizan ponderaciones en el periodo base; es decir, los precios y

las cantidades originales de los artículos comprados se utilizan para



Página 125

encontrar el cambio porcentual durante un periodo, ya sea en el precio o en la cantidad consumida, según el problema. En el

método de Paasche se utilizan ponderaciones en el año en curso. (Lind, Marchal, & Wathen, 2006)

3.6.1 ÍNDICE DE LAYSPEYRES

𝑃 = ∑ 𝑝𝑡𝑞0

∑ 𝑝0𝑞0 𝑥 100

Dónde:

𝑃 𝑒𝑠 𝑒𝑙 í𝑛𝑑𝑖𝑐𝑒 𝑑𝑒 𝑝𝑟𝑒𝑐𝑖𝑜𝑠.

𝑝𝑡es el precio actual

𝑝0 es el precio del periodo base

𝑞0 es la cantidad en el periodo base

(Lind, Marchal, & Wathen, 2006)


Determinar un índice de precios ponderado con el método de

Laysperes, con los precios dados en la siguiente tabla tomando como referencia Quito.

Producto Cantidad

(Libras)

Quito Guayaquil

Arveja tierna 0,55 12,50 20,00

Banano 0,65 7,00 5,00

Limón 0,80 15,00 15,18

Piña 0,05 1,50 1,31


∑ 𝑝0𝑞0 𝑥 100

Calculemos el índice simple de cada producto tomando como referencia Quito, a continuación presentamos los precios de

diferentes productos en Quito y Guayaquil



Página 126

Quito Guayaquil

Producto 𝒒𝟎(𝒍𝒃) 𝒑𝟎 𝒒𝒕(𝒍𝒃) 𝒑𝒕 𝒑𝒕𝒒𝟎 𝒑𝟎𝒒𝟎 𝒑𝒕𝒒𝒕 𝒑𝒐𝒒𝒕

Arveja tierna 110 25 55 20 2,200 2,750 1,100 1,375

Banano 65 7 65 5 325 455 325 455

Limón 80 15 95 18 1,440 1,200 1,710 1,425

Piña 5 1.5 65 17 85 7.5 1105 97.5

4,050 4,412.5 4,240 3,352.5


∑ 𝑝0𝑞0 𝑥 100

𝑃 = 4,050

4,412.5 𝑥 100 = 91.78

3.6.2 ÍNDICE DE PAASCHE

El cálculo es similar que el índice de Laspeyres, pero en lugar de emplear cantidades en el periodo base como ponderaciones, se

utilizan cantidades en el período actual.

𝑃 = ∑ 𝑝𝑡𝑞𝑡

∑ 𝑝0𝑞𝑡 𝑥 100


En el ejercicio de aplicación 7, calculemos el índice de Paasche

𝑃 = 4,240

3,352.5 𝑥 100 = 126.47


Los precios, de cuatro artículos que se indican a continuación,

en los años 2001 y 2003, permitiran calcular el índice de Paasche.

Artículo po

2001

Qo

2001

Pt

2003

qt

2003 pt*qt po*qt

Pan 0.05 20 0.08 24 1.92 1.20

Huevos 0.06 30 0.09 36 3.24 2.16

Leche 0.35 10 0.48 15 7.20 5.25

Manzana 0.15 15 0.25 20 5.00 3.00

∑ 0.61 75 0.90 95 17.36 11.61



Página 127

𝑃 = ∑ 𝑝𝑡𝑞𝑡

∑ 𝑝0𝑞𝑡 𝑥 100

𝑃 = 17.36

11.61 𝑥 100

𝑃 = 149.52

Este resultado. indica que el precio de este grupo de alimentos.

aumentó en el 49.52 %. en el período de dos años.

3.6.3 ÍNDICE DE FISHER

Es la media geométrica de los índices de Laspeyres y Paasche.

Í𝑛𝑑𝑖𝑐𝑒 𝑖𝑑𝑒𝑎𝑙 𝑑𝑒 𝐹𝑖𝑠ℎ𝑒𝑟 = √(Í𝑛𝑑𝑖𝑐𝑒 𝑑𝑒 𝐿𝑎𝑠𝑝𝑒𝑦𝑟𝑒𝑠)(Í𝑛𝑑𝑖𝑐𝑒 𝑑𝑒 𝑃𝑎𝑎𝑠𝑐ℎ𝑒)

Parece ser el ideal porque combina las mejores características del de Laspeyres y del de Paasche.


Al tener ya determinado el índice de Laspeyres y el índice de

Paasche, en el ejemplo de aplicación 9 procedemos a calcular el índice ideal de Fisher.

Í𝑛𝑑𝑖𝑐𝑒 𝑖𝑑𝑒𝑎𝑙 𝑑𝑒 𝐹𝑖𝑠ℎ𝑒𝑟 = √(150.29)(149.52)

Í𝑛𝑑𝑖𝑐𝑒 𝑖𝑑𝑒𝑎𝑙 𝑑𝑒 𝐹𝑖𝑠ℎ𝑒𝑟 = √22471.3608

Í𝑛𝑑𝑖𝑐𝑒 𝑖𝑑𝑒𝑎𝑙 𝑑𝑒 𝐹𝑖𝑠ℎ𝑒𝑟 = 149.90

3.7 ÍNDICES DE VALOR

Mide cambios tanto en los precios como en las cantidades que

intervienenen. Se usa precios y cantidades del perìodo base y del perìodo actual.

𝑉 =∑𝑝𝑡 ∗ 𝑞𝑡

∑𝑝𝑜 ∗ 𝑞𝑜



Página 128

donde:

𝑉 𝑒𝑠 𝑒𝑙 í𝑛𝑑𝑖𝑐𝑒 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟

𝑝𝑜 𝑒𝑠 𝑒𝑙 𝑝𝑟𝑒𝑐𝑖𝑜 𝑒𝑛 𝑒𝑙 𝑝𝑒𝑟í𝑜𝑑𝑜 𝑏𝑎𝑠𝑒

𝑞𝑜 𝑒𝑠 𝑙𝑎 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑐𝑜𝑛𝑠𝑢𝑚𝑖𝑑𝑎 𝑒𝑛 𝑒𝑙 𝑝𝑒𝑟í𝑜𝑑𝑜 𝑏𝑎𝑠𝑒

𝑞𝑡 𝑒𝑠 𝑙𝑎 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑐𝑜𝑛𝑠𝑢𝑚𝑖𝑑𝑎 𝑒𝑛 𝑒𝑙 𝑝𝑒𝑟í𝑜𝑑𝑜 𝑎𝑐𝑡𝑢𝑎𝑙

𝑝𝑡 𝑒𝑠 𝑒𝑙 𝑝𝑟𝑒𝑐𝑖𝑜 𝑎𝑐𝑡𝑢𝑎𝑙


Los precios de cuatro artículos que se indican a continuación, en

los años 2001 y 2003, permitirán calcular el índice de Valor.

Artículo Po

2001

qo

2001

Pt

2003

Qt

2003

ptqt poqo

Pan 0.05 20 0.08 24 1.92 1.00

Huevos 0.06 30 0.09 36 3.24 1.80

Leche 0.35 10 0.48 15 7.20 3.50

Manzana 0.15 15 0.25 20 5.00 2.25

∑ 0.61 75 0.90 95 17.36 8.55

𝑉 =∑𝑝𝑡 ∗ 𝑞𝑡

∑𝑝𝑜 ∗ 𝑞𝑜

𝑉 =17.36

8.55∗ 100

𝑉 = 203.04

Con este resultado, miramos que el valor de este grupo de alimentos, aumentó en el 103.04 %, en el período de dos años.



Página 129

4 CAPÍTULO IV: REGRESIÓN.

CORRELACIÓN Y SERIES DE TIEMPO

OBJETIVOS

El estudiante podrá:

1. Diferenciar e interpretar los términos variable dependiente e independiente.

2. Encontrar y analizar los coeficientes de correlación y determinación y error estándar.

3. Encontrar la ecuación de la recta aplicando el método del libre ajuste

4. Encontrar la ecuación de la recta aplicando el método de los

mínimos cuadrados.

5. Especificar los componentes de una serie de tiempo. 6. Encontrar un promedio móvil.

7. Calcular la ecuación para una tendencia lineal

4.1 ANÁLISIS DE CORRELACIÓN

Mide la intensidad de la asociación entre dos variables, cuyo

principal objetivo es determinar, qué tan intensa es la relación

entre esas dos variables.

4.1.1 VARIABLE DEPENDIENTE:

Es la variable que se predice o se calcula.

4.1.2 VARIABLE INDEPENDIENTE:

Es una variable que proporciona las bases para el cálculo. Es la

variable de predicción.

4.1.3 COEFICIENTE DE CORRELACIÓN

Mide la intensidad de la asociación entre dos variables.

Ambas variables deben ser al menos el nivel de intervalo de medición.

El coeficiente de correlación puede variar desde -1.00 hasta 1.00.



Página 130

Si la correlación entre dos variables es 0, no hay asociación entre ellas.

Un valor de 1.00 indica una correlación positiva perfecta, y una de -1.00, una correlación negativa perfecta.

Un signo positivo significa que hay una relación directa entre las variables, y un signo negativo, que hay una relación inversa.

Se identifica con la letra 𝑟.

La fórmula que permite calcular el coeficiente de correlación es

la siguiente:

𝑟 =𝑛(∑𝑋𝑌) − (∑𝑋)(∑𝑌)

√(𝑛(∑𝑋2) − (∑𝑋)2)(𝑛(∑𝑌2) − (∑𝑌)2)

donde:

𝑛 𝑒𝑠 𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑝𝑎𝑟𝑒𝑠 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠

∑𝑋 𝑒𝑠 𝑙𝑎 𝑠𝑢𝑚𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑋

∑𝑌 𝑒𝑠 𝑙𝑎 𝑠𝑢𝑚𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑌

(∑𝑋2) 𝑒𝑠 𝑙𝑎 𝑠𝑢𝑚𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑋

(∑𝑌2) 𝑒𝑠 𝑙𝑎 𝑠𝑢𝑚𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑌

(∑𝑋)2 𝑒𝑠 𝑒𝑙 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑑𝑒 𝑙𝑎 𝑠𝑢𝑚𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑋

(∑𝑌)2 𝑒𝑠 𝑒𝑙 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑑𝑒 𝑙𝑎 𝑠𝑢𝑚𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑌

∑𝑋𝑌 𝑠𝑢𝑚𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑝𝑟𝑜𝑑𝑢𝑐𝑡𝑜𝑠 𝑑𝑒 𝑋 𝑦 𝑌

En la Figura 1 y 2 se resume la intensidad y la dirección del

coeficiente de correlación.

Figura 1. Intensidad del coeficiente de correlación



Página 131

Figura 2. Recta con correlación positiva y negativa


Las llamadas mensuales realizadas para la venta de productos de limpieza y desinfección de la empresa Solquim S.A. de lo cual se

toma una muestra de 5 vendedores, se expresa en la siguiente tabla.

Representantes de

ventas

No. de

llamadas

No. de

productos

vendidos

Paquita Trujillo 20 40

Kléver Sosa 40 60

Ximena López 20 40

Andrea Flores 30 60

Marcelo Campaña 10 20

Solución

El primer paso para mostrar la relación entre dos variables es graficando los datos en un diagrama de dispersión.

En la Figura 3 podemos obsevar que existe relación entre el número de llamadas y los productos vendidos, puesto que, a mayor

número de llamadas, se realizan mayores ventas de productos.

Para realizar el cálculo del coeficiente de correlación es importante que identifiquemos las variable dependiente (No. de

productos vendidos) y la independiente (No. de llamadas).



Página 132

Figura 3. Diagrama de dispersión.

A continuación añadimos tres columnas a la tabla para realizar los cálculos requeridos por la fórmula de coeficiente de correlación.

𝑟 =𝑛(∑𝑋𝑌) − (∑𝑋)(∑𝑌)

√(𝑛(∑𝑋2) − (∑𝑋)2)(𝑛(∑𝑌2) − (∑𝑌)2)

Representantes de

ventas

No. de

llamadas

(X)

No. de

productos

vendidos

(Y)

X2 Y2 XY

Paquita Trujillo 20 40 400 1,600 800

Kléver Sosa 40 60 1,60

0

3,600 2,400

Ximena López 20 40 400 1,600 800

Andrea Flores 30 60 900 3,600 1,800

Marcelo Campaña 10 20 100 400 200

Total 120 220 3,40

0

10,800 6,000

Reemplazando los datos obtenidos en la fórmula, se tiene.

2222010800512034005

22012060005

r



Página 133

48400540001440017000

2640030000

r

56002600

3600r

14560000

3600r

76.3815

3600r

El coeficiente de correlación es:

𝑟 = 0.94

El coeficiente de correlación es positivo, lo cual nos permite ver

que existe una relación directa entre el número de llamadas y la cantidad de productos vendidos.

El valor de 0.94, está bastante cercano a 1.00. Si observamos la figura 1 podemos concluir que la relación es fuerte.

4.1.4 CÁLCULO DE COEFICIENTE DE

DETERMINACIÓN

Es la porción de la variación total en la variable dependiente Y

que se explica por la variación en la variable independiente X.

Varía de 0 a 1.

Es el cuadrado del coeficiente de correlación.

Al elevar el coeficiente de correlación al cuadrado. obtendremos

el coeficiente de determinación.

𝑟 = 0.94

Entonces

𝑟2 = 0.942

𝑟2 = 0.89

Ver figura 3, obtenido a través de excel.



Página 134

4.2 ANÁLISIS DE REGRESIÓN

La intensidad y dirección de la relación que existe entre dos

variables se determina en una ecuación que define la relación lineal

entre dos variables.

4.2.1 PRINCIPIO DE LOS MÍNIMOS CUADRADOS

Es la técnica empleada para obtener la ecuación de regresión, minimizando la suma de los cuadrados de las distancias verticales

entre los valores verdaderos de 𝑌 y los valores pronosticados de 𝑌′.

La forma general de la ecuación de regresión lineal es:

𝑌′ = 𝑎 + 𝑏𝑥

donde:

𝑌’ se lee “Y prima”, es el valor pronosticado de la variable 𝑌

para un valor seleccionado de 𝑋.

𝑎 es la ordenada de la intersecciòn con el eje 𝑌; es decir, el

valor estimado de 𝑌′ cuando 𝑥 = 0 . Dicho de otra forma,

corresponde al valor estimado de 𝑌′, donde la recta de regresiòn

cruza el eje 𝑌, cuando 𝑥 = 0.

𝑏 es la pendiente de la recta, o el cambio promedio en Y’ por

unidad de cambio (incremento o decremento) en la variable

independiente 𝑥.

𝑥 es cualquier valor seleccionado de la variable independiente.

Para poder encontrar (𝒂 que es la ordenada) y (𝒃 que es la

pendiente) a las que se les denomina coeficientes de regresión

estimado, o simplemente coeficiente de regresión, para lo cual se requiere de las siguientes fórmulas

Pendiente de la línea de regresión

𝑏 =𝑛 ∗ ∑(𝑋𝑌) − ∑𝑋 ∗ ∑𝑌

𝑛 ∗ ∑𝑋2 − (∑𝑋)2

Punto donde se intercepta con el eje 𝑌



Página 135

𝑎 =∑𝑌 ∗ ∑𝑋2 − ∑𝑋 ∗ ∑(𝑋𝑌)

𝑛 ∗ ∑𝑋2 − (∑𝑋)2

o’

𝑎 =∑𝑌

𝑛− 𝑏

∑𝑋

𝑛

donde:

𝑋 es un valor de la variable independiente

𝑌 es un valor de la variable dependiente

𝑛 es el número de elementos en la muestra


Para calcular la ecuación de la recta, utilizando el método de los

mínimos cuadrados, traemos el planteamiento del problema del ejemplo 1.

Representantes de

ventas

No. de

llamadas

No. de

productos

vendidos

Paquita Trujillo 20 40

Kléver Sosa 40 60

Ximena López 20 40

Andrea Flores 30 60

Marcelo Campaña 10 20

Las fórmulas a utilizar son las siguientes:

Pendiente de la línea de regresión

𝑏 =𝑛 ∗ ∑(𝑋𝑌) − ∑𝑋 ∗ ∑𝑌

𝑛 ∗ ∑𝑋2 − (∑𝑋)2

Punto donde se intercepta con el eje 𝑌

𝑎 =∑𝑌 ∗ ∑𝑋2 − ∑𝑋 ∗ ∑(𝑋𝑌)

𝑛 ∗ ∑𝑋2 − (∑𝑋)2



Página 136

𝑎 =∑𝑌 ∗ ∑𝑋2 − ∑𝑋 ∗ ∑(𝑋𝑌)

𝑛 ∗ ∑𝑋2 − (∑𝑋)2

o’

𝑎 =∑𝑌

𝑛− 𝑏

∑𝑋

𝑛

A la tabla anterior añadimos tres columnas para realizar los cálculos requeridos por las fórmulas de los mínimos cuadrados.

Identificando primero la variable dependiente (No. de productos vendidos) Y y la independiente (No. de llamadas) X.

Representantes de ventas

No. de llamadas

(X)

No. de productos

vendidos (Y)

X2 Y2 XY

Paquita Trujillo 20 40 400 1,600 800

Kléver Sosa 40 60 1,600 3,600 2,400

Ximena López 20 40 400 1,600 800

Andrea Flores 30 60 900 3,600 1,800

Marcelo Campaña 10 20 100 400 200

Total 120 220 3,400 10,800 6,000

Pendiente de la línea de regresión:

𝑏 =𝑛 ∗ ∑(𝑋𝑌) − ∑𝑋 ∗ ∑𝑦

𝑛 ∗ ∑𝑥2 − (∑𝑥)2

𝑏 =5(6000) − (120)(220)

5(3400) − (120)2

𝑏 =30000 − 26400

17000 − 14400

𝑏 =3600

2600

𝑏 = 1.38

Punto donde se intercepta con el eje 𝑌:

𝑎 =∑𝑌

𝑛− 𝑏

∑𝑋

𝑛

𝑎 =220

5− (1.38)

120

5

𝑎 = 44 − 33.12



Página 137

𝑎 = 10.88

Remplazando en la ecuación 𝑌′ = 𝑎 + 𝑏𝑥, los valores obtenidos se

obtiene Y= 10.88+1.38X

El valor de 𝑏 = 1.38 significa que para cada llamada adicional

que realizan los representantes de ventas pueden esperar aumentar

en casi 1.4 el número de venta de productos de limpieza y desinfección. El valor a de 10.88 es el punto donde la ecuaciòn

cruza el eje 𝑌, luego si no se hacen llamadas esto es 𝑋 = 0 se

venderán 10.88 productos.

4.2.2 TRAZO DE LA LÍNEA DE REGRESIÓN

Consideraciones Básicas

Para aplicar correctamente la regresión lineal deben satisfacerse varias suposiciones:

Para cada valor de la variable 𝑋, hay un cojunto de valores de

𝑌. Estos valores de 𝑌 siguen una distribución normal.

Las medias de estas distribuciones normales se encuentran

sobre la línea de regresión. Las desviaciones estándar de todas estas distribuciones

normales, son iguales. La mejor estimación que se tiene de esta desviación estándar es común, es el error estándar de

estimación (𝑆𝑦, 𝑥).

Los valores de 𝑌 son estadísticamente independientes. Lo que

significa que el tomar la muestra en determinado valor de X no

depende de ningún otro valor de X. Esto es importante cuando se toman datos durante un período. En esos casos los errores

de un determinado período suelen estar correlacionados con lo de otro período.


En el ejemplo 2 se obtuvo la gráfica 𝑌 = 10.88 + 1.38𝑋. El valor de

10.88 representa la intersección con el eje y, para encontrar otro punto, arbitrariamente damos un punto cualquiera a la variable X, podría ser el 20, remplazando en la ecuación 𝑌 = 10.88 + 1.38(20) se

obtiene Y = 38.48. Si tenemos dos puntos ya podemos encontrar el gráfico de la ecuación al unir estos puntos. Tomando en cuenta que

se trata de la Ecuación de la recta, como se muestra a continuación.



Página 138

Figura 4 Gráfica de la ecuación de la recta.

4.2.3 EL ERROR ESTÁNDAR DE LA ESTIMACIÓN

Es la medida de la dispersión de los valores observados. con

respecto a la línea de regresión.

Está en las mismas unidades que la variable dependiente. Se

basa en las desviaciones al cuadrado respecto de la recta de regresión

Valores pequeños indican que los puntos se agrupan cerca de la

recta de regresión

Para su cálculo se utiliza la siguiente fórmula:

2

2

.

n

XYbYaYS xy


Al trabajar con los datos del ejercicio del ejemplo 3, tendremos

el siguiente error estándar de estimación.

Para su cálculo se utiliza la siguiente fórmula:

2

2

.

n

XYbYaYS xy

25

000,638.122088.10800,10.

xyS



Página 139

3

280,86.393,2800,10.

xyS

3

4.126. xyS

13.42. xyS

49.6. xyS

El error estándar de estimación. mide la variación alrededor de

la línea de regresión.

4.3 FUNDAMENTOS PARA EL ANÁLISIS DE UNA

SERIE DE TIEMPO

Una serie de tiempo es una oportunidad, de poder mejorar las decisiones que toma la gerencia ya que se puede realizar una

predicción a largo plazo. Ya que una serie de tiempo al registrar los datos puede hacer uso de ellos para realizar proyecciones, ya que

los patrones del pasado pueden repetirse y ser de gran utilidad. En

una empresa si disponemos de la información en que los periodos de ventas en que la demanda es alta pueden ayudar a predecir,

planificar y programar la producción en un período posterior, incluso puede ayudar a tomar decisiones a largo plazo.

4.4 COMPONENTES DE UNA SERIE DE TIEMPOS

Tendencia Secular Variación cíclica

Variación estacional Variación irregular.

4.4.1 TENDENCIA SECULAR

La serie de tiempo con tendencia secular sigue una dirección uniforme en el tiempo. A pesar de que pueda haber variaciones, es

importante notar a largo plazo la tendencia que sigue.



Página 140


En el siguiente ejemplo se muestra una empresa se sabe que en

función del tiempo, sus clientes han incrementado en cientos, figuran en la tabla siguiente: se puede observar que el incremento

es proporcional en el tiempo y sigue una tendencia definida.

Figura 5. Ventas del 2009 al 2014

El micro mercado Cotocollao revisa el historial de sus ventas y encuentra que las ventas se han incrementado con el tiempo, a pesar de tener una acentuada disminución en las ventas en el año

2001 comparado con las ventas en el 2000, luego se observa una recuperación en los años siguientes.

Figura 6. Venta del micro mercado Cotocollao



Página 141

Si consideramos el número personas que salieron a España a buscar trabajo de un determinado sector del país en el transcurso

del 2000 al 2010, encontramos que en el 2000 salieron 1,000 personas, mientras que en el 2002 fueron 1,300, luego

encontramos una clara disminución para el año 2010 ya tenemos 70 personas que abandonaron el país, la tendencia a largo plazo

está bastante clara.

Figura 7. Emigrantes a España (datos supustos)

4.4.2 VARIACIÓN CÍCLICA

Se da un aumento y una disminución en períodos mayores a un año, manteniendo la tendencia en el trascurso del tiempo.


En la parte productiva es normal que existan variaciones en las ventas o ingresos en el trascurso de períodos de tiempo, esto se puede dar por reactivación de la economía por nuevos ingresos

petroleros o disminución de los mismos. Nuevas obras de inversión en el país como es el caso de las hidroeléctricas, finalización de

estas obras, incluso cambios de gobierno, entre otros factores que determina e influyen sobre la producción.

El ejemplo expuesto a continuación muestra la variación de los ingreso de Sinec Constructores en miles de dólares entre 1998 y el

2015.



Página 142

Figura 8. Ingresos en miles de dólares Sinec Constructores

4.4.3 VARIACIÓN ESTACIONAL

Sigue patrones de cambio durante un año, y se repiten en los

años posteriores.


En la mayoría de negocios suele suceder que se repiten los patrones de venta de un año a otro, pueden ser por situaciones como las de fin de año en la que la mayoría realiza compras y regalos por motivos religiosos

o de comportamiento, que en nuestro país viene acompañado del sueldo adicional que se recibe en diciembre, lo mismo sucede con el inicio de clases y todos los requerimientos, que pueden ser lista de útiles, ropa de

uniformes, zapatos. Negocios que se ven estimulados en sus ingresos en estas fechas. Este comportamiento suele repetirse cada año, para ello se

muestra un ejemplo de la ventas en miles de dólares.

Figura 9. Ventas en miles de dólares

0

200

400

600

800

1998

1999

2000

2001

2002

2003

2004

2005

2006

2007

2008

2009

2010

2011

2012

2013

2014

2015

In

greso

s e

n m

iles d

e

dó

lares

Año

Ingresos en miles de dolares



Página 143

4.4.4 VARIACIÓN IRREGULAR

Es aquella cuya variación es difícil predecir y pueden se variaciones episódicas y residuales.


Las variaciones episódicas pueden originarse por eventos como

una guerra, una huelga, un golpe de estado, una catástrofe natural y la residual por los demás factores que originan la variación. Como

se indica son impredecibles.

4.5 MEDICIÓN DE TENDENCIAS

4.5.1 TENDENCIA LINEAL

Se da un aumento y una disminución de los ingresos, ventas, gastos u otra variable, manteniendo la tendencia en el trascurso del

tiempo.

Del ejemplo 6 anterior la variación de los ingreso de Sinec

Constructores en miles de dólares entre 1998 y el 2015. Podemos ver que la tendencia que sigue a pesa de la variación en el

transcurso del tiempo el lineal.

Método de libre ajuste

Es un método aproximado y rápido para obtener la ecuación de la recta.


En la tabla 4, se muestra los ingreso en miles de dólares en

función del tiempo.

Solución

Graficamos como se muestra en la figura 10 los puntos de los años y los ingresos, numerados el primero como el año uno (1998 =



Página 144

1), como se indica en la tabla 4 para los siguientes años tomando

la misma consideración.

Trace una recta entre los puntos, la recta indica la tendencia.

Tabla 4

CÁLCULO POR EL MÉTODO DEL LIBRE AJUSTE

Años (X) Años (X) Ingresos

en miles de dólares (Y)

Años (X) Años (X) Ingresos

en miles de dólares (Y)

1998 1 200 2007 10 450

1999 2 300 2008 11 470

2000 3 350 2009 12 490

2001 4 250 2010 13 600

2002 5 270 2011 14 700

2003 6 290 2012 15 750

2004 7 400 2013 16 650

2005 8 500 2014 17 670

2006 9 550 2015 18 690

Extendemos la recta para obtener el punto donde interseca con

el eje ‘𝑦’.

Encontramos dos puntos de esta recta estimando los valores que serán aproximados, el primero puede ser (0; 185) y el oro el final

(18; 735).

Encuentre el valor de la pendiente con los puntos anteriores

𝑏 =𝑦2 − 𝑦1

𝑥2 − 𝑥1=

735 − 185

18 − 0= 30.55

El valor de 𝑎 recuerde que es la intersección con el eje ‘𝑦’ el cual

es 𝑎 = 185

La ecuación de la recta es 𝑌 = 𝑎 + 𝑏𝑥

Remplazando los valores encontrados 𝑌 = 185 + 30.55𝑥

Al realizar una comparación de la ecuación de la recta

encontrada en Excel es bastante aproximada a la encontrada.



Página 145

Figura 10. Ingreso en miles de dólares

Método de mínimos cuadrados

Para encontrar la tendencia aplicando el método de los mínimos

cuadrado realizamos las siguientes consideraciones.

Grafique los puntos de los años numerados el primero como el año uno (1998 = 1) los siguiente tomando la misma consideración

como en el caso anterior o simplemente con los años reales y los

ingresos.

La ecuación de la recta es 𝑌 = 𝑎 + 𝑏𝑥

Donde

𝑎 =∑𝑦 ∗ ∑𝑥2 − ∑𝑥 ∗ ∑(𝑥𝑦)

𝑛 ∗ ∑𝑥2 − (∑𝑥)2

𝑏 =𝑛 ∗ ∑(𝑥𝑦) − ∑𝑥 ∗ ∑𝑦

𝑛 ∗ ∑𝑥2 − (∑𝑥)2


Realice una tabla y encuentre los valores requeridos, al final podemos ver los valores encontrados.



Página 146

Tabla 5.

CÁLCULO DE LOS MÍNIMOS CUADRADOS

Número de

años Años (X)

Ingresos en

miles de

dólares (Y)

𝑿𝟐 X*Y

1 1998 200 3,992,004 399,600

2 1999 300 3,996,001 599,700

3 2000 350 4,000,000 700,000

4 2001 250 4,004,001 500,250

5 2002 270 4,008,004 540,540

6 2003 290 4,012,009 580,870

7 2004 400 4,016,016 801,600

8 2005 500 4,020,025 1,002,500

9 2006 550 4,024,036 1,103,300

10 2007 450 4,028,049 903,150

11 2008 470 4,032,064 943,760

12 2009 490 4,036,081 984,410

13 2010 600 4,040,100 1,206,000

14 2011 700 4,044,121 1,407,700

15 2012 750 4,048,144 1,509,000

16 2013 650 4,052,169 1,308,450

17 2014 670 4,056,196 1,349,380

18 2015 690 4,060,225 1,390,350

18 𝑛

36117 ∑𝑥

8,580 ∑𝑦

72,469,245 ∑𝑥2

17,230,560 ∑𝑥𝑦

Remplace los valores encontrados en las fórmulas.

𝑎 =∑𝑦 ∗ ∑𝑥2 − ∑𝑥 ∗ ∑(𝑥𝑦)

𝑛 ∗ ∑𝑥2 − (∑𝑥)2

𝑎 =8580 ∗ 72469245 − 36117 ∗ 17230560

18 ∗ 72469245 − (36117)2= −60,774

𝑏 =𝑛 ∗ ∑(𝑥𝑦) − ∑𝑥 ∗ ∑𝑦

𝑛 ∗ ∑𝑥2 − (∑𝑥)2

𝑏 =18 ∗ 17230560 − 36117 ∗ 8580

18 ∗ 72469245 − (36117)2

𝑚 = 30.526



Página 147

Remplazando los valores encontrados

𝑦 = 𝑎 + 𝑏𝑥

𝑦 = − 60,774 + 30.526𝑥

Al realizar una comparación de la ecuación de la recta encontrada en Excel es igual al calculado.

Figura 11. Ingreso en miles de dólares

4.5.2 MÉTODO DEL PROMEDIO MÓVIL

El promedio móvil es óptimo para patrones de demanda

aleatoria o nivelada donde se pretende eliminar el impacto de los

elementos irregulares históricos mediante un enfoque en períodos de demanda reciente.

El promedio móvil podemos observar la tendencia que indica la proyección de la serie, la variación cíclica en este caso el ciclo se

repite cada 7 años

Finalmente se promedia la variación cíclica y la variación

irregular y como resultado obtenemos la tendencia, que esta expresada por una recta que es una forma suavizada de

representar el promedio móvil, recta viene dada de la forma 𝑦 = 𝑎 +𝑏𝑥 , donde 𝑏 es la pendiente de la recta y 𝑎 representa la

intersección con el eje 𝑦.

y = 30,526x + 186,67

R² = 0,8713

0

200

400

600

800

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

In

greso

en

miles d

e

dó

lares

Años

Ingresos en miles de dolares (Y)



Página 148


Tabla 6

CÁLCULO DEL PROMEDIO MOVIL PARA 7 AÑOS

Año Ventas

Promedio móvil de 7

años

1990 4

1991 5

1992 6

1993 7

6.14

1994 8

6.29

1995 7

6.43

1996 6

6.57

1997 5

6.71

1998 6

6.86

1999 7

7.00

2000 8

7.14

2001 9

7.29

2002 8

7.43

2003 7

7.57

2004 6

7.71

2005 7

7.86

2006 8

8.00

2007 9

8.14

2008 10

8.29

2009 9

8.43

2010 8

8.57

2011 7

8.71

2012 8

2013 9

2014 10

La primera columna indica el año, la segunda la ventas anuales en miles de dólares y la tercera el promedio móvil el mismo que se

calcula sumando los primeros 7 años de ventas que es donde se repite completamente el ciclo (color azul) y dividimos para en número de años (4 + 5 + 6 + 7 + 8 + 7 + 6)/7 = 6.14 que viene a ser el

promedio móvil, el siguiente de color naranja (5 + 6 + 7 + 8 + 7 +6)/7 = 6.29 y de esta manera continuamos con los siguientes

valores. Si graficamos los años con las ventas observamos

diferentes rectas cada una con una tendencia propia, en este caso al graficar el tiempo con el promedio móvil, la gráfica se suaviza y



Página 149

se convierte en la tendencia de las ventas, si tomamos dos puntos cualquiera de los años y el valor de promedio móvil (1993; 6.14) y

(2011; 8.71), calculamos la pendiente

𝑎 =8.71−6.14

2011−1993= 0.1429 ,

la proyección de la recta sobre el eje “y” es 5.57. De ésta manera

obtenemos la ecuación 𝑦 = 0.1429𝑥 + 5.57 que representa el

promedio móvil; excel es una gran herramienta que permite encontrar la variación y la tendencia con la respectiva ecuación, la

gráfica muestra lo expuesto.

Figura 12. Ventas entre 1900 y 2014

En la mayoría de los casos es difícil obtener una tendencia lineal,

por lo general sea las ventas, los ingreso, la producción u otra variable en función del tiempo presentan una variación irregular,

razón por la que la tendencia del promedio móvil no representa una línea recta como se muestra en el ejemplo a continuación. Además

se debe considerar la naturaleza de los datos que pueden ser mensuales en este caso el promedio móvil se sugiere que se lo

tome para los doce meses, o incluso la información la podemos tener diaria, que la relacionaríamos con el número de días de la

semana. En la tabla expuesta a continuación los ingresos por

y = 0,1429x + 5,5714

0

2

4

6

8

10

12

1990

1991

1992

1993

1994

1995

1996

1997

1998

1999

2000

2001

2002

2003

2004

2005

2006

2007

2008

2009

2010

2011

2012

2013

2014

Ven

tas

Años

Ventas

Ventas

Promedio Movil

Lineal (Promedio

Movil)



Página 150

ventas son anuales y está calculado el promedio móvil para tres y cinco años. Para calcular el primer valor del promedio móvil para tres años (azul), sume las tres primero datos y divida para tres (8 +9 + 11)/3 = 9.33 y el promedio móvil para cinco años (amarillo) (8 +9 + 11 + 15 + 6)/5 = 9.80. El promedio móvil para cuatro años se debe

encontrar un doble promedio (violeta) y colocar en la ubicación mitad del número de años más uno. (4/2) + 1 = 3; encuentre el

promedio los cuatro primeros datos de los Ingresos por Ventas (8 +9 + 11 + 15)/4 = 10.75; luego parta del segundo valor y calculo el

promedio de los siguientes cuatro datos (9 + 11 + 15 + 6)/4 = 10.25;

finalmente calcule el promedio de los dos promedios (10.75 +10.25)/2 = 10.50. Continúe con el procedimiento como se indica en

la tabla.

Tabla 7

CÁLCULO DEL PROMEDIO MÓVIL DE 3, 5 Y 4 AÑOS

Luego de calcular los datos lo ideal es representarlos en una gráfica. Al observar el promedio móvil de los ingresos agrupados en tres años, cuatro y el de cinco años, este último tiene una

tendencia más suave, por lo que se observa que mientras mayores



Página 151

sea la cantidad de datos que agrupemos para el promedio móvil la tendencia está mejor representada.

Figura 13 Ingreso por ventas

4.5.3 MÉTODO DEL PROMEDIO MÓVIL PONDERADO

El pronóstico de promedio móvil es óptimo para patrones de demanda aleatoria o nivelada donde se pretende eliminar el impacto de los

elementos irregulares históricos mediante un enfoque en períodos de demanda reciente.


En el promedio móvil las ponderaciones son las mismas para todos los datos si ponderamos para tres años sumamos los tres

valores y dividimos para tres cada valor tiene una ponderación de

1/3, mientras que en el promedio ponderado cada valor tiene una ponderación según la necesidad, la consideración que podría

tomarse en cuenta es la necesidad de que al calcular el promedio móvil éste se encuentra entre los valores tomados. Si bien la

tendencia se ha suavizado, existe la necesidad de que el promedio se aproxime al valor del período final.

El promedio móvil obtenemos al sumar los clientes de los tres primeros años y dividirlo para tres (4,511 + 4,898 + 5,533)/3 = 4,980.67

Las ponderaciones para este ejemplo son de 0.1; 0.2; 0.7, que

suma 1; para cada uno de los períodos la ponderación es diferente tomando en cuenta que la ponderación del último año es mayor.



Página 152

El promedio móvil ponderado obtenemos al sumar los clientes de los tres primero años multiplicados por la ponderación y dividirlo para tres (4,511(0.1) + 4,898(0.20) + 5,533(0.7))/3 = 5,303.80.

En la tabla siguiente del ejemplo se observa en 1999 existieron 10,200 clientes y el promedio móvil fue de 8,776.33, mientras que

el promedio ponderado de 9,278 que se aproxima más a los clientes en ese año. La grafica muestra como el promedio móvil

ponderado se aproxima más al número de clientes.

Figura 14. Promedio móvil ponderado para diferentes periodos.



Página 153

BIBLIOGRAFÍA

Anderson, D., Sweeney, D., & Williams, T. (2008). Estadística para

administración y economía. Mexico D.F.: CENAGE Learning.

Aula Fácil. (28 de 12 de 2015). Curso de Estadística. Obtenido de

http://www.aulafacil.com/cursos/l11221/ciencia/estadisticas/estadi

sticas/coeficiente-de-curtosis

Cabrera, F. A. (24 de 12 de 2015). Medidas de tendencia central -

Estadística económica. Obtenido de

http://www.monografias.com/trabajos43/medidas-tendencia-

central/medidas-tendencia-central2.shtml

De La Vega, M. (mayo de 2012). TABLAS Y FIGURAS APA 6ta. Ed.

Obtenido de investigación.casagrande.edu.ec:

http://investigacion.casagrande.edu.ec/wp-

content/uploads/2013/10/3.-TABLAS-y-FIGURAS-APA-6ta.-ed..pdf

Definición.de. (12 de julio de 2015). Definición.de. Obtenido de

http://definicion.de/estadistica/

García Pérez, C. (26 de 12 de 2015). Medidas de dispersión . Obtenido de

http://fcps.uaq.mx/descargas/prope2014/estadistica/4/medidas_di

spersion.pdf



Página 154

García, J., & Japón , M. (10 de agosto de 2015). thales.cica.es. Obtenido

de http://thales.cica.es/rd/Recursos/rd99/ed99-0278-01/ed99-

0278-01.html

Instituto Nacional de Estadísticas y Censos. (6 de julio de 2015). INEC.

Obtenido de ¿Qué es el censo de población y vivienda?:

http://www.ecuadorencifras.gob.ec/que-es-el-censo-de-poblacion-

y-vivienda-2/

Levin, R., & Rubin, D. (2004). Estadística para Administración y

Economía. Mexico: Pearson.

Lind, D. A., Marchal, W. G., & Wathen, S. A. (2006). Estadística aplicada a

los negocios y la economía. México: McGraw - Hill.

Lind, D., Marchal, W., & Wathen, S. (2012). Estadística Aplicada a los

Negocios y la Economía. Mexico D.F.: Mc Grawhill.

Martínez, C. (2012). Estadística y muestreo. Bogotá: ECOE EDICIONES.

Recursos para trabajos administrativos. (18 de febrero de 2013).

www.funcionarioseficientes.com.

Reynaga, J. (6 de julio de 2015). Introducción al método estadístico.

Obtenido de

http://www.facmed.unam.mx/emc/computo/infomedic/presentac/

modulos/modulo3/estadistica/clase1/



Página 155

Slideshare. (5 de julio de 2015). Probabilidad y estadística. Obtenido de

http://es.slideshare.net/RoberLaura/52812712-

probabilidadyestadisticamisaiasefarias-1

Spiegel, M. R. (1997). Estadística. Madrid: McGraw - Hill.

Suárez, M. O. (16 de 12 de 2015). Guía didáctica para el Interaprendizaje

de Medidas de Tendencia Central. Obtenido de

http://www.monografias.com/trabajos85/interaprendizaje-

medidas-tendencia-central/interaprendizaje-medidas-tendencia-

central.shtml#mediaarita

Universidad Michoacana de San Nicolás de Hidalgo. (26 de 12 de 2015).

Moda. Obtenido de

http://dieumsnh.qfb.umich.mx/estadistica/moda.htm#La%20moda



Página 156

estadÍstica bÁsica i · estadÍstica bÁsica i mena, r. escobar, t. haro, e. córdova, m. merino,...

Documents