estadÍstica en rrll - curso 2010 turno...

24
Haga clic para modificar el estilo de subtítulo del patrón 11 MODULO 3: Medidas de tendencia central Docentes: Mariana Cabrera - Laura Noboa - Verónica Curbelo ESTADÍSTICA EN RRLL - CURSO 2010 TURNO NOCTURNO

Upload: vokhanh

Post on 13-Oct-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

Haga clic para modificar el estilo de subtítulo del patrón

•11

•MODULO 3: Medidas de tendencia central

Docentes:Mariana Cabrera - Laura Noboa - Verónica Curbelo

ESTADÍSTICA EN RRLL - CURSO 2010 TURNO NOCTURNO

•ANALISIS DESCRIPTIVO UNIVARIADO

1. Tablas, gráficos (Módulo 2)

2. Estadísticos:

1. Medidas de tendencia central (Módulo 3)

2. Medidas de posición y dispersión (Módulo 4)

•MEDIDAS DE TENDENCIA CENTRAL

•Estadísticos que indican dónde se encuentra el centro de la distribución o

punto central sobre el que gravitan el conjunto de valores de la distribución.

•Están sujetos al nivel de medición de la variable

•Para las variables cuantitativas la elección del estadístico depende del tipo de

distribución de la variable

Nivel de medición de la variable

Nominal Ordinal Cuantitativa (distr asimétrica)

Cuantitativa (distr. simétrica)

Medidas de tendencia central

Moda X X X X

Mediana X X X

Media aritmética o promedio

X

•MEDIA ARITMÉTICA O PROMEDIO

¿Cómo calcularla?:

1) A partir de una matriz de datos

Ejemplo:

Definición: Es la suma de todos los valores de la variable, dividida por el total de observaciones.

Notación: X

Dados los valores de una variable en una tabla:

• x1; x2; x3; ………xi

Nx

x i∑=

Nº de hijosTrab1 0Trab2 2Trab3 2Trab4 2Trab5 3Trab6 4Trab7 4Trab8 5Trab9 6

3.11

•MEDIA ARITMÉTICA O PROMEDIO: ¿Cómo calcularla?

2) A partir de tablas de frecuencias simples

Cálculo: En este caso la media es la suma ponderada de los valores de la variable por las frecuencias absolutas, sobre el total de observaciones (N)

Tabla de frecuencias simples

Nº HIJOS fi fr

0 1 0,1

2 3 0,3

3 1 0,1

4 2 0,2

5 1 0,1

6 1 0,1

Total 9 1

Nº de hijosTrab1 0Trab2 2Trab3 2Trab4 2Trab5 3Trab6 4Trab7 4Trab8 5Trab9 6

Matriz de datos

rikk fxfxfrxx ∑=+= ......1

( )nfx

fxfxn

x iikki

∑=+= .......11

Con frecuencias absolutas

Con frecuencias relativas

•66

MEDIA ARITMÉTICA O PROMEDIO: ¿Cómo calcularla?

3) A partir de tablas de frecuencias con datos agrupados en intervalos de clase

Cálculo: Dada la pérdida del dato original, en estos casos la media es la suma de las «marcas de clase» (xc) –no de los valores originales- ponderada por sus frecuencias relativas, o bien del producto de esa ponderación por sus frecuencias absolutas dividido el total de casos.

r

i

fxcx

nfxc

x

= =

= =

*

*Nº HIJOS fi fr

0-2 4 0,4

3-4 3 0,3

5-6 2 0,2

Total 9 1

Ejemplo:

2.83

Marca de clase (Li+Ls)/2

1

3,5

5,5

•Cálculo de media con datos agrupados en intervalos de clase

•77

• La media aritmética obtenida a partir de las marcas de clase (xc), en general diferirá de la media obtenida con los valores reales, xi.

• Es decir, habrá una pérdida de precisión que será tanto mayor cuanto mayor sea la diferencia entre los valores reales y las marcas de clase, o sea, cuanto mayores sean las amplitudes de los intervalos de clase (ai). • la media calculada sobre datos agrupados en intervalos dependerá siempre de la división en intervalos de clase.

•Propiedades de la MEDIA

•88

• Es un número comprendido entre el mínimo y el máximo de los valores observados.

• No tiene por qué coincidir con algún valor observado en la población.

• Si la distribución de la variable no es muy dispersa (porque se concentra en unos pocos valores) entonces el promedio es un buen indicador de la “posición” de la distribución.

• La media calculada sobre datos agrupados en intervalos dependerá siempre de la división en intervalos de clase.

• Como medida de tendencia central, tiene el defecto de estar muy influida por los valores extremos de la distribución. Ya que todas las observaciones intervienen en el cálculo de la media, la aparición de una observación con un valor extremo hará que la media se desplace en esa dirección. En consecuencia, no es recomendable usar la media como medida central en las distribuciones muy asimétricas.

•SIMETRÍA

• Supongamos que hemos representado gráficamente una distribución de frecuencias.

• Si trazamos una perpendicular al eje de abscisas por la media y tomamos esta perpendicular como eje de SIMETRÍA, una distribución es simétrica respecto a la media si existe el mismo número de valores a ambos lados de dicho eje, equidistantes de uno a uno, y tales que cada par de valores equidistantes tengan la misma frecuencia. En caso contrario, las distribuciones serán asimétricas.

Simétrica Asimétrica a la derecha

x x Asimétrica a la izquierda

x

•1010

•Ejemplo

Sea X una variable que ha presentado los siguientes valores

•Si cambiamos la última observación por otra anormalmente grande, esto afecta a la media:

•En este caso la media no es un posible valor de la variable, y se ha visto muy afectada por la observación extrema.

•MEDIANA

Definición: Dada una variable X cuyas observaciones en una tabla estadística han sido ordenadas de menor a mayor, la mediana es el primer valor de la variable que deja por debajo de sí al 50% de las observaciones y por encima de sí al restante 50%. • Notación: Xdn

¿Cómo se puede calcular?:

1) Con matriz de datos original

•Dado N impar: Xdn = [N+1]/2•Dado N par: Xdn = [N/2] y [N/2] *

* En las variables de razón se puede hacer promedio [((N+1)/2)+ (N/2)]/2

Ejercicio:Nº de hijos

Trab1 0Trab2 2Trab3 2Trab4 2Trab5 3Trab6 4Trab7 4Trab8 5Trab9 6

Nivel educativoTrab1 BajoTrab2 BajoTrab3 MedioTrab4 MedioTrab5 MedioTrab6 Alto

•MEDIANA

¿Cómo se puede calcular?:

2) Con tabla de frecuencias

•Debe leerse (o calcularse) la columna de frecuencia relativa acumulada. • Aquí la mediana es el valor o categoría que acumula antes el 50% de las observaciones

Ejercicio:Nº accidentes laborales 2008

(Xi) fi fr Fi Fr3 3 0,15 3 0,154 6 0,3 9 0,455 5 0,25 14 0,76 4 0,2 18 0,97 1 0,05 19 0,958 1 0,05 20 1

Total 20 1

•Como veremos, es un estadístico que no se ve afectado por los datos extremos, ya que no depende de los valores de la variable sino del orden de las mismas. De ahí que es utilizado en distribuciones asimétricas

•MEDIANA

¿Cómo se puede calcular?:2) Con tabla de frecuencias agrupadas en intervalos de clase(no lo trataremos en clase por ser bastante poco común recurrir a esto)

•En el caso de variables continuas, las clases vienen dadas por intervalos, y aquí la fórmula de la mediana se complica un poco más debido a que supone una interpolación de datos.

•fórmula para interpolar:

Donde: Li = límite inferior del intervalo medianoN= total de observaciones de la poblaciónFiant= frecuencias acumuladas en la clase anterior del intervalo medianofi= frecuencia absoluta simple del intervalo medianoAi = amplitud del intervalo mediano

ii

iant

i Af

FN

LMdn *2

−+= =

•Sin embargo, sugerimos que para facilitar la comprensión del tema se maneje con el concepto de ‘intervalo mediano’. Así, al igual que en las tablas de frecuencias, basta con identificar cuál es el intervalo que primero deja por debajo de sí el 50 % de las observaciones más pequeñas.

•PROPIEDADES DE LA MEDIANA

•1414

• Cálculo rápido e interpretación sencilla

•Es función de los intervalos escogidos.

•Como medida descriptiva, tiene la ventaja de no estar afectada por las observaciones extremas, ya que no depende de los valores que toma la variable, sino del orden de las mismas. Por ello es adecuado su uso en distribuciones asimétricas.

• Puede ser calculada aunque el intervalo inferior o el superior no tenga límites.

•A diferencia de la media, la mediana de una variable discreta es siempre un valor de la variable que estudiamos (ej. La mediana de una variable número de hijos toma siempre valores enteros).

•1515

•Ejemplo (Módulo 3)

Sea X una variable que ha presentado los siguientes valores

•Si cambiamos la última observación por otra anormalmente grande, esto no afecta a la mediana, pero si a la media:

•En este caso la media no es un posible valor de la variable, y se ha visto muy afectada por la observación extrema. Este no ha sido el caso para la mediana.

•MODA O MODO

¿Cómo se reconoce la(s) moda(s) en una tabla estadística?:

Observando el valor o valores con mayor frecuencia relativa

¿Cómo se conoce la moda en el diagrama de barras?:

Observando el valor de la variable que representa la barra más alta.

Ejercicio: Calcular XMo

Nº de hijos Estado civilTrab1 2 CasadoTrab2 2 CasadoTrab3 4 DivorciadoTrab4 6 CasadoTrab5 5 DivorciadoTrab6 0 SolteroTrab7 2 SolteroTrab8 3 SolteroTrab9 4 Viudo

Definición: Es el valor máximo de la distribución de frecuencias; es decir, el valor de la variable que posee una frecuencia mayor a los restantes. •En el caso de variables continuas es más correcto hablar de intervalos modales.

Notación: Xmo

•MODA O MODO

Propiedades

•Es muy fácil de calcular ( o identificar)

•Puede no ser única (distribución unimodal, bimodal, etc).

•Es condicional a los intervalos elegidos a través de su

amplitud, número y límites de los mismos.

•Aunque el primero o el último de los intervalos no posean

extremos inferior o superior respectivamente, la moda

puede ser calculada.

•MEDIDAS DE TENDENCIA CENTRAL

•Estadísticos que indican dónde se encuentra el centro de la distribución o

punto central sobre el que gravitan el conjunto de valores de la distribución.

•Están sujetos al nivel de medición de la variable

•Para las variables cuantitativas la elección del estadístico depende del tipo de

distribución de la variable

Nivel de medición de la variable

Nominal Ordinal Cuantitativa (distr asimétrica)

Cuantitativa (distr. simétrica)

Medidas de tendencia central

Moda X X X X

Mediana X X X

Media aritmética o promedio

X

•MEDIDAS DE TENDENCIA CENTRAL

Media o promedio: • Nivel de medición: cuantitativa • Se calcula pre-suponiendo una distribución simétrica (se debe analizar previamente la distribución con un gráfico)

Mediana: • Nivel de medición: cuantitativa, ordinal • Si la variable es cuantitativa, se calcula pre-suponiendo una distribución asimétrica (se debe analizar previamente la distribución con un gráfico)• Dada una variable cuantitativa, si su distribución es simétrica su mediana = media

Moda: • Nivel de medición: cuantitativa, ordinal, nominal

•EJERCICIO

•2020

•La siguiente distribución presenta a la población desocupada del interior urbano en 2001, por grupos de edad.

a. Completar la tabla con la frecuencia relativa y relativa acumulada de la distribución.

a. ¿Cuál era el grupo de edad modal de esta población?a. ¿Qué promedio de edad tenía la población desocupada del interior urbano en

2001? a. ¿Por debajo de qué edad se encontraba el 50% más jóven de los desocupados?b. Comente en forma conjunta los resultados obtenidos.

Edad Ni14-1718-2425-3435-4445-5455-64

65 y más (*)

8.71928.08516.95612.2098.9535.0571.672

81.651(*) Para cerrar este intervalo utilice como límite superior 74 años.

•2121

ESTUDIO DEL PERFIL DE PERSONAL DE LA EMPRESA ARLEQUIN

1. Construya la variable “nivel educativo” considerando las siguientes categorías:

1. Secundaria incompleta

2. Secundaria completa

3. Terciaria incompleta (menos de 4 años)

4. Terciaria completa

1. ¿Cuál es el nivel de medición de cada variable y qué estadísticos de tendencia central pueden calcularse en cada una?

• ESTUDIO DEL PERFIL DE PERSONAL DE LA EMPRESA ARLEQUIN (matriz de datos)

•2222

EMPLEADO Nº SEXOEDAD (en años)

ESCOLARIDAD (en años)

ANTIGÜEDAD (en años)

SALARIO (en miles de pesos)

1 F 39 12 9 3,52 F 25 16 1 3,53 F 25 10 2 44 F 37 16 4 4,55 F 26 14 3 6,56 F 39 14 2 6,57 F 26 16 5 78 F 26 16 2 8,59 F 39 18 9 1010 M 19 12 0 3,511 M 19 16 1 3,512 M 30 11 1 5,213 M 21 12 3 6,514 M 20 15 2 715 M 31 12 6 1116 M 34 14 6 1317 M 62 15 9 1518 M 46 14 9 16

•2323

ESTUDIO DEL PERFIL DE PERSONAL DE LA EMPRESA ARLEQUIN

1. Defina la unidad de análisis y la población de estudio

2. Construya la variable “nivel educativo” considerando las siguientes categorías:

1. Secundaria incompleta

2. Secundaria completa

3. Terciaria incompleta (menos de 4 años)

4. Terciaria completa

1. ¿Cuál es el nivel de medición de cada variable y qué estadísticos de tendencia central pueden calcularse en cada una?

•2424

1. Construya una tabla de frecuencias de la variable nivel educativo. ¿Cuál es el nivel educativo más frecuente? ¿Hasta qué nivel educativo alcanzó la mitad de la población trabajadora menos educada de la empresa?

2. ¿Cuál es el salario promedio de los empleados de la empresa Arlequín?

3. ¿Cuál es el salario promedio para los hombres y cuál para las mujeres? Comente los resultados.