medidas de tendencia central - … · • las medidas de tendencia central que más se utilizan...
TRANSCRIPT
Medidas de
Tendencia
CentralDra. Noemí L. Ruiz Limardo
© Derechos de Autor Reservados
Revisado 2010
Objetivos de Lección
• Conocer cuáles son las medidas de
tendencia central más comunes y
cómo se calculan o se determinan
• Conocer el significado e
interpretación de cada medida de
tendencia central
• Conocer el significado del concepto
valor típico
• Identificar el valor más típico de un
grupo de datos
• Aplicar las medidas de tendencia
central en un conjunto de datos
Introducción
Introducción
• Después de recopilar datos y organizarlos y
presentarlos en tablas y gráficas, uno desea conocer
cómo es la muestra.
• Este es el proceso de describir el conjunto de datos.
• Describir la muestra implica contestarse las siguientes
preguntas:
– ¿Qué forma tiene la distribución?
– ¿Cuáles son los valores más típicos?
– ¿Cuánta varíación hay en las puntuaciones? ¿Cuánto varían
los datos?
Introducción
• Conocer la muestra implica poder describirla
aplicando los siguientes conceptos:
– Forma de la distribución (Simetría o Sesgo)
– Medidas de Tendencia Central (Valores típicos-Promedios)
– Medidas de Variación (Dispersión de los datos)
– Medidas de Posición (Interpretación de un valor en referencia
a una norma-”norm-referenced interpretation”)
• En esta presentación se discutirán los conceptos de
Tendencia Central y su relación con la forma de la
distribución.
Medidas de Tendencia
Central
Medidas de tendencia central
• Son las medidas o valores que
tienden hacia el centro en una
distribución de datos.
• Representan el valor más típico de
un grupo de datos.
• Se conocen también como los
promedios.
• Hay varias clases de promedios.
• Las medidas de tendencia central
que más se utilizan son:
– Media Aritmética
– Mediana
– Moda
Valor más
típico- Valor que
mejor representa
un grupo de
datos.
Otros promedios,
pero no son
tendencia central:
1. Rango medio
2. Eje medio
Media Aritmética
Media Aritmética
• Se conoce también como el
promedio aritmético de una lista
de valores o simplemente la media.
• Es el valor que balancea o
distribuye en partes iguales un
grupo de valores.
• Se halla sumando todos los valores
(xi) del grupo de datos y dividiendo
ese resultado por el total de valores
que hay en el grupo (n).
(Ver por qué de acuerdo al
significado)
Media Aritmética
• El símbolo para la media de la
población es: .
• El símbolo para la media de una
muestra es: .
• La fórmula para calcular la media
aritmética es:
xi son los valores
n es total de datos
Σ significa sumar
x
n
x
x
n
i
i 1
67
42x
Ejemplo: Halla
la media.
4
3
2
5
7
12
9
7
6
5
4
3
2
1
x
x
x
x
x
x
x
Características de la Media Aritmética
• La media aritmética aplica cuando
tenemos datos cuantitativos.
• La media aritmética se afecta con
la existencia de valores extremos.
• La suma de las desviaciones de
todas las puntuaciones desde la
media, es cero.
• La suma de los cuadrados de las
desviaciones de todas las
puntuaciones desde la media es un
menor , esto es, produce el
número más pequeño que si se
tomaran las desviaciones desde
cualquier otro valor.
EJEMPLO
Media Ponderada
• A veces se desea hallar la media
de dos o más grupos de medias.
• Ejemplo:
• Un grupo de 180 estudiantes toman
un examen final, 106 son mujeres y
74 son varones. La media de las
puntuaciones fue:
• No se puede hallar la media de los
dos grupos combinados
simplemente hallando la media de
las medias.
89.54
26.45
M
F
x
x
O sea, no se
puede hallar la
media de las
dos medias
sumando
ambas y
dividiendo por
2.
2
89.5426.45 x
Hay que hallar
la media
ponderada.
Media Ponderada
• La media ponderada será igual a:
• Ejemplo: Halla la media del grupo
representado por el ejemplo
anterior:
MF
MF
MF
MMFF
nn
xx
nn
xnxnx
22.49
180
062,4798,4
74106
)89.54()74()26.45()106(
x
075.50
2
89.5426.45
x
Mediana
Mediana• Es el valor que está localizado en el
mismo centro de un grupo de datos,
cuando la lista de valores está
ordenada de menor a mayor.
• Es el punto medio de una distribución
de datos.
• Pasos para hallar la mediana:
– Ordenar los datos en forma
ascendente.
– Aplicar la fórmula para determinar
la posición que ocupa la mediana
en la lista de datos.
– Determinar qué valor de la lista
ocupa esa posición.
Esta fórmula se
usa para
determinar la
posición de la
mediana cuando
se tienen datos
crudos sin
agrupar. Más
adelante se verá
cómo se
determina la
mediana cuando
los datos están
agrupados.
2
1
nMd
Mediana• La mediana es un valor de la lista si
el total de datos es un número
impar.
• Si el total de datos es un número
par, la mediana se halla buscando el
punto medio de los dos valores
centrales. El punto medio se halla
sumando los dos valores centrales y
luego dividiendo ese total por 2.
• La mediana no se afecta con la
existencia de valores extremos. ¿Por
qué?
Mediana• Ejemplo 1:
• Halla la mediana del siguiente grupo
de datos: 3, 21, 18, 6, 23, 19, 12.
• Ejemplo 2:
• Halla la mediana del siguiente grupo
de datos: 18, 23, 27, 28, 29, 40, 44,
46.
Md = 18
Md = 28.5
Moda
Moda
• Es el valor que más se repite o que
aparece con mayor frecuencia en
una lista de datos.
• A veces hay más de una moda.
• Cuando hay dos modas, decimos
que el grupo es bimodal.
• A veces no hay moda porque no
hay un valor que se repite más que
los demás.
• Cuando existe, la moda es siempre
un valor del grupo de datos.
• No existe una fórmula matemática
para calcularla ya que se halla solo
por inspección visual.
Moda
• Es la medida de tendencia más fácil y
más sencilla de determinar.
• Provee muy poca información sobre el
grupo de datos por eso es la menos
confiable.
• Se usa como valor típico solo cuando la
variable es cualitativa en la escala
nominal.
• Cuando los datos están agrupados en
clases, se determina el intervalo modal
o la clase modal en vez de la moda.
• En este caso, se considera el punto
medio de la clase (marca de clase)
como el valor que representa la moda
del grupo.
Ejercicios para Calcular
Tendencia Central para
datos crudos
Ejemplo 1:• Halla la media aritmética, mediana
y moda del siguiente grupo de
datos:
84, 90, 65, 52, 90
• Media Aritmética
76.2
• Mediana
84
• Moda
90
Ejemplo 2:
• En la librería de la universidad se
vendió el libro de estadísticas por 8
semanas. A continuación aparece
el número de libros que se vendió
cada semana:
14, 21, 12, 18, 15, 17, 15, 16
• ¿Cuál fue la media aritmética de
libros vendidos?
• ¿Cuál fue la mediana de libros
vendidos?
• ¿Cuál fue la moda de libros
vendidos?
• ¿Qué promedio representa el valor
más típico?
16
15.5
15
¿Qué significa
cada medida
hallada?
Ejercicios para Calcular
Tendencia Central para
datos agrupados
Moda
Datos agrupados por valor simple
Segundos de reacción ante
estímulo previo a consumir
un gramo de THC
xi (segundos) f
12 1
11 2
10 3
9 2
8 1
Total 9
• Halla la moda.
Moda = 10 segundos
Frecuencia mayor
Datos Agrupados en Clases• Halla la moda.
Segundos de reacción ante
estímulo previo a consumir
una droga antidepresiva
xi (segundos) f
2-3 4
4-5 2
6-7 3
8-9 3
10-11 2
12-13 9
14-15 3
Total 26
Esta es la clase
modal porque es la
clase donde está la
frecuencia mayor
La moda es el punto
medio ya que el punto
medio representa la clase.
Moda = 12.5
Media Aritmética
Datos agrupados por valor simple
Segundos de reacción ante
estímulo previo a consumir
un gramo de THC
xi (segundos) f
12 1
11 2
10 3
9 2
8 1
Total 9
• Halla la media aritmética.
Cuando los datos están
agrupados la fórmula
para hallar la media
aritmética cambia ya
que hay que considerar
la frecuencia con que se
repiten los datos.
Datos agrupados por valor simple
ix fx
n
Segundos de reacción ante
estímulo previo a consumir
un gramo de THC
xi (segundos) f
12 1
11 2
10 3
9 2
8 1
Total 9
• Fórmula para hallar la media
aritmética:xi son los valores
f es frecuencia
n es total de datos
Σ significa sumar
Recuerda que cuando
aparecen dos variables
juntas en una fórmula,
significa: multiplicación.
¿Qué se necesita para
aplicar la fórmula?
Hay que añadir columna
de xi. f .
Datos agrupados por valor simple
ix fx
nSegundos de reacción ante estímulo previo
a consumir un gramo de THC
xi (segundos) f xi f
12 1 12
11 2 22
10 3 30
9 2 18
8 1 8
Total 9 90
• Halla la media aritmética.
9010
9x
Datos Agrupados en Clases
• Halla la media aritmética.
ix fx
n
Cocientes de inteligencia para
una muestra de adictos a
cocaína
x f
50-59 19
60-69 32
70-79 60
80-89 70
90-99 119
100-109 140
110-119 160
120-129 140
130-139 120
140-149 80
150-159 60
Total 1,000
¿Qué se necesita para
aplicar la fórmula?
Hay que añadir dos
columnas, la de xi y la
de xi. f .
¿Qué es xi ?
xi es el punto medio.
Cuando los datos están
agrupados en clases se usa
la misma fórmula anterior.
Datos Agrupados en Clases
• Media Aritméticaix f
xn
Cocientes de inteligencia para una muestra de adictos a cocaína
x f xi xi f
50-59 19 54.5 1,035.5
60-69 32 64.5 2,064.0
70-79 60 74.5 4,470.0
80-89 70 84.5 5,915.0
90-99 119 94.5 11,245.5
100-109 140 104.5 14,630.0
110-119 160 114.5 18,320.0
120-129 140 124.5 17,430.0
130-139 120 134.5 16,140.0
140-149 80 144.5 11,560.0
150-159 60 154.5 9,270.0
Total 1,000 112,080.0
112,080/1,000 112.08
Mediana
Datos agrupados por valor simple
inf
/ 2n faMd F
f
Segundos de reacción ante
estímulo después de
consumir 4 oz alcohol
x (segundos) f
7 1
8 1
9 2
10 3
11 3
12 6
13 8
14 12
15 14
16 2
Total 52
• Halla la mediana.
Finf es frontera inferior
de la clase mediana
fa es frecuencia
acumulada de la clase
anterior a la mediana
f es frecuencia de la
clase mediana
¿Qué se necesita para
aplicar la fórmula?
Hay que añadir la
columna de frecuencia
acumulada.
Datos agrupados por valor simple
inf
/ 2n faMd F
f
Segundos de reacción ante estímulo
después de consumir 4 oz alcohol
x (segundos) f fa
7 1 1
8 1 2
9 2 4
10 3 7
11 3 10
12 6 16
13 8 24
14 12 36
15 14 50
16 2 52
Total 52
• Mediana
26 2413.5
12
13.5 0.17
13.67
Md
n/2 = 52/2 = 26
Clase Mediana
Finf es frontera inferior
de clase mediana
fa es frecuencia
acumulada de clase
anterior a mediana
f es frecuencia de
clase mediana
¿Dónde empezamos en
la fórmula?
Datos agrupados en clases
inf
/ 2n faMd F i
f
Segundos de reacción ante estímulo
después de consumir 4 oz alcohol
x (segundos) f fa
7-8 2 2
9-10 5 7
11-12 9 16
13-14 20 36
15-16 16 52
Total 52
• Mediana
26 1612.5 2
20
1012.5 2
20
12.5 0.5 2
12.5 1
13.5
Md
n/2 = 26
Clase Mediana
i es intervalo de las
clases
Cuando los datos están agrupados
en clases se usa la fórmula anterior
pero con una variación. Hay que
considerar el intervalo de clases.
¿Cúal es la medida de
tendencia central más
apropiada?
¿Cuál es la medida de tendencia central más
apropiada?
• Dependerá si la variable es cualitativa o
cuantitativa y su escala de medición.
• Si la variable es cualitativa nominal, solo la moda
es apropiada.
• Si la variable es cualitativa ordinal, puede ser más
apropiada la mediana o la moda.
• Si la variable es cuantitativa intervalar o de razón,
las tres medidas pueden ser apropiadas aunque se
prefieren la mediana y la media.
• Si se desea inferir a la población, se debe usar la
media como medida más apropiada.
• Si hay valores extremos y no se desea inferir a la
población, la mediana podría ser la más apropiada.
Relación entre las medidas
de tendencia central y la
forma de la distribución
Comparación por forma de distribución
• Distribución Normal
MA
Md
Mo
Mo = Md = MA
Comparación por forma de distribución
• Distribución Rectangular
Md = MA
No hay Moda
Comparación por forma de la distribución
• Distribución con Sesgo Positivo
Mo Md MA
Mo < Md < MA
Comparación por forma de la distribución
• Distribución con Sesgo Negativo
MoMdMA
MA < Md < Mo
Fin de la lección
Ejemplo para ilustrar propiedades de la media
9 3 9 1
12 6 36 16
7 1 1 1
5 -1 1 9
2 -4 16 36
3 -3 9 25
4 -2 4 16
Totales = 42 = 0 = 76 = 104
ix xxi 2
xxi 2
8ix
n = 7 6x