m e d i d a s d e t e n d e n c i a c e n t r a l
Post on 30-Jun-2015
13.935 Views
Preview:
TRANSCRIPT
MEDIDAS DE TENDENCIA CENTRAL Medidas de localización
Media Aritmética
Se obtiene sumando todos los valores de una población o muestra y dividiéndolo entre el número de valores sumados.
x = ∑ xi
nµ =
∑ xi
N
Los valores extremos influyen sobre la media, y en algunos casos puede distorsionarla tanto que llega a ser indeseable como medida de tendencia central.
Media ponderadaMedia que se obtiene asignando distintos pesos a los valores,
x
=Σ ( W . X )
Σ W Necesitamos una media de tres calificaciones de una prueba, 85, 90, 75, donde
la primera prueba tiene el 20%, la segunda el 30% y la tercera 50%
Triola 2004:66
x
=( 20 . 85 ) + (30 . 90) + (50 . 75)
20 + 30 + 50= 81.5
Medidas de localización La Moda
La moda de un conjunto de valores es aquel que ocurre con mayor frecuenciaSi todos los valores son diferentes, no hay moda.Un conjunto de valores puede tener mas de una moda
Ejemplo:
¿Cual es la moda en los siguientes datos?
12 14 09 04 12 33 23 17 33 31 12 24 09 18
16 09 25 07 15
Medidas de localización La Mediana
La mediana de un conjunto finito de valores es aquel valor que divide al conjunto de números ordenados en dos partes iguales.Ninguna observación extrema en un conjunto de datos afecta a la mediana, en consecuencia, siempre que una observación extrema esté presente, es adecuado usar la mediana en lugar de la media para describir un conjunto de datos.
50%50% n + 1
2=(Par)
Me
n = número de datos
Tendencia central (Resumen)Son medidas que buscan posiciones (valores) con respecto a los cuales
los datos muestran tendencia a agruparse.
Media: Es la media aritmética (promedio) de los valores de una variable. Suma de los valores dividido por el tamaño muestral.
Media de 2, 2, 3, 7 es (2+2+3+7)/4 = 3,5Conveniente cuando los datos se concentran simétricamente con respecto a ese valor. Muy sensible a valores extremos.
Mediana: Es un valor que divide a las observaciones en dos grupos con el mismo número de individuos. Si el número de datos es par, se elige la media de los dos datos centrales.
Mediana de 1, 2 ,4 ,5, 6 ,6, 8 = 5Mediana de 1, 2, 4, 5, 6, 6, 8, 9 = (5+6)/2 = 5,5Es conveniente cuando los datos son asimétricos. No es sensible a valores extremos.Mediana de 1, 2 , 4, 5, 6, 6, 800 = 5 La media 1, 2, 4, 5, 6, 6, 800 = 117,7
Medidas de Dispersión
• La dispersión de un conjunto de observaciones se refiere a la variabilidad que presentan estas.
• Una medida de dispersión conlleva información respecto a la cantidad total de variabilidad presente en el conjunto de datos
Tres distribuciones normales con diferentes dispersiones de los datos
x
MEDIDAS DE DISPERSIÓN Rango
Diferencia entre el valor mayor y el valor menor de un conjunto de datos obtenidos en una medición.
Rango = X más grande – X más pequeño
El rango mide la dispersión total en un conjunto de datos. Aunque es una medida sencilla de la variación total de los datos, su debilidad característica consiste en que no toma en cuenta como se distribuyen los datos entre los valores mas grande y más pequeños.
No es necesariamente una medida de típica de dispersión porque la presencia de un valor extremo puede cambiar radicalmente su valor
Miden el grado de dispersión (variabilidad) de los datos, independientemente de su causa.
• Amplitud o Rango:Diferencia entre observaciónes extremas.– 2,1,4,3,8,4. El rango es 8-1=7– Es muy sensible a los valores extremos.
• Rango intercuartílico:– Es la distancia entre primer y tercer cuartil.
• Rango intercuartílico = Q3 – Q1 – Parecida al rango, pero eliminando las observaciones más extremas inferiores y superiores.– No es tan sensible a valores extremos.
150 160 170 180 190
0.0
00
.01
0.0
20
.03
0.0
40
.05
150 160 170 180 190
25% 25% 25% 25%
Mín. P25 P50 P75 Máx.
Rango intercuartílico
Rango
Medidas de dispersión
MEDIDAS DE DISPERSIÓN La Varianza
La varianza es una medida de la dispersión que emplea todos los valores de los datos. Se basa en la diferencia entre cada valor y la media.
La diferencia entre cada valor del dato Xi y el promedio ( x para una muestra y µ para una población) se llama desviación respecto al promedio.
Para una muestra la desviación se expresa como: (Xi – x); para una población: (Xi - µ)
Varianza Mide el promedio de las desviaciones (al cuadrado) de las observaciones con respecto a la media.
MEDIDAS DE DISPERSIÓN Varianza
( X1 – X )2 + ( X2 – X )2 + ….........…. ( Xi – X )2
n - 1
∑ ( Xi – X )2
S2 =
La varianza de la muestra, es la suma de los cuadrados de las diferencias de los datos con relación a la media aritmética divida entre el tamaño de la muestra menos 1
∑ ( Xi – )2
Nσ 2=
VARIANZA MUESTRAL
VARIANZA POBLACIONAL
Unidades de la varianza son al cuadrado.
S2 =n - 1
Dado un conjunto de observaciones, se llama varianza de dicho conjunto a la sumatoria de las diferencias entre cada observación y la media aritmética elevadas al cuadrado, y dividido por el número de observaciones
Es sensible a valores extremos (alejados de la media). Sus unidades son al cuadrado.
MEDIDAS DE DISPERSIÓN Desviación estándar
Es la raíz cuadrada de la varianza Indica como se agrupa o distribuye un conjunto de datos alrededor de la
media.
La desviación estándar también se define como la raíz cuadrada positiva de la varianza.
σ = σ 2
s2s =
Desviación estándar población
Desviación estándar muestra
MEDIDAS DE DISPERSIÓN Coeficiente de variación (de Pearson)
• El CV, relativo a un conjunto de datos, que se define como el cociente entre la desviación típica y la media aritmética, es evidentemente un número adimensional. Siempre se expresa como porcentaje.
CV =S
X100 %( )
S = Desviación estándar de un conjunto de datos numéricos
X = Media aritmética
Permite establecer comparaciones válidas entre las dispersiones relativas expresadas en unidades de medida diferente
No debe usarse cuando la variable presenta valores negativos o donde el valor 0 sea una cantidad fijada arbitrariamente. Por ejemplo 0ºC ≠ 0ºF
También se la denomina variabilidad relativa.
Es frecuente mostrarla en porcentajes Si la media es 80 y la desviación típica 20 entonces CV = 20/80 = 0,25 = 25% (variabilidad relativa)
Es una cantidad adimensional. Interesante para comparar la variabilidad de diferentes variables.
Si el peso tiene CV = 30% y la altura tiene CV = 10%, los individuos presentan más dispersión en peso que en altura.
MEDIDAS DE DISPERSIÓNLocalización Relativa
Puntuaciones Z
• Valor Z: Medida que indica la dirección y el grado en que un valor se aleja de la media, en una escala de unidades de desviaciones estándar del número de desviaciones estándar que un valor se aleja de la media
Z =
X - X
S
X = Puntuación o el valor a transformar
X = Media de la distribución
S = Desviación estándar de la distribución
Z = Puntuación transformada en unidades de desviaciones estándar
Las puntuaciones Z, permiten estandarizar valores para comparar puntuaciones de dos distribuciones diferentes. (la forma de medición es la misma, aunque se trata de distribuciones distintas).
Ejemplo:
Supongamos que en una distribución de frecuencias (Conjunto de datos) )obtuvimos una media de 60 y una desviación estándar de 10, deseamos comparar una puntuación de 50 con el resto de la distribución, entonces:
Sampieri 2006:436
X = 50 X = 60 S = 1050 - 60
10Z = = - 1.00
El valor de “50” se encuentra localizado a una desviación estándar por debajo de la media de la distribución. (el valor de 30 está a tres desviaciones por debajo de la media.
Ejemplo:
Queremos comparar los resultados obtenidos en una preprueba con los obtenidos en una posprueba. Se trata de un estímulo que incrementa la productividad. Un sujeto obtuvo en la preprueba una productividad de 130; la media del grupo fue de 122,5 y la desviación estándar de 10. En la postprueba obtuvo 135, la media fue de 140 y la desviación estándar de 9,8. ¿Mejoró la productividad del trabajador?
Sampieri 2006:436
Sin transformar las dos calificaciones a puntuaciones Z, no es posible asegurarlo, porque los valores no pertenecen a la misma distribución.
Preprueba.
130 - 122,510
Z = = 0,75
Postprueba.
135 - 1409,8
Z = = - 0,51
En términos absolutos, 135 es una mejor puntuación que 130, pero no en términos relativos (en relación con sus respectivas distribuciones)
MEDIDAS DE FORMA
MEDIDAS DE FORMA
Asimetría: Una distribución es simétrica si la mitad izquierda de su distribución es la imagen especular de su mitad derecha. La distribución de los datos es simétrica o no lo es. Si no lo es, recibe el nombre de distribución asimétrica o sesgada.
media > mediana: Sesgo positivo o a la derecha
media = mediana: simetría o sesgo cero
media < medina: sesgo negativo o a la izquierda
En las distribuciones simétricas media y mediana coinciden. Si sólo hay una moda también coincide
Las discrepancias entre la media y la mediana indican asimetría.
La asimetría es positiva o negativa en función de a qué lado se encuentra la cola de la distribución.
Sesgo (+) Sesgo (-)
La simetría de una función de distribución se mide por el coeficiente de sesgo de la misma.
El coeficiente de sesgo no debe sobrepasar el valor de ± 2 (para considerarse una distribución Normal)
CURTOSIS El coeficiente de curtosis mide el mayor o menor
aplanamiento de la curva de distribución
Curtosis < 0Curtosis = 0 Curtosis > 0
El coeficiente de sesgo no debe sobrepasar el valor de ± 2 (para considerarse una distribución Normal)
DISTRIBUCION NORMAL
V1
100
80
60
40
20
0
µ
Características de la distribución normal
1.- Es simétrica respecto a su media. En la imagen anterior, la curva hacia cualquiera de los lados de es una imagen de espejo de la del otro ladoµ
2.- La media, la mediana y la moda son iguales
3.- El área total bajo la curva sobre el eje de las X es una unidad de área. Esta característica se deduce del hecho de que la distribución normal es una distribución de probabilidad.
4.- Si se levantaran perpendiculares a una distancia de una desviación estándar desde la media hacia ambos lados, el área delimitada por esas perpendiculares, el eje de las X y la curva será del 68 % del área total, aproximadamente. A dos desviaciones estándar, estará incluido aproximadamente el 95 % del área, y a tres desviaciones estándar, aproximadamente 99,7 del área total estará englobada.
Dispersión en distribuciones ‘normales’
• Centrado en la media y a una desv. típica de distancia hay aproximadamente el 68% de las observaciones.
150 160 170 180 190
0.00
0.01
0.02
0.03
0.04
0.05
xs
68.5 %
150 160 170 180 190
0.00
0.01
0.02
0.03
0.04
0.05
x2s
95 %
A dos desviaciones típicas tenemos el 95% (aprox.)
Tres distribuciones normales con diferentes desviaciones estándar pero con la misma media
σ 3
σ 2
x
σ 1
DISTRIBUCIÓN NORMAL ESTÁNDAR
Como obtener la normalidad de un conjunto de datos?
MEDIDAS DE POSICIÓNNO CENTRALES
INFORMAN ACERCA DE LA POSICIÓN QUE OCUPA UN DATO DENTRO DE UNA SERIE ORDENADA EN FORMA CRECIENTE.
DECILES Dividen el conjunto de datos ordenados en diez partes
iguales. Nueve deciles dividen las observaciones en diez partes iguales. Se denotan: D1 D2 D3……………… D9 ; D5 = Mediana
PERCENTILES Dividen el conjunto de datos ordenados en 100 partes
iguales. El percentil 90 es un valor tal que el 90% de todos los valores son menores y el 10 son mayores que él. Se denotan: P1 , P2 P3 , P4 ……………. P99 ; P50 = Mediana; P25 Se corresponde con el primer cuartil ; P75 Se corresponde con tercer cuartil
CUARTILES Dividen el conjunto de datos ordenados en cuatro partes iguales. Los cuartiles
son: Q1 ; Q2 ; Q3 . Se necesitan solamente tres cuartiles para dividir los datos en cuatro partes. El cuartil Q2 = Mediana
Datos
Q1 Q2=Me Q3 Ls
0% 25% 50% 100%75%
CUARTILES
Li
Datos
DECILES 1 2 3 4 5 6 7 8 9 10
Variable Descripción Estadísticos y gráficos
Cualitativa en escala nominal
Valores no numéricos con ausencia de orden entre
ellos
Distribución de frecuencias
ModaDiagrama de barras
Cualitativa en escala ordinal
Valores no numéricos con
presencia de orden entre
ellos
MínimoMáximoMedianaCurtiles
PercentilesRango
IntercuartílicoGráfico de caja y
bigotes
Cuantitativa en escala de intervalo o de razón
Cuantitativa discreta Cuantitativa continua
En escala de intervalo En escala de razón
MediaRango
VarianzaDesviación Típica
Coeficiente de Variación
Coeficiente de asimetría
Coeficiente de curtosis
HistogramaGráfico de tallo y
hoja
HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA
EJERCICIO
1. Abra el archivo que se encuentra en el CD “Ejercicios datos SPSS2. Abra el archivo “Regresión Multiple_13. Identifique los nombres de cada variable4. Analizar – estadísticos descriptivos – descriptivos pasar “medición del estrés” (pasos siguientes: próxima diapositiva)5. Analizar – estadísticos descriptivos – frecuencias pasar “medición del estrés” (pasos siguientes: próxima diapositiva)6. Interprete los resultados
FIN PRESENTACÍON ESTADÍSTICA DESCRIPTIVA
top related