estadística y probabilidades cap iv
TRANSCRIPT
ESTADÍSTICA Y ESTADÍSTICA Y PROBABILIDADESPROBABILIDADES
UNHEVAL- 2009UNHEVAL- 2009
Mg. VARGAS RONCAL, RosarioMg. VARGAS RONCAL, Rosario
CAPÍTULO IV. MEDIDAS DE CAPÍTULO IV. MEDIDAS DE DISPERSIÓN Y DE FORMADISPERSIÓN Y DE FORMA
4.1 MEDIDAS DE DISPERSIÓN4.1 MEDIDAS DE DISPERSIÓN
• Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable. .
• Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable. .
4.1.1 RANGO O AMPLITUD ( R ) 4.1.1 RANGO O AMPLITUD ( R )
• Es la diferencia entre las medidas mayor y menor de un conjunto de datos.
• Datos no agrupados R = Xmax-XminXmax: dato mayor Xmin: dato menor • Datos agrupados• R = Ls – Li Ls: límite mayor y Li: límite menor
• PROPIEDADES DEL RANGO• Es fácil de calcular y sus unidades son las mismas que las de la
variable.• No utiliza todas las observaciones (sólo dos de ellas);• Se puede ver muy afectada por alguna observación extrema;• El rango aumenta con el número de observaciones, o bien se
queda igual. En cualquier caso nunca disminuye.
4.1.2 RANGO INTERCUARTÍLICO (RIQ).4.1.2 RANGO INTERCUARTÍLICO (RIQ).
• Lo calculamos como la diferencia entre el tercero y el primero de los cuartiles.
• RIQ = q3 - q1, el intervalo [q1,q3] contiene al 50% central de los valores muestrales.
4.1.3 DESVIACIÓN MEDIA (Dm)4.1.3 DESVIACIÓN MEDIA (Dm)Es la media aritmética de todas las diferencias absolutas entre cada observación individual y la media aritmética del conjunto de datos.
Datos no agrupados Datos agrupados
Población
Muestra
u: media de la población ni: frecuencia de clase ixi: punto medio de clase i ; n : total de observacionesN: total de observaciones
4.1.4 VARIANZA (S4.1.4 VARIANZA (S22))Es la media aritmética del cuadrado de las desviaciones de cada uno de los valores respecto a la media.
Datos no agrupados Datos agrupados
Población
Muestra
K: número de intervalos
4.1.6 COEFICIENTE DE VARIACIÓN (CV)
Para comparar la dispersión de variables que aparecen en unidades diferentes (metros, kilos, etc.) o que corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida de variabilidad que no dependa de las unidades o del tamaño de los datos.
A menor coeficiente de variación consideraremos que la distribución de la variable medida es más homogénea.
Población
Muestra
4.2 MEDIDAS DE FORMA4.2 MEDIDAS DE FORMA
• La forma de una distribución de frecuencias se puede describir por su simetría o falta de ella (asimetría) y por su agudeza (curtosis).
4.2.1 ASIMETRÍA4.2.1 ASIMETRÍA
• Otro rasgo interesante en una distribución de frecuencias es si los datos aparecen ubicados simétricamente o no respecto de la media. Si queremos cuantificar la simetría, es necesario conservar la información acerca tanto del signo como de la distancia de cada dato a la media (centro de simetría).
• En el caso en que el coeficiente valga cero la distribución es simétrica alrededor de la media.
• Los valores positivos, indicarán distribuciones con mayor sesgo a la derecha y los valores negativos indicarán un mayor sesgo a la izquierda.
Datos no agrupados Datos agrupados
Población
Coeficiente de Fisher
Coeficiente de Pearson
Muestra
Coeficiente de Fisher
Coeficiente de Pearson
Curva sesgada a la derecha o sesgo positivo f > 0; Sk > 0
Curva sesgada a la izquierda o sesgo negativo f < 0; Sk < 0
Curva simétrica f = 0, Sk = 0
4.2.2 CURTOSIS4.2.2 CURTOSIS
• Miden la mayor o menos concentración de datos alrededor de la media. Se suele medir con el coeficiente de curtosis, que describe lo picuda o plana que es la distribución, es decir si los datos se concentran demasiado o no, comparados con un modelo de distribución llamado distribución normal.
Datos no agrupados Datos agrupados
Población
Muestra
Platicúrtica Mesocúrtica Leptocúrtica
K=3 Mesocúrticak>3 Lepticúrticak<3 Platicúrtica
NormalMás agudas que la normalMás planas que la normal