estadistica descriptiva - medidas de variabilidad

Upload: jaime-hermosilla

Post on 18-Jul-2015

465 views

Category:

Documents


1 download

TRANSCRIPT

Estadstica Descriptiva: Medidas de Variabilidad

Hctor Venegas V.Osorno, Noviembre de 2011

MEDIDAS DE VARIABILIDAD

Hemos estudiado las medidas de Tendencia Central apreciando su utilidad para describir una distribucin, pero no es suficiente con este tipo de medidas para lograr talfin. Adems de conocer dnde se encuentra la mayor concentracin de los datos, es necesario determinar cmo varan los puntajes o las observaciones en relacin a esa Tendencia Central.

Cuando comparamos dos o ms distribuciones, puede ocurrir que tengan la misma media, pero ser muy distintas en cuanto a la dispersin. Por ej. Evaluandos los puntajes de la antigua ficha CASII de dos sectores poblacionales deprivados, observamos que la media en ambos es de 200 puntos, pero en uno de los sectores los puntajes se extienden de 197 a 203 mientras que en el otro de 190 a 210 puntos. Vemos que en el segundo grupo los puntajes abarcan una mayor amplitud, o lo que es lo mismo, el grupo es ms heterogneo, los puntajes estn ms dispersos. En el primer grupo los puntajes estn concentrados alrededor de la media, la variable presenta menor amplitud, por lo tanto el grupo ha tenido un puntaje ms homogneo

El conocer la heterogeneidad u homogeneidad de los sectores (grupos) permite elaborar tareas diferentes para cada uno. En el segundo grupo deben implementarse intervenciones diversas teniendo en cuenta las diferencias, en el primero, se podr implementar tareas similares ya que los puntajes del grupo son ms parejos. Cuando la variabilidad de un grupo es alta, se reduce la exactitud de las predicciones que pueden realizarse, pero cuando disminuye la variabilidad, disminuye tambin la incertidumbre en relacin a la o las variables estudiadas.

Las medidas que dan cuenta de la homogeneidad o heterogeneidad de un grupo se llaman MEDIDAS DE VARIABILlDAD y las ms usadas en Investigacin Social son: * Amplitud total * Desviacin semi- intercuartil * Desviacin standard * Varianza * Coeficiente de Variacin.

AMPLITUD TOTAL (At)Es la diferencia entre el Valor mayor y el valor menor de la variable,

cuanto mayor es esa diferencia, mayor es la variabilidad. At = V - v Por ejemplo, dado los siguientes puntajes: 1 - 2 - 3 - 4 - 5 - 6 - 7 - 8 - 9 At = 9 - 1 = 8 puntos Es una medida muy general de dispersin, se usa slo cuando queremos tener una idea aproximada de la variabilidad. En su determinacin intervienen slo los valores extremos, no tiene en cuenta la las observaciones dentro de la distribucin, por ello no es confiable cuando hay espacios muy grandes en la distribucin.

DESVIACION SEMI- INTERCUARTIL (Q)Es la mitad de la distancia entre el cuartil 1 y el cuartil 3, o lo que es lo mismo entre el P25 y el P75, de una distribucin. Cuanto mayor es la diferencia entre estos cuartiles, mayor ser la variabilidad del grupo Al igual que la amplitud total, se basa slo en 2 datos, los valores del C1 y del C3, aunque en este caso los valores no son los extremos La desviacin semi-intercuartilica (Q), se utiliza cuando estamos ante una distribucin asimtrica, es decir que como medida de Tendencia Central hemos utilizado la Mediana (Md). Su frmula es:

Para resolverlo primero debemos hallar el valor de ambos cuartiles. Veamos en la siguiente tabla de puntajes:

La distancia entre C1 y C3 marca los limites del 50% central de la distribucin. Si los puntajes se concentran en el centro, los cuartiles estarn cerca y Q ser pequea. Si los puntajes estn dispersos, los cuartiles estn separados y Q ser grande. Si a la mediana le sumamos y restamos el valor de Q, obtendremos los lmites del 50% central de la distribucin.

En el ejemplo anterior la Md= 14 puntos, le sumamos y restamos el valor de Q= 3,68 ptos.: 14 + 3,68 = 17,68 ptos. 14 - 3,68 = 10,32 ptos

Entre los puntajes 10,32 y 17,68 se halla el 50% central de los casos.

DESVIACION STANDARD (S)Es la medida de variabilidad ms usada, se emplea cuando hemos hallado la media como medida de tendencia central pues se basa en las desviaciones de los puntajes respecto a ella. En estadstica nos interesan los promedios, no la desviacin de cada puntaje por separado, debemos pues hallar el promedio de los desvos a la media. Supongamos que tenemos los puntajes de un grupo de alumnos y queremos determinar la homogeneidad o no que presenta ese grupo 4-5-6-7-8 Primero debemos hallar la media para luego hallar los desvos a ella.

Sabemos que la sumatoria de los desvos a la Media siempre es cero, por lo que este promedio dara cero. Para evitar esta dificultad se eleva al cuadrado cada uno de los desvos obteniendo as una sumatoria distinta de 0 y luego se extrae la raz, con lo que se reduce este promedio a la unidad que tenan las observaciones originales.

Por lo que la desviacin standard es la raz cuadrada del promedio del cuadrado de las desviaciones de las medidas respecto a su media.

Clculo de la Desviacin Standard para datos sin agrupar

Los pasos para calcularla cuando los datos estn sin agrupar son: 1 - Calculamos la media. 2- Calculamos los desvos de cada puntaje respecto a la meda 3 - Elevamos cada desvo al cuadrado 4 - Hallamos la sumatoria de los cuadrados de los desvos a la media 5 - Reemplazamos la frmula con los valores obtenidos:

La desviacin estndar es la medida de variabilidad ms usada, pues es la que vara menos cuando se calcula en distintas muestras de una misma poblacin. Siempre es un valor positivo que se expresa en la misma unidad de medida que la variable con la que estamos operando. En su clculo intervienen todos los valores de la variable. Nos indica el grado de homogeneidad o heterogeneidad de la distribucin, es decir que cuanto menor sea el valor de la Desviacin Standard, ms homogneo ser ese grupo.

PROPIEDADES Y CARACTERISTICAS DE LA DESVIACIN STANDARD

A) Si se suma o se resta a todos los valores de la variable por un valor

constante, la media queda aumentada o disminuida en este valor pero la desviacin standard permanece igual.B) Si se multiplica o divide cada valor de la variable por un valor

constante, tanto la media como la desviacin standard se vern afectados por esa operacin, quedando multiplicados o divididos por esa constante.C) Cuando

el nmero de casos es alto, podemos determinar

aproximadamente los lmites inferior y superior de la variable. Conociendo el valor de la desviacin standard, ste se encuentra comprendido seis veces en la variable.

PROPIEDADES Y CARACTERISTICAS DE LA DESV. STANDARD (cont.)

Por ejemplo, si una distribucin de puntajes de una prueba, tiene una media de 10 puntos y un desvo de 2 puntos podemos determinar los lmites de esa distribucin y decir que el lmite inferior ser de 4 puntos (resulta de restarle a la media tres veces el valor del desvo) y que el lmite superior ser de 16 puntos (resulta de sumarle a la media tres veces el valor de la desviacin standard).D) En una distribucin normal, el valor de la desviacin standard

medida por encima y por debajo de la media, delimita el 68,26% central de los casos. Si consideramos los datos anteriores podemos decir que entre 8 y 12 puntos se encuentra concentrado el 68% central, con lo que slo el 32% queda por fuera de ello.

Clculo de la Desviacin Standard para datos agrupados

Supongamos que tenemos los siguientes datos correspondientes a los puntajes de una evaluacin de Estadstica Social I, de un grupo de alumnos, organizados en una tabla de frecuencias simple:

Para reemplazar la frmula debemos abrir distintas columnas, siguiendo los pasos planteados anteriormente, en primer lugar calculamos el valor de la media que es 7 puntos, luego abrimos una columna para establecer los desvos de cada puntaje respecto de la media, en la columna siguiente elevamos cada desvo al cuadrado y finalmente deber multiplicarse cada desvo elevado al cuadrado por la frecuencia, a fin de considerar todos los datos.

Clculo Desv. Standard para datos agrupados en intervalos Ejemplo: Edades de un grupo de nios y jovenes de un sector pobl.

Observamos que al estar agrupados en intervalos, el Punto Medio representa los valores de cada intervalo, por ello en la frmula X (valor de variable) es reemplazado por el PM.

INTERPRETACIN DE LA DESVIACIN STANDARD

La desviacin standard es un estadstico que caracteriza a una distribucin. Aumenta en proporcin directa a la amplitud con que se dispersan las puntuaciones. Entonces al preguntarnos cundo una desviacin es grande y cundo pequea, la interpretacin de grande o pequea depende de la variable que estemos analizando, por ejemplo una desviacin de 5 ser grande si estamos hablando de la dispersin de la edad en que los nios aprenden a leer y ser pequea si nos estamos refiriendo a la dispersin del ingresos de un grupo de personas. Por otro lado grande o pequeo tienen un significado relativo, es ms grande o ms pequeo que el encontrado para algn otro grupo o algna otra prueba.

VARIANZA

Es el promedio de la suma de los cuadrados de desvos a la media, o sea el desvo standard elevado al cuadrado. Al utilizarse en el clculo de la desviacin standard una raz cuadrada, no permite aplicar la propiedad distributiva para la suma y resta. Por lo tanto cuando queremos analizar la desviacin en sus distintos componentes recurrimos al clculo de la varianza. No es muy utilizada en estadstica descriptiva debido a que se basa en desvos cuadrticos que no permiten una interpretacin clara de la dispersin de las observaciones

COEFlClENTE DE VARlAClON

Es una medida de variabilidad relativa, se expresa en porcentaje, por lo tanto permite la comparacin entre variables medidas en unidades diferentes, por ej. Peso y Altura, o cuando tratndose de la misma unidad de medida las medias son muy distintas. Cuanto ms prximo a cero sea el valor del CV, ser menor la variabilidad del grupo respecto a la Media. Es el cociente entre la Desv. Standard y la Media multiplicado por 100:

Por ejemplo tenemos la medicin del peso y la altura de un grupo de personas y queremos determinar en cul de las caractersticas el grupo es ms variable:Peso: Me=60 Kg, S=5 Kg

Altura: Me=162 cm, S=10 cm

Aqu podemos observar claramente que si comparramos los desvos directamente, la caracterstica en que el desvo es ms pequeo es peso, sin embargo al relacionarla con la media, peso es la caracterstica ms variable. Esta medida estadstica slo puede ser utilizada cuando trabajamos con el nivel de medicin por cocientes o razones, es decir cuando el origen de la variable es el cero verdadero.

USO DE LAS DISTINTAS MEDIDAS DE VARIABILIDAD

AMPLITUD TOTAL a) Cuando queremos determinar rpidamente la variabilidad sin recurrir a frmulas b) Cuando todo lo que se desea es conocer los puntajes extremos o la dispersin total. DESVIACIN SEMI-INTERCUARTIL a) Cuando la medida de tendencia central usada es la mediana b) Cuando interesa slo el 50% central, concentrado alrededor de la mediana c) Cuando hay puntajes dispersos o extremos que influirn demasiado en la desviacin standard.

USO DE LAS DISTINTAS MEDIDAS DE VARIABILIDAD

DESVIACIN STANDARD a) Cuando la media es la medida de tendencia central utilizada. b) Cuando importan todos los valores en la dispersin y no slo los centrales c) Cuando deben calcularse otros estadsticos VARIANZA a) Cuando nos interesa analizar cunto de la dispersin se debe a la incidencia de otra variable. COEFICIENTE DE VARIACIN a) Cuando queremos comparar la variabilidad de dos distribuciones distintas, ya sea por la variable analizada o por el valor de sus medias. b) Slo debe utilizarse cuando el nivel de medicin es cocientes o razones.

Las medidas de variabilidad o dispersin que hemos trabajado no son aplicables a distribuciones de escalas nominales u ordinales. Cuando trabajamos con variables que corresponden a estos niveles, la variabilidad ser mayor si el nmero de categoras es alto y si las frecuencias de las distintas categoras son semejantes entre s. Por el contrario cuando hay una categora modal con frecuencia muy superior al resto, hablamos de menor variabilidad o mayor probabilidad de que ocurra el valor de esa categora. Para las variables cualitativas debemos considerar que a mayor concentracin de las frecuencias menor variabilidad.

ASIMETRIA O SESGOLas observaciones de la realidad casi nunca resultan absolutamente simtricas, existen distintas formas para establecer el grado de asimetra o sesgo de una distribucin. Una de ellas es: As = 3 *(Me Md) S

Cuando el resultado obtenido es igual a 0 estamos ante una variable que se distribuye de manera simtrica, cuando el valor obtenido es positivo, hablamos de una asimetra positiva (las observaciones se agrupan hacia la izquierda o sea, por debajo del valor de la Me (la cola de la curva se extiende hacia la derecha). La asimetra es negativa cuando el valor es negativo y las observaciones se agrupan a la derecha o por encima del valor de la media (la cola del grfico ir hacia la izquierda, hacia los valores ms bajos de la variable).

CURTOSISEs la propiedad que, junto con las medidas de Tendencia Central, Variabilidad y Asimetra, describen una distribucin. La curtosis indica la pendiente de la curva o grfico, el grado de aplastamiento o elevamiento de la distribucin; si la pendiente es empinada le llamamos leptocrtica, si es plana: platicrtica y cuando es media: mesocrtica.

(es el caso de la curva normal). Este concepto es vlido cuando trabajamos con distribuciones unimodales. Una de las maneras de determinar la curtosis es: Cu = . Q . (P90-P10) Para la curva normal (mesocrtica) la frmula de Curtosis da igual a 0,263. Si Cu es mayor que 0,263 la distribucin es platicrtica, si es menor que 0,263 es leptocrtica.

BIBLIOGRAFA:

BLALOCK, Hubert M.: Estadstica Social. (1986) Fondo de Cultura Econmica. Mxico. CORTADA de KOHAN, Nuria Diseo Estadstico (1994) EUDEBA, Bs.As. DANIEL, W.: Estadstica con Aplicaciones a las Ciencias Sociales y a la Educacin. (1981) McGrawHill, Madrid. GARRET, Henry E.: Estadstica en Psicologa y Educacin. (1983) Paids. Barcelona. GRASSO, Livio T.P.: Introduccin a la Estadstica en Ciencias Sociales y del Comportamiento. (1999) Facultad de Filosofa y Humanidades de la Universidad Nacional de Crdoba. HERNNDEZFERNNDEZBAPTISTA: Metodologa de la Investigacin. Segunda Edicin. (1998) McGraw-Hill. Mxico.