medidas de dispersion udh.pdf

13
UNIVERSIDAD DE HUÁNUCO ESTADISTICA I – EST. Y . PROB. - ESTADISTICA LENIN JUSTINIANO PIO. FACULTAD DE INGENIERÍA ESCUELA PROFESIONAL DE ING. CIVIL / AMBIENTAL / SISTEMAS / ARQUITECTURA 1 MEDIDAS DE DISPERSION. Son indicadores estadísticos que representan cuan dispersas se encuentran los datos de la variable, señalándonos el grado de concentración de los mismos con respecto al promedio de la distribución. Las medidas de dispersión más usuales son: Rango Rango intercuartilico Varianza Desviación Estándar Coeficiente de Variación Las medidas de dispersión se usan para: a) Verificar la confiabilidad de los promedios. b) Establecer como base para el control de la variable. Así tenemos: Alta dispersión (medida de dispersión alta) --- baja concentración alrededor del promedio. DATOS HETEROGENEOS Baja dispersión (medida de dispersión baja) -- Alta concentración alrededor del promedio. DATOS HOMOGENEOS RANGO.- El rango de una variable es la diferencia entre el valor máximo y su valor mínimo y se define como: R = Xmax - Xmin Su uso es muy limitado, pues solo toma en cuenta los valores extremos. Ejemplo: La edad de 10 alumnos en un aula de clase, es según se muestra a continuación. Se pide hallar el rango. 23 18 28 18 16 26 19 20 21 18 Solución. Rango = 28 – 16 = 12 Luego, existe una dispersión de 12 años. RANGO INTERCUARTILICO Se le llama rango intercuartílico o rango intercuartil, a la diferencia entre el tercer y el primer cuartil de una distribución. A diferencia del rango, se trata de un estadístico robusto.

Upload: wilmer-fernandez

Post on 10-Nov-2015

40 views

Category:

Documents


0 download

TRANSCRIPT

  • UNIVERSIDAD DE HUNUCO ESTADISTICA I EST. Y . PROB. - ESTADISTICA LENIN JUSTINIANO PIO.

    FACULTAD DE INGENIERA ESCUELA PROFESIONAL DE ING. CIVIL / AMBIENTAL / SISTEMAS / ARQUITECTURA

    1

    MEDIDAS DE DISPERSION.

    Son indicadores estadsticos que representan cuan dispersas se encuentran los datos de la

    variable, sealndonos el grado de concentracin de los mismos con respecto al promedio de la

    distribucin.

    Las medidas de dispersin ms usuales son:

    Rango

    Rango intercuartilico

    Varianza

    Desviacin Estndar

    Coeficiente de Variacin

    Las medidas de dispersin se usan para:

    a) Verificar la confiabilidad de los promedios.

    b) Establecer como base para el control de la variable. As tenemos:

    Alta dispersin (medida de dispersin alta) --- baja concentracin alrededor del promedio. DATOS

    HETEROGENEOS

    Baja dispersin (medida de dispersin baja) -- Alta concentracin alrededor del promedio. DATOS

    HOMOGENEOS

    RANGO.-

    El rango de una variable es la diferencia entre el valor mximo y su valor mnimo y se define como:

    R = Xmax - Xmin

    Su uso es muy limitado, pues solo toma en cuenta los valores extremos.

    Ejemplo:

    La edad de 10 alumnos en un aula de clase, es segn se muestra a continuacin. Se pide hallar

    el rango.

    23 18 28 18 16 26 19 20 21 18

    Solucin.

    Rango = 28 16 = 12

    Luego, existe una dispersin de 12 aos.

    RANGO INTERCUARTILICO

    Se le llama rango intercuartlico o rango intercuartil, a la diferencia entre el tercer y el

    primer cuartil de una distribucin. A diferencia del rango, se trata de un estadstico robusto.

  • UNIVERSIDAD DE HUNUCO ESTADISTICA I EST. Y . PROB. - ESTADISTICA LENIN JUSTINIANO PIO.

    FACULTAD DE INGENIERA ESCUELA PROFESIONAL DE ING. CIVIL / AMBIENTAL / SISTEMAS / ARQUITECTURA

    2

    El rango intercuartlico es una medida de variabilidad adecuada cuando la medida de posicin

    central empleada ha sido la mediana.

    RI =Q3 Q1

    Ejemplo: Calcular e interpretar el RI para el siguiente conjunto de edades:

    20, 49, 59, 18, 32, 32, 63, 24, 20, 32, 53, 48

    Q1 = 22

    Q3 = 51

    RI = 5122 = 29 aos

    Interpretacin:

    29 aos es la distancia existente en el 50% central de la distribucin.

  • UNIVERSIDAD DE HUNUCO ESTADISTICA I EST. Y . PROB. - ESTADISTICA LENIN JUSTINIANO PIO.

    FACULTAD DE INGENIERA ESCUELA PROFESIONAL DE ING. CIVIL / AMBIENTAL / SISTEMAS / ARQUITECTURA

    3

    DESVIACIN MEDIA RESPECTO A LA MEDIA (Dx) Se define como el promedio de las desviaciones en valor absoluto respecto a la media aritmtica:

    D

    x x n

    nx

    i i

    i

    Si toma valores grandes significa que los valores de la variable se distribuirn en valores alejados de la media. Ejemplo 1:

    xi ni xi - x ni xi-x 0 2 2.52 5.04 1 4 1.52 6.04 2 21 0.52 10.92 3 15 0.48 7.2 4 6 1.48 8.88 5 1 2.48 2.48 6 1 3.48 3.48

    44.38 Dx = 44.38/50 = 1.77 DESVIACIN MEDIA RESPECTO A LA MEDIANA (DMe) Se define como el promedio de las desviaciones en valor absoluto respecto a la mediana:

    D

    x Men

    nMe

    i i

    i

    Si DMe es grande los valores estn dispersos respecto de la mediana. Ejemplo 1:

    xi ni xi - Me ni xi-Me 0 2 2 4 1 4 1 4 2 21 0 0 3 15 1 15 4 6 2 12 5 1 3 3 6 1 4 4

    42 DMe = 42/50 = 0.84

  • UNIVERSIDAD DE HUNUCO ESTADISTICA I EST. Y . PROB. - ESTADISTICA LENIN JUSTINIANO PIO.

    FACULTAD DE INGENIERA ESCUELA PROFESIONAL DE ING. CIVIL / AMBIENTAL / SISTEMAS / ARQUITECTURA

    4

    LA VARIANZA

    CALCULO DE LA VARIANZA.

    A) DATOS SIN AGRUPAR.-

    VARIANZA:

    N

    xN

    i

    i

    1

    2

    2

    1

    1

    2

    2

    n

    xx

    S

    n

    i

    i

    Donde: Xi valores de la variable X N tamao de la poblacin n tamao de la muestra

    2 Varianza poblacional S2 Varianza muestral

    .- DATOS AGRUPADOS.-

    Cuando los datos estn en una tabla de distribucin de frecuencia, la varianza se halla segn la

    frmula:

    N

    fmK

    i

    ii

    1

    2

    2

    .

    1

    .1

    2

    2

    n

    fxm

    Si

    k

    i

    i

  • UNIVERSIDAD DE HUNUCO ESTADISTICA I EST. Y . PROB. - ESTADISTICA LENIN JUSTINIANO PIO.

    FACULTAD DE INGENIERA ESCUELA PROFESIONAL DE ING. CIVIL / AMBIENTAL / SISTEMAS / ARQUITECTURA

    5

    donde:

    fi = frecuencia absoluta simple de cada clase o grupo

    mi = marcas de clase de cada clase o grupo.

    N = tamao de la poblacin.

    n = tamao de la muestra

    2 = Varianza poblacional

    S2 = varianza muestral

    Nota.- No olvidar que la Desviacin estndar es la raz cuadrada de la varianza

    Observacin: la frmula de la varianza en forma abreviada quedara del siguiente modo:

    Datos no agrupados Datos agrupados

    2 =

    2 2

    1

    2 =

    2 2

    1

    COEFICIENTE DE VARIACION.

    USO DE LAS MEDIDAS DE DISPERSION.

  • UNIVERSIDAD DE HUNUCO ESTADISTICA I EST. Y . PROB. - ESTADISTICA LENIN JUSTINIANO PIO.

    FACULTAD DE INGENIERA ESCUELA PROFESIONAL DE ING. CIVIL / AMBIENTAL / SISTEMAS / ARQUITECTURA

    6

    PROPIEDADES DE LA VARIANZA.

  • UNIVERSIDAD DE HUNUCO ESTADISTICA I EST. Y . PROB. - ESTADISTICA LENIN JUSTINIANO PIO.

    FACULTAD DE INGENIERA ESCUELA PROFESIONAL DE ING. CIVIL / AMBIENTAL / SISTEMAS / ARQUITECTURA

    7

    INDICES DE ASIMETRIA.

  • UNIVERSIDAD DE HUNUCO ESTADISTICA I EST. Y . PROB. - ESTADISTICA LENIN JUSTINIANO PIO.

    FACULTAD DE INGENIERA ESCUELA PROFESIONAL DE ING. CIVIL / AMBIENTAL / SISTEMAS / ARQUITECTURA

    8

    COEFICIENTE DE ASIMETRA DE FISHER:

    g

    x x n

    ns

    m

    s

    i

    i

    i

    1

    3

    3

    3

    3

    S la distribucin es simtrica en el denominador tendremos el mismo nmero de desviaciones positivas como negativas y por tanto g1 = 0.

    Si g1>0 la distribucin es asimtrica positiva o asimtrica a derechas. Si g1 0 la distribucin ser asimtrica positiva.

  • UNIVERSIDAD DE HUNUCO ESTADISTICA I EST. Y . PROB. - ESTADISTICA LENIN JUSTINIANO PIO.

    FACULTAD DE INGENIERA ESCUELA PROFESIONAL DE ING. CIVIL / AMBIENTAL / SISTEMAS / ARQUITECTURA

    9

  • UNIVERSIDAD DE HUNUCO ESTADISTICA I EST. Y . PROB. - ESTADISTICA LENIN JUSTINIANO PIO.

    FACULTAD DE INGENIERA ESCUELA PROFESIONAL DE ING. CIVIL / AMBIENTAL / SISTEMAS / ARQUITECTURA

    10

    CURTOSIS.

    Adems la curtosis Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Solo tienen sentido en distribuciones campaniformes, es decir, unimodales simtricas o ligeramente asimtricas. Si para valores prximos a la moda las frecuencias son ms altas que en la distribucin normal,

    la grfica ser muy apuntada en esa zona, y se dice que es de tipo leptocrtico. Cuando son ms

    bajas que en la distribucin normal se dice que es de tipo platicrtico. Cuando la distribucin de

    frecuencias es igual de apuntada que la normal se dice que es mesocrtica

    COEFICIENTE DE APUNTAMIENTO DE FISHER. Se define como:

    g

    x x n

    ns

    m

    s

    i

    i

    i

    2

    4

    4

    4

    43 3

    si g2>0 leptocrtica.

    si g2

  • UNIVERSIDAD DE HUNUCO ESTADISTICA I EST. Y . PROB. - ESTADISTICA LENIN JUSTINIANO PIO.

    FACULTAD DE INGENIERA ESCUELA PROFESIONAL DE ING. CIVIL / AMBIENTAL / SISTEMAS / ARQUITECTURA

    11

    CURTOSIS BASADAS EN CUARTILES Y PERCENTILES.

    =

    ( )

    Nota: Si K < 0,263 la distribucin es platicrtica Si K = 0,263 la distribucin es normal o mesocrtica Si K > 0,263 la distribucin es leptocrtica

    DIAGRAMA DE CAJAS.

    NOTA:

    QUE SON LOS MOMENTOS?

    Definicin: Los momentos son valores que caracterizan a una distribucin, de tal modo que dos

    distribuciones son iguales, si tienen todos sus momentos iguales, y son tanto ms parecidas

    cuanto mayor sea el nmero de momentos iguales que tengan.

    Es un artificio que nos permite unificar el tratamiento matemtico de los principales coeficientes de

    la estadstica descriptiva.

  • UNIVERSIDAD DE HUNUCO ESTADISTICA I EST. Y . PROB. - ESTADISTICA LENIN JUSTINIANO PIO.

    FACULTAD DE INGENIERA ESCUELA PROFESIONAL DE ING. CIVIL / AMBIENTAL / SISTEMAS / ARQUITECTURA

    12

    TIPOS DE MOMENTOS:

    a. Momento de Orden r con respecto a un punto a de la muestra (Mr,a):

    (|)= ( )

    ; datos no clasificados

    (|)= ( )

    ; datos clasificados

    r = numero de momentos.

    a = punto cualquiera.

    b. Momentos con respecto al origen (Mr,0; M`r):

    Cuando a = 0; Se observa que el momento de orden uno centrado en el origen coincide

    con la media aritmtica (x) de la distribucin.

    M`r = 1/n nir , datos no clasificados.

    M`r = 1/n niyir , datos clasificados.

    c. Momentos respecto a la media aritmtica (Mr,x; Mr):

    Cuando a = X; Se observa que:

    - El momento de orden 1 es igual a cero;

    - El momento de orden 2 centrado en la media aritmtica coincide con la varianza de la

    distribucin.

    - El momento de orden 3 coincide con el clculo de la asimetra o sesgo.

    - El momento de orden 4 coincide para el clculo de la curtosis o apuntamiento.

    =1

    ( )

    ; Datos no clasificados.

    =1

    ( )

    ; Datos clasificados.

    = marca de clase

    INTERPRETACIN:

    Los momentos de indican la semejanza y el sentido de dos variables; dos distribuciones son

    iguales, si tienen todos sus momentos iguales, y son tanto ms parecidas cuanto mayor sea el

    nmero de momentos iguales que tengan.

    APLICACIN:

  • UNIVERSIDAD DE HUNUCO ESTADISTICA I EST. Y . PROB. - ESTADISTICA LENIN JUSTINIANO PIO.

    FACULTAD DE INGENIERA ESCUELA PROFESIONAL DE ING. CIVIL / AMBIENTAL / SISTEMAS / ARQUITECTURA

    13

    - Una de las principales aplicaciones de los momentos es su utilizacin para la

    identificacin de distribuciones a partir de muestras de datos dentro de la estadstica

    descriptiva.

    - En finanzas, resulta til medir la forma de las distribuciones, porque es una solucin

    simple y eficaz para muchos problemas.