medidas de distribucion - … · de cómo están distribuidos los datos respecto al eje de...

44
MEDIDAS DE DISTRIBUCION ASIMETRIA Y CURTOSIS Dr. EDGAR APAZA ZUÑIGA UNIVERSIDAD NACIONAL DEL ALTIPLANO

Upload: trinhkhue

Post on 03-Oct-2018

221 views

Category:

Documents


0 download

TRANSCRIPT

MEDIDAS DE DISTRIBUCION

ASIMETRIA Y CURTOSIS

Dr. EDGAR APAZA ZUÑIGA UNIVERSIDAD NACIONAL DEL ALTIPLANO

MEDIDAS DE DISTRIBUCIÓN

Las Medidas de Distribución permiten identificar y caracterizar la forma en que se separan o aglomeran los valores de acuerdo a su representación gráfica. Estas medidas describen la manera de cómo los datos tienden a agruparse en relación con la frecuencia con la que se hallen dentro de la información. La utilidad fundamental de las Medidas de distribución radica en la posibilidad de identificar las características y discriminar la distribución sin necesidad de generar el gráfico.

I. ASIMETRIA

Es una expresión de la forma de la distribución, para saber si los valores de la variable se concentran en una determinada zona del recorrido de la variable. Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmética). Más precisamente, permiten establecer el grado de Simetría que presenta una distribución de probabilidad de una variable aleatoria.

ASIMETRÍA Presenta tres formas diferentes. Cada

una de ellas define y precisa la manera

de cómo están distribuidos los datos

respecto al eje de simetría

1. Asimetría positiva. Cuando la cola más dispersa se extiende en el lado de los valores altos de la variable con escaza frecuencia. 2. Simétrica. Si la dispersión es igual o muy similar a ambos lados, a una distribución de frecuencias simétrica. 3. Asimetría negativa. La cola más dispersa se extiende al lado de los valores más bajos.

COEFICIENTES DE ASIMETRÍA:

1. COEFICIENTES DE ASIMETRÍA DE K. PEARSON:

1.1. PRIMER COEFICIENTE DE ASIMETRÍA DE PEARSON 1.2. SEGUNDO COEFIENTE DE ASIMETRÍA DE PEARSON 1.3. TERCER COEFIENTE DE ASIMETRÍA DE PEARSON 2. COEFICIENTE DE ASIMETRÍA DE YOULE BOWLEY 3. COEFICIENTES DE ASIMETRÍA DE R. FISHER 3.1. PARA UNA SERIE SIMPLE DE DATOS 3.2. PARA DATOS DE UNA VARIABLE CUANTITATIVA

DISCRETA AGRUPADOS POR SUS FRECUENCIAS ABSOLUTAS 3.3. PARA DATOS DE VARIABLES CUANTITATIVAS

CONTINUAS AGRUPADOS EN TABLAS DE DISTRIBUCIONES DE FRECUENCIAS

1. COEFICIENTE DE ASIMETRIA DE KARL PEARSON.

s

XXA

m

S

)(3

SA Oscila entre -3 a 3

X

mX

s

DONDE:

Media aritmética Mediana

Desviación estándar de la muestra

SA = 0, La distribución es simétrica

SA > 0, La distribución es simétrica positiva

SA < 0, La distribución es simétrica negativa

2. COEFICIENTE DE ASIMETRIA DE YOULE BOWLEY.

13

2312

QQ

QQQA

S

DONDE:

1Q Cuartil uno

2Q Cuartil dos

3Q Cuartil tres

SA Oscila entre -1 a 1

Si : SA = 0, La distribución es simétrica

Si : SA > 0, La distribución es asimétrica positiva

Si : SA < 0, La distribución es asimétrica negativa

3. COEFICIENTES DE ASIMETRIA DE RONALD FISHER.

3.1. PARA DATOS DE UNA SERIE SIMPLE DE

DATOS (DATOS NO AGRUPADOS POR CLASES)

3

1

3

1

*)(

*1

S

nXX

ng

n

i

ii

LOS COEFICIENTES DE ASIMETRIA MÁS PRECISOS SON LOS DE FISHER

iX = Valores de la de la variable

X = Media aritmética de los valores de la muestra

in = Frecuencia absoluta de los valores de la variable n = Número total de datos S = Desviación estándar de la muestra

3.2. PARA DATOS DE UNA VARIABLE

CUANTITATIVA DISCRETA AGRUPADOS POR SUS

FRECUENCIAS ABSOLUTAS

3. COEFICIENTES DE ASIMETRIA DE RONALD FISHER

2

3

1

2

1

3

1

*)(1

*)(1

n

i

ii

n

i

ii

nXXn

nXXn

g)3)(1)(2(

)1(6

1nnn

nne

g

iX = Valores de la variable

X = Media aritmética de los valores de la muestra

in = Frecuencia absoluta de los valores de la variable n = Número total de datos

g1= 0 distribución simétrica g1> 0 Distribución asimétrica positiva g1< 0 Distribución asimétrica negativa

3. COEFICIENTES DE ASIMETRIA DE RONALD FISHER.

3.3. PARA DATOS DE VARIABLES CUANTITATIVAS

CONTINUAS AGRUPADOS EN TABLAS DE

DISTRIBUCIONES DE FRECUENCIAS

3

1

3

1

*)(

*1

S

nXXi

ng

n

i

i

iX = Valores de la marca de clase

X = Media aritmética de los valores de la muestra

in = Frecuencia absoluta de los valores de la variable n = Número total de datos

)3)(1)(2(

)1(6

1nnn

nne

g

3. COEFICIENTES DE ASIMETRIA DE RONALD FISHER.

3.2. PARA DATOS DE VARIABLES CUANTITATIVAS

CONTINUAS AGRUPADOS POR SUS FRECUENCIAS

ABSOLUTAS.

EJEMPLO. 20 21 23 19 19 18 22 20

23 19 22 18 21 23 19 20

20 19 21 21 23 20 19 22

20 20 23 20 18 20 22 23

19 18 18 19 19 21 22 21

21 18 19 19 23 22 18 21

21 21 22 23 20 22 23 22

21 18 22 20 18 22 18 19

23 21 18 19 19 18 18 21

18 22 22 22 22 21 21 23

19 21 21 23 23 19 21

22 18 18 22 19 19 18

18 21 23 21 22 21 19

21 23 22 20 23 18 20

18 19 23 18 23 19 21

19 21 19 22 22 18 23

19 18 23 23 21 22 22

21 23 18 19 19 23 20

18 18 23 18 22 19 20

19 18 21 18 20 19 23

LONGITUD DEL DIAMETRO DE FIBRA EN ALPACAS TUIS DE LA RAZA HUCAYO (n = 150)

Error estándar del Coeficiente de Asimetría de Ronal Fisher

PROCEDIMIENTO DE DETERMINACIÓN

MEDIANTE EL EXCEL

CONCLUSION: COMO EL VALOR DEL COEFICIENTE DE

ASIMETRÍA DE FISHER ES MENOR QUE CERO

(0.042), LA DISTRIBUCIÓN DE DIÁMETROS DE

FIBRA EN ALPACAS ES ASIMETRICA NEGATIVA,

ES DECIR QUE EXISTE MAYORES

CONCENTRACIONES DE FRECUENCIAS DE

DIAMETROS DE FIBRA EN LAS UBICACIONES

DE VALORES ALTOS.

II. CURTOSIS

A inicios del siglo XX, Karl Pearson, utilizó por primera vez la palabra Curtosis en el contexto estadístico para referirse a la forma de una distribución de frecuencias. En efecto, la Curtosis es un parámetro que determina el grado centralización que presentan los valores, en la región central de la distribución. K. Pearson, introdujo los términos: Platicúrtica, Mesocúrtica y Leptocúrtica para referirse a curvas de distribuciones de frecuencias menos, igual o más achatadas que la curva Normal. En consecuencia, la Curtosis hace referencia al apuntamiento de la distribución en relación a un estándar que es la distribución normal.

CURTOSIS

La Curtosis es una medida de forma, más precisamente de apuntamiento de las distribuciones, determina la mayor o menor concentración de las frecuencias alrededor de la Media y en la zona central de la distribución. Hace referencia al apuntamiento de la distribución en relación a un Estándar, que es la Distribución Normal, la que en este caso representa una distribución Mesocúrtica. Si la distribución es más apuntada que la Normal la distribución es Leptocúrtica; y si es más achatada esta es Platicúrtica. La Curtosis es independiente de la Variabilidad. No es cierto que una distribución Leptocúrtica tenga menos variación y que por eso es más apuntada, contrariamente, la distribución platicúrtica no por el hecho de ser más achatada, esta debe ser más variable.

1. Leptocúrtica. La distribución es más apuntada que la distribución normal

2. Mesocúrtica. La distribución es normal

3. Platicúrtica. La distribución es más achatada que la distribución normal

1 2 3

CURTOSIS

COEFICIENTE DE CURTOSIS.

EXISTEN VARIAS FORMAS DE DETERMINAR ESTE COEFIENTE:

1. COEFICIENTE DE CURTOSIS PERCENTÍLICO. Este coeficiente relaciona la desviación cuartil con el espacio inter percentílico obteniéndose el siguiente coeficiente.

k = 0.263 LA DISTRIBUCIÓN ES MESOCURTICA k > 0.263 LA DISTRIBUCIÓN ES LEPTOCURTICA k > 0.263 LA DISTRIBUCIÓN ES PLATICURTICA

PESO AL DESTETE EN TERNEROS DE LA RAZA BROWN SWISS

PESO AL DESTETE EN TERNEROS DE LA RAZA BROWN SWISS

212339.04.62

25.13

)30.12550.156(2

)00.13425.147(

)(2

)(

1090

13

PP

QQK

Como k = 0.2123 es menor que 0.263, la distribución es PLATICURTICA

2. COEFICIENTE DE CURTOSIS OBTENIDO POR LA HOJA ELECTRONICA EXCEL.

EL EXCEL USA LA SIGUIENTE ECUACIÓN PARA CALCULAR LA CURTOSIS:

PESO AL DESTETE EN TERNEROS DE LA RAZA BROWN SWISS

)3)(1(

)1(3

)3)(2)(1(

)1(2

1

4

nn

n

S

XX

nnn

nnk

n

i

i

PESO

Media 140.82

Error típico 1.455935074

Mediana 140

Moda 138

Desviación estándar 10.29501564

Varianza de la muestra 105.9873469

Curtosis -0.446368167

Coeficiente de asimetría 0.003150698

Rango 41

Mínimo 120

Máximo 161

Suma 7041

Cuenta 50

3. COEFICIENTE DE CURTOSIS DE PEARSON.

Pearson introdujo los términos Platicúrtica, Mesocúrtica y Platicúrtica para referirse a curvas menos, igual y más achatadas que la Curva Normal. Pearson, demostró para una distribución Normal que:

Define a = Como el “Grado de Curtosis” una medida de alejamiento con respecto a la distribución Normal. El cual es definido por:

32

3

)(1

)(1

2

1

2

1

4

2n

i

i

n

i

i

Xn

Xn

b)5)(3)(2)(3(

)1(242

2nnnn

nnEE

g

3

*)(1

*)(1

2

1

2

1

4

2

i

n

i

i

i

n

i

i

nXn

nXn

b

)5)(3)(2)(3(

)1(242

2nnnn

nnEE

g

FIN