tema2 ud1b

23
Probabilidades y Estadística I TEMA 2 Medidas características de una distribución de frecuencias

Upload: jacinto-gonzalez-pachon

Post on 14-Aug-2015

798 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Tema2 ud1b

Probabilidades y Estadística I

TEMA 2

Medidas características de una distribución de frecuencias

Page 2: Tema2 ud1b

Probabilidades y Estadística I

Esquema inicial

1. Introducción

2. Medidas de Centralización

3. Medidas de Dispersión

4. Medidas de Forma

5. Medidas de Relación

6. Representaciones gráficas. Diagrama de caja

7. Transformaciones de datos

Page 3: Tema2 ud1b

Probabilidades y Estadística I

Esquema inicial

1. Introducción

2. Medidas de Centralización

3. Medidas de Dispersión

4. Medidas de Forma

5. Medidas de Relación

6. Representaciones gráficas. Diagrama de caja

7. Transformaciones de datos

Page 4: Tema2 ud1b

Probabilidades y Estadística I

3. Medidas de dispersión (5/11)

Cuartiles (idea intuitiva)

25% 25% 25% 25%

Son los valores que dividen la muestra en 4 grupos, cada uno con el 25% de los datos (aproximadamente)

25% 25% 25% 25%

Q1 Q2 Q3min max Q1 Q2 Q3min max

Rango intercuartílico

Page 5: Tema2 ud1b

Probabilidades y Estadística I

3. Medidas de dispersión (6/11)

(definición formal)

Sea x1, x2, ...., xn una serie de datos y sea x(1) ≤ x(2) ....≤ x(k) la serie ordenadade menor a mayor.

Sea X una variable estadística y F(x) su función acumulativa de frecuencias relativas. Se define Qi como la solución de la siguiente ecuación funcional

F(x) = i/4

Datos explícitos

Datos implícitos

( )

( ) ( )

jn4ij si

xx

n4ij six

Qjj

j

i

+<+<+

+==

+ 1)1(2

)1(

1

Cuartiles

Page 6: Tema2 ud1b

Probabilidades y Estadística I

3. Medidas de dispersión (7/11)

(definición intuitiva)Percentiles

Son los valores que dividen la muestra en 100 grupos, cada uno con el 1% de los datos (aproximadamente)

P25 P50 P75min maxQ1 Q2 Q3

Page 7: Tema2 ud1b

Probabilidades y Estadística I

3. Medidas de dispersión (8/11)

(definición formal)

Sea x1, x2, ...., xn una serie de datos y sea x(1) ≤ x(2) ....≤ x(k) la serie ordenadade menor a mayor.

Sea X una variable estadística y F(x) su función acumulativa de frecuencias relativas. Se define Qi como la solución de la siguiente ecuación funcional

F(x) = i/100

Datos explícitos

Datos implícitos

( )

( ) ( )1

i si j ( 1) x x i si j ( 1) 1

2

100

100

j

ij j

x nP

n j+

= += + < + < +

Percentiles

Page 8: Tema2 ud1b

Probabilidades y Estadística I

3. Medidas de dispersión (9/11)

Varianza (definición formal)

Sea x1, x2, ...., xn una serie de datos

2 2 22 1 2( ) ( ) .... ( )nx x x x x x

nσ − + − + + −

=

Datos explícitos

Sea X una variable estadística y {x’1,x’2,...,x’k} el conjunto finito de modalidades. Sea {f1,f2,.…,fk} su distribución de frecuencias relativas.

( )∑=

−=k

iii xxfVar

1

2'X

Datos implícitos

Page 9: Tema2 ud1b

Probabilidades y Estadística I

3. Medidas de dispersión (10/11)

Desviación típica (definición formal)

( )∑=

−+=k

iii xxf

1

2'σ

)2,2( σσ +− x x contiene el 75% de los datos

( 3 , 3 )x xσ σ− + contiene el 89% de los datos

Detectar datos

atípicos

Page 10: Tema2 ud1b

Probabilidades y Estadística I

3. Medidas de dispersión (11/11)

Varianza (propiedades)

Var (aX+b)= a2Var(X)

Es un operador cuadrático (Teorema de Pitágoras)

COMPARACIÓN DE DISPERSIONES (Coeficiente de variación)

xCV σ

=

Page 11: Tema2 ud1b

Probabilidades y Estadística I

Esquema inicial

1. Introducción

2. Medidas de Centralización

3. Medidas de Dispersión

4. Medidas de Forma

5. Medidas de Relación

6. Representaciones gráficas. Diagrama de caja

7. Transformaciones de datos

Page 12: Tema2 ud1b

Probabilidades y Estadística I

4. Medidas de forma (1/6)

Una forma de valorar cuantitativamente la forma del perfil de una distribución de frecuencias

¿qué valores de una distribución pueden considerarse atípicos?

Apuntamiento Curtosis

Simetría Coeficiente de Fisher

Criterio MedidaGráfico

Page 13: Tema2 ud1b

Probabilidades y Estadística I

4. Medidas de forma (2/6)

Momento centrado en el origen (definición formal)

Sea x1, x2, ...., xn una serie de datos, se denomina momento centrado en el origen de orden r, y se representa por ar, a la siguiente expresión algebraica:

n x.... x x

ar

n

r

2

r1

r+++

=

Momento centrado en la media (definición formal)

Sea x1, x2, ...., xn una serie de datos, se denomina momento centrado en el origen de orden r, y se representa por ar, a la siguiente expresión algebraica:

n x(x....x(x x(x

mr

nr

2r

1r

))) −++−+−=

Page 14: Tema2 ud1b

Probabilidades y Estadística I

4. Medidas de forma (3/6)

Momentos (propiedades)

m1= 0m2 = Var (X)

a1= x

Var (X) = m2 = a2 – a12

2n n2i i

i 1 i 1x x

Var(X)n n

= =

= −

∑ ∑

Page 15: Tema2 ud1b

Probabilidades y Estadística I

4. Medidas de forma (4/6)

Coef. de Fisher

n3

i3 i 1

1 3 3

(x x)m

n=

−γ = =

σ σ

1 0γ =1 0γ < 1 0γ >

(definición formal)

Page 16: Tema2 ud1b

Probabilidades y Estadística I

4. Medidas de forma (5/6)

Curtosis (definición formal)

n4

i4 i 1

2 4 4

(x x)m 3 3

n=

−γ = − = −

σ σ

2 0γ =2 0γ < 2 0γ >

Page 17: Tema2 ud1b

Probabilidades y Estadística I

4. Medidas de forma (6/6)

Datos atípicos

No atípico Atípico

Page 18: Tema2 ud1b

Probabilidades y Estadística I

Esquema inicial

1. Introducción

2. Medidas de Centralización

3. Medidas de Dispersión

4. Medidas de Forma

5. Medidas de Relación

6. Representaciones gráficas. Diagrama de caja

7. Transformaciones de datos

Page 19: Tema2 ud1b

Probabilidades y Estadística I

5. Medidas de relación (1/4)

Una forma de valorar cuantitativamente la relación lineal entre dos variables

Eliminar información redundante. Establecer causalidades

Page 20: Tema2 ud1b

Probabilidades y Estadística I

5. Medidas de relación (2/5)

Momento centrado en el origen (definición formal)

Sea (x1,y1), (x2,y2),...., (xn,yn) una serie de datos bidimensionales que definen la variable estadística bidimensional (X, Y).

r h r h r h1 1 2 2 n n

rhx y x y .... x y a

n+ + +

=

Momento centrado en la media (definición formal)

Sea (x1,y1), (x2,y2),...., (xn,yn) una serie de datos bidimensionales que definen la variable estadística bidimensional (X, Y).

r h r h r h1 1 2 2 n n

r ,h(x X ) (y Y ) (x X ) (y Y ) .... (x X ) (y Y ) m

n− − + − − + + − −

=

Page 21: Tema2 ud1b

Probabilidades y Estadística I

5. Medidas de relación (3/5)

Momentos bid. (interrelaciones)

COVARIANZA

Page 22: Tema2 ud1b

Probabilidades y Estadística I

5. Medidas de relación (4/5)

Covarianza

DEPENDE DE LA MAGNITUD

Cov (X, Y) = m11

Page 23: Tema2 ud1b

Probabilidades y Estadística I

5. Medidas de relación (5/5)

Coeficiente de correlación (covarianza normalizada)

x ,yx y

cov( X ,Y )ρσ σ

= x ,y1 1ρ− ≤ ≤

X

Y

X

Y

X

Y

X

Y

x ,y 1ρ = − x ,y1 0ρ− < <X

Y

X

Y

X

Y

X

Y

x ,y 0ρ =

X

Y

X

Y

X

Y

X

Y

x ,y0 1ρ< < x ,y 1ρ =