tema1 (2ª parte)

38
TEMA 1 El análisis estadístico de datos (caso multidimensional) Probabilidades y Estadística I

Upload: jacinto-gonzalez-pachon

Post on 05-Aug-2015

260 views

Category:

Education


0 download

TRANSCRIPT

TEMA 1

El análisis estadístico de datos(caso multidimensional)

Probabilidades y Estadística I

Esquema inicial

111 IntroducciónIntroducciónIntroducción1.1.1. Introducción.Introducción.Introducción.

2. Variables y datos. Tipos de datos.2. Variables y datos. Tipos de datos.2. Variables y datos. Tipos de datos.y py py p

3. Descripción de datos mediante tablas (caso multidimensional)

4. Descripción de datos mediante gráficos.4. Descripción de datos mediante gráficos.4. Descripción de datos mediante gráficos.

5. Introducción al análisis exploratorio de datos.5. Introducción al análisis exploratorio de datos.5. Introducción al análisis exploratorio de datos.

Probabilidades y Estadística I

Probabilidades y Estadística I

3. Descripción de datos mediante tablas (1/17)

DATOS BIDIMENSIONALESDATOS BIDIMENSIONALES

Una muestra o población P. Una variable estadística bidimensional(X,Y)

Una serie de datos bidimensionales (x y ) (x y ) (x y )Una serie de datos bidimensionales (x1, y1), (x2, y2), …, (xn,, yn)

x’1, x’2, ...., x’k k valores distintos de X 1, 2, , k

y’1, y’2, ...., y’p p valores distintos de Y

REPETICIONESProbabilidades y Estadística I

REPETICIONES

3. Descripción de datos mediante tablas (2/17)

DATOS BIDIMENSIONALES: TIPO DE DISTRIBUCIONESDATOS BIDIMENSIONALES: TIPO DE DISTRIBUCIONES

1. CONJUNTASegún donde se observen

2. MARGINALES

3 CONDICIONADAS

Segú do de se obse velas repeticiones

3. CONDICIONADAS

Probabilidades y Estadística I

TAMAÑO

COLOR

PEQUEÑA

TAMAÑO

3 2 3PEQUEÑA

MEDIANA

3

3 4

2 3

2MEDIANA 3 4 2

GRANDE 2 1 0

Probabilidades y Estadística I

TAMAÑO

COLOR

PEQUEÑA

TAMAÑO

0 15 0 10 0 15PEQUEÑA

MEDIANA

0.15

0 15 0 20

0.10 0.15

0 10MEDIANA 0.15 0.20 0.10

GRANDE 0.10 0.05 0

Probabilidades y Estadística I

3. Descripción de datos mediante tablas (3/17)

EJEMPLOEJEMPLO

X “calificación de la asignatura PyE en esa convocatoria”Y “nº de convocatorias para aprobar el Cálculo”

(5 12 2) (7 1) (8 62 2) (6 3) (2 88 2) (7 33 2) (6 3)

Y n de convocatorias para aprobar el Cálculo

(5.12, 2), (7, 1), (8.62, 2), (6, 3), (2.88, 2),(7.33, 2), (6, 3), (2.75, 4) (5.25, 2), (5, 1),(6.88, 5) (5.83, 1), (5, 4), (3.38, 4), (6.25, 3), (6.12, 1), (6, 2), (4.62, 3), (6.62, 2), (8.5, 1)( ) ( ) ( ) ( ) ( ) ( )

• Modalidades X: [2 3) [3 4) [4 5) [5 6) [6 7) [7 8) [8 9)• Modalidades X: [2,3), [3,4), [4,5), [5,6), [6,7), [7,8), [8,9)

• Modalidades de Y: 1, 2, 3, 4, 5, 6Probabilidades y Estadística I

, , , , ,

3. Descripción de datos mediante tablas (4/17)

Tabla de contingencia de f i b l t1 Distribución conjunta frecuencias absolutas

X Y y’1 y’2 .. y’j .. y’p

1. Distribución conjunta

X Y y1 y2 yj yp

x’1 n11 n12 .. n1j .. n1p

’ n n n nx’2 n21 n22 .. n2j .. n2p... ... ... .. ... .. ...

x’i ni1 ni2 .. nij .. nipi j p

... ... ... ... ... ... ...

x’k nk1 nk2 ... nkj ... nkp

nij frecuencia absoluta para el par (x’i, y’j)

Probabilidades y Estadística I

3. Descripción de datos mediante tablas (5/17)

EJEMPLOEJEMPLO

Y1 2 3 4 5

X1 2 3 4 5

[2,3) 0 1 0 1 0[3 4) 0 0 0 1 0[3,4) 0 0 0 1 0

[4,5) 0 0 1 0 0[5,6) 2 2 0 1 0[5,6)[6,7) 1 2 2 0 1[7,8) 1 1 1 0 0

1 1 0 0 0[8,9) 1 1 0 0 0

Probabilidades y Estadística I

3. Descripción de datos mediante tablas (6/17)

1 Distribución conjuntaTabla de contingencia de f i l ti

X Y y’1 y’2 .. y’j .. y’p

1. Distribución conjunta frecuencias relativas

X Y y1 y2 yj yp

x’1 f 11 f 12 .. f 1j .. f 1p

’ f f f fx’2 f 21 f 22 .. f 2j .. f 2p... ... ... .. ... .. ...

x’i f i1 f i2 .. f ij .. f ipi j p

... ... ... ... ... ... ...

x’k f k1 f k2 ... f kj ... f kp

fij frecuencia relativa para el par (x’i, y’j) = nn ij

Probabilidades y Estadística I

n

3. Descripción de datos mediante tablas (7/17)

EJEMPLOEJEMPLO

Y1 2 3 4 5

X1 2 3 4 5

[2,3) 0 0.05 0 0.05 0[3 4) 0 0 0 0 05 0[3,4) 0 0 0 0.05 0

[4,5) 0 0 0.05 0 0[5,6) 0.10 0.10 0 0.05 0[5,6) 0. 0[6,7) 0.05 0.10 0.10 0 0.05[7,8) 0.05 0.05 0.05 0 0

0 0 0 05 0 0 0[8,9) 0.05 0.05 0 0 0

Probabilidades y Estadística I

COLOR

TAMAÑO

PEQUEÑA 3 2 3 8

MEDIANA 3 4 2 9

GRANDE 2 1 0 3

8 7 5 20

Probabilidades y Estadística I

COLOR

TAMAÑO

PEQUEÑA 0.15 0.10 0.15 0.40

MEDIANA 0.15 0.20 0.10 0.45

GRANDE 0.10 0.05 0.00 0.15

0.40 0.35 0.25 1

Probabilidades y Estadística I

3. Descripción de datos mediante tablas (8/17)

2 Distribuciones marginales Con frecuencias absolutas2. Distribuciones marginales Con frecuencias absolutas

X Y y’1 y’2 .. y’j .. y’p

x’ n11 n12 .. n1j .. n1x’1 n11 n12 .. n1j .. n1p

x’2 n21 n22 .. n2j .. n2p... ... ... .. ... .. ...

p

x’i ni1 ni2 .. nij .. nip

... ... ... ... ... ... ...

’ n n n n

p

jij i n n

x’k nk1 nk2 ... nkj ... nkp

k

iijj n n

Probabilidades y Estadística I

i

3. Descripción de datos mediante tablas (9/17)

EJEMPLOEJEMPLO

Y1 2 3 4 5

X1 2 3 4 5

[2,3) 0 1 0 1 0[3 4) 0 0 0 1 0

21[3,4) 0 0 0 1 0

[4,5) 0 0 1 0 0[5,6) 2 2 0 1 0

1

15[5,6)

[6,7) 1 2 2 0 1[7,8) 1 1 1 0 0

1 1 0 0 0

5632[8,9) 1 1 0 0 0 2

5 7 4 3 1

Probabilidades y Estadística I

3. Descripción de datos mediante tablas (10/17)

2 Distribuciones marginales Con frecuencias relativas2. Distribuciones marginales Con frecuencias relativas

X Y y’1 y’2 .. y’j .. y’p

x’ f 11 f 12 .. f 1j .. f 1x’1 f 11 f 12 .. f 1j .. f 1p

x’2 f 21 f 22 .. f 2j .. f 2p... ... ... .. ... .. ...

p

x’i f i1 f i2 .. f ij .. f ip

... ... ... ... ... ... ...

’ f f f f

·1

p

i ijj

f f

x’k f k1 f k2 ... f kj ... f kp

·1

k

ijji

f f

Probabilidades y Estadística I

3. Descripción de datos mediante tablas (11/17)

EJEMPLOEJEMPLO

Y1 2 3 4 5

X1 2 3 4 5

[2,3) 0 0.05 0 0.05 0[3 4) 0 0 0 0 05 0

0.100 05[3,4) 0 0 0 0.05 0

[4,5) 0 0 0.05 0 0[5,6) 0.10 0.10 0 0.05 0

0.05

0.050 25[5,6) 0. 0

[6,7) 0.05 0.10 0.10 0 0.05[7,8) 0.05 0.05 0.05 0 0

0 0 0 05 0 0 0

0.250.300.150 10[8,9) 0.05 0.05 0 0 0 0.10

0.25 0.35 0.20 0.15 0.05

Probabilidades y Estadística I

Probabilidades y Estadística I

COLOR

TAMAÑO

PEQUEÑA 2

MEDIANA 4

GRANDE 1

7

Probabilidades y Estadística I

COLOR

TAMAÑO

PEQUEÑA 0.10

MEDIANA 0.20

GRANDE 0.05

0.35

Probabilidades y Estadística I

COLOR

TAMAÑO

PEQUEÑA 2/7

MEDIANA 4/7

GRANDE 1/7

1

Probabilidades y Estadística I

COLOR

TAMAÑO

PEQUEÑA 0.10/0.35 = 0.28

MEDIANA 0.20/0.35= 0.56

GRANDE 0.05/0.35= 0.14

0.35/0.35 = 1

Probabilidades y Estadística I

COLOR

TAMAÑO

PEQUEÑA 0.10/0.35 = 0.28

MEDIANA 0.20/0.35= 0.56

GRANDE 0.05/0.35= 0.14

0.35/0.35 = 1

Probabilidades y Estadística I

3. Descripción de datos mediante tablas (12/17)

3 Distribuciones condicionadas Con frecuencias absolutas3. Distribuciones condicionadas

X Y y’1 y’2 .. y’j .. y’p

Con frecuencias absolutas

X Y y1 y2 yj yp

x’1 n11 n12 .. n1j .. n1p

x’2 n21 n22 .. n2j .. n2p... ... ... .. ... .. ...

x’i ni1 ni2 .. nij .. nipi j p

... ... ... ... ... ... ...

x’k nk1 nk2 ... nkj ... nkp

jn ·

Probabilidades y Estadística ISUBPOBLACIÓN

3. Descripción de datos mediante tablas (13/17)

3 Distribuciones condicionadas Con frecuencias relativas3. Distribuciones condicionadas

X| Y ’Frecuencias Frecuencias

Con frecuencias relativas

X| Y=y’j

x’1 n1j n ·jn1j

absolutas relativas

f j

n2j...nij

x’2...

x’i...

n2j n ·j

nij j fijij

...nkj

i

...x’k

...ij n ·j

nkj n ·j

jn ·

Probabilidades y Estadística ISUBPOBLACIÓN

3. Descripción de datos mediante tablas (14/17)

EJEMPLO Con frecuencias absolutasEJEMPLO

Y1 2 3 4 5

Con frecuencias absolutas

X1 2 3 4 5

[2,3) 0 1 0 1 00 0 1 0[3,4) 0 0 0 1 0

[4,5) 0 0 1 0 0[5,6) 2 2 0 1 0[5,6) 2 2 0 1 0[6,7) 1 2 2 0 1[7,8) 1 1 1 0 0[8,9) 1 1 0 0 0

5

Probabilidades y Estadística I

3. Descripción de datos mediante tablas (15/17)

EJEMPLO Con frecuencias relativasEJEMPLO Con frecuencias relativas

X | Y=1 Abs RelX | Y=1 Abs

[2,3) 0 0.00 0 0

RelSERIE NUMÉRICA

[3,4) 0 0.0

[4,5) 0 0.0[5,6) 2 0.4

Y=1

(5 1) (5 83 1) (6 12 1)[5,6) 2 0.4[6,7) 1 0.2[7,8) 1 0.2

0 2

(5, 1), (5.83, 1), (6.12, 1), (7, 1), (8.5, 1)

[8,9) 1

5

0.2

Probabilidades y Estadística I

3. Descripción de datos mediante tablas (16/17)

RELACIONES ENTRE DISTRIBUCIONESRELACIONES ENTRE DISTRIBUCIONES

INDEPENDENCIA

X| Y=y’j X j Y| X=x’i Y i

ij i jf f f i j Probabilidades y Estadística I

3. Descripción de datos mediante tablas (17/17)

EJEMPLOEJEMPLO

Y1 2 3 4 5

X1 2 3 4 5

[2,3) 0 0.05 0 0.05 0[3 4) 0 0 0 0 05 0

0.100 05[3,4) 0 0 0 0.05 0

[4,5) 0 0 0.05 0 0[5,6) 0.10 0.10 0 0.05 0

0.05

0.050 25[5,6) 0. 0

[6,7) 0.05 0.10 0.10 0 0.05[7,8) 0.05 0.05 0.05 0 0

0 0 0 05 0 0 0

0.250.300.150 10[8,9) 0.05 0.05 0 0 0 0.10

0.25 0.35 0.20 0.15 0.05

Probabilidades y Estadística I

COLOR

TAMAÑO

PEQUEÑA 0.15 0.10 0.15 0.40

MEDIANA 0.15 0.20 0.10 0.45

GRANDE 0.10 0.05 0.00 0.15

0.40 0.35 0.25 1

Probabilidades y Estadística I

Esquema inicial

111 IntroducciónIntroducciónIntroducción1.1.1. Introducción.Introducción.Introducción.

2. Variables y datos. Tipos de datos.2. Variables y datos. Tipos de datos.2. Variables y datos. Tipos de datos.y py py p

3. Descripción de datos mediante tablas.3. Descripción de datos mediante tablas.3. Descripción de datos mediante tablas.

4. Descripción de datos mediante gráficos (caso multidimensional)multidimensional)

5. Introducción al análisis exploratorio de datos.5. Introducción al análisis exploratorio de datos.5. Introducción al análisis exploratorio de datos.ppp

Probabilidades y Estadística I

4. Descripción de datos mediante gráficos (1/2)

Medidas intervalar/razón VARIABLE ESTADÍSTICA

BIDIMENSIONAL1’. Histograma tridimensional

BIDIMENSIONAL

Probabilidades y Estadística I

4. Descripción de datos mediante gráficos (2/2)

Medidas intervalar/razón VARIABLE ESTADÍSTICA

BIDIMENSIONAL1’. Histograma tridimensional

BIDIMENSIONAL

Probabilidades y Estadística I

Esquema inicial

111 IntroducciónIntroducciónIntroducción1.1.1. Introducción.Introducción.Introducción.

2. Variables y datos. Tipos de datos.2. Variables y datos. Tipos de datos.2. Variables y datos. Tipos de datos.y py py p

3. Descripción de datos mediante tablas.3. Descripción de datos mediante tablas.3. Descripción de datos mediante tablas.

4. Descripción de datos mediante gráficos.4. Descripción de datos mediante gráficos.4. Descripción de datos mediante gráficos.

5. Introducción al análisis exploratorio de datos.

Probabilidades y Estadística I

5. Introducción al AED (1/2)

Diagrama de dispersión Diagrama de tallo-hoja

10 0|1222333344(9) 0|5555567795 1|5 1|5 1|5

Probabilidades y Estadística I

5. Introducción al AED (2/2)

Diagrama de dispersión

YY YY YY YY

XX XX XX XX

YYYY YY

XX XX

Probabilidades y Estadística I

Pregunta de test

Probabilidades y Estadística I