estadÍstica descriptiva bidimensional · 2020. 4. 13. · próximo a 1, nube de puntos deforma...

8
ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL EL conjunto (X,Y) de valores que pueden tomar dos caracteres diferentes X e Y medidos sobre cada uno de los individuos de una población o muestra, puede venir dado de la siguiente forma: X\Y 38 39 40 41 37 1 3 5 2 38 1 3 3 3 39 0 3 3 5 X= nº pie madre Y=nº pie hijas a los 14 años TABLAS DE DOBLE ENTRADA x f 37 11 38 10 39 11 32 y f 38 2 39 9 40 11 41 10 32 DISTRIBUCIONES MARGINALES ANÁLISIS DESCRIPTIVO DE LAS VARIABLES https://marielmatesblog.wordpress.com/ X(mates) 1 3 5 5 7 8 Y(Fca) 2 3 6 5 9 8 f 1 1 1 1 1 1 TABLAS DE FRECUENCIAS N=6 N=32

Upload: others

Post on 24-Sep-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL · 2020. 4. 13. · próximo a 1, nube de puntos deforma lineal, …), podremos usarlo para poder predecir resultados de la variable dependiente

ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL

EL conjunto (X,Y) de valores que pueden tomar dos caracteres diferentes X e Y medidos sobre cada uno de los individuos de una población o muestra, puede venir dado de la siguiente forma:

X\Y 38 39 40 4137 1 3 5 238 1 3 3 339 0 3 3 5

X= nº pie madreY=nº pie hijas a los 14 años

TABLAS DE DOBLE ENTRADA

x f37 1138 1039 11

32

y f38 239 940 1141 10

32

DISTRIBUCIONES MARGINALES

ANÁLISIS DESCRIPTIVO DE LAS VARIABLEShttps://marielmatesblog.wordpress.com/

X(mates) 1 3 5 5 7 8Y(Fca) 2 3 6 5 9 8f 1 1 1 1 1 1

TABLAS DE FRECUENCIAS

N=6

N=32

Page 2: ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL · 2020. 4. 13. · próximo a 1, nube de puntos deforma lineal, …), podremos usarlo para poder predecir resultados de la variable dependiente

REPRESENTACIO ́N GRA ́FICA: NUBE DE PUNTOS.

37,5

38

38,5

39

39,5

40

40,5

41

41,5

36,5 37 37,5 38 38,5 39 39,5

MER

O P

IE H

IJA

NÚMERO PIE MADRE

https://marielmatesblog.wordpress.com/

Page 3: ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL · 2020. 4. 13. · próximo a 1, nube de puntos deforma lineal, …), podremos usarlo para poder predecir resultados de la variable dependiente

No determinista: Conocido el valor de X, el valor de Y no queda perfectamente establecido. Son del tipo: y = f (x) + udonde u es una perturbación desconocida

Lineal: Cuando la función f (x ) es lineal, y la representación gráfica de los datos tiene un aspecto lineal, f(x)=mx+n• Si m > 0 hay relación lineal positiva. • Si m < 0 hay relación lineal negativa.

No lineal: Cuando la función f (x ) no es lineal.

Ausencia de relación: Cuando f (x) = c.

Determinista: Conocido el valorde X, el valor de Y quedaperfectamente establecido. Sondel tipo:

y = f (x)

TIPOS DE RELACIÓN ENTRE X E Yhttp

s://marielm

atesb

log.word

press.com

/

Page 4: ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL · 2020. 4. 13. · próximo a 1, nube de puntos deforma lineal, …), podremos usarlo para poder predecir resultados de la variable dependiente

LA COVARIANZA

CovX,Y=∑ (xi−"x)(yi−"y)

n

=∑ xi· yi

n − "x·"y

•Si hay relación lineal positiva, la covarianza será positiva y “grande”. • Si hay relación lineal negativa, la covarianza será negativa y “grande” en valor absoluto. • Si hay no hay relación entre las variables o la relación es marcadamente no lineal, la covarianza será próxima a cero. •La covarianza depende de las unidades de medida de las variables.

COEFICIENTE DE CORRELACIÓN LINEAL

Esta medida no depende de las unidades de medida

rxy=CovX,YSX·SY

EXISTEN DOS FORMAS DE CUANTIFICAR LA RELACIÓN LINEAL ENTRE LAS VARIABLES

-1≤ rxy ≤1 r (x,y) = r (y,x)

rxy ≈1

rxy ≈-1

rxy ≈0

https://marielmatesblog.wordpress.com/

Varianza de X:

sx2=∑(xi−"x)2

n =∑ xi

2

n −!x2,

Desviación típica: sx= sx2

Page 5: ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL · 2020. 4. 13. · próximo a 1, nube de puntos deforma lineal, …), podremos usarlo para poder predecir resultados de la variable dependiente

una correlación FUERTE no implica

causalidad.

Sólo porque los movimientos de dos variables sigan caminos similares durante un tiempo no implica que uno haga que ocurra el otro.

Page 6: ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL · 2020. 4. 13. · próximo a 1, nube de puntos deforma lineal, …), podremos usarlo para poder predecir resultados de la variable dependiente

• Estatura del padre sobre la estatura del hijo. • Precio de una vivienda en función de su superficie. • Predecir la tasa de paro para cada edad. • Aproximar la calificación obtenida en una materia según el número de horas de estudio semanal.

Un modelo de regresión es un modelo que permite describir cómo influye una variable X sobre otra variable Y . X: Variable independiente o explicativa o exógena Y: Variable dependiente o respuesta o endógena

https://marielmatesblog.wordpress.com/

El modelo de regresión linealsimple

y=m·x+n

m=CovX,Y

sx2, n="y−m· "x

m y n son los coeficientes de regresión: • n : intercepto • m : pendiente

REGRESIÓN

Page 7: ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL · 2020. 4. 13. · próximo a 1, nube de puntos deforma lineal, …), podremos usarlo para poder predecir resultados de la variable dependiente

SIEMPRE Y CUANDO EL MODELO SEA ADECUADO (coeficiente de correlación

próximo a 1, nube de puntos de forma lineal, …), podremos usarlo para poder

predecir resultados de la variable dependiente y, conocido un valor de la

variable x

Dado una valor de la variable x, usamos nuestro modelo lineal y=n+m·x,

sustituimos en la función y hallamos el valor de estimación de la variable y, "y.

https://marielmatesblog.wordpress.com/

ESTIMACIÓN

Page 8: ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL · 2020. 4. 13. · próximo a 1, nube de puntos deforma lineal, …), podremos usarlo para poder predecir resultados de la variable dependiente

“No toda nube de puntos se ajusta apropiadamente a un modelo de regresión lineal”(a pesar de que la recta de regresión siempre se pueda calcular).CONSEJO: calcular “r”, coeficiente de correlación lineal.

Cuarteto de Anscombe

I II III IV

x y x y x y x y

10.0 8.04 10.0 9.14 10.0 7.46 8.0 6.58

8.0 6.95 8.0 8.14 8.0 6.77 8.0 5.76

13.0 7.58 13.0 8.74 13.0 12.74 8.0 7.71

9.0 8.81 9.0 8.77 9.0 7.11 8.0 8.84

11.0 8.33 11.0 9.26 11.0 7.81 8.0 8.47

14.0 9.96 14.0 8.10 14.0 8.84 8.0 7.04

6.0 7.24 6.0 6.13 6.0 6.08 8.0 5.25

4.0 4.26 4.0 3.10 4.0 5.39 19.0 12.50

12.0 10.84 12.0 9.13 12.0 8.15 8.0 5.56

7.0 4.82 7.0 7.26 7.0 6.42 8.0 7.91

5.0 5.68 5.0 4.74 5.0 5.73 8.0 6.89

https://marielm

atesblog.wordpress.com

/

0

5

10

15

0 5 10 15

0

5

10

15

0 5 10 15

0

5

10

15

0 10 200,002,004,006,008,00

10,00

0 5 10 15

0

5

10

15

0 5 10 15

0,00

5,00

10,00

15,00

0 5 10 15

0

5

10

15

0 5 10 15

0

5

10

15

0 10 20

y=3+0,5·x

Datos de Anscombe