modelos y regresión lineales: simple y múltiple

23
MODELOS LINEALES: SIMPLE Y MÚLTIPLE ESTADÍSTICA II GRUPO AD 1

Upload: thegoerge1906

Post on 26-Jun-2015

156 views

Category:

Documents


2 download

DESCRIPTION

Modelos y Regresión Lineales

TRANSCRIPT

Page 1: Modelos y Regresión Lineales: Simple y Múltiple

MODELOS LINEALES: SIMPLE Y MÚLTIPLE

ESTADÍSTICA II

GRUPO AD

DEPARTAMENTO DE CIENCIAS BÁSICAS

BARRANQUILLA, 2010

1

Page 2: Modelos y Regresión Lineales: Simple y Múltiple

TABLA DE CONTENIDO

Pág.

Introducción

Objetivos 4

General

Específicos

Metodología 5

Evidencias 18

Conclusión 20

2

Page 3: Modelos y Regresión Lineales: Simple y Múltiple

INTRODUCCIÓN

En la practica de nuestros conocimientos vemos que la EstadísticaInferencial nos permite trabajar con una variable a nivel de intervalo o razón, así también se puede comprender la relación de dos o más variablesy nos permitirá relacionar mediante ecuaciones, una variable en relación de la otra variable llamándose Regresión Lineal y una variable en relación a otras variables llamándose Regresión múltiple.

Casi constantemente en la practica de la investigación estadística, se encuentran variables que de alguna manera están relacionados entre si, por lo que es posible que una de las variables puedan relacionarse matemáticamente en función de otra u otras variables.

En el presente trabajo mediante un experimento en el cual evidenciaremos una simulación de obreros trabajando en el embalaje de un producto al trasporte, describiremos técnicas estadísticas aplicadas a los modelos lineales.

3

Page 4: Modelos y Regresión Lineales: Simple y Múltiple

OBJETIVOS

General

Adquirir la habilidad de construir un modelo de regresión simple y

múltiple utilizando los conocimientos adquiridos en algebra lineal.

Específicos

Aplicar modelos lineales a problemas de la vida diaria.

Establecer si al conjunto de datos se le puede aplicar bajo hipótesis.

Hallar valores dentro de la tabla de análisis de varianza “ANOVA”.

4

Page 5: Modelos y Regresión Lineales: Simple y Múltiple

METODOLOGÍA

Realice un experimento en donde todas las personas del grupo carguen un objeto pesado (pesa) a una distancia. Tomando el tiempo de traslado del punto de partida hasta la distancia prefijada. Usted debe variar el peso de cada persona, replicando el experimento tres veces por persona (el mismo peso, la misma distancia). Pero a medida que avanza el experimento debe aumentar el peso del objeto de la carga (Simulación de obreros trabajando en el embalaje de un producto al trasporte).

PersonaReplicació

nEDAD en

mesesPeso de la

personaTiempo establecido hasta la distancia x

Peso del objeto de carga

1

1

2

3

2

1

2

3

3

1

2

3

4

1

2

3

5

1

2

3

1. Ajuste un modelo de regresión lineal simple tomando como variable dependiente el tiempo establecido por cada persona y su peso corporal. Construya la tabla de análisis de varianza y realice las conclusiones pertinentes.

2. Ajuste un modelo de regresión múltiple tomando como variable dependiente el tiempo establecido por cada persona y el resto de las variables del experimento como las variables independientes. Construya la tabla de análisis de varianza y realice las conclusiones pertinentes.

5

Page 6: Modelos y Regresión Lineales: Simple y Múltiple

Utilice un alfa de 5%.Recopilación de datos

PersonaReplicació

nEDAD en

mesesPeso de la

personaTiempo establecido hasta la distancia x

Peso del objeto de carga

1

1 252 65.5 3.05 2.5

2 252 64 3.07 7.5

3 252 65 3.53 20

2

1 228 56 5.07 2.5

2 228 56 5.23 7.5

3 228 55 5.96 20

3

1 233 50 3.74 2.5

2 233 49 3.95 7.5

3 233 49 4.13 20

4

1 230 54 3.70 2.5

2 230 54.5 3.74 7.5

3 230 53 4.12 20

La información de la anterior tabla es la recopilación del peso de la persona, tiempo empleado y peso del objeto de carga.

La información de la persona 1, 2, 3 y 4, corresponde a José, Heidy, Jorge y Camila respectivamente.

Las cargas empleadas para tal uso fueron: 1º carga: 2.5 kg (incluida barra). 2º carga: 2.5 kg + 5 kg (7.5 kg, incluida barra). 3º carga: 2.5 kg + 5 kg + 12.5 kg (20 kg, incluida barra).

La distancia establecida desde el punto de partida hasta el punto de llegada fue de 4.0 metros.

6

Page 7: Modelos y Regresión Lineales: Simple y Múltiple

Realización punto #1

Caso José.

Y XTiempo Peso corporal

3.05 65,53.07 643.53 65

Tiempo (y), variable dependiente.Peso corporal (x), variable independiente.

∑ x2=12611.25 ∑ x=194.5

∑ y2=31.1883 ∑ y=9.65

x=64.8333 y=3.2166

∑ xy=625.705 n=3

Por lo tanto,

SSxy=∑ xy−(∑ x ) .(∑ y )

n

SSxy=625.705−(194.5 ) . (9.65 )

3SSxy=0.0633

SSxx=∑ x2−(∑ x )2

n

SSxx=12611.25−(194.5 )2

3SSxx=1.6666

7

Page 8: Modelos y Regresión Lineales: Simple y Múltiple

SSyy=∑ y2−(∑ y )2

n

SSyy=31.1883−(9.65 )2

3SSyy=0.1474SSxy=0.0633SSxx=1.6666SSyy=0.1474

β1=SSxySSxx

=0.06331.6666

=0.0542

βo= y−β1 x=3.2166−(0.0542)(64.8333)βo=−0.3028

El modelo es el siguiente,

y= β0+ β1 x+εy=−0.3028+0.0542 xEl coeficiente de correlación

r=∑ xy− (∑ x ) . (∑ y ) /n

√ [∑ x2−(∑ x )2/n ] .[∑ y2−(∑ y )2/n]r=

625.705−(194.5 ) . (9.65 )/3

√ [12611.25−(194.5 )2/3 ] . [31.1883−(9.65 )2/3 ]r= 0.0633

√ (1.1666 ) . (0.1474 )=0.06330.4146

r=0.1526 No existe una relación entre “x” y “y”R2= (0.1526 )2=0.0233 El modelo no es idóneo.

SStotal=∑ y2−(∑ y )2/n=0.1474

SSmodelo=∑ xy−(∑ x) .(∑ y )/n

[∑ x2−(∑ x)2/n ]=0.06331.1666

=0.0542

SSerror=0.1474−0.0542=0.0932

F de V SS CM Valor f

8

Page 9: Modelos y Regresión Lineales: Simple y Múltiple

Modelo 2 0,05428571 0,02714286 0,87387572Error 3 0,09318095 0,03106032  Total 5 0,14746667    

Fα [ p−1 ,n− p ]=F0.05 (2,3 )=9.5521f <Fα [ p−1 , n− p] 0.8738<9.5521No se rechaza Ho.

Caso Heidy.

Y XTiempo Peso corporal

5.07 565.23 565.96 55

Tiempo (y), variable dependiente.Peso corporal (x), variable independiente.

∑ x2=9297 ∑ x=167

∑ y2=88.5794 ∑ y=16.26

x=55.6666 y=5.42

∑ xy=904.6 n=3

Por lo tanto,

SSxy=∑ xy−(∑ x ) .(∑ y )

n

SSxy=904.6−(167 ) . (16.26 )

3SSxy=−0.54

SSxx=∑ x2−(∑ x )2

n

SSxx=9297−(167 )2

3SSxx=0.6666

9

Page 10: Modelos y Regresión Lineales: Simple y Múltiple

SSyy=∑ y2−(∑ y )2

n

SSyy=88.5794−(16.26 )2

3SSyy=0.4502

SSxy=−0.54SSxx=0.6666SSyy=0.4502

β1=SSxySSxx

= −0.540.6666

=−0.81

βo= y−β1 x=5.42−(−0.81)(55.6666)βo=50.51

El modelo es el siguiente,

y= β0+ β1 x+εy=50.51−0.81 x

El coeficiente de correlación

r=∑ xy− (∑ x ) . (∑ y ) /n

√ [∑ x2−(∑ x )2/n ] .[∑ y2−(∑ y )2/n]

r=904.6−(167 ) . (16.26 ) /3

√ [9297−(167 )2/3 ] . [88.5794−(16.26 )2/3 ]

r= −0.54√ (0.6666 ) . (0.4502 )

=−0.540.5478

r=−0.9856 Existe una relación negativa entre “x” y “y”

R2= (−0.9856 )2=0.9715 El modelo es idóneo.

SStotal=∑ y2−(∑ y )2/n=0.4502

SSmodelo=∑ xy−(∑ x) .(∑ y )/n

[∑ x2−(∑ x)2/n ]= −0.540.6666

=−0.81

10

Page 11: Modelos y Regresión Lineales: Simple y Múltiple

SSerror=0.4502−0.81=1.2602

F de V SS CM Valor fModelo 2 -0,81 -0,405 -0,96413268Error 3 1,2602 0,42006667  Total 5 0,4502    

Fα [ p−1 ,n−p ]=F0.05 (2,3 )=9.5521f <Fα [ p−1 , n−p] −0.9641<9.5521No se rechaza Ho.

Caso Jorge.

Y XTiempo Peso corporal

3.74 503.95 494.13 49

Tiempo (y), variable dependiente.Peso corporal (x), variable independiente.

∑ x2=7302 ∑ x=148

∑ y2=46.647 ∑ y=11.82

x=49.3333 y=3.94

∑ xy=582.92 n=3

Por lo tanto,

SSxy=∑ xy−(∑ x ) .(∑ y )

n

SSxy=582.92−(148 ) . (11.82)

3SSxy=−0.2

SSxx=∑ x2−(∑ x )2

n

11

Page 12: Modelos y Regresión Lineales: Simple y Múltiple

SSxx=7302−(148 )2

3SSxx=0.6666

SSyy=∑ y2−(∑ y )2

n

SSyy=46.647−(11.82)2

3SSyy=0.0762

SSxy=−0.2SSxx=0.6666SSyy=0.0762

β1=SSxySSxx

= −0.20.6666

=−0.3

βo= y−β1 x=3.94−(−0.3)(49.3333)βo=18.74

El modelo es el siguiente,

y= β0+ β1 x+εy=18.74−0.3x

El coeficiente de correlación

r=∑ xy− (∑ x ) . (∑ y ) /n

√ [∑ x2−(∑ x )2/n ] .[∑ y2−(∑ y )2/n]

r=582.92−(148 ) . (11.82)/3

√ [7302− (148 )2/3 ] . [46.647−(11.82 )2/3 ]

r= −0.2√ (0.6666 ) . (0.0762 )

= −0.20.2253

r=−0.8873 Existe una relación negativa entre “x” y “y”

R2= (−0.8873 )2=0.7874 El modelo esrelativamente idóneo.

12

Page 13: Modelos y Regresión Lineales: Simple y Múltiple

SStotal=∑ y2−(∑ y )2/n=0.0762

SSmodelo=∑ xy−(∑ x) .(∑ y )/n

[∑ x2−(∑ x)2/n ]= −20.6666

=−0.3

SSerror=0.0762−(−0.3)=0.3762

F de V SS CM Valor fModelo 2 -0,3 -0,15 -1,19617225Error 3 0,3762 0,1254  Total 5 0,0762    

Fα [ p−1 ,n−p ]=F0.05 (2,3 )=9.5521f <Fα [ p−1 , n−p] −1.1961<9.5521No se rechaza Ho.

Caso Camila.

Y XTiempo Peso corporal

3.7 543.74 54.54.12 53

Tiempo (y), variable dependiente.Peso corporal (x), variable independiente.

∑ x2=8695.25 ∑ x=161.5

∑ y2=44.652 ∑ y=11.56

x=53.8333 y=3.8533

∑ xy=621.99 n=3

Por lo tanto,

SSxy=∑ xy−(∑ x ) .(∑ y )

n

SSxy=621.99−(161.5 ) . (11.56 )

3SSxy=−0.3233

13

Page 14: Modelos y Regresión Lineales: Simple y Múltiple

SSxx=∑ x2−(∑ x )2

n

SSxx=8695.25−(161.5 )2

3SSxx=1.1666

SSyy=∑ y2−(∑ y )2

n

SSyy=44.652−(11.56 )2

3SSyy=0.1074

SSxy=−0.3233SSxx=1.1666SSyy=0.1074

β1=SSxySSxx

=−0.32331.1666

=−0.2771

βo= y−β1 x=3.8533−(−0.2771)(53.8333)βo=18.7728

El modelo es el siguiente,

y= β0+ β1 x+εy=18.7728−0.2771 x

El coeficiente de correlación

r=∑ xy− (∑ x ) . (∑ y ) /n

√ [∑ x2−(∑ x )2/n ] .[∑ y2−(∑ y )2/n]

r=621.99−(161.5 ) . (11.56 )/3

√ [8695.25−(161.5 )2/3 ] . [44.652−(11.56 )2/3 ]

r= −0.3233√ (1.1666 ) . (0.1074 )

=−0.32330.3539

14

Page 15: Modelos y Regresión Lineales: Simple y Múltiple

r=−0.9131 Existe una relación negativa entre “x” y “y”

R2= (−0.9131 )2=0.8338 El modelo esrelativamente idóneo.

SStotal=∑ y2−(∑ y )2/n=0.1074

SSmodelo=∑ xy−(∑ x) .(∑ y )/n

[∑ x2−(∑ x)2/n ]=−0.32331.1666

=−0.2771

SSerror=0.1074−(−0.2771)=0.3846

F de V SS CM Valor fModelo 2 -0,27714286 -0,13857143 -1,08087361Error 3 0,38460952 0,12820317  Total 5 0,10746667    

Fα [ p−1 ,n− p ]=F0.05 (2,3 )=9.5521f <Fα [ p−1 , n− p] −1.0808<9.5521No se rechaza Ho.Realización punto #2

Tenemos la información obtenida experimentalmente:Tabla de datos

Y X1 X2 X3

Tiempo Edad Pesopersona

Pesocarga

3,05 252 65,5 2,5

3,07 252 64 7,5

3,53 252 65 20

5,07 228 56 2,5

5,23 228 56 7,5

5,96 228 55 20

3,74 233 50 2,5

3,95 233 49 7,5

4,13 233 49 20

3,7 230 54 2,5

3,74 230 54,5 7,5

4,12 230 53 20

Tiempo (y), variable dependiente.

15

Page 16: Modelos y Regresión Lineales: Simple y Múltiple

Edad (X1), variable 1 independiente.Peso corporal (x2), variable 2 independiente.Peso carga del objeto (X3), variable 3 independiente.

A partir de la tabla, obtenemos la matriz x,Matriz x

1 252 65,5 2,51 252 64 7,51 252 65 201 228 56 2,51 228 56 7,51 228 55 201 233 50 2,51 233 49 7,51 233 49 201 230 54 2,51 230 54,5 7,51 230 53 20

De esta última se le aplica la matriz traspuesta x’,

Matriz x' 1 1 1 1 1 1 1 1 1 1 1 1

252 252 252 228 228 228 233 233 233 230 230 23065,5 64 65 56 56 55 50 49 49 54 54,5 532,5 7,5 20 2,5 7,5 20 2,5 7,5 20 2,5 7,5 20

Seguidamente obtenemos una matriz producto a partir de x’ (traspuesta) y x; con dimensiones 4x4.

Matriz x'x12 2829 671 120

2829 668031 158719 28290671 158719 37905,5 6680120 28290 6680 1850

Luego, a esta última se invierte, obteniendo la matriz (x’x)-1

Matriz (x'x)-1

77,5716783 -0,43753817 0,45789194 0,00574886

16

Page 17: Modelos y Regresión Lineales: Simple y Múltiple

-0,43753817 0,00277216 -0,00383126 -0,000176830,45789194 -0,00383126 0,00789892 0,000364570,00574886 -0,00017683 0,00036457 0,00155529

Posteriormente se multiplica la matriz x’ por la matriz y, seleccionada de la tabla de datos

Por último

Se aplica la forma:β=( x ' x )−1 x ' y

Para obtener:

β= (x'x)-1x'y24,4789493 → β0-0,1125236 → β10,10353548 → β20,03666318 → β3

Donde,βo, es igual a 24.4789

β1, es igual a −0.1125β2, es igual a 0.1035

β3, es igual a 0.0366

Así,

y= β0+ β1 x1+ β2 x2+ β3 x3

17

Obteniendo

Page 18: Modelos y Regresión Lineales: Simple y Múltiple

El modelo es: y=24.4789−0.1125 x1+0.1035 x2+0.0366 x3

CONCLUSIONES

1. En el caso de la Persona 1 (José), se pudo concluir que no existe relación entre las variables "x" y las variables "y", obteniendo r=0.1526. Además, se estableció que el modelo aplicado al conjunto de datos que arroja la experiencia con la Persona 1 (José) no es idóneo mientras que no se rechazó la hipótesis nula (Ho).

2. En el caso de la Persona 2 (Heidy), se pudo concluir que existe una altísima relación negativa entre las variables "x" y las variables "y", obteniendo r=-0.9856. Además, se estableció que el modelo aplicado al conjunto de datos que arroja la experiencia con la Persona 2 (Heidy) es idóneo mientras que no se rechazó la hipótesis nula (Ho).

3. En el caso de la Persona 3 (Jorge), se pudo concluir que existe una relación negativa y relativamente alta entre las variables "x" y las variables "y", obteniendo r=-0.8873. Además, se estableció que el modelo aplicado al conjunto de datos que arroja la experiencia con la Persona 3 (Jorge) es relativamente idóneo mientras que no se rechazó la hipótesis nula (Ho).

18

Page 19: Modelos y Regresión Lineales: Simple y Múltiple

4. En el caso de la Persona 4 (Camila), se pudo concluir que existe una relación negativa y relativamente alta entre las variables "x" y las variables "y", obteniendo r=-0.9131. Además, se estableció que el modelo aplicado al conjunto de datos que arroja la experiencia con la Persona 4 (Camila) es relativamente idóneo mientras que no se rechazó la hipótesis nula (Ho).

5. Finalmente, a partir de los datos obtenidos experimentalmente se pudo notar el modelo de relación entre las variables, conociendo sus respectivos coeficientes.

El modelo es: y=24.4789−0.1125 x1+0.1035 x2+0.0366 x3

19