17.regresión y correlación simple

91
REGRESIÓN Y CORRELACIÓN SIMPLE

Upload: manuel-chavez-leandro

Post on 24-May-2015

3.123 views

Category:

Documents


2 download

DESCRIPTION

Métodos estadísticos

TRANSCRIPT

Page 1: 17.regresión y correlación simple

REGRESIÓN Y CORRELACIÓN

SIMPLE

Page 2: 17.regresión y correlación simple

OBJETIVOS

1. Utilizar diagramas de dispersión para visualizar la relación entre dos variables.

2. Identificar relaciones simples entre variables

3. Utilizar la ecuación de regresión para predecir valores futuros.

4. Aplicar el análisis de correlación para describir el grado hasta el cuál dos variables están relacionadas linealmente entre si.

Al finalizar el Tema , el participante será capaz de:

Page 3: 17.regresión y correlación simple

6. Realizar el diagnostico de la regresión7. Medición de la autocorrelación8. Realizar la estimación por intervalos9. Realizar el análisis de varianza de la regresión

simple

Page 4: 17.regresión y correlación simple

1. El diagrama de dispersión

2. Las ecuaciones lineales simples

3. La regresión lineal simple

4. El error estándar de la estimación

5. El análisis de correlación

6. El diagnóstico de la regresión: al análisis residual

7. La estadística de Durbin-Watson

8. La estimación por intervalos

9. Análisis de varianza de la regresión simple.

CONTENIDO

Page 5: 17.regresión y correlación simple

17.1 El diagrama de dispersión

Es un gráfico que permite detectar la existencia de una relación entre dos variables.

Visualmente se puede buscar patrones que indiquen el tipo de relación que se da entre las variables.

Page 6: 17.regresión y correlación simple

• •

• •

• • •

• • • • •

• • •

• •

• • •

• •

• • • •

• • •

• •

• • •

• •

• • • •

• • •

• •

• • •

• • •

• •

• • •

• • • •

• • •

• • • • •

• • • •

• •

• • •

• • •

(a) Lineal directa (b) Lineal inversa (c) Curvilínea directa

(d) Curvilinea inversa (e) Lineal inversacon más dispersión

(d) Ninguna relación

Y

X

Y

X

Y

X

Y

X

Y

X

Y

X

Relaciones posibles entre X y Y vistos en diagramas de dispersión

Page 7: 17.regresión y correlación simple

Aplicación

Los datos siguientes muestran las cantidades consumidas de complemento nutricional (en Kg.) y el aumento de peso de niños con signos de desnutrición.

PACIENTE 1 2 3 4 5 6 7 8 9 10

COMPLEMENTO1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5

EN Kg: X

AUMENTO DE8 10 9 12 14 13 15 17 14 14

PESO : Y

Presente la información en un diagrama de dispersión

Page 8: 17.regresión y correlación simple

Procedimiento

1er Paso: Reúna pares de datos (X,Y), cuya relación desea estudiar y organice la información en una tabla.

PACIENTE 1 2 3 4 5 6 7 8 9 10

COMPLEMENTO1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5

EN Kg: X

AUMENTO DE8 10 9 12 14 13 15 17 14 14

PESO : Y

Page 9: 17.regresión y correlación simple

2do Paso: Encuentre los valores mínimos y máximos para X e Y. Elija las escalas que se usarán en los ejes horizontal y vertical, de manera que ambas longitudes sean aproximadamente iguales, facilitando la lectura del diagrama.

0

5

10

15

20

0.0 2.0 4.0 6.0

Page 10: 17.regresión y correlación simple

3er Paso: Registre los datos en el gráfico. Cuando se obtengan los mismos valores en diferentes observaciones, muestre estos puntos haciendo círculos concéntricos (o), o registre el segundo punto muy cerca del primero.

0

5

10

15

20

0.0 2.0 4.0 6.0

Page 11: 17.regresión y correlación simple

4to Paso: Agregue toda la información que puede ser de utilidad para entender el diagrama, tal como: título del diagrama, período de tiempo, número de pares de datos, nombre de la variable y unidades de cada eje, entre otros.

Relación complemento nutricional y aumento de peso

0

5

10

15

20

0.0 2.0 4.0 6.0

Complemento nutricional (Kg)

Au

men

to d

e p

eso

(K

g)

Page 12: 17.regresión y correlación simple

17.2 Las ecuaciones lineales simples

Si dos variables, como X e Y, están relacionadas, se puede expresar como una relación, por ejemplo:

Y = 3 + 1,5X

Al conocer la ecuación se puede:

a) Calcular el valor de Y para cualquier valor dado de X

b) Conocer el cambio en Y, cuando X varía en 1

Page 13: 17.regresión y correlación simple

Valor Valor Cambio dado de Xcalculado de Y de Y

1 4,5 -2 6,0 1,53 7,5 1,54 9,0 1,55 10,5 1,5

Por ejemplo: Y = 3 + 1,5X

Page 14: 17.regresión y correlación simple

El aumento en Y, cuando X varía en una unidad, está dado por el coeficiente de X.

Ejemplo:

En Y = 10 + 2Xcuando X aumenta en 1, Y aumenta en 2

En Y = 5 - 0,8Xcuando X aumenta en 1, Y disminuye en 0,8

Page 15: 17.regresión y correlación simple

A) Tipos de VariablesEn una ecuación como Y = 30 + 3X, el valor de Y depende del valor que toma X, por eso a Y se le llama variable dependiente, y a X se le llama variable independiente.

Y = b0 + b1 X

VariableDependiente

VariableIndependiente

Page 16: 17.regresión y correlación simple

B) Tipo de Relaciones

Cuando cambios en X provoca cambios en Y en igual sentido (aumentos o disminuciones), las variables están directamente relacionadas. Se observa el signo +

X

o

o

o

o

o

o

o

o

oYEjemplo:Y = 30 + 5X

Page 17: 17.regresión y correlación simple

Cuando cambios en X, provoca variaciones en Y en sentido inverso (X aumenta, Y disminuye o viceversa), las variables están inversamente relacionadas. Se observa en la ecuación el signo -.

o

o

o

o

o

o

o

o

X

YEjemplo:Y = 20 - 3X

Page 18: 17.regresión y correlación simple

La ecuación es de primer grado si la variable independiente está elevada al exponente 1. Su gráfica genera una línea recta (por lo que también se le llama ecuación lineal)

Ejemplo: Y = 30 + 4 X

C) Grado de la ecuación:

Page 19: 17.regresión y correlación simple

Si la variable independiente está elevada a un exponente diferente a 1, la ecuación toma el valor del exponente. Su gráfica no es una línea recta.

Ejemplo:

Y = 10 + 3 X + 4 X2 : ecuación de segundo grado

Y = 3 + 7X + 5 X3 : ecuación de tercer grado

Page 20: 17.regresión y correlación simple

D) Ecuaciones simples y múltiples: Simples: Muestra la relación entre dos variables

Y = 30 + 2X

Y = 10 - 3X2

Múltiple: Muestra la relación entre tres o más variables

Y = 3X + 8 Z

Y = 5 + 2X2 + 4W

Page 21: 17.regresión y correlación simple

D) Gráfica de una ecuación de primer grado:

Ejemplo: Y = 3 + 1,5X

Los cinco pares de valores se diagraman de la forma siguiente.

121110987654321

1 2 3 4 5

Y

.

X

.. . .

(1,4.5)

(4,9)

(3,7.5)

(2,6)

(5,10.5)

X 1 2 3 4 5Y 4 , 5 6 , 0 7 , 5 9 , 0 1 0 , 5

Page 22: 17.regresión y correlación simple

E) Forma general:

La ecuación simple de primer grado tiene la siguiente forma general

Y = b0 + b1 X

Donde:

b1: pendiente, o sea, el cambio en Y cuando X = 1.

b0: el valor autónomo, es decir, Y = b0 cuando X = 0. En la gráfica es la intersección con el eje Y

Ejemplo:

Y = 3 + 1.5X .b0 = 3

Y

X

Page 23: 17.regresión y correlación simple

17.3 Regresión lineal simple

Es una técnica estadística que permite determinar la mejor ecuación que represente la relación entre dos variables relacionadas.

Para poder establecer la relación cuantitativa entre X e Y es necesario disponer de pares de observaciones. Cada par ha sido registrado a la misma unidad elemental.

Page 24: 17.regresión y correlación simple

A) Suposiciones de regresión y correlación

a) Normalidad: los valores de Y estarán distribuidos normalmente a cada valor de X.

b) Homoscedasticidad: la variación alrededor de la línea de regresión sea constante para todos los valores de X.

c) Independencia de error: el error (diferenciaresidual entre un valor observado y uno

estimado de Y) sea independientemente de cada valor de X.

d) Linealidad: la relación entre las variables es lineal.

Page 25: 17.regresión y correlación simple

La ecuación general = b0 + b1X se llama ecuación de regresión y permite estimar o predecir los valores de Y.

Es el procedimiento matemático utilizado para determinar los valores numéricos de los coeficientes de regresión: b0 y b1

Y

B) El método de Mínimos Cuadrados

Page 26: 17.regresión y correlación simple

Yi - Y = error

Min Y - Yi

2

El método consiste en determinar una ecuación que la suma de los errores al cuadrado sea mínima.

X

Y

Error= 2

2 4 6 8 10 12 14

10

8

6

4

2 • •

Error= -6•

Línea deestimación

.

. Y

Page 27: 17.regresión y correlación simple

El método utiliza un sistema de ecuación llamado ecuaciones normales, que tienen la siguiente forma:

Para aplicar las fórmulas, tenemos que confeccionar un cuadro como el siguiente:

2

10

10

XbXbXY

X b + nbY

YX XY 2X

X Y X2 XY

1.0 8.0 1.0 8.0

1.5 10.0 2.3 15.0

2.0 9.0 4.0 18.0

2.5 12.0 6.3 30.0

3.0 14.0 9.0 42.0

3.5 13.0 12.3 45.5

4.0 15.0 16.0 60.0

4.5 17.0 20.3 76.5

5.0 14.0 25.0 70.0

5.5 14.0 30.3 77.0

32.5 126.0 126.3 442.0

       

Page 28: 17.regresión y correlación simple

Sustituyendo los valores , n = 5,

y ,en las ecuaciones normales, obtenemos el siguiente sistema de ecuaciones.

126 = 10b0 + 32,5b1

442 = 32,5b0 + 126,3b1

Resolviendo el sistema tenemos: b0 = 7,479 b1= 1,576 ,por lo tanto,

0,261Y 5,23X 424XY 3,126

2X

1,576X7,479 Y

Page 29: 17.regresión y correlación simple

c) Interpretación

b0 = 7,478 : Es probable que un paciente desnutrido que no sea considerado dentro del Programa de Alimentación Complementaria tenga un peso de 7,478 Kg.

b1 = 1,576:Por cada Kg. del alimento complementario, se espera que probablemente el niño aumento su peso en 1,576 Kg.

Page 30: 17.regresión y correlación simple

D) Valor observado y valor estimado de Y

El valor observado (Yi) se refiere al nivel efectivo u observado de la variable Y (peso del niño), mientras que el valor estimado ( ), es el nivel estimado de la variable (peso esperado), obtenido utilizando la ecuación de regresión.

iY

X

Y

Valorestimado

Valorobservado

YiY..

xo

X Y  

1.0 8.0 9.055

1.5 10.0 9.843

2.0 9.0 10.630

2.5 12.0 11.418

3.0 14.0 12.206

3.5 13.0 12.994

4.0 15.0 13.782

4.5 17.0 14.570

5.0 14.0 15.358

5.5 14.0 16.146

Y

Page 31: 17.regresión y correlación simple

17.4 Error estándar de estimación (Syx)

Mide la disparidad ¨promedio¨ entre los valores observados y estimados de la variable Y. Se calcula por la siguiente relación

2

2n

Y-Y )(=yxS

14

Page 32: 17.regresión y correlación simple

X Y      

1.0 8.0 9.055 -1.1 1.112181

1.5 10.0 9.843 0.2 0.024806

2.0 9.0 10.630 -1.6 2.658204

2.5 12.0 11.418 0.6 0.338375

3.0 14.0 12.206 1.8 3.217718

3.5 13.0 12.994 0.0 3.48E-05

4.0 15.0 13.782 1.2 1.483524

4.5 17.0 14.570 2.4 5.905386

5.0 14.0 15.358 -1.4 1.843621

5.5 14.0 46 -2.1 4.604028

32.5 126.0 126.0 0.0 21.2

Y YY 2YY

Page 33: 17.regresión y correlación simple

El Syx es un indicador del grado de precisión con que la ecuación de regresión describe la relación entre las dos variables: cuanto más pequeño, los valores observado y estimado de Y son razonablemente cercanos y, la ecuación de regresión es una buena descripción esa la relación.

Reemplazando en la formula

65,2820,21

20120,21=yxS

,6281=yxS

Page 34: 17.regresión y correlación simple

17.5 El análisis de correlación

El análisis de correlación es la técnica estadística que permite describir el grado hasta el cual una variable está linealmente relacionada con otra.

Hay dos medidas que se usan para describir la correlación El coeficiente de determinación El coeficiente de correlación

Page 35: 17.regresión y correlación simple

A) El coeficiente de determinaciónAl construir un modelo de regresión, se define que “el valor Y depende de X”.

Y = f (X)

Si la relación es lineal: Y = b0 + b1X

Pero en la práctica Y depende también de “otros factores” diferentes a X:

Y = b0 + b1X +

Parte de los cambios en Y pueden explicarse por X, a esto se llama variación explicada.Pero hay cambios en Y que no pueden explicarse por X, a lo que se llama variación no explicada.

Page 36: 17.regresión y correlación simple

VARIACION VARIACION VARIACION TOTAL = EXPLICADA + NO EXPLICADA

VariaciónTotal

Variaciónno explicada

VariaciónExplicada Y - Y

Y - Yi Y - Yi

Y

X

iY

y

Page 37: 17.regresión y correlación simple

El coeficiente de determinación se puede calcular del modo siguiente:

Se elevan al cuadrado, para evitar que

obteniéndose un número positivo.

variacion explicadavariacion total

r2

2

2

Y - iY

Y - Y=r2

Y - Y 0

Page 38: 17.regresión y correlación simple

1er Paso: Cálculo de la venta media por vendedor son ( )

Y =Y

ni

n

i

1

Y =Y Y Y Y Y

51 2 3 4 5

Y

Y =5

9 5 7 14 10 455

Y = unidades9

Page 39: 17.regresión y correlación simple

2do Paso: Se calcula la variación total, es decir, la sumatoria de las desviaciones de las ventas observadas (Yi) con respecto a la media:

2Y - iY

Y      

8.0 12.6 -4.6 21.16

10.0 12.6 -2.6 6.76

9.0 12.6 -3.6 12.96

12.0 12.6 -0.6 0.36

14.0 12.6 1.4 1.96

13.0 12.6 0.4 0.16

15.0 12.6 2.4 5.76

17.0 12.6 4.4 19.36

14.0 12.6 1.4 1.96

14.0 12.6 1.4 1.96

126.0 126.0 0.0 72.4

       

Y YY 2YY

Y Y 2YY YY

Page 40: 17.regresión y correlación simple

3er Paso: Se calcula la variación explicada, es decir, la sumatoria de las desviaciones cuadráticas entre las ventas esperadas y la venta media de la muestra: Y - Y

2

       

9.055 12.6 -3.545 12.5699

9.843 12.6 -2.758 7.6038

10.630 12.6 -1.970 3.8793

11.418 12.6 -1.182 1.3964

12.206 12.6 -0.394 0.1551

12.994 12.6 0.394 0.1553

13.782 12.6 1.182 1.3971

14.570 12.6 1.970 3.8805

15.358 12.6 2.758 7.6055

16.146 12.6 3.546 12.5720

126.0 126.0 0.0 51.2

       

Y Y YY

2YY Y Y YY

2YY

Page 41: 17.regresión y correlación simple

4to Paso: Se compara la variación explicada y la variación total.

variacion explicadavariacion total

r2

2

2

Y - Y

Y - Y=

ir2

707,04,722,51

= r2

5to Paso: Interpretación: 70,7% de las variaciones en el incremento de peso, pueden explicarse por el consumo del complemento nutricional.

Page 42: 17.regresión y correlación simple

Valores posibles de r2

Si r2 = 1 : Correlación perfecta, es decir, toda variación de Y puede explicarse por X

Si r2 = 0 : no existe correlación entre X e Y. La variación explicada es 0. La variable X no explica nada de los cambios en Y

Resumen1 r 0 2

Cuanto más cerca a uno, las variables tendrán mayor correlación.

Page 43: 17.regresión y correlación simple

B) El coeficiente de correlación

Es la raíz cuadrada del coeficiente de determinación.

Sus valores oscilan entre -1 y 1

Cuando r es positivo, indica que X e Y están directamente relacionados.

r = r2

Page 44: 17.regresión y correlación simple

Cuando r es negativo, indica que X e Y están inversamente relacionados.

El coeficiente r tiene el mismo signo que el coeficiente b1 en la ecuación de

regresión

Page 45: 17.regresión y correlación simple

Interpretación del coeficiente de correlación de Pearson

-1 0 0,5 0,9 1-0,9 -0,5Perfecta

Negativa

Perfecta

Positiva

FuerteNegativa

DébilNegativa

DébilPositiva

ModeradaPositiva

FuertePositiva

ModeradaNegativa

No existe correlación

Page 46: 17.regresión y correlación simple

r2= 0,707Ejemplo:

0,707=rr = 0,84

el signo es positivo ya que X e Y están relacionados directamente como lo indica el signo del coeficiente b1 en la ecuación de regresión 1,576X7,479 Y

Page 47: 17.regresión y correlación simple

Interpretación: El incremento de peso (Y) y el consumo del complemento nutricional (X) se encuentran directamente asociados.

Page 48: 17.regresión y correlación simple

17.6 Diagnóstico de la regresión: análisis residual

El análisis residual permite evaluar lo adecuado del modelo de regresión que ha sido ajustado a los datos. También sirve para detectar si los supuestos se cumplen.

A. Evaluación de lo adecuado de modelo ajustado

Los valores del error residual o estimado (i) se define como la diferencia entre los valores observados (Yi) y los estimados ( ) de la variable dependiente para los valores dados de Xi

iY

iYi = Yi -

Page 49: 17.regresión y correlación simple

Podemos evaluar lo adecuado del modelo de regresión ajustado mediante el gráfico de los residuos (eje vertical) con respecto a los correspondientes valores de Xi de la variable independiente (eje horizontal).

Variable X 1 Gráfico de los residuales

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

Variable X 1

Res

iduo

s

Ejemplo: El gráfico muestra un adecuado ajuste entre el incremento de peso y el consumo del com- plemento nutricional. No se observa una tendencia.

Page 50: 17.regresión y correlación simple

El análisis del gráfico nos brinda el criterio para adoptar el modelo lineal o dejarlo de lado. Si fuese así, podríamos probar con modelos no lineales como el cuadrático, logaritmo o exponencial.

El análisis de residuos se complementa con el cálculo de los residuos estandarizados (SRi), que resultan de la división del residuo dividido por su error estándar.

iYX

ii h1S

SR

En donde

n

1i

22i

2

ii

XnX

XXn1

h

Page 51: 17.regresión y correlación simple

Los valores estandarizados nos permiten tomar en cuenta la magnitud de los residuos en unidades que reflejen la variación estandarizada alrededor de la línea de regresión.

Análisis de los residualesObservación Pronóstico para Y Residuos Residuos estándares

1 9.138461538 -0.138461538 -0.101107641

2 3.276923077 1.723076923 1.258228423

3 6.207692308 0.792307692 0.578560391

4 15 -1 -0.730221853

5 12.06923077 -2.069230769 -1.510997526

6 44.30769231 0.692307692 0.505538206

Page 52: 17.regresión y correlación simple

En el gráfico siguiente, los residuos estandarizados fueron graficados en función de la variable independiente (cantidad del complemento nutricional). Se puede observar de que existe una dispersión amplia en la gráfica de residuos, no existe un patrón evidente o una relación entre los residuos estandarizados y Xi . Los residuos parecen estar equitativamente distribuidos por arriba y por debajo de 0, para diferentes valores de X. Podemos concluir que el modelo ajustado parece ser adecuado.

Page 53: 17.regresión y correlación simple

Residuos estándares

-2

-1.5

-1

-0.5

0

0.5

1

1.5

0 5 10 15 20

Page 54: 17.regresión y correlación simple

B. Evaluación de las suposiciones

a. Homoscedasticidad

b. Normalidad

c. Independencia:

Page 55: 17.regresión y correlación simple

17.7 Medición de la autocorrelación: Durbin-Watson Una de las suposiciones del modelo de regresión

básico es la independencia de los residuos. Esta suposición es violada con frecuencia cuando los datos son recopilados en periodos secuenciales, debido a que un residuo en cualquier punto del tiempo puede tender a ser parecido a los residuos que se encuentran en puntos de tiempo adyacentes. El estadístico D de Durbin-Watson mide la correlación de cada residuo y el residuo del periodo inmediato anterior al periodo de interés.

Page 56: 17.regresión y correlación simple

El estadístico D (Durbin-Watson)

En la que representa el residuo en el periodo i.

n

1i

2i

n

2i

21ii

D

i

Page 57: 17.regresión y correlación simple

Interpretación de D:

Cuando residuos sucesivos están correlacionados positivamente, el valor de D se aproximará a cero.

Si los resultados no están correlacionados, el valor D estará cercano a 2.

Si se presentase una autocorrelación negativa, lo cual rara vez sucede, de valor D tomará un valor mayor a 2 e, incluso podría aproximarse a su valor máximo que es 4.

Page 58: 17.regresión y correlación simple

Los resultados de SPSS nos proporciona el valor de D de Durbin-Watson

Model Summaryb

.707a 19.336 1 8 .002 1.517Model1

R SquareChange F Change df1 df2 Sig. F Change

Change Statistics

Durbin-Watson

Predictors: (Constant), Complementoa.

Dependent Variable: AUMENTOb.

Según este resultado permite afirmar que los residuos no están correlacionados.

Page 59: 17.regresión y correlación simple

17.8 Estimación por intervalosA.Intervalo de confianza para 1

b1 N

Lo que se va hacer es estimar

se estima mediante la siguiente formula:

x

2

1 SC,

t

SC

Sb

Sb

x

yx

11

b

11

1

x

2

SC desconocido

conocido

2

2n

SCbn

YY

S

x21

n

1i

2

2

2yx

Page 60: 17.regresión y correlación simple

-t0 t0

1t

SC

Sb

tPr

)tttPr(

0

x

yx

110

00

1SC

Stb

SC

StbPr

x

yx011

x

yx01

Page 61: 17.regresión y correlación simple

B. Intervalo de confianza para 0

x

22

00 SCx

n1

,b

2n

x

2

yx

00

b

00 t

SCx

n1

S

bS

b

0

2n

SCbn

YY

S

x2

2

2

2yx

0

donde:

Page 62: 17.regresión y correlación simple

-t0 t0

1tS

btPr

)tttPr(

0b

000

00

0

1StbStbPr00 b000b00

t0 con (n-2) grados de libertad y

Page 63: 17.regresión y correlación simple

Y/XC. Intervalo de confianza para

0

x

2

02X/y SC

XXn1

,NY0

Para un nivel dado de confianza, una variación aumentada alrededor de la línea de regresión, medida a través del error estándar de la estimación, tiene como resultado un intervalo más amplio.

Page 64: 17.regresión y correlación simple

1StyStyPr y0X/yy0 0

x

2

02yxy SC

xXn1

SS

donde:

Sin embargo, como se esperaría, un tamaño de muestra aumentado reduce el ancho del intervalo.

Page 65: 17.regresión y correlación simple

D. Intervalo de confianza para un valor individual

x

2

02X/y SC

XXn1

1,NY0

Además de obtener una estimación de intervalo de confianza para el valor promedio, a menudo es importante tener la capacidad de predecir la respuesta que se obtendría para un valor individual.

Page 66: 17.regresión y correlación simple

1StyStyPr y0X/Yy0 0

x

2

02yxy SC

xXn1

1SS

donde:

El intervalo de predicción está estimando un valor individual, no un parámetro.

Page 67: 17.regresión y correlación simple

SCtotal = SCerror + SCregresión

(SCresidual)

17.9 Análisis de varianza de la regresión simple

El análisis de varianza es una técnica que permite localizar las fuentes de variabilidad que ayuden a explicar el comportamiento de la variable dependiente.

Page 68: 17.regresión y correlación simple

El cuadro de Análisis de Varianza

Fuentes de variabilidad

Suma de Cuadrados GL

Cuadrado Medio

F calculado E(CMe)

Debido a la Regresión        

Error Experimental        

Total 

X2SCb

x

21

2

2 SCbn

YY

totalSC

1

2n

1n

x21SCb

2yxS

2yx

x21

SSCb

x21

2 SC

2

Page 69: 17.regresión y correlación simple

A.La ecuación de regresión e interprete los coeficientes de regresión.

B.El intervalo de confianza para 1y para un valor individual si X = 3,8.

C.El cuadro de ANOVA para la regresión lineal

D.El valor de cuando X = 5,1

E.La prueba de hipótesis respectiva a partir del ANOVA e interprete el resultado.

F.Estime el aumento de peso que puede darse se consumen 6 Kg. del complemento nutricional mediante un intervalo e interprete el resultado.

y

Asumiendo que existe una regresión lineal, determine:

Page 70: 17.regresión y correlación simple

SoluciónPrimero se realizan los cálculos necesarios:

A. Cálculo de los coeficientes de regresión:

442YX

1660Y

25,126X

126Y

5,32X10n

ii

2i

2i

i

i

49,7)25,3)(57,1(6,12b

57,162,205,32

105,32

25,126

101265,32

442

n

XX

n

YXYX

b

XbYb

XbbY

0

2

i2i

iiii

1

10

10

Page 71: 17.regresión y correlación simple

La ecuación de regresión será:

Interpretación:

b0= Se espera que el peso que un niño que no consume este complemento nutricional sea 7,49 Kg.

b1= Por cada Kg. de complemento nutricional, el peso del niño se incrementará en 1,57 Kg.

X57,149,7Y

Page 72: 17.regresión y correlación simple

B. Intervalo de confianza para 1

10,01SC

St57,1

SC

St57,1Pr

x

yx810,01

x

yx810,0

90,054,4

S86,157,1

54,4

S86,157,1Pr yx

1yx

642,1S

69,28

82,507,728

62,2057,110

1261660

S

yx

22

2yx

Page 73: 17.regresión y correlación simple

90,02427,28973,0Pr

90,054,4

642,186,157,1

54,4642,1

86,157,1Pr

1

1

Interpretación: Hay 0,90 de confianza que el intervalo que se ha construido, pertenezca al grupo de intervalos que contienen al verdadero parámetro 1.

Page 74: 17.regresión y correlación simple

1S)86,1(45,13YS)86,1(45,13Pr YindY

62,20

25,380,3101

1642,1S2

Y

Interpretación

Intervalo de confianza para un valor individual Si X = 3,8 entonces 45,13Y

1StYYStYPr Y0indY0

Page 75: 17.regresión y correlación simple

C. Análisis de Varianza

Fuentes de variabilidad

Suma de Cuadrados GL

Cuadrado Medio

F calculado E(CMe)

Debido a la Regresión  50,82 1 50,82  18,84  

Error Experimental  21,58 8  2,697    

Total72,40  9

Interpretación: Se rechaza la hipótesis planteada. El complemento nutricional si explica significativamente los cambios en el peso de los niños.

Page 76: 17.regresión y correlación simple

D. Si X = 5,1

14,16Y)51,5(57,149,7Y

E. Prueba de Hipótesis acerca de 1

1. Hp: 1= 0

Ha: 1 0 2. = 0,10

3. error

regresiónc CMe

CMeF

Page 77: 17.regresión y correlación simple

F1-/2 F/2

Supuestos- La muestra seleccionada al azar- La población se distribuye al azar- Los valores de X fijas y de Y variables (o

aleatorias)- Asunciones de la regresión lineal simple

4. Criterios de decisión

0,0041 5,32

Si se rechaza la hipótesis planteada 0041,0F32,5 c

Page 78: 17.regresión y correlación simple

5. Cálculos

6. Conclusiones La variable “complemento nutricional” es

apropiada para explicar el comportamiento del “aumento de peso” en niños desnutridos. Además, la ecuación de regresión puede ser usada con fines de predicción hasta cierto límite.

84,18697,2

82,50Fc

Page 79: 17.regresión y correlación simple

F. ¿ Para X = 6, que promedio de Y vamos a obtener?

1S86,191,16S86,191,16Pr YXYY 0

Page 80: 17.regresión y correlación simple

Estadísticas de la regresión

Coeficiente de correlación múltiple 0.99582747

Coeficiente de determinación R^2 0.99167236

R^2 ajustado 0.98959045

Error típico 1.5310881

Observaciones   6

ANÁLISIS DE VARIANZA

  GL SC CMe F cal P-valor

Regresión 1 1116.62308 1116.62308 476.328138 2.60786E-05

Residuos 4 9.37692308 2.34423077    

Total 5 1126      

 

Coeficientes

Error típico

Estadístico t P-valor

Inferior 95%

Superior 95%

Inferior 95.0%

Superior 95.0%

Intercepción 0.346154 0.9173433 0.37734384 0.72508508 -2.200804756 2.893112448 -2.200804756 2.893112448

Variable X 1 2.930769 0.13428531 21.824943 2.6079E-05 2.557932668 3.303605794 2.557932668 3.303605794

17.10 Resultados con Excel

Page 81: 17.regresión y correlación simple

Ejemplo:

En la Farmacia Santa Rita, se desea determinar la relación lineal simple entre la experiencia del vendedor y las ventas durante un mes. Se seleccionan 5 vendedores, los datos registrados se presentan a continuación:

VENDEDOR CARLOS PEDRO JOSE JUAN MANUELEXPERIENCIA (años):X 3 1 2 5 4VENTAS (unidades) : Y 9 5 7 14 10

Page 82: 17.regresión y correlación simple

Un equipo de profesionales en salud mental de un hospital psiquiátrico donde el tiempo de permanencia es largo, quiere medir el nivel de respuesta de pacientes retraídos mediante un programa de terapia de remotivación. Para este propósito se contaba con una prueba estandarizada, que era costosa y su aplicación tomaba mucho tiempo. Para salvar este obstáculo, el equipo creó una prueba más fácil de aplicar.

Caso 1

Page 83: 17.regresión y correlación simple

Para probar la utilidad de este nuevo instrumento para medir el nivel de respuesta del paciente, el equipo decidió examinar la relación entre las calificaciones obtenidas con la nueva prueba y las calificaciones obtenidas con la prueba estandarizada.

Paciente 1 2 3 4 5 6 7 8 9 10 11

Prueba nueva 50 55 60 65 70 75 80 85 90 95 100

Prueba estandar 61 61 59 71 80 76 90 106 98 100 114

Page 84: 17.regresión y correlación simple

Caso 2

Se llevo a cabo un experimento para estudiar el efecto de cierto medicamento para disminuir la frecuencia cardiaca en adultos. Se reunieron los siguientes datos: dosis en miligramos del medicamento y la diferencia entre la frecuencia cardiaca mas baja después de la administración del medicamento y un control antes de administrarlo.

Page 85: 17.regresión y correlación simple

Dosis (mg) 1 1 1 1 2 2 2 2 3 3 3 3Reduccion ritmo cardiaco 10 8 12 12 14 12 16 18 17 20 18 20

Determine la ecuación de regresión lineal y explique el valor de los coeficientes de regresión. Calcule e interprete el coeficiente de correlación y el coeficiente de determinación.

Page 86: 17.regresión y correlación simple

Hoja de Comprobación

1. El análisis de regresión se usa para describir que tan bien una ecuación de estimación describe la relación que está estudiando

2. Dado que la ecuación para una línea es Y = 26 - 24X, podemos decir que la relación Y con X es directa y lineal

3. Un valor r2 cercano a cero indica una fuerte correlación entre X y Y

Page 87: 17.regresión y correlación simple

4. Los análisis de regresión y correlación se usan para determinar relaciones de causa y efecto

5. El coeficiente de correlación de muestra, r, no es nada más quey no podemos interpretar su significado directamente como un porcentaje del mismo tipo

6. El error estándar de la estimación mide la variabilidad de los valores observados alrededor de la ecuación de regresión.

7. La línea de regresión se deriva de una muestra y no de toda la población

2r

Page 88: 17.regresión y correlación simple

8. Podemos interpretar el coeficiente de determinación de muestra como la cantidad de la variación en Y que es explicada por la línea de regresión

9. Las líneas trazadas a cada lado de la línea de regresión a 1, 2 y 3 veces el valor del error estándar de la estimación se denominan líneas de confianza

10.La ecuación de estimación es válida sólo sobre el mismo intervalo que el dado por los datos originales de muestra sobre los cuales se desarrolló

11.En al ecuación Y = a + bX para la variable dependiente Y y la variable independiente X, la intersección Y es b.

Page 89: 17.regresión y correlación simple

12.Si una línea se ajusta a un conjunto de puntos mediante el método de mínimos cuadrados, los errores individuales positivos y negativos desde la línea suman cero.

13. Si Se = 0 para una ecuación de estimación, debe estimar perfectamente la variable dependiente en los puntos observados

14.Supongamos que la pendiente de una ecuación de estimación es positiva. Entonces el valor de r debe ser la raiz cuadrada positiva de r2

Page 90: 17.regresión y correlación simple

15.Si r = 0.8, entonces la ecuación de regresión explica 80% de la variación total en la variable dependiente

16.El coeficiente de correlación es el porcentaje de la variación total de la variable dependiente que es explicada por la regresión

17.El error estándar de la estimación es medido perpendicularmente desde la línea de regresión más que sobre el eje X

18.Al cuadrar los errores individuales, el método de mínimos cuadrados magnidica todas las desviaciones desde la línea de regresión estimada

Page 91: 17.regresión y correlación simple

19. Una ecuación de regresión no puede ser válida al ampliarse fuera del intervalo de muestra de la variable independiente

20. Un valor r2 implica que no existe una relación de causa-efecto significativa entre X y Y

21. Una valor pequeño de r2 implica que no existe una relación de causa-efecto significativa entre X y Y