regresión mínimo cuadrada (i) estadística descriptiva y analisis de datos con la hoja de cálculo...
TRANSCRIPT
Regresión mínimo cuadrada (I)
Estadística Descriptiva y Analisis de Datos con la Hoja de Cálculo Excel
Funciones lineales simples
• Forma de la función: Yt=0+1Xt+et
• Variable dependiente, endógena o a explicar: Yt
• Variable independiente, exógena o explicativa: Xt
• Error aleatorio: et
• Parámetros ó coeficientes: 0 (termino independiente) y 1.
Mínimos Cuadrados Ordinarios
n
i
n
iiii
n
iii XbaYYYeMin
1 1
22
1
2 )ˆˆ()ˆ(
XbYa
XX
YYXXb n
ii
n
iii
1
2
1
)(
))((
Ejemplo 5.1
Año Yt Xt
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
10
12
13
14
15
17
20
21
22
20
19
18
16
15
15
14
14
13
12
13
Calculo MCO
Y t X t )( YY i )( XX i )( YY i · )( XX i 2)( XX i 2)( YY i
1 0 1 9 -6 ,4 4 ,1 -2 6 ,2 4 1 6 ,8 1 4 0 ,9 6
1 2 1 8 -4 ,4 3 ,1 -1 3 ,6 4 9 ,6 1 1 9 ,3 6
1 3 1 6 -3 ,4 1 ,1 -3 ,7 4 1 ,2 1 1 1 ,5 6
1 4 1 5 -2 ,4 0 ,1 -0 ,2 4 0 ,0 1 5 ,7 6
1 5 1 5 -1 ,4 0 ,1 -0 ,1 4 0 ,0 1 1 ,9 6
1 7 1 4 0 ,6 -0 ,9 -0 ,5 4 0 ,8 1 0 ,3 6
2 0 1 4 3 ,6 -0 ,9 -3 ,2 4 0 ,8 1 1 2 ,9 6
2 1 1 3 4 ,6 -1 ,9 -8 ,7 4 3 ,6 1 2 1 ,1 6
2 2 1 2 5 ,6 -2 ,9 -1 6 ,2 4 8 ,4 1 3 1 ,3 6
2 0 1 3 3 ,6 -1 ,9 -6 ,8 4 3 ,6 1 1 2 ,9 6
T o ta l 1 6 4 1 4 9 0 0 -7 9 ,6 4 4 ,9 1 5 8 ,4
M e d ia 1 6 ,4 1 4 ,9 0 0
Solución MCO
82.42)9.14·7728.1(4.16
7728.19.44
6.79
)(
))((
1
2
1
XbYa
XX
YYXXb n
ii
n
iii
Regresión Lineal: MCO
y = -1,7728x + 42,815
R2 = 0,8909
0
5
10
15
20
25
0 5 10 15 20
X
Y
Errores MCO
• La esperanza matemática de et es cero, tal que E(et) = 0
• La covarianza entre ei y ej es nula : E(ei·ej) = 0
• La matriz de varianzas y covarianzas del término de error debe ser escalar tal que Var(ei) = 2I, i=1,…,n, donde I es la matriz unidad
Errores aleatorios:representación
gráfica
100 numeros aleatorios media 0 desviación estandar 0,1
-0,3-0,2-0,1
00,10,20,3
Errores aleatorios: Histograma
1000 datos aletorios de media 0 y varianza 0,1
0102030405060708090
100
Errores aleatorios: distribución de frecuencias
Clase Frecuencia % acumulado-0,3487221 1 ,10%
-0,32754014 0 ,10%-0,30635819 3 ,40%-0,28517623 0 ,40%-0,26399427 1 ,50%-0,24281232 4 ,90%-0,22163036 4 1,30%-0,20044841 7 2,00%-0,17926645 13 3,30%-0,1580845 23 5,60%
-0,13690254 29 8,50%-0,11572059 53 13,80%-0,09453863 56 19,40%-0,07335667 61 25,50%-0,05217472 69 32,40%-0,03099276 73 39,70%-0,00981081 72 46,90%0,01137115 80 54,90%0,0325531 95 64,40%
0,05373506 57 70,10%0,07491701 68 76,90%0,09609897 48 81,70%0,11728093 56 87,30%0,13846288 41 91,40%0,15964484 28 94,20%0,18082679 23 96,50%0,20200875 12 97,70%0,2231907 10 98,70%
0,24437266 4 99,10%0,26555462 4 99,50%0,28673657 1 99,60%
y mayor... 4 100,00%
Errores ejemplo 5.1
iYˆiii YYe ˆ
9 . 1 3 1 4 0 3 1 2 0 . 8 6 8 5 9 6 8 8
1 0 . 9 0 4 2 3 1 6 1 . 0 9 5 7 6 8 3 7
1 4 . 4 4 9 8 8 8 6 - 1 . 4 4 9 8 8 8 6 4
1 6 . 2 2 2 7 1 7 1 - 2 . 2 2 2 7 1 7 1 5
1 6 . 2 2 2 7 1 7 1 - 1 . 2 2 2 7 1 7 1 5
1 7 . 9 9 5 5 4 5 7 - 0 . 9 9 5 5 4 5 6 6
1 7 . 9 9 5 5 4 5 7 2 . 0 0 4 4 5 4 3 4
1 9 . 7 6 8 3 7 4 2 1 . 2 3 1 6 2 5 8 4
2 1 . 5 4 1 2 0 2 7 0 . 4 5 8 7 9 7 3 3
1 9 . 7 6 8 3 7 4 2 0 . 2 3 1 6 2 5 8 4
Sumas de cuadrados
• SCT: es la Suma de Cuadrados Totales y representa una medida de la variación de la variable dependiente.
• SCE: es la Suma de Cuadrados Explicados por el modelo de regresión.
• SCR: es la Suma de Cuadrados de los Errores
2
1
22' YnYYnYYSCTn
i
2'' YnYXSCE
SCESCTYXYYeSCRn
ii
'''1
2
Bondad de Ajuste: R2
SCT
SCRR 12
22 11
11
1 Rkn
n
nSCT
knSCRR
Bondad de ajuste. Ejemplo 5.1
8909,04,158
28,17112
SCT
SCRR
Y2 Y*Y e2
1988 100 91,3140312 0,754460541989 144 130,85078 1,200708331990 169 187,848552 2,102177071991 196 227,11804 4,940471531992 225 243,340757 1,495037231993 289 305,924276 0,991111161994 400 359,910913 4,017837211995 441 415,135857 1,51690221996 484 473,906459 0,210494991997 400 395,367483 0,05365053
Total 2848 2830,71715 17,2828508SC 158,4 141,117149 17,2828508
Intervalos de confianza (I)
Intervalos de confianza (II)
• Si X está normalmente distribuido sabemos que 1- está especificado. Por ejemplo, si 1- = 0,95 entonces el valor de k es igual a 1,96, de manera que, tras hacer una operación algebraica expresamos la anterior igualdad como:
• y decimos que la probabilidad de que el parámetro desconocido esté entre los puntos
95,0]96,196,1[
n
Xn
XP
_
,X n 1 96
y
Xn
1 96,
es igual a 0,95.
Intervalos de confianza i (I)
)ˆ(: kni tSICii
12ˆˆ ' XXSS e
1
21)'(
XX
XnXX
kn
eS
n
ii
e 1
2
2
Intervalos de confianza i (II)
22
22ˆ1 XXn
nSS
ie
22
222
ˆXXn
XSS
ioe
Intervalos de confianza. Ejemplo 5.1(I)
1
1
2265149
14910)'(
XX
22,0449
1016,22
ˆ1
S
30,3449
226516,22
ˆ0
S
Intervalos de confianza. Ejemplo 5.1(II)
Coeficientes Error típico Estadístico t Inferior 95% Superior 95%Inferior 95,0%
Superior 95,0%
o 42,815 3,301 12,970 35,203 50,428 35,203 50,428
1 -1,773 0,219 -8,082 -2,279 -1,267 -2,279 -1,267
Predicción
• Predicción individual: se trata de hallar el valor estimado para la variable Y un periodo hacia delante: Yt+1=0+1Xt+1
• Intervalos de predicción para un valor medio o esperado. La expresión a utilizar en este caso será:
1
1'111
1'11 'Y; 'ˆ:
1 ttkntttkntYE XXXXStXXXXStYICt
Predicción ejemplo 5.1
• Para X’t+1=(1,21); Yt+1=+42,8*(1)-1,77*(21)=5,59
• Intervalo:– Se=1,46
– Xt+1' (X'X)Xt+1=0,93
– t0,025;8=2,3
– Intervalo (8,84-2,33)