problemas resueltos regresion

3
ÁREA DE ESTADÍSTICA Inga. María Eugenia Aguilar REGRESIÓN Y CORRELACION LINEAL 1. Al estudiar los efectos de la herencia y el entorno sobre la inteligencia, ha resultado útil analizar los puntajes de cociente intelectual (IQ) de gemelos idénticos que fueron separados poco después de nacer. Los gemelos idénticos comparten los mismos genes heredados del mismo óvulo fertilizado. Al estudiar gemelos idénticos que se criaron separados, podemos eliminar la variable de la herencia y aislar mejor los efectos del entorno. En la tabla adjunta se muestran los puntajes de IQ de gemelos idénticos (los gemelos mayores son x) que se criaron separados. Use los datos de muestra para determinar si existe una relación entre los puntajes de IQ de los gemelos. X 107 96 103 90 96 113 86 99 109 105 96 89 Y 111 97 116 107 99 111 85 108 102 105 103 93 Basado en datos de “IQs of Identical Twins Reares Apart”, por Arthur Jensen Behavioral Genetics. Por medio de la opción Análisis de Datos de Excel se obtiene el siguiente despliegue: En estadística de la regresión se muestran los valores de la correlación: Correlación lineal = R = 0.6941 Determinación = R 2 = 0.4818 Estos valores se interpretan de la siguiente manera: El modelo es lineal en un 69.41% lo que significa que la variable Y se relaciona con la X en un 69.41%. El modelo tiene un grado de ajuste de 0.4818, es decir que es útil en un 48.18%, o dicho de otra forma, el 48.18% de los valores de Y pueden predecirse correctamente a través de la equis. En la tabla de abajo se muestran los coeficientes para el modelo: Y = 33.0122 + 0.7071X Dando respuesta al problema, puede decirse que existe poca relación entre los puntajes de IQ de los gemelos. Resumen Estadísticas de la regresión Coeficiente de correlación múltiple 0.694118972 Coeficiente de determinación R^2 0.481801147 R^2 ajustado 0.429981262 Error típico 6.514304855 Observaciones 12 ANÁLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F Regresión 1 394.5549893 394.5549893 9.297611219 0.01226848 Residuos 10 424.3616774 42.43616774 Total 11 818.9166667 Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Intercepción 33.01225309 23.05697898 1.431768364 0.182714755 -18.36189738 84.38640355 X 0.707193409 0.231927642 3.049198455 0.01226848 0.19042642 1.223960397

Upload: pablo-jose

Post on 07-Nov-2015

29 views

Category:

Documents


3 download

DESCRIPTION

se presentan ejemplos de regresion lineal utilizados en el analisis estadistico y probabilistico

TRANSCRIPT

  • REA DE ESTADSTICA Inga. Mara Eugenia Aguilar

    REGRESIN Y CORRELACION LINEAL

    1. Al estudiar los efectos de la herencia y el entorno sobre la inteligencia, ha resultado til analizar los puntajes de cociente intelectual (IQ) de gemelos idnticos que fueron separados poco despus de nacer. Los gemelos idnticos comparten los mismos genes heredados del mismo vulo fertilizado. Al estudiar gemelos idnticos que se criaron separados, podemos eliminar la variable de la herencia y aislar mejor los efectos del entorno. En la tabla adjunta se muestran los puntajes de IQ de gemelos idnticos (los gemelos mayores son x) que se criaron separados. Use los datos de muestra para determinar si existe una relacin entre los puntajes de IQ de los gemelos.

    X 107 96 103 90 96 113 86 99 109 105 96 89 Y 111 97 116 107 99 111 85 108 102 105 103 93

    Basado en datos de IQs of Identical Twins Reares Apart, por Arthur Jensen Behavioral Genetics. Por medio de la opcin Anlisis de Datos de Excel se obtiene el siguiente despliegue:

    En estadstica de la regresin se muestran los valores de la correlacin: Correlacin lineal = R = 0.6941 Determinacin = R2 = 0.4818 Estos valores se interpretan de la siguiente manera: El modelo es lineal en un 69.41% lo que significa que la variable Y se relaciona con la X en un 69.41%. El modelo tiene un grado de ajuste de 0.4818, es decir que es til en un 48.18%, o dicho de otra forma, el 48.18% de los valores de Y pueden predecirse correctamente a travs de la equis. En la tabla de abajo se muestran los coeficientes para el modelo: Y = 33.0122 + 0.7071X Dando respuesta al problema, puede decirse que existe poca relacin entre los puntajes de IQ de los gemelos.

    Resumen

    Estadsticas de la regresinCoeficiente de correlacin mltiple 0.694118972Coeficiente de determinacin R^2 0.481801147R^2 ajustado 0.429981262Error tpico 6.514304855Observaciones 12

    ANLISIS DE VARIANZAGrados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crtico de F

    Regresin 1 394.5549893 394.5549893 9.297611219 0.01226848Residuos 10 424.3616774 42.43616774Total 11 818.9166667

    Coeficientes Error tpico Estadstico t Probabilidad Inferior 95% Superior 95%Intercepcin 33.01225309 23.05697898 1.431768364 0.182714755 -18.36189738 84.38640355X 0.707193409 0.231927642 3.049198455 0.01226848 0.19042642 1.223960397

  • 2. Se cree que la energa elctrica consumida cada mes en cientos de Kw-hora por una planta qumica est relacionada con la temperatura ambiental promedio X1, el nmero de das del mes X2, la pureza promedio del producto X3 y las toneladas fabricadas del producto X4. Se dispone de datos histricos que se presentan en tabla 1. a. Calcule el modelo de regresin lineal. b. Prediga el consumo de energa para un mes en que X1 = 75F, X2 = 24 das, X3 = 90% y X4 = 98

    toneladas c. Estime S del modelo d. Calcule e interprete los coeficientes R y R2.

    TABLA 1 Y X1 X2 X3 X4

    240 25 24 91 100 236 31 21 90 95 290 45 24 88 110 274 60 25 87 88 301 65 25 91 94 316 72 26 94 99 300 80 25 87 97 296 84 25 86 96 267 75 24 88 110 276 60 25 91 105 288 50 25 90 100 261 38 23 89 98

    Por medio de la opcin Anlisis de Datos de Excel se obtiene el siguiente despliegue:

    a. El modelo est dado por: Y = -1025.7132 + 0.6053X1 +8.9836X2 + 1.1374X3 + 0.0136X4. b. Y cuando X1 = 75F, X2 = 24 das, X3 = 90% y X4 = 98 toneladas. Y = 287.5618 cientos de Kw-hora. c. S = 15.57 d. Correlacin lineal = R = 0.8629 Determinacin = R2 = 0.7447 El modelo es lineal en un 86.29% lo que significa que la variable Y se relaciona con las equis en un 86.69%. El modelo tiene un grado de ajuste de 0.7447, es decir que es til en un 74.47%, o dicho de otra forma, el 74.47% de los valores de Y (consumo) pueden predecirse correctamente a travs de la equis.

    Resumen

    Estadsticas de la regresinCoeficiente de correlacin mltiple 0.862988866Coeficiente de determinacin R^2 0.744749783R^2 ajustado 0.598892516Error tpico 15.57933272Observaciones 12

    ANLISIS DE VARIANZAGrados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crtico de F

    Regresin 4 4957.240744 1239.310186 5.10601768 0.030302769Residuos 7 1699.009256 242.7156081Total 11 6656.25

    Coeficientes Error tpico Estadstico t Probabilidad Inferior 95% Superior 95%Intercepcin -102.7132364 207.8588509 -0.494148967 0.636328637 -594.221316 388.7948432X1 0.605370537 0.368896954 1.641028833 0.144796622 -0.266932145 1.47767322X2 8.923644198 5.300522238 1.683540564 0.136145668 -3.61009923 21.45738763X3 1.437456733 2.391620508 0.601038806 0.566759239 -4.217827118 7.092740585X4 0.013609308 0.733821444 0.018545803 0.985720985 -1.721602674 1.748821289

  • 3. Una corporacin ha estado buscando los factores que influyen en la cantidad de acero (en millones de toneladas) que puede vender cada ao. La administracin sospecha que los siguientes son los factores principales: la tasa anual de inflacin del pas, el precio promedio por tonelada del acero importado que acota los precios (en dlares) y el nmero de automviles (en millones) que los fabricantes de autos de Estados Unidos planean producir ese ao. Se recolectaron los datos de los ltimos siete aos:

    Millones de Tasa de Cota de Nmero Toneladas inflacin importaciones de Ao Vendidas Automviles 2002 4.2 3.1 3.10 6.2 2003 3.1 3.9 5.00 5.1 2004 4.0 7.5 2.20 5.7 2005 4.7 10.7 4.50 7.1 2006 4.3 15.5 4.35 6.5 2008 3.7 13.0 2.60 6.1 2009 3.5 11.0 3.05 5.9

    En base a la informacin de los aos 2002 a 2009: a. Calcule el modelo de regresin lineal que representa el comportamiento de las toneladas vendidas anualmente en funcin de las dems variables. b. Estime el valor de . c. Estime e interprete los coeficientes de correlacin y determinacin. Por medio de la opcin Anlisis de Datos de Excel se obtiene el siguiente despliegue:

    a. El modelo est dado por: Y = -1.049 - 0.0282X1 0.0505X2 + 0.8903X3 b. La estimacin de es S. S = 0.2772 c. Correlacin lineal = R = 0.9311 Determinacin = R2 = 0.8669 El modelo es lineal en un 93.11% lo que significa que la variable Y se relaciona con las equis en un 93.11%. El modelo tiene un grado de ajuste de 0.8669, es decir que es til en un 86.69%, o dicho de otra forma, el 86.69% de los valores de Y (toneladas vendidas) pueden predecirse correctamente a travs de la equis.

    Resumen

    Estadsticas de la regresinCoeficiente de correlacin mltiple 0.931128159Coeficiente de determinacin R^2 0.866999649R^2 ajustado 0.733999298Error tpico 0.277284817Observaciones 7

    ANLISIS DE VARIANZAGrados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crtico de F

    Regresin 3 1.503625106 0.501208369 6.518777157 0.078975386Residuos 3 0.230660609 0.07688687Total 6 1.734285714

    Coeficientes Error tpico Estadstico t Probabilidad Inferior 95% Superior 95%Intercepcin -1.049030449 1.194367423 -0.878314687 0.444435936 -4.850040641 2.751979742inflacin -0.028228867 0.028818842 -0.979528141 0.399554203 -0.119943284 0.063485551cota -0.05084386 0.107167915 -0.474431738 0.667587754 -0.391899995 0.290212275Automviles 0.890388464 0.212762351 4.184896707 0.024868082 0.213283705 1.567493223