09 regresion y correlacion lineal simple

Upload: francisco-javier-espitia-romero

Post on 06-Jul-2018

2.251 views

Category:

Documents


23 download

TRANSCRIPT

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    1/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    Regresión y Correlación lineal simple es el noveno fascículo, de una serie deguías de estudio en las que se desarrollan los temas de los programas de lasasignaturas del área de Probabilidad y Estadística, así como temas selectosque complementan el aprendizaje de de esta disciplina. Tienen lacaracterística de que el estudiante adquiera sólo aquella que trate el temaque necesite reforzar o el que sea de su propio interés.

    Estas guías de estudio pretenden reorientar y actualizar el enfoque con el quese debe abordar el estudio de los métodos estadísticos, despertando lainquietud por aprender y resolver los problemas y casos planteados.

    Cada guía integra el desarrollo del tema con ejercicios, casos de estudio y conla sección llamada Aprendiendo.com. En esta última sección se le proporcionaal estudiante un ambiente interactivo, utilizando los recursos disponibles enInternet, de tal forma que los casos planteados los desarrolle en ambientes

    de aprendizaje que le permitan encontrarse con el conocimiento,“manipularlo”, hacerlo suyo. Con esta filosofía se utilizan applets, sitios deinternet con acceso a bases de datos reales, software de uso libre y engeneral los recursos de la Web 2.0, que se refieren a una segunda generaciónen la historia de la Web basada en comunidades de usuarios, que fomentan lacolaboración y el intercambio ágil de información entre los mismos.

    Nuestro reconocimiento a la Dirección General de Asuntos del PersonalAcadémico de nuestra Casa de Estudios, que a través del Programa de Apoyoa Proyectos para la Innovación y Mejoramiento de la Enseñanza (PAPIME) ha

    apoyado nuestro proyecto “Implantación de un Laboratorio Virtual deEstadística y Elaboración de las Guías de Estudio con Soporte Multimedia”clave PE302709.

    Los Autores

    PRESENTACIÓN

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    2/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

    Es común que las personas tomen decisiones personales y profesionalesbasadas en predicciones de sucesos futuros. Para hacer estos pronósticos, sebasan en la relación intuitiva y calculada entre lo que ya se sabe y lo que sedebe estimar. Si los responsables de la toma de decisiones puedendeterminar cómo lo conocido se relaciona con un evento futuro, puedenayudar considerablemente al proceso de toma de decisiones.

    Cualquier método estadístico que busque establecer una ecuación quepermita estimar el valor desconocido de una variable a partir del valor

    conocido de una o más variables, se denomina análisis de regresión.

    Los análisis de regresión y correlación mostrarán como determinar lanaturaleza y la fuerza de una relación entre dos variables.

    El término  regresión fue utilizado por primera vez por el genetista yestadístico inglés Francis Galton (1822-1911) en 1877 Galton efectúo unestudio que demostró que la altura d los hijos de padres altos tendía aretroceder, o “regresar”, hacia la talla media de la población. Regresión fue

    el nombre que le dio al proceso general de predecir una variable,(la talla delos niños) a partir de otra (la talla de los padres).

    Hoy en día, esta tendencia de miembros de cualquier población que estánen una posición extrema (arriba o debajo de la media poblacional) en unmomento, y luego en una posición menos extrema en otro momento, (ya seapor sí o por medio de sus descendientes), se llama efecto de regresión.

    El análisis de regresión se desarrolla una ecuación de estimación, es decir,una formula matemática que relaciona las variables conocidas con lasdesconocidas. Luego de obtener el patrón de dicha relación, se aplica elanálisis de correlación para determinar el grado de relación que hay entre lasvariables.

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    3/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    REGRESIÓN LINEAL SIMPLE

    “Una técnica estadística que establece una ecuación para estimar elvalor desconocido de una variable, a partir del valor conocido de otravariable, (en vez de valores de muchas otras variables) se denomina análisisde regresión simple.”

    Por lo tanto el análisis de regresión lineal simple, es el proceso general depredecir una variable (Y) a partir de otra (X).

    Las relaciones entre las variables pueden ser directas o también inversas.

     Relación directa: la pendiente de esta línea es positiva, por que la variableY crece a medida que la variable X también lo hace.

     Relación inversa: La pendiente de esta línea es negativa, por que a medidaque aumenta el valor de la variable Y, el valor de la variable X disminuye.

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    4/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    VARIABLE INDEPENDIENTE (X)

    En el análisis de regresión una variable cuyo valor se suponga conocido yque se utilice para explicar o predecir el valor de otra variable de interés sellama variable independiente; se simboliza con la letra X.

    Otros nombres alternativos para la variable independiente (X), sonvariable explicatoria, variable predictora y en ocasiones variable regresora.

    VARIABLE DEPENDIENTE (Y)

    En el análisis de regresión una variable cuyo valor se suponga desconocidoy que se explique o prediga con ayuda de otra se llama variable dependiente y se simboliza con la letra Y.

    La variable dependiente, al igual que la variable independiente es llamadade diferentes maneras algunas de ellas son: variable explicada o variablepronosticada.

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    5/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    DIAGRAMAS DE DISPERSIÓN 

    Un diagrama de dispersión  es una ilustración gráfica que se usa en elanálisis de regresión. Consta de una dispersión de puntos tal que cada puntorepresenta un valor de la variable independiente (medido a lo largo del ejehorizontal), y un valor asociado de la variable dependiente (medido a lo largodel eje vertical).

    El diagrama de dispersión, también llamado nube de puntos, brinda dostipos de información, visualmente se pueden determinar los patrones queindican como las variables están relacionadas (lineal o mediante una curva) ypor otro lado si existe una relación entre ellas visualizando la clase de línea o

    ecuación de estimación que describe a dicha relación.

    A continuación se ilustran algunas relaciones en los diagramas dedispersión:

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    6/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    METODO DE MINIMOS CUADRADOS

    El método que por lo común se utiliza para ajustar una línea a los datosmuestrales indicados en el diagrama de dispersión, se llama método demínimos cuadrados. La línea se deriva en forma tal que la suma de loscuadrados de las desviaciones verticales entre la línea y los puntosindividuales de datos se reduce al mínimo.

    El método de mínimos cuadrados sirve para determinar la recta quemejor se ajuste a los datos muestrales, y los supuestos de este método son:

     El error es cero. Los datos obtenidos de las muestra son estadísticamente independientes. La varianza del error es igual para todos los valores de X.

    Una línea de regresión calculada a partir de los datos muestrales, por elmétodo de mínimos cuadrados se llama línea de regresión estimada o líneade regresión muestral. 

    Dicha línea recta es la que mejor se ajusta al conjunto de datos (X, Y) y es

    aquella en que la distancia que hay entre los datos y la supuesta recta es lamenor posible, y se calcula mediante la siguiente formula:

    bxa y   +=ˆ  

     Para calcular el valor de b (pendiente), que representa el grado deinclinación que tiene la recta, se emplea la siguiente formula:

    22  xn x

     y xn xyb

    ∑−

    −=

     

     Para calcular el valor de a (ordenada al origen), que representa el puntoen que la recta corta al eje de las Y, se emplea la siguiente formula:

     xb ya   +=  

    Las variables a y b  son constantes numéricas que son las que se calculanmediante el método de mínimos cuadrados.

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    7/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    ERROR ESTANDAR DE ESTIMACIÓN

    El siguiente proceso que se necesita en el análisis de la regresión linealsimple es cómo medir la confiabilidad de la ecuación de estimación quehemos desarrollado.

    El error estándar de estimación mide la variabilidad o dispersión de losvalores observados alrededor de la línea de regresión y se representa comoSe. Su formula es la siguiente:

    ( ) ( )2

    2

    −•−•−=   ∑∑ ∑n

     xyb ya yS e  

    Cuanto mayor sea el error estándar de la estimación, más grande será ladispersión (o esparcimiento) de puntos alrededor de la línea de regresión.Por el contrario, si Se= 0, se espera que la ecuación de estimación sea unestimador “perfecto” de la variable dependiente, en este caso todos lospuntos caerían directamente sobre la línea de regresión y no habría puntosdispersos, como se muestra en la siguiente figura:

    El error estándar de estimación tiene la misma aplicación que de ladesviación estándar que se vio en los temas anteriores. Esto es, suponiendoque los puntos observados tienen una distribución normal alrededor de la

    recta de regresión, podemos esperar que:

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    8/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    •  68% de los puntos están dentro de ± 1se 

    •  95.5% de los puntos están dentro de ± 2se •  99.7% de los puntos están dentro de ± 3se 

    El error estándar de la estimación se mide a lo largo del eje “Y”, y noperpendicularmente desde la recta de regresión.

    Las suposiciones son:

    1. Los valores observados para Y tienen distribución normal alrededor

    de cada valor estimado de  ŷ  2. La varianza de las distribuciones alrededor de cada valor posible de

     ŷ es la misma.

    Si esta segunda suposición no fuera cierta, entonces el error estándar en unpunto de la recta de regresión podría diferir del error estándar en otro punto.

    PROCEDIMIENTO PARA REALIZAR UN ANÁLISIS DE REGRESIÓN LINEALSIMPLE

    1.  Obtención de los datos muestrales.

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    9/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    2.  Los datos obtenidos se tabulan. (tener cuidado en determinar

    correctamente quien es la variable independiente y dependiente)

    X Y

    3.  La información se gráfica en un diagrama de dispersión,estableciéndose la posible relación entre las dos variables

    4.  Se calcula la pendiente.

    ( )∑∑

    −=

    22  xn x

     y xn xyb

     

    5.  Se calcula la ordenada al origen.

     xb ya   +=  

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    10/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    6.  Se obtiene la ecuación que mejor se ajusta a la información obtenida.

    bxa y   +=ˆ  

    7.  Se traza la línea estimada en el diagrama de dispersión.

    8.  Se calcula el error estándar de estimación.

    ( ) ( )

    2

    2

    •−•−=

      ∑∑ ∑n

     xyb ya yS e  

    Por ejemplo:

    Una cadena de Pizzerías toma una muestra de diez de sus sucursalespara tratar de encontrar un modelo matemático que le permita predecir susventas y obtuvo los siguientes datos: la población de personas en miles fuede 2, 6, 8, 8, 12, 16, 20, 20, 22, 26; y las ventas trimestrales en miles de pesos

    fue de: 58, 105, 88, 118, 117, 137, 157, 169, 169, 149, 202.

     Realice una regresión para estimar las ventas de dos sucursales que tienen14,000 y 30,000 personas como potenciales clientes respectivamente.

    Solución

    Datosn=10

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    11/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    X: Población de personas en miles

    Y: Ventas trimestrales en miles de pesos

    1.  Tabular los datos obtenidos:Sucursal X Y

    1 2 58

    2 6 105

    3 8 88

    4 8 118

    5 12 117

    6 16 137

    7 20 1578 20 168

    9 22 149

    10 26 202

    2.  Graficar los datos en un diagrama de dispersión y determinar la posiblerelación entre las variables X Y.

    Se puede observar una relación lineal directa.

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    12/29

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    13/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    7.  Trazar la línea estimada.

    8.  Calcular el error estándar de estimación.

    ( ) ( )21.12

    210

    210405130060184393=

    •−•−=eS   

    Tiene un error de estimación de 12,210 pesos.

     Para una N = 14,0001 

    ( )

    ( )130,14

    13014560ˆ

    =+= y  

     Para una N = 30,000

    ( )( )210,30

    21030560ˆ

    =+= y  

    1 Recuerda que estamos trabajando con miles de pesos, en este ejercicio.

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    14/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    CORRELACIÓN SIMPLE

    Mientras que el análisis de regresión simple establece una ecuaciónprecisa que enlaza dos variables, el análisis de correlación es la herramientaestadística que podemos usar para describir el grado o fuerza en el que unavariable esta linealmente relacionada con otra.

    Dependiendo del tamaño de esta medida cuantitativa se puede decir, quetan cercanamente se mueven dos variables, y por lo tanto, con cuantaconfiabilidad se puede estimar una variable con ayuda de la otra.

    Una técnica estadística que establece un índice que proporciona, en unsolo número, una medida de la fuerza de asociación entre dos variables deinterés, se llama análisis de correlación simple.

    El análisis de correlación es la herramienta estadística de que nos valemospara describir el grado de relación que hay entre dos variables.

    A menudo el análisis de correlación simple se utiliza junto con el análisis deregresión lineal simple para medir la eficacia con que la línea de regresión

    explica la variación de la variable dependiente, Y.

    Diagramas de dispersión con correlación débil y fuerte.

    Existen dos medidas para describir la correlación entre dos variables: el 

    coeficiente de determinación y el coeficiente de correlación.

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    15/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    COEFICIENTE MUESTRAL DE DETERMINACIÓN

    La medida más importante de que también ajusta la línea de regresiónestimada en los datos muestrales en los que esta basada, es el coeficiente dedeterminación muestral, este es igual a la proporción de la variación total delos valores de la variable dependiente, “Y”, que puede explicarse por mediode la asociación de Y con X medida por la línea de regresión estimada.

    El coeficiente de determinación es la manera primaria de medir elgrado, o fuerza, de la relación que existe entre dos variables, X y Y.

    El coeficiente de determinación muestral se representa como r 2, y mideexclusivamente la fuerza de una relación lineal entre dos variables.

     El Calculo del coeficiente de determinación se lleva a cabo con la siguienteformula:

    ( ) ( )   ( )( )∑∑∑

    •−

    •−•+•

    = 22

    2

    2

     yn y

     yn xyb ya

    r   

    COEFICIENTE MUESTRAL DE CORRELACIÓN

    La raíz cuadrada del coeficiente de determinación muestral, 2r  , es un

    índice alternativo común del grado de asociación entre dos variablescuantitativas. Esta mediad se llama coeficiente de correlación muestral (r) yes un estimador puntual del coeficiente de correlación poblacional (ρ).

    El coeficiente de correlación muestral es la segunda medida con quepuede describirse la eficacia con que una variable es explicada por otra, asípues el signo de r  indica la dirección de la relación entre las dos variables X yY.

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    16/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    El siguiente esquema representa adecuadamente la intensidad y la

    dirección del coeficiente de correlación muestral.

     El calculo del coeficiente de correlación muestral se lleva a cavo con lasiguiente formula:

    2r r  =  INTERVALO DE CONFIANZA

    Debido a que la recta estimada de regresión, no es del todo real, esnecesario elaborar un intervalo de confianza que le de seguridad a nuestroscálculos.

    Como se ha visto, cuando se utilice el método de mínimos cuadrados,los coeficientes de regresión, a y b  son estimadores insesgados, eficientes y

    consistentes de α  y β, también aquí es muchas ocasiones es deseableestablecer intervalos de confianza.

     Los intervalos de confianza se calculan con la siguiente fórmula:

     

      

     ±=   −

    n

    S glt  y y   e

    nc   22/  ,ˆ

      α   

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    17/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    INTERVALO DE PREDICCIÓN 

    El intervalo de predicción, como su nombre lo indica, se utiliza parapredecir un intervalo de valores de Y, dado un valor de X.

     El intervalo de predicción se calcula con la siguiente fórmula:

    ( )( )   ( )( )∑   −

    −++••−±=

    22

    2

    2

    112ˆ

     xn x

     x X 

    nS nt  y y

    e p   α  

    PROCEDIMIENTO PARA REALIZAR UN ANÁLISIS DE CORRELACIÓN LINEALSIMPLE

    1.  Obtención y tabulación de los datos muestrales.

    2.  La información se gráfica en un diagrama de dispersión.

    3.  Calcular la pendiente y ordenada al origen.

    4.  Se obtiene la ecuación que mejor se ajusta a la información obtenida.

    5.  Se traza la línea estimada en el diagrama de dispersión.

    6.  Calcular el error estándar de estimación.

    7.  Calcular el coeficiente de determinación.

    8.  Determinar el coeficiente de correlación.

    9.  Determinar el intervalo de confianza.

    10. Determinar el intervalo de predicción.

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    18/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    Por ejemplo:

    Un gerente de ventas reunió los datos siguientes relacionados con lasventas anuales en miles de pesos y los años de experiencia de diezvendedores. Estime las ventas anuales para un vendedor con 7 años deexperiencia.

    Solución

    1.  Obtención y tabulación de los datos muestrales.

    X: Años de experiencia

    Y: Ventas anuales en miles de pesos.

    Vendedor X Y

    1 1 802 3 973 4 924 4 1025 6 103

    6 8 1117 10 1198 10 1239 11 117

    10 13 136

    70 1080

    2.  Diagrama de dispersión.

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    19/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    3.  Realizar los cálculos correspondientes y determinar la pendiente y

    ordenada al origen.

    Vendedor X Y XY X2  Y 2 

    1 1 80 80 1 64002 3 97 291 9 94093 4 92 368 16 84644 4 102 408 16 104045 6 103 618 36 106096 8 111 888 64 12321

    7 10 119 1190 100 141618 10 123 1230 100 151299 11 117 1287 121 13689

    10 13 136 1768 169 18496

    70 1080 8128 632 119082

    ( )( )( )

    ( )   8074108

    4710632

    1087108128

    710

    70

    10810

    1080

    2

    =−=

    =−

    −=

    ==

    ==

    a

    b

     x

     y

     

    4. Ecuación que mejor se ajusta.

    ( ) x y   480ˆ   +=  

     Para un vendedor con 7 años de experiencia, sus ventas estimadas serían:

    ( )   anualesventas y   1087480ˆ   =+=  

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    20/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    5. Trazo de la línea estimada en el diagrama de dispersión

    6. Calcular el error estándar de estimación.

    ( ) ( )61.4

    210

    81284108080119082=

    •−•=eS   

    7. Calcular el Coeficiente de Determinación.

    ( ) ( )   ( )( )

    %03.93

    10810119082

    1081081284108080

    2

    2

    22

    =

    =×−

    ×−×+×=

    r  

    El 93% de las ventas anuales se deben a la experiencia de los vendedores yel 7% restante de debe a otros factores.

    8. Calcular el Coeficiente de Correlación

    9645.09303.0   ==r  

    Este número nos indica que las variables X Y tienen una correlación positivaintensa.

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    21/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    9. Determinar el intervalo de confianza al 95%.

    Considerandoanualesventas y   108ˆ  =  

    3617.1116383.104

    3617.31083617.3108

    10

    61.4306.2108

    ≤≤

    +≤≤−

     

      

     ±=

    c

    c

    c

     y

     y

     y

     

    Se puede asegurar con un nivel de confianza del 95% que las ventas de losvendedores con 7 años de experiencia están entre 104.6 y 111.4 miles pesosanuales.

    10. Determinar el intervalo de predicción para un vendedor con 9 años deexperiencia se tiene

    ( )( )   ( )

    ( )∑   −

    −++••−±=

    22

    2

    2

    112ˆ

     xn x

     x X 

    n

    S nt  y ye p   α 

     

    Sustituyendo:

    ( )

    291.119709.96

    291.11108291.11108

    )7(10632

    79

    10

    1161.4306.2108

    2

    2

    ≤≤

    +≤≤−

    −++••±=

     p

     p

     p

     y

     y

     y

     

    Se puede asegurar con un nivel de confianza del 95% que las ventaspronosticadas de un vendedor con 9 años de experiencia están entre 96.71y 119.3 miles pesos anuales.

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    22/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    Ejercicios propuestos:

    1. El jefe del departamento de aguas de una ciudad desea establecer unarelación entre el consumo mensual domiciliario de agua Y, y el tamaño de lasfamilias X, Dados los datos muestrales, determine:

    a)  Elabora el diagrama de dispersión.b)  Calcula la pendiente y ordenada al origen.c)  Obtener la ecuación que mejor se ajusta a los datos.d)  Traza la línea estimada en el diagrama de dispersión.e)  Calcula el error estándar de estimación.f)  Calcula el coeficiente de determinación.g)  Determina el coeficiente de correlación.h)  Determina el intervalo de confianza al 99%.i)  Determina el intervalo de predicción 99%

    Galonesde

    Agua

    Tamañode

    familia.Y X

    650 2

    1200 71300 9430 41400 12900 61800 9640 3793 3925 2

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    23/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    2. El gerente de una compañía de seguros desea establecer la relación entreel seguro de vida de las personas Y, y sus salarios X. Realice una regresión con

    los datos muestrales:

    Segurode

    vida

    SalarioAnual.

    Y X50 1080 29100 30130 31150 36

    a)  Elabora el diagrama de dispersión.b)  Calcula la pendiente y ordenada al origen.c)  Obtener la ecuación que mejor se ajusta a los datos.d)  Traza la línea estimada en el diagrama de dispersión.e)  Calcula el error estándar de estimación.f)  Calcula el coeficiente de determinación.g)  Determina el coeficiente de correlación.h)  Determina el intervalo de confianza al 90%.

    i)  Determina el intervalo de predicción 90%

    3. Un economista desea establecer la relación entre la tasa de desempleo Y, yla tasa de cuentas vencidas de la Tesorerías, Determine la regresión ycorrelación con los datos muestrales.

    Y X6.7 9.7

    7.3 9.88.9 7.69.1 6.17.2 10.25.2 12.76.9 14.36.9 7.97.1 8.9

    1.  Elabora el diagrama de dispersión.2.  Calcula la pendiente y ordenada al origen.3.  Obtener la ecuación que mejor se ajusta a los datos.

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    24/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    4.  Traza la línea estimada en el diagrama de dispersión.5.  Calcula el error estándar de estimación.

    6.  Calcula el coeficiente de determinación.7.  Determina el coeficiente de correlación.8.  Determina el intervalo de confianza al 95%.9.  Determina el intervalo de predicción 95%

    4. Un director de ventas desea establecer la relación entre las ventas delsegundo año de vendedores Y, y sus ventas del primer año X. Realice unanálisis de regresión.

    Y 69 75 86 111 129 133

    X 170 133 86 161 112 133

    a)  Elabora el diagrama de dispersión.b)  Calcula la pendiente y ordenada al origen.c)  Obtener la ecuación que mejor se ajusta a los datos.d)  Traza la línea estimada en el diagrama de dispersión.e)  Calcula el error estándar de estimación.f)  Calcula el coeficiente de determinación.g)  Determina el coeficiente de correlación.

    h)  Determina el intervalo de confianza al 95%.i)  Determina el intervalo de predicción 95%

    5. Un gerente de comercialización desea establecer la relación entre lasventas Y, y el precio de un producto similar fabricado por la competenciaX, Realice un análisis de correlación.

    Ventas Precio decompetencia

    Y X520 13550 13600 15610 15620 16724 21680 21300 14

    962 40270 12

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    25/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    1.  Elabora el diagrama de dispersión.2.  Calcula la pendiente y ordenada al origen.

    3.  Obtener la ecuación que mejor se ajusta a los datos.4.  Traza la línea estimada en el diagrama de dispersión.5.  Calcula el error estándar de estimación.6.  Calcula el coeficiente de determinación.7.  Determina el coeficiente de correlación.8.  Determina el intervalo de confianza al 99%.9.  Determina el intervalo de predicción 99%

    6. Se hizo una encuesta a una muestra de 10 los estudiantes de 3er. Semestrede la carera de Lic. En administración del grupo 1301 del semestre 2009-1 y se

    encontraron los siguientes datos:

    Estudiante Altura (mts) Peso (Kg)1 1.50 482 1.54 503 1.60 524 1.72 705 1.80 726 1.50 50

    7 1.61 578 1.54 549 1.63 8010 1.70 62

    a)  Elabora el diagrama de dispersión.b)  Calcula la pendiente y ordenada al origen.c)  Obtener la ecuación que mejor se ajusta a los datos.d)  Traza la línea estimada en el diagrama de dispersión.e)  Calcula el error estándar de estimación.

    f)  Calcula el coeficiente de determinación.g)  Determina el coeficiente de correlación.h)  Determina el intervalo de confianza al 95%.i)  Determina el intervalo de predicción 95%

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    26/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    7. Los datos siguientes muestran las ventas (en miles de cajas) y los costos de

    un anuncio publicitario para la televisión (en millones de pesos) para 7 marcasprincipales de refrescos.Marca Gastos de

    publicidad ($)Ventas de cajas

    (miles)Coca-Cola 13.0 19.3Pepsi-Cola 9.4 13.8

    Sprite 6.4 8.4Diet Coke 5.7 5.5

    7-Up 4.2 5.9

    Jarritos 2.9 5.3Boing 1.6 2.5a)  ¿Dibuje el diagrama de dispersión, que parece indicar este diagrama

    acerca de la relación entre las dos variables?b)  Trace una recta que pase por los datos, para aproximar una relación

    lineal entre los gastos del anuncio y las ventas.c)  Aplique el método de los cuadrados mínimos para plantear la ecuación

    estimada de regresión.d)  Prediga las ventas para una marca que decida gastar $7 millones de

    pesos en un anuncio publicitario.e)  Calcule el error estándar en la regresión.f)  Calcule el coeficiente de determinación y correlación e interprételos.g)  Determina el intervalo de confianza al 95%.h)  Determina el intervalo de predicción 95%

    8. La revista del consumidor publico en su número 381 del mes de noviembredel 2008 la siguiente información acerca del uso de los teléfonos celulares:

    Año Usuarios que compran

    tiempo aire en (miles deusuarios)2000 16282001 17842002 20062003 20292004 25082005 32682006 4035

    2007 5199

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    27/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    a)  Trace un diagrama de dispersión para estos datos,b)  Aplique el método de mínimos cuadrados para plantear la ecuación

    estimada de regresión.c)  Trace una recta que pase por los datos, para aproximar una relaciónlineal entre la altura y el peso.

    d)  Prediga cuantos usuarios compraran tiempo aire para su teléfonocelular para el año 2009.

    e)  Calcule el error estándar en la regresión.f)  Calcule el coeficiente de correlación y el coeficiente de determinación

    e interprételos.g)  Determina el intervalo de confianza al 92%.h)  Determina el intervalo de predicción 92%

    9. Un vendedor de Century 21 desea establecer la relación entre el tiempo enmeses que están a la venta los departamentos antes de lograr su venta y elprecio pedido por ellos. Los datos de una muestra de 9 departamentos semuestran a continuación:

    Meses en venta 6.5 7.0 8.6 12.1 9.0 9.5 8.6 10.6 15.0Precio pedido (en

    miles de pesos)

    800 1000 990 1250 1400 1100 990 990 1250

    a)  Trace un diagrama de dispersión para estos datos,b)  Aplique el método de mínimos cuadrados para plantear la ecuación

    estimada de regresión.c)  Prediga cuanto tiempo se tardara en vender un departamento que

    cueste $ 1’500,000 pesos.d)  Calcule el error estándar en la regresión.e)  Calcule el coeficiente de correlación y el coeficiente de determinación

    e interprételos.f)  Determina el intervalo de confianza al 95%.g)  Determina el intervalo de predicción 95%

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    28/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx

    10. El Orgamismo Operador de agua en el Muncipio de cuautitlán IzcalliOPERAGUA quiere conocer la relación entre en consumo mensual domiciliario

    de agua y el tamaño de las familias, toma una muestra de 10 familias elegidasal azar y encuentra los siguientes datos:

    Metros cúbicosconsumidos

    65 120 130 43 140 90 180 64 79 92

    Tamaño de lafamilia

    2 7 9 4 12 6 9 3 3 4

    a)  Trace un diagrama de dispersión para estos datos,b)  Aplique el método de mínimos cuadrados para plantear la ecuación

    estimada de regresión.c)  Prediga cuantos metros cúbicos al mes consumirá una familia que tiene

    10 miembros.d)  Calcule el error estándar en la regresión.e)  Calcule el coeficiente de correlación y el coeficiente de determinación

    e interprételos.f)  Determina el intervalo de confianza al 95%.g)  Determina el intervalo de predicción 95%

    11- El gerente de una mueblería “FAMSA” quiere conocer la relación de lasventas logradas por un vendedor en dos años, toma una muestra de 8vendedores que lograron la etiqueta de (vendedor del mes) y encontró lossiguientes datos:

    Unidades vendidas en el año 2007 170 133 86 161 112 133 136 82

    Unidades vendidas en el año 2006 99 95 50 80 92 88 130 100 

    a)  Trace un diagrama de dispersión para estos datos,b)  Aplique el método de mínimos cuadrados para plantear la ecuación

    estimada de regresión.c)  Calcule el error estándar en la regresión.d)  Calcule el coeficiente de correlación y el coeficiente de determinación e

    interprételos.e)  Determina el intervalo de confianza al 95%.f)  Determina el intervalo de predicción 95%

  • 8/16/2019 09 Regresion y Correlacion Lineal Simple

    29/29

      Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

    12. Según el INEGI los nacimientos registrados en el país en el 2007 fueron:

    Mes de registro NacimientosRegistrados1 Enero 220,6702 Febrero 211,3303 Marzo 213,2994 Abril 270,8195 Mayo 225,2986 Junio 205,5727 Julio 211,1808 Agosto 249,626

    9 Septiembre 220,66610 Octubre 241,52911 Noviembre 211,85712 Diciembre 173,237

    a)  Aplique el método de mínimos cuadrados para plantear la ecuaciónestimada de regresión.

    b)  El INEGI reporto que en julio de 2007 se registraron 211,330nacimientos, utiliza la ecuación obtenida y predice cuantos debieronde haberse registrado en ese mes, compara resultados y obtén tus

    conclusiones.c)  Estime cuantos nacimientos se registraron en enero de 2008.d)  Calcule el error estándar en la regresión.e)  Calcule el coeficiente de correlación y el coeficiente de determinación

    e interprételos.f)  Determina el intervalo de confianza al 95%.g)  Determina el intervalo de predicción 95%