09 regresion y correlacion lineal simple
TRANSCRIPT
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
1/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
Regresión y Correlación lineal simple es el noveno fascículo, de una serie deguías de estudio en las que se desarrollan los temas de los programas de lasasignaturas del área de Probabilidad y Estadística, así como temas selectosque complementan el aprendizaje de de esta disciplina. Tienen lacaracterística de que el estudiante adquiera sólo aquella que trate el temaque necesite reforzar o el que sea de su propio interés.
Estas guías de estudio pretenden reorientar y actualizar el enfoque con el quese debe abordar el estudio de los métodos estadísticos, despertando lainquietud por aprender y resolver los problemas y casos planteados.
Cada guía integra el desarrollo del tema con ejercicios, casos de estudio y conla sección llamada Aprendiendo.com. En esta última sección se le proporcionaal estudiante un ambiente interactivo, utilizando los recursos disponibles enInternet, de tal forma que los casos planteados los desarrolle en ambientes
de aprendizaje que le permitan encontrarse con el conocimiento,“manipularlo”, hacerlo suyo. Con esta filosofía se utilizan applets, sitios deinternet con acceso a bases de datos reales, software de uso libre y engeneral los recursos de la Web 2.0, que se refieren a una segunda generaciónen la historia de la Web basada en comunidades de usuarios, que fomentan lacolaboración y el intercambio ágil de información entre los mismos.
Nuestro reconocimiento a la Dirección General de Asuntos del PersonalAcadémico de nuestra Casa de Estudios, que a través del Programa de Apoyoa Proyectos para la Innovación y Mejoramiento de la Enseñanza (PAPIME) ha
apoyado nuestro proyecto “Implantación de un Laboratorio Virtual deEstadística y Elaboración de las Guías de Estudio con Soporte Multimedia”clave PE302709.
Los Autores
PRESENTACIÓN
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
2/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE
Es común que las personas tomen decisiones personales y profesionalesbasadas en predicciones de sucesos futuros. Para hacer estos pronósticos, sebasan en la relación intuitiva y calculada entre lo que ya se sabe y lo que sedebe estimar. Si los responsables de la toma de decisiones puedendeterminar cómo lo conocido se relaciona con un evento futuro, puedenayudar considerablemente al proceso de toma de decisiones.
Cualquier método estadístico que busque establecer una ecuación quepermita estimar el valor desconocido de una variable a partir del valor
conocido de una o más variables, se denomina análisis de regresión.
Los análisis de regresión y correlación mostrarán como determinar lanaturaleza y la fuerza de una relación entre dos variables.
El término regresión fue utilizado por primera vez por el genetista yestadístico inglés Francis Galton (1822-1911) en 1877 Galton efectúo unestudio que demostró que la altura d los hijos de padres altos tendía aretroceder, o “regresar”, hacia la talla media de la población. Regresión fue
el nombre que le dio al proceso general de predecir una variable,(la talla delos niños) a partir de otra (la talla de los padres).
Hoy en día, esta tendencia de miembros de cualquier población que estánen una posición extrema (arriba o debajo de la media poblacional) en unmomento, y luego en una posición menos extrema en otro momento, (ya seapor sí o por medio de sus descendientes), se llama efecto de regresión.
El análisis de regresión se desarrolla una ecuación de estimación, es decir,una formula matemática que relaciona las variables conocidas con lasdesconocidas. Luego de obtener el patrón de dicha relación, se aplica elanálisis de correlación para determinar el grado de relación que hay entre lasvariables.
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
3/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
REGRESIÓN LINEAL SIMPLE
“Una técnica estadística que establece una ecuación para estimar elvalor desconocido de una variable, a partir del valor conocido de otravariable, (en vez de valores de muchas otras variables) se denomina análisisde regresión simple.”
Por lo tanto el análisis de regresión lineal simple, es el proceso general depredecir una variable (Y) a partir de otra (X).
Las relaciones entre las variables pueden ser directas o también inversas.
Relación directa: la pendiente de esta línea es positiva, por que la variableY crece a medida que la variable X también lo hace.
Relación inversa: La pendiente de esta línea es negativa, por que a medidaque aumenta el valor de la variable Y, el valor de la variable X disminuye.
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
4/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
VARIABLE INDEPENDIENTE (X)
En el análisis de regresión una variable cuyo valor se suponga conocido yque se utilice para explicar o predecir el valor de otra variable de interés sellama variable independiente; se simboliza con la letra X.
Otros nombres alternativos para la variable independiente (X), sonvariable explicatoria, variable predictora y en ocasiones variable regresora.
VARIABLE DEPENDIENTE (Y)
En el análisis de regresión una variable cuyo valor se suponga desconocidoy que se explique o prediga con ayuda de otra se llama variable dependiente y se simboliza con la letra Y.
La variable dependiente, al igual que la variable independiente es llamadade diferentes maneras algunas de ellas son: variable explicada o variablepronosticada.
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
5/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
DIAGRAMAS DE DISPERSIÓN
Un diagrama de dispersión es una ilustración gráfica que se usa en elanálisis de regresión. Consta de una dispersión de puntos tal que cada puntorepresenta un valor de la variable independiente (medido a lo largo del ejehorizontal), y un valor asociado de la variable dependiente (medido a lo largodel eje vertical).
El diagrama de dispersión, también llamado nube de puntos, brinda dostipos de información, visualmente se pueden determinar los patrones queindican como las variables están relacionadas (lineal o mediante una curva) ypor otro lado si existe una relación entre ellas visualizando la clase de línea o
ecuación de estimación que describe a dicha relación.
A continuación se ilustran algunas relaciones en los diagramas dedispersión:
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
6/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
METODO DE MINIMOS CUADRADOS
El método que por lo común se utiliza para ajustar una línea a los datosmuestrales indicados en el diagrama de dispersión, se llama método demínimos cuadrados. La línea se deriva en forma tal que la suma de loscuadrados de las desviaciones verticales entre la línea y los puntosindividuales de datos se reduce al mínimo.
El método de mínimos cuadrados sirve para determinar la recta quemejor se ajuste a los datos muestrales, y los supuestos de este método son:
El error es cero. Los datos obtenidos de las muestra son estadísticamente independientes. La varianza del error es igual para todos los valores de X.
Una línea de regresión calculada a partir de los datos muestrales, por elmétodo de mínimos cuadrados se llama línea de regresión estimada o líneade regresión muestral.
Dicha línea recta es la que mejor se ajusta al conjunto de datos (X, Y) y es
aquella en que la distancia que hay entre los datos y la supuesta recta es lamenor posible, y se calcula mediante la siguiente formula:
bxa y +=ˆ
Para calcular el valor de b (pendiente), que representa el grado deinclinación que tiene la recta, se emplea la siguiente formula:
22 xn x
y xn xyb
∑
∑−
−=
Para calcular el valor de a (ordenada al origen), que representa el puntoen que la recta corta al eje de las Y, se emplea la siguiente formula:
xb ya +=
Las variables a y b son constantes numéricas que son las que se calculanmediante el método de mínimos cuadrados.
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
7/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
ERROR ESTANDAR DE ESTIMACIÓN
El siguiente proceso que se necesita en el análisis de la regresión linealsimple es cómo medir la confiabilidad de la ecuación de estimación quehemos desarrollado.
El error estándar de estimación mide la variabilidad o dispersión de losvalores observados alrededor de la línea de regresión y se representa comoSe. Su formula es la siguiente:
( ) ( )2
2
−•−•−= ∑∑ ∑n
xyb ya yS e
Cuanto mayor sea el error estándar de la estimación, más grande será ladispersión (o esparcimiento) de puntos alrededor de la línea de regresión.Por el contrario, si Se= 0, se espera que la ecuación de estimación sea unestimador “perfecto” de la variable dependiente, en este caso todos lospuntos caerían directamente sobre la línea de regresión y no habría puntosdispersos, como se muestra en la siguiente figura:
El error estándar de estimación tiene la misma aplicación que de ladesviación estándar que se vio en los temas anteriores. Esto es, suponiendoque los puntos observados tienen una distribución normal alrededor de la
recta de regresión, podemos esperar que:
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
8/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
• 68% de los puntos están dentro de ± 1se
• 95.5% de los puntos están dentro de ± 2se • 99.7% de los puntos están dentro de ± 3se
El error estándar de la estimación se mide a lo largo del eje “Y”, y noperpendicularmente desde la recta de regresión.
Las suposiciones son:
1. Los valores observados para Y tienen distribución normal alrededor
de cada valor estimado de ŷ 2. La varianza de las distribuciones alrededor de cada valor posible de
ŷ es la misma.
Si esta segunda suposición no fuera cierta, entonces el error estándar en unpunto de la recta de regresión podría diferir del error estándar en otro punto.
PROCEDIMIENTO PARA REALIZAR UN ANÁLISIS DE REGRESIÓN LINEALSIMPLE
1. Obtención de los datos muestrales.
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
9/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
2. Los datos obtenidos se tabulan. (tener cuidado en determinar
correctamente quien es la variable independiente y dependiente)
X Y
3. La información se gráfica en un diagrama de dispersión,estableciéndose la posible relación entre las dos variables
4. Se calcula la pendiente.
( )∑∑
−
−=
22 xn x
y xn xyb
5. Se calcula la ordenada al origen.
xb ya +=
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
10/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
6. Se obtiene la ecuación que mejor se ajusta a la información obtenida.
bxa y +=ˆ
7. Se traza la línea estimada en el diagrama de dispersión.
8. Se calcula el error estándar de estimación.
( ) ( )
2
2
−
•−•−=
∑∑ ∑n
xyb ya yS e
Por ejemplo:
Una cadena de Pizzerías toma una muestra de diez de sus sucursalespara tratar de encontrar un modelo matemático que le permita predecir susventas y obtuvo los siguientes datos: la población de personas en miles fuede 2, 6, 8, 8, 12, 16, 20, 20, 22, 26; y las ventas trimestrales en miles de pesos
fue de: 58, 105, 88, 118, 117, 137, 157, 169, 169, 149, 202.
Realice una regresión para estimar las ventas de dos sucursales que tienen14,000 y 30,000 personas como potenciales clientes respectivamente.
Solución
Datosn=10
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
11/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
X: Población de personas en miles
Y: Ventas trimestrales en miles de pesos
1. Tabular los datos obtenidos:Sucursal X Y
1 2 58
2 6 105
3 8 88
4 8 118
5 12 117
6 16 137
7 20 1578 20 168
9 22 149
10 26 202
2. Graficar los datos en un diagrama de dispersión y determinar la posiblerelación entre las variables X Y.
Se puede observar una relación lineal directa.
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
12/29
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
13/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
7. Trazar la línea estimada.
8. Calcular el error estándar de estimación.
( ) ( )21.12
210
210405130060184393=
−
•−•−=eS
Tiene un error de estimación de 12,210 pesos.
Para una N = 14,0001
( )
( )130,14
13014560ˆ
∴
=+= y
Para una N = 30,000
( )( )210,30
21030560ˆ
∴
=+= y
1 Recuerda que estamos trabajando con miles de pesos, en este ejercicio.
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
14/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
CORRELACIÓN SIMPLE
Mientras que el análisis de regresión simple establece una ecuaciónprecisa que enlaza dos variables, el análisis de correlación es la herramientaestadística que podemos usar para describir el grado o fuerza en el que unavariable esta linealmente relacionada con otra.
Dependiendo del tamaño de esta medida cuantitativa se puede decir, quetan cercanamente se mueven dos variables, y por lo tanto, con cuantaconfiabilidad se puede estimar una variable con ayuda de la otra.
Una técnica estadística que establece un índice que proporciona, en unsolo número, una medida de la fuerza de asociación entre dos variables deinterés, se llama análisis de correlación simple.
El análisis de correlación es la herramienta estadística de que nos valemospara describir el grado de relación que hay entre dos variables.
A menudo el análisis de correlación simple se utiliza junto con el análisis deregresión lineal simple para medir la eficacia con que la línea de regresión
explica la variación de la variable dependiente, Y.
Diagramas de dispersión con correlación débil y fuerte.
Existen dos medidas para describir la correlación entre dos variables: el
coeficiente de determinación y el coeficiente de correlación.
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
15/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
COEFICIENTE MUESTRAL DE DETERMINACIÓN
La medida más importante de que también ajusta la línea de regresiónestimada en los datos muestrales en los que esta basada, es el coeficiente dedeterminación muestral, este es igual a la proporción de la variación total delos valores de la variable dependiente, “Y”, que puede explicarse por mediode la asociación de Y con X medida por la línea de regresión estimada.
El coeficiente de determinación es la manera primaria de medir elgrado, o fuerza, de la relación que existe entre dos variables, X y Y.
El coeficiente de determinación muestral se representa como r 2, y mideexclusivamente la fuerza de una relación lineal entre dos variables.
El Calculo del coeficiente de determinación se lleva a cabo con la siguienteformula:
( ) ( ) ( )( )∑∑∑
•−
•−•+•
= 22
2
2
yn y
yn xyb ya
r
COEFICIENTE MUESTRAL DE CORRELACIÓN
La raíz cuadrada del coeficiente de determinación muestral, 2r , es un
índice alternativo común del grado de asociación entre dos variablescuantitativas. Esta mediad se llama coeficiente de correlación muestral (r) yes un estimador puntual del coeficiente de correlación poblacional (ρ).
El coeficiente de correlación muestral es la segunda medida con quepuede describirse la eficacia con que una variable es explicada por otra, asípues el signo de r indica la dirección de la relación entre las dos variables X yY.
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
16/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
El siguiente esquema representa adecuadamente la intensidad y la
dirección del coeficiente de correlación muestral.
El calculo del coeficiente de correlación muestral se lleva a cavo con lasiguiente formula:
2r r = INTERVALO DE CONFIANZA
Debido a que la recta estimada de regresión, no es del todo real, esnecesario elaborar un intervalo de confianza que le de seguridad a nuestroscálculos.
Como se ha visto, cuando se utilice el método de mínimos cuadrados,los coeficientes de regresión, a y b son estimadores insesgados, eficientes y
consistentes de α y β, también aquí es muchas ocasiones es deseableestablecer intervalos de confianza.
Los intervalos de confianza se calculan con la siguiente fórmula:
±= −
n
S glt y y e
nc 22/ ,ˆ
α
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
17/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
INTERVALO DE PREDICCIÓN
El intervalo de predicción, como su nombre lo indica, se utiliza parapredecir un intervalo de valores de Y, dado un valor de X.
El intervalo de predicción se calcula con la siguiente fórmula:
( )( ) ( )( )∑ −
−++••−±=
22
2
2
112ˆ
xn x
x X
nS nt y y
e p α
PROCEDIMIENTO PARA REALIZAR UN ANÁLISIS DE CORRELACIÓN LINEALSIMPLE
1. Obtención y tabulación de los datos muestrales.
2. La información se gráfica en un diagrama de dispersión.
3. Calcular la pendiente y ordenada al origen.
4. Se obtiene la ecuación que mejor se ajusta a la información obtenida.
5. Se traza la línea estimada en el diagrama de dispersión.
6. Calcular el error estándar de estimación.
7. Calcular el coeficiente de determinación.
8. Determinar el coeficiente de correlación.
9. Determinar el intervalo de confianza.
10. Determinar el intervalo de predicción.
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
18/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
Por ejemplo:
Un gerente de ventas reunió los datos siguientes relacionados con lasventas anuales en miles de pesos y los años de experiencia de diezvendedores. Estime las ventas anuales para un vendedor con 7 años deexperiencia.
Solución
1. Obtención y tabulación de los datos muestrales.
X: Años de experiencia
Y: Ventas anuales en miles de pesos.
Vendedor X Y
1 1 802 3 973 4 924 4 1025 6 103
6 8 1117 10 1198 10 1239 11 117
10 13 136
∑
70 1080
2. Diagrama de dispersión.
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
19/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
3. Realizar los cálculos correspondientes y determinar la pendiente y
ordenada al origen.
Vendedor X Y XY X2 Y 2
1 1 80 80 1 64002 3 97 291 9 94093 4 92 368 16 84644 4 102 408 16 104045 6 103 618 36 106096 8 111 888 64 12321
7 10 119 1190 100 141618 10 123 1230 100 151299 11 117 1287 121 13689
10 13 136 1768 169 18496
∑
70 1080 8128 632 119082
( )( )( )
( ) 8074108
4710632
1087108128
710
70
10810
1080
2
=−=
=−
−=
==
==
a
b
x
y
4. Ecuación que mejor se ajusta.
( ) x y 480ˆ +=
Para un vendedor con 7 años de experiencia, sus ventas estimadas serían:
( ) anualesventas y 1087480ˆ =+=
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
20/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
5. Trazo de la línea estimada en el diagrama de dispersión
6. Calcular el error estándar de estimación.
( ) ( )61.4
210
81284108080119082=
−
•−•=eS
7. Calcular el Coeficiente de Determinación.
( ) ( ) ( )( )
%03.93
10810119082
1081081284108080
2
2
22
=
=×−
×−×+×=
r
r
El 93% de las ventas anuales se deben a la experiencia de los vendedores yel 7% restante de debe a otros factores.
8. Calcular el Coeficiente de Correlación
9645.09303.0 ==r
Este número nos indica que las variables X Y tienen una correlación positivaintensa.
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
21/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
9. Determinar el intervalo de confianza al 95%.
Considerandoanualesventas y 108ˆ =
3617.1116383.104
3617.31083617.3108
10
61.4306.2108
≤≤
+≤≤−
±=
c
c
c
y
y
y
Se puede asegurar con un nivel de confianza del 95% que las ventas de losvendedores con 7 años de experiencia están entre 104.6 y 111.4 miles pesosanuales.
10. Determinar el intervalo de predicción para un vendedor con 9 años deexperiencia se tiene
( )( ) ( )
( )∑ −
−++••−±=
22
2
2
112ˆ
xn x
x X
n
S nt y ye p α
Sustituyendo:
( )
291.119709.96
291.11108291.11108
)7(10632
79
10
1161.4306.2108
2
2
≤≤
+≤≤−
−
−++••±=
p
p
p
y
y
y
Se puede asegurar con un nivel de confianza del 95% que las ventaspronosticadas de un vendedor con 9 años de experiencia están entre 96.71y 119.3 miles pesos anuales.
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
22/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
Ejercicios propuestos:
1. El jefe del departamento de aguas de una ciudad desea establecer unarelación entre el consumo mensual domiciliario de agua Y, y el tamaño de lasfamilias X, Dados los datos muestrales, determine:
a) Elabora el diagrama de dispersión.b) Calcula la pendiente y ordenada al origen.c) Obtener la ecuación que mejor se ajusta a los datos.d) Traza la línea estimada en el diagrama de dispersión.e) Calcula el error estándar de estimación.f) Calcula el coeficiente de determinación.g) Determina el coeficiente de correlación.h) Determina el intervalo de confianza al 99%.i) Determina el intervalo de predicción 99%
Galonesde
Agua
Tamañode
familia.Y X
650 2
1200 71300 9430 41400 12900 61800 9640 3793 3925 2
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
23/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
2. El gerente de una compañía de seguros desea establecer la relación entreel seguro de vida de las personas Y, y sus salarios X. Realice una regresión con
los datos muestrales:
Segurode
vida
SalarioAnual.
Y X50 1080 29100 30130 31150 36
a) Elabora el diagrama de dispersión.b) Calcula la pendiente y ordenada al origen.c) Obtener la ecuación que mejor se ajusta a los datos.d) Traza la línea estimada en el diagrama de dispersión.e) Calcula el error estándar de estimación.f) Calcula el coeficiente de determinación.g) Determina el coeficiente de correlación.h) Determina el intervalo de confianza al 90%.
i) Determina el intervalo de predicción 90%
3. Un economista desea establecer la relación entre la tasa de desempleo Y, yla tasa de cuentas vencidas de la Tesorerías, Determine la regresión ycorrelación con los datos muestrales.
Y X6.7 9.7
7.3 9.88.9 7.69.1 6.17.2 10.25.2 12.76.9 14.36.9 7.97.1 8.9
1. Elabora el diagrama de dispersión.2. Calcula la pendiente y ordenada al origen.3. Obtener la ecuación que mejor se ajusta a los datos.
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
24/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
4. Traza la línea estimada en el diagrama de dispersión.5. Calcula el error estándar de estimación.
6. Calcula el coeficiente de determinación.7. Determina el coeficiente de correlación.8. Determina el intervalo de confianza al 95%.9. Determina el intervalo de predicción 95%
4. Un director de ventas desea establecer la relación entre las ventas delsegundo año de vendedores Y, y sus ventas del primer año X. Realice unanálisis de regresión.
Y 69 75 86 111 129 133
X 170 133 86 161 112 133
a) Elabora el diagrama de dispersión.b) Calcula la pendiente y ordenada al origen.c) Obtener la ecuación que mejor se ajusta a los datos.d) Traza la línea estimada en el diagrama de dispersión.e) Calcula el error estándar de estimación.f) Calcula el coeficiente de determinación.g) Determina el coeficiente de correlación.
h) Determina el intervalo de confianza al 95%.i) Determina el intervalo de predicción 95%
5. Un gerente de comercialización desea establecer la relación entre lasventas Y, y el precio de un producto similar fabricado por la competenciaX, Realice un análisis de correlación.
Ventas Precio decompetencia
Y X520 13550 13600 15610 15620 16724 21680 21300 14
962 40270 12
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
25/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
1. Elabora el diagrama de dispersión.2. Calcula la pendiente y ordenada al origen.
3. Obtener la ecuación que mejor se ajusta a los datos.4. Traza la línea estimada en el diagrama de dispersión.5. Calcula el error estándar de estimación.6. Calcula el coeficiente de determinación.7. Determina el coeficiente de correlación.8. Determina el intervalo de confianza al 99%.9. Determina el intervalo de predicción 99%
6. Se hizo una encuesta a una muestra de 10 los estudiantes de 3er. Semestrede la carera de Lic. En administración del grupo 1301 del semestre 2009-1 y se
encontraron los siguientes datos:
Estudiante Altura (mts) Peso (Kg)1 1.50 482 1.54 503 1.60 524 1.72 705 1.80 726 1.50 50
7 1.61 578 1.54 549 1.63 8010 1.70 62
a) Elabora el diagrama de dispersión.b) Calcula la pendiente y ordenada al origen.c) Obtener la ecuación que mejor se ajusta a los datos.d) Traza la línea estimada en el diagrama de dispersión.e) Calcula el error estándar de estimación.
f) Calcula el coeficiente de determinación.g) Determina el coeficiente de correlación.h) Determina el intervalo de confianza al 95%.i) Determina el intervalo de predicción 95%
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
26/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
7. Los datos siguientes muestran las ventas (en miles de cajas) y los costos de
un anuncio publicitario para la televisión (en millones de pesos) para 7 marcasprincipales de refrescos.Marca Gastos de
publicidad ($)Ventas de cajas
(miles)Coca-Cola 13.0 19.3Pepsi-Cola 9.4 13.8
Sprite 6.4 8.4Diet Coke 5.7 5.5
7-Up 4.2 5.9
Jarritos 2.9 5.3Boing 1.6 2.5a) ¿Dibuje el diagrama de dispersión, que parece indicar este diagrama
acerca de la relación entre las dos variables?b) Trace una recta que pase por los datos, para aproximar una relación
lineal entre los gastos del anuncio y las ventas.c) Aplique el método de los cuadrados mínimos para plantear la ecuación
estimada de regresión.d) Prediga las ventas para una marca que decida gastar $7 millones de
pesos en un anuncio publicitario.e) Calcule el error estándar en la regresión.f) Calcule el coeficiente de determinación y correlación e interprételos.g) Determina el intervalo de confianza al 95%.h) Determina el intervalo de predicción 95%
8. La revista del consumidor publico en su número 381 del mes de noviembredel 2008 la siguiente información acerca del uso de los teléfonos celulares:
Año Usuarios que compran
tiempo aire en (miles deusuarios)2000 16282001 17842002 20062003 20292004 25082005 32682006 4035
2007 5199
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
27/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
a) Trace un diagrama de dispersión para estos datos,b) Aplique el método de mínimos cuadrados para plantear la ecuación
estimada de regresión.c) Trace una recta que pase por los datos, para aproximar una relaciónlineal entre la altura y el peso.
d) Prediga cuantos usuarios compraran tiempo aire para su teléfonocelular para el año 2009.
e) Calcule el error estándar en la regresión.f) Calcule el coeficiente de correlación y el coeficiente de determinación
e interprételos.g) Determina el intervalo de confianza al 92%.h) Determina el intervalo de predicción 92%
9. Un vendedor de Century 21 desea establecer la relación entre el tiempo enmeses que están a la venta los departamentos antes de lograr su venta y elprecio pedido por ellos. Los datos de una muestra de 9 departamentos semuestran a continuación:
Meses en venta 6.5 7.0 8.6 12.1 9.0 9.5 8.6 10.6 15.0Precio pedido (en
miles de pesos)
800 1000 990 1250 1400 1100 990 990 1250
a) Trace un diagrama de dispersión para estos datos,b) Aplique el método de mínimos cuadrados para plantear la ecuación
estimada de regresión.c) Prediga cuanto tiempo se tardara en vender un departamento que
cueste $ 1’500,000 pesos.d) Calcule el error estándar en la regresión.e) Calcule el coeficiente de correlación y el coeficiente de determinación
e interprételos.f) Determina el intervalo de confianza al 95%.g) Determina el intervalo de predicción 95%
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
28/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
Regresión y Correlación Lineal Simplehttp://www.cuautitlan.unam.mx
10. El Orgamismo Operador de agua en el Muncipio de cuautitlán IzcalliOPERAGUA quiere conocer la relación entre en consumo mensual domiciliario
de agua y el tamaño de las familias, toma una muestra de 10 familias elegidasal azar y encuentra los siguientes datos:
Metros cúbicosconsumidos
65 120 130 43 140 90 180 64 79 92
Tamaño de lafamilia
2 7 9 4 12 6 9 3 3 4
a) Trace un diagrama de dispersión para estos datos,b) Aplique el método de mínimos cuadrados para plantear la ecuación
estimada de regresión.c) Prediga cuantos metros cúbicos al mes consumirá una familia que tiene
10 miembros.d) Calcule el error estándar en la regresión.e) Calcule el coeficiente de correlación y el coeficiente de determinación
e interprételos.f) Determina el intervalo de confianza al 95%.g) Determina el intervalo de predicción 95%
11- El gerente de una mueblería “FAMSA” quiere conocer la relación de lasventas logradas por un vendedor en dos años, toma una muestra de 8vendedores que lograron la etiqueta de (vendedor del mes) y encontró lossiguientes datos:
Unidades vendidas en el año 2007 170 133 86 161 112 133 136 82
Unidades vendidas en el año 2006 99 95 50 80 92 88 130 100
a) Trace un diagrama de dispersión para estos datos,b) Aplique el método de mínimos cuadrados para plantear la ecuación
estimada de regresión.c) Calcule el error estándar en la regresión.d) Calcule el coeficiente de correlación y el coeficiente de determinación e
interprételos.e) Determina el intervalo de confianza al 95%.f) Determina el intervalo de predicción 95%
-
8/16/2019 09 Regresion y Correlacion Lineal Simple
29/29
Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán
12. Según el INEGI los nacimientos registrados en el país en el 2007 fueron:
Mes de registro NacimientosRegistrados1 Enero 220,6702 Febrero 211,3303 Marzo 213,2994 Abril 270,8195 Mayo 225,2986 Junio 205,5727 Julio 211,1808 Agosto 249,626
9 Septiembre 220,66610 Octubre 241,52911 Noviembre 211,85712 Diciembre 173,237
a) Aplique el método de mínimos cuadrados para plantear la ecuaciónestimada de regresión.
b) El INEGI reporto que en julio de 2007 se registraron 211,330nacimientos, utiliza la ecuación obtenida y predice cuantos debieronde haberse registrado en ese mes, compara resultados y obtén tus
conclusiones.c) Estime cuantos nacimientos se registraron en enero de 2008.d) Calcule el error estándar en la regresión.e) Calcule el coeficiente de correlación y el coeficiente de determinación
e interprételos.f) Determina el intervalo de confianza al 95%.g) Determina el intervalo de predicción 95%