unidad nº 1 regresion y correlacion monica
DESCRIPTION
Curso Elaboración de Instrumentos estadìsticosTRANSCRIPT
- 1. UNIDAD N 1
Regresin lineal y correlacin
Mnica Valencia Parra
Lic. En matemticas y computacin
2. REGRESION Y CORRELACION
Los temas vistos anteriormente, en nuestro curso de estadstica
descriptiva se han basado en el estudio y anlisis de una sla
variable.Con ste tema trataremos el anlisis de situaciones que se
presentan en una distribucin que contienen dos variables X y Y.El
espacio muestral de un experimento con dos variables es cierto
conjunto de pares ordenados de medidas, es decir, dos observaciones
por cada prueba.
3. Nuestro principal objetivo, al analizar las dos variables X y Y,
es el poder determinar la relacin entre stas dos variables, es
decir como se comportan las dos variables una con respecto a la
otra. Tambin nos interesa encontrar una ecuacin, de tal manera que
basndonos en una determinada cantidad X podamos estimar el promedio
de cantidad Y.
4. As, una ecuacin de ste tipo que relaciona las dos variables, una
dependiente de la otra se puede considerar como una relacin de
estimacin. La ecuacin que relaciona stas dos variables se llama
ecuacin de Regresin de Y respecto a X.
5. DIAGRAMAS DE DISPERSION
Un diagrama de dispersin es una grfica en la que cada punto trazado
representa un par de valores observados de las variables
independientes y dependientes.El valor de la variable independiente
X se ubica en el eje horizontal mientras que el valor de la
variable dependiente Y se ubica en el eje vertical, una vez
ubicados en un plano cartesiano podemos obtener una imagen de como
est distribuida la muestra bien sea (lnea positiva, lnea inversa o
no hay relacin, entre otras).
6. EJEMPLOS DE DIAGRAMAS DE DISPERSION
7. 8. 9. 10. 11. COEFICIENTE DE CORRELACION DE PEARSON
En la mayora de los casos el principal inters del investigador no
solamente est en poder medir la relacin que puede existir, entre
las dos variables, directa e inversa , sino que adems se concentra
en determinar si estn o no correlacionadas, y en caso afirmativo,
en hallar que tan fuerte es ste grado de relacin.
12. Esta tcnica analtica que se utiliza en hallar este grado de
relacin, recibe el nombre de anlisis de correlacin.El valor del
coeficiente de correlacin puede ir de -1.00 a +1.00.El signo
aritmtico asociado con el coeficiente de correlacin indica la
direccin de la relacin entre X y Y (positivo igual a directa;
negativo igual inversa).
13. Cuando las dos variables no estn correlacionadas el coeficiente
de correlacin es 0 o muy cercano a 0.Con base a stos hechos,
podemos deducir que mientras ms cerca est el valor numrico del
coeficiente de correlacin a +1 o -1, entonces ms estrecho ser el
grado de relacin de las variables estudiadas.A continuacin
encontraremos la frmula que nos permite determinar el coeficiente
de correlacin de pearson (r).
14. donde:El smbolo sumatoria de Xi *Yi es el total de la columna
de la tabla respectivan es el numero de observacionesX barra es la
suma de los Xi dividido entre nY barra es la suma de los Yi
dividido entre nSumatoria de los Xi al cuadrado, total de la
columna de Xi al cuadrado.
15. Y as sucesivamente se reemplazan los datos en la frmula
X barra =Sumatoria de Xi dividido entre n
Y barra = Sumatoria de Yi dividido entre n
16. Para hacer ms cmodos los clculos podemos realizar la siguiente
tabla con las siguientes columnas:
17. ECUACIN DE REGRESIN LINEAL
Es necesario definir una recta de tal manera que las suma de los
cuadrados entre las diferencia de los valores de Y y los
correspondiente valores calculados por medio de la recta para cada
valor de X sea el ms pequeo.Este mtodo conocido como el mtodo de
los mnimos cuadrados es el ms comnmente usado en estadstica para
obtener la recta de mejor ajuste.
18. Recordemos que la forma general de la ecuacin de la lnea recta
es Y = mX + b, que es la ecuacin que queremos estimar y la
llamaremos Y* = mX + b.Para encontrar esta ecuacin utilizamos las
siguientes frmulas:
19. Donde m es la pendiente y b el intercepto Y de la lnea
recta
Pendiente de la recta
Intercepto o corte con el eje Y
20. EJEMPLO PRACTICO
Supngase que se desea determinar la posible relacin existente entre
la cantidad de agua lluvia en una regin, y la cantidad de maiz
recolectada en 10 haciendas diferentes, durante un cierto periodo
de tiempo:
21. 22. Se desea ahora decidir si la cantidad de maz recolectada
est relacionada con la cantidad de precipitacin lluviosa durante el
periodo de cultivo de maz, y tratar de encontrar una ecuacin que
exprese la cantidad de maz cosechada en trminos de la cantidad de
agua recibida.El valor de esta ecuacin permitir estima o predecir
el valor de una variable en funcin de la otra.
23. En este ejercicio debemos determinar:1.El diagrama de
dispersin2.La ecuacin de regresin (Mtodo de los mnimos
cuadrados)3.Estimar posibles valores de Y para determinados valores
de X.4.Calcular e interpretar el grado de correlacin de las dos
variables (Coeficiente de Pearson)
24. Diagrama de dispersin
25. Ecuacin de Regresin (mtodo de los mnimos cuadrados)
26. Puesto que:
27. Tenemos que:
As que la ecuacin de la recta de regresin de Y con respecto a X
ser:
Y* = 0.176 (X) 0.64
Nota: Los puntos solo los utilizo para notacin decimal.
28. 3. Prediccin de otros valoresSi X= 40 Y=?Y* = 0.176 (40) 0.64=
6.4Lo que significa que para un supuesto de 40 met. Cub. de
precipitacin de agua lluvia se espera una cosecha de 6.4 mill. de
lib. de maiz.
29. - SiY = 9 X=?Lo que significa que para obtener una cosecha de 9
mill. Lib. De maiz deben precipitarse 54.77 met. Cub. de agua
lluvia.
30. 4. Grado de correlacin de las dos variables (coeficiente de
pearson)aplicamos la frmula sacando los datos de la tabla
respectiva:
31. r = 0.952, lo que significa que existe un alto grado de
correlacin lineal directa entre las dos variables.