unidad nº 1 regresion y correlacion monica

31
UNIDAD Nº 1 Regresión lineal y correlación Mónica Valencia Parra Lic. En matemáticas y computación

Upload: movapa

Post on 08-Jun-2015

7.374 views

Category:

Documents


1 download

DESCRIPTION

Curso Elaboración de Instrumentos estadìsticos

TRANSCRIPT

  • 1. UNIDAD N 1
    Regresin lineal y correlacin
    Mnica Valencia Parra
    Lic. En matemticas y computacin

2. REGRESION Y CORRELACION
Los temas vistos anteriormente, en nuestro curso de estadstica descriptiva se han basado en el estudio y anlisis de una sla variable.Con ste tema trataremos el anlisis de situaciones que se presentan en una distribucin que contienen dos variables X y Y.El espacio muestral de un experimento con dos variables es cierto conjunto de pares ordenados de medidas, es decir, dos observaciones por cada prueba.
3. Nuestro principal objetivo, al analizar las dos variables X y Y, es el poder determinar la relacin entre stas dos variables, es decir como se comportan las dos variables una con respecto a la otra. Tambin nos interesa encontrar una ecuacin, de tal manera que basndonos en una determinada cantidad X podamos estimar el promedio de cantidad Y.
4. As, una ecuacin de ste tipo que relaciona las dos variables, una dependiente de la otra se puede considerar como una relacin de estimacin. La ecuacin que relaciona stas dos variables se llama ecuacin de Regresin de Y respecto a X.
5. DIAGRAMAS DE DISPERSION
Un diagrama de dispersin es una grfica en la que cada punto trazado representa un par de valores observados de las variables independientes y dependientes.El valor de la variable independiente X se ubica en el eje horizontal mientras que el valor de la variable dependiente Y se ubica en el eje vertical, una vez ubicados en un plano cartesiano podemos obtener una imagen de como est distribuida la muestra bien sea (lnea positiva, lnea inversa o no hay relacin, entre otras).
6. EJEMPLOS DE DIAGRAMAS DE DISPERSION
7. 8. 9. 10. 11. COEFICIENTE DE CORRELACION DE PEARSON
En la mayora de los casos el principal inters del investigador no solamente est en poder medir la relacin que puede existir, entre las dos variables, directa e inversa , sino que adems se concentra en determinar si estn o no correlacionadas, y en caso afirmativo, en hallar que tan fuerte es ste grado de relacin.
12. Esta tcnica analtica que se utiliza en hallar este grado de relacin, recibe el nombre de anlisis de correlacin.El valor del coeficiente de correlacin puede ir de -1.00 a +1.00.El signo aritmtico asociado con el coeficiente de correlacin indica la direccin de la relacin entre X y Y (positivo igual a directa; negativo igual inversa).
13. Cuando las dos variables no estn correlacionadas el coeficiente de correlacin es 0 o muy cercano a 0.Con base a stos hechos, podemos deducir que mientras ms cerca est el valor numrico del coeficiente de correlacin a +1 o -1, entonces ms estrecho ser el grado de relacin de las variables estudiadas.A continuacin encontraremos la frmula que nos permite determinar el coeficiente de correlacin de pearson (r).
14. donde:El smbolo sumatoria de Xi *Yi es el total de la columna de la tabla respectivan es el numero de observacionesX barra es la suma de los Xi dividido entre nY barra es la suma de los Yi dividido entre nSumatoria de los Xi al cuadrado, total de la columna de Xi al cuadrado.
15. Y as sucesivamente se reemplazan los datos en la frmula
X barra =Sumatoria de Xi dividido entre n
Y barra = Sumatoria de Yi dividido entre n
16. Para hacer ms cmodos los clculos podemos realizar la siguiente tabla con las siguientes columnas:
17. ECUACIN DE REGRESIN LINEAL
Es necesario definir una recta de tal manera que las suma de los cuadrados entre las diferencia de los valores de Y y los correspondiente valores calculados por medio de la recta para cada valor de X sea el ms pequeo.Este mtodo conocido como el mtodo de los mnimos cuadrados es el ms comnmente usado en estadstica para obtener la recta de mejor ajuste.
18. Recordemos que la forma general de la ecuacin de la lnea recta es Y = mX + b, que es la ecuacin que queremos estimar y la llamaremos Y* = mX + b.Para encontrar esta ecuacin utilizamos las siguientes frmulas:
19. Donde m es la pendiente y b el intercepto Y de la lnea recta
Pendiente de la recta
Intercepto o corte con el eje Y
20. EJEMPLO PRACTICO
Supngase que se desea determinar la posible relacin existente entre la cantidad de agua lluvia en una regin, y la cantidad de maiz recolectada en 10 haciendas diferentes, durante un cierto periodo de tiempo:
21. 22. Se desea ahora decidir si la cantidad de maz recolectada est relacionada con la cantidad de precipitacin lluviosa durante el periodo de cultivo de maz, y tratar de encontrar una ecuacin que exprese la cantidad de maz cosechada en trminos de la cantidad de agua recibida.El valor de esta ecuacin permitir estima o predecir el valor de una variable en funcin de la otra.
23. En este ejercicio debemos determinar:1.El diagrama de dispersin2.La ecuacin de regresin (Mtodo de los mnimos cuadrados)3.Estimar posibles valores de Y para determinados valores de X.4.Calcular e interpretar el grado de correlacin de las dos variables (Coeficiente de Pearson)
24. Diagrama de dispersin
25. Ecuacin de Regresin (mtodo de los mnimos cuadrados)
26. Puesto que:
27. Tenemos que:
As que la ecuacin de la recta de regresin de Y con respecto a X ser:
Y* = 0.176 (X) 0.64
Nota: Los puntos solo los utilizo para notacin decimal.
28. 3. Prediccin de otros valoresSi X= 40 Y=?Y* = 0.176 (40) 0.64= 6.4Lo que significa que para un supuesto de 40 met. Cub. de precipitacin de agua lluvia se espera una cosecha de 6.4 mill. de lib. de maiz.
29. - SiY = 9 X=?Lo que significa que para obtener una cosecha de 9 mill. Lib. De maiz deben precipitarse 54.77 met. Cub. de agua lluvia.
30. 4. Grado de correlacin de las dos variables (coeficiente de pearson)aplicamos la frmula sacando los datos de la tabla respectiva:
31. r = 0.952, lo que significa que existe un alto grado de correlacin lineal directa entre las dos variables.