seminario 10 de estadistica y tics

25
Seminari o 10: Correlacion es Laura Arriaza Granado. Grupo 1. Facultad de Valme. 1º enfermería Estadística y Tics

Upload: laura-arriaza-granado

Post on 17-Jun-2015

186 views

Category:

Education


2 download

TRANSCRIPT

Page 1: seminario 10 de estadistica y tics

Seminario

10: Correlaciones

Laura Arriaza Granado.

Grupo 1. Facultad de

Valme.

1º enfermería

Estadística y Tics

Page 2: seminario 10 de estadistica y tics

En un municipio español se ha realizado una pequeña encuesta en la que se ha preguntado por el nº de personas que habitan en el hogar y el nº de habitaciones del mismo.

Si ambas variables se distribuyen normalmente:

-Averiguar si existe correlación entre ambas variables en la población de donde derivan los datos.

-Calcular el coeficiente de correlación de Pearson.

-Averiguar si el coeficiente de correlación es significativo. Realizar las hipótesis.

-Incluir los datos en SSPS y realizar gráfico dispersión simple, realizar la correlación de Pearson y evaluar los resultados.

Page 3: seminario 10 de estadistica y tics

Lo primero que tenemos que hacer es averiguar si existe normalidad en la muestra. Esto lo sabremos mediante las pruebas de normalidad en SPSS. Para ello, miraremos el test de Kolmogorov-Smirnov si el tamaño de la muestra es mayor a 50, y el Test de Shapiro Wills si el tamaño de la muestra es menor a 50.Después, usaremos R de Pearson si se distribuye normalmente y Rho de Spearman si no se distribuye normalmente.

Page 4: seminario 10 de estadistica y tics

Vamos a ver si las variables se distribuyen normalmente en SPSS

Page 5: seminario 10 de estadistica y tics

Para ello, pinchamos en:

“Analizar----estadísticos

descriptivos----Explorar”.

Page 6: seminario 10 de estadistica y tics

Elegimos las variables y pinchamos en

“gráficos”.

Page 7: seminario 10 de estadistica y tics

Pinchamos en “niveles de los factores juntos”---- “De tallo y hojas”---- “Gráficos con prueba de normalidad”

Page 8: seminario 10 de estadistica y tics
Page 9: seminario 10 de estadistica y tics
Page 10: seminario 10 de estadistica y tics

Ahora nos va a salir una tabla y nos tendremos que fijar en la parte de “Sig.” (nivel de significación).Si el resultado del nivel de significación es mayor de 0,05 el conjunto de datos sigue una distribución normal, es decir, se acepta la Ho, y usaremos R de PearsonSi el resultado del nivel de significación es menor de 0,05, el conjunto de datos no sigue una distribución normal, es decir, se rechaza la Ho y usaremos Rho de Spearman

Page 11: seminario 10 de estadistica y tics

La sig. es mayor que 0,05 por lo que sigue una distribución normal. Así que, aceptamos la hipótesis nula y utilizaremos la R de Pearson

En la tabla nos aparece Kolmogorov-Smirnov y Shapiro Will. Como la muestra es menor de 50 nos fijamos en Shapiro-Wills.

Page 12: seminario 10 de estadistica y tics

Vamos a utilizar la FÓRMULA DE R DE PEARSON, porque se distribuye normalmente:

R= coeficiente de correlación de pearson∑xy= sumatorio de los productos de ambas variables∑x=sumatoria de los valores de la variable independiente∑y= sumatoria de los valores de la variable dependiente∑x^2= sumatoria de los valores al cuadrado de la variable independiente∑y^2= sumatoria de los valores al cuadrado de la variable dependienteN= tamaño de la muestra en función de parejas.

Page 13: seminario 10 de estadistica y tics

x y X2 Y2 xy

3 2 9 4 6

5 3 25 9 15

4 4 16 16 16

6 4 36 16 24

5 3 25 9 15

4 3 16 9 12

Σx=27 Σy=19 Σx2 =127 Σy2=63 Σxy=88

(88x6) – (19x27)

r = = 0,63

√ {(6x127)-(729) } {(6x63)-(361)

Page 14: seminario 10 de estadistica y tics

Si Pearson nos da cero pues entonces en esa población no hay correlación.Si es diferente de cero, como en nuestro caso (Pearson = 0,63==0), el resultado obtenido hay que estudiarlo y para eso haremos la T de Student, con N-2 grados de libertad (N= nº de muestra).

La T de Student informa de si la relación se ha producido al azar o no.

T(n-2) = r xy

= 1,63

(n-2)

1-rxy^2 T (n-2) = 0,63

( 6-2

1-(0,63)^2

Page 15: seminario 10 de estadistica y tics

.

Ya sabemos el valor de la T de Student (1,63). Ahora tenemos que compararlo con el valor de la tabla de distribución de la T de Student. Si el valor de la fórmula es mayor que el valor de las tablas rechazamos la hipótesis nula, y diremos que las variables están relacionadas. Si T de student de la fórmula < T de las tablas, aceptamos la hipótesis nula, y las variables no están relacionadas.

Todo esto teniendo en cuenta que:

• H0: No hay relación entre el número de personas que viven en una casa y el número de habitaciones de ella.

• H1: Hay relación significativa entre el número de personas que viven en una casa y el número de habitaciones de la misma

Page 16: seminario 10 de estadistica y tics

Para buscar en la tabla tenemos que tener en cuenta el grado de libertad (n-2= 6-2= 4), y el nivel de confianza, que vamos a suponer que es del 95%.

Vemos que la T de Student de la fórmula es menor que la T de las tablas (1,63<2,132) por lo que aceptamos la hipótesis nula. Por tanto, las variables no están relacionadas, es decir, no existe relación significativa entre las personas que habitan una casa y el número de habitaciones que tiene.

Page 17: seminario 10 de estadistica y tics

Incluir los datos en SSPS y realizar gráfico dispersión simple, realizar la correlación de Pearson y evaluar los resultados.

Incluimos los datos en SPSS

Page 18: seminario 10 de estadistica y tics

Para realizar el gráfico de dispersión simple tenemos que seguir los siguientes pasos:

---”Gráficos”--- “cuadros de diálogo antiguos”--- “Dispersión/puntos”

Page 19: seminario 10 de estadistica y tics

Nos sale la siguiente tabla: Pinchamos en “dispersión simple” y en “definir”

Page 20: seminario 10 de estadistica y tics

Señalamos las dos variables: Personas y Habitaciones

Page 21: seminario 10 de estadistica y tics

Este sería el gráfico de dispersión simple que nos sale.

Page 22: seminario 10 de estadistica y tics

Para hacer la correlación de Pearson: “Analizar”--- “Correlaciones” --- “Bivariadas”

Page 23: seminario 10 de estadistica y tics
Page 24: seminario 10 de estadistica y tics
Page 25: seminario 10 de estadistica y tics

Vemos que la significación es 0,177 > 0,05 por lo que aceptamos la hipótesis nula y, por tanto, no existe relación entre las variables, así que la relación entre ambas variables se ha producido al azar.