ejercicio estadística seminario 7

14
R Commander: Tablas de contingencia y asociación entre variables. Realizado por Ismael Rodríguez Godino Subgrupo 16 – Virgen del Rocío Estadística y TICS. SEMINARIO VII.

Upload: ismael-rodriguez-godino

Post on 15-Apr-2017

227 views

Category:

Art & Photos


0 download

TRANSCRIPT

Page 1: Ejercicio estadística seminario 7

R Commander: Tablas de contingencia y asociación entre variables.Realizado por Ismael Rodríguez Godino

Subgrupo 16 – Virgen del Rocío

Estadística y TICS. SEMINARIO VII.

Page 2: Ejercicio estadística seminario 7

INTRODUCCIÓN.R Commander puede realizar operaciones estadísticas de diversas índoles. En esta ocasión, vamos a realizar actividades relacionadas con la asociación de variables, utilizando tablas de contingencia.

Las actividades a realizar son: A partir de este ejercicio, realizarlo manualmente y contrastar los resultados con la actividad hecha

en R Commander.• Si queremos conocer si existe asociación entre el consumo de tabaco y el bajo peso al nacer;

estudiamos a 250 mujeres fumadoras y a 1750 mujeres no fumadoras y encontramos que: De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer. De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al nacer.

Establecer y describir si existe asociación entre las variables del archivo “activossalud.Rdata” sexo y: Practicadeporte (Sí, No); Fruta: 1- “Nunca o casi nunca”, 2- “Menos de una vez por semana”, 3-“Una o dos veces a la

semana”, 4- “Tres o más veces a la semana”, 5 “A diario”.

Page 3: Ejercicio estadística seminario 7

Ejercicio manual y ejercicio a resolver en

R Commander.

1ª Actividad del seminario VII.

Page 4: Ejercicio estadística seminario 7

El enunciado de la actividad es: Si queremos conocer si existe asociación entre el consumo de tabaco y el bajo peso al nacer; estudiamos a 250 mujeres

fumadoras y a 1750 mujeres no fumadoras y encontramos que:• De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer.• De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al nacer.

1. Representa los datos en un tabla de contingencia indicando las frecuencias observadas y porcentajes.

MANERA MANUAL

Page 5: Ejercicio estadística seminario 7

2. Establece una hipótesis adecuada para el estudio.¿Existe asociación entre el consumo de tabaco y la probabilidad de tener un bebe con bajo peso al nacer?Ho= No existe asociación entre el consumo de tabaco en mujeres y el bajo peso al nacer de los bebes.Hi= existe asociación entre el consumo de tabaco en mujeres y el bajo peso al nacer de los bebes.

3. Utiliza la prueba chi-cuadrado de Pearson para contrastar tu hipótesis.a) Para calcular la chi cuadrado es necesario calcular las frecuencias esperadas (aquellas que deberían haberse observado si la Ho fuese cierta) y frecuencias observadas en nuestro estudio (FO).

Las frecuencias esperadas serán:

Page 6: Ejercicio estadística seminario 7

La tabla de frecuencias observadas y las esperadas quedará de esta manera:

b) A continuación, vamos a calcular chi cuadrado mediante la fórmula:

c) Una vez conocida la X2, necesitamos saber los grados de libertad. Los grados de libertad se calculan (Número de filas-1)*(Número de columnas menos 1), por tanto nuestros g.l serán 1.

Page 7: Ejercicio estadística seminario 7

d) Una vez conocidos tantos chi cuadrado real como los grados de libertad, vamos a la tabla chi cuadrada, para conocer la chi cuadrada teórica asociada a nuestro margen de error establecido (0,05).

De manera que teniendo en cuenta la condición:• Si el chi cuadrado real es menor o igual que la chi cuadrado teórica aceptamos hipótesis nula (no hay relación

entre variables)• Si el chi cuadrado real es mayor que la chi cuadrado teórica rechazamos la hipótesis nula, aceptando la

alternativa (hay relación entre variables). Por tanto, como X2 real (40,044) > X2 teórica (3,84) nuestra hipótesis nula es FALSA (Ho) y por tanto, existirá dependencia o asociación entre el consumo de tabaco y el bajo peso al nacer de los bebes.

El X2 teórico es 3, 84.

4. Calcula la odds ratio.

En nuestro caso, la odds ratio es mayor a 1, por tanto, OR>1 la presencia del factor se asocia a mayor ocurrencia del evento.

Page 8: Ejercicio estadística seminario 7

5. Repite el ejercicio con R Commander ¿Los resultados son los mismos?

a) Primero vamos a abrir R Commander. Una vez abierto, pulsamos sobre “estadísticos”, luego sobre “tablas de contingencia” y finalmente sobre “Introducir y analizar un tabla de doble entrada”.

Introducimos los valores de nuestra tabla de 2x2, cogiendo los datos del ejercicio propuesto:

R COMMANDER

Page 9: Ejercicio estadística seminario 7

Una vez incluido los datos, pulsamos en aceptar y nos aparecerá en la ventana de resultados, los valores de chi cuadrado y “p”; test exacto de Fisher y la odds ratio.

Valores de X2 y “P”.

Frecuencias esperadas (FE)

Test exacto de Fisher y odds ratio.

CONCLUSIÓN: Los valores de X2 (40,044), “p”, las FE (frecuencias esperadas), test exacto de Fisher y Odds ratio (3,25158) presentan valores similares a los valores dados al realizar de manera manual la actividad.

Page 10: Ejercicio estadística seminario 7

Asociación entre variables de un

conjunto de datos.2ª Actividad

Page 11: Ejercicio estadística seminario 7

1. Primero debemos abrir R commander. Una vez dentro, deberemos cargar el archivo de R “activossalud-2.Rdata”. Para ello, pulsamos sobre “Datos” y posteriormente sobre “Cargar conjunto de datos” (Realmente habria un paso anterior, determinando el directorio de trabajo pero eso ya lo hemos explicado en seminarios anteriores).

Nos aparecerá una ventana, buscamos nuestro archivo de R en nuestro ordenador y posteriormente pulsamos en aceptar.

Page 12: Ejercicio estadística seminario 7

2. Una vez cargado el conjunto de datos vamos a construir una tabla de contingencia. Para ello, pulsamos sobre “estadísticos”, luego sobre “Tablas de contingencia” y finalmente sobre “Tabla de doble entrada…”.

Page 13: Ejercicio estadística seminario 7

3. Una vez hecho lo anterior comenzamos a probar la asociación entre ciertas variables:a) Entre la variable “SEXO” y la variable “PRACTICADEPORTE”.

Conclusión: Como podemos ver en los resultados la X2 real es 19,163, como la X2 real es mayor que X2 teórica (3,84), rechazamos la hipótesis nula (Ho) y, por tanto, al aceptar la hipótesis alternativa declaramos que existe asociación entre la variable “sexo” y la variable “practicadeporte”.

Page 14: Ejercicio estadística seminario 7

b) Entre la variable “sexo” y la variable “Fruta”.

Conclusión: Como podemos ver en los resultados la X2 real es 7,6036; como la X2 real es mayor que X2 teórica (3,84), rechazamos la hipótesis nula (Ho) y, por tanto, al aceptar la hipótesis alternativa declaramos que existe asociación entre la variable “sexo” y la variable “Fruta”.