seminario vi

14
SEMINARIO VI Alicia Zazo Luengo Virgen del Rocío, grupo 16

Upload: aliciazazoluengo

Post on 12-Apr-2017

56 views

Category:

Data & Analytics


0 download

TRANSCRIPT

Page 1: Seminario VI

SEMINARIO VIAlicia Zazo LuengoVirgen del Rocío, grupo 16

Page 2: Seminario VI

Ejercicio 1

• Selecciona dos variables cualitativas-factor del fichero “activossalud.RData”, descríbelas en tablas de frecuencias e interpreta al menos 3 aspectos en relación a la distribución de las mismas.

Page 3: Seminario VI

Después de haber cargado el conjunto de datos “activosensalud.RData” que nos hemos descargado previamente, escogemos dos variables cualitativas (tabaco y cerveza), de la siguiente manera:

Page 4: Seminario VI

Las tablas de frecuencicas serían:

Page 5: Seminario VI

Concretamos que es llamativo que:• El 13,84% de los individuos toma cerveza 2 o 3 veces al mes• Son 3 los individuos que hacen botellón a diario • El 2,11 % hacen botellón dos o treces a las semanas.

Page 6: Seminario VI

Ejercicio 2

• Selecciona dos variables numéricas del fichero “activossalud.RData”, y mediante resúmenes numéricos describe e interpreta la distribución de las mismas.

Page 7: Seminario VI

Esta vez, en ver de “distribución de frecuencias”, hacemos clic en “resúmenes numéricos”, y vamos a seleccionar dos variables numéricas: peso y altura

Page 8: Seminario VI

INTERPRETACIÓN DE LA DISTRIBUCIÓN

La variable “altura” tiene una media de 1,66700. También tiene una desviación de 0,8078101. La mediana coincide con el segundo cuartil (Q2), que en este caso es 1,655.Se trata de una variable simétrica, ya que la media y la mediana tienen valores similares. Solo hay un caso no disponible.

La variable “peso” tiene una media de 62,75571, y una desviación de 12,65981241. La mediana, que coincide que con el segundo cuartil (Q2), es de 60.000. La media y la mediana son muy parecidas, por lo que podemos decir también que es una variable simétrica. Además, 16 individuos no han contestado.

Page 9: Seminario VI

Ejercicio 3

• Debes realizar al menos un gráfico de cada tipo con variables adecuadamente seleccionadas del fichero “activossalud.RData”, describe e interpreta la distribución los mismos.

Page 10: Seminario VI

• Sabemos que para las variables cualitativas podemos usar el gráfico de barras y el de sectores.

• Para las variables cuantitativas utilizaremos, por otro lado, el histograma de frecuencias y el diagrama de cajas.

Page 11: Seminario VI

Comenzaremos con las variables cualitativas: cerveza y botellón

DIAGRAMA DE SECTORES

• Es llamativo , viendo el diagrama, la cantidad de personas que nunca beben cerveza, y el mínimo número de individuos que la beben a diario.

• Además, el porcentaje de individuos que beben cerveza alguna vez y el que la bebe los fines de semana parecen ser muy similares.

Page 12: Seminario VI

GRÁFICO DE BARRAS

• Aquí, podemos concretar que es relevante el hecho de que el porcentaje de personas que toman dulces a diario es más alto de lo que se esperaría.

• Por otro lado, también vemos que el porcentaje de personas que los toman menos de una vez a la semana es el más alto.

Page 13: Seminario VI

A continuación, damos paso a las variables cuantitativas: altura y

HISTOGRAMADada la gráfica, podemos decir que la mayoría de los individuos de la muestra tiene una altura concentrada entre 1,55 y 1,7 cm.

Page 14: Seminario VI

DIAGRAMA DE CAJAS

• Podemos concluir que se trata de una variable simétrica, ya que el diagrama nos muestra que la media y la mediana coinciden y los datos se distribuyen de igual manera a ambos lados.