estadistica modulo ii

22
TIPOS DE VARIABLES Según la medición Variables cualitativas Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles como sí y no, hombre y mujer o son politómicas cuando pueden adquirir tres o más valores. Dentro de ellas podemos distinguir: Variable cualitativa ordinal o variable cuasicuantitativa: La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado, grave. Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden como por ejemplo los colores. Variables cuantitativas Son las variables que se expresan mediante cantidades numéricas . Las variables cuantitativas además pueden ser: Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores específicos que la variable pueda asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5). Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg,...) o la altura (1,64 m, 1,65 m, 1,66 m,...), o el salario. Solamente se está limitado por la precisión del aparato medidor, en teoría permiten que siempre exista un valor entre dos variables. Según la influencia

Upload: jaryelis-higuera

Post on 31-Dec-2015

27 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Estadistica Modulo II

TIPOS DE VARIABLES

Según la medición

Variables cualitativas

Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles como sí y no, hombre y mujer o son politómicas cuando pueden adquirir tres o más valores. Dentro de ellas podemos distinguir:

Variable cualitativa ordinal o variable cuasicuantitativa: La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado, grave.

Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden como por ejemplo los colores.

Variables cuantitativas

Son las variables que se expresan mediante cantidades numéricas. Las variables cuantitativas además pueden ser:

Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores específicos que la variable pueda asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5).

Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg,...) o la altura (1,64 m, 1,65 m, 1,66 m,...), o el salario. Solamente se está limitado por la precisión del aparato medidor, en teoría permiten que siempre exista un valor entre dos variables.

Según la influencia

Variables independientes

Son las que el investigador escoge para establecer agrupaciones en el estudio, clasificando intrínsecamente a los casos del mismo. Un tipo especial son las variables de control, que modifican al resto de las variables independientes y que de no tenerse en cuenta adecuadamente pueden alterar los resultados por medio de un sesgo. Es aquella característica o propiedad que se supone ser la causa del fenómeno estudiado. En investigación experimental se llama así a la variable que el investigador manipula.

Page 2: Estadistica Modulo II

Variables dependientes

Son las variables de respuesta que se observan en el estudio y que podrían estar influenciadas por los valores de las variables independientes.

Hayman (1974 : 69) la define como propiedad o característica que se trata de cambiar mediante la manipulación de la variable independiente.

La variable dependiente es el factor que es observado y medido para determinar el efecto de la variable independiente.

Variables intervinientes

Son aquellas características o propiedades que, de una manera u otra, afectan el resultado que se espera y están vinculadas con las variables independientes y dependientes.

Variables moderadoras

Según Tuckman: representan un tipo especial de variable independiente, que es secundaria, y se selecciona con la finalidad de determinar si afecta la relación entre la variable independiente primaria y las variables dependientes. Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles como sí y no, hombre y mujer o son politómicas cuando pueden adquirir tres o más valores.

Tipos de variables

Variable Independiente

Una variable independiente es aquella cuyo valor no depende del de otra variable. La variable independiente en una función se suele representar por x. La variable independiente se representa en el eje de abscisas.

Variable Dependiente

Una variable dependiente es aquella cuyos valores dependen de los que tomen otra variable. La variable dependiente en una función se suele representar por y. La variable dependiente se representa en el eje ordenadas. La variable y está en función de la variable x.

Variable cualitativa

Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas con números. Podemos distinguir dos tipos:

Page 3: Estadistica Modulo II

Variable cualitativa nominal

Una variable cualitativa nominal presenta modalidades no numéricas que no admiten un criterio de orden. Por ejemplo:

El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.

Variable cualitativa ordinal o variable cuasicuantitativa

Una variable cualitativa ordinal presenta modalidades no númericas, en las que existe un orden. Por ejemplo:

La nota en un examen: suspenso, aprobado, notable, sobresaliente.

Puesto conseguido en una prueba deportiva: 1º, 2º, 3º, ...

Medallas de una prueba deportiva: oro, plata, bronce.

Variable cuantitativa

Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos:

Variable discreta

Una variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores específicos. Por ejemplo:

El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.

Variable continua

Una variable continua es aquella que puede tomar valores comprendidos entre dos números. Por ejemplo:

La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.

En la práctica medimos la altura con dos decimales, pero también se podría dar con tres decimales.

Variable aleatoria

Se llama variable aleatoria a toda función que asocia a cada elemento del espacio muestral E un número real.

Se utilizan letras mayúsculas X, Y, ... para designar variables aleatorias, y las respectivas minúsculas (x, y, ...) para designar valores concretos de las mismas.

Page 4: Estadistica Modulo II

Variable aleatoria discreta

Una variable aleatoria discreta es aquella que sólo puede tomar valores enteros.

Ejemplos

El número de hijos de una familia, la puntuación obtenida al lanzar un dado.

Variable aleatoria continua

Una variable aleatoria continua es aquella que puede tomar todos los valores posibles dentro de un cierto intervalo de la recta real.

Ejemplos

La altura de los alumnos de una clase, las horas de duración de una pila.

Variable aleatoria binomial

La variable aleatoria binomial, X, expresa el número de éxitos obtenidos en cada prueba del experimento.

La variable binomial es una variable aleatoria discreta, sólo puede tomar los valores 0, 1, 2, 3, 4, ..., n suponiendo que se han realizado n pruebas.

Ejemplo

k = 6, al lanzar una moneda 10 veces y obtener 6 caras.

Variable aleatoria normal

Una variable aleatoria continua, X, sigue una distribución normal de media μ y desviación típica σ, y se designa por N(μ, σ), si se cumplen las siguientes condiciones:

1. La variable puede tomar cualquier valor: (-∞, +∞ )

2. La función de densidad, es la expresión en términos de ecuación matemática de la curva de Gauss.

Variable estadística bidimensional

Una variable bidimensional es una variable en la que cada individuo está definido por un par de caracteres, (X, Y).

Estos dos caracteres son a su vez variables estadísticas en las que sí existe relación entre ellas, una de las dos variables es la variable independiente y la otra variable dependiente.

Page 5: Estadistica Modulo II

Distribución de frecuencias

La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.

Diagrama de barras

Un diagrama de barras se utiliza para de presentar datos cualitativos o datos cuantitativos de tipo discreto.

Los datos se representan mediante barras de una altura proporcional a la frecuencia.

Polígonos de frecuencias

Un polígono de frecuencias se forma uniendo los extremos de las barras mediante segmentos.

También se puede realizar trazando los puntos que representan las frecuencias y uniéndolos mediante segmentos.

Diagrama de sectores

Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentemente para las variables cualitativas.

Los datos se representan en un círculo, de modo que el ángulo de cada sector es proporcional a la frecuencia absoluta correspondiente.

Gráficos para variables cualitativas

Los gráficos más usuales para representar variables de tipo nominal son los siguientes:

Diagramas de barras: Siguiendo la figura 1.1, representamos en el eje de ordenadas las modalidades y en abscisas las frecuencias absolutas o bien, las frecuencias relativas. Si, mediante el gráfico, se intenta comparar varias poblaciones entre sí, existen otras modalidades, como las mostradas en la figura 1.2. Cuando los tamaños de las dos poblaciones son diferentes, es conveniente utilizar las frecuencias relativas, ya que en otro caso podrían resultar engañosas.

   Figura: Diagrama de barras para una variable cualitativa.

Page 6: Estadistica Modulo II

   Figura: Diagramas de barras para comparar una variable

cualitativa en diferentes poblaciones. Se ha de tener en cuenta que la altura de cada barra es proporcional al número de

observaciones (frecuencias relativas).

Diagramas de sectores (también llamados tartas). Se divide un círculo en tantas porciones como clases existan, de modo que a cada clase le corresponde un arco de círculo proporcional a su frecuencia absoluta o relativa (figura 1.3).

   Figura: Diagrama de sectores.

Page 7: Estadistica Modulo II

El arco de cada porción se calcula usando la regla de tres:

Como en la situación anterior, puede interesar comparar dos poblaciones. En este caso también es aconsejable el uso de las frecuencias relativas (porcentajes) de ambas sobre gráficos como los anteriores. Otra posibilidad es comparar las 2 poblaciones usando para cada una de ellas un

diagrama semicircular, al igual que en la figura 1.4. Sean los tamaños respectivos de las 2 poblaciones. La población más pequeña se representa con un semicírculo de radio r1y la mayor con otro de radio r2. La relación existente entre los radios, es la que se obtiene de suponer que la relación entre las areas de las circunferencias es igual a la de los tamaños de las poblaciones respectivas, es decir:

   Figura: Diagrama de sectores para comparar dos

poblaciones

Page 8: Estadistica Modulo II

Pictogramas Expresan con dibujos alusivo al tema de estudio las frecuencias de las modalidades de la variable. Estos gráficos se hacen representado a diferentes escalas un mismo dibujo, como vemos en la figura 1.5.

   Figura: Pictograma. Las áreas son proporcionales a las

frecuencias.

El escalamiento de los dibujos debe ser tal que el área1.1 de cada uno de ellos sea proporcional a la frecuencia de la modalidad que representa. Este tipo de gráficos suele usarse en los medios de comunicación, para que sean comprendidos por el público no especializado, sin que sea necesaria una explicación compleja.

1.9.4 Gráficos para variables cuantitativas

Para las variables cuantitativas, consideraremos dos tipos de gráficos, en función de que para realizarlos se usen las frecuencias (absolutas o relativas) o las frecuencias acumuladas:

Diagramas diferenciales:

Son aquellos en los que se representan frecuencias absolutas o relativas. En ellos se representa el número o porcentaje de elementos que presenta una modalidad dada.

Page 9: Estadistica Modulo II

Diagramas integrales:

Son aquellos en los que se representan el número de elementos que presentan una modalidad inferior o igual a una dada. Se realizan a partir de las frecuencias acumuladas, lo que da lugar a gráficos crecientes, y es obvio que este tipo de gráficos no tiene sentido para variables cualitativas.

Según hemos visto existen dos tipos de variables cuantitativas: discretas y continuas. Vemos a continuación las diferentes representaciones gráficas que pueden realizarse para cada una de ellas así como los nombres específicos que reciben.

1.9.4.1 Gráficos para variables discretas

Cuando representamos una variable discreta, usamos el diagrama de barras cuando pretendemos hacer una gráfica diferencial. Las barras deben ser estrechas para representar el que los valores que toma la variable son discretos. El diagrama integral o acumulado tiene, por la naturaleza de la variable, forma de escalera. Un ejemplo de diagrama de barras así como su diagrama integral correspondiente están representados en la figura 1.6.

1.9.4.2 Ejemplo Se lanzan tres monedas al aire en 8 ocasiones y se contabiliza el número de caras, X, obteniendose los siguientes resultados:

Representar gráficamente el resultado.

Solución: En primer lugar observamos que la variable X es cuantitativa discreta, presentando las modalidades:

Ordenamos a continuación los datos en una tabla estadística, y se representa la misma en la figura 1.6.

Figura: Diagrama diferencial (barras) e integral para una variable discreta. Obsérvese que el diagrama integral

Page 10: Estadistica Modulo II

(creciente) contabiliza el número de observaciones de la variable inferiores o iguales a cada punto del eje de abcisas.

xi ni fi Ni Fi

0 1 1/8 1 1/8

1 3 3/8 4 4/8

2 3 3/8 7 7/8

3 1 1/8 8 8/8

n=8 1

1.9.4.3 Ejemplo Clasificadas 12 familias por su número de hijos se obtuvo:

Número de hijos (xi) 1 2 3 4

Frecuencias (ni) 1 3 5 3

Comparar los diagramas de barras para frecuencias absolutas y relativas. Realizar el diagrama acumulativo creciente.

Solución: En primer lugar, escribimos la tabla de frecuencias en el modo habitual:

Variable F. Absolutas F. Relativas F. Acumuladas

Page 11: Estadistica Modulo II

xi ni fi Ni

1 1 0,083 1

2 3 0,250 4

3 5 0,416 9

4 3 0,250 12

12 1

Con las columnas relativas a xi y ni realizamos el diagrama de barras para frecuencias absolutas, lo que se muestra en la figura 1.7. Como puede verse es identico (salvo un cambio de escala en el eje de ordenadas) al diagrama de barras para frecuencias relativas y que ha sido calculado usando las columnas de xi y fi. El diagrama escalonado (acumulado) se ha construido con la información procedente de las columnas xi y Ni.

Figura: Diagramas de frecuencias para una variable discreta

Page 12: Estadistica Modulo II

1.9.4.4 Gráficos para variables continuas

Cuando las variables son continuas, utilizamos como diagramas diferenciales los histogramas y los polígonos de frecuencias.

Un histograma se construye a partir de la tabla estadística, representando sobre cada intervalo, un rectángulo que tiene a este segmento como base. El criterio para calcular la altura de cada rectángulo es el de mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de cada intervalo y el área de los mismos.

El polígono de frecuencias se construye fácilmente si tenemos representado previamente el histograma, ya que consiste en unir mediante lineas rectas los puntos del histograma que corresponden a las marcas de clase. Para representar el polígono de frecuencias en el primer y último intervalo, suponemos que adyacentes a ellos existen otros intervalos de la misma amplitud y frecuencia nula, y se unen por una línea recta los puntos del histograma que corresponden a sus marcas de clase. Obsérvese que de este modo, el polígono de frecuencias tiene en común con el histograma el que las áreas de la gráficas sobre un intervalo son idénticas. Veanse ambas gráficas diferenciales representadas en la parte superior de la figura 1.8.

El diagrama integral para una variable continua se denomina también polígono de frecuencias acumulado, y se obtiene como la poligonal definida en abcisas a partir de los extremos de los intervalos en los que hemos organizado la tabla de la variable, y en ordenadas por alturas que son proporcionales a las frecuencias acumuladas. Dicho de otro modo, el polígono de frecuencias absolutas es una primitiva del histograma. Véase la parte inferior de la figura 1.8, en la que se representa a modo de ilustración los diagramas correspondientes a la variable cuantitativa continua expresada en la tabla siguiente:

Intervalos ci ni Ni

0 -- 2 1 2 2

2 -- 4 3 1 3

4 -- 6 5 4 7

6 -- 8 7 3 10

8 - 10 9 2 12

12

Figura: Diagramas diferenciales e integrales para una

Page 13: Estadistica Modulo II

variable continua.

1.9.4.5 Ejemplo La siguiente distribución se refiere a la duración en horas (completas) de un lote de 500 tubos:

Duración en horas Número de tubos

300 -- 500 50

500 -- 700 150

700 -- 1.100 275

más de 1.100 25

Total 500

Representar el histograma de frecuencias relativas y el polígono de frecuencias. Trazar la curva de frecuencias relativas acumuladas. Determinar el número mínimo de tubos que tienen una duración inferior a 900 horas.

Solución: En primer lugar observamos que la variable en estudio es discreta (horas completas), pero al tener un rango tan amplio de valores resulta más conveniente agruparla en intervalos, como si de una variable continua se tratase. La consecuencia es una ligera perdida de precisión.

Page 14: Estadistica Modulo II

El último intervalo está abierto por el límite superior. Dado que en él hay 25 observaciones puede ser conveniente cerrarlo con una amplitud ``razonable''. Todos los intervalos excepto el tercero tienen una amplitud de 200 horas, luego podríamos cerrar el último intervalo en 1.300 horas1.2.

Antes de realizar el histograma conviene hacer una observación importante. El histograma representa las frecuencias de los intervalos mediante áreas y no mediante alturas. Sin embargo nos es mucho más fácil hacer representaciones gráficas teniendo en cuenta estas últimas. Si todos los intervalos tienen la misma amplitud no es necesario diferenciar entre los conceptos de área y altura, pero en este caso el tercer intervalo tiene una amplitud doble a los demás, y por tanto hay que repartir su área en un rectángulo de base doble (lo que reduce su áltura a la mitad).

Así será conveniente añadir a la habitual tabla de frecuencias una columna que represente a las amplitudes ai de cada intervalo, y otra de frecuencias relativas rectificadas, fi', para representar la altura del histograma. Los gráficos requeridos se representan en las figuras 1.9 y 1.10.

Intervalos ai ni fi fi' Fi

300 -- 500 200 50 0,10 0,10 0,10

500 -- 700 200 150 0,30 0,30 0,40

700 -- 1.100 400 275 0,55 0,275 0,95

1.100 -- 1.300 200 25 0,05 0,05 1,00

n=500

Figura: Histograma. Obsérvese que la altura del histograma en cada intervalo es fi' que coincide en todos con fisalvo en

el intervalo 700 -- 1.100 en el que ya que la amplitud de ese intervalo es doble a la de los demás.

Page 15: Estadistica Modulo II

Figura: Diagrama acumulativo de frecuencias relativas

Por otro lado, mirando la figura 1.9 se ve que sumando frecuencias relativas, hasta las 900 horas de duración hay

0,10 + 0,30 + 0,275 = 0,675 = 67,5 % de los tubos.

Esta cantidad se obtiene de modo más directo viendo a qué altura corresponde al valor 900 en el diagrama de frecuencias acumuladas (figura 1.10).

Page 16: Estadistica Modulo II

Como en total son 500 tubos, el número de tubos con una duración igual o menor que 900 horas es

, redondeando, 338 tubos.

Tabla: Principales diagramas según el tipo de variable.

Tipo de variable Diagrama

V. Cualitativa Barras, sectores, pictogramas

V. Discreta Diferencial (barras)

Integral (en escalera)

V. Continua Diferencial (histograma, polígono de frecuencias)

Integral (diagramas acumulados)

TABLA DE DOBLE ENTRADA

Tablas de doble entrada: También llamadas tablas de contingencias, son aquellas tablas de datos referentes a dos variables, formada, en las cabeceras de las filas, por las categorías o valores de una variable y en las de las columnas por los de la otra, y en las casillas de la tabla, por las frecuencias o numero de elementos que reúnen

Page 17: Estadistica Modulo II

a la vez las dos categorías o valores de las dos variables que se cruzan en cada casilla. Para la tabulación de un material agrupado de observaciones simultaneas de dos variables aleatorias necesitaremos una tabla descrita como anteriormente lo describimos, las reglas para agrupar son las mismas que en el caso de una sola variable.Este tipo de tablas brindan información estadística de dos eventos relacionados entre sí, es útil en casos en los cuales los experimentos son dependientes de otro experimento, mas adelante aparecen mas aplicaciones del análisis estadístico bivariable.DescripciónEn una tabla de doble entrada, los datos se muestran en columnas y filas al igual que en las tablas. Sin embargo, en comparación con las tablas, cada columna tiene por lo menos un encabezado y cada fila tiene por lo menos un encabezado de fila. Los datos correspondientes aparecen en la intersección de los encabezados de la columna y la fila: esta sección corresponde al "cuerpo".El ejemplo: de la tabla de doble entrada muestra el volumen de negocios por prestación y por trimestre. Los rótulos de las prestaciones son encabezados de fila y, los rótulos de trimestre son encabezados de columna. El volumen de negocios para cada prestación para cada trimestre aparece en el cuerpo.Para entender la disposición de los elementos en una tabla de doble entrada, imagínese la tabla de doble entrada como un bloque terminado. Los objetos que se colocan en el cuadrante inferior izquierdo de la tabla de doble entrada proporcionan los datos para los encabezados de fila; los objetos colocados en el cuadrante superior derecho proporcionan los datos para los encabezados de columna, y los objetos del cuadrante inferior derecho proporcionan los datos para el cuerpo de la tabla. No puede colocar ningún objeto en el cuadrante superior izquierdo.

Uso :Presentación de la información en un formato multidimensional de filas y columnas, donde cada elemento está asociado a otro. Por ejemplo, un tipo de prestación podría estar asociado a un centro de vacaciones en particular.

Importante :Organice los objetos en el orden en que desea que aparezcan en el bloque.Depende de si el documento contiene secciones o no, la disposición del cuerpo de la tabla de doble entrada corresponde siempre a la organización de los objetos del panel Bloque.Los objetos de tipo indicador no se pueden utilizar en los encabezados verticales u horizontales; sólo se pueden utilizar en el cuerpo de la tabla de doble entrada.Puede utilizar más de un objeto en el cuerpo de la tabla de doble entrada.

Puede utilizar varios objetos en los encabezados verticales u horizontales. Por ejemplo, podría utilizar los objetos Tipos de prestaciones y Prestaciones en un encabezado, de modo que tanto el tipo de prestaciones como las prestaciones se muestren en la tabla de doble entrada.Los objetos no tienen que formar parte de la misma clase. Por ejemplo, podría utilizar los objetos Tipo de prestaciones y Centro de vacaciones para mostrar información por tipo de prestaciones por centro de vacaciones.