medidas de tendencia central y dispercion

Post on 02-Aug-2015

1.761 Views

Category:

Education

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Caracterización de variables cuantitativas

José David Ojeda

Datos no agrupados

Medidas de tendencia central

Medidas de tendencia central

1. El diagrama de dispersiónEs la representación de los datos en la recta numérica mediante puntos.Ejemplo: A continuación se relacionan las cantidades de artículos vendidos en una tienda de computadores durante 15 días.25, 32, 20, 21, 29, 26, 30, 25, 19, 22, 17, 28, 30, 21, 40.

1. El diagrama de dispersión• Elaborar un diagrama de dispersión y

analizarlo.

En la gráfica se puede observar que la mayoría de los datos, exceptuando el dato 40, se encuentran cercanos entre si. Es decir que el numero de artículos vendidos fue muy parecido en 14 de los 15 días.

17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40

Medidas de tendencia central

2. La Media:La media aritmética o promedio se representa por y se interpreta como el individuo típico de la población:

1 2 31,

n

ini

XX X X X

Xn n

X

2. La Media:• Ejemplo: El jefe de recursos humanos de

una empresa esta interesado en determinar el numero medio de cigarrillo que consumen los trabajadores en un día. Para ello pregunto a 16 empleados por la cantidad de cigarrillos que fumaron ese día, los resultados fueron:

• 3 1 4 7 6 7 0 4 6 2 3 1 0 2 2 0Calcular el numero promedio de cigarrillos que consume un trabajador.

2. La Media:• Solución: Calculamos la media aritmética

El numero medio de cigarrillos que consume un trabajador en un día es de tres. Se espera que al escoger al azar un empleado de la empresa, fume alrededor de 3 cigarrillos

3 1 4 7 6 7 0 4 6 2 3 1 0 2 2 016

X

483

16X

Medidas de tendencia central

3. La Mediana:Es el dato que divide un grupo de datos en dos partes iguales. Se simboliza .Para calcular la mediana es necesario ordenar los datos de menor a mayor, una vez ordenados se ubica el valor que esta en el centro de ellos.

3. La Mediana:• En el calculo de la mediana se pueden

presentar dos casos:• Caso 1: Numero de datos impar: En

este caso se suma 1 a la cantidad de datos y se divide entre 2. La mediana será el dato que esta en esa posición.Por ejemplo si se tienen 11 datos, la mediana estará en la posiciónluego de ordenar los datos.11 1

62

3. La Mediana:

• Ejemplo: Un biólogo desea probar que el diámetro del tronco de un árbol influye en la producción de oxigeno para ello hace la medición del diámetro de 7 arboles en centímetros:110, 79, 128, 161, 158, 175, 50.Calcular la mediana de los diámetros de tronco.

3. La Mediana:

• Solución:Ordenamos los datos de menor a mayor50, 79, 110, 128, 158, 161, 175

Se concluye que el 50% de los diámetros de tronco son iguales o superior a 128.

47 12

128x x

3. La Mediana:• Caso 2: Numero de datos par: Se

divide el total de datos entre 2. Se toma el dato que esta en esa posición y el dato siguiente, la mediana será el promedio de estos dos datos.

3. La Mediana:• Ejemplo 2: En un simulacro se midió el

tiempo de reacción de seis patrullas de policías luego de recibir una llamada de emergencia. Los resultados en minutos fueron:

6,0 5,99 5,41 5,44 5,21 5,48Calcular la mediana de los tiempos de reacción.

• Solución: Ordenamos los datos de menor a mayor.

3. La Mediana:

5,21 5,41 5,44 5,48 5,99 6,0

Se puede concluir que el 50% de las patrullas llegaron en 5,46 minutos o menos.

6 61

2 2 3 4 5,44 5,485,46

2 2 2

x xx x

Medidas de Dispersión

Medidas de Dispersión

Medidas de Dispersión

Medidas de Dispersión

2

2 1

( )

1

n

ii

x XS

n

Medidas de Dispersión• Ejemplo: El entrenador de un equipo

de futbol pregunto a los jugadores sobre el tiempo en horas que dedican al entrenamiento por semana. Los resultados fueron:

5, 5, 6, 8, 7, 7, 9, 5, 6, 8, 4, 11, 6, 10, 8.

Solución: Hallamos la media de los datos

5 5 6 8 7 7 9 5 6 8 4 11 6 10 815

X

10515

7X

Medidas de Dispersión• Hallamos la desviación de cada uno de

los datos con respecto a la media y su cuadrado.

• Teniendo en cuenta la tabla anterior, la varianza es:

2 4 4 1 1 0 0 4 4 1 1 9 16 1 9 115 1

S

2 25614

4 HorasS

Medidas de Dispersión

3. Desviación EstándarSe nota como S, y es la raíz cuadrada de la varianza

La desviación estándar se utiliza para interpretar el comportamiento de los datos y la representatividad del promedio

2

2 1

( )

1

n

ii

x XS S

n

Medidas de Dispersión

• La varianza al ser sumada y restada dos veces a la media, proporciona un intervalo en el cual se encuentra el 95% de los datos, este intervalo se denomina intervalo de extremos :

• Si este intervalo es muy grande, se dice que el promedio no representa bien a los datos. En el caso contrario se dirá que el promedio es un buen representante de los datos.

2 , 2X s X s

Medidas de Dispersión• Para el ejemplo del equipo de futbol

la desviación estándar sería:

• Construimos el intervalo de extremos:

Se observa que los datos están muy alejados entre si, ya que el 95% de los futbolistas entrena entre 3 y 11 horas semanales.

2 2 2 Horas4 HorasSS

7 2(2) 2 , 2 3, 7 2(2) , 11X s X s

Medidas de Dispersión

• Ejemplo: A continuación se muestran las edades de 20 pacientes del pabellón de adultos del Hospital General55, 78, 50, 41, 55, 35, 41, 42, 51, 54, 41, 54, 72, 76, 75, 47, 62, 59, 75, 46.

• Caracterizar la variable utilizando la media, el rango, la varianza y la desviación estándar y el intervalo de extremos.

Medidas de Dispersión

1). Hallamos la media

2). Hallamos el rango

55 78 50 41 55 35 41 42 51 54 41 54 72 76 75 47 62 59 75 4620

X

110920

55,45X

78 35

43

Mayor MenorRango D D

Rango

Rango

Medidas de Dispersión

3). Hallamos la VarianzaEn la siguiente tabla hallamos la desviación de cada dato y el cuadrado de estaDato 55 78 50 41 55 35 41 42 51 54

Desviación

-0,45 22,55 -5,45-

14,45-0,45

-20,45

-14,45

-13,45

-4,45 -1,45

Cuad. Des.

0,203

508,5

29,7208,

80,20

3418,

2208,

8180,

919,8

2,103

Dato 41 54 72 76 75 47 62 59 75 46

Desviación

-14,45

-1,45 16,55 20,55 19,55 -8,45 6,55 3,55 19,55 -9,45

Cuad. Des.

208,8

2,103

273,9

422,3

382,2

71,4 42,9 12,6382,

289,3

Medidas de Dispersión

• Utilizando los resultados de la tabla anterior, hallamos la varianza:

4). Hallamos la Desviación Estándar:

2 20,203 508,5 29,7 ... 89,3

20 1182,36 añosS

2 2182,36 añ 13,5 os añosS S

Medidas de Dispersión5). Hallamos el intervalo de extremos

Dentro de este intervalo se encuentra el 95% de los datos, como el intervalo es muy grande, aproximadamente de 28 a 83 años, la variabilidad es muy alta.Las edades de los pacientes son entonces muy heterogéneas, la media no representa bien los datos

55,45 2(13,5) 55,45 2(13,5)

2 , 2 ,

28, , 45 82,45

X s X s

top related