clase2 medidas resumen be 18 marzo 2014
TRANSCRIPT
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
1/46
BIOESTADISTICA ICURSO 2014
Estadstica DescriptivaMedidas de Resumen I
Raquel Correa Luna
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
2/46
Conocer y calcular las diferentes medidas de
localizacin (tendencia central y posicin)
Conocer y calcular las diferentes medidas de dispersin
Conocer y calcular medidas de asimetra
Identificar y comparar mtodos numricos para resumirdatos
Saber seleccionar las medidas de resumen msadecuadas a diferentes tipos de datos
OBJETIVOS DE LA CLASE
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
3/46
Clases f F fr Fr
330-345 3 3 0,09 0,09
345-360 3 6 0,09 0,17
360-375 4 10 0,11 0,29
375-390 12 22 0,34 0,63
390-405 7 29 0,20 0,83
405-420 4 33 0,11 0,94
420-435 2 35 0,06 1,00TOTAL 35 1,00
n f
x
frecuenciaABSOLUTA
ACUMULADA
frecuenciaRELATIVA
ACUMULADA
n
F
Fr
MARCA DE CLASE (O PUNTO MEDIO)
53372
345330
2.
LsLi
337.5
352.5
367.5
382.5
397.5
412.5
427.5
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
4/46
MEDIDAS DE RESUMEN DE DATOS NUMERICOS
Se podra condensar la informacin contenida en los
datos con algunos pocos valores que la expresen de formaclara y concisa ?
PARMETROSCaractersticas medibles de una
poblacin.Representadas por letras griegas.Valor fijo para una poblacin dada.
ESTADSTICOSCaractersticas medibles de una
muestra, usadas para estimarparmetros poblacionales.Representadas por letras latinas.Variablepara la poblacin de muestra(cambia de muestra en muestra).
poblacin
muestras
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
5/46
RESUMEN NUMERICO DE DATOS Medidas de Localizacin (posicin)
.
Medidas Dispersin
Medidas de Asimetra Coeficiente de Asimetra
Valores que tienden
a representar mejoral conjunto de datos
Medidas de Tendencia CentralMedia Aritmtica
MedianaModa
Cuantiles (separatrices)Cuartiles, Quintiles, Deciles,Percentiles
Medida de informacinrespecto a la cantidadde variabilidadpresente en un conjuntode datos.
Amplitud TotalSemirecorrido IntercuartlicoVarianzaDesviacin Tpica
Medida de la forma de ladistribucin
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
6/46
Medidas de Pos icin o Local izacin
De tendencia central : MODA, MEDIANA , MEDIA aritmticaCuantiles o Separatrices: CUARTILES, DECILES, PERCENTILES
Identifican una la posicin en una distribucin, se utilizan paradescribir o representar lo mejor posible una distribucin de
frecuencias, pero tambin son valores de referencia para un
comparacin con otras distribuciones de frecuencia. Ademspara un valor de una caracterstica de una observacin
individual, se puede determinar la posicin relativa de esa
unidad con respecto a las otras unidades estudiadas.
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
7/46
Media Aritmtica
1
N
i
i
x
N
n
i
i
x
x n
1
k
i i
ix f
N
1 1
1
k k
i ii i
i i
k
i
i
x f x fx
nf
poblacin muestra
agrupar
datos sin
datosagrupados
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
8/46
EJEMPLO
(4.37+4.87+4.35+3.92+4.68+4.54+5.24+4.57+4.59+4.66+4.40+4.73+4.83+4.2163.96 4.57 /
14
x
x mmol l
Se toma una muestra de 14 perros y se determina suvalor K en plasma (mmol/l):
4.37, 4.87, 4.35, 3.92, 4.68, 4.54, 5.24, 4.57, 4.59, 4.66, 4.40, 4.73, 4.83, 4.2
Calcular la media aritmtica para los datos sin agrupar
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
9/46
Clases Xi f Xi(fi) Xi(fi) Xi(fr)
330-344 337 3 337(3) 1011 28,89
345-359 352 3 352(3) 1056 30,17360-374 367 4 367(4) 1468 41,94
375-389 382 12 382(12) 4584 130,97
390-404 397 7 397(7) 2779 79,40
405-419 412 4 412(4) 1648 47,09420-434 427 2 427(2) 854 24,40
TOTAL 35 13400 382,86
EJEMPLO para datos agrupados
Marca declase
xfr .
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
10/46
CARACTERSTICAS DE LA MEDIA ARITMTICA
til para comparar poblaciones Nose puede calcular con clases extremas abiertas
ej: 1,2, 3 , 4, 4,6 media= 20/6 = 3,33
1, 2, 3, 4, 4, 16 media= 30/6 =5
ej.: (1- 5)+(2-5)+(3-5)+(4-5)+(4-5) +( 16- 5) = 0
Calculada para datos en escala de Intervalo y Proporcin (Razn)
Centro de gravedad de la distribucin
nicapara un conjunto dado de datos
Sensiblea todos los valores del conjunto de datos, sobre todo extremos
La suma de desvos de los datos con respecto a la media es 0
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
11/46
MEDIANA
DefinicinValor de los datos ordenados, que deja por debajo de s, e50%de las observaciones
Caractersticas
Calculada para datos en escala Ordinal, Intervalo y Proporcin (razn) nicapara un conjunto dado de datos
Fcilde determinar en datos no agrupados
No es influenciada por valores extremos Se puede calcularcon clases con extremos abiertos
Mediana o Percentil 50
MEDIANA
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
12/46
MEDIANA
2) Aplicar la frmula de clculo
Sin Agrupar:1) Ordenar
2) Determinar el n de posicin i
3) Hallar el valor de x en la posicin i
Datos Agrupados
1) Determinar la clase que contiene la Mn buscando la primera clase con Fr>0,5
O bien : Buscar la clase que contiene la Mn por el n de posicin i, buscando primera clase con F >i
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
13/46
Es el valor de la variableque divide a las observaciones en dosgrupos con el mismo nmero de individuos (percentil 50).
Si el nmero de datos es par, se elige la media de los dos datoscentrales
MEDIANA ( P50, Q2)
Mnes 5
Si el nmero de observaciones es IMPAR 1, 2, 4, 5, 6, 6, 8
Si el nmero de observaciones es PAR 1, 2, 4, 4,5, 6, 6, 8
Mn es (4+5)/2 = 4,5
M di j l d t sin agr par
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
14/46
314 991 789 556 412 499 350 863 455 297
598 510 388 642 474 333 421 685 536
297 314 333 350 388 412 421 455 474 499510 536 556 598 642 685 789 863 991
DatosNo Ordenados
Datos Ordenados
Pesos en gr de 19 cobayos:
Mediana .- ejemplo datos sin agrupar
2) Determinar el n de posicin 1
2
ni
10
2
119
3) Hallar el valor de x en la posicin i =10 Mn = 499
CALCULO de la MEDIANA para datos agrupados
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
15/46
f F
3 3
3 6
4 10
12 22
7 29
4 33
2 35
35
Clases
330-345
345-360
360-375
375-390
390-405
405-420
420-435
TOTAL
CALCULO de la MEDIANA para datos agrupados
1) Determinar la posicin 185.0)135(
2) clase que contiene la Mediana
3) Realizar la interpolacin para hallar el valorde la
i
2a
nF
Mn L hf
5.3825.73751512
10235375
Mn
Extensin del intervalo h = 390-375
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
16/46
Clases Xi f F fr Fr
330-344 337 3 3 0,09 0,09
345-359 352 3 6 0,09 0,17
360-374 367 4 10 0,11 0,29
375-389 382 12 22 0,34 0,63
390-404 397 7 29 0,20 0,83
405-419 412 4 33 0,11 0,94
420-434 427 2 35 0,06 1,00
TOTAL 35 1,00
EJEMPLO datos agrupados:el resultadoes diferente para diferentes agrupamientos
383,9 KgClase que contienela mediana
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
17/46
EJEMPLODistribucin de frecuencias relativas acumuladas
de los pesos de novillos. FV. 2002
0,00,1
0,20,3
0,40,50,6
0,7
0,80,9
1,0
330 345 360 375 390 405 420 435
Marcas de Clase Kg
Fr
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
18/46
Se puede calcular con clases con extremos abiertos
Caractersticas de la Mediana
Calculada para datos en escala Ordinal, Intervalo y Proporcin (razn)nica para un conjunto dado de datos
Fcil de determinar en datos no agrupados
No es influenciada por valores extremos
1, 2, 4, 5, 6, 6, 800.La mediaes 117,7
La medianaes 5
MODA
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
19/46
Caractersticas til para medidas nominales y ordinales
Nose afecta por valores extremos
Se puede utilizar con clases abiertas
Puede no existir o no ser nica
MODADefinicin : Valor de la variable con mayor frecuencia
datos sin agrupar
Mo = 455
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
20/46
Poblacin o Muestra
Moda
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
21/46
MODA datos agrupados
hLiMo .
21
1
1) Determinar la clase que contiene la Moda2) Aplicar la frmula:
1 Diferencia entre lafrecuencia de la clase modal yla clase anterior
2 Diferencia entre lafrecuencia de la clase modal yla clase siguiente
CALCULO d l MODA d t d
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
22/46
Extensin del intervalo h = 390-375
23.38423.93751558
8375
Mo
f F
3 3
3 6
4 10
12 22
7 29
4 33
2 35
35
Clases
330-345
345-360
360-375
375-390
390-405
405-420
420-435
TOTAL
CALCULO de la MODA para datos agrupados
1) Determinar la clase que contiene la Moda
2) Realizar la interpolacin para hallar el valorde la
375Li
hLiMo
21
1
= 124 = 8 2 = 127 = 5
2
f fi d d t i l d
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
23/46
12
xL iLimite inferior de la clase modal
Mo
forma grafica de determinar la moda
CUAL MEDIDA DE TENDENCIA CENTRAL USAR?
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
24/46
CUAL MEDIDA DE TENDENCIA CENTRAL USAR?
Se debe considerar:
Escala de Medicin Forma de la Distribucin
MEDIA Datos Numricos y distribuciones Simtricas
MEDIANA Datos Ordinales o Numricos con distribuciones
Sesgadas
MODA Datos Nominales y distribuciones bimodales
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
25/46
Histograma
0
2
4
6
8
10
12
14
16
100 110 120 130 140 150 160 170 180
Hb
f
media ( )xmediana ( Mn )
moda ( Mo )
Relacin entre las medidas de tendencia central
1/3 2/3
en las distribuciones simtricas
coinciden las 3 medidas
Cuantiles o Separatrices
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
26/46
26
0.20
0.800.40
P20 P40 P80
Cuantiles o SeparatricesValor de la variable que deja por debajo un porcentaje
determinado de las observaciones. PERCENTILES
P20(Percentil20 ) valor de xque deja por debajo el 20% de las observacionesP40(Percentil40 ) valor de xque deja por debajo el 40% de las observaciones
x
Percentiles
Cuartiles
Deciles
Cuantiles o Separatrices
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
27/46
1) Ordenar
2) Determinar el n de posicin iposicin del percentil :
i= ( n +1) r /100i= ( n +1) p
Si ino es entero tomar el punto medio entre los valores xint(i) xint(i+1
f
Fa100
n.r
LiPr
posicin del percentil :i = 1 + ( n-1) r/100 Para interpolar considerando la fraccin obtenida
Cuantiles o SeparatricesP = x
iSin Agrupar:
Datos Agrupados
1) Determinar la clase que contiene el percentil2) Aplicar la frmula de clculo
Cuantiles
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
28/46
posicin
(mol/l)
Cuantiles
(mol/l)
(mol/l)
suma
posicin X i
1 2,5 -2,06 4,2354 6,32 2,9 -1,66 2,7490 8,4
3 3,3 -1,26 1,5826 10,9
4 3,4 -1,16 1,3410 11,6
5 3,5 -1,06 1,1194 12,3
6 4,2 -0,36 0,1282 17,67 4,9 0,34 0,1170 24,0
8 5,1 0,54 0,2938 26,0
9 5,4 0,84 0,7090 29,2
10 5,6 1,04 1,0858 31,4
11 6,9 2,34 5,4850 47,6
12 7,0 2,44 5,9634 49,0
13 54,7 0,00 24,8092 274,2
ix x 2( )
ix x
2
ix
Ejemplo: concentracin de vit. E (mol/l)en vaquilloncon signos clnicos de carencia
Quartiles datos sin agrupa
P50= Q2 = Mn= 4.55
P25
P75
EJEMPLO datos agrupados P
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
29/46
Clases Xi f F fr Fr
330-344 337 3 3 0,09 0,09
345-359 352 3 6 0,09 0,17
360-374 367 4 10 0,11 0,29
375-389 382 12 22 0,34 0,63
390-404 397 7 29 0,20 0,83
405-419 412 4 33 0,11 0,94
420-434 427 2 35 0,06 1,00
TOTAL 35 1,00
EJEMPLO datos agrupados P90
413,9 K
Clase que contiene el EP90
EJEMPLO P
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
30/46
EJEMPLO P90Distribucin de frecuencias relativas acumuladas
de los pesos de novillos. FV. 2002
0,00,1
0,20,3
0,40,50,6
0,7
0,80,9
1,0
330 345 360 375 390 405 420 435
Marcas de Clase Kg
Fr
MEDIDAS DE DISPERSION
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
31/46
MEDIDAS DE DISPERSION
Proporciona informacin acerca de la variabilidad
presente en un conjunto de datos
Amplitud Total (A )
Desviacin Media Absoluta Varianza (poblacin: 2 muestra s2)
Desviacin Estndar (Tpica) (poblacin: muestra s)
Coeficiente de Variacin ( CV)
Semirecorrido Intercuartlico (Desviacin Cuartlica) Q
dispersin
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
32/46
Ejemplo: concentracin de vit. E (mol/l)envaquillonas con signos clnicos de carencia
X i
2,5 -2,06 4,2354 6,3
2,9 -1,66 2,7490 8,4
3,3 -1,26 1,5826 10,9
3,4 -1,16 1,3410 11,6
3,5 -1,06 1,1194 12,34,2 -0,36 0,1282 17,6
4,9 0,34 0,1170 24,0
5,1 0,54 0,2938 26,0
5,4 0,84 0,7090 29,2
5,6 1,04 1,0858 31,4
6,9 2,34 5,4850 47,67,0 2,44 5,9634 49,0
54,7 0,00 24,8092 274,2
ix x 2( )ix x
2
ix
7 .0 2 .5 4 .5S I
A L L
Amplitud
mo
Amplitud
suma
Ej : Amplitud con Datos Agrupados
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
33/46
Ej.: Amplitud con Datos Agrupados
Clases Xi f
330-344337 3 1011 6309,4 340707
345-359352 3 1056 2857,0 371712
360-374367 4 1468 1006,2 538756
375-389382 12 4584 8,9 1751088
390-404397 7 2779 1399,6 1103263
405-419412 4 1648 3396,6 678976
420-434427 2 854 3896,7 364658
TOTAL 35 13400 18874,3 5149160
2( )i i
x x fi ix f 2
i ix f
434.5 329.5 105A
Varianza
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
34/46
Varianza
poblacin muestra
agrupardatos sin
datosagrupados
2 =
1
2
n
xxf 2 =
1
22
n
xxfs
la varianza es el promedio de los cuadrados de los desvos
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
35/46
1-n
xx 2 2s
p
con respecto a la media (MC)
suma de cuadrados de
los desvos (SC)
grados de libertad (gl)
La divisin porn-1asegura que la varianza muestralsea una estimacin centrada d
varianza poblacional
Es sensible a valores extremos(alejados de la media).Sus unidadesson el cuadrado de las unidades de la variable
DESVIACIN TPICAEs la raz cuadrada de la varianzaTiene las mismas unidades que la variable.
Ejemplo: concentracin de vit. E (mol/l)en vaquillonas
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
36/46
con signos clnicos de carencia
X
2.5 -2.06 4.2354 6.32.9 -1.66 2.7490 8.4
3.3 -1.26 1.5826 10.9
3.4 -1.16 1.3410 11.6
3.5 -1.06 1.1194 12.3
4.2 -0.36 0.1282 17.64.9 0.34 0.1170 24.0
5.1 0.54 0.2938 26.0
5.4 0.84 0.7090 29.2
5.6 1.04 1.0858 31.4
6.9 2.34 5.4850 47.6
7.0 2.44 5.9634 49.0
54.7 0.00 24.8092 274.2
ix x 2( )
ix x 2ix
54.74.56
12x
2
2
24.80922.
11
2.26
S
S S
2
2
2 1
2
2
( )
1
54.7274.2
12 2.2612 1
ni
i
i
xx
nS
n
S
Varianza y Desviacin Estndarmuestrales (datos sin agrupar)
1.5100 100 32.9%
4.56
SC V
x
Coeficiente de Variacin
Coeficiente de variacin
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
37/46
Es el cocienteentre la desviacin tpicay la media.
Expresa la desviacin tpica en forma relativa a la media
Es frecuente indicarla en porcentajes
Si la media es 80 y la desviacin tpica 20 entoncesCV =20/80 = 0,25 = 25% (variabilidad relativa)
Es adimensional. Puede usarse para comparar la variabilidad de diferentesvariables. Si el peso tiene CV=30% y la alturatiene CV=10%, los individuos presentan
ms dispersin en peso que en altura.
No debe usarsecuando la variable presenta valores negativos o donde el valorsea una cantidad fijada arbitrariamente
Por ejemplo 0C 0F
Coeficiente de variacin
Ej.: Varianza, Desviacin y CV con Datos Agrupados
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
38/46
Clases Xi f
330-344 337 3 6309.4 1011 340707
345-359 352 3 2857.0 1056 371712
360-374 367 4 1006.2 1468 538756
375-389 382 12 8.9 4584 1751088
390-404 397 7 1399.6 2779 1103263
405-419 412 4 3396.6 1648 678976420-434 427 2 3896.7 854 364658
TOTAL 35 18874.3 13400 5149160
2( )i ix x f i ix f 2
i ix f
2
2 1( ) 18874.3
555.13( ) 1 34
k
i i
i
i
X X fs
f
2
2 1
2 1
( )
1
n
n i i
ii i
i
f X
f Xn
Sn
2
2
134005149160
35 555.34
S
23.6 6.2%382.86
CV
2555.13 2S S
Ej.: Semirrecorido Intercuartilico con Datos
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
39/46
Clases Xi f F fr Fr
330-345 337 3 3 0.09 0.09
345-360 352 3 6 0.09 0.17
360-375 367 4 10 0.11 0.29
375-390 382 12 22 0.34 0.63
390-405 397 7 29 0.20 0.83
405-420 412 4 33 0.11 0.94
420-435 427 2 35 0.06 1.00
TOTAL 35 1.00
Agrupados
P25
P75
Ej.: Semirrecorido Intercuartilico con Datos Agrupados
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
40/46
1
1
14
8.75 6360 15 370.34
a
i
n FQ L h
f
Q
3
3
34
26.25 22390 15 399
7
a
i
n F
Q L hf
Q
Clases Xi f F fr Fr
330-345 337 3 3 0.09 0.09
345-360 352 3 6 0.09 0.17360-375 367 4 10 0.11 0.29
375-390 382 12 22 0.34 0.63
390-405 397 7 29 0.20 0.83
405-420 412 4 33 0.11 0.94
420-435 427 2 35 0.06 1.00
TOTAL 35 1.00
Cual medida de dispersinutilizar?
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
41/46
p
DESVIACIN TPICA
Se emplea cuando tambin es apropiado utilizar la media
(simetra, datos numricos) SEMIRECORRIDO INTERCUARTILICO
Cuando se usa la mediana (datos ordinales o numricos
sesgados, intervalos abiertos)
AMPLITUD
Cuando se quiere poner el nfasis en datos numricos extremos COEFICIENTE DE VARIACION
Cuando se quiere comparar distribuciones numricas medidas en
escalas o unidades diferentes
medidas de tendencia centraly dispersin
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
42/46
42
y pforman DUOS
Media -Varianza ydesviacin tpica
Mediana-Semirrecorridointercuartlico
Moda -Amplitud total
Segn teora de momentos
Segn el mtodo de las separatrices
Segn el mtodo de los extremos
Datos numricosdistribuciones simtricas o asimtricascon muchas observaciones
Datos ordinales o numricosdistribucin asimtrica y con pocasobservaciones-
Datos nominalesDistribuciones bimodales
MEDIDAS DE ASIMETRA o SESGO
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
43/46
medidas de asimetra (sesgo)
asimetra positiva asimetra negativa
distribucin simtrica
FORM DE L DISTRIBUCION
Es nulo cuando la distribuc
es simtrica
Coeficiente de asimetra
s
Mnxas
3
as= + as= -
382.9 384.43 3 0.23.6
x M nC AS
TIPOS DE CURVAS
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
44/46
TIPOS DE CURVAS
SIMTRICA las observaciones equidistan del mximo central con
la misma frecuencia. Coinciden Media, Moda yMediana
ASIMTRICA la cola ms larga determina la direccin del sesgo. Se
separan la Media, Mediana y Moda
BIMODAL
MULTIMODAL
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
45/46
-
5/24/2018 Clase2 Medidas Resumen Be 18 Marzo 2014
46/46
Prximo terico:
Representacin Grfica
MUCHAS GRACIAS