bioestadística y epidemiología

59
Bioestadística y epidemiología Conceptos básicos Estadística descriptiva Probabilidades Muestreo

Upload: ricardo-andrade-albarracin

Post on 04-Jul-2015

22.952 views

Category:

Travel


5 download

DESCRIPTION

1° capacitacion

TRANSCRIPT

Page 1: BioestadíStica Y EpidemiologíA

Bioestadística y epidemiología

Conceptos básicos Estadística descriptiva

ProbabilidadesMuestreo

Page 2: BioestadíStica Y EpidemiologíA

Estadistica

• La Estadística se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrínseca de los mismos; así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones.

Page 3: BioestadíStica Y EpidemiologíA

Definiciones

• Individuos o elementos: personas u objetos que contienen cierta información que se desea estudiar.

Población: conjunto de individuos o elementos que cumplen ciertas propiedades comunes.

Muestra: subconjunto representativo de una población.

Parámetro: función definida sobre los valores numéricos de características medibles de una población.

Estadístico: función definida sobre los valores numéricos de una muestra.

Page 4: BioestadíStica Y EpidemiologíA

Variables

• Variable cualitativa: Aquella cuyas modalidades son de tipo nominal.

Variable cuasicuantitativa: Modalidades de tipo nominal, en las que existe un orden.

Variable cuantitativa discreta: Sus modalidades son valores enteros.

Variable cuantitativa continua: Sus modalidades son valores reales

Page 5: BioestadíStica Y EpidemiologíA

Representaciones Gráficas

Tabla: Principales diagramas según el tipo de variable.

Tipo de variable Diagrama

   

V. Cualitativa Barras, sectores, pictogramas

   

   

V. Discreta Diferencial (barras)

  Integral (en escalera)

   

   

V. ContinuaDiferencial (histograma, polígono de frecuencias)

 Integral (diagramas acumulados)

   

Page 6: BioestadíStica Y EpidemiologíA

Estadistica descriptiva

Page 7: BioestadíStica Y EpidemiologíA

• Las descripciones numéricas de datos suelen ser importantes. Dado un conjunto de n observaciones

• La estadística descriptiva nos puede ayudar mediante resúmenes numéricos, que son medidas de tendencia central, o también llamadas de posición y medidas de dispersión

nxxx ,.....,, 21

Page 8: BioestadíStica Y EpidemiologíA

• Las medidas descriptivas más comunes de tendencia central o localización son: la media aritmética y la mediana (existen otras medidas de tendencia central que en ocasiones pueden resultar de interés: la moda, los cuartiles, los deciles, los percentiles, la media armónica, la media geométrica y la media ponderada.)

Page 9: BioestadíStica Y EpidemiologíA

• La media aritmética o simplemente promedio (también llamada media muestral ya que generalmente se calcula en relación a una muestra) se calcula de la siguiente forma: si las observaciones de una muestra de tamaño n son x1, x2,…,xn entonces

n

x

n

xxxX

n

ii

n

∑==

+++= 121 ...

Page 10: BioestadíStica Y EpidemiologíA

• Característica de la Media• Es intuitiva y fácil de calcular.• Su valor puede que no coincida con ninguno de los

valores de la muestra• La suma de las diferencias de cada valor de la

muestra con la media su resultado es cero, es decir,

∑=

=−n

ii xx

1

0)(

Page 11: BioestadíStica Y EpidemiologíA

• La mediana se suele definir como el valor “más intermedio” una vez que los datos han sido ordenados en forma creciente. Se suele denotar por Me. La forma más general de calcular la mediana es la siguiente:

( )( )

( ) ( )

1 2

2 ( 2) 1

2

n

n n

x si n es impar

Me x xsi n es par

+

+

= +

Page 12: BioestadíStica Y EpidemiologíA

• La mediana es aquel valor que deja el cincuenta por ciento de los datos por debajo y otro cincuenta por encima.

• Cabe destacar que es preferible el uso de la mediana como medida descriptiva del centro cuando se quiere reducir o eliminar el efecto de valores extremos en un conjunto de datos (muy grandes o muy pequeños).

Page 13: BioestadíStica Y EpidemiologíA

• Moda:• Es una medida de tendencia central que

se puede utilizar sea cual sea el tipo de variable a estudiar. La moda de un conjunto de observaciones es el valor que más se repite, aquel cuya frecuencia absoluta es máxima. Puede ser única, que haya más de una, o que no exista.

Page 14: BioestadíStica Y EpidemiologíA

• Media Geométrica:• Se define como la raíz n-ésima del producto

de todos los valores numéricos, es decir,•

ni

n

i

nnG xxxxX )(.....

121

=∏==

Page 15: BioestadíStica Y EpidemiologíA

• La media armónica:• Se define como el número de

observaciones de la muestra dividido por la suma del inverso de cada una de las observaciones, es decir,

∑=

= n

ii

A

x

nX

1

)/1(

Page 16: BioestadíStica Y EpidemiologíA

• La localización o tendencia central de un conjunto de datos no necesariamente proporciona información suficiente para describirlos adecuadamente. Debido a que no todos los valores son semejantes, la variación entre ellos se considera importante. Se puede decir que un conjunto de datos tiene una dispersión reducida si los mismos se aglomeran estrechamente en torno a alguna medida de localización de interés y se dice que tiene una dispersión grande si se esparcen ampliamente alrededor de alguna medida de localización de interés.

Page 17: BioestadíStica Y EpidemiologíA

• Las medidas descriptivas más comunes de dispersión son: el rango, la varianza, la desviación estándar y el rango intercuartílico.

Page 18: BioestadíStica Y EpidemiologíA

• El rango de la muestra es la medida de variabilidad más sencilla entre todas las mencionadas; y se define como la diferencia entre la observación más grande y la más pequeña :

minmax xxr −=

Page 19: BioestadíStica Y EpidemiologíA

• Aunque es una medida muy fácil de calcular, ignora toda la información de la muestra entre las observaciones más grande y más pequeña. Sin embargo, vale la pena resaltar que el rango se utiliza mucho en aplicaciones estadísticas al control de calidad, donde lo común es emplear muestras con tamaños n = 4 o

• n = 5 ya que en estos casos la pérdida de información no se considera relevante.

Page 20: BioestadíStica Y EpidemiologíA

• En general, se desea una medida de variabilidad que dependa de todas las observaciones y no sólo de unas pocas; así que parece razonable medir la variación en términos de las desviaciones relativas a alguna medida de localización (generalmente esta medida es la media)

Page 21: BioestadíStica Y EpidemiologíA

Para el conjunto de datos x1, x2,….,xn

Las diferencias

Determinan las desviaciones de la media.Dado que la suma de estas desviaciones es cero, se utiliza como medida de variabilidad el promedio de los cuadrados de tales desviaciones.

)(),.....,(),( 21 xxxxxx n −−−

Page 22: BioestadíStica Y EpidemiologíA

Sin embargo, como sólo hay n-1 desviaciones independiente se conviene en dividir entre n-1, es decir,

n

xxs

n

ii∑

=

−= 1

2

2

)(

Page 23: BioestadíStica Y EpidemiologíA

Esta última será la fórmula que emplearemos.

1

)(1

2

2

−=∑=

n

xxS

n

ii

Page 24: BioestadíStica Y EpidemiologíA

• Esta medida de variabilidad se denomina varianza. Como S2 no tiene las mismas unidades que los datos, se define la desviación estándar como la raíz cuadrada (positiva) de la varianza a fin de tener una medida en las mismas unidades de los datos; La desviación estándar es útil para comparar dispersión entre dos poblaciones, pero también lo es para calcular el porcentaje de la población que pueden localizarse a menos de una distancia específica de la media.

Page 25: BioestadíStica Y EpidemiologíA

• Cuartiles, deciles y percentiles• Los cuatiles dividen a un conjunto de

datos en cuatro partes iguales.• Para explicarlo un poco mejor, piense en

un conjunto de datos ordenados de menor a mayor. Al valor de en medio es la mediana. Esto es, 50 por ciento de los datos son mayores que la mediana y 50 por ciento son menores. De manera similar los cuartiles dividen a un conjunto de datos en cuatro partes igueles.

Page 26: BioestadíStica Y EpidemiologíA

• El primer cuartil, al que se le llama Q1, es el valor por debajo del cual se encuentra el 25% de los datos, y el tercer cuartil usualmente llamado Q3, es el valor por debajo de el se encuentra el 75% de los datos. Q2 es la mediana. Los valores Q1, Q2 y Q3 dividen al conjunto de datos ordenados en cuatro partes iguales. Q1 se puede entender como la mediana de la mitad inferior de los datos ordenados y Q3

como la mediana de la mitad superior de los datos ordenado.

Page 27: BioestadíStica Y EpidemiologíA

• Procedimiento para el calculo de los percentiles

• Sea Lp la posición del percentil deseado.

• Entonces

• donde n es el numero de datos y p el percentil

• Ejemplo: el percentil 33 P33, el percentil 50 es el P50, que es también la mediana ó el Q2. El percentil 25 es el P25=Q1 y el percentil 75 es el P75=Q3

( )100p

pL n=

Page 28: BioestadíStica Y EpidemiologíA

• Calculo del p-ésimo percentil• Paso 1: Ordenar los datos de manera

ascendente.• Paso 2: Calculamos el Lp ( )

• Paso 3: a) Si Lp no es entero, se redondea. El valor entero inmediato mayor que Lp indica la posición del p-ésimo percentil.

• b) Si Lp es entero, el p-ésimo persentil es el promedio de los valores de los datos ubicados en los lugares i e i+1

%100

)(p

nLp =

Page 29: BioestadíStica Y EpidemiologíA

• Por Ejemplo:• Si tenemos 15 datos ordenados y que-

remos localizar el primer cuartil (percentil 25) según la formula este estará ubicado en la posición 4 (por redondeo) y el tercer cuartil (percentil 75) estará ubicado en la posición 12 (por redondeo)

• Si tenemos 20 datos ordenados el primer cuartil estara en la posición intermedia entre el 5° y el 6° dato es decir si el 5° dato fuese 36 y el 6° 41 el P25=Q1=38,5

Page 30: BioestadíStica Y EpidemiologíA

• Asimetría• Si los valores de la serie de datos presenta la

misma forma a izquierda y derecha de un valor central (media aritmética) se dice que es simétrica de lo contrario será asimétrica.

• Para medir el nivel de asimetría se utiliza el llamado Coeficiente de Asimetría de Fisher, que viene definido:

31

3

1

)()(/1(

s

xxng

n

ii∑

=

−=

Page 31: BioestadíStica Y EpidemiologíA

• Los resultados pueden ser los siguientes:

• g1 = 0 (distribución simétrica; existe la misma concentración de valores a la derecha y a la izquierda de la media)

• g1 > 0 (distribución asimétrica positiva; existe mayor concentración de valores a la derecha de la media que a su izquierda)

• g1 < 0 (distribución asimétrica negativa; existe mayor concentración de valores a la izquierda de la media que a su derecha)

Page 32: BioestadíStica Y EpidemiologíA

CONCEPTO BASICOS DE PROBABILIDADES

Page 33: BioestadíStica Y EpidemiologíA

Minitab 14 33

4.1 Espacio Muestral y Eventos

4.1.1 Experimentos Aleatorios y Espacios Muestrales

Un experimento es una observación de un fenómeno que ocurre en la naturaleza. Tipos de experimentos:

Experimentos Determinísticos: Son aquellos en donde no hay incertidumbre acerca del resultado que ocurrirá cuando éstos son repetidos varias veces.

Experimentos Aleatorios: Son aquellos en donde no se puede anticipar el resultado que ocurrirá, pero si se tiene una completa idea acerca de todos los resultados posibles del experimento cuando éste es ejecutado.

Page 34: BioestadíStica Y EpidemiologíA

Minitab 14 34

4.1 Espacio Muestral y Eventos

Espacio Muestral: Es el conjunto de posibles resultados de un experimento aleatorio. Representación del espacio muestral S y cada elemento de él es llamado un punto muestral. Ejemplo:

,

Tipos de espacios muestrales:

Espacios muestrales discretos: Son espacios muestrales cuyos elementos resultan de hacer conteos, y por lo general son subconjuntos de los números enteros.

Espacios muestrales continuos: Son espacios muestrales cuyos elementos resultan de hacer mediciones, y por lo general son intervalos en la recta Real.

{ }XXXCCXCCS ,,,2 = { } [ )∞≡≥= ,00:5 tts

Page 35: BioestadíStica Y EpidemiologíA

Minitab 14 35

4.1.2. Eventos

Un Evento es un resultado particular de un experimento aleatorio. En términos de conjuntos, un evento es un subconjunto del espacio muestral. Por lo general se le representa por las primeras letras del alfabeto. Ejemplo:

A: Que salga un número par al lanzar un dado.

E: Que haya que esperar más de 10 minutos para ser atendidos.

Evento Nulo: Es aquél que no tiene elementos. Se representa por φ.

Evento Seguro: Es el espacio muestral que puede ser considerado como un evento.

Page 36: BioestadíStica Y EpidemiologíA

Minitab 14 36

4.1.3. Relaciones entre eventosUnión de eventos: Dados dos eventos A y B de un mismo espacio muestral su

unión se representa por y es el evento que contiene los elementos que están en A o en B, o en ambos. El evento ocurre si al menos uno de los dos eventos ocurre. Dada una colección de eventos, su unión denotada por ocurre si al menos uno de los ocurre.

Intersección de eventos: Dados dos eventos A y B de un mismo espacio muestral su intersección se representa por y es el evento que contiene los elementos que están en A y B al mismo tiempo. El evento ocurre cuando los eventos ocurren simultáneamente. Dada una colección de eventos, su intersección denotada por ocurre si todos los eventos ocurren a la vez.

BA ∪

n

iiA

1=

BA ∩

nAA ,...,1

)1(, niAi ≤≤

nAA ,...,1 n

iiA

1=

)1(, niAi ≤≤

Page 37: BioestadíStica Y EpidemiologíA

Minitab 14 37

4.1.3. Relaciones entre eventos

Evento Complemento: El complemento de un evento A se representa por y es el evento que contiene todos los elementos que no están en A. El evento ocurre si A no ocurre.

Propiedades de relaciones entre eventos: Sean A, B y Celementos de un mismo espacio muestral S entonces:

3) Propiedad Conmutativa: ,

4) Propiedad Asociativa: ,

5) Propiedad Distributiva: ,

6) Leyes de De Morgan: ,

Todas estas propiedades se pueden aplicar a más de dos eventos.

A

A

ABBA ∪=∪ ABBA ∩=∩

CBACBA ∪∪=∪∪ )()( CBACBA ∩∩=∩∩ )()(

)()()( CABACBA ∪∩∪=∩∪ )()()( CABACBA ∩∪∩=∪∩

BABA ∩=∪ BABA ∪=∩

Page 38: BioestadíStica Y EpidemiologíA

Minitab 14 38

4.2 Métodos de asignar Probabilidades

4.2.1 Método Axiomático: La Probabilidad es considerada como una función de valor real definida sobre una colección de eventos de un espacio muestral S que satisface los siguientes axiomas:

1.

2. Si A es un evento de S entonces .

3. Si, es una colección de eventos disjuntos (por pares) entonces . Esta es llamada el axioma de aditividad contable. Asumiendo que se sigue del axioma 3 que , ésta es llamada la propiedad de aditividad finita.

( ) 1=SP

( ) 0≥AP

∑∞

=

=

=11

)()(i

ii

i APAP φ=== ++ ...21 nn AA

∑==

=n

ii

n

ii APAP

11

)()(

Page 39: BioestadíStica Y EpidemiologíA

Minitab 14 39

4.2.2. Método Clásico

Un espacio muestral finito se dice que es Equiprobable si cada uno de sus elementos tiene la misma probabilidad de ocurrencia, es decir para todo ,

Ejemplo 4.4. Se lanza un par de dados legales y

distinguibles, entonces su espacio muestral dado por:

tiene 36 resultados, cada uno de ellos con probabilidad de ocurrencia 1/36. En el Ejemplo 4.4 se vió que , por lo tanto .

},...,{ 1 nwwS =

nwP i

1)( = ni ,...,1=

( ){ }6,5,4,3,2,1,:, == jijiS

( ) 36# =S

( ) 3615=AP

Page 40: BioestadíStica Y EpidemiologíA

Minitab 14 40

4.2.2. Probabilidades- Método Clásico

Definición. Si un experimento aleatorio tiene un espacio muestral equiprobable que contiene elementos y A es un evento de que ocurre de maneras distintas entonces la probabilidad de ocurrencia de A es:

Ejemplo 4.6. ¿Cuál es la probabilidad de que salga suma mayor que 7 al lanzar un par de dados?

Solución:

El evento A: Suma mayor que 7, incluye los resultados que dan suma 8, 9, 10, 11 ó 12 y éstos ocurren de 5, 4, 3, 2 y 1 maneras repectivamente. Luego .

S( )S#S

( )A#

)(#

)(#)(

S

AAP =

( ) 15# =A

Page 41: BioestadíStica Y EpidemiologíA

Minitab 14 41

4.2.3 Probabilidades-Método Frecuencial

Si un experimento se repite n veces y n(A) de esas veces ocurre el evento A, entonces la frecuencia relativa de A se define por .

Se puede notar que: a) b) c) Si A y B son eventos disjuntos entonces Es decir satisface los axiomas de probabilidad.

Definición. La probabilidad del evento A es el valor al cual se aproxima cuando el experimento se ha repetido un gran número de veces. O sea:

n

Anf A

)(=

1=Sf

0≥Af

BABA fff +=∪

Af

)()(

APn

An →

Page 42: BioestadíStica Y EpidemiologíA

Minitab 14 42

4.2.5 Probabilidades-Método Subjetivo

Algunas personas de acuerdo a su propio criterio generalmente basado en su experiencia, asignan probabilidades a eventos, éstas son llamadas probabilidades subjetivas. Por ejemplo:

• La Probabilidad de que llueva mañana es 40%.

• La Probabilidad de que haya un terremoto en Puerto Rico antes del 2000 es casi cero.

• La Probabilidad de que el caballo Camionero gane el clásico del domingo es 75%.

Page 43: BioestadíStica Y EpidemiologíA

Minitab 14 43

4.3 Probabilidad Condicional

Sean A y B dos eventos de un mismo espacio muestral S. La probabilidad condicional de A dado que B ha ocurrido esta dado por:

Ejemplo 4.11. Se lanza un par de dados legales y distinguibles. ¿Cuál es la probabilidad de que solamente uno de los dos dados sea par si se sabe que la suma de los dos es mayor que 8?

Solución:

Sean los eventos A: Que solamente uno de los dos dados sea par y el evento condicionante B: Que la suma sea mayor que 8. Claramente y . Luego .

)(

)()/(

BP

BAPBAP

∩=

( ) 10# =B ( ) 6# =∩ BA ( ) 106/ =BAP

Page 44: BioestadíStica Y EpidemiologíA

Minitab 14 44

4.3.1 Regla del Producto. Dados los eventos A y B de un mismo espacio muestral, la

probabilidad de que ambos ocurran esta dado por:

Ejemplo 4.16. Un lote contiene 10 artículos de los cuales 4 son defectuosos, se extraen al azar 3 articulos uno por uno y sin reposición. ¿Cuál es la probabilidad de que:

Sólo uno de los tres salga defectuoso?

Solución: Sea el evento que el i-ésimo artículo resulte defectuoso para .

)/()()( ABPAPBAP =∩

3,2,1=i

( ) ( ) ( ) ( )21849510685941068596104

321321321

=××+××+××=++= DBBPBDBPBBDPdefectuosounsoloP

Page 45: BioestadíStica Y EpidemiologíA

Minitab 14 45

4.3.2 Probabilidad Total y Regla de BayesRegla de la Probabilidad Total: Sean B1,…,Bn

una colección de eventos que forman una partición del espacio muestral S esto es y para i ≠ j. Sea A otro evento definido sobre S entonces:

Notar que: . Aplicando la propiedad Distributiva:

, la unión es disjunta, y y aplicando el tercer axioma:

. Finalmente se aplica la regla del producto a cada término de la suma. Para una partición de S en dos eventos B y se obtiene:

φ=∩ ji BBSBn

ii =

=

1

∑=

=n

iii BAPBPAP

1

)/()()(

)(1

n

iiBASAA

=

∩=∩=

n

iiBAA

1=

∩=

∑=

∩=n

iiBAPAP

1

)()(

B

)/()()/()()( BAPBPBAPBPAP +=

Page 46: BioestadíStica Y EpidemiologíA

Minitab 14 46

4.4 Eventos Independientes

Dos eventos A y B son independientes si la ocurrencia de uno de ellos no afecta la probabilidad de ocurrencia del otro. O sea:

De la definición de probabilidad condicional se obtiene la siguiente definición equivalente:

Dos eventos A y B son independientes si:

Page 47: BioestadíStica Y EpidemiologíA

Minitab 14 47

4.5. Aplicación de técnicas de conteo al Cálculo de Probabilidades

4.5.1 Regla Multiplicativa del conteo: Si un experimento I ocurre de m maneras distintas y un experimento II ocurre de n maneras distintas entonces, el experimento compuesto de I seguido de II ocurre de maneras.

La regla multiplicativa se puede generalizar de la siguiente manera: Si un experimento compuesto de k experimentos simples, cada uno de los cuales se puede efectuar de maneras distintas, entonces el experimento compuesto se puede efectuar de maneras distintas.

)1(, kini ≤≤

knnn ××× ...21

Page 48: BioestadíStica Y EpidemiologíA

Minitab 14 48

4.5.2 Permutaciones

Una permutación es un arreglo ordenado de objetos distintos. Por ejemplo, las permutaciones de tamaño 2 que se pueden hacer con las letras A, B y C son: AB, AC, BC, BA, CA y CB.

Haciendo uso de la regla multiplicativa del análisis combinatorio se desprende que:i) El número de permutaciones de n objetos tomados todos a la vez está dado por

ii) El número de permutaciones de n objetos distintos tomados de r en r está dado por:

Recordar que 0! = 1.

( ) ( ) ( ) 1...21!, −−== nnnnnnP

( ) ( ) ( ) ( )!!

1...1,rn

nrnnnrnP

−=+−−=

Page 49: BioestadíStica Y EpidemiologíA

Minitab 14 49

4.5.3 Combinaciones

Una combinación es una selección de objetos donde el orden en que estos han sido escogidos no interesa. Por ejemplo, las combinaciones que se pueden hacer con los objetos: A, B y C elegidos de dos en dos son: AB, AC y BC. Observe que el número de permutaciones obtenidas anteriormente fue el doble.

El número de combinaciones de n objetos tomado de r en r está dado por:

Como 0! = 1, se tiene que

!

),(

)!(!

!

r

rnP

rnr

n

r

n=

−=

10

=

=

n

n

n

Page 50: BioestadíStica Y EpidemiologíA

MUESTREO

Page 51: BioestadíStica Y EpidemiologíA
Page 52: BioestadíStica Y EpidemiologíA
Page 53: BioestadíStica Y EpidemiologíA
Page 54: BioestadíStica Y EpidemiologíA
Page 55: BioestadíStica Y EpidemiologíA
Page 56: BioestadíStica Y EpidemiologíA
Page 57: BioestadíStica Y EpidemiologíA
Page 58: BioestadíStica Y EpidemiologíA
Page 59: BioestadíStica Y EpidemiologíA

FIN