bioestadistica..universidad wiener peru

Población

μ: media

σ2: Varianza

π ó P: Proporción

MuestraX: media

S2: Varianza

P:proporción

MUESTREO

INFERENCIAPARÁMETROS

ESTADÍSTICOS

Inferencia Estadística

Inferencia Paramétrica

• Variables cuantitativas cuyo número es mayor de30 datos o provienen de una curva normal.

• Pueden ser menos de 30 datos si es que se tiene laseguridad que provienen de una curva normal

Inferencia No Paramétrica

• Variables cualitativas y variables cuantitativas sincurva normal

Tipos de Muestras

• Una sola muestra

• Dos o más muestras:

-Muestras Relacionadas o pareadas

-Muestras Independientes

Estimación de Parámetros

Es un proceso para obtener valores

aproximados de una población

(parámetros) a partir de los valores

calculados de una muestra (estadísticos)

• INTERVALOS DE CONFIANZA:

a) Puntual

b) Por Intervalos

• PRUEBA DE HIPÓTESIS

INTERVALOS DE CONFIANZA

El valor de la respuesta se ofrece a través de un intervalo con una

probabilidad de ocurrencia, mide el grado de confianza en la

respuesta llamado nivel de confianza: 1-α

Ejemplo:

Una muestra de n=100 individuos de una población tiene un

peso medio de 60 kg y desviación de 5kgEstimaciones puntuales

• 60 kg estima a μ

• 5 kg estima a σ

• 5/raiz(n)= 0,5 estima el error estándar (típico) EE

Estimación por Intervalos de Confianza• Hay una confianza del 68% de que μ esté en 60±0,5

• Hay una confianza del 95% de que μ esté en 60±1

Nivel de confianza = 1-

Probabilidad de error o nivel de significancia: = 0.10, 0.05, 0.01

Prueba de Hipótesis

Consideraciones preliminares

•Muestras independientes o pareadas

•Varianzas iguales o diferentes

•Prueba de la normalidad

•Datos fuera de rango

•Pruebas paramétricas o no paramétricas

•El valor de “p”

Ejemplos de Hipótesis:

1. La talla de los peruanos es diferente de 1.65

2. El estado nutricional de las gestantes depende del nivel

de hemoglobina

3. La talla promedio de niños con lactancia materna es

mayor de los niños que no recibieron

4. La proporción de fumadores del género femenino es

menor al género masculino

5. Existe relación entre los conocimientos y las prácticas

que tiene la madre del niño menor de 5 años sobre la

medidas preventivas de las IRA.

6. El peso final es diferente al peso inicial después de la

aplicación de una dieta

Región crítica y nivel de significancia

No rechazo H0

Reg. CríticaReg. Crítica

Nivel de significancia + Nivel de confianza = 100

Rechazo H0Rechazo H0

NIVEL DE SIGNIFICANCIA

Z= 1.96Z= - 1.96

DISTRIBUCIÓN NORMAL ESTANDARIZADA ACUMULADA

Muestras Independientes o Pareadas

Muestras Independientes

Se dice que dos o más muestras son independientescuando sus datos provienen de gruposdiferentes, que no guardan ninguna relación entresí.

- Proporción de muertes neonatales de los hospitalesde Essalud y Minsa.

- Estado nutricional de niños de Lima Cercado yChosica.

- Edad gestacional de Adolescentes y Añosas.

…muestras Independientes o Pareadas

Muestras Pareadas o Repetidas

Se dice que las muestras son pareadas cuando

1. Dos o más grupos de datos provienen de unamisma muestra, también se denomina muestrarepetida.

Ejm. Cuando se quieren determinar diferencias entrelos niveles de Hb en una intervención quirúrgicaen tres momentos :Hb basal, a los 10 minutos y alos 20 minutos.

2. Cuando se forman dos muestras en donde laspersonas son pareadas o emparejadas con otraspersonas que tienen las mismas característicasque se desean controlar.

Se quiere determinar si el hecho de comerpescado es un factor para contraer el cólera. Paralo cual se identifica a un grupo de personas quetuvieron la enfermedad y se emparejan cada unade ellas con otra persona que no tiene laenfermedad. Se empareja tomando en cuentaciertos tipos de variables, edad, sexo, barrio, etc.

…muestras Independientes o Pareadas

EL VALOR DE “p”

…sea cual sea el valor de “p” y demasiadas

veces de “ No hay diferencias significativas”

deducimos que “no hay diferencias”.

Austin Bradford Hill

…el valor de “p”

El valor de “p” nos permitirá interpretar los

resultados de un análisis de datos realizado por un

software, toda vez que en este caso ya no existe la

necesidad de usar tablas para comparar un valor

calculado con el tabulado.

…el valor de “p”

Interpretación:

1. Si el valor de “p” es mayor que el valor de

significación (α) entonces no existen diferencias

estadísticamente significativas.

2. Si el valor de “p” es menor que el valor de

significación (α) entonces existen diferencias

estadísticamente significativas.

Prueba de la Normalidad

Es importante realizar esta prueba cuando no setiene la certeza de que los datos provienen o no deuna curva normal.

Conocer si los datos provienen de una curva normalpermitirá decidir que pruebas se han de utilizar.

Se utilizarán pruebas Paramétricas si los datosprovienen de una curva normal.

Se utilizarán pruebas No paramétricas si los datosno provienen de una curva normal.

…prueba de la Normalidad

La condición para decidir si un determinado

grupo de datos tiende a una curva normal es que

al menos existan más de 30 datos de la variable

en estudio (tamaño de muestra mínimo) en cada

grupo de estudio.

De particular interés están los coeficientes de

asimetría y curtosis estandarizados que pueden

utilizarse para determinar si la muestra procede de

una distribución normal.

Los valores de estos estadísticos fuera del rango de

-2 a +2 indican alejamiento significante de

normalidad que tendería a invalidar cualquier test

estadístico con respecto a la desviación normal.

• También se puede utilizar el valor de

Asimetría para la prueba de la normalidad.

• Si el valor de Asimetría es mayor que

1(uno) en valor absoluto entonces se dice

que no pertenece a una distribución normal.

En algunos casos a pesar de que existe una

gran cantidad de datos (más de 30), sin

embargo los valores de curtosis o asimetría

indican que los datos no provienen de una

curva normal.

Esto se puede deber a la presencia de datos

FUERA DE RANGO O INTERVALO.

Datos Fuera de Rango o Intervalo

• El dato se observa, registra e introduce en la

computadora incorrectamente.

• El dato proviene de una población distinta.

• El dato es correcto pero representa un suceso

poco común (fortuito).

Datos Fuera de Rango o Intervalo

Los datos fuera de intervalo aparecen generalmente por las siguientes razones:

Como detectar un dato fuera de rango

1. Calculando el Valor Z

Si el valor de Z es mayor de 3 quiere decirque ese dato está fuera de intervalo, ya que seasume que el 100% de una población estácomprendida dentro del rango de -3z y +3z (-3s y +3s).

2. Con el gráfico de Caja y Bigotes (Box and Plot).

– Al elaborar este gráfico haciendo uso de los

rangos intercuartílicos y la mediana, así como

los valores de -3s y +3s. Se puede determinar

fácilmente los datos que se encuentran fuera

de rango.

Transformación a curva normal

Los datos que no cumplen el criterio de ser

una curva normal de acuerdo con los

anteriores estadísticos, se pueden convertir

a una curva normal utilizando la raíz

cuadrada o el logaritmo natural de los datos.

Pruebas Paramétricas o No

Paramétricas

Pruebas Paramétricas

Se dice que una prueba es paramétrica cuando:

• Se trata de variables cuantitativas cuyo número esmayor de 30 datos o provienen de una curvanormal.

• Pueden ser menos de 30 datos si es que se tiene laseguridad que provienen de una curva normal

• Si son seis o menos datos, usar pruebas noparamétricas. Algunos indican 11 o menor de 20.

…Pruebas Paramétricas o No Paramétricas

Pruebas no Paramétricas

Son pruebas no paramétricas cuando:

• Se trata de variables cualitativas.

• Se trata de variables cuantitativas, conmenos de 30 datos y no provienen de unacurva normal.

• Cuando son seis o menos datos. Algunosindican 11 o 20 datos.

PRUEBAS ESTADÍSTICAS

Pruebas para

Comparar grupos

Variables

cualitativas

Variables

cuantitativas

2 grupos 3 grupos2 grupos Tres o más grupos

Pruebas para comparar

grupos

VARIABLES CUALITATIVAS

COMPARACIÓN DE DOS GRUPOS

Variables Categóricas o Cualitativas

Menú principal

2 grupos

Muestras

independientes

Chi Cuadrado

Corrección de Yates

Frecuencias

pequeñas:

Prueba exacta de

Fisher

Muestras

pareadas

McNemar

Comparación de dos proporciones Independientes

Prueba de Chi Cuadrado

Ejemplo 6

Se desea analizar el tratamiento de la

infección urinaria con dos antibióticos A y

B. Dividiéndose 34 pacientes en dos grupos

de 17, evaluándose después de un tiempo de

observación si la infección desapareció o

Solución

1. Codificar la variable 1 como:

– Etiqueta: Tratamiento de Antibiótico

– 1= A

– 2= B

2. Codificar la variable 2 como

– Etiqueta: Desaparición de la Infección

– 1= Si

– 2= No

Interpretación

Como el valor de p = 0,001 es menor que

0,05 entonces hay diferencias

significativas entre los grupos, por lo tanto

podemos concluir que el tratamiento con

el antibiótico A es más eficaz que el

antibiótico B.

volver

Comparación de dos proporciones pareadas

Prueba de Chi Cuadrado de McNemar

Ejemplo 7

Se desea saber si el efecto de dos fármacos es

el mismo para desaparecer los síntomas de una

úlcera. Para lo cual se seleccionan 50 pacientes

a los que se les administra el fármaco A. Luego

se busca a otro paciente de características

similares (Par o “gemelo”) al que se les

suministra el fármaco B. Después de un periodo

de observación se comprueba en cada caso si

los síntomas han desaparecido.

Solución

– Etiqueta: Fármaco A

– 1= Úlcera ha cicatrizado

– 2= Úlcera no ha cicatrizado

– Etiqueta: Fármaco B

Interpretación

Como el valor de p = 0,607 es mayor que

0,05 entonces no hay diferencias

podemos concluir que el Fármaco A y el

Fármaco B tienen la misma eficacia para

la cicatrización de úlceras.

Volver

Comparación de 3 o más grupos

Variables Cualitativas

Menú Principal

Muestras

independientes Muestras

pareadas

3 o más grupos

χ2 Q de Cochran

Comparación de 3 o más proporciones

Independientes

Prueba de Chi Cuadrado Ejemplo 8

Se desea analizar si el efecto de tres tratamientosdermatológicos para el acné A,B y C, depende deltipo de presentación, crema, comprimido, polvo ylíquido. Para lo cual se distribuyen 300 pacientes en12 grupos de 25 cada uno. Luego de un periodo deobservación se analiza la proporción de pacientes sinacné en cada grupo.

Se desea determinar si la eficacia del tratamientoestá relacionado con el tipo de presentación.

Solución1. Codificar la variable 1 como:

– Etiqueta: Tratamiento dermatológico

– 1= A

– 2= B

– 3= C

– Etiqueta: Presentación del tratamiento

– 1= Crema

– 2= Comprimido

– 3= Polvo

– 4= Líquido

Interpretación

Como el valor de p = 0,00 asociado al

estadístico Chi cuadrado es menor que

podemos concluir que el uso del

tratamiento dependerá del tipo de

presentación.

Volver

Comparación de 3 o más proporciones pareadas

Prueba Q de Cochran

Ejemplo 9

Se desea analizar el efecto de dos fármacos sobre lossíntomas de la úlcera, para lo cual se distribuyen 150pacientes en tres grupos de 50 cada uno.Aleatoriamente se suministra a 50 pacientes unplacebo, luego se busca dos pares o “gemelos” aquienes se les suministra los fármacos A y Brespectivamente. Después de un periodo se observasi los síntomas han desaparecido o no.

Se desea determinar si la eficacia de los fármacoscon respecto al placebo es la misma .

Solución1. Codificar la variable 1 como:

– Etiqueta: Placebo

2. Codificar la variable 2 como– Etiqueta: Fármaco A

3. Codificar la variable 3 como:– Etiqueta: Fármaco B

Interpretación

estadístico Q de Cochran es menor que

podemos concluir que los fármacos tienen

menor efectividad que el placebo.

Volver

Pruebas para comparar

grupos

VARIABLES CUANTITATIVAS

COMPARACIÓN DE DOS GRUPOS

Variables Cuantitativas

Menú principal

2 Grupos

Muestras

independientes

¿Distribución

normal?

("paramétrica")

¿Varianzas Iguales?

t de student para v.

iguales

T de student para

diferentes

U Mann-Whitney

Muestras

pareadas

¿Distribución

normal?

("paramétrica")

t de Student

pareada

Prueba Wilcoxon

Comparación de dos grupos

independientes con distribución normal

Prueba de t de Student

Ejemplo 10

Se desea conocer si la disminución de

hemoglobina es independiente de la presencia o no

de úlcera en los pacientes cuando se aplica un

nuevo tratamiento. Para lo cual se mide la

disminución de hemoglobina en 70 pacientes, de

los cuales 28 tenían úlcera y 42 no.

Solución

– Etiqueta: Disminución de Hemoglobina

– Etiqueta: Con úlcera

– 1= Si

– 2= No

El valor de p= 0,138 nos indica queno hay diferencias significativas entrelas varianzas por lo que se asume laigualdad de varianzas.

Interpretación

Como el valor de p= 0,00 asociado alestadístico “t”, cuando se asumenvarianzas iguales es menor que 0,05entonces existen diferencias significativasentre los promedios. Por lo tanto se puedeconcluir que la disminución dehemoglobina es diferente entre lospacientes con úlcera y sin úlcera. Para elejemplo existe mayor disminución dehemoglobina en los pacientes con úlcera.

Volver

Comparación de dos grupos independientes

sin distribución normal (no paramétrica)

Prueba de U de Mann- Witney

Ejemplo 12

Se desea conocer si al aplicar un nuevo Fármacomás el tratamiento habitual permite incrementar laFEVI (fracción de eyección del ventrílocuoizquierdo) deprimida en grado severo. Seseleccionan 12 pacientes a los que se les aplica eltratamiento habitual y 11 pacientes a quienes seles aplica el tratamiento habitual más el nuevoFármaco. Luego de seis meses se mide la FEVI enambos grupos.

Solución

– Etiqueta: FEVI

– Etiqueta: Tratamiento

– 1= Habitual

– 2= Habitual más fármaco.

Interpretación

Como el valor de p= 0,740 asociado alestadístico “U” de Mann-Whitney, esmayor que 0,05 entonces no existendiferencias significativas entre lasmuestras. Por lo tanto se puede concluirque el uso del Farmaco A más eltratamiento habitual no aumentasignificativamente el FEVI.

Volver

Comparación de dos grupos pareados con

distribución normal

Prueba de t de Student para muestras pareadas

Ejemplo 11

Se desea conocer si un tratamiento contra la

artrosis puede causar disminución de

hemoglobina. Para lo cual se mide la

hemoglobina en 70 pacientes antes y

después del tratamiento.

Solución

– Etiqueta: Hemoglobina inicial

– Etiqueta: Hemoglobina final

Interpretación

Como el valor de p= 0,00 asociado alestadístico “t”, es menor que 0,05entonces existen diferencias significativasentre los promedios inicial y final. Por lotanto se puede concluir que el tratamientocontra la artrosis produce disminución dehemoglobina.

Volver

Comparación de dos grupos

pareados sin distribución normal

Prueba de Wilcoxon

Ejemplo 13

Se desea conocer si el nivel de colesterol se

incrementa debido a un producto (A) presente en

la dieta de los pacientes de un hospital. Para lo

cual se cambia el Producto A por un producto B

menos rico en colesterol y se hace la medición del

colesterol a 42 pacientes antes y después de la

sustitución del producto.

Solución

– Etiqueta: Colesterol inicial

– Etiqueta: Colesterol final

Interpretación

Como el valor de p= 0,230 asociado alestadístico Wilcoxon, es mayor que 0,05entonces existen diferencias significativasentre los rangos positivos y negativos. Porlo tanto se puede concluir que el colesterolen los pacientes no se ve incrementadopor el consumo del producto A.

volver

Variables Cuantitativas

Menú Principal

3 o más grupos

Muestras

independientes

¿Distribución

normal?

("paramétrica")

Kruskal-Wallis

Muestras

apareadas

¿Distribución

normal?

("paramétrica")

ANOVA para

medidas

repetidas

Friedman

independientes con distribución normal

ANÁLISIS DE LA VARIANZA (ANOVA)

Ejemplo 14

Se desea saber si el tiempo de reaparición de los

síntomas en pacientes con úlcera péptica es

independiente del tiempo de respuesta a un

tratamiento aplicado. Para lo cual se determina el

tiempo de reaparición de los síntomas y se agrupa de

acuerdo al tiempo de respuesta en cuatro grupos

(2, 4, 6 y 8 semanas).

Solución

– Etiqueta: Tiempo de respuesta al tratamiento

– 1 = 2 semanas

– 2 = 4 semanas

– 3 = 6 semanas

– 4 = 8 semanas

– Etiqueta: Tiempo de reaparición de los síntomas

• Como el valor de p = 0,00 asociado al

estadístico de Levene es menor que 0,05

entonces las varianzas son diferentes, por lo

que se tendrá que homogenizar las

varianzas con la función potencia, raíz

cuadrada y logaritmo natural.

Interpretación

estadístico de F de Snedecor es menor que

0,05 entonces existen diferencias

significativas entre los promedios. Por lo

tanto se tiene que realizar la prueba de

comparaciones múltiples para determinar

entre que grupos existen las diferencias.

Tukey (grupos del mismo tamaño)

Scheffé (grupos de diferente tamaño)

Conclusión

• El análisis de comparaciones múltiples nos

indica que todos los grupos son

diferentes, por lo tanto se debe considerar

que el tiempo de reaparición de los síntomas

va a ser diferente para cada tiempo de

respuesta al tratamiento.

volver

independientes sin distribución normal

ANÁLISIS DE LA VARIANZA DE KRUSKAL-WALLIS

Ejemplo 15

Se desea saber si un Fármaco aumenta el índice cardiaco en

pacientes con Shock, pero se sospecha que el aumento

puede ser diferente según el tipo de shock. Para lo cual se

suministra el fármaco a 99 pacientes y después de un

determinado tiempo se mide el índice cardiaco y se divide

en cuatro grupos de acuerdo con el tipo de shock

(Hipovolémico, Cardiogénico, Distributivo y Obstructivo).

Interpretación

Como el valor de p = 0,001 es menor que

0,05 entonces los promedios de rangos en

los cuatro tratamientos son diferentes. Por

lo tanto se puede concluir indicando que el

fármaco incrementa el índice cardiaco

independientemente del tipo de shock.

Siendo mayor el efecto en el grupo

cardiogénico.

Volver

pareados con distribución normal

ANOVA PARA MEDIDAS REPETIDAS

Ejemplo 16

Se desea conocer el efecto de tres fármacos para reducir

la presión arterial sistólica. Para lo cual se buscó a 160

pacientes, a los que se les administró el fármaco

A, luego se buscó a dos “pares” o “gemelos” de la

misma edad, al primero se le administró el Fármaco B

y al segundo el Fármaco C.

Solución

– Etiqueta: Fármaco A

– Etiqueta: Fármaco B

– Etiqueta: Fármaco C

Interpretación

estadístico de contraste es mayor que 0,05

entonces no existen diferencias

significativas entre los grupos. Por lo tanto

se puede concluir que el efecto de los

fármacos sobre la presión arterial sistólica

es el mismo.

Volver

pareados sin distribución normal

PRUEBA DE FRIEDMAN

Ejemplo 17

Se desea conocer si el consumo de un fármaco (A)

antihipertensivo es igual que el de otros dos

fármacos (B y C) de la competencia. Para lo cual

se seleccionan aleatoriamente 34 farmacias y se

obtiene el número de fármacos (A, B y C)

vendidos en el mes en cada farmacia.

Solución

– Etiqueta: Cantidad de Fármaco A

– Etiqueta: Cantidad de Fármaco B

– Etiqueta: Cantidad de Fármaco C

Interpretación

estadístico de Friedman es mayor que 0,05

entonces no existen diferencias

significativas entre los grupos. Por lo tanto

se puede concluir que la venta de los tres

fármacos es la misma.

volver

Asociación entre dos variables

cuantitativasCorrelación de Pearson

Ejemplo 21

Se realiza un estudio para establecer una ecuación

mediante la cual se pueda utilizar la concentración

de estrona en saliva(X) para predecir la

concentración del esteroide en plasma libre (Y).

Para lo cual se midieron la concentración de

ambos indicadores en 14 varones sanos.

Solución

– Etiqueta: Estrona en Saliva

– Esteroide en plasma libre

Interpretación

estadístico t es menor que 0,05 entonces

podemos concluir que conociendo el nivel

de estrona en la saliva se puede predecir

concentración de esteroide en el plasma

libre.

VOLVER

edad de los encuestados

Figura 4. Ejemplo de gráfico de Caja y Bigotes. Edad de

encuestados.

Volver

bioestadistica..universidad wiener peru

Education

bioestadistica - cmat.edu.uy

bioestadistica estadisticadescriptivaprobabilidades

bioestadistica -agronomia

bioestadistica clase3

tema bioestadistica

bioestadistica ejercicios 2011

math - bioestadistica

biologia, bioestadistica

bioestadistica (r)

bioestadistica apuntes.pdf

bioestadistica _0

apuntes bioestadistica

bioestadistica - taucher

bioestadistica monografia.docx

bioestadistica introducción

libro bioestadistica

modulo bioestadistica

bioestadistica correcion

ejercicios bioestadistica

bioestadistica noriega