bioestadistica..universidad wiener peru
Post on 10-Jul-2015
114 Views
Preview:
TRANSCRIPT
Población
μ: media
σ2: Varianza
π ó P: Proporción
MuestraX: media
S2: Varianza
P:proporción
MUESTREO
INFERENCIAPARÁMETROS
ESTADÍSTICOS
Inferencia Estadística
Inferencia Paramétrica
• Variables cuantitativas cuyo número es mayor de30 datos o provienen de una curva normal.
• Pueden ser menos de 30 datos si es que se tiene laseguridad que provienen de una curva normal
Inferencia No Paramétrica
• Variables cualitativas y variables cuantitativas sincurva normal
Tipos de Muestras
• Una sola muestra
• Dos o más muestras:
-Muestras Relacionadas o pareadas
-Muestras Independientes
Estimación de Parámetros
Es un proceso para obtener valores
aproximados de una población
(parámetros) a partir de los valores
calculados de una muestra (estadísticos)
• INTERVALOS DE CONFIANZA:
a) Puntual
b) Por Intervalos
• PRUEBA DE HIPÓTESIS
INTERVALOS DE CONFIANZA
El valor de la respuesta se ofrece a través de un intervalo con una
probabilidad de ocurrencia, mide el grado de confianza en la
respuesta llamado nivel de confianza: 1-α
Ejemplo:
Una muestra de n=100 individuos de una población tiene un
peso medio de 60 kg y desviación de 5kgEstimaciones puntuales
• 60 kg estima a μ
• 5 kg estima a σ
• 5/raiz(n)= 0,5 estima el error estándar (típico) EE
Estimación por Intervalos de Confianza• Hay una confianza del 68% de que μ esté en 60±0,5
• Hay una confianza del 95% de que μ esté en 60±1
60
Nivel de confianza = 1-
Probabilidad de error o nivel de significancia: = 0.10, 0.05, 0.01
Prueba de Hipótesis
Consideraciones preliminares
•Muestras independientes o pareadas
•Varianzas iguales o diferentes
•Prueba de la normalidad
•Datos fuera de rango
•Pruebas paramétricas o no paramétricas
•El valor de “p”
Ejemplos de Hipótesis:
1. La talla de los peruanos es diferente de 1.65
2. El estado nutricional de las gestantes depende del nivel
de hemoglobina
3. La talla promedio de niños con lactancia materna es
mayor de los niños que no recibieron
4. La proporción de fumadores del género femenino es
menor al género masculino
5. Existe relación entre los conocimientos y las prácticas
que tiene la madre del niño menor de 5 años sobre la
medidas preventivas de las IRA.
6. El peso final es diferente al peso inicial después de la
aplicación de una dieta
Región crítica y nivel de significancia
No rechazo H0
Reg. CríticaReg. Crítica
=2.5%
Nivel de significancia + Nivel de confianza = 100
=2.5%
=95%
=5%
Rechazo H0Rechazo H0
NIVEL DE SIGNIFICANCIA
0.025
0.95
0
Z= 1.96Z= - 1.96
0.025
DISTRIBUCIÓN NORMAL ESTANDARIZADA ACUMULADA
Muestras Independientes o Pareadas
Muestras Independientes
Se dice que dos o más muestras son independientescuando sus datos provienen de gruposdiferentes, que no guardan ninguna relación entresí.
Ejm.
- Proporción de muertes neonatales de los hospitalesde Essalud y Minsa.
- Estado nutricional de niños de Lima Cercado yChosica.
- Edad gestacional de Adolescentes y Añosas.
…muestras Independientes o Pareadas
Muestras Pareadas o Repetidas
Se dice que las muestras son pareadas cuando
1. Dos o más grupos de datos provienen de unamisma muestra, también se denomina muestrarepetida.
Ejm. Cuando se quieren determinar diferencias entrelos niveles de Hb en una intervención quirúrgicaen tres momentos :Hb basal, a los 10 minutos y alos 20 minutos.
2. Cuando se forman dos muestras en donde laspersonas son pareadas o emparejadas con otraspersonas que tienen las mismas característicasque se desean controlar.
Ejm.
Se quiere determinar si el hecho de comerpescado es un factor para contraer el cólera. Paralo cual se identifica a un grupo de personas quetuvieron la enfermedad y se emparejan cada unade ellas con otra persona que no tiene laenfermedad. Se empareja tomando en cuentaciertos tipos de variables, edad, sexo, barrio, etc.
…muestras Independientes o Pareadas
EL VALOR DE “p”
…sea cual sea el valor de “p” y demasiadas
veces de “ No hay diferencias significativas”
deducimos que “no hay diferencias”.
Austin Bradford Hill
…el valor de “p”
El valor de “p” nos permitirá interpretar los
resultados de un análisis de datos realizado por un
software, toda vez que en este caso ya no existe la
necesidad de usar tablas para comparar un valor
calculado con el tabulado.
…el valor de “p”
Interpretación:
1. Si el valor de “p” es mayor que el valor de
significación (α) entonces no existen diferencias
estadísticamente significativas.
2. Si el valor de “p” es menor que el valor de
significación (α) entonces existen diferencias
estadísticamente significativas.
Prueba de la Normalidad
Es importante realizar esta prueba cuando no setiene la certeza de que los datos provienen o no deuna curva normal.
Conocer si los datos provienen de una curva normalpermitirá decidir que pruebas se han de utilizar.
Se utilizarán pruebas Paramétricas si los datosprovienen de una curva normal.
Se utilizarán pruebas No paramétricas si los datosno provienen de una curva normal.
…prueba de la Normalidad
La condición para decidir si un determinado
grupo de datos tiende a una curva normal es que
al menos existan más de 30 datos de la variable
en estudio (tamaño de muestra mínimo) en cada
grupo de estudio.
De particular interés están los coeficientes de
asimetría y curtosis estandarizados que pueden
utilizarse para determinar si la muestra procede de
una distribución normal.
Los valores de estos estadísticos fuera del rango de
-2 a +2 indican alejamiento significante de
normalidad que tendería a invalidar cualquier test
estadístico con respecto a la desviación normal.
…prueba de la Normalidad
• También se puede utilizar el valor de
Asimetría para la prueba de la normalidad.
• Si el valor de Asimetría es mayor que
1(uno) en valor absoluto entonces se dice
que no pertenece a una distribución normal.
…prueba de la Normalidad
En algunos casos a pesar de que existe una
gran cantidad de datos (más de 30), sin
embargo los valores de curtosis o asimetría
indican que los datos no provienen de una
curva normal.
Esto se puede deber a la presencia de datos
FUERA DE RANGO O INTERVALO.
Datos Fuera de Rango o Intervalo
• El dato se observa, registra e introduce en la
computadora incorrectamente.
• El dato proviene de una población distinta.
• El dato es correcto pero representa un suceso
poco común (fortuito).
Datos Fuera de Rango o Intervalo
Los datos fuera de intervalo aparecen generalmente por las siguientes razones:
Como detectar un dato fuera de rango
1. Calculando el Valor Z
Si el valor de Z es mayor de 3 quiere decirque ese dato está fuera de intervalo, ya que seasume que el 100% de una población estácomprendida dentro del rango de -3z y +3z (-3s y +3s).
s
yyZ
2. Con el gráfico de Caja y Bigotes (Box and Plot).
– Al elaborar este gráfico haciendo uso de los
rangos intercuartílicos y la mediana, así como
los valores de -3s y +3s. Se puede determinar
fácilmente los datos que se encuentran fuera
de rango.
Transformación a curva normal
Los datos que no cumplen el criterio de ser
una curva normal de acuerdo con los
anteriores estadísticos, se pueden convertir
a una curva normal utilizando la raíz
cuadrada o el logaritmo natural de los datos.
Pruebas Paramétricas o No
Paramétricas
Pruebas Paramétricas
Se dice que una prueba es paramétrica cuando:
• Se trata de variables cuantitativas cuyo número esmayor de 30 datos o provienen de una curvanormal.
• Pueden ser menos de 30 datos si es que se tiene laseguridad que provienen de una curva normal
• Si son seis o menos datos, usar pruebas noparamétricas. Algunos indican 11 o menor de 20.
…Pruebas Paramétricas o No Paramétricas
Pruebas no Paramétricas
Son pruebas no paramétricas cuando:
• Se trata de variables cualitativas.
• Se trata de variables cuantitativas, conmenos de 30 datos y no provienen de unacurva normal.
• Cuando son seis o menos datos. Algunosindican 11 o 20 datos.
SPSS
PRUEBAS ESTADÍSTICAS
Pruebas para
Comparar grupos
Variables
cualitativas
Variables
cuantitativas
2 grupos 3 grupos2 grupos Tres o más grupos
Pruebas para comparar
grupos
VARIABLES CUALITATIVAS
COMPARACIÓN DE DOS GRUPOS
Variables Categóricas o Cualitativas
Menú principal
2 grupos
Muestras
independientes
Chi Cuadrado
Corrección de Yates
Frecuencias
pequeñas:
Prueba exacta de
Fisher
Muestras
pareadas
McNemar
Comparación de dos proporciones Independientes
Prueba de Chi Cuadrado
Ejemplo 6
Se desea analizar el tratamiento de la
infección urinaria con dos antibióticos A y
B. Dividiéndose 34 pacientes en dos grupos
de 17, evaluándose después de un tiempo de
observación si la infección desapareció o
no.
Solución
1. Codificar la variable 1 como:
– Etiqueta: Tratamiento de Antibiótico
– 1= A
– 2= B
2. Codificar la variable 2 como
– Etiqueta: Desaparición de la Infección
– 1= Si
– 2= No
Interpretación
Como el valor de p = 0,001 es menor que
0,05 entonces hay diferencias
significativas entre los grupos, por lo tanto
podemos concluir que el tratamiento con
el antibiótico A es más eficaz que el
antibiótico B.
volver
Comparación de dos proporciones pareadas
Prueba de Chi Cuadrado de McNemar
Ejemplo 7
Se desea saber si el efecto de dos fármacos es
el mismo para desaparecer los síntomas de una
úlcera. Para lo cual se seleccionan 50 pacientes
a los que se les administra el fármaco A. Luego
se busca a otro paciente de características
similares (Par o “gemelo”) al que se les
suministra el fármaco B. Después de un periodo
de observación se comprueba en cada caso si
los síntomas han desaparecido.
Solución
1. Codificar la variable 1 como:
– Etiqueta: Fármaco A
– 1= Úlcera ha cicatrizado
– 2= Úlcera no ha cicatrizado
2. Codificar la variable 2 como
– Etiqueta: Fármaco B
– 1= Úlcera ha cicatrizado
– 2= Úlcera no ha cicatrizado
Interpretación
Como el valor de p = 0,607 es mayor que
0,05 entonces no hay diferencias
significativas entre los grupos, por lo tanto
podemos concluir que el Fármaco A y el
Fármaco B tienen la misma eficacia para
la cicatrización de úlceras.
Volver
Comparación de 3 o más grupos
Variables Cualitativas
Menú Principal
Muestras
independientes Muestras
pareadas
3 o más grupos
χ2 Q de Cochran
Comparación de 3 o más proporciones
Independientes
Prueba de Chi Cuadrado Ejemplo 8
Se desea analizar si el efecto de tres tratamientosdermatológicos para el acné A,B y C, depende deltipo de presentación, crema, comprimido, polvo ylíquido. Para lo cual se distribuyen 300 pacientes en12 grupos de 25 cada uno. Luego de un periodo deobservación se analiza la proporción de pacientes sinacné en cada grupo.
Se desea determinar si la eficacia del tratamientoestá relacionado con el tipo de presentación.
Solución1. Codificar la variable 1 como:
– Etiqueta: Tratamiento dermatológico
– 1= A
– 2= B
– 3= C
2. Codificar la variable 2 como
– Etiqueta: Presentación del tratamiento
– 1= Crema
– 2= Comprimido
– 3= Polvo
– 4= Líquido
Interpretación
Como el valor de p = 0,00 asociado al
estadístico Chi cuadrado es menor que
0,05 entonces hay diferencias
significativas entre los grupos, por lo tanto
podemos concluir que el uso del
tratamiento dependerá del tipo de
presentación.
Volver
Comparación de 3 o más proporciones pareadas
Prueba Q de Cochran
Ejemplo 9
Se desea analizar el efecto de dos fármacos sobre lossíntomas de la úlcera, para lo cual se distribuyen 150pacientes en tres grupos de 50 cada uno.Aleatoriamente se suministra a 50 pacientes unplacebo, luego se busca dos pares o “gemelos” aquienes se les suministra los fármacos A y Brespectivamente. Después de un periodo se observasi los síntomas han desaparecido o no.
Se desea determinar si la eficacia de los fármacoscon respecto al placebo es la misma .
Solución1. Codificar la variable 1 como:
– Etiqueta: Placebo
– 1= Úlcera ha cicatrizado
– 2= Úlcera no ha cicatrizado
2. Codificar la variable 2 como– Etiqueta: Fármaco A
– 1= Úlcera ha cicatrizado
– 2= Úlcera no ha cicatrizado
3. Codificar la variable 3 como:– Etiqueta: Fármaco B
– 1= Úlcera ha cicatrizado
– 2= Úlcera no ha cicatrizado
Interpretación
Como el valor de p = 0,09 asociado al
estadístico Q de Cochran es menor que
0,05 entonces hay diferencias
significativas entre los grupos, por lo tanto
podemos concluir que los fármacos tienen
menor efectividad que el placebo.
Volver
Pruebas para comparar
grupos
VARIABLES CUANTITATIVAS
COMPARACIÓN DE DOS GRUPOS
Variables Cuantitativas
Menú principal
2 Grupos
Muestras
independientes
¿Distribución
normal?
("paramétrica")
Si
¿Varianzas Iguales?
Si
t de student para v.
iguales
No
T de student para
var.
diferentes
No
U Mann-Whitney
Muestras
pareadas
¿Distribución
normal?
("paramétrica")
Si
t de Student
pareada
No
Prueba Wilcoxon
Comparación de dos grupos
independientes con distribución normal
Prueba de t de Student
Ejemplo 10
Se desea conocer si la disminución de
hemoglobina es independiente de la presencia o no
de úlcera en los pacientes cuando se aplica un
nuevo tratamiento. Para lo cual se mide la
disminución de hemoglobina en 70 pacientes, de
los cuales 28 tenían úlcera y 42 no.
Solución
1. Codificar la variable 1 como:
– Etiqueta: Disminución de Hemoglobina
2. Codificar la variable 2 como
– Etiqueta: Con úlcera
– 1= Si
– 2= No
El valor de p= 0,138 nos indica queno hay diferencias significativas entrelas varianzas por lo que se asume laigualdad de varianzas.
Interpretación
Como el valor de p= 0,00 asociado alestadístico “t”, cuando se asumenvarianzas iguales es menor que 0,05entonces existen diferencias significativasentre los promedios. Por lo tanto se puedeconcluir que la disminución dehemoglobina es diferente entre lospacientes con úlcera y sin úlcera. Para elejemplo existe mayor disminución dehemoglobina en los pacientes con úlcera.
Volver
Comparación de dos grupos independientes
sin distribución normal (no paramétrica)
Prueba de U de Mann- Witney
Ejemplo 12
Se desea conocer si al aplicar un nuevo Fármacomás el tratamiento habitual permite incrementar laFEVI (fracción de eyección del ventrílocuoizquierdo) deprimida en grado severo. Seseleccionan 12 pacientes a los que se les aplica eltratamiento habitual y 11 pacientes a quienes seles aplica el tratamiento habitual más el nuevoFármaco. Luego de seis meses se mide la FEVI enambos grupos.
Solución
1. Codificar la variable 1 como:
– Etiqueta: FEVI
2. Codificar la variable 2 como
– Etiqueta: Tratamiento
– 1= Habitual
– 2= Habitual más fármaco.
Interpretación
Como el valor de p= 0,740 asociado alestadístico “U” de Mann-Whitney, esmayor que 0,05 entonces no existendiferencias significativas entre lasmuestras. Por lo tanto se puede concluirque el uso del Farmaco A más eltratamiento habitual no aumentasignificativamente el FEVI.
Volver
Comparación de dos grupos pareados con
distribución normal
Prueba de t de Student para muestras pareadas
Ejemplo 11
Se desea conocer si un tratamiento contra la
artrosis puede causar disminución de
hemoglobina. Para lo cual se mide la
hemoglobina en 70 pacientes antes y
después del tratamiento.
Solución
1. Codificar la variable 1 como:
– Etiqueta: Hemoglobina inicial
2. Codificar la variable 2 como
– Etiqueta: Hemoglobina final
Interpretación
Como el valor de p= 0,00 asociado alestadístico “t”, es menor que 0,05entonces existen diferencias significativasentre los promedios inicial y final. Por lotanto se puede concluir que el tratamientocontra la artrosis produce disminución dehemoglobina.
Volver
Comparación de dos grupos
pareados sin distribución normal
Prueba de Wilcoxon
Ejemplo 13
Se desea conocer si el nivel de colesterol se
incrementa debido a un producto (A) presente en
la dieta de los pacientes de un hospital. Para lo
cual se cambia el Producto A por un producto B
menos rico en colesterol y se hace la medición del
colesterol a 42 pacientes antes y después de la
sustitución del producto.
Solución
1. Codificar la variable 1 como:
– Etiqueta: Colesterol inicial
2. Codificar la variable 2 como
– Etiqueta: Colesterol final
Interpretación
Como el valor de p= 0,230 asociado alestadístico Wilcoxon, es mayor que 0,05entonces existen diferencias significativasentre los rangos positivos y negativos. Porlo tanto se puede concluir que el colesterolen los pacientes no se ve incrementadopor el consumo del producto A.
volver
Comparación de 3 o más grupos
Variables Cuantitativas
Menú Principal
3 o más grupos
Muestras
independientes
¿Distribución
normal?
("paramétrica")
Si
ANOVA
No
Kruskal-Wallis
Muestras
apareadas
¿Distribución
normal?
("paramétrica")
Si
ANOVA para
medidas
repetidas
No
Friedman
Comparación de 3 o más grupos
independientes con distribución normal
ANÁLISIS DE LA VARIANZA (ANOVA)
Ejemplo 14
Se desea saber si el tiempo de reaparición de los
síntomas en pacientes con úlcera péptica es
independiente del tiempo de respuesta a un
tratamiento aplicado. Para lo cual se determina el
tiempo de reaparición de los síntomas y se agrupa de
acuerdo al tiempo de respuesta en cuatro grupos
(2, 4, 6 y 8 semanas).
Solución
1. Codificar la variable 1 como:
– Etiqueta: Tiempo de respuesta al tratamiento
– 1 = 2 semanas
– 2 = 4 semanas
– 3 = 6 semanas
– 4 = 8 semanas
2. Codificar la variable 2 como
– Etiqueta: Tiempo de reaparición de los síntomas
• Como el valor de p = 0,00 asociado al
estadístico de Levene es menor que 0,05
entonces las varianzas son diferentes, por lo
que se tendrá que homogenizar las
varianzas con la función potencia, raíz
cuadrada y logaritmo natural.
Interpretación
Como el valor de p = 0,00 asociado al
estadístico de F de Snedecor es menor que
0,05 entonces existen diferencias
significativas entre los promedios. Por lo
tanto se tiene que realizar la prueba de
comparaciones múltiples para determinar
entre que grupos existen las diferencias.
Tukey (grupos del mismo tamaño)
Scheffé (grupos de diferente tamaño)
Conclusión
• El análisis de comparaciones múltiples nos
indica que todos los grupos son
diferentes, por lo tanto se debe considerar
que el tiempo de reaparición de los síntomas
va a ser diferente para cada tiempo de
respuesta al tratamiento.
volver
Comparación de 3 o más grupos
independientes sin distribución normal
ANÁLISIS DE LA VARIANZA DE KRUSKAL-WALLIS
Ejemplo 15
Se desea saber si un Fármaco aumenta el índice cardiaco en
pacientes con Shock, pero se sospecha que el aumento
puede ser diferente según el tipo de shock. Para lo cual se
suministra el fármaco a 99 pacientes y después de un
determinado tiempo se mide el índice cardiaco y se divide
en cuatro grupos de acuerdo con el tipo de shock
(Hipovolémico, Cardiogénico, Distributivo y Obstructivo).
Interpretación
Como el valor de p = 0,001 es menor que
0,05 entonces los promedios de rangos en
los cuatro tratamientos son diferentes. Por
lo tanto se puede concluir indicando que el
fármaco incrementa el índice cardiaco
independientemente del tipo de shock.
Siendo mayor el efecto en el grupo
cardiogénico.
Volver
Comparación de 3 o más grupos
pareados con distribución normal
ANOVA PARA MEDIDAS REPETIDAS
Ejemplo 16
Se desea conocer el efecto de tres fármacos para reducir
la presión arterial sistólica. Para lo cual se buscó a 160
pacientes, a los que se les administró el fármaco
A, luego se buscó a dos “pares” o “gemelos” de la
misma edad, al primero se le administró el Fármaco B
y al segundo el Fármaco C.
Solución
1. Codificar la variable 1 como:
– Etiqueta: Fármaco A
2. Codificar la variable 2 como
– Etiqueta: Fármaco B
3. Codificar la variable 3 como
– Etiqueta: Fármaco C
Interpretación
Como el valor de p = 0,523 asociado al
estadístico de contraste es mayor que 0,05
entonces no existen diferencias
significativas entre los grupos. Por lo tanto
se puede concluir que el efecto de los
fármacos sobre la presión arterial sistólica
es el mismo.
Volver
Comparación de 3 o más grupos
pareados sin distribución normal
PRUEBA DE FRIEDMAN
Ejemplo 17
Se desea conocer si el consumo de un fármaco (A)
antihipertensivo es igual que el de otros dos
fármacos (B y C) de la competencia. Para lo cual
se seleccionan aleatoriamente 34 farmacias y se
obtiene el número de fármacos (A, B y C)
vendidos en el mes en cada farmacia.
Solución
1. Codificar la variable 1 como:
– Etiqueta: Cantidad de Fármaco A
2. Codificar la variable 2 como:
– Etiqueta: Cantidad de Fármaco B
3. Codificar la variable 3 como:
– Etiqueta: Cantidad de Fármaco C
Interpretación
Como el valor de p = 0,865 asociado al
estadístico de Friedman es mayor que 0,05
entonces no existen diferencias
significativas entre los grupos. Por lo tanto
se puede concluir que la venta de los tres
fármacos es la misma.
volver
Asociación entre dos variables
cuantitativasCorrelación de Pearson
Ejemplo 21
Se realiza un estudio para establecer una ecuación
mediante la cual se pueda utilizar la concentración
de estrona en saliva(X) para predecir la
concentración del esteroide en plasma libre (Y).
Para lo cual se midieron la concentración de
ambos indicadores en 14 varones sanos.
Solución
1. Codificar la variable 1 como:
– Etiqueta: Estrona en Saliva
2. Codificar la variable 2 como:
– Esteroide en plasma libre
Interpretación
Como el valor de p = 0,00 asociado al
estadístico t es menor que 0,05 entonces
podemos concluir que conociendo el nivel
de estrona en la saliva se puede predecir
concentración de esteroide en el plasma
libre.
VOLVER
edad de los encuestados
20
40
60
80
191
412
Figura 4. Ejemplo de gráfico de Caja y Bigotes. Edad de
encuestados.
Volver
top related