Download - Testes para comparação de duas médias
Especialização em Pesquisa ClínicaMódulo 3 – Epidemiologia e Bioestatística
Daniel Kashiwamura Scheffer1o. Semestre – 2009
Testes para comparação de médias
Na prática, o mais comum é se comparar as médias de duas populações diferentes (cujas médias são
desconhecidas).
Com freqüência esses dois grupos recebem tratamentos diferentes ou sofrem exposições diferenciadas
n,N~X
2
0
Dois grupos possuem respostas de interesse (variáveis)
quantitativas com distribuição normal com parâmetros (μ1, σ1) e
(μ2, σ2), respectivamente.
Parâmetros da distribuição normal
(gaussiana)
Testes para comparação de médias
Queremos comparar dois grupos:
Testes paramétricos Testes não-paramétricos
Teste t Teste de Mann-Whitney
Livres de distribuição.
n,N~X
2
0
Variáveis quantitativas
Teste t para duas amostras independentes
Suposições:
Populações Normais: X ~ N(1,12) e Y ~ N(2, 2
2)
Amostras Independentes
A idéia é comparar os parâmetros 1 e 2 em termos
de sua diferença 1- 2.
DESCONHECIDOS
Análogo, para a população do grupo 2
De uma população normal com média 1 e desvio-padrão 1, extraímos uma amostra de tamanho n1, com média x1 e desvio padrão s1.
Grupo 1 Grupo 2
PopulaçãoMédia 1 2
Desvio-padrão 1 2
Amostra
Média x1 x2
Desvio-padrão s1 s2
Tamanho da amostra n1 n2
Duas situações para comparar essas amostras
As variâncias das populações originais são iguais (ou assume-se)
As variâncias das populações originais são DESiguais
Teste t para duas amostras independentes
H0: μ1 - μ2 = 0 (caso particular: H0: μ1 = μ2)
2nn
) S1-(n) S1-(nS
; t ~
n1
n1
S
δYXt
21
22
212
2-nn
21
2
0
21
21
Variâncias populacionais iguais (e desconhecidas)
As variâncias populacionais são desconhecidas. Então substituo pelas estimativas amostrais.
Ponderação das duas variâncias
Estatística do teste Distribuição t-
Student
Teste t para duas amostras independentes
-4 -2 0 2 4
0.0
0.1
0.2
0.3
0.4
T1
T5
T30
Z
Distribuição t-Student
Teste t para duas amostras independentes
• Pacientes com problemas de depressão formaram dois grupos: um que recebeu tianeptina (fármaco antidepressivo) e outro que recebeu placebo. Ao final de 40 dias, os pesquisadores quantificaram a depressão desses pacientes através de uma escala (MADRS). Quanto maior o valor dessa escala, mais grave é o quadro depressivo do paciente. Os dados são fornecidos na tabela abaixo:
p pequeno (p < α)
p grande (p > α)
Rejeito H0
Não rejeito H0
Objetivo: comparar o escore MADRS entre os grupos que receberam tianeptina e placebo.
Exemplo
p-valor é a probabilidade dos dois grupos serem equivalentes
Grupo MADRS
Placebo6 33 21 26 10
29 33 29 37 152 21 7 26 13
Tianeptina
10 8 17 4 1714 9 4 21 37 10 29 13 142
• O valor MADRS médio do grupo tianeptina é de 11,37 (desvio padrão igual a 7,3) e o valor médio do grupo controle (placebo) é de 20,53 (desvio padrão igual a 11,09).
Two-sample T for MADRS
Grupo N Mean StDev SE Mean 1 15 20,5 11,1 2,9 2 16 11,4 7,26 1,8
Difference = mu (1) - mu (2)Estimate for difference: 9,1695% CI for difference: (2,32; 16,00)T-Test of difference = 0 (vs not =): T-Value = 2,74 P-Value = 0,010 Both use Pooled StDev = 9,31
Quadro 1. Resultados do Teste t realizado no Minitab (Grupo 1: placebo; Grupo 2: tianeptina).
Exemplo – Teste t
t-test for Equality of Means
t dfSig.
(2-tailed)Mean
DifferenceStd. Error Difference
95% Confidence Interval of the
Difference
Lower UpperPADRS
2,497 17,520 ,023 13,49 5,402 2,120 24,864
GRUPO N Mean Std. Deviation Std. Error MeanPADRS 1 15 24,87 19,708 5,089
2 16 11,38 7,256 1,814
Exemplo – Teste t
• Pacientes com problemas de depressão formaram dois grupos: um que recebeu tianeptinaX (fármaco antidepressivo) e outro que recebeu placebo. Ao final de 40 dias, os pesquisadores quantificaram a depressão desses pacientes através de uma escala (PADRS). Quanto maior o valor dessa escala, mais grave é o quadro depressivo do paciente. Os dados são fornecidos na tabela abaixo:
Teste de Mann-Whitney
Suposições:
Amostras Independentes
A idéia é comparar as medianas (Md1 e Md2).
A variável de interesse é quantitativa
Se as populações diferem, elas diferem somente em relação às medianas
Grupo MADRS ordem posto1 2 1 1,52 2 2 1,52 3 3 32 4 4 4,52 4 5 4,51 6 6 61 7 7 7,52 7 8 7,52 8 9 92 9 10 101 10 11 122 10 12 122 10 13 12... ... ... ...1 21 22 222 21 23 221 26 24 24,51 26 25 24,51 29 26 271 29 27 272 29 28 271 33 29 29,51 33 30 29,51 37 31 31
Exemplo – Teste de Mann-Whitney
1) Ordeno meu banco de dados (ordem crescente);2) Crio um ranking (ou postos) para as observações:
• Se não houver empates, os postos equivalem à posição dos valores ordenados (coluna ordem);
• Se houver empates, os postos dos valores empatados correspondem a uma média das ordens em que há o empate.
2
)1n(nSMW
Soma dos postos do grupo com menor valor
Tamanho da amostra do grupo
com menor soma S
No exemplo, S1 = 296,5 e S2= 199,5 n1 = 15 e n2= 16
MW = 199,5 – (16x17)/2MW = 63,5
Exemplo – Teste de Mann-Whitney
No exemplo, S1 = 296,5 e S2= 199,5 n1 = 15 e n2= 16
MW = 199,5 – (16x17)/2MW = 63,5
Procuramos em uma tabela o p-valor
associado a essa estatística MW
Mann-Whitney Test and CI: G1; G2
G1 N = 15 Median = 21,00G2 N = 16 Median = 10,00Point estimate for ETA1-ETA2 is 10,5095,4 Percent CI for ETA1-ETA2 is (1,00;18,00)W = 296,5Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0,0269The test is significant at 0,0266 (adjusted for ties)
Exemplo – Teste de Mann-Whitney
Quadro 1. Resultados do Teste MW realizado no Minitab (Grupo 1: placebo; Grupo 2: tianeptina).
E se tivermos mais de 2 grupos para serem comparados?
O teste t, por exemplo, não é mais adequado para testar esses grupos
O teste de Mann-Whitney também não é mais adequado para testar esses
grupos
?
Existem outros testes que generalizam as comparações acima
Análise de Variância (ANOVA) Kruskal-Wallis
Referências BibliográficasReferências Bibliográficas
Básica
BUSSAB, W. de O. e MORETTIN, P. A. Estatística Básica. 5ª ed. São Paulo: Saraiva, 2005.
SOARES, J.F. e SIQUEIRA, A.L. Introdução à Pesquisa Médica. 2ª ed. COOPMED, 2002.
DANIEL, W.W. Biostatistics: A Foundation for Analysis in the Health Sciences. 7ª ed. New York: Wiley, 1998.
Sessenta pacientes com problemas depressivos foram selecionados para participar de uma pesquisa,
sendo que eles formaram dois grupos de 30 pessoas cada. Um grupo recebeu um fármaco antidepressivo
tradicional (chamaremos esse grupo de GTradicional) e o outro recebeu um medicamento novo
(chamaremos esse grupo de GNovo), cujo efeito o pesquisador acredita ser melhor do que o tradicional, no sentido
de melhorar o quadro depressivo de pacientes com este tipo de problema.Ao final de 40 dias, o pesquisador quantificou a depressão desses pacientes através de uma escala (MADRS). Quanto maior o valor dessa escala, mais grave é o quadro depressivo do paciente. Além
das informações acima descritas, esses pacientes iniciaram o estudo com características parecidas,
como a idade, o sexo, o peso e o quadro depressivo.
ExercícioExercício
Grupo N MédiaDesvio padrão
Q1 Mediana Q3 Mínimo Máximo Amplitude
GNovo 30 41,2 8,6 36,9 39,3 46,2 29,0 69,2 40,2
GTradicional 30 47,2 10,2 43,5 48,1 54,2 17,5 63,3 45,8
Tabela 1. Medidas resumo da escala MADRS, segundo grupo.
Two-Sample T-Test and CI: G_novo; G_tradicionalTwo-sample T for G_novo vs G_tradicional N Mean StDev SE MeanG_novo 30 41,18 8,57 1,6G_tradicional 30 47,2 10,2 1,9Difference = mu G_novo – mu G_tradicionalEstimate for difference: -6,0295% CI for difference: (-9,89; 1,35)T-Test of difference = 0 (vs not =): T-Value = -2,06 P-Value = 0,113 DF = 58
O passo seguinte do pesquisador foi comparar os dois grupos através de um Teste t. Ele utilizou um software
estatístico para facilitar as contas e os resultados são apresentados na figura abaixo.. Baseado nas informações do quadro abaixo, responda:
• Qual a conclusão do teste, considerando o nível de significância de 5%?
O pesquisador ficou em dúvida com o resultado do Teste t e decidiu realizar um teste não paramétrico
(Mann-Whitney). Os resultados são apresentados abaixo.Mann-Whitney Test and CI: G_novo; G_tradicional
G_novo N = 30 Median = 39,278G_tradicional N = 30 Median = 48,061Point estimate for ETA1-ETA2 is -7,53695,2 Percent CI for ETA1-ETA2 is (-11,148;-3,354)W = 705,0Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0,002
• Qual a conclusão do teste, considerando o nível de significância de 5% ?