testes de hipÓteses - inf.ufsc.brmarcelo.menezes.reis/aula10cpgcc.pdf · os resultados da...

45
1 TESTES DE HIPÓTESES Testes de comparação entre grupos

Upload: duonglien

Post on 18-Jan-2019

216 views

Category:

Documents


0 download

TRANSCRIPT

1

TESTES DE HIPÓTESES

Testes de comparação entre grupos

2

Abordagem não paramétrica

Não se faz suposição sobre as medidas da variável de interesse

3

Exemplo 1

Com o objetivo de avaliar o efeito de um programa de

treinamento sobre a produtividade dos funcionários de

uma certa empresa, fez-se um estudo em que se observou a

produtividade de uma amostra de funcionários antes e

depois do programa de treinamento.

4

Exemplo 1

ANTES TREINAMENTO DEPOIS

Melhorou

ou piorou?

5

Exemplo 1

Hipóteses:

H0: = 0,5

H1: > 0,5

= probabilidade de melhorar

Resultado do Experimento: dos 10 funcionários submetidos ao treinamento, 7 melhoraram.

6 p = 0,172 ou 17,2%

Uso da distribuição binomial

valor esperado

por H0

x 0.001

0.010

0.044

0.117

0.205

0.246

0.205

0.117

0.044

0.010 0.001

0 1 2 3 4 5 6 7 8 9 10

7

Exemplo 1

Adotando = 5%

p = 17,2% > ==> O teste aceita H0

Não se pode afirmar que o programa de

treinamento realmente aumenta a produtividade

dos funcionários

8

Abordagem paramétrica

Faz-se suposições sobre as medidas da variável de interesse.

Especialmente sobre a distribuição amostral.

Tem-se testes mais poderosos.

9

Exemplo 2

Com o objetivo de avaliar o efeito de um programa de

treinamento sobre a produtividade dos funcionários de

uma certa empresa, fez-se um estudo em que se observou

a produtividade de uma amostra de funcionários antes e

depois do programa de treinamento. OBS. Avaliações

quantitativas

10

Exemplo 2

ANTES TREINAMENTO DEPOIS

De quanto

foi a

variação?

11

Exemplo 2

Hipóteses:

H0: µdepois = µantes

H1: µdepois > µantes

µantes: produtividade esperada antes do programa;

µdepois: produtividade esperada após o programa;

12

Exemplo 2 - Amostra

Funcio- Produtividade nário antes depois diferença

1 22 25 3 2 21 28 7 3 28 26 -2 4 30 36 6 5 33 32 -1 6 33 39 6 7 26 28 2 8 24 33 9 9 31 30 -1 10 22 27 5

13

-2 0 2 4 6 8 10

Exemplo 2 - Amostra

A análise é feita com a variável diferença: D =

depois - antes

D: 3, 7, -2, 6, -1, 6, 2, 9, -1, 5

valor esperado

de D, D, sob H0

média dos valores

observados de D:

D = 3,4

14

Estatística do teste

S

n . D =t

D

onde

n: número de pares (antes, depois) observados;

D: média das diferenças observadas e

SD : desvio padrão das diferenças observadas

15

Distribuição de referência

-4 -3 -2 -1 0 1 2 3 4 0

0,1

0,2

0,3

0,4

t

f(t)

possíveis valores da estatística t

Assumindo que D

tenha distribuição

normal, sob H0, t

tem distribuição

“t” com n – 1 graus

de liberdade.

16

Exemplo 2 - Amostra

D = depois - antes

D: 3, 7, -2, 6, -1, 6, 2, 9, -1, 5

3,4 = 10

34 =

n

D = D

3,81. = 1 10

)(10).(3,4 246 =

1 n

D.n D = S

222

D

17

2,82. = 3,81

10 . 3,4 =

S

n . D =t

D

Estatística de teste:

Exemplo 2 - Amostra

18

0 t = 2,82

P = 0,010 (tabela t)

Distribuição de referência: t com gl = n - 1 = 9

19

Tabela t

área cauda superior

gl 0,25 0,10 0,05 0,025 0,01 0,005

... ... ...

9 0,703 1,383 1,833 2,262 2,821 3,250

... ... ...

Amostra: gl = 9 e t = 2,82

p = 0,01

20

Exemplo 2 - conclusão

O teste rejeita H0 ao nível de significância de 5%.

O programa de treinamento aumenta a produtividade dos funcionários

21

Exercício 1

Os dados a seguir referem-se a acidentes de trabalho

que ocasionam perda de tempo (média das horas de

trabalho perdidas por mês, durante um ano). Os dados

foram recolhidos antes e depois de um programa de

segurança de trabalho, desenvolvido em 6 indústrias.

22

Exercício 1

Horas de trabalho perdidas por mês antes e depois do programa de prevenção

Indústria número

1 2 3 4 5 6

Antes 38 64 42 70 58 30

Depois 31 58 43 65 52 29

Os dados mostram evidência de que o programa de prevenção é efetivo? Use nível de significância de 5%.

23

Exercício 1

Hipóteses:

H0: depois = antes

H1: depois < antes

depois: valor médio de horas perdidas

por mês após o programa de prevenção

antes: valor médio de horas perdidas

por mês antes do programa de prevenção

24

Exercício 1

Cálculo da estatística do teste:

Indústria número

1 2 3 4 5 6

Antes 38 64 42 70 58 30

Depois 31 58 43 65 52 29

Diferença (D): -7 -6 +1 -5 -6 -1

= -4,000 SD = 3,225 D

25

04,3 = 225,3

6 . 4 =

S

n . D =t

D

Cálculo da estatística do teste:

Exercício 1

26

Tabela t

área cauda superior

gl 0,25 0,10 0,05 0,025 0,01 0,005

... ... ...

5 0,727 1,476 2,015 2,571 3,365 4,032

... ... ...

Amostra: gl = 5 e t = -3,04

0,01 < p < 0,025

27

Exercício 1 - conclusão

O teste rejeita H0 ao nível de significância de 5%.

O programa de prevenção de acidentes reduz, em média, o número de acidentes.

28

Projeto do experimento ou do levantamento de dados

DADOS PAREADOS AMOSTRAS

INDEPENDENTES

X11 X21

X12 X22

X1n X2n

...

X11

X12

...

X1n

X21

X22

...

X2m

29

Dados pareados

Projetos do tipo antes-e-depois, como nos exemplos

anteriores.

Comparação de dois tipos de argamassas (A e B). Ambas

aplicadas em n tipos de paredes.

Análise: teste t para dados pareados (já visto!)

30

Amostras independentes

Comparação de dois medicamentos (A e B), cada

um aplicado a um grupo de pacientes.

Comparação de dois tipos de argamassas (A e B).

Cada argamassa aplicada num conjunto diferente

de paredes.

Importante: aleatorização

Análise: teste t para amostras independentes

31

Exemplo 3

H0: Em média, os dois métodos produzem os mesmos resultados;

H1: Em média, os dois métodos produzem resultados diferentes.

Problema: comparação de dois métodos de ensino.

32

H0: 1 = 2 e H1: 1 2

1: nota média de indivíduos

submetidos ao método A de ensino;

2: nota média de indivíduos submetidos ao método B de ensino.

Exemplo 3

33

Exemplo 3

Amostras: notas numa avaliação, por grupo

método A método B

45 51 50 62 43 45 35 43 59 48

42 53 50 48 55 45 41 43 49 39

34

Exemplo 3

30 35 40 45 50 55 60 65

nota

método A

método B

35

A importância da análise da variabilidade

a) evidência de grupos diferentes

b) não evidência de grupos diferentes

36

A estatística do teste (admitindo n1 = n2 = n)

onde

2

2

2

2

12 SSSa

221

2 aS

nXX t =

37

Exemplo 3 - continuação

Amostra 1 Amostra 2

n1 = 10 n2 = 10

X1 = 49,90 X2 = 44,70

S1 = 5,97 S2 = 6,50

95,382

)50,6()97,5(

2

222

2

2

12

SS

Sa

86,1)95,38(2

1070,4490,49

2 221

aS

nXX t =

38

Exemplo 3 - continuação

Uso da tabela t

Amostras ==> gl = 2(n-1) = 18 e t = 1,86

área cauda superior

gl 0,25 0,10 0,05 0,025 0,01 0,005

... ... ...

18 0,688 1,330 1,734 2,101 2,552 2,878

... ... ...

0,05 < p < 0,10 p = 0,0794

39

Exemplo 3 - conclusão

O teste aceita H0 ao nível de significância de 5%.

Os dados não comprovam diferença entre os dois métodos de ensino.

40

Exercício 2

Para verificar o grau de adesão de uma nova cola para vidros, prepararam-se dois tipos de montagem: cruzado, onde a cola é posta em forma de X, e quadrado, onde a cola é posta apenas nas 4 bordas. Os resultados da resistência para duas amostras de 10 ensaios cada estão a seguir. Os tipos de montagem são diferentes em termos de resistência média?

41

Resultados das resistência nos 20 ensaios Método cruzado Método quadrado

16 14 19 18 19 13 19 14 17 21

20 15 18 17 18 24 10 14 13 15 Média = 17,4 16,0

Desvio padrão = 1,897 4,243

Exercício 2

42

Exercício 2 - resolução

H0: Em média, o grau de adesão é o mesmo para os dois métodos.

H1: Em média, o grau de adesão é diferente para os dois métodos.

43

n1 = 10 n2 = 10

X1 = 17,4 X2 = 16,0

S1 = 1,897 S2 = 4,243

Exercício 2 - resolução

801,102

2

2

2

12

SS

Sa

95,02 221

aS

nXX t =

44

Amostra gl = 18

t = 0,95

Tabela 0,20 < p < 0,50 p = 0,3546

aceita H0 ao nível de significância de 5%

não há evidência de diferença entre os dois

métodos.

Exercício 2 - resolução

45

A estatística do teste (admitindo n1 ≠ n2)

onde 2

)1()1(

21

2

22

2

112

nn

SnSnSa

21

21

11

nnS

xx t =

a