prof. lorí viali, dr. [email protected] ...viali/estatistica/mat2246/material/laminas/cor... ·...

101
1 Prof. Lorí Viali, Dr. Prof. Lorí Viali, Dr. Prof. Lorí Viali, Dr. Prof. Lorí Viali, Dr. [email protected] [email protected] [email protected] [email protected] http://www.mat.ufrgs.br/~viali/ http://www.mat.ufrgs.br/~viali/ http://www.mat.ufrgs.br/~viali/ http://www.mat.ufrgs.br/~viali/

Upload: tranbao

Post on 18-Jan-2019

220 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

1

Prof. Lorí Viali, Dr.Prof. Lorí Viali, Dr.Prof. Lorí Viali, Dr.Prof. Lorí Viali, [email protected]@[email protected]@mat.ufrgs.br

http://www.mat.ufrgs.br/~viali/http://www.mat.ufrgs.br/~viali/http://www.mat.ufrgs.br/~viali/http://www.mat.ufrgs.br/~viali/

Page 2: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

2

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

É o grau de associação entre

duas ou mais variáveis. Pode ser:

correlacionalcorrelacionalcorrelacionalcorrelacional

ou

experimentalexperimentalexperimentalexperimental.

Page 3: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

3

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Numa relação experimental os

valores de uma das variáveis são

controlados.

No relacionamento correlacional,por outro lado, não se tem nenhumcontrole sobre as variáveis sendoestudadas.

Page 4: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

4

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Page 5: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

5

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Um engenheiro químico está

investigando o efeito da temperatura

de operação do processo no

rendimento do produto. O estudo

resultou nos dados da tabela

seguinte:

Page 6: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

6

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Temperatura, C0 (X) Rendimento (Y)100 45110 51120 54130 61140 66150 70160 74170 78180 85190 89

Page 7: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

7

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

O primeiro passo para

determinar se existe relacionamento

entre as duas variáveis é obter o

diagramadiagramadiagramadiagrama dededede dispersãodispersãodispersãodispersão (scatter

diagram).

Page 8: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

8

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

0

25

50

75

100

100 120 140 160 180 200

Temperatura (X)

Rendimento

(Y)

Page 9: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

9

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

O diagrama de dispersão

fornece uma idéia do tipo de

relacionamento entre as duas

variáveis. Neste caso, percebe-se que

existe um relacionamentorelacionamentorelacionamentorelacionamento linearlinearlinearlinear.

Page 10: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

10

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Quando o relacionamento

entre duas variáveis

quantitativas for do tipo linearlinearlinearlinear,

ele pode ser medido através do:

Page 11: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

11

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Page 12: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

12

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Observado um relacionamentorelacionamentorelacionamentorelacionamento

linearlinearlinearlinear entre as duas variáveis é possível

determinar a intensidade deste

relacionamento. O coeficiente que mede

este relacionamento é denominado de

Coeficiente de Correlação (linear).

Page 13: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

13

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Quando se está trabalhando com

amostras o coeficiente de correlação é

indicado pela letra “rrrr” e é uma

estimativa do coeficiente de correlação

populacional que é representado por

“ρρρρ” (rho).

Page 14: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

14

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Page 15: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

15

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Para determinar o coeficiente de

correlação (grau de relacionamento

linear entre duas variáveis) vamos

determinar inicialmente a variação

conjunta entre elas, isto é, a

covariância.

Page 16: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

16

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

A covariância entre duas

variáveis X e Y, é representada

por “Cov(XCov(XCov(XCov(X;;;; Y)Y)Y)Y)” e calculada por:

1n

)YY)(XX()Y,X(Cov ii

∑ −−=

Page 17: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

17

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Mas

∑ −=

=+∑ −−=

=∑+∑ ∑−∑−=

=∑+∑ ∑−∑−=

=+∑ −−=

=∑ −−

YXnYX

YXnYXnYXnYX

YXXYYXYX

YXYXYXYX

]YXYXYXYX[

)YY)(XX(

ii

ii

iiii

iiii

iiii

ii

Page 18: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

18

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Então:

1n

YXnYX

1n

)YY)(XX()Y,X(Cov

ii

ii

∑ −=

=−

∑ −−=

Page 19: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

19

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

A covariância poderia ser utilizada

para medir o graugraugraugrau e o sinalsinalsinalsinal do

relacionamento entre as duas variáveis,

mas ela é difícil de interpretar por variar

de -∞ a +∞. Assim vamos utilizar o

coeficientecoeficientecoeficientecoeficiente dededede correlaçãocorrelaçãocorrelaçãocorrelação linearlinearlinearlinear dededede

PearsonPearsonPearsonPearson.

Page 20: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

20

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

O coeficiente de correlação

linear (de Pearson) é definido por:

SS YX

)Y,X(Cov r =

Page 21: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

21

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Onde:

1n

YnY S

1n

XnX S

1n

YXnYX )Y,X(Cov

22i

Y

22i

X

ii

∑ −=

∑ −=

∑ −=

Page 22: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

22

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Esta expressão não é muito

prática para calcular manualmente o

coeficiente de correlação. Pode-se obter

uma expressão mais conveniente para

o cálculo manual e o cálculo de outras

medidas necessárias mais tarde.

Page 23: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

23

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Tem-se:

( )( )∑ −∑ −

∑ −=

=

∑ −

∑ −

∑ −

=

==

YnYXnX

YXnYX

1nYnY

1n

XnX

1n

YXnYX

SS

)Y,X(Cov r

22i

22i

ii

22i

22i

ii

YX

Page 24: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

24

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Fazendo:

S.S

S r :seTem

YnYS

XnXS

YXnYXS

YYXX

XY

22iYY

22iXX

iiXY

=−

∑ −=

∑ −=

∑ −=FFFFaaaazzzzeeeennnnddddoooo

Page 25: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

25

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

A vantagem do coeficiente de

correlação (de Pearson) é ser

adimensional e variar de – 1 a + 1,

que o torna de fácil interpretação.

Page 26: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

26

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Assim se r = -1, temos uma

relacionamento linear negativo

perfeito, isto é, os pontos estão todos

alinhados e quando X aumenta Y

decresce e vice-versa.

Page 27: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

27

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

0

10

20

30

40

50

10 15 20 25 30

1r −=

Page 28: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

28

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Se r = +1, temos uma

relacionamento linear positivo

perfeito, isto é, os pontos estão todos

alinhados e quando X aumenta Y

também aumenta.

Page 29: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

29

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

0

10

20

30

40

50

10 15 20 25 30

1r +=

Page 30: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

30

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Assim se r = 0, temos uma

ausência de relacionamento linear,

isto é, os pontos não mostram

“alinhamento”.

Page 31: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

31

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

0r =

0

10

20

30

40

50

10 15 20 25 30

Page 32: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

32

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Assim se –1 < r < 0, temos uma

relacionamento linear negativo, isto é,

os pontos estão mais ou menos

alinhados e quando X aumenta Y

decresce e vice-versa.

Page 33: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

33

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

0r1 <<−

0

10

20

30

40

50

10 15 20 25 30

Page 34: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

34

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Assim se 0 < r < 1, temos uma

relacionamento linear positivo, isto é,

os pontos estão mais ou menos

alinhados e quando X aumenta Y

também aumenta.

Page 35: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

35

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

0

10

20

30

40

50

10 15 20 25 30

1r0 <<

Page 36: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

36

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Uma correlação amostral não

significa necessariamente uma correlação

populacional e vice-versa. É necessário

testar o coeficiente de correlação para

verificar se a correlação amostral é

também populacional.

Page 37: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

37

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Observada uma amostra de seis

pares, pode-se perceber que a correlação é

quase um, isto é, rrrr ≅≅≅≅ 1111. No entanto,

observe o que ocorre quando mais pontos

são acrescentados, isto é, quando se

observa a população!

Page 38: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

38

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

0

10

20

30

40

50

10 15 20 25 30

r r r r ≅≅≅≅ 1111

ρ ρ ρ ρ ≅≅≅≅ 0000

Page 39: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

39

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Page 40: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

40

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Determinar o “grau de

relacionamento linear” entre as

variáveis X = temperatura de

operação do processo versus Y =

rendimento do produto, conforme

tabela.

Page 41: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

41

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

X Y XY X Y100 45 4500 10000 2025110 51 5610 12100 2601120 54 6480 14400 2916130 61 7930 16900 3721140 66 9240 19600 4356150 70 10500 22500 4900160 74 11840 25600 5476170 78 13260 28900 6084180 85 15300 32400 7225190 89 16910 36100 7921

1450145014501450 673673673673 101570101570101570101570 218500218500218500218500 47225472254722547225

Page 42: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

42

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Vamos calcular “r”

utilizando a expressão em

destaque vista anteriormente,

isto é, através das quantidades,

SxY, SXX e SYY.

Page 43: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

43

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Tem-se:

47225Y 218500X

101570 XY 67,3Y 145X

673 Y 1450X 10n

22 =∑=∑

∑ ===

∑ =∑ ==

Então:

3985

3,67.145.10101570

YXnYXS iiXY

=

=−=

=∑ −=

Page 44: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

44

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

8250

145.10218500

XnXS

2

22iXX

=

=−=

=∑ −=

10,1932

3,67.1047225

YnYS

2

22iYY

=

=−=

=∑ −=

Page 45: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

45

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

9981,0

10,1932.8250

3985

S.S

S r

YYXX

XY

=

==

==

Page 46: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

46

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Apesar de “rrrr” ser um

valor adimensional, ele não é

uma taxataxataxataxa. Assim o resultado

não deve ser expresso em

percentagem.

Page 47: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

47

Prof. Lorí Viali, Dr.Prof. Lorí Viali, Dr.Prof. Lorí Viali, Dr.Prof. Lorí Viali, [email protected]@[email protected]@mat.ufrgs.br

http://www.mat.ufrgs.br/~viali/http://www.mat.ufrgs.br/~viali/http://www.mat.ufrgs.br/~viali/http://www.mat.ufrgs.br/~viali/

Page 48: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

48

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Em muitas situações duas ou mais

variáveis estão relacionadas e surge

então a necessidade de determinar a

natureza deste relacionamento.

Page 49: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

49

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

A análise de regressão é uma

técnica estatística para modelar e

investigar o relacionamento entre

duas ou mais variáveis.

Page 50: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

50

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

De fato a regressão pode ser

dividida em dois problemas:

(i)(i)(i)(i) o da especificação e

(ii)(ii)(ii)(ii) o da determinação.

Page 51: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

51

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

O problema da especificação é

descobrir dentre os possíveis modelos

(linear, quadrático, exponencial, etc.)

qual o mais adequado.

Page 52: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

52

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

O problema da determinação é

uma vez definido o modelo (linear,

quadrático, exponencial, etc.) estimar

os parâmetros da equação.

Page 53: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

53

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Normalmente é suposto que exista

uma variável Y (dependente ou

resposta), que está relacionada a “k”

variáveis (independentes ou

regressoras) Xi (i = 1, 2, ..., k).

Page 54: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

54

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

A variável resposta YYYY é aleatória,

enquanto que as variáveis regressoras

Xi são normalmente controladascontroladascontroladascontroladas. O

relacionamento entre elas é

caracterizado por uma equação

denominada de “equaçãoequaçãoequaçãoequação dededede regressãoregressãoregressãoregressão”

Page 55: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

55

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Quando existir apenas uma

variável regressora (X) tem-se a

regressãoregressãoregressãoregressão simplessimplessimplessimples, se Y depender de

duas ou mais variáveis regressoras,

então tem-se a “regressãoregressãoregressãoregressão múltiplamúltiplamúltiplamúltipla”.

Page 56: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

56

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Vamos supor que a regressão é do

tipo simplessimplessimplessimples e que o o modelo seja

linearlinearlinearlinear, isto é, vamos supor que a

equação de regressão seja do tipo:

Y = α + βX + U

Page 57: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

57

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

x 1 x 2 x nx

y

Y = α + βX + U;

Page 58: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

58

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

O termo “U” é o termo erro, isto é,

“U” representa outras influências

sobre a variável Y, além da exercida

pela variável “X”. A variação residual

(termo U) é suposto de média zero e

desvio constante e igual a σ.

Page 59: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

59

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Ou ainda pode-se admitir que

o modelo fornece o valor médio

de Y, para um dado “x”, isto é,

E(Y/x) = α + βX

Page 60: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

60

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Y = α + βX + U;

E(Y/x) = α + βX, isto é, E(U) = 0

V(Y/x) = σ2;

Cov(Ui, Uj) = 0, para i ≠ j;

A variável X permanece fixa em observaçõessucessivas e os erros U são normalmentedistribuídos.

Page 61: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

61

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

O modelo suposto E(Y/x)E(Y/x)E(Y/x)E(Y/x) ==== αααα ++++ ββββXXXX

é populacional.

Vamos supor que se tenha n pares de

observações, digamos: (x(x(x(x1111,,,, yyyy1111),),),), (x(x(x(x2222,,,, yyyy2222),),),), ............,,,,

(x(x(x(xnnnn,,,, yyyynnnn)))) e que através deles queremos

estimar o modelo acima.

Page 62: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

62

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

A reta estimada será representada

por:EbXaY ou bXaY ++=+=

Onde “aaaa” é um estimador de α e

“bbbb” é um estimador de β, sendo um

estimador de E(Y/x).Y

Page 63: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

63

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Existem diversos métodos para a

determinação da reta desejada. Um deles,

denominado de MMQMMQMMQMMQ (MMMMétodos dos

MMMMínimos QQQQuadrados), consiste em

minimizar a “somasomasomasoma dosdosdosdos quadradosquadradosquadradosquadrados dasdasdasdas

distânciasdistânciasdistânciasdistâncias dadadada retaretaretareta aosaosaosaos pontos”pontos”pontos”pontos”.

Page 64: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

64

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Tem-se:

Yi = a + bxi + Ei,

Então:

Ei = Yi - (a + bxi)

Page 65: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

65

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Deve-se minimizar:

∑ −−=

=∑ −=∑=φ

=

==

n

1iii

2

n

1iii

2n

1i

2i

)XbaY(

)YY(E

Page 66: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

66

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

EXbaY iii ++=

Eiy i

y i

x i

Page 67: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

67

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Derivando parcialmente tem-se:

)XbaY(x2b

)XbaY(2a

iin

1ii

n

1iii

−−∑−=∂

φ∂

∑ −−−=∂

φ∂

=

=

Page 68: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

68

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Igualando as derivadasparciais a zero vem:

0)XbaY(x

0)XbaY(

iin

1ii

n

1iii

=−−∑

=∑ −−

=

=

Page 69: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

69

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Isolando as incógnitas, tem-se:

∑+∑=∑

∑+=∑

XbXnYX

XbnaY

2iii i

ii

Page 70: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

70

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Resolvendo para “a” e “b”, segue:

XbYa

S

S

XnX

YXnyXb

XX

XY22

i

ii

−=

=∑ −

∑ −=

Page 71: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

71

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Fazendo:

∑ −=

∑ −=

∑ −=

YnYS

XnXS

YXnYXS

22iYY

22iXX

iiXY

Lembrando que:

Page 72: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

72

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Page 73: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

73

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Um engenheiro químico está

investigando o efeito da temperaturatemperaturatemperaturatemperatura

dededede operaçãooperaçãooperaçãooperação dodododo processoprocessoprocessoprocesso no

rendimentorendimentorendimentorendimento dodododo produtoprodutoprodutoproduto. O estudo

resultou nos dados da tabela, ao lado.

Determinar a linha de regressão.

Page 74: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

74

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Temperatura, C0 (X) Rendimento (Y)100 45110 51120 54130 61140 66150 70160 74170 78180 85190 89

Page 75: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

75

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Da mesma forma que para

calcular o coeficiente de correlação é

necessário a construção de três novas

colunas. Uma para X2, uma para Y2 e

outra para XY.

Page 76: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

76

X Y XY X Y100 45 4500 10000 2025110 51 5610 12100 2601120 54 6480 14400 2916130 61 7930 16900 3721140 66 9240 19600 4356150 70 10500 22500 4900160 74 11840 25600 5476170 78 13260 28900 6084180 85 15300 32400 7225190 89 16910 36100 7921

1450145014501450 673673673673 101570101570101570101570 218500218500218500218500 47225472254722547225

Page 77: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

77

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Tem-se:

47225Y 218500X

101570 XY 67,3Y 145X

673 Y 1450X 10n

22 =∑=∑

∑ ===

∑ =∑ ==

Então:

3985

3,67.145.10101570

YXnYXS iiXY

=

=−=

=∑ −=

Page 78: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

78

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

8250

145.10218500

XnXS

2

22iXX

=

=−=

=∑ −=

10,1932

3,67.1047225

YnYS

2

22iYY

=

=−=

=∑ −=

Page 79: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

79

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

A equação de regressão, será, então:

74,27394,2

145.4830,030,67XbYa

48,04830,08250

3985

S

Sb

XX

XY

−≅−=

=−=−=

≅===

x48,074,2Y +−=

Page 80: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

80

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

A pergunta que cabe agora é:

este modelo representa bem os pontos

dados? A resposta é dada através do

erro padrão da regressão.

Page 81: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

81

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Page 82: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

82

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

O objetivo do MMQ é minimizara variação residual em torno da reta

de regressão. Uma avaliação destavariação é dada por:

2n

)bXaY(

2n

ES

222

∑ −−=

∑=

Page 83: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

83

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

O cálculo da variância residual,

por esta expressão, é muito trabalhoso,

pois é necessário primeiro determinar

os valores previstos. Entretanto é

possível obter uma expressão que não

requeira o cálculo dos valores

previstos, isto é, de bXaY +=

Page 84: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

84

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

SbSb2S

)XX(b)YY)(XX(b2)YY(

)]XX(bYY[]bXXbYY[

]bX)XbY(Y[)bXaY(

XX2

XYYY

222

22

22

+−=

=∑ −+−∑ −∑ −−=

=∑ −−−=∑ −+−=

=∑ −−−=∑ −−

Desenvolvendo o numerador da

expressão, vem:

Page 85: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

85

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

SYnY)YY(

SXnX)XX(

SYXnYX

)YY)(XX(

YY22

i2

XX22

i2

XYii

=∑ −=∑ −

=∑ −=∑ −

=∑ −=

=∑ −−

Uma vez que:

Page 86: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

86

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Deste modo, tem-se:

Mas:

SbSb2S)bXaY( XX2

XYYY2 +−=∑ −−

SbSS

Sb XXXY

XX

XY =⇒=

Então:

SbSSbSb2S

SbSb2S)bXaY(

XX2

YYXX2

XX2

YY

XX2

XYYY2

−=+−=

=+−=∑ −−

Page 87: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

87

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Finalmente:

2n

SbS

2n

SbS

2n

)bXaY(

2n

Es

XYYYXX2

YY

22

−=

−=

=−

∑ −−=

∑=

Page 88: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

88

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Page 89: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

89

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Considerando os valores do

exemplo anterior, determinar o erro

padrão da regressão.

10,1932SYY =

4830,08250

3985

S

Sb

XX

XY ===

8250S XX =TemTemTemTem----sesesese::::

Page 90: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

90

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

EntãoEntãoEntãoEntão::::

95,09503,0

210

3985.8250

398510,1932

2n

SbSs XYYY

≅=

=−

−=

=−

−=

Page 91: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

91

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Page 92: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

92

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

x i

Y

Y

Y

YY −YY −

YY −

YYYYYY −+−=−

∑ −+∑ −=∑ − )YY()YY()YY(222

VEVRVT +=

Page 93: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

93

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

(aaaa) Variação Total: VT

(bbbb) Variação Residual: VR

( ) SYYVT YY2 =∑ −=

( ) VEVTSbSYYVR XX2

YY2

−=−=∑ −=

(cccc) Variação Explicada: VE

( ) SbYYVE XX22

=∑ −=

Page 94: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

94

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Uma maneira de medir o

grau de aderência (adequação) de

um modelo é verificar o quanto

da variação total de Y é

explicada pela reta de regressão.

Page 95: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

95

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

R2 = VE / VT

Para isto, toma-se o quociente

entre a variação explicada, VE, pela

variação total ,VT:

Este resultado é denominado de

“CoeficienteCoeficienteCoeficienteCoeficiente dededede DeterminaçãoDeterminaçãoDeterminaçãoDeterminação”.

Page 96: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

96

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Este resultado mede o quanto as

variações de uma das variáveis são

explicadas pelas variações da outra

variável.

SS

S

S

Sb

S

Sb

VT

VER

XX YY

2XY

YY

XY

YY

XX2

2 ====

Page 97: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

97

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Ou ainda, ele mede a parcela davariação total que é explicada pela reta de

regressão, isto é:

SR Sb VE YYXX2 2

==A variação residual corresponde a:

S)R 1( VR YY2−=

Assim 1 – R2 é o Coeficiente deIndeterminação.

Page 98: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

98

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Page 99: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

99

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

O % de impurezas no gás oxigênio

produzido por um processo de

destilação supõem-se que esteja

relacionado com o % de hidrocarbono

no condensador principal do

processador. Os dados de um mês de

operação produziram a seguinte tabela

Page 100: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

100

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

X Y X Y1,02 86,91 1,46 96,731,11 89,85 1,55 99,421,43 90,28 1,55 98,661,11 86,34 1,55 96,071,01 92,58 1,40 93,650,95 87,33 1,15 87,311,11 86,29 1,01 95,000,87 91,86 0,99 96,851,43 95,61 0,95 85,201,02 89,86 0,98 90,56

Page 101: Prof. Lorí Viali, Dr. viali@mat.ufrgs.br ...viali/estatistica/mat2246/material/laminas/Cor... · Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

101

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

(a)(a)(a)(a) Ajuste um modelo linear aos dados;

(b)(b)(b)(b) Teste a existência da regressão;

(c)(c)(c)(c) Determine o valor de R2 para estemodelo;

(d)(d)(d)(d) Determine um IC, de 95%, para o valorda pureza, na hipótese do % de

hidrocarbono ser 1,20% .