aula 11. regressão linear múltipla. - homepage | ime-uspyambar/mae0229/aula 4 regressao... ·...

Aula 11. Regressão Linear Múltipla.

1. C.Dougherty “Introduction to Econometrics” 2. Capítulo 16. Bussab&Morettin “Estatística Básica” 7ª Edição

Regressão linear simples - Resumo

),0( 2

Modelo

ii xyE ][ ]|[ ii xyE

1. Saber como obter fórmulas para coeficientes de regressão pelo método de

mínimos quadrados. Lembrar fórmulas

xbyaxVarxyCovb )(/),(

2. Interpretação de coeficientes: sempre para b (“x aumenta em 1 – y aumenta

(diminue) em b”)

3. T-teste para coeficientes, intervalo de confiança.

).(.)(2;

1 bestbICn

4. F-teste para regressão: saber definição de R2 e realizar teste

)2/()1(

5. Transformação de variáveis, logaritmica, interpretação de coeficientes

(tendência exponencial, elasticidade)

população

MODELO

2211 xxy

MODELO

),0( 2

kk xxy 11

Modelo com k explicativas

Regressão bi-dimensional

y (food)

x (salario)

p (preço)

MODELO

efeito puro de salario x1

efeito puro de preço p2

efeito conjunto de preço e salario px 21

y = 116.7 + 0.112 x – 0.739 p R2=0.99

(s.e.) (9.6) (0.003) (0.114)

Consideramos o seguinte exemplo: para os anos 1959-1983 o gasto total em alimentos

(y) em E.U. com salario liquido (x) e preços (p) deu a seguinte regressão.

y e x são medidas em $ bilhões no nível de preços em 1972, e p é índice relativo de

preços calculado dividindo deflator implícito de preços em alimentos pelo deflator

implícito para gasto total, com base de calculo 1972 = 100, e multiplicando por 100.

A equação tem que ser interpretada em seguinte maneira. Para cada incremento em $

bilhão em renda, deixando preços em nível constante, gastos em alimentos aumentam

em $ 112 milhões. Em cada incremento em um ponto de índice p, mantendo o salario

constante, os gastos diminuem em $ 739 milhões

min),,())(()ˆ( 21

bbaSSxbxbayyyen

Regressão bi-dimensional Método mínimos quadrados

bbaSSa

xbxbayx

xbxbay

211122

212211

)],([)()(

),(),()(),(

)],([)()(

),(),()(),(

xxCovxVarxVar

xxCovyxCovxVaryxCovb

xxCovxVarxVar

xxCovyxCovxVaryxCovb

xbxbya

A regressão múltipla pode discriminar os efeitos de variáveis explicativas, tomando em

consideração fato que variáveis explicativas podem ser correlacionadas. Coeficiente de

cada variável x estima a influência dessa variável em variável dependente y,

controlando os efeitos de outras variáveis.

Isso pode ser mostrado do jeito seguinte: estimamos coeficiente em regressão

y conta x1, mas o x1 tem que ser “limpo” da parte da variável x2

2211 xxy

MODELO

supomos que coeficientes 𝛽1 e 𝛽2 são

positivos e correlação entre x1 e x2

é positivo

o que acontece se a gente faça a

regressão entre y e x1, esquecendo

a variável x2, supondo que o modelo

real é bidimencional?

efeito direto

de x1 mantendo

x2 constante

efeito direto

de x2 mantendo

x1 constante

efeito aparente

de x1 que atua

como imitador

para x2

separamos x1 em duas partes 111 x̂xx

1x̂ atua como imitador de x2

atua “independente” de x2

1x̂1x

)ˆ( 111 xxx

)ˆ( 21 dxcx

2211 xbxbay

11xbay

colocando 𝑑 =𝐶𝑜𝑣(𝑥1,𝑥2)

𝑉𝑎𝑟(𝑥2) obtemos

𝑏1 =𝐶𝑜𝑣(𝑥1, 𝑦)

𝑉𝑎𝑟(𝑥1)=

𝐶𝑜𝑣 𝑥1, 𝑦 − 𝐶𝑜𝑣 𝑥 1, 𝑦

𝑉𝑎𝑟 𝑥1 + 𝑉𝑎𝑟 𝑥 1 − 2𝐶𝑜𝑣(𝑥1, 𝑥 1)

=𝐶𝑜𝑣 𝑥1, 𝑦 − 𝐶𝑜𝑣 𝑐 + 𝑑𝑥2, 𝑦

𝑉𝑎𝑟 𝑥1 + 𝑉𝑎𝑟 𝑥 1 − 2𝐶𝑜𝑣(𝑥1, 𝑐 + 𝑑𝑥2)

=𝐶𝑜𝑣 𝑥1, 𝑦 − 𝑑𝐶𝑜𝑣 𝑑𝑥2, 𝑦

𝑉𝑎𝑟 𝑥1 + 𝑉𝑎𝑟 𝑥 1 − 2𝑑𝐶𝑜𝑣(𝑥1, 𝑥2)

Modelos não lineares que podem ser estimados atraves de regressão linear

Transformação básica:

)()( 2111 xgxfy 2211 zzy

Se o erro 𝜀 satisfaz as condições de Gauss-Markov de modelo, então

depois de transformação ele vai continuar satisfazendo as condições

2211 )(xxy

Modelos não lineares que podem ser estimados atraves de regressão linear

Transformação logaritmica. Não linearidade pelos parâmetros é o problema serie.

Mas caso lado direto de modelo consiste de produto de membros de tipo 𝑥𝛽 ou 𝑒𝛽𝑥,

então o modelo pode ser linearizado usando logaritmo de duas partes. Por exemplo

a função de demanda 𝑦 = 𝛼𝑥𝛽𝑝𝛾𝜈

em que 𝑦 é despesas com o produto, 𝑥 é lucro, 𝑝 é preço relativo, e 𝜈 é erro

multiplicativo, essa função de demanda pode ser transformada em função linear

pelos parâmetros:

log 𝑦 = log𝛼 + 𝛽 log 𝑥 + 𝛾 log 𝑝 + log 𝜈

assim se estimar a regressão em variáveis log 𝑦, log 𝑥, e log 𝑝, então coeficiente de

log 𝑥, 𝛽 é a estimativa direta da elasticidade de demanda pelo lucro, o coeficiente de

log 𝑝, 𝛾 é estimativa de elasticidade da demanda pelo preço

Modelos não lineares que podem ser estimados através de regressão linear

Exemplo: função de demanda

Regressão logarítmica entre despesas com alimentos e salario liquido foi

construída em base de dados agregados dos EU em período 1959-1983

(em parêntesis erro padrão)

log 𝑦 = 2.82 + 0.64 log 𝑥 − 0.48 log 𝑝; 𝑅2 = 0.99 (0.42) (0.03) (0.12) 𝐹 = 820.1

a regressão mostra, que a elasticidade da demanda em relação ao salario

liquido é de 0.64, e a elasticidade da demanda em relação ao preço – 0.48

os dois coeficientes são significantes com nível de significância de 1%

Modelos não lineares que podem ser estimados através de regressão linear

Exemplo: função de produção de Cobb-Douglas

C.Cobb e P.Douglas em 1927 sugeriram usar a função

𝑌 = 𝐴𝐾𝛼𝐿1−𝛼

para descrever a dependência de volume de produção (𝑌) em relação ao gastos

em capital (𝐾) e gastos em mão de obra (𝐿). Usando diretamente a função log não

podemos estimar o coeficiente 𝛼, pois obtemos dois diferentes estimadores para 𝛼.

Em vez disso primeiramente faremos seguinte transformação de variáveis

𝐿= 𝐴

∙ 𝜈

incluímos o erro 𝜈 multiplicativo. Depois disso usaremos a linearização

log𝑌

𝐿= log𝐴 + 𝛼 log

𝐿+ log 𝜈

usando os dados

log𝑌

𝐿= −0.02 + 0.25 log

𝐿 ; 𝑅2 = 0.63;

(0.02) (0.04) 𝐹 = 38.0

compare

log 𝑌 = −0.18 + 0.23 log𝐾 + 0.81 log 𝐿 ; 𝑅2 = 0.96; (0.43) (0.06) (0.15) 𝐹 = 236.1

Modelo estatístico

parte aleatória do modelo

Gauss-Markov conditions

1. 𝐸[𝜀𝑖] = 0 para todos os 𝑖 = 1,… , 𝑛

2. 𝐷[𝜀𝑖 ] = 𝜎2 para todos os 𝑖 = 1,… , 𝑛 (homoscedasticidade)

𝑐𝑜𝑣(𝜀𝑖, 𝜀𝑗) = 0 para todos os 𝑖 ≠ 𝑗 3. 𝜀𝑖 são independentes

4. 𝜀𝑖 não depende do 𝑥𝑖 são independentes – termo de perturbação não depende

de variáveis explicativas

5. 𝜀𝑖 tem distribuição normal

1. 𝜀𝑖 são i.i.d. 𝜀𝑖 ≈ 𝑁(0, 𝜎2) 2. 𝜀 e 𝑥𝑖 são independentes

OBS: em curso vamos considerar 𝑥𝑖 como constante

𝑦 = 𝛼 + 𝛽1𝑥1 + ⋯+ 𝛽𝑘𝑥𝑘 + 𝜀

Precisão de coeficientes em regressão múltipla

Teorema Gauss-Markov para a regressão múltipla estabelece que o método de

mínimos quadrados como em caso unidimensional oferece melhores estimados

dentro de classe de estimadores lineares, no sentido que dentro da mesma

informação que contem em amostra não existe outros estimadores não viesados

com menor variância. Não vamos provar o teorema, mas resumimos os fatores

que influenciam em precisão de coeficientes. Em geral os coeficientes de regressão

são mais precisos quando:

1. maior número de observações em amostra;

2. quando maior a dispersão de variáveis explicativas;

3. menor a variância populacional de erro 𝜀;

4. menor a ligação entre variáveis explicativas.

Os três primeiros conhecemos em regressão simples, o ultimo vale somente para

a regressão múltipla.

Precisão de coeficientes em regressão múltipla

1. maior número de observações em amostra;

2. quando maior a dispersão de variáveis explicativas;

3. menor a variância populacional de erro 𝜀;

4. menor a ligação entre variáveis explicativas.

Consideramos caso bidimensional quando temos duas variáveis explicativas.

𝑦 = 𝛼 + 𝛽1𝑥1 + 𝛽2𝑥2 + 𝜀

Obtemos a regressão 𝑦 = 𝑎 + 𝑏1𝑥1 + 𝑏2𝑥2

A variância populacional de estimador 𝑏1:

𝑉𝑎𝑟 𝑏1 =𝜎2

𝑛𝑉𝑎𝑟(𝑥1)∙

1 − 𝑟𝑥1𝑥22

Regressão multi-dimensional

t-teste

kxxxy ,,, 21

F-teste

)1/()1(

Testa hipótese

0: 210 kH

0:0 iH

aula 11. regressão linear múltipla. - homepage | ime-uspyambar/mae0229/aula 4 regressao... ·...

Documents

correlação e regressão - ime-uspyambar/mae0219/aula 3...

análise da regressão múltipla: inferência revisão aula...

utilizaÇÃo da regressÃo linear mÚltipla para...

regressão linear múltipla - pucrs.br · da mesma forma...

ii.2. regressão linear múltipla -...

modelos de regressÃo linear mÚltipla para … ·...

ii.2. regressão linear múltipla · ii.2. regressão...

1 análise de regressão múltipla: mínimos quadrados...

análise de regressão múltipla · introduÇÃo À...

regressão linear - introdução · regressão linear -...

regressão linear múltipla arquivo: seleção2_tarefa.sav

mestrado profissional em administração de regressão...

regressão linear múltipla - ulisboa · regressão linear...

modelos de regressão linear múltipla

o uso da regressão logística múltipla no mapeamento de

1 capítulo 14. regressão linear múltipla 14.1...

anÁlise de regressÃo linear mÚltipla - instituto de...

unidade 4. regressão linear múltipla (duas variáveis) ·...

análise da regressão múltipla: inferência revisão da...

modelo de regressão múltipla -...