tópico 4 regressão linear simples 02
TRANSCRIPT
Estatística II
Ricardo Bruno N. dos SantosProfessor Adjunto da Faculdade de Economia
e do PPGE (Economia) UFPA
UNIVERSIDADE FEDERAL DO PARÁINSTITUTO DE CIÊNCIAS SOCIAIS APLICADAS
FACULDADE DE ECONOMIA
O Modelo Clássico de Regressão
Linear Normal (MCRLN)Até o momento foi verificado como estimar os valores
dos 𝛽′𝑠 e para o MRLS. Porém existe uma etapa muitoimportante, que são os testes de hipóteses. São tais testesque tornam possível a inferência estatística, ou seja, nos dãoum grau de “tranquilidade” para afirmar se nossasestimativas da FRA são realmente próximas a FRP.
Para que tal aspecto seja válido, devemos consideraruma pressuposição fundamental sobre os resíduos, devemosconsiderar e provar que os mesmos são normais.
A hipótese de normalidade de 𝒖𝒊
Foi verificado que:
Média: 𝐸 𝑢𝑖 = 0
Variância: 𝐸 𝑢𝑖 − 𝐸 𝑢𝑖2 = 𝐸 𝑢𝑖
2 = 𝜎2
Covariância: 𝐸 𝑢𝑖 − 𝐸 𝑢𝑖 𝑢𝑗 − 𝐸 𝑢𝑗
= 𝐸 𝑢𝑖𝑢𝑗 = 0
Todas as hipóteses acima podem ser representadas deforma compacta, pelo indicativo que os resíduos possuemuma distribuição normal com média 0 e variância constante:
𝒖𝒊~𝑵 𝟎, 𝝈𝟐
A hipótese de normalidade de 𝒖𝒊
Por que usar a normalidade:
1) Pelo fato dos resíduos 𝑢𝑖 serem uma influênciacombinada (sobre a variável independente) de um conjuntode variáveis independentes não incluídas no modelo, porémcom pouca influência sobre a variável dependente. A maiorparte das distribuições quando apresentam crescimento noseu número de observações tornam-se normais, e como oresíduo representa variáveis não incluídas no modelo,imagina-se que, segundo o TEOREMA DO LIMITE CENTRAL(TLC), a soma de tais variáveis levem a uma distribuiçãonormal.
A hipótese de normalidade de 𝒖𝒊
2) Mesmo não sendo grande o número de variáveis e que asmesmas não sejam independentes, a sua soma pode ainda sernormal.
3) Como os 𝛽′𝑠 são funções lineares de 𝑢𝑖, então podemosconcluir que os estimadores tendem a uma normal.
4) A facilidade do uso da distribuição normal, por conterapenas dois parâmetros (média e variância), tornou seu uso muitofrequente, bem como o direcionamento para vários estudos eresultados baseados nessas pressuposições.
5) Mesmo com uma amostra inferior a 100 observaçõesainda podemos relaxar a hipótese de normalidade, para tanto,usa-se outras distribuições como a t, F e 2 (qui-quadrado), quepossuem o comportamento de uma normal, quando aplicado oTLC.
Propriedade dos estimadores de MQO
sobre a hipótese de normalidadeConsiderando que os resíduos possuem uma
distribuição normal, então podemos afirmar sobre osestimadores que:
1) São não viesados
2) Tem variância mínima.
COMBINANDO 1 COM 2 TEREMOS ESTIMADORES EFICIENTES
3) São Consistentes; à medida que o tamanho da amostraaumenta indefinidamente, os estimadores convergem para osverdadeiros valores da população. (Ou seja FRA≈FRP).
Propriedade dos estimadores de MQO
sobre a hipótese de normalidade4) 𝛽1 ( que é uma função linear de 𝑢_𝑖 ) apresenta
distribuição normal com
Média: E 𝛽1 = 𝛽1
Variância: 𝑣𝑎𝑟 𝛽1 : 𝜎 𝛽1
2 = 𝑋𝑖
2
𝑛 𝑥𝑖2 𝜎2
Ou seja 𝛽1~𝑁 𝛽1, 𝜎 𝛽1
2
Pelas propriedades da distribuição normal, a variável Z, queé definida como:
𝑍 = 𝛽1 − 𝛽1
𝜎 𝛽1
Que por sua vez segue uma distribuição normal padrão,com média zero e variância =1.
𝑍~𝑁(0,1)
Propriedade dos estimadores de MQO
sobre a hipótese de normalidade5) Como 𝛽2 (sendo uma função linear de 𝑢𝑖 ) tem
distribuição normal com
Média: E 𝛽2 = 𝛽2
Variância: 𝑣𝑎𝑟 𝛽2 : 𝜎 𝛽2
2 =𝜎2
𝑥𝑖2
Ou seja 𝛽2~𝑁 𝛽2, 𝜎 𝛽2
2
Pelas propriedades da distribuição normal, a variável Z,que é definida como:
𝑍 = 𝛽2 − 𝛽2
𝜎 𝛽2
Propriedade dos estimadores de MQO
sobre a hipótese de normalidadeGeometricamente podemos representar as
distribuições dos estimadores a partir dos seguintes gráficos:
Propriedade dos estimadores de MQO
sobre a hipótese de normalidade6) (n-2)( 𝜎2/𝜎2 ) segue a distribuição de 2 (qui-
quadrado) com (n-2) graus de liberdade. Essa informação nosajuda a fazer inferência sobre o verdadeira 𝜎2 com base noseu valor estimado.
7) A distribuição dos ’s são independentes de 𝜎2.
8) 𝛽1 e 𝛽2 possuem a variância mínima dentro dasclasses dos estimadores não viesados, sejam lineares ou não.
MRLS: Estimação de intervalo e testes de
hipóteses
A principal ideia da estimação de intervalos lembremosdo resultado da Propensão Marginal a Consumir encontrada apartir dos dados da Tabela 3.2. O valor de 𝛽2 = 0,51, querepresenta uma única estimativa (pontual) do valordesconhecido da população 𝛽2. A pergunta é: Até que pontoessa estimativa é CONFIÁVEL? Em Estatística, a confiabilidadede um estimador pontual é medida por seu ERRO PADRÃO.
Em vez de considerar apenas a estimativa pontual,podemos construir um intervalo em torno de um estimadorpontual, de dois ou três erros padrão de cada lado doestimador pontual, de modo que este intervalo tenha, porexemplo, 95% DE PROBABILIDADE DE INCLUIR O VERDADEIROVALOR DO PARÂMETRO. Essa é a ideia que está por trás daestimação de intervalo.
MRLS: Estimação de intervalo e testes de
hipóteses
Um exemplo disso seria supormos que temos doisnúmeros positivos e , sendo situado entre 0 e 1, oelemento a ser encontrado é de que a probabilidade de que o
intervalo aleatório ( 𝛽2 − 𝛿, 𝛽2 + 𝛿) contenha o verdadeirovalor de 𝛽2 seja de 1 − 𝛼. Assim:
Pr 𝛽2 − 𝛿 ≤ 𝛽2 ≤ 𝛽2 + 𝛿 = 1 − 𝛼, onde:
1 − 𝛼: Coeficiente de confiança; (se =5%, teremos95% de confiança de estar corretos).
: Nível de significância.
𝛽2 − 𝛿: Limite inferior de confiança
𝛽2 + 𝛿: Limite superior de confiança.
MRLS: Estimação de intervalo e testes de
hipóteses
Intervalos de confiança para 𝜷𝟏 e 𝜷𝟐Verificamos que, dada a hipótese de normalidade dos
resíduos, teríamos:
𝑍 = 𝛽2 − 𝛽2
𝑒𝑝 𝛽2
=
𝛽2 − 𝛽2 𝑥𝑖2
𝜎Assim poderíamos afirmar que:
𝑡 = 𝛽2 − 𝛽2
𝑒𝑝 𝛽2
=𝐸𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 − 𝑃𝑎𝑟â𝑚𝑒𝑡𝑟𝑜
𝑒𝑟𝑟𝑜 𝑝𝑎𝑑𝑟ã𝑜 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜 𝑑𝑜 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟
MRLS: Estimação de intervalo e testes de
hipóteses
Intervalos de confiança para 𝜷𝟏 e 𝜷𝟐Nesse caso, em vez de usar uma distribuição normal,
podemos utilizar a distribuição t para estabelecer umintervalo de confiança para 𝛽2 como abaixo:
Pr(−𝑡𝛼/2 ≤ 𝑡 ≤ 𝑡𝛼/2)= 1 − 𝛼
Assim teríamos:
Pr(−𝑡𝛼/2 ≤ 𝛽2−𝛽2
𝑒𝑝 𝛽2≤ 𝑡𝛼/2)= 1 − 𝛼
Que reorganizado nos fornece:
Pr[ 𝛽2 − 𝑡𝛼2𝑒𝑝 𝛽2 ≤ 𝛽2 ≤ 𝛽2 + 𝑡𝛼
2𝑒𝑝 𝛽2 ] = 1 − 𝛼
Assim o intervalo será: 𝛽2 ± 𝑡𝛼
2𝑒𝑝 𝛽2
MRLS: Estimação de intervalo e testes de
hipóteses
Intervalos de confiança para 𝜷𝟏 e 𝜷𝟐A linha de raciocínio anterior também vale para 𝛽1,
logo:
Pr[ 𝛽1 − 𝑡𝛼2𝑒𝑝 𝛽1 ≤ 𝛽1 ≤ 𝛽1 + 𝑡𝛼
2𝑒𝑝 𝛽1 ] = 1 − 𝛼
Assim o intervalo será: 𝛽1 ± 𝑡𝛼
2𝑒𝑝 𝛽1
MRLS: Estimação de intervalo e testes de
hipóteses
Intervalos de confiança para 𝜷𝟏 e 𝜷𝟐Vamos consideras os valores encontrados para a
estimativa da PMC da tabela 3.2. Considere os valores de 𝛽2 = 0,509, como temos 10 observações, então o grau de
liberdade será 8. Supondo que =5%, a tabela t mostra para 8graus de liberdade o valor crítico de 𝑡𝛼/2 = 2,306
Substituindo os valores até então encontrados naequação abaixo teremos:
𝛽2 ± 𝑡𝛼2𝑒𝑝 𝛽2
= 0,509 + 2,306 ∗ 0,0357428 = 0,5914= 0,509 − 2,306 ∗ 0,0357428 = 0,4266
Logo: 0,4266 ≤ 𝛽2 ≤ 0,5914
MRLS: Estimação de intervalo e testes de
hipóteses
Intervalos de confiança para 𝜷𝟏 e 𝜷𝟐Assim, com uma confiança de 95% de estarmos certos,
ou seja, em 95 de 100 casos, os intervalos de 𝛽2 conterão overdadeiro 𝛽2.
Para o 𝛽1 teremos:= 24,45 + 2,306 ∗ 6,41 = 39,23
= 24,45 − 2,306 ∗ 6,41 = 9,67
Logo: 9,67 ≤ 𝛽1 ≤ 39,23
MRLS: Estimação de intervalo e testes de
hipóteses
Intervalos de confiança para 𝝈𝟐.O intervalo de confiança para a variância dos resíduos
estará pautado em um distribuição do tipo qui-quadrado onde:
2 = 𝑛 − 2 𝜎2
𝜎2
Que pode ser utilizada para estabelecer o intervalo deconfiança, onde:
Pr 1−
𝛼2
2 ≤ 2 ≤ 𝛼2
2 = 1 − 𝛼
onde o valor da distribuição 2 no meio dessa dupla desigualdade
é dado pela 1ª Equação acima onde 1−𝛼/22 e 𝛼/2
2 são dois valores
de 2 (os valores críticos de 2) obtidos na tabela de qui-quadradopara n-2 gl, de modo que eles excluem 100(/2)% das áreascaudais da distribuição de qui-quadrado.
MRLS: Estimação de intervalo e testes de
hipóteses
Intervalos de confiança para 𝝈𝟐
Consultado a tabela qui-quadrado para (n-2) graus de
liberdade (8), teremos o seguintes valores:0,0252 = 17,5346
e 0,9752 = 2,1797. Tais valores mostram que a probabilidade
de que um valor 2 superior a 17,5346 e de 2,5% e o de2,1797 é de 97,5%. Portanto, o intervalo entre esses doisvalores é o intervalo de confiança de 95% para 2, como ográfico a seguir, mas antes, verifiquemos como se consulta ovalor na tabela qui-quadrado.
No slide seguinte temos a apresentação do gráfico da2.
MRLS: Estimação de intervalo e testes de
hipóteses
Intervalos de confiança para 𝝈𝟐
MRLS: Estimação de intervalo e testes de
hipóteses
Intervalos de confiança para 𝝈𝟐
Se substituirmos o 2 = 𝑛 − 2 𝜎2
𝜎2 em Pr 1−
𝛼
2
2 ≤
MRLS: Estimação de intervalo e testes de
hipóteses
Intervalos de confiança para 𝝈𝟐
8 ∗42,1591
2,1797= 154,734
8 ∗42,1591
17,5346= 19,2347
Assim teremos: 19,23 ≤ 𝜎2 ≤ 154,73
Ou seja, se estabelecermos limites de confiança de 95%em 𝜎2 e se mantivermos a priori que esses limites incluem overdadeiro 𝜎2, estaremos certos 95% das vezes a longo prazo.
MRLS: Estimação de intervalo e testes de
hipóteses
Os testes de hipótesesA pergunto é: Quais as hipóteses devem ser feitas sobre os
estimadores ’s?
Devemos saber se esses estimadores são ou não diferentesde zero, ou seja, estabelecemos a hipótese nula e alternativareferente a um valor específico dos betas, a referência então serádizer que os betas são não significativos, ou seja, serão zero.
𝐻0: 𝛽 = 0𝐻1: 𝛽 ≠ 0
O 𝛽2 observado é compatível com 𝐻0? Para respondermosa essa pergunta, voltemos ao intervalo (0,4266;0,5914) conterão,com 95% de probabilidade de não cometer o erro tipo I, overdadeiro valor de 𝛽2 . Quando um teste especifica uma diferençaela pode ser para mais ou para menos, o que indica dois pontosdistintos, esse é um tipo de TESTE BICAULDAL ou BILATERAL.
MRLS: Estimação de intervalo e testes de
hipóteses
Os testes de hipótesesConsequentemente, a longo prazo (em repetidas
amostras), esses intervalos proporcionam faixas ou limitesdentro dos quais o verdadeiro 𝛽2 pode situar-se com umcoeficiente de confiança de, por exemplo, 95%. O intervalo deconfiança oferece um conjunto de hipóteses nulas plausíveis.Se 𝛽2 sob 𝐻0 cair no intervalo de confiança de 100(1-)%,NÃO REJEITAREMOS a hipótese nula; se estiver situada foradesse intervalo, poderemos rejeita-la. Podemos ver essa faixano gráfico a seguir.
MRLS: Estimação de intervalo e testes de
hipóteses
Os testes de hipótesesTeste UNILATERAL ou UNICAUDAL: quando se tem
certeza de que o coeficiente terá um determinadocomportamento, por exemplo, sabemos que o coeficiente deinclinação da regressão de demanda do consumidor énegativo, portanto podemos estabelecer uma hipótese sobre𝛽2 onde:
𝐻0: 𝛽2 < 0
Essa é uma forte expectativa teórica (a priori) sobre ocomportamento da demanda do consumidor, que indica queaumentos dos preços provocam queda na quantidadedemandada de um bem.
MRLS: Estimação de intervalo e testes de
hipóteses
Os testes de hipóteses: a significância do testeApesar de válida, a abordagem do intervalo de
confiança é demorada e visualmente complicada de semostrar, uma forma rápida e eficiente de se testar hipótesesestatísticas são pelos testes de significância. O maisconhecido e comum teste é o teste t de student.
Considerando a premissa da normalidade verificou-seque:
𝑡 = 𝛽2 − 𝛽2
𝑒𝑝 𝛽2
MRLS: Estimação de intervalo e testes de
hipóteses
Os testes de hipóteses: a significância do testeO teste é feito se avaliando o valor calculado pela
função anterior comparado com o valor tabelado, se o valorcalculado for maior que o tabelado, teremos a rejeição dahipótese nula H0. Vamos mostrar através de um infográfico ocálculo da estatística t e sua comparação com o valortabelado para o modelo de regressão da propensão marginala consumir:
A hipótese aqui testada é a de que Beta 2 é igual a zero,assim:
𝐻𝑜: 𝛽2 = 0, ou seja, trata-se de uma hipótese bicaudal.
Vejamos o procedimento de rejeição ou não de talhipótese:
MRLS: Estimação de intervalo e testes de
hipóteses
Os testes de hipóteses: a significância do teste
1º Qual a Hipótese?𝐻0: 𝛽2 = 0
O valor do t calculado é:
𝑡𝑐𝑎𝑙𝑐 =0,51
0,0357= 14,29
O 𝑡𝑡𝑎𝑏𝑒𝑙𝑎𝑑𝑜 éPara 10% = 1,86Para 5% = 2,306Para 1%= 3,355
A CONCLUSÃO:Como o valor de t Tabelado é
Maior que o Calculado, rejeitamos a Hipótese nula
𝐻0 de que o 𝛽2 = 0
MRLS: Estimação de intervalo e testes de
hipóteses
Os testes de hipóteses: a significância do testeA hipótese pode ser feita também sobre algum tipo de
restrição, vamos usar um exemplo hipotético, imagine que ocoeficiente 𝛽2 de uma função seja = 2,3; e seu erro padrãoseja de 0,32, assim teríamos
𝑡 =2,3
0,32= 7,19, que é significativa, ou seja, rejeita-se
H0. Agora imagine que exista uma restrição para essa variávelafirmando que na verdade ela é igual a 0,5, assim nossahipótese mudaria para, considere n=13 e =5%:
𝐻0: 𝛽2 = 0,5; originando a seguinte restrição:𝐻0: 𝛽2 − 0,5 = 0
MRLS: Estimação de intervalo e testes de
hipóteses
Os testes de hipóteses: a significância do testeDessa forma passamos a testar:
𝑡 = 𝛽2 − 0,5
𝑒𝑝 𝛽2
Assim teríamos:
𝑡 =2,3 − 0,5
0,32= 5,625
Pelo resultado acima ainda rejeitamos H0, logo,podemos concluir que 𝛽2 ≠ 0,5.
O gráfico para uma situação como essa seria algo dotipo:
MRLS: Estimação de intervalo e testes de
hipóteses
Os testes de hipóteses: a significância do teste
MRLS: Estimação de intervalo e testes de
hipóteses
Os testes de hipóteses: a significância do teste
MRLS: Estimação de intervalo e testes de
hipóteses
Os testes de hipóteses: a significância do testeVamos considerar agora o mesmo exemplo, porém na
ótica do teste unilateral para fixarmos tal aplicação econceito.
Vamos supor agora que a inclinação seja maior que 0,5,ou seja, a hipótese a ser testada agora é:
𝐻0: 𝛽2 ≤ 0,5𝐻1: 𝛽2 > 0,5
Ou seja, a hipótese agora remete apenas a um lado dadistribuição, agora ela possui característica unilateral. Oprocedimento para o cálculo de tal hipótese ainda permaneceo mesmo, a única coisa que muda será o valorcorrespondente do , considerando o nível de 5%, teremos:
MRLS: Estimação de intervalo e testes de
hipóteses
Os testes de hipóteses: a significância do testeTeste de significância para o 𝝈𝟐.
Vamos tomar como exemplo o valor calculado para avariância dos resíduos estimado no modelo da PMC. 𝜎2 =42,1591 e o grau de liberdade 8. Se postularmos que𝐻0: 𝜎2 = 85 e 𝐻1: 𝜎2 ≠ 85 a equação envolvendo o qui-
quadrado 𝑛 − 2 𝜎2
𝜎2 = 2 nos fornece o teste estatístico para
𝐻0. Substituindo os valores nos parâmetros da fórmula doqui-quadrado, verificamos que, para 𝐻0 , 2 = 3,97 . Seassumirmos =5%, os valores críticos de 2 serão 2,1797 e17,5346. Como o valor do 2 = 3,97 encontra-se dentrodeste intervalo não rejeitamos, portanto, a hipótese nula.
MRLS: Estimação de intervalo e testes de
hipóteses
Os testes de hipóteses: a significância do testePara avaliar o teste qui-quadrado sobre a variância dos
resíduos devemos considerar:
MRLS: Análise de Regressão e Análise de
Variância
Verificamos que
𝑦𝑖2 = 𝑦𝑖
2 + 𝑢𝑖2
= 𝛽22 𝑥𝑖
2 + 𝑢𝑖2
Ou seja, SQT=SQE+SQR
Todos esses resultados podem ser organizados em umatabela, que é a tabela da ANOVA.
MRLS: Análise de Regressão e Análise de
Variância
MRLS: Análise de Regressão e Análise de
Variância
Se preenchermos a tabela anterior com os dadosobtidos no exemplo da seção 3.6, poderemos encontrar umaimportante estatística do MRLS que é a estatística F, assim,teremos os seguintes resultados:
Aplicação da análise da regressão: o problema
da previsão
Um dos últimos procedimentos do MRLS é verificar a suaprevisão, iremos trabalhar nesse caso com a previsão média eindividual, tendo em vista que são as mais comuns de seremutilizadas, os procedimentos para tal uso necessitam que o alunotenha fixado os conceitos vistos anteriormente sobre variância,erro padrão e intervalo de confiança.
Vamos então utilizar o mesmo exemplo da propensãomarginal a consumir da seção 3.6, onde o seguinte modelo haviasido estimado:
𝑌0 = 24,4545 + 0,5091𝑋0
O termo sublinhado zero indica que estamos na etapainicial da previsão, ou seja, é o modelo cru. Agora imagine quequeiramos estimar o valor de Y quando X=20, assim:
Aplicação da análise da regressão: o problema
da previsão
𝑌20 = 24,4545 + 0,5091 20= 34,6365
Algo interessante a ser notado nesse resultado é que,quando a renda for 20 unidades monetárias, o consumo seráde 34,6365 unidades. Mas em termos de impactos teríamosque analisar da seguinte forma: um aumento de 20 unidadesmonetárias gera um aumento no consumo de 34,6365-24,4545= 10,182 unidades.
Temos que subtrair o intercepto para fazer a análise deimpacto, pois este se trata de um consumo médio quandonão existe variação, ou seja, o mesmo não pode sercomputado.
Aplicação da análise da regressão: o problema
da previsão
Para trabalhar essa estimativa em termos de intervadode confiança, teríamos que estimar a variância de Y, ou seja,𝑣𝑎𝑟 𝑌0 , onde, considerando uma distribuição normal,teremos:
𝑣𝑎𝑟 𝑌0 = 𝜎21
𝑛+
𝑋0 − 𝑋 2
𝑥𝑖2
Claro que a 𝜎2 deve ser substituída pelo seu valorestimado, ou seja, 𝜎2, o que nos gera:
𝑡 = 𝑌0 − 𝛽1 + 𝛽2𝑋0
𝑒𝑝 𝑌0
Aplicação da análise da regressão: o problema
da previsão
Com isso, o intervalo de confiança a ser formado será o:
Pr 𝛽1 + 𝛽2𝑋0 − 𝑡𝛼2𝑒𝑝 𝑌0 ≤ 𝛽1 + 𝛽2𝑋0 ≤ 𝛽1 + 𝛽2𝑋0 + 𝑡𝛼
2𝑒𝑝 𝑌0 = 1 − 𝛼
Em que o 𝑒𝑝 𝑌0 = 𝑣𝑎𝑟( 𝑌0)
Já verificamos que:
𝜎2 = 𝑢𝑖
2
𝑛 − 2=
337.2727
8= 42,1591 𝜎 = 6,493
𝑥𝑖2 = 33000
𝑋 = 170
Aplicação da análise da regressão: o problema
da previsão
Assim temos:
𝑣𝑎𝑟 𝑌0 = 42,15911
10+
20 − 170 2
33000
= 32,96
ep 𝑌0 = 5,74
Com isso podemos calcular o intervalo de confiançapara a projeção que será de:
34,6365 − 2,306 5,74 ≤ 𝐸 𝑌0 𝑋 = 20 ≤ 34,6365 + 2,306(5,74)
21,397 ≤ 𝐸 𝑌0 𝑋 = 20 ≤ 47,876
Aplicação da análise da regressão: o problema
da previsão
Para a individual teremos o seguinte comportamentono cálculo da variância de Y
𝑣𝑎𝑟 𝑌0 − 𝑌0 = 𝐸 𝑌0 − 𝑌02
= 𝜎2 1 +1
𝑛+
𝑋0 − 𝑋 2
𝑥𝑖2
E t será
𝑡 =𝑌0 − 𝑌0
𝑒𝑝 𝑌0 − 𝑌0
No caso do nosso exemplo verificamos que suavariância pontual será de 75,12, assim o intervalo deconfiança para 95% para 𝑌0 correspondente a 𝑋0 = 20 é:
(14,65 ≤ 𝑌0|𝑋0 = 20 ≤ 54,623)
Aplicação da análise da regressão: o problema
da previsão
O objetivo é que no final tenhamos um gráficosemelhante ao que se encontra a seguir:
Aplicação da análise da regressão: Teste de
Normalidade
Um dos principais pressupostos dentro do Modelo deRegressão linear é a de que os resíduos sejam normais. Logoapós a estimação do modelo de regressão o teste denormalidade pode ser feito, ou pode ser feitoespecificamente, com a variável em questão, nesse caso, osresíduos.
O teste mais comum de normalidade é o Jarque-Bera(JB). Ele faz o calculo baseado na assimetria (S) e na curtose(K) das variáveis.
As características das distribuições normais são de S=0e K=3.
Aplicação da análise da regressão: Teste de
Normalidade
O teste de JB é dado pela seguinte expressão:
𝐽𝐵 = 𝑛𝑆2
6+
𝐾 − 3 2
24
Note que se o pressuposto da normalidade sejaatendido S=0 e K=3, o valor do JB será zero, logo estamostestando na estatística de Jarque-Bera a seguinte hipótese:
𝐻0: 𝑁𝑜𝑟𝑚𝑎𝑙𝑖𝑑𝑎𝑑𝑒
Portanto, o principal resultado da estatística JB é nãorejeitar a hipótese nula.
Vamos ao exemplo da seção 3.6 (PMC) no Gretl.
FIM DO TÓPICO
4