Økonometri 1

21
Økonometri 1: F15 1 Økonometri 1 Specifikation og dataproblemer 10. november 2006

Upload: norm

Post on 28-Jan-2016

33 views

Category:

Documents


0 download

DESCRIPTION

Økonometri 1. Specifikation og dataproblemer 10. november 2006. Program. Info om ”prøveeksamen” Specifikation og dataproblemer, fortsat (Wooldridge kap. 9): Mere om brug af proxy-variabler Betydning af målefejl Dataudvælgelse: Manglende observationer Endogen og eksogen dataudvælgelse - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Økonometri 1

Økonometri 1: F15 1

Økonometri 1

Specifikation og dataproblemer

10. november 2006

Page 2: Økonometri 1

Økonometri 1: F15 2

Program

Info om ”prøveeksamen”

Specifikation og dataproblemer, fortsat (Wooldridge kap. 9):

Mere om brug af proxy-variabler Betydning af målefejl Dataudvælgelse:

Manglende observationer Endogen og eksogen dataudvælgelse Ekstreme og indflydelsesrige observationer

Page 3: Økonometri 1

Økonometri 1: F15 3

Info om ”prøveeksamen”

Ugeseddel 10 er en frivillig ”prøveeksamen”.

Formål: I får lejlighed til - under eksamensrealistiske forhold - at: Løse en opgave af samme type som eksamensopgaven (men ca. halv størrelse) Afprøve ”infrastrukturen” omkring download og upload af data og programmer Afprøve den computer og SAS-installation som I har tænkt jer at løse

eksamensopgaven på

Forløb: ”Prøveeksamens”-opgaven udleveres/downloades ved øvelserne i uge 47 (21/11

hhv. 23/11). Opgaven afsluttes ved øvelserne i uge 48. Anbefalet samlet tidsforbrug i løbet af uge

47/48: 10 timer. Besvarelsen skal ikke afleveres, men upload af SAS-programmer og datafiler

afprøves. Vejledende besvarelse udleveres på hjemmesiden fredag den 1. december. Opgaven bliver gennemgået ved forelæsningen den 4. december.

Page 4: Økonometri 1

Økonometri 1: F15 4

Målefejl

Der må ofte antages at være målefejl i økonomiske data

Grunde til at målefejl opstår: Spørgeskemaundersøgelser – retrospektiv information Præcis information, der svarer til det teoretiske begreb,

findes ikke Tastefejl

To hovedtilfælde: Målefejl i afhængig variabel Målefejl i forklarende variabler

Page 5: Økonometri 1

Økonometri 1: F15 5

Målefejl i den afhængige variabel

Antag følgende model

Modellen opfylder MLR.1-MLR.4 Desværre observerer man ikke y*, i stedet observeres y

hvor kan opfattes som en målefejl For at kunne estimere modellen skal y* erstattes med y:

0 1 1 2 2* k ky x x x u

0*y y e 0e

0 0 1 1 2 2

0 1 1 2 2 0

k k

k k

y e x x x u

y x x x u e

Page 6: Økonometri 1

Økonometri 1: F15 6

Målefejl i den afhængige variabel

Fejlleddet i den ”nye” model: Hvornår giver OLS middelrette og konsistente

estimater af ?

Under antagelserne Middelværdien af målefejlene er 0 Målefejlene er uafhængige af de forklarende variablevil den ”nye” model med y opfylde MLR.1-MLR.4, og derfor er

OLS middelret og konsistent Hvis målefejlene ikke har middelværdi 0, men stadig

er uafhængige af de forklarende variabler, vil OLS blot give et skævt estimat af

0 1 2, , , , k

0u e

0

Page 7: Økonometri 1

Økonometri 1: F15 7

Målefejl i den afhængige variabel

Variansen i det nye fejlled: Normalt antager man, at variansen af målefejlen er

konstant. Så er antagelsen MLR.5 også opfyldt for den ”nye” model.

.. Hvis ikke giver det anledning til heteroskedasticitet Hvis målefejlene og u er ukorrelerede, er variansen

Variansen er større med målefejl -> større varians af parameterestimaterne.

2 2 20 0( ) u uV u e

Page 8: Økonometri 1

Økonometri 1: F15 8

Målefejl i den afhængige variabel

Multiplikative målefejl

Målefejl som er proportionale med den afhængige variabel

Hvis den afhængige variabel transformeres med log fås

0*y y a

0 0log( ) log( *) log( ) log( *)y y a y e

Page 9: Økonometri 1

Økonometri 1: F15 9

Målefejl i de forklarende variabler

Antag følgende model:

x* er uobserverbar. I stedet observeres x, som er givet ved

Antagelserne om målefejl:

x kan opfattes som en proxy for x* OLS er middelret og konsistent

1

1 1

( ) ( ) 0

( ) ( , ) 0

i E e

ii Cov e x

*0 1 1y x u

1 1 1*x x e

Page 10: Økonometri 1

Økonometri 1: F15 10

Målefejl i de forklarende variabler

At målefejlen er ukorreleret med det observerede x, er ofte en urealistisk antagelse

Klassiske målefejl: Målefejlen er ukorreleret med den sande værdi af variablen.

Antagelser:

Disse antagelser er ofte mere naturlige. Desværre giver de anledning til alvorlige problemer.

1

1 1

( ) ( ) 0

( ) ( , *) 0

i E e

ii Cov e x

Page 11: Økonometri 1

Økonometri 1: F15 11

Målefejl i de forklarende variabler

Egenskaber ved OLS estimatoren OLS ikke konsistent

Tavlegennemgang

I kapitel 15 ser vi på, hvordan man kan få konsistente estimater når der er målefejl

Page 12: Økonometri 1

Økonometri 1: F15 12

Data problemer

Indtil nu har vi antaget, at MLR.2 altid er opfyldt

Vi har antaget, at data stammer fra en tilfældig stikprøve

Der er mange grunde til, at denne antagelse ikke er opfyldt i praksis: Manglende observationer: Tilfældigt eller ej? Ikke-tilfældig dataudvælgelse: Exogent eller

endogent.

Page 13: Økonometri 1

Økonometri 1: F15 13

Manglende observationer

Er manglende observationer for en eller flere variabler et problem?

Manglende observationer vil reducere antallet af brugbare observationer i analysen

Det afgørende for, om manglende observationer giver alvorlige problemer, er hvorfor observationerne mangler

Hvis observationerne mangler ”tilfældigt”, er det et mindre problem -> mindre præcise estimater

Page 14: Økonometri 1

Økonometri 1: F15 14

Ikke-tilfældig dataudvælgelse

Der er forskellige måder hvorpå stikprøven kan være ikke-tilfældig (dvs. antagelse MLR.2 ikke er opfyldt): Eksogen dataudvælgelse Endogen dataudvælgelse Stratificeret dataudvælgelse

Det er ikke alle typer af ikke-tilfældig dataudvælgelse, som giver anledning til skæve eller inkonsistente OLS estimater

Page 15: Økonometri 1

Økonometri 1: F15 15

Ikke-tilfældig dataudvælgelse

Eksogen dataudvælgelse: Dataudvælgelse baseret på en af de forklarende

variabler Denne type af dataudvælgelse vil (under

forudsætninger af nok variation i de forklarende variabler) stadig give middelrette og konsistente OLS etimater

Dataudvælgelse baseret på variabler, som er uafhængige af fejlleddet giver stadig, at OLS estimaterne er middelrette og konsistente

Page 16: Økonometri 1

Økonometri 1: F15 16

Ikke-tilfældig dataudvælgelse

Endogen dataudvælgelse: Dataudvælgelse baseret på den afhængige

variabel eller variabler, der er korrelerede dermed Eksempler

Formue i model for investeringsstrategier blandt aktieinvestorer (kun baseret på folk med formue under 0,5 mill. kr.)

Lønrelationen (kun baseret på folk som arbejder) OLS estimator er ikke middelret og ikke konsistent

Page 17: Økonometri 1

Økonometri 1: F15 17

Ikke-tilfældig dataudvælgelse

Stratificeret dataudvælgelse: Populationen er delt i grupper (disjunkte

grupper som udgør hele populationen) Nogle af grupperne er udvalgt mere hyppigt

end andre, sammenlignet med deres andel af populationen

OLS er middelret og konsistent, hvis gruppeopdelingen er baseret på eksogene variabler

Page 18: Økonometri 1

Økonometri 1: F15 18

Ekstreme observationer

Ekstreme observationer er observationer, som har stor betydning på værdien af OLS estimaterne

En ekstrem observation får stor betydning på OLS estimater, da OLS bestemmes ved at minimere de kvadrerede residualer

Hvorfor er der ekstreme observationer: Fejl i data Enkelte enheder i populationen er meget

forskellige fra resten

Page 19: Økonometri 1

Økonometri 1: F15 19

Ekstreme observationer

Hvad gør man ved ekstreme observationer: Hvis man er sikker på, at de skyldes fejl i data:

Ekstreme observationer udelades Hvis det ikke er en oplagt fejl, er der ingen nemme

løsninger: Estimér modellen med og uden de ekstreme

observationer og sammenlign resultaterne Der findes estimatorer, som er mere robuste overfor

ekstreme observationer end OLS

Page 20: Økonometri 1

Økonometri 1: F15 20

NB’er

Målefejl i den afhængige variabel giver oftest anledning til mindre præcis estimation, men berører sædvanligvis ikke konsistensen af OLS estimation.

Klassiske målefejl: Mest rimelige antagelse i mange tilfælde. Desværre giver dette tilfælde anledning til alvorlige problemer (inkonsistente OLS estimater).

Dataudvælgelse der er baseret på information, der er relateret til den afhængige variabel, giver ofte anledning til bias.

Page 21: Økonometri 1

Økonometri 1: F15 21

Næste gang

Næste forelæsning er mandag den 13. november

Nyt emne: Gentagne tværsnit og paneldata: Kapitel 13+14 i Wooldridge.