pc2309 - gu.se · vidare hur skall man avläsa/tolka regressionslinjen? 2. (4 p) nedanstående...

------------------------------------------------------------------------------------------------------------------------------------- Kod: _____________ Kurs:______________________________________

KOD:

Försättsblad

Kurskod: PC2309 Kursnamn: Metod 1 i psykologi Provmoment: Forskningsmetodik Ansvarig lärare: Ulf Dahlstrand Tentamensdatum: 2012-03-19 Tillåtna hjälpmedel: Kalkylator. Student som ej har svenska som modersmål får använda ordbok för översättning mellan svenska och annat språk. Maxpoäng: 27 Gräns för godkänt: 16 p. Gräns för väl godkänt: 21,5

***************************************************************************

OBS! Vi har nya rutiner.

Detta är en anonym tenta. Skriv ditt namn och personnummer på avsedd plats nedan. Detta

försättsblad kommer att tas bort före rättning. Koden ersätter dina personuppgifter på

tentamen. Kontrollera att din tentamen är komplett och att samma kodnummer står på

tentamen som på detta försättsblad. Notera koden även på din talong nedan.

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta.

Tentamensresultaten anslås med hjälp av kodnummer.

Studentens namn:_______________________________________________

Studentens personnummer:________________________________________

------------------------------------------------------------------------------------------------------------------------------------- Kod: _____________ Kurs:______________________________________

KOD:

Försättsblad

Kom ihåg att notera din kod på talongen nedan, riv av och ta med den innan du lämnar in tentamen. Om du slarvar bort eller glömmer koden så kan vi inte ge ut den, utan du måste vänta tills betyget är inlagt i Ladok. Psykologiska institutionen

Göteborgs universitet

Kurs: Metod 1 i psykologi

Datum: 2012-03-19

Tid: 09.00-13.00

Lokal: Viktoriagatan 30

Ulf Dahlstrand

Tentamen

i

forskningsmetodik

Maxpoäng: 27

Gräns för godkänt: 16 p.

Gräns för väl godkänt: 21,5 p.

1. (2 p)

Antag att det finns två variabler, en y-variabel och en x-variabel, i en studie. Man kan då göra

ett s.k. spridningsdiagram med dessa variabler, där varje prick i diagrammet skulle kunna

representera en individ. Med hjälp av regressionsanalys kan man få fram en regressionslinje

som kan läggas in i diagrammet och som beskriver sambandet mellan de två variablerna. Var

hamnar denna linje i förhållande till prickarna i diagrammet, dvs vilken idé ligger bakom

uträkningen av regressionslinjen så att man får en så rättvisande beskrivning av sambandet

som möjligt? Vidare hur skall man avläsa/tolka regressionslinjen?

2. (4 p)

Nedanstående ekvation har man erhållit i en enkel regressionsanalys med 204 deltagare.

Y’ = 10,12 – 1,34X1 R2

= 0,06

Y = antal miljövänliga handlingar

X1 = kön med kodningen 0=kvinnor, 1=män

En ytterligare analys gjordes med samma beroendevariabel och med kön (X1 ) som en

oberoende variabel. Dessutom lades det till två nya oberoende variabler, ”attityd” (X2) och

”norm” (X3). Följande ekvation erhölls:

Y’ = 2,59 - 0,84X1 + 0,41X2 + 0,49X3 R2 = 0,16

Notera att regressionskoefficienten för kön i denna ekvation inte är densamma som i den

enkla regressionsanalysen, vad kan det bero på? Hur skall man tolka regressionskoefficienten

för kön i den multipla regressionsanalysen?

Ökningen i R2 är 0,10 när man går från den enkla till den multipla regressionsanalysen, är det

en signifikant ökning?

3. (3 p)

Dummykodning, effektkodning och kontrastkodning är tre olika metoder för att koda en

kvalitativ faktor som skall införas i en regressionsanalys. Välj en av dem och beskriv den

valda metoden utförligt.

4. (4 p)

När man gör en regressionsanalys kan man få residualer, dvs skillnader mellan predicerade y-

värden och faktiska y-värden. Hur bör dessa vara beskaffade för att analysen skall vara giltig

5. (3 p)

Förklara vad ”power” respektive typ-2-fel innebär i samband med regressionsanalys och

signifikanstestning.

6) (2 p)

Vad säger det s.k. VIF-värdet (Variance Inflation Factor) för en oberoende variabel i en

multipel regressionsanalys?

7. (6 p)

Det finns olika regressionsanalyser som man kan utföra med flera oberoende variabler. Jämför

och beskriv de fyra nedanstående typerna så att skillnader mellan dem framgår.

A) Simultan (den vanliga) regressionanalys

B) Hierarkisk

C) Stepwise

D) Binär logistisk

8. (3 p)

En variabel skulle kunna moderera respektive mediera ett samband mellan två andra

variabler, x och y. Förklara vad skillnaden är mellan de två fenomenen.

PC2309 VT 2012

Ulf Dahlstrand

Formelsamling

Varians

1

2

2

N

XXsx N = stickprovsstorlek

Kovarians

1N

YYXXsxy

Korrelation

22

YYXX

YYXXrxy

Enkel linjär regression

Population XY

Stickprov ebXaY

Regressionskoefficient 2

XX

YYXXb

Intercept XbYa

(konstant)

Predicerade Y-värden bXaY

Enkel och multipel regression

Fel YYe

Residualkvadratsumma 22 YYe

(residual sum of squares)

Regressionskvadratsumma 2

YY

(regression sum of squares)

SStot = SSreg + SSres 2

YY 2

YY + 2

YY

Determinationskoefficient

eller förklarad variation tot

reg

xySS

SSr 2 ;

tot

reg

yySS

SSr 2 ;

tot

reg

SS

SSR2

Justerat 2R

1

111ˆ 22

kN

NRR

Residualvarians 1

2

2

...12.kN

YYMSRs ky

(Mean square residual;

Variance of estimate) k = antal oberoende variabler (X)

Residualstandardavvikelse 1

2

...12.kN

YYs ky

Signifikanstestning av regressionskoefficent (enkel regression)

Regressionskoefficientens standardfel 2

...12.

XX

ss

ky

b

(Standard error of b)

t-testning; bs

bt

frihetsgrader; df = (N-k-1)

Konfidensintervall bkrit stb

Multipel regressionsanalys med två oberoende variabler

Stickprov eXbXbaY 2211

(Partiella) regressionskoefficienter

1

2

12

1221

11 s

s

r

rrrb

yyy

2

2

12

1212

21 s

s

r

rrrb

yyy

Intercept 22110 XbXbYba

(konstant)

Standardfel för 1b

2

12

2

1

___

1

12.

1

1

rXX

ss

y

b

Standardfel för 2b

2

12

2___

22

12.

1

2

rXX

ss

y

b

Signifikanstestning

1

1

1

b

bs

bt

2

2

2

b

bs

bt

Frihetsgrader df = (N-k-1)

Signifikanstestning av hela modellen

resres

regreg

dfSS

dfSS

kNR

kRF

/

/

1/1

/2

2

Frihetsgrader df = (k, (N-k-1)

Signifikanstestning av skillnad i R-kvadrat mellan två modeller

1/1

)/()(

1

2

...12.

21

2

...12.

2

...12.

1

21

kNR

kkRRF

ky

kyky

Frihetsgrader 1, 121 kNkkdf

Partialkorrelation

2

12

2

2

1221

2.1

111

rr

rrrrr

y

yy

yeey

2

2.

2

2.

2

12.2

2.11 y

yy

yR

RRr

Semipartialkorrelation

2

12

1221

2.1

11

r

rrrrr

yy

yye

2

2.

2

12.

2

2.1 yyy RRr

2

)2.1(

2

2

2

)1.2(

2

1

2

12. yyyyy rrrrR

Mått för att upptäcka utbölingar och observationer med stort inflytande (diagnostik)

Standardiserad residual ky

i

s

eZRESID

..12.

Studentized residual

ie

i

s

eSRESID

2

2

...12.

11

XX

XX

Nss i

kyei

Leverage (hävstångsvärde) 2

2)(1

XX

XX

Nh i

i

Cooks avstånd i

ii

ih

h

k

SRESIDD

11

2

Skillnad i b-värde då )(ibbDFBETA

en viss individ är med eller inte

Konfidensintervall kring predicerade värden: En prediktor (enkel regression)

Standardfel för genomsnittligt

predicerat värde 2

2

2

.

1

XX

XX

Nss i

xy

Prediktionsintervall: Medelvärde stY

Standardfel för individuellt

predicerat värde 2

2

2

.

11

XX

XX

Nss i

xyy

Prediktionsintervall: Individuellt värde ystY

Binär logistisk regressionsanalys

Naturliga logaritmen

Basen i den naturliga logaritmen är e som är ungefär 2,718

e0

= 1 e-1

= 1

1

e

Exponentialfunktion: y = ex ln(y) = X

Logittransformation av beroendevariabel

Binär (dikotom) beroendevariabel som kan ha värdena:

1 som är en kategori för en händelse, eller ja

och

0 som är detsamma som ”ej händelse” eller nej

P = sannolikhet för 1

1 – P är sannolikhet för 0

Oddskvot kan vara en sannolikhetskvot: P

P

1

Enkel binär logistisk regression kan skrivas som

P

P

1= e

a + bx

logit(P) = lnP

P

1= a + bx

P = =

pc2309 - gu.se · vidare hur skall man avläsa/tolka regressionslinjen? 2. (4 p) nedanstående...

Documents