pc2309 - gu.se · vidare hur skall man avläsa/tolka regressionslinjen? 2. (4 p) nedanstående...
TRANSCRIPT
------------------------------------------------------------------------------------------------------------------------------------- Kod: _____________ Kurs:______________________________________
KOD:
Försättsblad
Kurskod: PC2309 Kursnamn: Metod 1 i psykologi Provmoment: Forskningsmetodik Ansvarig lärare: Ulf Dahlstrand Tentamensdatum: 2012-03-19 Tillåtna hjälpmedel: Kalkylator. Student som ej har svenska som modersmål får använda ordbok för översättning mellan svenska och annat språk. Maxpoäng: 27 Gräns för godkänt: 16 p. Gräns för väl godkänt: 21,5
***************************************************************************
OBS! Vi har nya rutiner.
Detta är en anonym tenta. Skriv ditt namn och personnummer på avsedd plats nedan. Detta
försättsblad kommer att tas bort före rättning. Koden ersätter dina personuppgifter på
tentamen. Kontrollera att din tentamen är komplett och att samma kodnummer står på
tentamen som på detta försättsblad. Notera koden även på din talong nedan.
Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta.
Tentamensresultaten anslås med hjälp av kodnummer.
Studentens namn:_______________________________________________
Studentens personnummer:________________________________________
------------------------------------------------------------------------------------------------------------------------------------- Kod: _____________ Kurs:______________________________________
KOD:
Försättsblad
Kom ihåg att notera din kod på talongen nedan, riv av och ta med den innan du lämnar in tentamen. Om du slarvar bort eller glömmer koden så kan vi inte ge ut den, utan du måste vänta tills betyget är inlagt i Ladok. Psykologiska institutionen
Göteborgs universitet
Kurs: Metod 1 i psykologi
Datum: 2012-03-19
Tid: 09.00-13.00
Lokal: Viktoriagatan 30
Ulf Dahlstrand
Tentamen
i
forskningsmetodik
Maxpoäng: 27
Gräns för godkänt: 16 p.
Gräns för väl godkänt: 21,5 p.
1. (2 p)
Antag att det finns två variabler, en y-variabel och en x-variabel, i en studie. Man kan då göra
ett s.k. spridningsdiagram med dessa variabler, där varje prick i diagrammet skulle kunna
representera en individ. Med hjälp av regressionsanalys kan man få fram en regressionslinje
som kan läggas in i diagrammet och som beskriver sambandet mellan de två variablerna. Var
hamnar denna linje i förhållande till prickarna i diagrammet, dvs vilken idé ligger bakom
uträkningen av regressionslinjen så att man får en så rättvisande beskrivning av sambandet
som möjligt? Vidare hur skall man avläsa/tolka regressionslinjen?
2. (4 p)
Nedanstående ekvation har man erhållit i en enkel regressionsanalys med 204 deltagare.
Y’ = 10,12 – 1,34X1 R2
= 0,06
Y = antal miljövänliga handlingar
X1 = kön med kodningen 0=kvinnor, 1=män
En ytterligare analys gjordes med samma beroendevariabel och med kön (X1 ) som en
oberoende variabel. Dessutom lades det till två nya oberoende variabler, ”attityd” (X2) och
”norm” (X3). Följande ekvation erhölls:
Y’ = 2,59 - 0,84X1 + 0,41X2 + 0,49X3 R2 = 0,16
Notera att regressionskoefficienten för kön i denna ekvation inte är densamma som i den
enkla regressionsanalysen, vad kan det bero på? Hur skall man tolka regressionskoefficienten
för kön i den multipla regressionsanalysen?
Ökningen i R2 är 0,10 när man går från den enkla till den multipla regressionsanalysen, är det
en signifikant ökning?
3. (3 p)
Dummykodning, effektkodning och kontrastkodning är tre olika metoder för att koda en
kvalitativ faktor som skall införas i en regressionsanalys. Välj en av dem och beskriv den
valda metoden utförligt.
4. (4 p)
När man gör en regressionsanalys kan man få residualer, dvs skillnader mellan predicerade y-
värden och faktiska y-värden. Hur bör dessa vara beskaffade för att analysen skall vara giltig
5. (3 p)
Förklara vad ”power” respektive typ-2-fel innebär i samband med regressionsanalys och
signifikanstestning.
6) (2 p)
Vad säger det s.k. VIF-värdet (Variance Inflation Factor) för en oberoende variabel i en
multipel regressionsanalys?
7. (6 p)
Det finns olika regressionsanalyser som man kan utföra med flera oberoende variabler. Jämför
och beskriv de fyra nedanstående typerna så att skillnader mellan dem framgår.
A) Simultan (den vanliga) regressionanalys
B) Hierarkisk
C) Stepwise
D) Binär logistisk
8. (3 p)
En variabel skulle kunna moderera respektive mediera ett samband mellan två andra
variabler, x och y. Förklara vad skillnaden är mellan de två fenomenen.
PC2309 VT 2012
Ulf Dahlstrand
Formelsamling
Varians
1
2
2
N
XXsx N = stickprovsstorlek
Kovarians
1N
YYXXsxy
Korrelation
22
YYXX
YYXXrxy
Enkel linjär regression
Population XY
Stickprov ebXaY
Regressionskoefficient 2
XX
YYXXb
Intercept XbYa
(konstant)
Predicerade Y-värden bXaY
Enkel och multipel regression
Fel YYe
Residualkvadratsumma 22 YYe
(residual sum of squares)
Regressionskvadratsumma 2
YY
(regression sum of squares)
SStot = SSreg + SSres 2
YY 2
YY + 2
YY
Determinationskoefficient
eller förklarad variation tot
reg
xySS
SSr 2 ;
tot
reg
yySS
SSr 2 ;
tot
reg
SS
SSR2
Justerat 2R
1
111ˆ 22
kN
NRR
Residualvarians 1
2
2
...12.kN
YYMSRs ky
(Mean square residual;
Variance of estimate) k = antal oberoende variabler (X)
Residualstandardavvikelse 1
2
...12.kN
YYs ky
Signifikanstestning av regressionskoefficent (enkel regression)
Regressionskoefficientens standardfel 2
...12.
XX
ss
ky
b
(Standard error of b)
t-testning; bs
bt
frihetsgrader; df = (N-k-1)
Konfidensintervall bkrit stb
Multipel regressionsanalys med två oberoende variabler
Stickprov eXbXbaY 2211
(Partiella) regressionskoefficienter
1
2
12
1221
11 s
s
r
rrrb
yyy
2
2
12
1212
21 s
s
r
rrrb
yyy
Intercept 22110 XbXbYba
(konstant)
Standardfel för 1b
2
12
2
1
___
1
12.
1
1
rXX
ss
y
b
Standardfel för 2b
2
12
2___
22
12.
1
2
rXX
ss
y
b
Signifikanstestning
1
1
1
b
bs
bt
2
2
2
b
bs
bt
Frihetsgrader df = (N-k-1)
Signifikanstestning av hela modellen
resres
regreg
dfSS
dfSS
kNR
kRF
/
/
1/1
/2
2
Frihetsgrader df = (k, (N-k-1)
Signifikanstestning av skillnad i R-kvadrat mellan två modeller
1/1
)/()(
1
2
...12.
21
2
...12.
2
...12.
1
21
kNR
kkRRF
ky
kyky
Frihetsgrader 1, 121 kNkkdf
Partialkorrelation
2
12
2
2
1221
2.1
111
rr
rrrrr
y
yy
yeey
2
2.
2
2.
2
12.2
2.11 y
yy
yR
RRr
Semipartialkorrelation
2
12
1221
2.1
11
r
rrrrr
yy
yye
2
2.
2
12.
2
2.1 yyy RRr
2
)2.1(
2
2
2
)1.2(
2
1
2
12. yyyyy rrrrR
Mått för att upptäcka utbölingar och observationer med stort inflytande (diagnostik)
Standardiserad residual ky
i
s
eZRESID
..12.
Studentized residual
ie
i
s
eSRESID
2
2
...12.
11
XX
XX
Nss i
kyei
Leverage (hävstångsvärde) 2
2)(1
XX
XX
Nh i
i
Cooks avstånd i
ii
ih
h
k
SRESIDD
11
2
Skillnad i b-värde då )(ibbDFBETA
en viss individ är med eller inte
Konfidensintervall kring predicerade värden: En prediktor (enkel regression)
Standardfel för genomsnittligt
predicerat värde 2
2
2
.
1
XX
XX
Nss i
xy
Prediktionsintervall: Medelvärde stY
Standardfel för individuellt
predicerat värde 2
2
2
.
11
XX
XX
Nss i
xyy
Prediktionsintervall: Individuellt värde ystY
Binär logistisk regressionsanalys
Naturliga logaritmen
Basen i den naturliga logaritmen är e som är ungefär 2,718
e0
= 1 e-1
= 1
1
e
Exponentialfunktion: y = ex ln(y) = X
Logittransformation av beroendevariabel
Binär (dikotom) beroendevariabel som kan ha värdena:
1 som är en kategori för en händelse, eller ja
och
0 som är detsamma som ”ej händelse” eller nej
P = sannolikhet för 1
1 – P är sannolikhet för 0
Oddskvot kan vara en sannolikhetskvot: P
P
1
Enkel binär logistisk regression kan skrivas som
P
P
1= e
a + bx
logit(P) = lnP
P
1= a + bx
P = =