multipel linjär regression · 2018. 10. 5. · multipel kausalitet en aktuell fråga: svårare...
TRANSCRIPT
![Page 1: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/1.jpg)
Multipel linjär regression
![Page 2: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/2.jpg)
Motiverande exempel: effekt av sjukhusstorlek
![Page 3: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/3.jpg)
Multipel kausalitetEn aktuell fråga:
Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar bort urinblåsan. De senaste åren har man börjat koncentrera verksamheten till färre ställen. Frågan är nu om detta också gjort vården bättre.
![Page 4: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/4.jpg)
Färgningen beror av antalet cystektomier de föregående tre åren
![Page 5: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/5.jpg)
Centraliseringen är påtaglig
![Page 6: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/6.jpg)
ResultatmåttKnappast imponerande!
Kan det dock vara så att man tagit sig an svårare patienter?
![Page 7: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/7.jpg)
Lite spretigt!● Fler äldre ● Fler med
komorbiditet● Men färre T3,
och T-stadium är en viktig prediktor
● Kön är inte så viktigt
![Page 8: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/8.jpg)
Varaktigheten av besöket på sjukhuset
CCI
Kön
VA
RA
KTI
GH
ET
Ålder
T-stadium
Sjukhusstorlek
Statistisk modell i princip (Notera logaritmen!):
log(varaktighet)=B0+B1*Sjukhusstorlek+B2*Ålder+B3*CCI+B4*T-stadium+B5*kön+slumpfel
Teknik: Uppskatta B0, B1, ….,B5 och se hur stora de blir. Om B1 uppskattas större än vad man kan förvänta av en ren slump när B1 = 0, kallar vi effekten av Sjukhusstorlek statistiskt signifikant
![Page 9: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/9.jpg)
Multipel linjär regression- Ett försök att bringa reda i
en oändligt komplex verklighet.
- Utför den med ödmjukhet! Resultaten kan och bör alltid ifrågasättas.
![Page 10: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/10.jpg)
![Page 11: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/11.jpg)
![Page 12: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/12.jpg)
![Page 13: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/13.jpg)
>> L = [0.21 -0.86 0.76;-0.86 5.52 -5.68;0.76 -5.68 6.31]
L =
0.2100 -0.8600 0.7600 -0.8600 5.5200 -5.6800 0.7600 -5.6800 6.3100
>> R = [82.89 50.30 36.35]'
R =
82.8900 50.3000 36.3500
>> L*R
ans =
1.7749 -0.0974 6.6609
![Page 14: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/14.jpg)
Tre skattade parametrar: σ2 skattas med 30-3=27 frihetsgrader
s2=Q0/27=4.72/27=0.1748s=0.4181
![Page 15: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/15.jpg)
95 % konfidensintervall för β0, β1 och β2:
![Page 16: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/16.jpg)
![Page 17: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/17.jpg)
Alltså kan det givna ekvationssystemet
Skrivas på det kompakta sätter.
Lägg märke till att det inte gör något att den andra förklarande variabeln är kvadraten på den första. Ett kvadratiskt beroende görs alltså om till en term som fungerar precis som en linjär.
Fråga till den som minns skolfysiken: Konfidensintervallet för β1 är (-2.11,1.92), dvs är inte signifikant skild från noll: Tolkning?
![Page 18: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/18.jpg)
Multipel linjär regressionVi observationer av en responsvariabel y, som antas bero både på slump och på linjärt på ett antal förklarande variabler x1,...xp:
Detta kan skrivas på matrisform:
![Page 19: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/19.jpg)
Slutsats: Det vimlar av matriser. Låt oss ge dem några minuter.
![Page 20: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/20.jpg)
Repetition av matriser
![Page 21: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/21.jpg)
Matrisalgebra - addition och subtraktionAddition är bara att lägga ihop respektive element.
Subtraktion fungerar analogt.
Det är bara matriser av samma dimension som kan adderas och subtraheras.
![Page 22: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/22.jpg)
Matlab>> [2 7 2;3 -9 1/3]
ans =
2.0000 7.0000 2.0000
3.0000 -9.0000 0.3333
>> [-2 5 2;0 7 2/3]
ans =
-2.0000 5.0000 2.0000
0 7.0000 0.6667
>> L = [2 7 2;3 -9 1/3];
>> R = [-2 5 2;0 7 2/3];
>> L+R
ans =
0 12 4
3 -2 1
>> [2 7 2;3 -9 1/3]+[-2 5 2;0 7 2/3]
ans =
0 12 4 3 -2 1
En smidigare lösning: Spara matriserna i variablerna L (”left”) och R (”Right”)
![Page 23: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/23.jpg)
![Page 24: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/24.jpg)
Matrismultiplikation Matrismultiplikation C = AB:
“”Multiplicera
- element 1 i rad As rad i med element 1 i Bs kolonn j
- element 2 i rad As rad i med element 2 i Bs kolonn j
- …- Summera till element (i,j)
![Page 25: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/25.jpg)
![Page 26: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/26.jpg)
Matlab>> [1 2 3;4 5 6]
ans =
1 2 3
4 5 6
>> [7 10;8 11;9 12]
ans =
7 10
8 11
9 12
>> [1 2 3;4 5 6]*[7 10;8 11;9 12]
ans =
50 68
122 167
>> L = [1 2 3;4 5 6];>> R = [7 10;8 11;9 12];>> L*R
ans =
50 68 122 167
En smidigare lösning: Spara matriserna i variablerna L (”left”) och R (”Right”)
![Page 27: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/27.jpg)
Matriser måste vara kompatibla>> [3 4;5 6] +[2 9 1;3 4 5]
Matrix dimensions must agree.
>> [3 4;5 6]*[2 9 1;3 4 5]
ans =
18 43 23
28 69 35
>> [2 9 1;3 4 5]*[3 4;5 6]
Error using * Inner matrix dimensions must agree.
Matriserna A och B kan multipliceras om A har lika många kolonner som B har rader.
![Page 28: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/28.jpg)
Transponering byter plats på rader och kolonner
![Page 29: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/29.jpg)
Transponering är apostrof i Matlab
![Page 30: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/30.jpg)
Regler för transponering av produkten av matriser(AB)T=BTAT.
(ABC)T=CTBTAT
(AT)T=A
Nedanstående gäller visserligen inverser, men reglerna är analoga. (Inverser kommer vi till. Matriser där transponat och invers sammanfaller kallas ortogonala.)
![Page 31: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/31.jpg)
IdentitetsmatrisenIdentitetsmatrisen fungerar alltså som en etta för matrismultiplikation.
IB = B.
Man kan lätt kolla att även
BI=B.
Detta gäller naturligtvis bara om I har lika många rader (och kolonner) som Bs rader i det första fallet och som Bs kolonner i det andra.
![Page 32: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/32.jpg)
I Matlab heter identitetsmatrisen eye
![Page 33: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/33.jpg)
Matrisinvers - bara för symmetriska matriserFör kvadratiska matriser A med full rang (dvs. kolonnerna är linjärt oberoende) existerar en entydligt bestämd matris A-1 så att AA-1=A-1A=I, där I är identitetsmatrisen:
Identitetsmatrisen har egenskapen att
IB=B
CI=C
närhelst B och C har rätt dimension och fungerar alltså som en etta i matrismultiplikation.
![Page 34: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/34.jpg)
Invers matris
Det är alltid möjligt att invertera matriser för hand, även om det ofta är krångligt när de är stora. Men det behövs nästan aldrig. Matlab, eller något annat programm - eller en avancerad miniräknare - kan göra jobbet.
![Page 35: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/35.jpg)
Här kommer en speciell form av inverser att dominera(För enkelhets skull visar jag för tre kolonner med n>3)
ATA är inverterbar om och bara om kolonnerna i A är linjärt oberoende.
Lägg för märke till att ATA är symmetrisk, dvs. (ATA)T=A^TA.
![Page 36: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/36.jpg)
Ekvationssystem kan formuleras med matriserOm
Ekvivalent skrivning: skriver vi
Om n>3 har denna ekvation oftast ingen lösning.
![Page 37: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/37.jpg)
Minsta kvadrat-lösningÄven om denna ekvation saknar lösning, så kan man finna minsta kvadrat-lösningen, dvs det x som minimerar
I så fall har över ATA full rang, och lösningen kan skrivas
ur lösningen till ekvationen
Denna ekvation har entydig lösning om A har oberoende kolonner.
![Page 38: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/38.jpg)
Exempel, Olbjer 11:4, bromssträcka för en truck En platschef tror att bromsstäckan för en truck beror av farten och av lasten och sätter upp modellen:
Bromssträcka = A+B*Fart+C*Last
(Att denna modell bara kan gälla för begränsade värden på Fart och Last, eftersom bromssträckan är noll då Farten än noll.)
Vederbörande platschef samlar in data och lägger i en vektor (kolonnmatris) och en
![Page 39: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/39.jpg)
I Matlab ser det ut så härBromssträckor: En kolonn med ettor,
farten (m/s) och lasten (ton)
Ettorna är där för att då kan ekvationen skrivas som:
![Page 40: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/40.jpg)
Ingen äkta lösning, men minsta-kvadrat-lösning
![Page 41: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/41.jpg)
Platschefen kan nu uppskatta bromssträckan Nu kan varje uppskattat värde jämföras med det verkliga.
Inte så illa, men detta är ju en statistikkurs … Vi behöver feluppskattningar!
![Page 42: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/42.jpg)
SlumpvektorerTidigare hade vi endimensionella slumpvariabler, som bland annat karaktäriserades av väntevärde och varians.
En flerdimensionell slumpvariabel är helt enkelt flera endimensionella variabler samlade i en vektor, representerad som en kolonnmatris:
Med väntevärdet menas bara de enskilda väntevärdena samlade i en vektor:
![Page 43: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/43.jpg)
Variansen motsvaras av kovariansmatrisen
Denna definition är inte så mycket att fästa sig vid. Notera att diagonalelementen är varianserna av komponenterna. De övriga elementen är kovarianser mellan elementen.
Det man verkligen använder är räknerregler:
om B är en konstant matris - dvs. inte en slumpmatris.
![Page 44: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/44.jpg)
Allmänna räknereglerOm a är en konstant vektor (kolonnmatris), A en konstant matris och X en slumpvektor, så gäller om matriserna är kompatibla:
Vi kommer inte att använda särskilt mycket matrisalgebra, men detta behövs.
Om A är en radvektor, får vi tillbaka en endimensionell vektor.
![Page 45: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/45.jpg)
Tillbaka till ursprungsproblemetDet enda som varierar slumpmässigt här är E, men notera att β består av okända parametrar, som vi kan vilja skatta.
Detta kan skrivas på matrisform:
![Page 46: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/46.jpg)
Notationen ser lite annorlunda ut i regression
Annars brukar X vara slumpvariabeln.
Nu är det E som varierar slumpmässigt. X består av kända kovariatvärden och de konstanter som ska skattas är samlade i vektorn β.
Nu låter skattar vi parametrarna som minsta kvadrat-lösningen till Y=Xβ.
![Page 47: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/47.jpg)
Formelsamlingen!
![Page 48: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/48.jpg)
En enkel tillämpning
Låt oss börja med ett intervall för β0. Även om det är ett omständligt sätt att skriva en enkel sak, gäller
Precis samma logik gäller för β1*, β2*,...,βp*.
![Page 49: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/49.jpg)
Age and weight are to be related to blood fat content.# D G Kleinbaum and L L Kupper,# Applied Regression Analysis and Other Multivariable Methods,# Duxbury Press, 1978, page 149.# Helmut Spaeth,# Mathematical Algorithms for Linear Regression,# Academic Press, 1991,# ISBN 0-12-656460-4.
![Page 50: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/50.jpg)
Beror blodfett på ålder och vikt?25 observationer. Data har laddats ned till:
![Page 51: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/51.jpg)
Alltid plotta!
![Page 52: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/52.jpg)
Skapa designmatrisen och (inte helt nödvändigt) Y
![Page 53: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/53.jpg)
Inversmatrisen och skattningarna av β
Kontroll att det stämmer:
![Page 54: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/54.jpg)
Residualkvadratsumman och s
![Page 55: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/55.jpg)
Man kan få ut diagonalelementen med diagDärför kan man få ut respektive gräns för konfidensintervallen på en enda rad:
Kontroll:
![Page 56: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/56.jpg)
TolkningVi satte vikt som första och ålder som andra förklarande variabel (kovariat).Detta tolkas som att ålder saknar betydelse för blodfett medan vikten har betydelse.
![Page 57: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/57.jpg)
Eftersom ålder inte ser ut att ha effekt reduceras modellen
![Page 58: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/58.jpg)
.. eller varför inte använda reggui?>> reggui(weight,bloodFat)
En vag misstanke om seriellt beroende, men vi struntar i det.
![Page 59: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/59.jpg)
På detta vis kan vi lösa följande uppgifter:
- 6.22 a, b och d- 6.26 a-e- 6.27 a-c
6.26
6.27
Ännu fattas vi en del för att lösa nedanstående
![Page 60: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/60.jpg)
Här är vad som fattas (ur formelsamlingen)
Vi kan också behöva det analoga prediktionsintervall som bara beskrivs i boken och inte står med i formelsamlingen:
![Page 61: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/61.jpg)
Truck-exemplet igen - omparametrisera
![Page 62: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/62.jpg)
En statistisk modellSkattningen av x0Tβ görs så här:
Ett konfidensintervall för det förväntade värdet när när x1=0.85 m/s och x2=0.75 ton.
![Page 63: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/63.jpg)
![Page 64: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/64.jpg)
Samma beräkningar för prediktionsintervall95 % CI: (0.41,0.49)
95 % PI: (0.38,0.51)
Med ett så litet datamaterial är det förväntat att felet i uppskattningen av parametrarna dominerar över felet i prediktionen.
![Page 65: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/65.jpg)
ResidualanalysÄr avvikelserna från modellen oberoende, likafördelade och rimligt normalfördelade?
![Page 66: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/66.jpg)
ResidualanalysNär vi har enkel linjär regression är det ett verkligt alternativ att plotta data och se hur bra modellen stämmer.
När vi har många förklarande variabler, faller den direkta undersökningen av grafen bort som alternativ, eftersom vi skulle behöva 3, 4 eller ännu fler dimensioner. (Tre är visserligen möjligt, men alls inte lika tilltalande som två.)
Valet faller därför på att studera residualerna, som är de verkliga y-värdenas avvikeler från modellens förutsägelser.
ri=yi-β0*-β1*x1i-...-βp*xpi
![Page 67: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/67.jpg)
Vi kan hämta (fast modifiera) strategin från reggui- Residualerna plottas mot sitt
ordningsnummer. Detta är ett sätt att upptäcka om mätprocessen glidit.
- Residualerna plottas mot varje kovariat. De får inte vara så att residualerna ser annorlunda ut för stora som för små kovariatvärden.
- Residualerna plottas mot de predikterade värdena. (Jag har föreslagit och fått igenom en ändring av reggui till nästa version.)
- Residualerna läggs i en normalfördelningsplot.
![Page 68: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/68.jpg)
Exempel med bussresande, ex 6.25(Jag passar på att få med lite om beroende mellan kovariater medan jag illustrerar regressionsanalys.)
addpath 'C:\Users\Oskar\Documents\undervisning\FMSF70\program\raknaMedVariation';
load Buss
y = resandel
X =[ones(length(resandel),1) avst restid ink bil]
plotmatrix([y X(:,2:end]))
![Page 69: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/69.jpg)
En första inspektion- Det mest slående är att den första (restid,
kolonn/rad 2) och den andra (avstånd, kolonn/rad 3) är starkt beroende. Surprise, surprise!
- Ett sätt att studera beroende på är genom att göra en korrelationsmatris:
![Page 70: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/70.jpg)
Anpassa först modellen- [b bint r] = regress(y,X)- Notera att varken den första eller den
andra kovariaten har signifikant effekt. Den första är ”närmast signifikans” och behålls.
- X =[ones(length(resandel),1) restid ink bil]-
1
2
![Page 71: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/71.jpg)
Två kovariater återstår>> X =[ones(length(resandel),1) restid ink] - Restiden är alltså en positivt korrelerat
med kollektivresande, vilket förvånar. Att inkomst har det förvånar mindre.
- Nu har vi en anpassad modell och kan studera hur väl den fungerar genom residualanalys.
- >> [b bint r] = regress(y,X)- Låt oss för omväxlings skulle börja med
normalfördelnigsplot.
>> normplot(r)
![Page 72: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/72.jpg)
Inga problem med normalfördelningen- Skulle det ha funnits problem, hade vi blivit
tvungna att fundera över att transformera data.
![Page 73: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/73.jpg)
Residualer mot ordningsnummer- scatter(1:length(r),r)- En vag tendens till avtagande ger viss
anledning till oro, men inget allvarligt.
![Page 74: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/74.jpg)
Residualer mot restid-
![Page 75: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/75.jpg)
Residualer mot inkomst- scatter(ink,r)- Det här kan tyda på att det finns faktorer
som vi inte hittat för områden med låg inkomst. Någon att ha i minnet för forskaren, men inget vi kan göra något åt här.
![Page 76: Multipel linjär regression · 2018. 10. 5. · Multipel kausalitet En aktuell fråga: Svårare fall av urinblåsecancer behandlas ofta med cystektomi, det vill säga att man opererar](https://reader036.vdocuments.mx/reader036/viewer/2022071423/611e2b27eb8d4109c55b0269/html5/thumbnails/76.jpg)
Residualer mot predikterade värden- scatter(X*b,r)- Några förutsäger om högt resande har
slagit rejält fel.- Standardfrasen ”Mer forsning behövs” kan
användas ….