![Page 1: Chapitre 17 - MOOC€¦ · Chapitre 17. Pr. Bruno Falissard ... Number of Fisher Scoring iterations: 4. ... –Variables catégorielles à plus de 2 classes (prof),](https://reader034.vdocuments.mx/reader034/viewer/2022042513/5b9a6b7209d3f2dc2b8d9621/html5/thumbnails/1.jpg)
Pr. Bruno Falissard
Régression logistique avecplusieurs variables explicative
Introduction à la statistique avec R
Chapitre 17
![Page 2: Chapitre 17 - MOOC€¦ · Chapitre 17. Pr. Bruno Falissard ... Number of Fisher Scoring iterations: 4. ... –Variables catégorielles à plus de 2 classes (prof),](https://reader034.vdocuments.mx/reader034/viewer/2022042513/5b9a6b7209d3f2dc2b8d9621/html5/thumbnails/2.jpg)
Pr. Bruno Falissard
Introduction à la statistique avec R > La régression logistique
Plusieurs variables explicatives
𝐿𝑜𝑔𝑝 ℎ. 𝑟. 𝑑𝑒 𝑠𝑢𝑖𝑐𝑖𝑑𝑒
1 − 𝑝 ℎ. 𝑟. 𝑑𝑒 𝑠𝑢𝑖𝑐𝑖𝑑𝑒= 𝑎 + 𝑏 × 𝑑𝑢𝑟𝑒𝑒 + 𝑐 × 𝑑𝑖𝑠𝑐𝑖𝑝 + 𝑑 × 𝑎𝑏𝑢𝑠
![Page 3: Chapitre 17 - MOOC€¦ · Chapitre 17. Pr. Bruno Falissard ... Number of Fisher Scoring iterations: 4. ... –Variables catégorielles à plus de 2 classes (prof),](https://reader034.vdocuments.mx/reader034/viewer/2022042513/5b9a6b7209d3f2dc2b8d9621/html5/thumbnails/3.jpg)
Pr. Bruno Falissard
Introduction à la statistique avec R > La régression logistique
Plusieurs variables explicatives
𝐿𝑜𝑔𝑝 ℎ. 𝑟. 𝑑𝑒 𝑠𝑢𝑖𝑐𝑖𝑑𝑒
1 − 𝑝 ℎ. 𝑟. 𝑑𝑒 𝑠𝑢𝑖𝑐𝑖𝑑𝑒= 𝑎 + 𝑏 × 𝑑𝑢𝑟𝑒𝑒 + 𝑐 × 𝑑𝑖𝑠𝑐𝑖𝑝 + 𝑑 × 𝑎𝑏𝑢𝑠
> mod2 <- glm(suicide.hr~abus+discip+duree, data=smp.l, family="binomial")
> summary(mod2)
Call:
glm(formula = suicide.hr ~ abus + discip + duree, family = "binomial",
data = smp.l)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.3200 -0.6655 -0.6012 -0.4997 2.0700
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.02462 0.49635 -0.050 0.960439
abus 0.62289 0.22764 2.736 0.006213 **
discip 0.52809 0.23767 2.222 0.026287 *
duree -0.39862 0.11723 -3.400 0.000673 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 555.94 on 549 degrees of freedom
Residual deviance: 533.26 on 546 degrees of freedom
(249 observations deleted due to missingness)
AIC: 541.26
Number of Fisher Scoring iterations: 4
![Page 4: Chapitre 17 - MOOC€¦ · Chapitre 17. Pr. Bruno Falissard ... Number of Fisher Scoring iterations: 4. ... –Variables catégorielles à plus de 2 classes (prof),](https://reader034.vdocuments.mx/reader034/viewer/2022042513/5b9a6b7209d3f2dc2b8d9621/html5/thumbnails/4.jpg)
Pr. Bruno Falissard
Introduction à la statistique avec R > La régression logistique
Plusieurs variables explicatives
𝐿𝑜𝑔𝑝 ℎ. 𝑟. 𝑑𝑒 𝑠𝑢𝑖𝑐𝑖𝑑𝑒
1 − 𝑝 ℎ. 𝑟. 𝑑𝑒 𝑠𝑢𝑖𝑐𝑖𝑑𝑒= 𝑎 + 𝑏 × 𝑑𝑢𝑟𝑒𝑒 + 𝑐 × 𝑑𝑖𝑠𝑐𝑖𝑝 + 𝑑 × 𝑎𝑏𝑢𝑠
> mod2 <- glm(suicide.hr~abus+discip+duree, data=smp.l, family="binomial")
> summary(mod2)
Call:
glm(formula = suicide.hr ~ abus + discip + duree, family = "binomial",
data = smp.l)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.3200 -0.6655 -0.6012 -0.4997 2.0700
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.02462 0.49635 -0.050 0.960439
abus 0.62289 0.22764 2.736 0.006213 **
discip 0.52809 0.23767 2.222 0.026287 *
duree -0.39862 0.11723 -3.400 0.000673 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 555.94 on 549 degrees of freedom
Residual deviance: 533.26 on 546 degrees of freedom
(249 observations deleted due to missingness)
AIC: 541.26
Number of Fisher Scoring iterations: 4
![Page 5: Chapitre 17 - MOOC€¦ · Chapitre 17. Pr. Bruno Falissard ... Number of Fisher Scoring iterations: 4. ... –Variables catégorielles à plus de 2 classes (prof),](https://reader034.vdocuments.mx/reader034/viewer/2022042513/5b9a6b7209d3f2dc2b8d9621/html5/thumbnails/5.jpg)
Pr. Bruno Falissard
Introduction à la statistique avec R > La régression logistique
Plusieurs variables explicatives
𝐿𝑜𝑔𝑝 ℎ. 𝑟. 𝑑𝑒 𝑠𝑢𝑖𝑐𝑖𝑑𝑒
1 − 𝑝 ℎ. 𝑟. 𝑑𝑒 𝑠𝑢𝑖𝑐𝑖𝑑𝑒= 𝑎 + 𝑏 × 𝑑𝑢𝑟𝑒𝑒 + 𝑐 × 𝑑𝑖𝑠𝑐𝑖𝑝 + 𝑑 × 𝑎𝑏𝑢𝑠
> mod2 <- glm(suicide.hr~abus+discip+duree, data=smp.l, family="binomial")
> summary(mod2)
Call:
glm(formula = suicide.hr ~ abus + discip + duree, family = "binomial",
data = smp.l)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.3200 -0.6655 -0.6012 -0.4997 2.0700
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.02462 0.49635 -0.050 0.960439
abus 0.62289 0.22764 2.736 0.006213 **
discip 0.52809 0.23767 2.222 0.026287 *
duree -0.39862 0.11723 -3.400 0.000673 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 555.94 on 549 degrees of freedom
Residual deviance: 533.26 on 546 degrees of freedom
(249 observations deleted due to missingness)
AIC: 541.26
Number of Fisher Scoring iterations: 4
![Page 6: Chapitre 17 - MOOC€¦ · Chapitre 17. Pr. Bruno Falissard ... Number of Fisher Scoring iterations: 4. ... –Variables catégorielles à plus de 2 classes (prof),](https://reader034.vdocuments.mx/reader034/viewer/2022042513/5b9a6b7209d3f2dc2b8d9621/html5/thumbnails/6.jpg)
Pr. Bruno Falissard
Introduction à la statistique avec R > La régression logistique
Plusieurs variables explicatives
𝐿𝑜𝑔𝑝 ℎ. 𝑟. 𝑑𝑒 𝑠𝑢𝑖𝑐𝑖𝑑𝑒
1 − 𝑝 ℎ. 𝑟. 𝑑𝑒 𝑠𝑢𝑖𝑐𝑖𝑑𝑒= 𝑎 + 𝑏 × 𝑑𝑢𝑟𝑒𝑒 + 𝑐 × 𝑑𝑖𝑠𝑐𝑖𝑝 + 𝑑 × 𝑎𝑏𝑢𝑠
> mod2 <- glm(suicide.hr~abus+discip+duree, data=smp.l, family="binomial")
> summary(mod2)
Call:
glm(formula = suicide.hr ~ abus + discip + duree, family = "binomial",
data = smp.l)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.3200 -0.6655 -0.6012 -0.4997 2.0700
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.02462 0.49635 -0.050 0.960439
abus 0.62289 0.22764 2.736 0.006213 **
discip 0.52809 0.23767 2.222 0.026287 *
duree -0.39862 0.11723 -3.400 0.000673 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 555.94 on 549 degrees of freedom
Residual deviance: 533.26 on 546 degrees of freedom
(249 observations deleted due to missingness)
AIC: 541.26
Number of Fisher Scoring iterations: 4
![Page 7: Chapitre 17 - MOOC€¦ · Chapitre 17. Pr. Bruno Falissard ... Number of Fisher Scoring iterations: 4. ... –Variables catégorielles à plus de 2 classes (prof),](https://reader034.vdocuments.mx/reader034/viewer/2022042513/5b9a6b7209d3f2dc2b8d9621/html5/thumbnails/7.jpg)
Pr. Bruno Falissard
Introduction à la statistique avec R > La régression logistique
Plusieurs variables explicatives
𝐿𝑜𝑔𝑝 ℎ. 𝑟. 𝑑𝑒 𝑠𝑢𝑖𝑐𝑖𝑑𝑒
1 − 𝑝 ℎ. 𝑟. 𝑑𝑒 𝑠𝑢𝑖𝑐𝑖𝑑𝑒= 𝑎 + 𝑏 × 𝑑𝑢𝑟𝑒𝑒 + 𝑐 × 𝑑𝑖𝑠𝑐𝑖𝑝 + 𝑑 × 𝑎𝑏𝑢𝑠
> mod2 <- glm(suicide.hr~abus+discip+duree, data=smp.l, family="binomial")
> summary(mod2)
Call:
glm(formula = suicide.hr ~ abus + discip + duree, family = "binomial",
data = smp.l)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.3200 -0.6655 -0.6012 -0.4997 2.0700
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.02462 0.49635 -0.050 0.960439
abus 0.62289 0.22764 2.736 0.006213 **
discip 0.52809 0.23767 2.222 0.026287 *
duree -0.39862 0.11723 -3.400 0.000673 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 555.94 on 549 degrees of freedom
Residual deviance: 533.26 on 546 degrees of freedom
(249 observations deleted due to missingness)
AIC: 541.26
Number of Fisher Scoring iterations: 4
Codageabus : « 1 » oui, « 0 » nondiscip : « 1 » oui, « 0 » nonduree : 1 à 5 (gradation)
![Page 8: Chapitre 17 - MOOC€¦ · Chapitre 17. Pr. Bruno Falissard ... Number of Fisher Scoring iterations: 4. ... –Variables catégorielles à plus de 2 classes (prof),](https://reader034.vdocuments.mx/reader034/viewer/2022042513/5b9a6b7209d3f2dc2b8d9621/html5/thumbnails/8.jpg)
Pr. Bruno Falissard
Introduction à la statistique avec R > La régression logistique
Plusieurs variables explicatives
> mod2 <- glm(suicide.hr~abus+discip+duree, data=smp.l, family="binomial")
> summary(mod2)
Call:
glm(formula = suicide.hr ~ abus + discip + duree, family = "binomial",
data = smp.l)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.3200 -0.6655 -0.6012 -0.4997 2.0700
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.02462 0.49635 -0.050 0.960439
abus 0.62289 0.22764 2.736 0.006213 **
discip 0.52809 0.23767 2.222 0.026287 *
duree -0.39862 0.11723 -3.400 0.000673 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 555.94 on 549 degrees of freedom
Residual deviance: 533.26 on 546 degrees of freedom
(249 observations deleted due to missingness)
AIC: 541.26
Number of Fisher Scoring iterations: 4
> exp(coefficients(mod2))
(Intercept) abus discip duree
0.9756803 1.8643147 1.6956873 0.6712485
Codageabus : « 1 » oui, « 0 » nondiscip : « 1 » oui, « 0 » nonduree : 1 à 5 (gradation)
![Page 9: Chapitre 17 - MOOC€¦ · Chapitre 17. Pr. Bruno Falissard ... Number of Fisher Scoring iterations: 4. ... –Variables catégorielles à plus de 2 classes (prof),](https://reader034.vdocuments.mx/reader034/viewer/2022042513/5b9a6b7209d3f2dc2b8d9621/html5/thumbnails/9.jpg)
Pr. Bruno Falissard
• Ce qui change peu ou pas avec le chapitre sur la
régression linéaire
– Variables catégorielles à plus de 2 classes (prof),
Introduction à la statistique avec R > La régression logistique
Incidentes
![Page 10: Chapitre 17 - MOOC€¦ · Chapitre 17. Pr. Bruno Falissard ... Number of Fisher Scoring iterations: 4. ... –Variables catégorielles à plus de 2 classes (prof),](https://reader034.vdocuments.mx/reader034/viewer/2022042513/5b9a6b7209d3f2dc2b8d9621/html5/thumbnails/10.jpg)
Pr. Bruno Falissard
• Ce qui change peu ou pas avec le chapitre sur la
régression linéaire
– Variables catégorielles à plus de 2 classes (prof),
– drop1(mod1, .~., test="Chisq"),
Introduction à la statistique avec R > La régression logistique
Incidentes
![Page 11: Chapitre 17 - MOOC€¦ · Chapitre 17. Pr. Bruno Falissard ... Number of Fisher Scoring iterations: 4. ... –Variables catégorielles à plus de 2 classes (prof),](https://reader034.vdocuments.mx/reader034/viewer/2022042513/5b9a6b7209d3f2dc2b8d9621/html5/thumbnails/11.jpg)
Pr. Bruno Falissard
• Ce qui change peu ou pas avec le chapitre sur la
régression linéaire
– Variables catégorielles à plus de 2 classes (prof),
– drop1(mod1, .~., test="Chisq"),
– Interaction (smp.l$duree*smp.l$discip)
Introduction à la statistique avec R > La régression logistique
Incidentes
![Page 12: Chapitre 17 - MOOC€¦ · Chapitre 17. Pr. Bruno Falissard ... Number of Fisher Scoring iterations: 4. ... –Variables catégorielles à plus de 2 classes (prof),](https://reader034.vdocuments.mx/reader034/viewer/2022042513/5b9a6b7209d3f2dc2b8d9621/html5/thumbnails/12.jpg)
Pr. Bruno Falissard
• Conditions de validité de la régression logistique
Introduction à la statistique avec R > La régression logistique
Conditions de validité
![Page 13: Chapitre 17 - MOOC€¦ · Chapitre 17. Pr. Bruno Falissard ... Number of Fisher Scoring iterations: 4. ... –Variables catégorielles à plus de 2 classes (prof),](https://reader034.vdocuments.mx/reader034/viewer/2022042513/5b9a6b7209d3f2dc2b8d9621/html5/thumbnails/13.jpg)
Pr. Bruno Falissard
• Conditions de validité de la régression logistique
« Au moins 5-10 évènements par variable explicative »
Introduction à la statistique avec R > La régression logistique
Conditions de validité
![Page 14: Chapitre 17 - MOOC€¦ · Chapitre 17. Pr. Bruno Falissard ... Number of Fisher Scoring iterations: 4. ... –Variables catégorielles à plus de 2 classes (prof),](https://reader034.vdocuments.mx/reader034/viewer/2022042513/5b9a6b7209d3f2dc2b8d9621/html5/thumbnails/14.jpg)
Pr. Bruno Falissard
• Conditions de validité de la régression logistique
« Au moins 5-10 évènements par variable explicative »
– Fichier « smp.l » : 799 détenus
– Variable à expliquer : « forme sévère de schizophrénie » : 54 détenus
Introduction à la statistique avec R > La régression logistique
Conditions de validité
![Page 15: Chapitre 17 - MOOC€¦ · Chapitre 17. Pr. Bruno Falissard ... Number of Fisher Scoring iterations: 4. ... –Variables catégorielles à plus de 2 classes (prof),](https://reader034.vdocuments.mx/reader034/viewer/2022042513/5b9a6b7209d3f2dc2b8d9621/html5/thumbnails/15.jpg)
Pr. Bruno Falissard
• Conditions de validité de la régression logistique
« Au moins 5-10 évènements par variable explicative »
– Fichier « smp.l » : 799 détenus
– Variable à expliquer : « forme sévère de schizophrénie » : 54 détenus
– Variables explicatives : age, trauma, prof
Introduction à la statistique avec R > La régression logistique
Conditions de validité
![Page 16: Chapitre 17 - MOOC€¦ · Chapitre 17. Pr. Bruno Falissard ... Number of Fisher Scoring iterations: 4. ... –Variables catégorielles à plus de 2 classes (prof),](https://reader034.vdocuments.mx/reader034/viewer/2022042513/5b9a6b7209d3f2dc2b8d9621/html5/thumbnails/16.jpg)
Pr. Bruno Falissard
• Conditions de validité de la régression logistique
« Au moins 5-10 évènements par variable explicative »
– Fichier « smp.l » : 799 détenus
– Variable à expliquer : « forme sévère de schizophrénie » : 54 détenus
– Variables explicatives : age (1), trauma (1), prof (7)
Introduction à la statistique avec R > La régression logistique
Conditions de validité
![Page 17: Chapitre 17 - MOOC€¦ · Chapitre 17. Pr. Bruno Falissard ... Number of Fisher Scoring iterations: 4. ... –Variables catégorielles à plus de 2 classes (prof),](https://reader034.vdocuments.mx/reader034/viewer/2022042513/5b9a6b7209d3f2dc2b8d9621/html5/thumbnails/17.jpg)
Pr. Bruno Falissard
• Conditions de validité de la régression logistique
« Au moins 5-10 évènements par variable explicative »
– Fichier « smp.l » : 799 détenus
– Variable à expliquer : « forme sévère de schizophrénie » : 54 détenus
– Variables explicatives : age, trauma, prof
– (1+1+7) × 10 = 90 ˃ 54 pas bon
Introduction à la statistique avec R > La régression logistique
Conditions de validité
![Page 18: Chapitre 17 - MOOC€¦ · Chapitre 17. Pr. Bruno Falissard ... Number of Fisher Scoring iterations: 4. ... –Variables catégorielles à plus de 2 classes (prof),](https://reader034.vdocuments.mx/reader034/viewer/2022042513/5b9a6b7209d3f2dc2b8d9621/html5/thumbnails/18.jpg)
Pr. Bruno Falissard
• Conditions de validité de la régression logistique
« Au moins 5-10 évènements par variable explicative »
– Fichier « smp.l » : 799 détenus
– Variable à expliquer : « forme sévère de schizophrénie » : 54 détenus
– Variables explicatives : age, trauma, prof
– (1+1+7) × 10 = 90 ˃ 54 pas bon
– (1+1+7) × 5 = 45 ˂ 54 OK mais franchement limite
Introduction à la statistique avec R > La régression logistique
Conditions de validité
![Page 19: Chapitre 17 - MOOC€¦ · Chapitre 17. Pr. Bruno Falissard ... Number of Fisher Scoring iterations: 4. ... –Variables catégorielles à plus de 2 classes (prof),](https://reader034.vdocuments.mx/reader034/viewer/2022042513/5b9a6b7209d3f2dc2b8d9621/html5/thumbnails/19.jpg)
Pr. Bruno Falissard
Introduction à la statistique avec R > La régression logistique
Conclusion
mod2 <- glm(suicide.hr~abus+discip+duree, data=smp.l,
family="binomial")
summary(mod2)
exp(coefficients(mod2))