on a deux variables quantitatives. on cherche sil y a un lien entre les 2 variables
TRANSCRIPT
On a deux variables quantitatives.
On cherche s’il y a un lien entre les 2 variables
1. Garçons ou filles : qui réussi le mieux au bac ?
2. Cigarette et cancer : y a t il un lien ?3. Prévention routière : moins d’accident chez
les verbalisés ?
Autre formulation :
1. Y a t il un lien entre sexe et réussite au bac ?2. Y a t il un lien entre cancer et cigarette ?3. Y a t il un lien entre accident et
verbalisation ?
H0 : il n’y a pas de lien entre la variable sexe et la variable résultat.
EffectifAdmis Garçon 10Admis Fille 42Refusé Garçon 5Refusé Fille 18
Garçons FillesRefusés 5 18Admis 10 42
Résultat SexeIsabelle Ref FSylvain Adm GLucie Adm Fjean Ref GZoé Adm F… … …
Données brutesTableau des effectifs
Tableau croisé
Garçons FillesRefusés 5 18Admis 10 42
Garçons FillesRefusés 50 10Admis 50 70
Garçons FillesRefusés 30 15Admis 30 15
Dans notre lycée :
Pas de différenceH0 n’est pas rejetable
Différence énorme On rejette H0
Variabilité biologique ?Différence significative ?
On veut un indice qui reflète les disparités de notre tableau.
On veut qu’il soit grand pour
et petit pour :
Garçons FillesRefusés 50 10Admis 50 70
Garçons FillesRefusés 30 15Admis 30 15
Pour le calculer :1. Tableau des effectifs observés (tableau
croisé) 2. Tableau des effectifs attendus3. Tableau des écarts4. Tableau des écarts au carré et pondérés5. 2
Garçons Filles TotalRefusés 5 18 23Admis 10 42 52Total 15 60 75
Résultats
Pour chaque case : effectif attendu = total colonne x total ligne
total généralGarçons Filles Total
Refusés 23Admis 52Total 15 60 75
Garçons Filles TotalRefusés 15x23/75 6x23/75 23Admis 15x52/75 60x52/75 52Total 15 60 75
Garçons Filles TotalRefusés 4,6 18,4 23Admis 10,4 41,6 52Total 15 60 75
Totaux
Calcul par case
Pour chaque case : écart brut = effectifs observés – effectifs
attendus
–
=
Effectifs attendusEffectifs observés
Tableau des écarts bruts
Garçons FillesRefusés 4,6 18,4Admis 10,4 41,6
Garçons FillesRefusés 5 18Admis 10 42
Garçons FillesRefusés 0,4 -0,4Admis -0,4 0,4
Pour chaque case : Écart au carré pondéré =
Garçons Filles
Refusés (0,4)2/4,6 (-0,4)2/18,4
Admis (-0,4)2/10,4 (0,4)2/41,6
(écart brut)2
effectif attendu
Garçons FillesRefusés 0,035 0,009Admis 0,015 0,004
Le 2 est la somme des écarts au carré pondérés
2 = (Écart au carré pondéré)
2 =0,035+0,015+0,009+0,004=0,63
Garçons FillesRefusés 0,035 0,009Admis 0,015 0,004
Y a t il un lien entre couleur des yeux et des cheveux ?
H0 : il n’y a pas de lien entre la couleur des yeux et celle des cheveux
CheveuxBlond Bruns Noir Roux Total
Bleus 25 9 3 7 44
Yeux Vert 13 17 10 7 47
Marron 7 13 8 5 33Total 45 39 21 19 124
CheveuxBlond Bruns Noir Roux Total
Bleus 44
Yeux Vert 47
Marron 33Total 45 39 21 19 124
CheveuxBlond Bruns Noir Roux Total
Bleus 16,0 13,8 7,5 6,7 44
Yeux Vert 17,1 14,8 8,0 7,2 47
Marron 12,0 10,4 5,6 5,1 33
Total 45 39 21 19 124
Pour chaque case : effectif attendus = total colonne x total ligne
total général
Pour chaque case : écart brut = effectif observé – effectif
attendu
–
=
Effectifs attendusEffectifs observés
Tableau des écarts bruts
Blond Bruns Noir RouxBleus 25 9 3 7
Vert 13 17 10 7
Marron 7 13 8 5
Blond Bruns Noir RouxBleus 16,0 13,8 7,5 6,7
Vert 17,1 14,8 8,0 7,2
Marron 12,0 10,4 5,6 5,1
Blond Bruns Noir RouxBleus 9,0 -4,8 -4,5 0,3Vert -4,1 2,2 2,0 -0,2
Marron -5,0 2,6 2,4 -0,1
Pour chaque case : Ecart au carré pondéré = (écart brut)2
effectif attendu
Blond Bruns Noir Roux
Bleus (9,0)2/16,0 (-4,8)2/13,8 (-4,5)2/7,5 (0,3)2/6,7
Vert (-4,1)2/17,1 (2,2)2/14,8 (2,0)2/8,0 (-0,2)2/7,2
Marron (-5,0)2/12,0 (2,6)2/10,4 (2,4)2/5,6 (-0,1)2/5,1
Blond Bruns Noir RouxBleus 5,11 1,69 2,66 0,01Vert 0,96 0,33 0,52 0,01
Marron 2,07 0,66 1,04 0,00
2 = (écart au carré pondéré)
2 = 5,11+1,69+2,66+0,01+
0,96+0,33+0,52+0,01+
2,07+0,66+1,04+0,00 = 15,05
Blond Bruns Noir RouxBleus 5,11 1,69 2,66 0,01Vert 0,96 0,33 0,52 0,01
Marron 2,07 0,66 1,04 0,00
2Obs
=(effectifs observés – effectifs théoriques)2
effectif théorique
Quand un 2 est-il grand ?
A B C D ETrès grand 0,3 0,2 0,3 0,2 0,1Grand 0,2 0,1 0,1 0,1 0,3Moyen 0,3 0,3 0,2 0,3 0,1Petit 0,1 0,3 0,1 0,2 0,3Très petit 0,2 0,2 0,3 0,3 0,2
Homme FemmeAdmis 0,2 0,1Refusé 0,1 2,2
2=2,6 2=5,3
DDL=Degrés de liberté
DDL=(Nombre de colonnes-1)x(Nombre de lignes-1)
DDL = (2-1)x(2-1) = 1 DDL=(4-1)x(3-1) = 6 Blond Bruns Noir Roux
Bleus 16,0 13,8 7,5 6,7
Vert 17,1 14,8 8,0 7,2
Marron 12,0 10,4 5,6 5,1
Garçons FillesRefusés 5 18Admis 10 42
R : chisq.test(effectifs Observés)
χ2 1 2 3 4 5 6 7 8 9 10 11 12 130,00 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00%
0,50 47,95% 77,88% 91,89% 97,35% 99,21% 99,78% 99,94% 99,99% 100,00% 100,00% 100,00% 100,00% 100,00%
1,00 31,73% 60,65% 80,13% 90,98% 96,26% 98,56% 99,48% 99,82% 99,94% 99,98% 99,99% 100,00% 100,00%
1,50 22,07% 47,24% 68,23% 82,66% 91,31% 95,95% 98,23% 99,27% 99,71% 99,89% 99,96% 99,99% 100,00%
2,00 15,73% 36,79% 57,24% 73,58% 84,91% 91,97% 95,98% 98,10% 99,15% 99,63% 99,85% 99,94% 99,98%
2,50 11,38% 28,65% 47,53% 64,46% 77,65% 86,85% 92,71% 96,17% 98,09% 99,09% 99,58% 99,82% 99,92%
3,00 8,33% 22,31% 39,16% 55,78% 70,00% 80,88% 88,50% 93,44% 96,43% 98,14% 99,07% 99,55% 99,79%
3,50 6,14% 17,38% 32,08% 47,79% 62,34% 74,40% 83,52% 89,92% 94,11% 96,71% 98,23% 99,09% 99,54%
4,00 4,55% 13,53% 26,15% 40,60% 54,94% 67,67% 77,98% 85,71% 91,14% 94,73% 96,99% 98,34% 99,12%
4,50 3,39% 10,54% 21,23% 34,25% 47,99% 60,93% 72,07% 80,94% 87,55% 92,20% 95,29% 97,26% 98,46%
5,00 2,53% 8,21% 17,18% 28,73% 41,59% 54,38% 66,00% 75,76% 83,43% 89,12% 93,12% 95,80% 97,52%
5,50 1,90% 6,39% 13,86% 23,97% 35,79% 48,15% 59,92% 70,30% 78,87% 85,54% 90,46% 93,92% 96,25%
Probabilité qu'il n'y ait pas de lien entre les deux variables
DDL
χ2
2=2,6DDL=1p=0,11
2=5,3DDL=6p=0,51
Sexe / Réussite :
2Obs=0,63 et DDL=1
P=0.11
On ne peut pas rejeter H0,
Il n’y a pas de lien entre Sexe et Réussite
C. Cheveux / C. Yeux :
2Obs=15,05 et DDL=6
P=0,0167
On peut rejeter H0,
Il y a un lien entre C. Cheveux et C. Yeux
>5%
<5%
Écarts au carré pondérés
Parce que Blond / Bleus = 5,11 et que Noir / Bleus = 2,66 Ces deux cases « apportent » beaucoup au 2
Blond Bruns Noir RouxBleus 5,11 1,69 2,66 0,01Vert 0,96 0,33 0,52 0,01
Marron 2,07 0,66 1,04 0,00
Cases qui apportent beaucoup : Sur le tableau des écarts au carré pondéré
Apport positif ou négatifs ? Sur le tableau des écarts, Blonds / Bleus = + 9 : il y en a
beaucoup.
On dit qu’ils sont
sur-représentés
Sur le tableau des écarts, Noirs / Bleus = - 4,5 : il en manque beaucoup.
On dit qu’ils sont
sous-représentés
Blond Bruns Noir RouxBleus 9,0 -4,8 -4,5 0,3Vert -4,1 2,2 2,0 -0,2
Marron -5,0 2,6 2,4 -0,1
Blond Bruns Noir RouxBleus 5,11 1,69 2,66 0,01Vert 0,96 0,33 0,52 0,01
Marron 2,07 0,66 1,04 0,00
Écarts au carré pondérés Écarts