biostatistiques et statistiques appliquées aux sciences ... · biostatistiques et statistiques...
TRANSCRIPT
Biostatistiques et statistiques appliquéesaux sciences expérimentales
ANOVA à deux facteurs
Pascal Bessonneau, Christophe Lalanne et Jérémie Mattout*
Cogmaster A4 2006-2007
p. 1/16
• Principes généraux des dessins expérimentaux multi-factoriels
• Modèle d’ANOVA à deux facteurs
• Notion d’intéraction
• Tableau d’ANOVA et tests
p. 2/16
Programme de la séance
• 2 types d’effet pour le facteur• effet fixe: les modalités du facteur sont choisies par l’expérimentateur (e.g. dose d’unproduit administré, durée de présentation d’une cible à l’écran)
• effet aléatoire: les modalités du facteur sont issues d’un processusd’échantillonnage (e.g. dose d’un produit administré, sujet)
• Conséquence à 2 niveaux:• au niveau de la formulation du modèle
• du point de vue des effets que l’on peut « généraliser » à la population parente
• Distinction entre 3 modèles d’ANOVA:• type I: modèle à effet(s) fixe(s)
• type II: modèle à effet(s) aléatoire(s)
• type III: modèle à effets mixtes
p. 3/16
Principes généraux
• Plan factoriel: plusieurs variables indépendantes/facteurs
• Cellule ou bloc: unité d’intersection entre les modalités de chaque facteur
• Plan équilibré: chaque cellule contient le même nombre d’observations(plus généralement: même nombre d’observations par cellule, de façon indépendante pour chaque modalité d’undes deux facteurs)
• Plan avec répétitions: chaque cellule contient plusieurs observations
• Mesures répétées: les mêmes sujets ont été utilisés pour les observationsau sein de différentes cellules (appariement)
p. 4/16
Principes généraux
Dans le cadre de plans factoriels équilibrés, on s’intéresse ici au cas général,avec répétitions et sans appariement (mesures non répétées).
• 2 facteurs A et B à 2 niveaux (groupes indépendants)
p. 5/16
a2b2a1b2b2
a2b1a1b1b1
a2a1
A
B
Principes généraux
• Notation: dessin expérimental 2x2
• Formulation:A + B (sans interaction)A + B + AxB (avec interaction)
• Interaction:modifications d’un effet principal du fait de la variabilité de l’autre facteur
• Modèle complet:
• moyenne générale
• écarts à la moyenne des moyennes de groupe pour le facteur A
• écarts à la moyenne des moyennes de groupe pour le facteur B
• écarts à la moyenne des moyennes pour les traitements A x B
• erreur (variance non expliquée ou résiduelle)p. 6/16
ijkijjiijky !"#$µ ++++= ),0(~ !" Nijk
µ
i!
j!
ij!
ijk!
Modèle d’ANOVA à 2 facteurs
• Hypothèses sous-jacentes- modèle linéaire
- les facteurs A et B agissent sur la moyenne de façon additive
- les données suivent une loi normale de variance (l’erreur expérimentale)
- les effets et des variantes des facteurs A et B sont certains (effets fixes)
• Conditions d’applications:
- indépendance des observations
- homogénéité des variances
- normalité des résidus
• Estimateurs sans biais des effets:
- pour
- pour
- pour
- pourp. 7/16
Modèle d’ANOVA à 2 facteurs
µ2
!
i!
j!
xm =
xxaii!=
xxb ji !=
jiijij baxxc !!!=
µ
i!
i!
ij!
p. 8/16
…Xijn………X22nX21n…X12nX11n
…………………………
…Xijk………X22kX21k…X12kX11k
…………………………
…Xij2………X222X212…X122X112
…Xij1………X221X211…X121X111
…bj…b2b1…b2b1…b2b1
ai ……a2a1
Modèle d’ANOVA à 2 facteurs
• Tableau des observations
• Notations
ijnij Xx 1=
inpi Xxb
1=
jnpj Xxa
1=
N
Xx =!! ==
j
ij
jk
ijki XxX
!! ==
i
i
ik
ijkj XxX
!=k
ijkij xX
!=ijk
ijkxX
• i: niveau de A ; j: niveau de B ; k: numéro d’observation
• n: nombre de répétitions ; N = npapb : nombre total d’observations
• ddl de la résiduelle obtenus par soustraction (ddlt – [ddla + ddlb + ddlc])p. 9/16
pb – 1Facteur B
pa – 1Facteur A
N – 1Totale
papb(n-1)Erreur
(pa – 1)(pb – 1)Inter. AxB
CMddlSCEVariation
( )! "=
i
iba xxnpSCE2
( )! "=
j
jab xxnpSCE2
( )! +""=
ij
jiijc xxxxnSCE2
!=ijk
ijkr eSCE 2
( )! "=
ijk
ijkt xxSCE2
Modèle d’ANOVA à 2 facteurs
1!=
a
aa
p
SCECM
1!=
b
bb
p
SCECM
( )( )11 !!=
ba
cc
pp
SCECM
( )1!=
npp
SCECM
ba
rr
p. 10/16
Modèle d’ANOVA à 2 facteurs
• Equation de l’analyse de la variance
rcbatSCESCESCESCESCE +++=
• Interprétation
- Indépendamment des effets principaux des facteurs et de leur interaction,CMe est une estimée de l’erreur σ2
- Si les αi sont nuls, CMa est une estimation de σ2, indépendante de CMe
- Si les βj sont nuls, CMb est une estimation de σ2, indépendante de CMe
- Si les γij sont nuls, CMc est une estimation de σ2, indépendante de CMe
3 Hypothèses à tester grâce à la statistique de 3 Hypothèses à tester grâce à la statistique de Fisher-SnedecorFisher-Snedecor::ll’’interaction doit être testée avant les effets principaux!interaction doit être testée avant les effets principaux!
p. 11/16
Notion d’interaction
A1 A2
B2
B1
Pas d’interaction
A1 A2 A1 A2
Interaction croisée Interaction ordonnée
effet B
effet A
p. 12/16
Tests
• Tests: 3 hypothèses conduisant à trois estimées différentes de l’erreur résiduelle
- L’interaction ou effet d’ordre 2 (A x B) H0: pas d’interaction ; H1: interaction⇔ cas 2x2 H0:
- L’effet principal du facteur A H0: αi = 0 ∀ i ; H1: ∃ i tq. αi ≠ 0⇔ cas 2x2 H0:
- L’effet principal du facteur B H0: βj = 0 ∀ j ; H1: ∃ j tq. βj ≠ 0⇔ cas 2x2 H0:
• Statistiques associées
- Interaction A x B: est comparé à la valeur critique
- Effet principal A: est comparé à la valeur critique
- Effet principal B: est comparé à la valeur critique
22211211xxxx !=!
.2.1xx =
2.1.xx =
e
c
cCM
CMF =
( )( ) )]1(,11[1 !!!!
nppppF baba"
e
a
aCM
CMF =
( ) )]1(,1[1 !!!
npppF baa"
e
b
bCM
CMF =
( ) )]1(,1[1 !!!
npppF bab"
On On distinguedistingue les les deuxdeux cascas possiblespossibles……
p. 13/16
Tests
• L’interaction n’est pas significative
Les effet de A et de B sont dits « purs » et on peut supprimer le termed’interaction du modèle qui se restreint alors à:
et l’erreur expérimentale est estimée par:
ce qui conduit à un test plus puissant des effets principaux.
• Si de plus, l’effet principal du facteur A (ou B) se révèle non significatif, l’effetdu facteur B pourra être estimé par le modèle simplifié:
ijkjiijky !"#µ +++=
1+!!
!!=
ba
batr
ppN
SCESCESCECM
ijkjijky !"µ ++=
p. 14/16
Tests
• L’interaction est significative
- Cela signifie que l’effet du facteur A n’est pas le même selon lesmodalités du facteur B
- Si les deux effets principaux sont significatifs, pas de problème.
- Si un seul des effets principaux est significatifs (e.g. A), il fautanalyser les données sur chacun des niveaux de l’autre facteur (B):on parle d’effets simples pour A.
- Il se peut que seule l’interaction soit significative⇔
En moyenne et pour le domaine expérimental considéré, les effets de A et de B s’annulent.
- Effets principaux
effet A =
effet B =
- Effets simples
effet A|B1 =
effet A|B2 =
- Effet d’interaction
Interaction croiséeInteraction croisée: l’effet du facteur A s’inverse en fonction des niveauxdu facteur B, e.g. et
Interaction ordonnéeInteraction ordonnée: l’effet du facteur A est consistant quelque soit le niveau du facteur B, e.g.
p. 15/16
Tests
• Analyse des effets
22
12112221xxxx !
=!
22
21112212xxxx !
=!
1121xx !
1222xx !
2111xx <
2212xx >
jxx jj !>21
- Même principe que pour les plans à un facteur
- Attention: le nombre total de paires de moyennes est
p. 16/16
Tests
• Comparaisons multiples
( )2
1!baba pppp