statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/annexe...

44
Statistiques multivariées : aspects descriptifs et inférentiels Prof Bi I. Arsène ZORO (Agronome généticien) Biostatistiques Appliquées en Protection des Végétaux Formation thématique ProVeg (3-6 juillet 2015)

Upload: doannhi

Post on 16-Sep-2018

231 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

Statistiques multivariées :aspects descriptifs etinférentiels

Prof Bi I. Arsène ZORO (Agronome généticien)

Biostatistiques Appliquées en Protection des Végétaux

Formation thématique ProVeg (3-6 juillet 2015)

Page 2: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

2Programme du module 4

1. Analyse de la variance multivariée (MANOVA)

2. Analyse en Composante Principale (ACP)

3. Analyse Factorielle Discriminante (AFD)

Page 3: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

Chapitre 1Analyse de la variance multivariée

Modules 4 – Analyse multivariéeProf ZORO

Page 4: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

Plan du chapitre

1. Principes généraux2. MANOVA 1 pour deux échantillons indépendants3. MANOVA 1 pour plus de deux échantillons

indépendants

4

Page 5: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

5

La MANOVA un test statistique approprié quand l’analyse de lavariance (ANOVA) doit prendre en compte plus d’une variabledépendante.

L’objectif de la MANOVA est de savoir si les différences entre desgroupes, basées sur une combinaison de plusieurs variablesdépendantes ont une forte probabilité ou non d’être dues à uneerreur d’échantillonnage.

La MANOVA est un test multivarié (à ne pas confondre avec un testmultifactoriel), c’est à dire qu’elle explore plus de deux variablesdépendantes (VD) en rapport avec deux ou plus de deux variablesindépendantes (VI).

1 – Principes généraux

Page 6: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

6

La préférence à la réalisation de la MANOVA au lieu deplusieurs ANOVA peut s’expliquer par plusieurs raisons :o l’utilisation de plusieurs analyses univariées augmente le

risque α. Par exemple dans le cas de 10 variablesdépendantes, α avoisine 0,60 ;

o les tests univariés ne tiennent pas compte de lacorrélation entre variables dépendantes alors que laMANOVA le fait ;

o des différences systématiques mais petites entre groupesde variables indépendantes peuvent être individuellementnon significatives mais une MANOVA fait ressortir l’effetcumulatif.

Avantages de la MANOVA (/ ANOVA)

1 – Principes généraux

Page 7: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

7

La ou les variables indépendantes doit/doivent êtrecatégorielle(s), avec au moins deux groupes.

Les observations sont indépendantes.

Les échantillonnages sont aléatoires et simples.

Les variables dépendantes ont chacune une distributionnormale.

Il doit avoir une homogénéité de variance entre les groupes(vérifiée par le test de Levene).

Conditions d’application de la MANOVA

1 – Principes généraux

Page 8: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

8

La corrélation entre les variables dépendantes doit être lamême à travers les groupes.

Il doit avoir une corrélation entre les variables dépendantes ;si non il ne va pas avoir un effet multivarié (1 – R2 <= 0,30).

Il faut éviter un trop grand nombre de variables dépendantes(en fonction de la capacité du processeur de l’ordinateur).

Conditions d’application de la MANOVA

1 – Principes généraux

Page 9: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

9

Réalisation de la MANOVA

1 – Principes généraux

La méthode de calcul de la statistique du test est analogue àcelle de l'ANOVA, mais au lieu de considérer les sommes decarrés total (SCEt) factorielle (SCEa) et résiduelle (SCEr)pour la variable, on introduit les matrices totale T, factorielle Het résiduelle E.

Chacune de ces matrices est carrée d'ordre p, et symétrique.Pour chacune d'elles :o sur la diagonale, on retrouve les sommes de carrés

habituelles ;o en dehors de la diagonale, on trouve des sommes de

produits d'écarts.

Page 10: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

10

Réalisation de la MANOVA

1 – Principes généraux

On observe p variables dépendantes X1, X2, ..., Xp pourchacun des individus de chaque échantillon.

L'ANOVA à un facteur permet de tester l'égalité desmoyennes dans les populations parentes, pour chaquevariable dépendante prise isolément.

Mais la MANOVA, quant à elle, permet de tester l'égalité desvecteurs de moyennes dans les différentes populationsparentes.

La situation la plus simple est celle où on dispose de deuxniveaux de la variable indépendante (deux échantillonsindépendants).

Page 11: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

112 – MANOVA 1 pour deux échantillons

Les notifications suivantes peuvent être adoptées :o Population 1 : X11, X12, …, X1n1

o Population 2 : X21, X22, …, X2n2.

Ici, le vecteur Xij représente toutes les données pour detoutes les variables de l’échantillon j de la population i.

Ce vecteur contient les éléments Xijk où k varie de 1 à p, pourp différentes variables considérées dans l’analyse. Ainsi, Xijkest l’observation k effectuée sur l’individu j de la population i.

Page 12: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

122 – MANOVA 1 pour deux échantillons

On cherche à tester l’égalité des vecteurs de moyennes des deuxpopulations parentes, c’est à dire :

Cette hypothèse nulle peut être testé en utilisant le test statistiqueT2 de Hotelling pour deux échantillons. Il s’agit de la versionmultivariée du test t de Student pour échantillons indépendants. Ilest basé sur la formule :

Page 13: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

132 – MANOVA 1 pour deux échantillons

Pour des échantillons de grands effectifs, cette statistique suitapproximativement une distribution Khi-2 à p degrés de liberté (pétant le nombre de variables dépendantes).

Cependant, on peut transformer le T2 en F de Fisher Snedecor parl’expression suivante :

Cette statistique est à p et n1 + n2 – p degrés de liberté.

Page 14: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

142 – MANOVA 1 pour deux échantillons

Lorsqu’un test préliminaire tel que le test Box’s M amène à rejeterl’hypothèse de l’égalité des vecteurs de variances, une alternativeau test T2 peut être effectuée.

Dans ce contexte, le test proposé par Nel et van der Merwe (1986)donne des résultats satisfaisants.

Page 15: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

152 – MANOVA 1 pour deux échantillons

ApplicationA certain type of tropical disease is characterized by fever, low blood pressureand body aches. A pharmaceutical company is working on a new drug to treatthis type of disease and wanted to determine whether the drug is effective.They took a random sample of 20 people with this type of disease and 18 witha placebo. Based on the data they wanted to determine whether the drug iseffective at reducing these three symptoms.

Page 16: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

162 – MANOVA 1 pour deux échantillons

Fever(k=1)

Pressure(k=2)

Aches(k=3)

Fever(k=1)

Pressure(k=2)

Aches(k=3)

38,4 73 18 40,9 54 1436,8 85 14 39,5 75 18

40 58 20 39,4 57 2439,8 80 20 38,2 71 2438,6 68 25 39,7 65 2239,1 52 27 38,9 49 3038,9 79 26 38,6 58 2536,8 100 8 39,9 52 1740,4 64 21 41,3 62 1839,4 53 22 38,1 57 20

38 70 15 39,6 78 1938,6 75 14 37,1 92 1540,1 48 28 39,5 63 1338,1 57 22 40,3 52 2537,2 78 16 41,5 46 2739,5 65 18 39,3 56 1437,3 77 13 37,6 86 1639,1 67 16 40,6 48 2139,9 52 1037,8 68 13

Drug (i = 1) Placebo (i = 2)

Résultats du testn1 = 20n2 = 18p = 3T2 = 4,12F = 1,30P = 0,29

Page 17: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

173 – MANOVA 1 pour plus de 2 échantillons

Aspects descriptifs

La décomposition de la variance se fait de la même façon que cellede l’ANOVA1 :

On a donc affaire à des matrices de produits croisés au lieu dessommes de carrés total (SCEt) factorielle (SCEa) et résiduelle(SCEr) habituelles dans le cas univarié.

Page 18: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

183 – MANOVA 1 pour plus de 2 échantillons

Aspects descriptifs

L’équation de l’analyse de la variance multivariée à un facteur estdonc :o T (Total) : total des produits croisés des matrices des

sommes des carréso B (Between) : produits croisés des matrices des sommes

des carrés liés à la variables indépendante (facteur)o W : (Within) produits croisés des matrices des sommes

des carrés liés à la variation résiduelle

T = B + W

Page 19: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

193 – MANOVA 1 pour plus de 2 échantillons

Aspects inférentiels

Dans le cas du modèle fixe (modèle I), l’hypothèse nulle àlaquelle on s’intéresse est l’hypothèse d’égalité des matrices demoyennes :

Page 20: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

203 – MANOVA 1 pour plus de 2 échantillons

Aspects inférentiels

Sur cette base, on peut calculer une statistique similaire à F deFischer-Snedecor en divisant B par W, comme dans le cas del’ANOVA.

L’équivalent de cette quantité en termes de matrice est BW-1.On rejettera l’hypothèse nulle lorsque B trop grande par rapportà W.

Page 21: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

213 – MANOVA 1 pour plus de 2 échantillons

Aspects inférentiels

En MANOVA, quatre différents tests pour savoir si B est tropélevée, comparée à W :

o Hotelling-Lawley Trace : T2 = trace(HE-1). Appropriéquand la VI à deux nieaux ou modalités (deuxéchantillons).

o Pillai-Bartlett Trace : V = trace(H(H+E)-1). Appropriéquand les échantillons sont de même effectifs.

o Roy’s Largest Root : Θ = eigenvalues de (HE-1). Test leplus puissant mais très sensible aux violations.

o Wilk’s Lambda : Λ = . Approprié quand la VI à plus dedeux niveaux (modalités). C’est le test le plus untilisé.

Page 22: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

223 – MANOVA 1 pour plus de 2 échantillons

Aspects inférentiels

Sources de variation DL SSCP Statistique P

Différences entre échantillons p – 1 SSCPB

Différences entre observations n - p SSCPWTotaux n -1 SSCPT

Tableau de l’analyse de la variance à un critère de classification

Page 23: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

233 – MANOVA 1 pour plus de 2 échantillons

ApplicationDans le cadre d’une évaluation comparative de la productivité du manioc,on analyse chez trois variétés (Six mois, Boko et Yacé), trois variablesdépendantes : temps de maturation (Mat en mois), le rendement (Rdt entonnes par hectare) et le nombre de thalles (Tha). Les données sontprésentées dans le tableau ci-après.Peut-on dire que les deux premières variétés (Six mois et Bokou) ont desproductivités différentes ?

Six moisi = 1

Bokoui = 2

Yacéi = 3

Matk = 1

Rdtk = 2

Thak = 3

Matk = 1

Rdtk = 2

Thak = 3

Matk = 1

Rdtk = 2

Thak = 3

6 15 3 09 31 5 13 20 46 09 3 10 30 6 11 17 25 13 4 08 25 4 14 16 36 13 2 11 29 6 12 16 37 10 3 12 35 4 10 19 3

Page 24: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

Chapitre 2Analyse en Composante Principale (ACP)

Modules 4 – Analyse multivariéeProf ZORO

Page 25: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

Plan du chapitre

1. Principes généraux2. Réalisation de l’ACP3. Interprétation des résultats

25

Page 26: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

261 – Principes généraux

Objectif de l’ACP : décrire à l’aide de q < p composantes unmaximum de cette variabilité.

Ce qui permet :

o une réduction des données à q nouveaux descripteurs

o une visualisation des données à 2 ou 3 dimensions (si q= 2 ou 3)

o une interprétation des données (essentiellement lesliaisons inter-variables).

L’ACP est une étape intermédiaire souvent utilisée avantd’autre analyse.

Page 27: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

272 – Réalisation de l’ACP

Traitement des donnéeso Standardisation des données brutes (morphologiques)

o Analyse de corrélations entre variables (tolérance = 1- R2)

o Suppression de variables fortement corrélées à un trop grandnombre de variables.

Choisir le nombre q d’axes factoriels (ou de composantesprincipales) à retenir pour obtenir un résumé suffisammentprécis de l’information contenue dans le tableau initial.

Construire les graphiques (cercle de corrélation et ACP)

Donner une signification aux nouvelles variables.

Évaluer la qualité de ce résumé (éventuellement par d’autresanalyses).

Page 28: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

282 – Réalisation de l’ACP

Deux critères empiriques sont habituellement pris encompte :o Critère du coude : sur la courbe de distribution des valeurs

propres, on observe un décrochement (coude) suivi d’unedécroissance régulière. On sélectionne les axes avant ledécrochement

o Critère de Kaiser : on ne retient que les axes dont l’inertie estsupérieure à l’inertie moyenne I/p (un peu étroit).Kaiser en ACP normée : I/p= 1 : On ne retiendra que les axesassociés à des valeurs propres supérieures à 1

Choix du nombre d’axes à retenir

Page 29: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

292 – Réalisation de l’ACP

Choix du nombre d’axes à retenir

0

10

20

30

40

50

60

70

80

1 2 3 4 5 6

Coude

Page 30: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

302 – Réalisation de l’ACP

Construction des graphiques (nuages de points projetés)

Chaque nuage de points (variables et individus) est construiten projection sur les plans factoriels : un plan factoriel est unrepère du plan défini par deux des q axes factoriels retenus.

L’examen des plans factoriels permettra de visualiser lescorrélations entre les variables et d’identifier les groupesd’individus ayant pris des valeurs proches sur certainesvariables.

Mais avant de lire directement les graphiques il fautinterpréter les axes et s’assurer que la projection est fidèle ala réalité.

Page 31: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

313 – Interprétation des résultats

Deux type de facteurs peuvent être identifiés, selon l’effetdes variables :o Effet taille – Si les variables sont toutes du même coté d’un

l’axe cela veut dire qu’elles contribuent toutes dans le mêmesens à la formation de cet axe).

o Effet forme – Deux groupes de variables en positionsopposées peuvent être observés : celles qui contribuentpositivement à l’axe et celles qui contribuent négativement.

Page 32: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

32

Contribution des points (individus et variables) Pour chaque axe retenu et chaque nuage, on regarde :

o Quelles sont les variables qui participent le plus à la formationde l’axe.

o Quels sont les individus qui participent le plus à la formationde l’axe.

L’outil de mesure est la contribution des points (individus ou lesvariables) à l’inertie de l’axe. Ce sont les points dont la contributionest supérieure à la moyenne qui permettent de donner un sens àl’axe.L’interprétation des nouvelles variables (des axes factoriel) se feraà l’aide des individus et variables contribuant le plus à l’axe avec larègle suivante : si une variable a une forte contribution positive àl’axe, les individus ayant une forte contribution positive à l’axe sontcaractérisés par une valeur élevée de la variable.

3 – Interprétation des résultats

Page 33: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

33

Etude des proximités entre points (individus et variables) Cet examen qui porte surtout sur la qualité des proximités

permet :o de mettre en évidence des proximités éventuelles que l’on n’a

pas remarquées lors de l’interprétation des axes. On interprèteles proximités d’éléments bien représentés sur le plan factoriel;

o de repérer les points qui ne contribuent pas fortement àl’inertie de l’axe, mais qui sont bien représentés par cet axe,c'est-à-dire qui présentent des caractéristiques propres à l’axe.

3 – Interprétation des résultats

Page 34: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

34

Etude des proximités entre points (individus et variables) La proximité dans l’espace entre deux individus bien

représentés traduit la ressemblance réelle de ces deuxindividus du point de vue des valeurs prises par les variables.

La proximité entre deux variables sur un axe donne, si lesdeux variables sont bien représentées sur l’axe, uneapproximation de leur corrélation :o Deux variables proches sont corrélées positivement.

o Deux variables qui s’opposent sont corrélées négativement.

o Deux variables orthogonales sont non corrélées.

3 – Interprétation des résultats

Page 35: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

35

Exemple (Koffi et al., 2009)

3 – Interprétation des résultats

Page 36: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

363 – Interprétation des résultats

Exemple (Koffi et al., 2009)

Page 37: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

373 – Interprétation des résultats

Exemple (Koffi et al., 2009)

Page 38: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

383 – Interprétation des résultats

Exemple (Koffi et al., 2009)

Page 39: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

393 – Interprétation des résultats

Exemple (Tro, 2014)

Page 40: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

403 – Interprétation des résultats

Exemple (Tro, 2014)

Page 41: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

Chapitre 2Analyse Factorielle Discriminante (AFD)

Modules 4 – Analyse multivariéeProf ZORO

Page 42: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

42Principes généraux de l’AFD

L’analyse factorielle discriminante (AFD) est une méthodedescriptive et explicative, apparentée à l’analyse encomposantes principales (ACP), s’appliquant à des donnéesquantitatives sur lesquelles est déjà définie une typologie oupartition.

Le but de la méthode, comme en ACP, est de réduire lenombre de dimensions des données, en recherchant cellessuivant lesquelles les classes se séparent le mieux. Lesdirections factorielles discriminantes successives sontdéterminées, tandis que des graphiques factoriels planspermettent ici encore de visualiser les individus ou lesvariables.

Page 43: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

43Principes généraux de l’AFD

Divers indicateurs et tests sont également calculés, quipermettent de juger de l'intérêt et de la pertinence desrésultats obtenus :o Distance de Mahalanobis (D2) calculée entre les quatre

groupes issus des analyses factorielles. Significativeité testéepar Lamda de Wilk

o Test de classification correcte des individus (CAH)

Page 44: Statistiques multivariées : aspects descriptifs et ...proveg.org/attachments/article/103/ANNEXE 5_Stat_Multivariees.pdf · Statistiques multivariées : aspects descriptifs et inférentiels

44Principes généraux de l’AFD