master marketing / pierre desmet 1 analyse des données appliquée au marketing 3. expérimentation...

31
Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

Upload: leroy-laine

Post on 03-Apr-2015

119 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

Master MARKETING / Pierre Desmet 1

Analyse des donnéesappliquée au marketing

3. Expérimentation

Pierre DESMET

Page 2: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 2

Sommaire général

1. Introduction

2. Tests

3. Expérimentation et Analyse de Variance

4. Analyses factorielles et des similarités

5. Typologies et Segmentation

6. Régression logistique et Analyse discriminante

7. Mesure et Méthodes avancées

8. Régression

Page 3: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 3

3. Expérimentation et Analyse de variance

Expérimentation : faire varier de manière contrôlée une variable pour

mesurer son effet sur une autre Mesurer une relation causale

Plan d’expérience

Analyse des résultats Une variable à expliquer (métrique)

1 facteur contrôlé nominal : ANOVA Plusieurs facteurs ANOVA 1 facteur + covariable : ANCOVA

Plusieurs variables à expliquer (métriques) MANOVA MANCOVA

Page 4: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 4

Causalité et Expérimentation

On cherche à mettre en évidence une relation de cause à effet entre X et Y

Conditions à respecter pour établir la relation causale Variation concomitante (dx, dy) Séquence temporelle / Présence manipulée Élimination des autres causes possibles Indépendance (Orthogonalité) des variables dépendantes entre

elles

Quasi-expérimentation si pas d’affectation aléatoire des individus Exemple mesure Avant-après sur un seul groupe

Variables VI (indépendantes, X) VD (dépendante, Y)

VI manipulée (pack) ou VI invoquée (groupage des individus sur les modalités)

Page 5: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 5

Procédure

Définition de la question marketing : Quel est l’effet de la mention sur le pack sur les ventes du produit

?

Construction de la base théorique Les variables situationnelles :

Evaluatives : Attention, perception, préférence, choix Attitude (envers l’annonce, la marque,..) Valeur perçue, satisfaction, fidélité

Intermédiaires : risque perçu,

Les variables modératrices : Individuelles : genre, revenu, csp,… Psychologiques stables : aversion pour le risque,… Interactives : relation à la marque, implication produit,…

Page 6: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 6

Le modèle

Rédiger clairement les hypothèses pour pouvoir les rejeter H1 : La mention « sans colorant » accroît la préférence pour le pack

H1a M(sans) > M(avec) - H1b M(sans)<= M(avec) H2 : Plus la sensibilité à la présence de colorants est forte, plus l’effet de la

mention sur la préférence est élevé. H2a [M(sans,s+) - M(avec,s+) ] > [M(sans,s-) - M(avec,s-) ]

X Y X YZ

Relation de causalité Relation avec médiatrice

X Y

Z

Relation avec modératrice

+

Mention surLe pack

PréférencePour le pack

Sensibilitéaux colorants

Mention surLe pack

Naturalitéperçue

Sensibilitéaux colorants

PréférencePour le pack

Page 7: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 7

Construire un modèle utile

De la gauche vers la droite : le chemin de l’influence de X sur Y

Puis de la droite vers la gauche : les autres variables importantes qui peuvent influencer Y et qu’il

faut mesurer ou contrôler

Identifier Les hypothèses « validées » (par les connaissances, l’expérience,

le quali..) Les hypothèses « à valider »

Exemple : Maggi souhaite lancer un sachet de soupe déshydratée en 5

assiettes au lieu de 4 … Proposez un modèle

Page 8: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 8

Plan Inter ou Intra-sujets

Démarche Un échantillon représentatif : accent sur les relations et l’effet

Préférence pour le pack A versus B Des groupes différents : accent sur les modérateurs

Clients de la marque / versus concurrence

Comment éliminer les spécificités personnelles ? Neutraliser : affectation aléatoire à un groupe

Un groupe n’évalue qu’une option les groupes « identiques »

Contrôler par des mesures répétées Un seul groupe qui évalue les options Mais effet de la méthodologie (ordre de la présentation,..)

Page 9: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 9

Validité des résultats

Interne : Force de la conclusion Facteurs non pris en compte dans l’analyse

Le temps La répétition L’environnement Les mesures L’interaction des répondants avec la méthodologie La modification de l’échantillon (mortalité) L’affectation des répondants

Externe : Généralité de la conclusion Représentativité des répondants Représentativité-réalisme des stimulis Contexte expérimental

Page 10: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 10

Les causes possibles des variations

Il faut isoler ces effets

Traitement (E) Effet de la manipulation

Histoire (H) évolution de l’environnement

Contamination (I) Modification des réponses en fonction de la connaissance de l’objet de l’expérimentation (effet de demande)

Maturation (M) évolution des sujets (t, t+n)

Test (T) Changement des réponses, ou biais, provoqué par la mesure

Sélection (S) Variation dans la composition de l’échantillon : Auto-sélection; échantillonnage; non réponse

Instrumentation Changement dans l’instrument de mesure (enquêteur,…)

Régression statistique Présence de valeurs extrêmes; sélection successive en fonction de réponses précédentes

Mortalité Réduction de l’échantillon par le refus de participation : collecte contraignante

Page 11: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 11

Plans expérimentaux

Grandes classes Quasi-expérimental : Avant-Après Expérimental

Double affectation aléatoire des individus aux cellules ; des traitements aux cellules

Observation – Mesure Traitement

Quelles comparaisons Entre les groupes d’individus Entre les réponses d’un même groupe

Après seulement – Groupe de contrôle

Groupe 1 A X O1

Groupe 2 A O2Avant - Après – Groupe de contrôle

Groupe 1 A O1 X O2

Groupe 2 A O3 O4Solomon 4 groupes

Groupe 1 A O1 X O2

Groupe 2 A O3 O4

Groupe 3 A X O5

Groupe 4 A O6

A

O

X

Page 12: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 12

Mesure des effets

Source : Lambin JJ La recherce Marketing, McGraw Hill

X O1 ?

O1 X O2 O2-O1 E H I M (T) (S)

X O1

O2 O2-O1 E (T) (S)

O1 X O2 O2-O1 E H I M (T) (S)

O3 O4 O4-O3 H M (T) (S)

(O2-O1)-(O4-O3) E I

O1 X O2 D1= O2-O1 E H I M (T) (S)

O3 O4 D2= O4-O3 H M (T) (S)

X O5 D3= O5-(O2+O4)/2 E H (T) (S)

O6 D4= O6-(O2+O4)/2 H (S)

O6 D5= O6-O5 E (T) (S)

D4-D3 = E

D3-D5 = H

D1-D3-(D2-D4)

= I

D2-D4 = M

D4+D5-D3 = (T) (S)

Page 13: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 13

Plans statistiques

Mise en évidence de l’effet de plusieurs facteurs Effet du prix sur Des magasins de tailles différentes Situés dans des régions différentes

Plans Complet : toutes les possibilités

Permet de tester les effets d’interaction Fractionné : combinaison choisie des modalités

Moins de cellules donc gourmand en effectifs

Page 14: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 14

Plans statistiques complets

Plan factoriel : 2 variables (X, Y), même nombre de modalités (2) 3 modalités -> 3² groupes = 9 groupes 3 var, 3 modalités ->27 groupes

Plan factoriel en blocs aléatoires Groupage des individus selon une variable à contrôler

Plan factoriel 2 variables

X y

Groupe 1

1 1

Groupe 2

1 2

Groupe 3

2 1

Groupe 4

2 2

Page 15: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 15

Plans statistiques fractionnés

Carré latin : 3 variables (X, Y, Z), même nombre de modalités (3) le groupe 3 reçoit [3, 1, 2]

Autres tailles Gréco-latin : 4 variables Hyper-gréco-latin : 5 variables

Carré latin 3 variables

X1 X2 X3

Y1 Z1 Z3 Z2

Y2 Z3 Z2 Z1

Y3 Z2 Z1 Z3

3

Page 16: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 16

Modèle linéaire d’effets indépendants Une moyenne générale () Des effets spécifiques par facteur (i) pour la modalité i du facteur

I Des effets d’interaction (ii) ) Une variable aléatoire () qui dépend des facteurs (i,j) mais aussi

de l’observation (k)

Mesures dans les cellules (combinaison de traitements) Normalité Égalité des variances, surtout si les effectifs sont différents Homogénéité des covariances (échantillons appariés)

Terminologie Variations totales, Factorielles, Résiduelles Variations ou Somme de carrés (ex : VF = ni (mx1 – mx.)2 )

Analyse de variance : Postulats

Yijk i j (i j ) k

Page 17: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 17

Analyse de variance

Hypothèse Les effets sont linéaires : X = Moyenne + effet du facteur + erreur Hypothèse

H1a : 1 = 2 =3 pas de différence de moyenne entre niveaux H1b : au moins une moyenne est différente des autres

Les facteurs contrôlés sont différents ENTRE les groupes mais identiques à l'intérieur de chaque groupe (VF variations factorielles)

Les facteurs incontrôlés ont la même influence quel que soit le groupe (VR variations résiduelles)

Le théorème de la décomposition de la variance (intra et inter) VT=VF+VR

xik x ki

2 xi x i

2 xik xi

ki

2

Page 18: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 18

Qualité globale : Test F de Fisher

Test de la qualité globale du modèle I = nombre de niveaux du facteur, N= nombre d’observations (I-1; N-1) degrés de liberté

Interprétation H0 : aucune effet de X sur Y (moyenne identique) Si F calc > F critique : rejet de H0

F( I 1,N 1) Variat Factorielle / ( I 1)

Variat Résiduelle / (N I )Variance factorielle

Variance résiduelle

Page 19: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 19

Rapport de corrélation - êta carré (2)

Si le F diagnostique l’existence d’une relation, eta carré détermine la force de cette relation

Mesure d’association entre une variable quantitative et une variable non quantitative (nominale ou ordinale) Ex : pouvoir explicatif du genre sur le montant des dépenses

Eta2 = Variations expliquées / Variations totales Eta2 e [0, 1]

S’interprète comme le % des variations de la variable quantitative expliquées par la variable nominale/ordinale

Page 20: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 20

Exemple de lecture

Effet du prix sur les ventes des magasins (q)

3 niveaux de prix

4 types de magasin, 30 observations par magasin

Relation globalement significative (F) Mais Faible (Eta2 ou R2)

Effet du prix Significatif (t) Dans quel sens ? (demander solution)

Page 21: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 21

Analyse de variance multivariée : Les interactions

Les effets de variables peuvent se combiner pour S’amplifier ou Se neutraliser

Variabledépendante

Variable indépendante

Sans interactinn

Interactinn dis-ordinaleAvec croisement

Interactinn dis-ordinaleSans croisement

Interactinn ordinale

Page 22: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 22

2 facteurs avec interaction

Effet du magasin Significatif

Effet de l’interaction Significative

Amélioration de la qualité globale

Attention ! Les effets d’interaction sont toujours à analyser d’abord Car ils changent l’interprétation des effets directs

Yijk i j (i j ) k

Page 23: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 23

Problème des comparaisons multiples

Quand il y a plusieurs groupes, les tests en t (2 groupes) ne sont pas adaptés

Car pour chaque test d’hypothèse, on additionne les risques d’erreur alpha pour k groupes : k.(k-1)/2 comparaisons… Pour 3 groupes avec un risque alpha=5%, la probabilité

qu’aucune comparaison ne soit significative est (0.95*0.95*0.95)=0.857 soit un risque alpha réel de 14.3%

Objectif des corrections Comparer les moyennes des groupes en contrôlant pour l’inflation

des risques (type I) pour toutes les comparaisons Garder un risque a de 5% pour toutes les comparaisons => le

risque pour chaque comparaison sera d’autant plus petit que le nombre de comparaisons est important

Page 24: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 24

Bonferroni, Scheffé, Dunnett

Comparaison a priori ou a posteriori des groupes

Corrections pour des comparaisons multiples

Dunn-Bonferroni : (la correction plus simple a priori) corrigé = / nombre de tests. 5%-> 1% si 5 comparaisons

Autres tests ( a posteriori) Dunnett : les groupes sont comparés à un groupe de contrôle

Contrastes non orthogonaux - Usage fréquent Tukey HSD:

Compare toutes les paires possibles adapté s’il y a de nombreux groupes à comparer

Scheffé : très conservateur mais accepte des groupes inégaux. Correction pour toutes les comparaisons possibles (paires ou

composées) en augmentant la différence critique. Une différence à elle seule doit être assez grande pour rendre

le F global significatif.

Page 25: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 25

Test des différences

Bonferroni (test en t) Scheffé (test en F)

Page 26: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 26

Contrastes

un test a priori de différences de moyennes (hypothèse préalable)

Un Contraste est une somme pondérée des moyennes dont la valeur attendue sous H0 est nulle C = a1.1 + a2.2 + a3.3

Comparaison sur une combinaison linéaire de plusieurs groupes Test d’une combinaison linéaire des (nb groupes-1) contrastes Si a = [1 0 –1] alors on a C = 1 - 3

Si a = [1 –1/2 –1/2] alors on a C = 1 - 0.5 2 -0.5 3

Contrastes particuliers Helmert (groupes ordonné)

[-1 1 0 0] [-1 -1 2 0] [-1 -1 -1 3] Contraste polynomial

Prise en compte successive d’un trend linéaire, quadratique, cubique

Page 27: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 27

Contrastes orthogonaux

Des Contrastes orthogonaux sont indépendants les uns des autres

Pour que 2 contrastes soient orthogonaux, il faut que la Somme des produits des coefficients de chaque variable soit

NULLE Somme des coefficients d’un contraste soit NULLE

Exemple C1 : [ -1 0 1] et C2 : [ -1 2 -1] C1 : [ 1 -1 0 0] et C2 : [ 0 0 1 -1]

Générer des contraste orthogonaux : http://www.bolderstats.com/orthogCodes/

Tous les contrastes doivent être orthogonaux 2 à 2

Chaque contraste

a sa somme des carrés

a 1 degré de liberté au numérateur et ddl erreur au dénominateur.

Page 28: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 28

Type I Hiérarchique :

l’ordre détermine la prise en compte des variables. F de l’effet = SC de l’effet / SC des effets précédents

II Non expérimental F de l’effet = SC de l’effet / SC des effets de son niveau et des

niveaux inférieurs III Régression

F de l’effet = SC de l’effet / SC de tous les autres effets

Préconisations Type I si les variables ont un ordre d’importance ET les groupes de

taille identique Type II déconseillé Type III à privilégier (même si effectifs inégaux) : option par

défaut Approfondir : http://www.lsp.ups-tlse.fr/Doc_pedagogique/PDF/ab-deseq.pdf

Choix des sommes des carrés de Type I à III

Page 29: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 29

Moyennes et Moyennes estimées

Moyenne (MEAN) correspond à la moyenne arithmétique C’est la moyenne générale

Moyenne estimée (LSMEANS) correspond à la moyenne estimée par le modèle utilisé C’est la moyenne des moyennes des niveaux d’un facteur Elle est ajustée en fonction de la moyenne des variables

indépendantes

Elles sont différentes S’il y a des valeurs manquantes ou des effectifs différents S’il y a des variables explicatives (covariates)

Page 30: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 30

ANCOVA et MANOVA

ANCOVA Permet de tenir compte d’un facteur/variable que l ’on peut

mesurer mais non contrôler L’effet de la variable non contrôlé est éliminé d’abord avant de

prendre en compte les facteurs

MANOVA Prendre en compte plusieurs variables à expliquer (Y1, Y2, Y3) Voir s’il y a un effet global de la variable explicative Puis chercher sur quelle variable plus particulièrement il y a un

effet par des ANOVA

Page 31: Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 31

Modèles mixtes

Les modèles mixtes prennent en compte la différence des répondants lors d’analyses de mesures répétées

Modèle de base Y = a + b.X + e

Introduction d’une constante par répondant (i) Yit = a + b.Xit + .i + eit

Prise en compte des variations des coefficients selon des caractéristiques des répondants (modèles multi-niveaux ou hiérarchiques) Yit = ai + bi.Xit + .i + it

ai = a + c.Zi + i

bi = b + d.Ki + i