l’approche empirique démarche, concepts essentiels, vocabulaire · 2015-03-17 · m e s s 2 0 1...

22
MeSS 2015 Module I R1 L’approche empirique Démarche, concepts essentiels, vocabulaire • Niveau théorique/conceptuel - Cadre théorique - Conceptualisation (formulation théorique): Définition conceptuelle - Hypothèses: Postule des relations entre concepts • Niveau empirique - Des concepts aux indicateurs (mesure): Définition opérationnelle - Types de données - Sondage, données agrégatives, données expérimentales - Qualité de la mesure: Validité, fiabilité - Construction/production des données - Structures des données: Matrice de données - Niveaux de mesure - Vérification empirique • Interprétation et généralisation

Upload: others

Post on 04-Jul-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: L’approche empirique Démarche, concepts essentiels, vocabulaire · 2015-03-17 · M e S S 2 0 1 5 M o d u l e I R1 L’approche empirique Démarche, concepts essentiels, vocabulaire

Me

SS

201

5M

odu

leI

R1L’approche empirique

Démarche, concepts essentiels, vocabulaire

• Niveau théorique/conceptuel

- Cadre théorique

- Conceptualisation (formulation théorique): Définition conceptuelle

- Hypothèses: Postule des relations entre concepts

• Niveau empirique

- Des concepts aux indicateurs (mesure): Définition opérationnelle

- Types de données- Sondage, données agrégatives, données expérimentales

- Qualité de la mesure: Validité, fiabilité

- Construction/production des données

- Structures des données: Matrice de données

- Niveaux de mesure

- Vérification empirique

• Interprétation et généralisation

Page 2: L’approche empirique Démarche, concepts essentiels, vocabulaire · 2015-03-17 · M e S S 2 0 1 5 M o d u l e I R1 L’approche empirique Démarche, concepts essentiels, vocabulaire

Me

SS

201

5M

odu

leI

R2

Préférencepartisane

Attitudeface à l’EuropeHypothèse

Mesu

re

Mesu

re

Con

cepts

Ind

icateurs

Relation observée

La démarche empirique

Th

éo

rieE

mp

irie

Défin

ition(con

ceptuelle)

Défin

ition

(op

ération

nelle

)

Va

lidi

téF

iab

ilit

é(d

esm

esu

res)

Réponse à la question:

Pour quel parti politique

avez-vous voté lors des

dernières élections fédérales

Réponse à la question:Si la CH votait dimanche pro-chain sur l’adhésion à l’UE, vousvoteriez certainement pour, prob.pour, prob. contre, certainementcontre?

Var. dépendante(à expliquer)

Var. indépendante(explicative)

exte

rne

(gén

éral

sbil

ité)

inte

rne

(oér

ence

)V

alid

ité

de

lam

esu

re

Page 3: L’approche empirique Démarche, concepts essentiels, vocabulaire · 2015-03-17 · M e S S 2 0 1 5 M o d u l e I R1 L’approche empirique Démarche, concepts essentiels, vocabulaire

Me

SS

201

5M

odu

leI

R3

Classification

Ordre

Distances

Point zéro

Nominal Ordinal Intervalles (Rapports) (Absolu)

Les échelles de mesure et leurs propriétés

Unité fixe

Choix de l’outil ↔ Niveau de mesure

Qualitatif Quantitatif

Discret Continu

Catégoriel Métrique

Ordinal métrique: Intervalles constants entre modalités (hypothèse!)

Page 4: L’approche empirique Démarche, concepts essentiels, vocabulaire · 2015-03-17 · M e S S 2 0 1 5 M o d u l e I R1 L’approche empirique Démarche, concepts essentiels, vocabulaire

Me

SS

201

5M

odu

leI

R4Les enquêtes par sondage

• Echantillons et inférence statistique

- Échantillonnage

- Bases théoriques: Loi des grands nombres, distribution normale- Echantillons: Précision et représentativité; choix aléatoire, par quotas,…- Inférence statistique: Tests statistiques, décision statistique

• Outils d’analyse (pour données nominales ou ordinales)

- Diagnostic et description univariés

- Etude de relations bivariées

- Etude de tableaux croisés

- Diagnostic des variables et de la relation (N, données manquantes etc)

- Lecture des % (prob. conditionnelles et conjointes)

- Le test du chi-deux

- Les coefficients d’association: Niveaux de mesure, familles de coefficients

- Etude de relations plurivariées- Tableau croisés avec variables de contrôle- Coefficients d’association partiels

Page 5: L’approche empirique Démarche, concepts essentiels, vocabulaire · 2015-03-17 · M e S S 2 0 1 5 M o d u l e I R1 L’approche empirique Démarche, concepts essentiels, vocabulaire

Me

SS

201

5M

odu

leI

R5

Echantillons

• Choix aléatoire/loi des grands nombres → Représentativité

• Taille de l’échantillon → Précision

• Modèle idéal: Echantillon aléatoire

- Modèle des données

- Distribution théorique (a priori): distribution normale

• Notions importantes

- Intervalle de confiance (“fourchette”); marge d’erreurs

- Seuil de signification (risque): Décidé/spécifié a priori

Page 6: L’approche empirique Démarche, concepts essentiels, vocabulaire · 2015-03-17 · M e S S 2 0 1 5 M o d u l e I R1 L’approche empirique Démarche, concepts essentiels, vocabulaire

Me

SS

201

5M

odu

leI

R6

MIS-Trend Avril 2000a

a. Echantillon représentatif des électeurs alémaniques et romands;marge d’erreur ±3.2%

BilatéralesSuisse

RomandeSuisse

alémaniqueTotal

Oui 65.2 55.1 57.6

Plutôt oui 8.9 6.9 7.4

Plutôt non 7.3 15.9 13.8

Non 6.3 15.9 9.5

NSP/Refus 12.3 11.5 11.7

N 242 754 996

Votation sur les BilatéralesEnquête par sondage représentatif des électeurs suisses (méthode des quotas)

Représentativité: Choix aléatoire

Précision: Marge d’erreur, intervalle de confiance

Page 7: L’approche empirique Démarche, concepts essentiels, vocabulaire · 2015-03-17 · M e S S 2 0 1 5 M o d u l e I R1 L’approche empirique Démarche, concepts essentiels, vocabulaire

Me

SS

201

5M

odu

leI

R7Inférence statistique

Echantillon Population mère

Modèle théorique (a priori) des donnéesDistribution théorique

Récolte des données

(Echantillons)

Modèleconceptuel

Modèlestatistique

Modèleempirique

Page 8: L’approche empirique Démarche, concepts essentiels, vocabulaire · 2015-03-17 · M e S S 2 0 1 5 M o d u l e I R1 L’approche empirique Démarche, concepts essentiels, vocabulaire

Me

SS

201

5M

odu

leI

R8Décision statistique

• Hypothèses Ho / H1

• Fixer un seuil de signification (choisi a priori)

• Choix et calcul d’un test→ Distribution théorique appropriée aux données

• Décision statistique:

Probabilité (erreur de type I/α)

Seuil de signification

Confrontation DécisionGarder ou rejeter H0

• Signification/significativité

- Signification statistique [“significant”]

- Signification “substantielle” (recherche) [“meaningful”]

• Test statistique

Établir la signification statistique d’une statistique : Confrontation durésultat empirique au modèle théorique des données.

Page 9: L’approche empirique Démarche, concepts essentiels, vocabulaire · 2015-03-17 · M e S S 2 0 1 5 M o d u l e I R1 L’approche empirique Démarche, concepts essentiels, vocabulaire

Me

SS

201

5M

odu

leI

R9

Variable indépendanteV

aria

ble

dépe

nda

nte

Nominal Ordinal Intervalles

Nominal

Ordinal

Intervalles

Tableaux croisés

Coeff. d’association

Outils pour l’analyse de variables catégorielles

Tableaux de moyennes

Test du χ2

Test de F, η, η2

Page 10: L’approche empirique Démarche, concepts essentiels, vocabulaire · 2015-03-17 · M e S S 2 0 1 5 M o d u l e I R1 L’approche empirique Démarche, concepts essentiels, vocabulaire

Me

SS

201

5M

odu

leI

R10

Présentation

Nominal Ordinal Intervalles

Outil de base Tableau de fréquence Liste, dotplot

Graphiques Diagrammes à barres Histogrammes, boxplots

Résumés numériques (statistiques univariées)

Attention: La moyenne n’est pas résistante.

Nominal Ordinal Intervalles

Tendance centrale (Mode) (Médiane) Moyenne, médiane

Dispersion (-) (Distance interquar-tile)

Ecart-type,dist. interquartile

Diagnostiquer, décrire, résumer une variable• Diagnostic général

- Effectifs, contexte

- Données manquantes

- Particularités

• Diagnostic statistique en fonction du niveau de mesure- Tendance centrale et dispersion (variabilité)

- Forme de la distribution (symétrie!)

- Valeurs extraordinaires, discontinuités etc.

Méfiez vous despièges des résumés

... en vue de son rôledans votre analyse

Page 11: L’approche empirique Démarche, concepts essentiels, vocabulaire · 2015-03-17 · M e S S 2 0 1 5 M o d u l e I R1 L’approche empirique Démarche, concepts essentiels, vocabulaire

Me

SS

201

5M

odu

leI

R11

Q49 Identification partisane

151 12.5 13.4

193 15.9 17.1

85 7.0 7.5

84 6.9 7.4

49 4.0 4.3

22 1.8 2.0

8 .7 .7

24 1.9 2.1

17 1.4 1.5

23 1.9 2.0

19 1.6 1.7

8 .7 .7

21 1.7 1.8

424 35.0 37.6

1127 92.9 100.0

30 2.5

56 4.6

86 7.1

1213 100.0

1 PRD Parti radical-démocratique

2 PSS Parti socialiste suisse

3 PDC Parti démocrate chrétien

4 UDC Union démocratique du centre

5 PES Parti écologiste suisse

6 PA Parti des automobilistes

7 DS Démocrates suisses

8 PLS Parti libéral suisse

9 AdI Alliance des indépendants

10 PEP Parti évangélique et populaire

11 PST/POP Parti suisse travail

12 PCS Parti chrétien-social suisse

13 Autre (FraP)

80 Aucun parti

Total

Valid

98 NSP

99 NR

Total

Missing

Total

Frequency PercentValid

Percent

• Lecture politologique

- Partis

- Préférence ou pas de préf.

- …

• Diagnostic

- Modalités à faible effectif

- Concentrations

- Données manquantes

• Résumés statistiques?

- Tendance centrale?

- Mode (catégorie modale)

• Représentation graphique

- Diagramme à barres

- (Camembert)

Tableaux de fréquences: Diagnostic et description [Univarié]

Page 12: L’approche empirique Démarche, concepts essentiels, vocabulaire · 2015-03-17 · M e S S 2 0 1 5 M o d u l e I R1 L’approche empirique Démarche, concepts essentiels, vocabulaire

Me

SS

201

5M

odu

leI

R12Etude des relations entre variables catégorielles

• Tableau croisé

- Outil de base pour analyser des variables catégorielles- Diagnostic

- Données manquantes?

- Lignes/colonnes/cases à effectifs trop faibles?

- Allure/forme de la relation entre les variables

- Réponse à des questions- Lecture des % (prob. conditionnelles et conjointes)

- Etude de la relation ↔ Hypothèses

- Présentation des résultats- Conseils pratiques

- Aiguisez vos compétences en lecture des tableaux croisés- Apprenez à produire les tableaux qui correspondent à vos questions

• Résumé de la relation

- Significativité statistique (test du chi-2)

- Coefficients d’association

Page 13: L’approche empirique Démarche, concepts essentiels, vocabulaire · 2015-03-17 · M e S S 2 0 1 5 M o d u l e I R1 L’approche empirique Démarche, concepts essentiels, vocabulaire

MeSS2015ModuleI

R13

Vital pour l'economie suisse * Region linguistique Crosstabulation

Vital pour l’économie suisse Region linguistique Total

Suissealemanique

Suisseromande

Tessin

Entierementd'accord

Count 182 113 12 307

% within Vital pour l'eco-nomie suisse

59.3% 36.8% 3.9% 100.0%

% within Rég.linguistique 26.9% 60.4% 25.0% 33.7%

% of Total 20.0% 12.4% 1.3% 33.7%

Plutotd'accord

Count 164 51 11 226

% within Vital pour l'eco-nomie suisse

72.6% 22.6% 4.9% 100.0%

% within Rég. linguistique 24.3% 27.3% 22.9% 24.8%

% of Total 18.0% 5.6% 1.2% 24.8%

Plutot pasd'accord

Count 197 12 13 222

% within Vital pour l'eco-nomie suisse

88.7% 5.4% 5.9% 100.0%

% within Rég. linguistique 29.1% 6.4% 27.1% 24.4%

% of Total 21.6% 1.3% 1.4% 24.4%

absolumentpas d'accord

Count 133 11 12 156

% within Vital pour l'eco-nomie suisse

85.3% 7.1% 7.7% 100.0%

% within Rég. linguistique 19.7% 5.9% 25.0% 17.1%

% of Total 14.6% 1.2% 1.3% 17.1%

Total Count 676 187 48 911

% within Vital pour l'eco-nomie suisse

74.2% 20.5% 5.3% 100.0%

% within Rég. linguistique 100.0% 100.0% 100.0% 100.0%

% of Total 74.2% 20.5% 5.3% 100.0%

Entierementd'accord

Count

% within Vital pourl'economie suisse

% within Region

linguistique

% of Total

Tableau croisé (tri croisé, tableau de contingence)(crosstabulation, contingency table)

N : Nombre de personnes :

Pourcentage en ligne

Pourcentage en colonne

Pourcentage total (probabilité conjointe)

probabilités

conditionnelles

Nom

bre

dedo

nnée

sm

anqu

ante

s76

Page 14: L’approche empirique Démarche, concepts essentiels, vocabulaire · 2015-03-17 · M e S S 2 0 1 5 M o d u l e I R1 L’approche empirique Démarche, concepts essentiels, vocabulaire

Me

SS

201

5M

odu

leI

R14

Vital pour l'économie suisse * Région linguistique Crosstabulation

182 113 12 307

26.9% 60.4% 25.0% 33.7%

164 51 11 226

24.3% 27.3% 22.9% 24.8%

197 12 13 222

29.1% 6.4% 27.1% 24.4%

133 11 12 156

19.7% 5.9% 25.0% 17.1%

676 187 48 911

100.0% 100.0% 100.0% 100.0%

Count

% within Région

Count

% within Région

Count

% within Région

Count

% within Région

Count

% within Région

Entièrement d'accord

Plutôt d'accord

Plutôt pas d'accord

absolument pas d'accord

Vital pour

l'économie

suisse

Total

Suisse

alémanique Suisse romande Tessin

Région linguistique

Total

Case Processing Summary

911 92.5% 74 7.5% 985 100.0%Vital pour l'économie* Région

N Percent N Percent N Percent

Valid Missing Total

Cases

Page 15: L’approche empirique Démarche, concepts essentiels, vocabulaire · 2015-03-17 · M e S S 2 0 1 5 M o d u l e I R1 L’approche empirique Démarche, concepts essentiels, vocabulaire

Me

SS

201

5M

odu

leI

R15

Chi-Square Tests

99.844a 6 .000

107.399 6 .000

28.238 1 .000

.b

911

Pearson Chi-Square

Likelihood Ratio

Linear-by-LinearAssociation

McNemar Test

N of Valid Cases

Value df

Asymp.Sig.

(2-sided)Exact Sig.(2-sided)

0 cells (.0%) have expected count less than 5. The minimum expectedcount is 8.22.

a.

Computed only for a PxP table, where P must be greater than 1.b.

Sig.Valeur p (p-value)Probabilité d’une erreur de type I (α)

Page 16: L’approche empirique Démarche, concepts essentiels, vocabulaire · 2015-03-17 · M e S S 2 0 1 5 M o d u l e I R1 L’approche empirique Démarche, concepts essentiels, vocabulaire

Me

SS

201

5M

odu

leI

R16

Directional Measures

.019 .024 .796 .426

.026 .033 .796 .426

.000 .000 .c .c

.041 .007 .000d

.081 .015 .000d

.057 .010 5.633 .000e

.043 .008 5.633 .000e

.084 .015 5.633 .000e

-.207 .028 -7.394 .000

-.291 .039 -7.394 .000

-.160 .022 -7.394 .000

.312

.196

Symmetric

Vital pr. l'économieDependent

Région Dependent

Vital pr. l'économieDependent

Région Dependent

Symmetric

Vital pr. l'économieDependent

Région Dependent

Symmetric

Vital pr. l'économieDependent

Région Dependent

Vital pr. l'économieDependent

Région Dependent

Lambda

Goodman andKruskal tau

UncertaintyCoefficient

Nominal byNominal

Somers' dOrdinal byOrdinal

EtaNominal byInterval

Value

Asymp.Std. Error

aApprox. T

bApprox.

Sig.

Not assuming the null hypothesis.a.

Using the asymptotic standard error assuming the null hypothesis.b.

Cannot be computed because the asymptotic standard error equals zero.c.

Based on chi-square approximationd.

Likelihood ratio chi-square probability.e.

Choix du coefficient en fonction des niveaux de mesure

Page 17: L’approche empirique Démarche, concepts essentiels, vocabulaire · 2015-03-17 · M e S S 2 0 1 5 M o d u l e I R1 L’approche empirique Démarche, concepts essentiels, vocabulaire

Me

SS

201

5M

odu

leI

R17

Symmetric Measures

.331 .000

.234 .000

.314 .000

-.216 .029 -7.394 .000

-.177 .024 -7.394 .000

-.392 .052 -7.394 .000

-.240 .032 -7.452 .000c

-.176 .034 -5.395 .000c

.d

911

Phi

Cramer's V

Contingency Coefficient

Nominal by Nominal

Kendall's tau-b

Kendall's tau-c

Gamma

Spearman Correlation

Ordinal by Ordinal

Pearson's RInterval by Interval

KappaMeasure of Agreement

N of Valid Cases

ValueAsymp.

Std. Errora

Approx.T

bApprox.

Sig.

Not assuming the null hypothesis.a.

Using the asymptotic standard error assuming the null hypothesis.b.

Based on normal approximation.c.

Kappa statistics cannot be computed.They require a symmetric 2-way table in which thevalues of the first variable match the values of the second variable.

d.

Page 18: L’approche empirique Démarche, concepts essentiels, vocabulaire · 2015-03-17 · M e S S 2 0 1 5 M o d u l e I R1 L’approche empirique Démarche, concepts essentiels, vocabulaire

Me

SS

201

5M

odu

leI

R18

Nominal Ordinal Intervalles

Nominal

Ordinal

Intervalles

Coefficients d’association (Regard symétrique ou aysmétrique)

(phi)

Coeff. de contingence C

V de Cramer

x y xy

de Goodman et Kruskal

Coefficients ordinaux

Q de Yule(Gamma)

b(tau b)

c(tau c)

D de Somer

r (de Pearson)

(Variable indépendante)(V

aria

ble

dépe

nda

nte

)

(Eta)

Examinez les tableaux croisées soigneusement avant de résumer la relation à l’aide d’un coefficient.

(si vous souhaitez utiliser un coefficient!)

... et dans le doute retournez aux tableaux croisés....

Page 19: L’approche empirique Démarche, concepts essentiels, vocabulaire · 2015-03-17 · M e S S 2 0 1 5 M o d u l e I R1 L’approche empirique Démarche, concepts essentiels, vocabulaire

Me

SS

201

5M

odu

leI

R19S

ou

rce

:E

nq

teé

lec

tora

le(S

ele

cts

)d

e1

99

5(K

rie

si)

Armée Pour/contre l’arméeEducation Niveau d’éducation

Inférieur Supérieur

pour

contre

Education

Armée

66% 53%

34% 47%

100% 100%(1006) (591)

( = 0,13)

Sig. 2 = 0.000

Homme Femme

Pour

Contre

Sexe

Armée

65% 57

35 43

100% 100%(752) (845)

( = 0,08)

Sig. 2 = 0.001

Page 20: L’approche empirique Démarche, concepts essentiels, vocabulaire · 2015-03-17 · M e S S 2 0 1 5 M o d u l e I R1 L’approche empirique Démarche, concepts essentiels, vocabulaire

Me

SS

201

5M

odu

leI

R20

Homme Femme

Pour

Contre

Armée

68% 64

32 36

100% 100%(422) (584)

( = 0,04)

Education: Niveau inférieur

Sig. 2 = 0.21

( = 0,20)

Sig 2 = 0.000

Homme Femme

Pour

Contre

Armée

61% 41

39 59

100% 100%(330) (261)

Education: niveau supérieur

Variable de contrôle: Niveau d’éducation

Effet educationéliminé(constant)

Page 21: L’approche empirique Démarche, concepts essentiels, vocabulaire · 2015-03-17 · M e S S 2 0 1 5 M o d u l e I R1 L’approche empirique Démarche, concepts essentiels, vocabulaire

Me

SS

201

5M

odu

leI

R21Tableaux de moyennes

• Var. dépendante continue, var. indép.catégorielle

• Comparaison des catégories de lavariable indépendante- Tableaux de moyennes/écart-types;diagnostic de la relation

- Boxplot (boîte à pattes)

• Décomposition de la varianceV

total= V

inter-groupes+ V

intra-groupes

Var(y) = Var(x) + Var(reste)attribuable à X attribuable à “autre chose”

- QualitéVariance expliquée)

- Relation (force)

• Signification statistique

- Relation → Test de F

Page 22: L’approche empirique Démarche, concepts essentiels, vocabulaire · 2015-03-17 · M e S S 2 0 1 5 M o d u l e I R1 L’approche empirique Démarche, concepts essentiels, vocabulaire

Me

SS

201

5M

odu

leI

R22

Aucune formscol/prof

Ecoleobligatoire

Appr prof ouécole prof

Ecole dematurité

Form sup techet prof

Ecole tech sup Université,EPF

Dernière école achevée

0

3

6

9

12

15

Potact1

Cases weighted by Pondération sur regling, données OFS grisons=além

Comparaison de groupes: Boîte à pattes (Boxplot)

Echelle “potact” et niveau d’éducation

Attention: Comparaison de médianes/distances interquartiles

Médiane

Distanceintequartile