psycho l1 l2 l1 l2 l2 psycho statistique …...statistique descriptive stéphanie baggio stéphane...
TRANSCRIPT
Statistique descriptiveStéphanie BaggioStéphane Rothen Stéphane Deline
20 fiches Résumés de cours + de 50 exercices corrigés Applications sur le logiciel R
L1 L2L1 L2
Stat
istiq
ue d
escr
iptiv
e
Con
cept
ion
grap
hiqu
e : P
rim
o&Pr
imo®
ISBN : 978-2-8073-1491-7
www.deboecksuperieur.comPrix TTC : 16 €
DANS LA MÊME COLLECTION
Qu’est-ce que la statistique descriptive ? À quoi sert-elle en psychologie ? Comment recueille-t-on des données ? À quoi ressemble un graphique boîte à moustaches ? Qu’est-ce qu’un tableau de contingence ? Et un score z ? Comment les utiliser ? Est-ce compliqué ?
« Statistique », un mot qui fait peur ! En 20 cours, cet ouvrage livre aux étudiants de psychologie les clés de la statistique descriptive, base indispensable pour la suite de leur parcours.
Très concret, ancré dans la méthodologie propre à la psychologie, il décrit la statistique descriptive sous toutes ses formes (tableaux, graphiques, résumés numériques) grâce à des explications pas-à-pas. Il propose également des applications sur le logiciel R (libre et gratuit).
Enrichi de nombreuses illustrations pour mieux visualiser et d’exemples ludiques pour dédramatiser la matière, ce guide progressif permettra à chaque étudiant d’apprivoi-ser la statistique et de l’utiliser de manière autonome et critique. Un véritable passeport pour la réussite !
Chaque fiche contient :> Un résumé de cours avec les grands concepts
à maîtriser> Des applications, notamment sur R> Des conseils méthodologiques > Des exercices avec corrigés détaillés
Statistique descriptive
PSY
CH
O
PSY
CH
O
Stéphanie Baggioest docteure en psychologie sociale et statisticienne, chargée de mission aux Hôpitaux Universitaires de Genève et première assistante à l’Institut des sciences sociales de l’Université de Lausanne.
Stéphane Rothenest docteur en épidémiologie psychia-trique, psychologue adjoint aux Hôpitaux Universitaires de Genève et Privat-Docent à la Faculté d’économie et de management de l’Université de Genève.
Stéphane Delineest docteur en psychologie différentielle et ingénieur de recherche au sein de l’Université Bretagne Sud.
L1L2
PS_PSY_STATS.indd 1 20/07/2017 11:03
Statistique descriptive
DANS LA MÊME COLLECTION
Sup en poche est une collection destinée aux étudiants du 1er cycle, essentiellement en Licence 1 et 2. Son objectif est de permettre à l’étudiant de réviser et s’entraîner en vue de réussir ses examens. Chaque ouvrage est composé de fiches proposant des cours résumés suivis d’exercices corrigés pas à pas.
Méthodologie pour psychologuesG. Broc
Statistique descriptiveStéphanie BaggioStéphane Rothen Stéphane Deline
L1 L2
PSY
CH
O
Pour toute information sur notre fonds et les nouveautés dans votre domaine de spécialisation, consultez notre site web : www.deboecksuperieur.com
© De Boeck Supérieur s.a., 2017 1re édition 2017Rue du Bosquet 7, B-1348 Louvain-la-Neuve 1er tirage 2017
Tous droits réservés pour tous pays.Il est interdit, sauf accord préalable et écrit de l’éditeur, de reproduire (notamment par photocopie) partiellement ou totalement le présent ouvrage, de le stocker dans une banque de données ou de le communiquer au public, sous quelque forme et de quelque manière que ce soit.
Imprimé aux Pays-Bas
Dépôt légal :Bibliothèque Nationale, Paris : août 2017 ISSN 2566-2716Bibliothèque royale de Belgique, Bruxelles : 2017/13647/125 ISBN 978-2-8073-1491-7
Utiliser R avec cet ouvrageDans ce livre, en plus des concepts statistiques présentés, nous avons choisi de vous sensibiliser à l’usage d’un logiciel statistique afin que vous deveniez vrai-ment autonomes. Le logiciel choisi est le logiciel R, gratuit, puissant et modu-lable.
Si vous n’êtes pas déjà familier avec R, commencez par lire la partie 5 qui est une introduction simple à l’usage de ce logiciel. Cela vous permettra de faire les exercices des autres parties.
Vous pouvez (devez ?!) également télécharger des bases de données et des scripts R utiles pour certains exercices et qui vous permettront de reproduire les exemples des cours. Ces fichiers à télécharger se trouvent dans un dossier com-pressé .zip téléchargeable sur le site de l’éditeur :
www.deboecksuperieur.com
Il vous suffit d’entrer le code de l’ouvrage (9782807314917) dans la barre de recherche, de cliquer sur l’image du livre puis sur le lien repris dans la rubrique « Ressources » en bas de la page web.
Vous trouverez dans ce dossier trois sous-dossiers contenant les fichiers sui-vants :
• les données (« Data ») : bases de données et fichier des fonctions utilisées dans les cours.
• les scripts au format .R (dossier « Scripts_R ») : scripts à utiliser dans un environnement R (comme R-Studio) ou avec un éditeur de code R (par exemple Tinn-R) et qui correspondent aux fonctions présentées dans cha-cun des cours.
• les scripts au format .txt (dossier « Scripts_txt ») : scripts à utiliser si vous préférez utiliser R (plutôt que R-Studio) et qui correspondent aux fonctions présentées dans chacun des cours.
Nous vous recommandons d’utiliser les fichiers avec l’extension .R dans R-Studio pour vous initier à l’utilisation de R.
Attention : les scripts R correspondant aux exercices du livre sont accessibles directement dans les corrigés. Aucun fichier script n’est disponible pour ceux-ci.
7Sommaire
Sommaire
INTRODUCTION
Pourquoi étudier la statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .9
Partie 1 Méthodologie et vocabulaire
COURS 1 La méthode scientifique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
COURS 2 Sur qui ? Population et échantillon . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
COURS 3 Sur quoi ? Variables et échelles de mesure . . . . . . . . . . . . . . . 30
COURS 4 Sur quoi ? Le statut des variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
COURS 5 Comment ? Les méthodes de recueil de données . . . . . . 44
COURS 6 Comment ? Les plans de recherche . . . . . . . . . . . . . . . . . . . . . . . . . 53
Partie 2 Tableaux
COURS 7 La base de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
COURS 8 Les tableaux de fréquence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
COURS 9 Les tableaux de contingence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
COURS 10 Recoder ses données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
Partie 3 Graphiques
COURS 11 Graphiques pour variables qualitatives . . . . . . . . . . . . . . . . . . . . 101
COURS 12 Graphiques pour variables quantitatives . . . . . . . . . . . . . . . . . . 108
COURS 13 Graphiques bivariés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
COURS 14 Quel graphique choisir ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
8 Sommaire
Partie 4 Indices numériques
COURS 15 Indices de tendance centrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
COURS 16 Indices de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
COURS 17 Indices de position . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
COURS 18 Indices de forme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
Partie 5 Introduction à R
COURS 19 Comprendre R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201
COURS 20 Utiliser R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207
CONCLUSION
J’adore la statistique ! . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
ANNEXE
Table de la loi normale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
9Introduction • Pourquoi étudier la statistique
Cet ouvrage vise à relativiser l’enseignement de la statistique en montrant qu’il est abordable, même sans connaissances avancées en mathématiques. En effet, il s’agit non pas d’étudier la théorie statistique en soi, mais de l’appliquer à la psychologie. Toutefois, pour user des statistiques avec raison, il est indispensable de comprendre ce à quoi elles servent et comment s’en servir.
Pourquoi des statistiques en psychologie ?1uu Il existe plusieurs définitions de la psychologie : l’une scientifique, l’autre plus intuitive.
uu La définition intuitive est celle communément partagée et correspond à l’idée que le plus grand nombre se fait de la psychologie : la psycho-logie est la connaissance empirique ou intuitive des sentiments, idées, croyances ou encore comportements d’autrui. Elle permet de se mettre à la place des autres, de deviner leurs attentes, leurs envies, etc.
uu La définition scientifique est celle que l’on utilise dans le cursus de psychologie : la psychologie est l’étude scientifique des faits psychiques. Les faits psychi ques renvoient aux comportements, aux états mentaux et aux processus mentaux.
Application. Exemples de faits psychiques
Par comportement, on entend l’ensemble des manifestations observables de notre activité, comme donner une gifle à quelqu’un. Les états mentaux correspondent quant à eux à ce qui est éprouvé par les individus et réfléchi par la conscience, comme la haine de la personne à laquelle on a donné une gifle. Enfin, les
AttentionCertains étudiants choisissent la filière Psychologie en s’appuyant sur la première définition, c’est-à-dire avec une vision er-ronée de la façon dont est conçue la psy-chologie à l’université. Ils seront fort déçus, puisque la psychologie telle qu’elle leur sera enseignée ne leur permettra jamais de prédire le comportement de quelqu’un selon qu’il préfère les pommes rouges ou vertes, ni de lire dans autrui comme dans un livre ouvert. Elle donne des bases scien-tifiques à la compréhen sion des faits psy-chiques, en recourant notamment à la méthode expérimentale et aux statistiques.
Pourquoi étudier la statistique
INTRODUCTION
Partie 1
Méthodologie et vocabulaireCOURS 1La méthode scientifique 15
COURS 2Sur qui ? Population et échantillon 25
COURS 3Sur quoi ? Variables et échelles de mesure 30
COURS 4Sur quoi ? Le statut des variables 38
COURS 5Comment ? Les méthodes de recueil de données 44
COURS 6Comment ? Les plans de recherche 53
Cours 1 • La méthode scientifique 15
1. M
étho
dolo
gie e
t voc
abul
aireLa méthode scientifique
COURS1
Les éléments clés de la méthode scientifique1uu La méthode scientifique peut se voir comme un processus circulaire ayant pour but de : 1) Comprendre un phénomène ;2) Augmenter les connaissances dans un domaine spécifique ;3) Avoir une base solide pour entreprendre des actions.
uu Elle est construite sur des démarches rigoureuses et utilise des instruments fiables.
uu Elle doit se conformer à deux règles importantes :1) La reproductibilité, c’estàdire la possibilité de répéter une expé
rience donnée n’importe où et par n’importe qui ;2) La falsifiabilité (ou réfutabilité), c’estàdire que toute proposition
scientifique est susceptible d’être réfutée.
[ MOTS-CLÉS : causalité, hypothèse, problématique, procédure ]
DÉFINITION
La méthode scientifique correspond à un ensemble de procédures rigoureuses et standardisées mises en œuvre afin de répondre à des questions de recherche.
La théorie sert à définir une hypothèse vérifiable
On crée une expérience pour tester l’hypothèse
On teste les hypothèses et on interprète les résultats
On modifie la théorie, puis on mène des expériences
complémentaires
Théorie
Hypothèse
Expérience
Conclusion
Schéma de la méthode scientifique
Cours 1 • La méthode scientifique16
uu Idéalement, cette méthode a pour but de protéger le/la scientifique de la subjectivité.
1.1 Étape 1 : La question de rechercheuu À l’origine de toute étude se trouve une question. Celleci peut provenir d’une observation faite, de l’intérêt du/de la scientifique, ou encore d’une demande qui lui est adressée. Les questions peuvent être, a priori, de n’importe quelle nature. Cela peut aller de « Comment se forment les nuages ? » à « Quel est l’impact de la consommation de cannabis sur la qualité de vie ? »
uu Il s’agit d’abord de savoir si la réponse existe déjà ! Pour cela, le/la scientifique procède notamment à une revue de littérature, en recensant l’ensemble des travaux effectués dans le domaine. Selon les résultats de cette recherche, une problématique sera alors définie, ce qui revient à se poser les questions suivantes :– Qu’étudieton ? – Quel en est l’intérêt ?– Dans quel but ?– Quelles sont les lacunes des travaux déjà existants ?– Qu’estce que l’étude envisagée pourrait combler ?
uu Ainsi, la question de départ se voit précisée. Par exemple, si la question d’origine était : « Fautil manger du poisson ? », elle peut devenir : « À quelle fréquence les Français mangentils du poisson ? » ou « Manger du poisson diminuetil le risque cardiovasculaire ? » ou « La quantité de mercure dans le poisson représentetelle un risque pour l’humain ? » ou encore « Quels nutriments sont bons pour la santé dans le poisson ? », etc.
uu À cette étape, nous pourrons dire précisément :1) Quelle est la question de recherche ;2) Pourquoi cette question est importante (évaluation du contexte et
de la pertinence de la question).
1.2 Étape 2 : La prédictionuu À partir de ce travail, le/la scientifique est capable de formuler une hypothèse de recherche.
uu Une hypothèse de recherche doit avoir la forme d’une affirmation, c’estàdire proposer une réponse possible à la question posée. En effet, le/la scientifique a bien souvent une idée de la réponse à la question posée, précisée lors de la revue de littérature, de son expérience du terrain ou encore d’autres sources d’information.
CORRIGÉS2Exercice 1
1) Les étudiants en première et deuxième année à l’université (toutes filières confondues) et les étudiants en classes préparatoires pour les grandes écoles.
2) Les adolescents souffrant de dépression (qu’ils utilisent ou non du cannabis).
3) Les ménages français avec enfant(s), de manière à avoir l’information concernant les enfants (réussite scolaire) et celle concernant les parents (réussite socioéconomique).
Exercice 21) Non : la chercheuse a utilisé un
échantillon de convenance. Elle devra donc être vigilante quant aux conclusions qu’elle tirera de son étude, c’estàdire ne pas généraliser ses résultats aux étudiants des autres filières (et même aux étudiants des autres cours de psychologie/prépa si on veut être très rigoureux !)
2) Non : les adolescents diagnostiqués et suivis ne constituent pas un échantillon représentatif de la population totale des adolescents souffrant de dépression, dont nombre ne sont ni diagnostiqués, ni suivis. De plus, on ne sait pas comment les hôpitaux sont sélectionnés. Sélectionner au hasard ne suffit pas à faire que l’échantillon soit représentatif.
3) Oui.
Exercice 3La population est : tous les élèves de sa classe. Comme la population est de petite taille et qu’il suffit à cet élève de compter discrètement les garçons et les filles lorsque le prof raconte des choses ennuyeuses, il n’est pas nécessaire de créer un échantillon. De plus, avoir toute la population permet de calculer la vraie proportion de garçons et de filles, alors que s’il prenait un échantillon, cette proportion serait seulement une estimation, donc imprécise.
29Cours 2 • Sur qui ? Population et échantillon
1. M
étho
dolo
gie e
t voc
abul
aire
217Conclusion • J’adore la statistique !
Apprendre la statistique descriptive1uu L’objectif de cet ouvrage était de vous initier à la statistique descriptive et à la conduite de ce type d’analyse, aussi bien sur le plan conceptuel (quel indice choisir et quand) que sur le plan pratique (utiliser le logiciel R pour mettre en œuvre ces analyses).
uu En expliquant pas à pas comment procéder et en vous permettant de comprendre pleinement à quoi correspondent les indices statistiques, nous espérons vous avoir rendus autonomes non seulement en ce qui concerne les indices et graphiques présentés dans cet ouvrage, mais également dans la recherche de nouveaux indices. On vous demande par exemple de calculer un indice de Gini ? Il n’est pas présenté dans cet ouvrage, mais qu’à cela ne tienne, une recherche sur Internet suffit amplement à trouver à quoi cet indice correspond et à le calculer (il s’agit en l’occurrence d’un écart moyen relatif).
uu De la même manière, n’hésitez pas à explorer les possibilités de R, à tester différents graphiques, à faire varier les paramètres, la fonction « help » et les très nombreux tutoriels et forums en ligne vous permettant de résoudre les éventuels problèmes que vous pourrez rencontrer. Pratiquer est le meilleur moyen de maîtriser.
uu Cet ouvrage a également éveillé votre sens critique, en vous rendant capable de voir les erreurs et raccourcis qu’il est possible de faire, aussi bien concernant les graphiques que la méthode, le choix et l’interprétation des indices. Comme nous sommes ambitieux, nous visons à vous apprendre à faire de la science avec conscience !
uu Nous avons également mis l’accent sur l’interprétation des résultats. Obtenir des statistiques est une bonne chose, mais il faut également expliciter ce à quoi elles correspondent. Ainsi, donner K’ ne suffit pas, il faut également expliquer en quoi l’aplatissement est intéressant et en quoi il constitue une caractéristique importante de votre échantillon. Présentez toujours vos résultats comme si vous vous adressiez à
J’adore la statistique !CONCLUSION
[ MOTS-CLÉS : j’adore la statistique, la statistique descriptive n’a plus de secret pour moi ]
Travailleuse compulsive qui aime apprendre le nom des fleurs de montagne ou monter à cheval. Quand elle est là-haut, ses collègues se félicitent et peuvent souffler. Aime éveiller les âmes à la beauté de la statistique. Traduction : Docteure en psychologie sociale et statisticienne, chargée de mission dans le service de médecine pénitentiaire des Hôpitaux Universitaires de Genève et première assis-tante à l’Institut des sciences sociale de l’Université de Lausanne. Mon domaine de prédilection est la vulnérabilité humaine dans une perspective d’épidémiologie de la santé, en particulier les phénomènes addictifs et les comportements de santé.
Cavalier qui aime jouer avec les nombres ou aider les personnes qui souffrent d’addiction(s). Acheteur pathologique de livres qui parfois écrit des articles scien-tifiques avec ses collègues. Ignorant qui adore enseigner. Traduction : Psychologue adjoint dans le service d’addictologie des Hôpitaux Universitaires de Genève, Privat- Docent à la Faculté d’économie et de management de l’Université de Genève. Mes domaines de prédilection sont la méthodologie de la recherche, l’utilisation abusive des concepts de statistique comme la p-valeur, et la psychothérapie exis-tentielle, qui remet le patient au cœur de son projet de vie.
À cheval sur la variabilité, c’est vers l’étude des différences individuelles qu’il aime galoper. Maniant nombres et formules, entre ses mains, les données s’arrangent et se combinent dans une douce mélodie. Traduction : Docteur en psychologie diffé-rentielle, ingénieur de recherche au sein du Laboratoire des sciences et techniques de l’information, de la communication et de la connaissance, Université Bretagne Sud. Mes domaines de prédilection sont le traitement et l’analyse de données en psychologie, afin d’en exploiter la richesse et mieux comprendre notre fonctionne-ment et notre adaptation au monde et aux situations les plus complexes.
Stéphanie Baggio
Stéphane Rothen
Stéphane Deline
Statistique descriptiveStéphanie BaggioStéphane Rothen Stéphane Deline
20 fiches Résumés de cours + de 50 exercices corrigés Applications sur le logiciel R
L1 L2L1 L2
Stat
istiq
ue d
escr
iptiv
e
Con
cept
ion
grap
hiqu
e : P
rim
o&Pr
imo®
ISBN : 978-2-8073-1491-7
www.deboecksuperieur.comPrix TTC : 16 €
DANS LA MÊME COLLECTION
Qu’est-ce que la statistique descriptive ? À quoi sert-elle en psychologie ? Comment recueille-t-on des données ? À quoi ressemble un graphique boîte à moustaches ? Qu’est-ce qu’un tableau de contingence ? Et un score z ? Comment les utiliser ? Est-ce compliqué ?
« Statistique », un mot qui fait peur ! En 20 cours, cet ouvrage livre aux étudiants de psychologie les clés de la statistique descriptive, base indispensable pour la suite de leur parcours.
Très concret, ancré dans la méthodologie propre à la psychologie, il décrit la statistique descriptive sous toutes ses formes (tableaux, graphiques, résumés numériques) grâce à des explications pas-à-pas. Il propose également des applications sur le logiciel R (libre et gratuit).
Enrichi de nombreuses illustrations pour mieux visualiser et d’exemples ludiques pour dédramatiser la matière, ce guide progressif permettra à chaque étudiant d’apprivoi-ser la statistique et de l’utiliser de manière autonome et critique. Un véritable passeport pour la réussite !
Chaque fiche contient :> Un résumé de cours avec les grands concepts
à maîtriser> Des applications, notamment sur R> Des conseils méthodologiques > Des exercices avec corrigés détaillés
Statistique descriptive
PSY
CH
O
PSY
CH
O
Stéphanie Baggioest docteure en psychologie sociale et statisticienne, chargée de mission aux Hôpitaux Universitaires de Genève et première assistante à l’Institut des sciences sociales de l’Université de Lausanne.
Stéphane Rothenest docteur en épidémiologie psychia-trique, psychologue adjoint aux Hôpitaux Universitaires de Genève et Privat-Docent à la Faculté d’économie et de management de l’Université de Genève.
Stéphane Delineest docteur en psychologie différentielle et ingénieur de recherche au sein de l’Université Bretagne Sud.
L1L2
PS_PSY_STATS.indd 1 20/07/2017 11:03