transparents philippe lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un...

53
SOCI1241-1 El´ ements du calcul des probabilit´ es appliqu´ ees aux sciences sociales et exercices pratiques (en ce compris les bases de statistiques inf´ erentielles) Transparents Philippe Lambert http : //www.statsoc.ulg.ac.be/proba.html Facult´ e des Sciences Sociales Universit´ e de Li` ege

Upload: others

Post on 25-Jun-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

SOCI1241-1 Elements du calcul des probabilites appliquees

aux sciences sociales et exercices pratiques

(en ce compris les bases de statistiques inferentielles)

Transparents

Philippe Lambert

http : //www.statsoc.ulg.ac.be/proba.html

Faculte des Sciences Sociales

Universite de Liege

Page 2: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Avertissement - Droits d’auteur

Les supports de cours mis sur Internet ont pour seulevocation d’etre utilises par les etudiants dans le cadrede leur cursus au sein de l’Universite de Liege. Aucunautre usage ni diffusion ne sont autorises, sous peinede constituer une violation de la Loi du 30 juin 1994relative aux droits d’auteurs.

Les supports de cours mis sur Internet ne represententpas l’entierete de la matiere, mais constituent lesnotes de base indispensables et minimales a la bonneconnaissance de celle-ci.

P. Lambert c© - Faculte des sciences sociales

Page 3: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

References

Pratiquement n’importe quel livre introductif a la statistique peut convenir.

Quelques references que vous pourriez trouver utiles:

• Agresti, A. and Finlay, B. (2013, 4th edition) Statistical Methods for the Social

Sciences. Prentice Hall. ISBN 978-1292021669. Prix: ± 75 euros.

• Howell, D.C (2008) Methodes Statistiques en Sciences Humaines. De Boeck.

ISBN 978-2804156855. Prix: ± 55 euros.

P. Lambert c© - Faculte des sciences sociales Probabilites - 1

Page 4: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Objectifs du cours

• Proposer une introduction a la theorie des probabilites (chap. 1) en se concentrant

sur les elements strictement utiles a une bonne comprehension des outils de base en

statistique appliquee.

• Proposer une introduction a l’inference statistique:

-1- Elements de base de la theorie de l’estimation:

. estimation et comparaison de proportions (chap. 2 et 4);

. estimation et comparaison de moyennes (chap. 3);

-2- Association entre variables categorielles (chap. 4):

. visualisation;

. quantification;

. test d’independance.

• Assurer, via les travaux pratiques, que ces concepts sont bien integres et peuvent

etre mis en oeuvre pratiquement.

P. Lambert c© - Faculte des sciences sociales Probabilites - 2

Page 5: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Ch 1: Introduction a la theorie des probabilites

Population et echantillon: l’inference statistique

• Jusqu’ici, nous nous sommes contentes de resumer graphiquement et numeriquement

l’information disponible dans un echantillon de donnees.

• En sciences humaines, il est frequent que ces donnees soient relatives a des variables

mesurees sur les individus d’un sous-groupe de la population.

• Differentes techniques permettent d’assurer, au travers de la procedure de selection,

une certaine representativite des individus retenus (cfr. theorie des sondages).

• L’inference statistique a pour objectif l’estimation de caracteristiques de la

population etudiee au travers de mesures realisees sur l’echantillon.

Ex Dans un pays sans registre national: estimation du nombre moyen d’enfants par

femme au depart d’une enquete realisee aupres d’un echantillon aleatoire de femmes

de cette population.

P. Lambert c© - Faculte des sciences sociales Probabilites - 3

Page 6: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

• Cette inference permet egalement d’evaluer la pertinence d’hypotheses:

Ex En Belgique, le nombre moyen d’enfants par femme est-il le meme quel que soit

le niveau de formation de la mere? De nouveau, une enquete aupres d’un nombre

restreint (mais representatif) de femmes devrait permettre de repondre a la question.

Ex Suivre des cours preparatoires augmente les chances de reussite en 1ere annee de

bac?

• Les probabilites permettent de quantifier l’information presente dans un echantillon

a propos de certains aspects de la population etudiee.

Cet outil est donc fondamental pour faire de l’inference statistique.

P. Lambert c© - Faculte des sciences sociales Probabilites - 4

Page 7: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Probabilites

Definition frequentiste• On peut voir la probabilite d’un evenement comme etant la proportion de fois que

cet evenement se produit apres repetition un grand nombre de fois de l’”experience”.

Ex Probabilite qu’une femme residant en Belgique choisie au hasard (via le Registre

national) soit mere de 2 enfants: c’est, parmi les N residentes eligibles (=population),

la proportion x/N ou x est le nombre de telles femmes egalement meres de 2 enfants.

Ex Probabilite de faire ’pile’ lors du

lance d’une piece de monnaie equilibree.

• Le nombre de lances N n’etant pas

fixe a une valeur finie, il s’agit alors de

la valeur limite prise par la proportion de

’piles’ (cad la frequence relative de ’pile’)

lorsque N →∞.

• La frequence relative de ’pile’ tend a

se stabiliser autour de 0.50. 0 500 1000 1500 2000

0.0

0.2

0.4

0.6

0.8

1.0

Nombre de lancés

Fré

quen

ce r

elat

ive

de 'p

ile'

P. Lambert c© - Faculte des sciences sociales Probabilites - 5

Page 8: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Limites de la definition frequentiste

Ex Probabilite de reussite cette annee en 1er bac a l’ULg:

La population est clairement definie: c’est l’ensemble des N etudiants de 1er bac

inscrits a l’ULg cette annee academique. La probabilite recherchee est x/N ou x est

le nombre d’etudiants qui reussiront. Cependant, x n’est pas encore connu. . .

Ex Probabilite de reussite de John inscrit cette annee academique en 1er bac a l’ULg:

. La population se reduit ici a John qui reussira ou ne reussira pas son annee.

. On pourrait eventuellement le voir comme faisant partie d’un sous-groupe de N

etudiants presentant les memes chances de reussites: x/N serait alors la probabilite

recherchee. . . ou x est le nombre (encore inconnu) d’etudiants, parmi ceux-la, qui

reussiront.

Ex Probabilite que ”l’Homme marche sur Mars d’ici 2030”:

la definition frequentiste est clairement inapplicable ici.

P. Lambert c© - Faculte des sciences sociales Probabilites - 6

Page 9: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Definition ”subjective”

• Alternativement, on peut definir la probabilite comme etant une mesure de convic-

tion, a partir de l’information a sa disposition (information a priori), d’un individu donne

par rapport a une affirmation. C’est, a ses yeux, la plausibilite de cette affirmation.

Cette mesure est donc potentiellement specifique a la personne concernee.

• Plusieurs qualificatifs sont associes a cette ”definition”: certains parlent de prob-

abilites logiques, d’autres de probabilites subjectives (H. Jeffreys, R.T. Cox, E.T.

Jaynes).

• Il est cependant remarquable qu’il y ait un consensus quant aux lois regissant la

manipulation de ces plausibilites (egalement appelees probabilites ci-dessous).

• Dans la presentation faite traditionnellement par les frequentistes, elles sont d’origine

axiomatique (axiomatique de Kolmogorov).

• Dans l’approche subjective, on peut voir ces lois comme etant la consequence de

quelques regles du bon sens commun (E.T. Jaynes, Probability Theory: The Logic of

Science, Cambridge University Press, 2006).

P. Lambert c© - Faculte des sciences sociales Probabilites - 7

Page 10: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Notations

• Soit C, la proposition reprenant l’ensemble de l’information disponible (a priori).

Ex Lors du lance d’un de, il pourrait s’agir des proprietes du de, de la maniere dont

le de est lance, du traitement specifique qui est fait d’un de casse, etc.

Ex Lance d’une piece de monnaie: les proprietes de la piece (ex: equilibree) et du

lance.

• P(A|C): la probabilite que A soit vraie si C est vraie.

• P(A|C): la probabilite que A soit fausse si C est vraie.

• P(A + B|C): la probabilite que A ou B soient vraies si C est vraie.

• P(AB|C): la probabilite que A et B soient vraies si C est vraie.

• P(A|BC): la probabilite que A soit vraie si B et C le sont.

Autrement dit, pour une information contextuelle donnee C, c’est la probabilite que

la proposition A soit vraie sachant que B est vraie.

Ex C = “Je lance (sans tricher) un de standard a 6 faces” ; B = “J’obtiens un resultat

pair” ; A = “Le resultat est 3”.

P. Lambert c© - Faculte des sciences sociales Probabilites - 8

Page 11: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Definition ”subjective”: regles regissant la plausibilite

Regle 1: La plausibilite d’une proposition est mesuree a l’aide d’un nombre reel.

• Convention: la plausibilite d’une proposition augmente avec le nombre reel qui lui

est associe.

Ce choix est evidemment arbitraire: nous aurions pu faire le choix inverse

P. Lambert c© - Faculte des sciences sociales Probabilites - 9

Page 12: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Definition ”subjective”: regles regissant la plausibilite (2)

Regle 2: Correspondence qualitative avec le bon sens.

• Considerons les affirmations suivantes pour illustrer le propos ci-dessous:

. C: John vient de s’inscrire en 1er bac.

. C ′: John, inscrit en 1er bac, assiste attentivement a tous les cours.

. A: John va reussir son annee.

. B: Jack va reussir son annee.

(John et Jack ne se connaissent pas).

• Si une information ancienne C (cad la proposition C est vraie) est remise a jour par

C ′ (cad la proposition C ′ est vraie) de facon a ce que:

. P(A|C ′) > P(A|C): la plausibilite de la proposition A augmente,

. P(B|AC ′) = P(B|AC): la plausibilite de B etant donne A n’est pas affectee,

alors P(AB|C ′) ≥ P(AB|C) (la plausibilite de la prop. AB ne peut pas diminuer).

P. Lambert c© - Faculte des sciences sociales Probabilites - 10

Page 13: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Definition ”subjective”: regles regissant la plausibilite (3)

Regle 3: Etre coherent.

Entre d’autres termes:

-a- S’il y a plusieurs facons d’aboutir a la quantification de la plausibilite d’une propo-

sition, on doit aboutir au meme resultat.

-b- Toute l’information disponible doit etre utilisee pour quantifier une plausibilite.

(pas de dogmatisme).

-c- A donnees equivalentes, on aboutit a la meme quantification.

Definition ”subjective”: consequences des 3 regles

De ces 3 regles (et de la convention), il est possible de demontrer les resultats suivants:

(R.T. Cox. Probability, frequency and reasonable expectation, American Journal of Physics, Vol. 14: pp. 1-13, 1946)

P. Lambert c© - Faculte des sciences sociales Probabilites - 11

Page 14: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Regles fondamentales du calcul des probabilites

Le calcul des probabilites (frequentistes ou subjectives) repond aux regles suivantes:

• Si A est une proposition, alors 0 ≤ P(A|C) ≤ 1.

• La valeur 0 traduit l’impossibilite, alors que 1 traduit la certitude.

Ex C = “Je lance (sans tricher) un de standard a 6 faces” ; B = “J’obtiens un resultat

pair” ; A = “Le resultat est 3”. on a P(A|BC) = 0 et P(B|AC) = 1.

• Principe d’indifference : si, sachant que C est vraie,

. les propositions A1, . . . , An sont mutuellement exclusives (cad, si une est vraie,

les autres sont necessairement fausses) et exhaustives (au moins une est vraie);

. le fait que C soit vraie ne favorise pas une des propositions A1, . . . , An,

alors A1, . . . , An sont equiprobables et P(A1|C) = . . . = P(An|C) = 1/n.

Ex C = “Je lance (sans tricher) un de standard a 6 faces” ; Ai=“J’obtiens i comme

resultat” pour i = 1, . . . , 6. Les propositions A1, . . . , A6 etant mutuellement exclu-

sives et exhaustives, et C ne favorisant aucune d’entre elles, le principe d’indifference

suggere que P(A1|C) = . . . = P(An|C) = 1/6.

P. Lambert c© - Faculte des sciences sociales Probabilites - 12

Page 15: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

• P(A|C) + P(A|C) = 1.

Ex C = “Je lance (sans tricher) un de standard a 6 faces” ; A = “Le resultat est 3”.

Par le principe d’indifference, on a P(A) = 1/6. Donc, P(A|C) = 1− 1/6 = 5/6.

• Regle du produit : P(AB|C) = P(A|BC) P(B|C) = P(B|AC) P(A|C).

Ex Lorsque Roger sert au tennis, il manque son 1er (resp. 2eme) service dans 44%

(resp. 2%) des cas. Quelle est la probabilite qu’il fasse une double faute? Soit C

l’information contextuelle precedente, A=“Roger manque son 1er service” etB=“Roger

manque son 2eme service”. On a P(A|C) = 0.44, P(B|AC) = 0.02 et par la regle

du produit P(AB|C) = 0.02× 0.44 = 0.009, soit environ 1 fois sur 100.

• Independance : lorsque P(B|AC) = P(B|C), on dit que les propositions A et

B sont independantes (si C est vraie).

Ex La probabilite d’avoir un garcon lors d’une naissance est de 0.52. Quelle est

la probabilite d’avoir 2 garcons dans une famille de 2 enfants ? Si A (resp. B)

est la proposition “avoir un garcon” lors de la 1ere (resp. 2eme) naissance, alors

P(AB|C) = P(B|AC) P(A|C) = P(B|C) P(A|C) = 0.52× 0.52 = 0.27

P. Lambert c© - Faculte des sciences sociales Probabilites - 13

Page 16: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

• Regle de la somme : P(A + B|C) = P(A|C) + P(B|C)− P(AB|C).

Ex Quelle est la probabilite qu’une famille de 2 enfants compte au moins un garcon?

Avec les memes definitions que precedemment, la probabilite recherchee vaut P(A +

B|C) = P(A|C) + P(B|C)− P(AB|C) = 0.52 + 0.52− 0.27 = 0.77.

Remarques

• Le conditionnement sur l’information contextuelle, incarnee par l’affirmation C, est

fondamental pour l’obtention des resultats.

Ex Imaginons que je vous informe que “je lance une piece de monnaie non equilibree”

(=C) et que je vous demande de quantifier la probabilite de la proposition A=“le

resultat est pile”.

Assez naturellement, sans information complementaire, vous allez vous referer a votre

experience passee et supposer, en plus, que la piece presente un cote “face” et un

cote “pile”, et ne peut pas retomber en equilibre sur le tranchant: votre information

contextuelle est desormais C ′.

Ne sachant pas quel cote de la piece est favorise par le desequilibre, vous obtenez, en

utilisant le principe d’indifference, P(A|C ′) = P(A|C ′) = 1/2.

P. Lambert c© - Faculte des sciences sociales Probabilites - 14

Page 17: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Je vous donne maintenant l’occasion d’examiner la piece et vous constatez que la

piece presente 2 cotes “pile”. Avec votre nouvelle information contextuelle C ′′, vous

obtenez P(A|C ′′) = 1.

Cet exemple souligne que l’information contextuelle est avant tout le reflet des connais-

sances de l’observateur a propos du systeme observe. La probabilite finalement obtenue

peut donc varier d’un observateur a un autre sans que les proprietes intrinseques du

systeme aient change. Cependant, sur base d’exactement la meme information con-

textuelle, les observateurs doivent aboutir au meme resultat.

• Il est remarquable que les memes regles de calcul s’imposent aux probabilites frequentistes

(= frequences relatives) et subjectives (= quantification d’une conviction).

P. Lambert c© - Faculte des sciences sociales Probabilites - 15

Page 18: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Theoreme de probabilite totale

• Pour alleger les notations ci-dessous, nous laissons tomber ”|C”, cad le condi-

tionnnement sur l’information contextuelle, dans la notation de la probabilite.

• Si A1, . . . , An sont n propositions mutuellement exclusives et exhaustives, alors

P(B) = P(B|A1)P(A1) + . . . + P(B|An)P(An).

Cas particulier: P(B) = P(B|A)P(A) + P(B|A)P(A).

Ex Garry participe a un tournoi d’echecs. Son prochain adversaire sera tire au hasard

parmi les autres participants. Il estime sa probabilite de victoire a 0.30 contre la moitie

des adversaires potentiels, a 0.40 contre un quart des autres joueurs, et a 0.50 contre

le dernier quart. Sachant cela, quelle est la probabilite qu’“il remporte sa prochaine

partie” (=B)?

Si Ai est la probabilite que son adversaire fasse partie du ieme groupe de joueurs, alors

P(B|A1) = 0.30,P(B|A2) = 0.40,P(B|A3) = 0.50.

Donc, P(B) = 0.30× 0.50 + 0.40× 0.25 + 0.50× 0.25 = 0.375.

P. Lambert c© - Faculte des sciences sociales Probabilites - 16

Page 19: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Theoreme de Bayes (UK, 1702-1761)

Si P(A) > 0, alors P(B|A) =P(A|B)P(B)

P(A)

Ex Un cancer affecte 3 personnes sur 1000 dans une population. Par experience, on

sait qu’un test de depistage precoce donne un resultat positif chez 98% des personnes

atteintes contre 5% chez des personnes non atteintes. Quelle est la probabilite qu’une

personne presentant un resultat positif souffre de ce cancer? [Rep.: 5.5%].

Remarque

Ce theoreme joue un role fondamental en (inference) statistique.

Il va permettre de remettre a jour la plausibilite d’un evenement ou d’une hypothese

a la lumiere d’informations nouvelles.

P. Lambert c© - Faculte des sciences sociales Probabilites - 17

Page 20: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Distributions de probabilite

• Nous avons deja rencontre la distribution empirique des frequences (relatives) en

statistique descriptive.

Cette distribution donne les frequences (relatives) avec lesquelles on observe les differentes

donnees de l’echantillon considere.

Ex Nombre de jours d’absence dans une entreprise comptant 280 personnes:

Absences 0 1 2 3 4 5 6 7 8 9 10 11 12 13

Frequences 12 8 20 35 40 46 47 30 18 7 11 3 2 1

Freq. relatives 4% 3% 7% 12% 14% 16% 17% 11% 6% 3% 4% 1% 1% 0%

P. Lambert c© - Faculte des sciences sociales Probabilites - 18

Page 21: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Distributions . . . (2)

Distribution de probabilite

C’est un modele theorique qui est utilise pour calculer la probabilite qu’un evenement

se realise. On le specifie par deux choses:

-1- L’espace d’echantillonnage E : ensemble de tous les resultats possibles pour

l’experience consideree. Les elements de cet ensemble sont appeles evenements sim-

ples: ils sont mutuellement exlusifs.

Ex Resultat du lance d’un de: {1, 2, 3, 4, 5, 6}Ex Nombre d’enfants par couple: {0, 1, 2, 3, . . .}

-2- Les probabilites associees a chaque evenement simple. Ces probabilites sont des

nombres

. compris entre 0 et 1,

. dont la “somme” fait 1.

P. Lambert c© - Faculte des sciences sociales Probabilites - 19

Page 22: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Distributions . . . (3)

• La theorie des probabilites ne nous dit pas comment determiner ces probabilites. Les

valeurs qui seront cependant specifiees devront refleter l’etat des connaissances sur le

sujet (cf. conditionnement sur l’information contextuelle).

Ex Lance du de: si nous n’avons aucune information concernant ce de (hormis qu’il

ressemble a un cube avec un resultat different par face), les plausibilites de chaque

resultat sont a priori identiques:

p1 = . . . = p6 et p1 + . . . + p6 = 1 ⇒ pi =1

6∀ i

Ces probabilites pouront etre remises a jour s’il s’avere a l’usage que le de n’est pas

equilibre.

P. Lambert c© - Faculte des sciences sociales Probabilites - 20

Page 23: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Variable aleatoire

• Variable aleatoire: c’est une variable qui peut prendre differentes valeurs avec

une probabilite donnee. La distribution (de probabilite) de la variable aleatoire reprend

les differentes valeurs possibles (= evenements simples associes a la variable) pour

cette variable et les probabilites d’observer chacune de ces valeurs pour la variable.

Ex Naissance d’un enfant (=experience). On peut, parmi beaucoup d’autres choses,

associer a cette experience une variable aleatoire X indiquant le sexe de l’enfant:

X = 0 si c’est une fille et 1 sinon.

L’information contextuelle est l’ensemble des connaissances dont nous diposons sur le

sujet. Elle pourrait nous amener a specifier

p0 = 0.48 ; p1 = 0.52

• Nous avons etudie en statistique descriptive differentes manieres de classer les vari-

ables. Ces classifications restent d’actualite avec les variables aleatoires.

P. Lambert c© - Faculte des sciences sociales Probabilites - 21

Page 24: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Distributions discretes

• Une distribution est discrete lorsqu’elle est associee a une variable aleatoire discrete.

• L’espace d’echantillonnage associe est donc discret (“on peut compter les evenements

simples”).

Distribution uniforme

Une distribution discrete est dite uniforme si

. l’espace d’echantillonnage comporte un nombre fini K d’evenements simples ;

. tous les evenements simples ont la meme probabilite 1/K.

Ex Jet d’un de equilibre: si X enregistre le resultat du lance, on a E = {1, 2, 3, 4, 5, 6}et pk = Pr(X = k) = 1/K avec k ∈ E .

1 2 3 4 5 6

Distribution uniforme

Probabilité

0.00

0.05

0.10

0.15

P. Lambert c© - Faculte des sciences sociales Probabilites - 22

Page 25: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Moyenne d’une variable aleatoire discrete

• Pour introduire cette notion, considerons l’exemple precedent du jet de de.

Imaginons que le de ait ete lance N fois avec une communication des resultats via la

distribution empirique des frequences:

X 1 2 3 4 5 6 Total

Freq. n1 n2 n3 n4 n5 n6 N

Freq. rel. w1 w2 w3 w4 w5 w6 1

avec wk = nk/N .

• Alors la moyenne arithmetique des resultats est

x = w1 × 1 + . . . + w6 × 6 =∑xk∈E

wkxk avec xk = k

P. Lambert c© - Faculte des sciences sociales Probabilites - 23

Page 26: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

... Moyenne (suite)

• Plus concretement, le tableau suivant reprend la frequence nk (la frequence relative

wk) observee pour chacun des 6 resultats possibles tous les 50 jets de de:

Nombrede lances n1 (w1) n2 (w2) n3 (w3) n4 (w4) n5 (w5) n6 (w6) x σ2

50 7 (0.140) 7 (0.140) 7 (0.140) 4 (0.080) 12 (0.240) 13 (0.260) 3.92 3.23100 14 (0.140) 14 (0.140) 15 (0.150) 12 (0.120) 22 (0.220) 23 (0.230) 3.83 3.08150 26 (0.173) 17 (0.113) 23 (0.153) 20 (0.133) 32 (0.213) 32 (0.213) 3.74 3.17200 37 (0.185) 26 (0.130) 32 (0.160) 24 (0.120) 42 (0.210) 39 (0.195) 3.63 3.19...

• Le graphe ci-contre montre comment

la moyenne des resultats evolue avec

le nombre de lances, chaque symbole

faisant le point apres 50 nouveaux

lances.

• Clairement, la moyenne arithmetique x

tend a se stabiliser autour de 3.5.

●●

●●

● ● ●

● ● ● ●● ● ●

●●

●●

● ●● ● ● ● ●

● ●● ●

●● ● ● ● ●

0 500 1000 1500 2000

3.0

3.2

3.4

3.6

3.8

4.0

Nombre de lancés

Moy

enne

des

rés

ulta

ts:

x

P. Lambert c© - Faculte des sciences sociales Probabilites - 24

Page 27: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

... Moyenne (fin)

• Cela s’explique facilement au depart de la formule de la moyenne arithmetique:

x = w1 × x1 + . . . + w6 × x6

En effet, a mesure que le nombre de lances N augmente, la frequence relative wkassociee a l’evenement simple X = xk (cad obtenir ’k’ lors du lance) tend vers la

probabilite pk de cet evenement.

• Par consequent, a la limite, x tend vers

p1 × x1 + p2 × x2 + . . . + p6 × x6 =1

6× 1 +

1

6× 2 + . . . +

1

6× 6 = 3.5

• Plus generalement, on appelle esperance d’une variable aleatoire discrete X d’espace

d’echantillonnage E = {x1, x2, . . .} avec probabilites associees {p1, p2, . . .}, le nombre

X = E(X) = µX = µ =∑xk∈E

pkxk

• Propriete:

E(a + bX) = a + bE(X)

P. Lambert c© - Faculte des sciences sociales Probabilites - 25

Page 28: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Variance d’une variable aleatoire discrete

• Le meme constat peut etre fait pour la variance

σ2 = w1 × (1− x)2 + . . . + w6 × (6− x)2

• A mesure que la taille de l’echantillon augmente, elle tend a se stabiliser autour de

σ2 = p1×(1−µ)2 + . . .+p6×(6−µ)2 =1

6×(1−3.5)2 + . . .+

1

6×(6−3.5)2 = 2.917

• Plus generalement, on appelle variance d’une variable aleatoire discrete X d’espace

d’echantillonnage E = {x1, x2, . . .} avec probabilites associees {p1, p2, . . .}, le nombre

σ2 = Var(X) = E(X−µ)2 = p1× (x1−µ)2 +p2× (x2−µ)2 + . . . =∑xk∈E

pk(xk−µ)2

• La variance quantifie la variabilite de X .

• Proprietes:

σ2 = E(X − µ)2 = . . . = E(X2)− µ2

V (a + bX) = b2Var(X)

P. Lambert c© - Faculte des sciences sociales Probabilites - 26

Page 29: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Distribution de Bernoulli (1654-1705, Suisse)• La distribution de Bernoulli surgit lorsqu’on considere une experience

avec seulement deux resultats possibles: le succes ou l’echec.

Ex Sexe d’un enfant a la naissance: succes si c’est un garcon (X = 1

avec probabilite p) et 0 sinon.

• L’espace d’echantillonnage est E = {0, 1} et p0 = 1− p ; p1 = p.

•Moyenne et variance:

µ = E(X) =∑xi ∈ E

pixi = p0 × 0 + p1 × 1 = p

σ2 = E(X − µ)2 = E(X2)− µ2 = p0 × 02 + p1 × 12 − p2 = p(1− p)

• La variance est nulle lorsque p = 0 (’succes’ impossible) ou p = 1 (’succes’ garanti):

dans ces 2 cas, la valeur prise par X est totalement previsible.

• La variance est maximum et egale a 0.25 si p = 0.50: c’est la situation dans laquelle

le resultat est le plus incertain.

P. Lambert c© - Faculte des sciences sociales Probabilites - 27

Page 30: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Distribution binomiale

• Schema de Bernoulli: considerons maintenant l’experience composite consistant

en la repetition de l’experience precedente n fois de maniere independante avec une

probabilite p de succes constante.

• On peut associer a cette experience composite la variable aleatoire X comptant le

nombre total de succes (Ex le nombre de garcons parmi n enfants).

-1- L’espace d’echantillonnage est (Ex n = 10: nombre d’eleves dans une classe).

E = {0, 1, 2, . . . , n}

-2- Les probabilites associees sont (Ex p = 0.52: probabilite d’un garcon).

px = Pr(X = x) =n!

x! (n− x)!px (1− p)n−x

• Note: X = X1 +X2 + . . .+Xn ou Xi = 1 si le ieme bebe est un garcon (0 sinon).

• k! = k(k − 1)(k − 2) . . . 1

P. Lambert c© - Faculte des sciences sociales Probabilites - 28

Page 31: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

... Binomiale (suite)

• Par definition, une telle distribution est dite binomiale.

• Notation: X ∼ Bin(n, p)

∼ = “a comme distribution”

Ex : n = 10 et p = 0.52

x 0 1 2 3 4 5 6 7 8 9 10

px 0.001 0.007 0.034 0.099 0.188 0.244 0.220 0.136 0.055 0.013 0.001

0 1 2 3 4 5 6 7 8 9 10

Bin(10,0.52)

Probabilité

0.00

0.10

0.20

P. Lambert c© - Faculte des sciences sociales Probabilites - 29

Page 32: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Binomiale: moyenne et variance

•Moyenne et variance: comme lesXi’s sont des variables aleatoires independantes

avec une distribution de Bernoulli,

E(X) = E(X1)+ . . . E(Xn) = np ; Var(X) = Var(X1)+ . . .Var(Xn) = np(1−p)

Ex Dans une population dont les naissances

ne sont pas controlees, la probabilite d’avoir

un garcon est 0.52. Considerons par exem-

ple une famille de n = 3 enfants. Sous les

hypotheses decrites precedemment (. . . ), le

nombre X de garcons a une distribution binomi-

ale Bin(n = 3, p = 0.52).

L’esperance de X vaut donc µ = E(X) = 3 ×0.52 = 1.56. C’est, le nombre moyen de garcons

que l’on constatera dans les familles de 3 enfants

si cette moyenne est calculee a partir d’un grand

nombre de telles familles.

0 1 2 3

0.0

0.1

0.2

0.3

x 0 1 2 3

px 0.11 0.36 0.39 0.14

P. Lambert c© - Faculte des sciences sociales Probabilites - 30

Page 33: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

• Remarque: en pratique, p est souvent inconnu et doit donc etre estime.

Fonction de distribution

• Considerons cette fois une classe de n = 10 enfants en maternelle. Si la probabilite

d’avoir un garcon est p = 0.52, alors la probabilite d’avoir au plus 3 garcons vaut:

Pr(X ≤ 3) = Pr(X = 0 ou X = 1 ou X = 2 ou X = 3) = p0 + p1 + p2 + p3 = 0.14

• Tout a fait generalement, on peut s’interesser

a la fonction de distribution (aussi appelee fonc-

tion de repartition) de X

F (x) = Pr(X ≤ x) .

• Le caractere discret de X se manifeste par

une fonction F discontinue. −2 0 2 4 6 8 10 120.

00.

20.

40.

60.

81.

0

Bin(10,0.52)

x

F(x

)

P. Lambert c© - Faculte des sciences sociales Probabilites - 31

Page 34: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Distribution de Poisson (1781-1840, France)

• Une variable aleatoire suit une distribution de Poisson lorsqu’elle compte

le nombre d’evenements survenant au hasard et independamment dans le

temps ou l’espace a un taux moyen µ (par unite de temps ou d’espace).

Ex Nombre X d’accidents par an a un carrefour dangereux. Si ces accidents se

produisent aleatoirement durant la periode d’observation avec une moyenne de λ acci-

dents par semaine, alors le nombre d’accidents durant une annee suit une distribution

de Poisson de moyenne µ = 52× λ.

• La distribution de X est donnee par

-1- Espace d’echantillonnage: E = {0, 1, 2, . . .}

-2- Probabilites:

px = Pr(X = x) = e−µµx

x!(x ∈ E)

• Notation: X ∼ Pois(µ)

• Note: contrairement a une variable aleatoire binomiale, une variable aleatoire Poisson

n’a pas de contrainte superieure (comptage illimite).

P. Lambert c© - Faculte des sciences sociales Probabilites - 32

Page 35: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Proprietes

• Moyenne et variance: E(X) = V(X) = µ

• Si x > 0, on a px = px−1 × µx avec p0 = e−µ.

Ex Si X∼ Pois(µ = 3.5)

x 0 1 2 3 4 5 6 7 8 9 10

px 0.030 0.106 0.185 0.216 0.189 0.132 0.077 0.039 0.017 0.007 0.002

P. Lambert c© - Faculte des sciences sociales Probabilites - 33

Page 36: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Poisson... comme approximation d’une binomiale

• Lorsque n est grand et que p est petit,

Bin(n, p) ≈ Pois(µ = np)

En pratique: des que n > 50 et p < 0.10.

Ex Cancer du sein: y a-t-il une composante familiale (environnementale ou genetique)

dans ce cancer ?

. Fait: ce cancer touche 1 femme sur 1000 parmi les 40-49 ans (p = 0.001).

. Une etude aupres de 1000 femmes avec une mere ayant eu un cancer du sein

revele 4 cas de cancer de sein (soit 4 fois plus qu’attendu).

? Cela peut-il etre considere comme une preuve de la composante familiale?

Elements de la reponse:

. Sous H0 : “pas de composante familiale”,

X ∼ Bin(n = 1000, p = 0.001) ≈ Pois(np = 1).

. Pr(X ≥ 4|H0) = 1− Pr(X ≤ 3) = 1− (p0 + p1 + p2 + p3) = . . . = 0.019.

P. Lambert c© - Faculte des sciences sociales Probabilites - 34

Page 37: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Distributions continues

• Nous allons maintenant nous consacrer aux variables aleatoires continues: l’espace

d’echantillonnage prend la forme d’un intervalle et il est impossible de compter les

valeurs possibles pour cette variable aleatoire.

Ex Age, taille ou poids d’un individu choisi au hasard dans une population donnee:

l’espace d’echantillonnage est E = (0,+∞).

• Probabilites: on associe a une variable

aleatoire continue une densite de proba-

bilite, cad une fonction f telle que

. 0 ≤ f (x) pour tout x dans E ;

. l’aire “en-dessous” de f soit 1.0.1 0.2 0.3 0.4 0.5

01

23

45

Densite d’une variable aleatoire continue

x

f(x)

P. Lambert c© - Faculte des sciences sociales Probabilites - 35

Page 38: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Pr(a < X ≤ b) = Aire sous f entre a et b

0.1 0.2 0.3 0.4 0.5

01

23

45

Pr(0.3<X<=0.4)

x

f(x)

P. Lambert c© - Faculte des sciences sociales Probabilites - 36

Page 39: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Pr(X ≤ a) = Aire sous f entre −∞ et a

0.1 0.2 0.3 0.4 0.5

01

23

45

Pr(X<=0.3)

x

f(x)

P. Lambert c© - Faculte des sciences sociales Probabilites - 37

Page 40: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Pr(X > b) =Aire sous f entre b et +∞

0.1 0.2 0.3 0.4 0.5

01

23

45

Pr(X>0.4)

x

f(x)

P. Lambert c© - Faculte des sciences sociales Probabilites - 38

Page 41: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Moyenne d’une v.a. continue

• Pour rappel, si X est une variable aleatoire discrete X d’espace d’echantillonnage

E = {x1, x2, . . .} avec probabilites associees {p1, p2, . . .}, la moyenne de X est definie

par

X = E(X) = µX = µ =∑xk∈E

pkxk

• Si, cette fois, X est une v.a. continue avec espace d’echantillonnage E , par ex

(0,+∞), et densite f (x), la moyenne (= l’esperance) de X est definie par

X = E(X) = µX = µ =

∫Ex f (x) dx

pour autant que cette integrale soit finie.

• Propriete:

E(a + bX) = a + bE(X)

P. Lambert c© - Faculte des sciences sociales Probabilites - 39

Page 42: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Variance d’une v.a. continue

• Pour rappel, on appelle variance d’une variable aleatoire discreteX d’espace d’echantillon-

nage E = {x1, x2, . . .} avec probabilites associees {p1, p2, . . .}, le nombre

σ2 = Var(X) = E(X−µ)2 = p1× (x1−µ)2 +p2× (x2−µ)2 + . . . =∑xk∈E

pk(xk−µ)2

• Si, cette fois, X est une v.a. continue avec espace d’echantillonnage E , par ex

(0,+∞), et densite f (x), la variance de X est definie par

σ2 = Var(X) = E(X − µ)2 = µ =

∫E(x− µ)2 f (x) dx

pour autant que cette integrale soit finie.

• Proprietes:

σ2 = E(X − µ)2 = . . . = E(X2)− µ2

V (a + bX) = b2Var(X)

• Si X1, . . . , Xn sont des v.a. (associees a des experiences) independantes, alors

Var(X1 + . . . + Xn) = Var(X1) + . . .Var(Xn)

P. Lambert c© - Faculte des sciences sociales Probabilites - 40

Page 43: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Distribution Normale (Gauss, 1777-1855, Allemagne)

• Une variable aleatoire continue X suit une distribution Normale

de moyenne µ et de variance σ2 lorsque

-1- L’espace d’echantillonnage est E = (−∞,+∞)

-2- La densite de probabilite a pour equation

f (x) =1√

2πσ2e−

12(x−µσ )

2

• Notation: X ∼ N(µ, σ2)

• Interpretation des parametres:

. µ: moyenne,

. σ2: variance.

P. Lambert c© - Faculte des sciences sociales Probabilites - 41

Page 44: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Normale: effet de la moyenne

−6 −4 −2 0 2 4 6

0.0

0.1

0.2

0.3

0.4

x

f(y)

µ=−2

µ=0

µ=2

P. Lambert c© - Faculte des sciences sociales Probabilites - 42

Page 45: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Normale: effet de la variance

−6 −4 −2 0 2 4 6

0.0

0.1

0.2

0.3

0.4

x

f(y)

σ2=1

σ2=4

σ2=9

P. Lambert c© - Faculte des sciences sociales Probabilites - 43

Page 46: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Normale: quelques proprietes

• Distribution completement specifiee lorsqu’on connaıt la moyenne et la variance.

• Unimodale.

• Symetrique par rapport a la moyenne.

• Moyenne = mode = mediane.

• 68% des donnees dans (µ− σ, µ + σ)

95% des donnees dans (µ− 1.96 σ, µ + 1.96 σ)

99% des donnees dans (µ− 2.58 σ, µ + 2.58 σ)

99.7% des donnees dans (µ− 3 σ, µ + 3 σ)

P. Lambert c© - Faculte des sciences sociales Probabilites - 44

Page 47: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Normale: frequente en pratique

• La distribution Normale est souvent rencontree en pratique. En effet, lorsqu’on

contruit l’histogramme d’une variable continue, il n’est pas rare de constater qu’il a

approximativement la forme d’une cloche.

P. Lambert c© - Faculte des sciences sociales Probabilites - 45

Page 48: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Utilisation d’une table N(0, 1)

• Si X ∼ N(µ, σ2), alors

Z =X − µσ∼ N(0, 1)

• Pr(X ≥ x) = Pr(Z ≥ x−µσ )

Ex Sachant que le taille des individus d’une population d’hommes est distribuee suiv-

ant une Normale de moyenne 177 et d’ecart-type 7, quelle est la probabilite qu’une

personne choisie au hasard dans cette population ait une taille superieure a 185?

[Rep.:0.127].

P. Lambert c© - Faculte des sciences sociales Probabilites - 46

Page 49: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Verification de la normalite *

• L’hypothese que des donnees suivent approximativement une distribution Normale

doit etre verifiee en pratique.

• Le Q-Q plot (ou droite de Henry) permet d’evaluer cette hypothese.

On realise un graphique avec

. en ordonnee (axe y): les valeurs observees ordonnees, la ieme observation ete vue

comme une estimation du quantile i/(n + 1)× 100%

. en abscisse (axe x): les quantiles correspondants d’une N(0,1), celui correspon-

dant a la ieme observation etant le quantile i/(n + 1)× 100% de la N(0,1).

Si la Normalite est une hypothese raisonnable, le graphique obtenu devrait approxima-

tivement decrire une droite.

P. Lambert c© - Faculte des sciences sociales Probabilites - 47

Page 50: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

P. Lambert c© - Faculte des sciences sociales Probabilites - 48

Page 51: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Remarques

• En pratique, on utilise beaucoup d’autres distributions continues que la normale: la

gamma, la beta, la chi-carre, la Student, la log-normale, la Pareto, . . . .

• Il est egalement possible de specifier des distributions pour des vecteurs de variables

aleatoires.

Nous les presenterons plus tard au cas par cas si cela est necessaire.

• Note: la fonction

F (x) = Pr(X ≤ x)

est la fonction de repartition de X .

Le caractere continu de la variable aleatoire se

manifeste par la continuite de F .

P. Lambert c© - Faculte des sciences sociales Probabilites - 49

Page 52: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Relations entre distributions

Approximation normale de la binomiale

• Rappel: si X ∼ bin(n, p), alors

. moyenne=np

. variance=np(1− p)

• Constat: lorsque np et np(1 − p) sont grands, la distribution de X tend a devenir

symetrique.

• On peut montrer que lorsque np > 5 et

np(1− p) > 5, on a approximativement

Bin(n, p) ≈ N(np, np(1− p))

• Si X ∼ Bin(n = 30, p = 0.4), que

vaut Pr(X ≤ 15)? Ex: Proba qu’au plus

15 reussites parmi 30 etudiants lorsque

le taux de reussite est de 40%. [Rep.

exacte: 0.9029; Rep. approx: 0.9039]. 0 5 10 15 20 25 30

0.00

0.05

0.10

0.15

Approximation de Bin(30,0.4)

P. Lambert c© - Faculte des sciences sociales Probabilites - 50

Page 53: Transparents Philippe Lambert · 2020-02-18 · cet ev enement se produit apr es r ep etition un grand nombre de fois de l’"exp erience". Ex Probabilit e qu’une femme r esidant

Approximation normale de la Poisson

• Rappel: si X ∼ Pois(µ), alors

. moyenne=µ

. variance=µ

• Constat: lorsque µ augmente, la distri-

bution de X tend a devenir symetrique.

• On peut montrer que

Pois(µ→ +∞) ≈ N(µ, µ)

En pratique: µ ≥ 5.

• Si X ∼ Pois(µ = 6), que vaut

Pr(X ≤ 7)? [Rep. exacte: 0.744].

0 1 2 3 4 5 6 7 8 9 10 12 14 16 18 20

0.00

0.05

0.10

0.15

0.20

0.25

Pois( µ=2 )

0 1 2 3 4 5 6 7 8 9 10 12 14 16 18 20

0.00

0.05

0.10

0.15

Pois( µ=6 )

0 1 2 3 4 5 6 7 8 9 10 12 14 16 18 20

0.00

0.04

0.08

0.12

Pois( µ=10 )

P. Lambert c© - Faculte des sciences sociales Probabilites - 51