la statistique

47
LA STATISTIQUE SON HISTOIRE ET SES APPLICATIONS

Upload: uriel-jimenez

Post on 30-Dec-2015

41 views

Category:

Documents


0 download

DESCRIPTION

LA STATISTIQUE. SON HISTOIRE ET SES APPLICATIONS. LA STATISTIQUE QUELLE EST CETTE DISCIPLINE ?. Petit Robert - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: LA  STATISTIQUE

LA STATISTIQUE

SON HISTOIREET SES APPLICATIONS

Page 2: LA  STATISTIQUE

LA STATISTIQUEQUELLE EST CETTE DISCIPLINE ?

Petit Robert

Etude méthodique des faits sociaux par des procédés numériques (classements, dénombrements, inventaires chiffrés, recensements) destinée à renseigner et à aider les gouvernements.

Ensemble de techniques d’interprétation mathématique appliquées à des phénomènes pour lesquels une étude exhaustive de tous les facteurs est impossible, à cause de leur grand nombre et de leur complexité.

Page 3: LA  STATISTIQUE

LA STATISTIQUE

BIBLIOGRAPHIE

J. J. DROESBEKE et P. TASSI, Histoire de la statistique, Que sais-je ? n°2527, PUF, 1997.

Faut-il se fier aux statistiques ? Tangente, n°77 (octobre - novembre 2000).

G. BRONNER, Coïncidences, Vuibert, 2007.

Page 4: LA  STATISTIQUE

« Statistique » : du latin statisticum (ce qui se rapporte à l’Etat)

Gottfried Achenwall (1746) : premier enseignement de la

statistique (Allemagne)

En fait, origine plus ancienne :

mot déjà utilisé dans un texte administratif de Colbert

(vers 1666)

Page 5: LA  STATISTIQUE

Chefs d’Etats : connaître leur puissance : population, richesses,

potentiel militaire…

idée de recensement

Premiers recensements :

* Sumériens : 5000 à 2000 av J.-C.* Egyptiens : recensements systématiques de la population

Etats forts avec un système administratif fort

Page 6: LA  STATISTIQUE

Au début,

la statistique a consisté à observer des faits

Statistique descriptive

• XIVe siècle : début des enregistrements des actes civils

(naissances, mariages, décès)

Page 7: LA  STATISTIQUE
Page 8: LA  STATISTIQUE

Nombre de morts dans les hôpitaux militaires britanniques (guerre de Crimée)Florence Nightingale (1820-1910)

gris : maladies évitables brun : blessures mortelles rose : autres causes

Page 9: LA  STATISTIQUE

• XVIIe siècle : Probabilités estimations, prévisions

Extrapolation à partir d’une partie de la population(W. Petty: estimation de la population londonienne, 1686)

Juger d’après un échantillon:(problème de la représentativité)

Statistique inférentielle

Page 10: LA  STATISTIQUE

• XXe siècle : développement des sondages (U.S.A.)

* 1885 : création de l’Institut International de la Statistique (IIS)

* 1895 – 1925 : débat sur la représentativité (IIS)

- A. Kiaer (Norvège) : « une partie pour le tout »

réactions violentes

* Après 1925 : « Comment tirer l’échantillon ? »

Page 11: LA  STATISTIQUE

•Date cruciale : 3 novembre 1936

Election présidentielle américaineF. Roosevelt versus G. Landon

•Magazine Literary Digest : 2000 000 personnes (téléphone)

Landon

•G. Gallup : 3 000 personnes Roosevelt

Principe de la validité d’un sondage accepté

Page 12: LA  STATISTIQUE

-5000 -2900 1600 1700 1800 1900

2000

Recensements, sondages

1666: Colbert1746: Achenwall

1885: IIS 1936: Roosevelt vs Landon1938: IFOP

1946: INSEE

Valeurs typiques

1602: moy. arith. Tycho Brahé

1722: moy. pond.Roger Cotes

1757: médianeBoscovich

1805: varianceLegendre, Gauss

1874: moy. géom. moy. Harm. W.S. Jevons

Graphiques 1637: Descartes 1786: diag. en barres diag. en secteurs W. Playfair

1855: diag. pol.F. Nightingale

1874: Pyram. des âges Surf. de corrélation

Indices 1707: nombre indice Fleetwood

1738: indice des prix Dutot

1865: Laspeyres1875: Paasche

Ajustement, corrélation, régression1805-1806Legendre-GaussMoindres carrés

1888 et 1896:Galton et K. PearsonCoef. de Corrélation.

1904: K. Pearson, Khi-deux1904 Spearmann, rho

1938: Kendall

Tau

Page 13: LA  STATISTIQUE

La statistique fait partie de la culture

ANGLO-SAXONNE

Culture probabiliste indispensable

Enorme retard en France

Page 14: LA  STATISTIQUE

• Causes :

- Statistique: parent pauvre des probabilités et des mathématiques

- Forte imprégnation cartésienne

- L’«incertain» est antipédagogique (déstabilisant …)

- Nette préférence pour l’enseignement de certitudes

- Association obligatoire avec une autre discipline (bio., gestion,...)

(l’approche pluridisciplinaire est encore mal acceptée)

Page 15: LA  STATISTIQUE

• Conséquences :

* Bon sens statistique insuffisamment développé

* La présentation de données statistiques : un exercice « difficile »

* « Un chiffre ne peut être qu’exact , exempt de toute

indétermination »

Risque de manipuler l’opinion

Page 16: LA  STATISTIQUE

Exemples :

• moyenne, médiane

• cote de popularité des hommes politiques

• classement des hôpitaux, des lycées…

• rapports d’«experts» …

Page 17: LA  STATISTIQUE

Connaître, c’est mesurer (Brunschvicg)

La statistique nous dit:

* Comment effectuer les mesures

* Comment extraire l’information des mesures

Page 18: LA  STATISTIQUE

INFORMATION

Principale matière première du XXIe siècle

Sa production et son exploitation

statisticiens

Page 19: LA  STATISTIQUE

LA VARIABILITE En général, dans une population, la variabilité

est un critère de qualité , voire une nécessité (pour la survie)

Exception : l’industrie

Le statisticien doit savoir :- appréhender- analyser- « gérer » la variabilité

La variabilité est une entrave à l’inférence statistique

Qualité de la variabilité

Page 20: LA  STATISTIQUE

moyenne variance 2

proportion

Moyenne xvariance s2 proportion x/n

Population Echantillon( x1 , x2 , ...., xn )

tirage

Inférence statistique

inconnues

Page 21: LA  STATISTIQUE

LA STATISTIQUE DESCRIPTIVE

LA STATISTIQUE INFERENTIELLE

Série statistique univariée Série statistique bivariée La modélisation Les plans d’expériences Les sondages L’estimation Les tests statistiques Les séries chronologiques L’analyse des données

Le data mining

Page 22: LA  STATISTIQUE

LA MODELISATION

En général, une observation dépendd’un grand nombre de

facteurs

cause multifactorielle

les effets des facteurs ne sont pas simplement additifs

(présence d’interactions)

Page 23: LA  STATISTIQUE

LA MODELISATION (suite)

Le statisticien va tenter :

d’identifier les facteurs prépondérants

évaluer leur importance relative

expliciter le lien de ces facteurs « causaux »avec le caractère étudié, à

l’aide d’un

modèle mathématique

Page 24: LA  STATISTIQUE

Exemple :

variable expliquée : prix d’une voiture

variables explicatives : cylindrée, puissance, vitesse, largeur, longueur, poids …

prix = 1775 + 103,8 puissance + 9,8 poids (CV DIN) (kg)

Page 25: LA  STATISTIQUE

Exemple: biométrie foetale

Log10 EPF = 1,6961 + 0,02253 PC + 0,01645 PA + 0,06439 LF

(Weiner et al., 1985)

EPF: estimation poids fœtal (en g)PC: périmètre crânien (mm)PA: périmètre abdominal (mm)LF: longueur fémur (mm)

Page 26: LA  STATISTIQUE

Statisticiens Interlocuteurs privilégiés des décideurs

• dans tous les secteurs d’activité :

( politique, économique, scientifique, industriel … )

et

• à tous les niveaux :

(collecte de données, conception des systèmes d’information, contrôle de la production, analyse et restitution des données, etc.)

Page 27: LA  STATISTIQUE

Diversification des métiers de la statistique

Discipline transversale par excellence

Page 28: LA  STATISTIQUE

DOMAINES D’ UTILISATION DE LA STATISTIQUE

STATISTIQUES OFFICIELLES (I.N.S.E.E.) PRESSE – MEDIAS BANQUES – ASSURANCES SCIENCES DE LA VIE ENVIRONNEMENT ( Foresterie, pêche …) SANTE SCIENCES HUMAINES ENTREPRISES – INDUSTRIE ( R&D, contrôle

de qualité, études de marché, management … )

FINANCE RECHERCHE FONDAMENTALE ET APPLIQUEE etc …

Page 29: LA  STATISTIQUE

et même … LA POESIE !

Page 30: LA  STATISTIQUE

• BANQUES

Probabilité qu’un client rembourse son crédit ?

Cette probabilité peut être exprimée en fonction :

- du montant moyen de son compte courant- de la durée du crédit- du montant du crédit- du sexe- de la situation familiale

etc …

Page 31: LA  STATISTIQUE

• ASSURANCES (calcul des primes)

Assurance décès

- Taux d’intérêt- Tables de mortalité- Frais de gestion

Assurance-auto

Tarif unique ou différencié ?

Page 32: LA  STATISTIQUE

• Le risque dépend de nombreux facteurs :

* Assuré :- Age- Sexe- Profession- Résidence- Expérience, etc …

* Véhicule :- Modèle- Puissance, etc …

Page 33: LA  STATISTIQUE

• Etude du « risque ou coût » (actuariat)

par des méthodes de régression

« juste tarif » mieux résister à la concurrenceproblèmes de déontologie et d’éthique

Page 34: LA  STATISTIQUE

SCIENCES DE L’ENVIRONNEMENT

Surveillance d’un milieu (qualité d’une eau,…) Estimation de l’effectif d’une population Toxicologie de l’environnement, analyse du

risque Epidémiologie environnementale Prévision des effets du réchauffement

climatique Phénomènes extrêmes (vagues, cyclones, …) Prévision des épisodes de pollution (ozone) etc.

Page 35: LA  STATISTIQUE

Estimation du nombre de jours/an avec des températures > 35°CPériode 2090-2099 (Météo-France, 2007)

Page 36: LA  STATISTIQUE

SANTE – BIOLOGIE

Biométrie Imagerie médicale Génétique (trouver les gènes « coupables ») Epidémiologie Statistique de la preuve en sciences

forensiques Diagnostic médical (aide au diagnostic) Essais cliniques etc.

Page 37: LA  STATISTIQUE

Comparaison de deux traitements contre le VIH(Essai Trianon-ANRS81, INSERM U738)

Page 38: LA  STATISTIQUE

PharmacocinétiqueConcentration de théophylline (médicament contre l’asthme) chez 12 individus pendant 24 heures (IUT de Paris, département STID)

Page 39: LA  STATISTIQUE

LES ESSAIS CLINIQUES

Comparaison de plusieurs traitements

Essais cliniques randomisés en double-aveugle

Abstraction des aspects psychologiques : médecin et malade

Introduction du hasard dans l’expérience médicale

Page 40: LA  STATISTIQUE

• Exemple : un nouveau médicament a-t-il des effets secondaires ?

Effectifs observés

Traitement

Placebo

Nausées

Oui Non

15 35

4 46

Page 41: LA  STATISTIQUE

• Exemple : un nouveau médicament a-t-il des effets secondaires ?

Effectifs observés - Effectifs Théoriques

Traitement

Placebo

Nausées

Oui Non

15 9,5 35 40,5

4 9,5

46 40,5

2 = 7,86 Probabilité critique : 1%

Page 42: LA  STATISTIQUE

• Les risques d’erreur

Pas d’effetssecondaires

Effets secondaires

Décision Correcte

Décision Correcte

Décision du statisticien

Situationréelle

Pas d’effetssecondaires

Effets secondaires

Décision erronéePromotion d’unmauvaismédicament

Décision erronéePerte d’un bonmédicament

Page 43: LA  STATISTIQUE

•Poème de 429 mots découvert en 1985

Question : Shakespeare en est-il l’auteur ?

Le vocabulaire du poème s’écarte-t-il de façon statistiquement significative du vocabulaire shakespearien connu ?

* Méthode basée sur l’étude comparative :

- de la fréquence des répétitions et

- de l’ étendue du vocabulaire

échantillons successifs de 429 mots dans l’œuvre complète

Page 44: LA  STATISTIQUE

• L’œuvre complète comprend 31 534 mots distincts sur un total de 884 647 mots,

répartis de la manière suivante :

• 14 376 mots apparaissent une fois• 4 343 mots deux fois• 2 292 mots trois fois

etc …• 846 mots apparaissent plus de cent fois.

•La structure des répétitions est comparée à celle des œuvres de Marlowe, Ben Jonson …

Page 45: LA  STATISTIQUE

L’hypothèse : « Shakespeare est l’auteur du sonnet »

est remplacée par

l’hypothèse : « La structure des répétitions est comparable à celle

de l’œuvre de Shakespeare »

Conclusion : le sonnet a bien été écrit par Shakespeare ;

la probabilité d’erreur est faible

Page 46: LA  STATISTIQUE

DEBOUCHES

Banques Sociétés de placement collectif Compagnies d’assurance Services de marketing Sociétés de sondage Environnement Industrie pharmaceutique, santé (biostatistique) Industrie agroalimentaire Services de contrôle de la qualité de la production

(automobile, eau, etc.)

...

Page 47: LA  STATISTIQUE

à méditer …

Le hasard est la somme de nos ignorances

(Laplace)

Le hasard, cet hôte indésirable de la pensée humaine …

(Gérard Bronner)