exercices de statistique 2006
TRANSCRIPT
-
7/29/2019 Exercices de Statistique 2006
1/124
Dpartement de Mathmatiques et Informatique
E x er c i c es Cor r i g s
Abdelhamid El MossadeqProfesseur lEHTP
2006-2007
-
7/29/2019 Exercices de Statistique 2006
2/124
A. El MossadeqJuin 2006
-
7/29/2019 Exercices de Statistique 2006
3/124
TABLE DES MATIERES
Structures Statistiques et Estimation 1
Les Procdures Usuelles des Tests dHypothses : 1. Les Frquences 45
Les Procdures Usuelles des Tests dHypothses :2. Les Tests du Khi-Deux 61
Les Procdures Usuell es des Tests dHypothses :3. Moyennes et Variances 95
-
7/29/2019 Exercices de Statistique 2006
4/124
-
7/29/2019 Exercices de Statistique 2006
5/124
Structure Statistique et
Estimation
-
7/29/2019 Exercices de Statistique 2006
6/124
-
7/29/2019 Exercices de Statistique 2006
7/124
A. El Mossadeq Structures Statistiques et Estimation
Exercice 1Dterminer et tudier les proprits de lestimateur du maximum de vraisemlancedun r -chantillon pour :
1. le paramtre p dune loi de Bernouilli2. le paramtre p dune loi geometrique3. le paramtre p dune loi binomiale dordre n4. le paramtre dune loi de Poisson
5. le paramtre dune loi exponentielle6. les paramtres et 2 dune loi normale7. le paramtre dune loi uniforme sur lintervalle [0, ]
Solution 11. Soit X une variable alatoire de Bernouilli de paramtre p.
Pour tout x
{0, 1}, la probabilit lmentaire p (x) de x est :
p(x) = px (1 p)1 x
de plus :
E [X ] = p
V [X ] = p (1 p)
(a) Recherche du maximum de vraisemlance :Considrons un r -chantillon de cette structure.Sa fonction de vraisemblance est d nie pour tout p
[0, 1] et tout
(x1,...,x r ){0, 1}r
par :
L ( p; x1,...,x r ) =r
Yi=1 p(xi )= p
r
Pi =1 x i (1 p)r
r
Pi =1 x ido :
ln L ( p; x1,...,x r ) = r
Xi=1 x i!ln p + r r
Xi=1 x i!ln(1 p)
3
-
7/29/2019 Exercices de Statistique 2006
8/124
Structures Statistiques et Estimation A. El Mossadeq
Il en rsulte que :
p
ln L ( p; x1,...,x r ) =
r
Pi=1 xi
p r
r
Pi=1 xi
1 pdo :
p
ln L ( p; x1,...,x r ) = 0 = p =1r
r
Xi=1 x iet comme :
2
p2ln L ( p; x1,...,x r ) < 0
donc lestimateur du maximum de vraisemblance dun r -chantillon dunestructure de Bernouilli est :
p =1r
r
Xi=1 X iCest la frquence empirique du r -chantillon.
(b) Etude des proprits de p :Puisque :
E [ p] = E [X ]
= pet :
V [ p] =V [X ]
r
=p (1 p)
rOn en dduit que p est un estimateur sans biais et convergent du paramtre p dune loi de Bernouilli.
2. Soit X une variable alatoire de gomtrique de paramtre p.Pour tout x
N , la probabilit lmentaire p (x) de x est :
p(x) = p (1 p)x 1
de plus :
E [X ] =1 p
V [X ] =1 p p2
4
-
7/29/2019 Exercices de Statistique 2006
9/124
A. El Mossadeq Structures Statistiques et Estimation
Considrons un r -chantillon de cette structure.Sa fonction de vraisemblance est d nie pour tout p
[0, 1] et tout (x1,...,x r )
(N )r par :
L ( p; x1,...,x r ) =r
Yi=1 p(xi )= pr (1 p)
r
Pi =1 x i rdo :
ln L ( p; x1,...,x r ) = r ln p + r
Xi=1
x i!r ln(1 p)Il en rsulte que :
p
ln L ( p; x1,...,x r ) =r p
r
Pi=1 xi r1 p=
r pr
Pi=1 xi p(1 p)do :
p ln L ( p; x1,...,x r ) = 0 = p =
rr
Pi=1 x iet comme : 2
p2ln L ( p; x1,...,x r ) < 0
donc lestimateur du maximum de vraisemblance dun r -chantillon dune struc-ture gomtrique est :
p =r
r
Pi=1
X i
Cest linverse de la moyenne empirique du r -chantillon.
3. Soit X une variable alatoire binomiale dordre n et de paramtre p.pour tout x
{0, 1,...,n }, la probabilit lmentaire p (x) de x est :
p(x) = C (n, x ) px (1 p)n x
5
-
7/29/2019 Exercices de Statistique 2006
10/124
Structures Statistiques et Estimation A. El Mossadeq
de plus :
E [X ] = np
V [X ] = np (1 p)
(a) Recherche du maximum de vraisemlance :Considrons un r -chantillon de cette structure.Sa fonction de vraisemblance est d nie pour tout p
[0, 1] et tout
(x1,...,x r ){0, 1,...,n }r par :
L ( p; x1,...,x r ) =
r
Yi=1 p(xi )
= "r
Yi=1 C (n, x i )# pr
Pi =1 x i (1 p)rn
r
Pi =1 x i
do :
ln L ( p; x1,...,x r ) = lnr
Yi=1 C (n, x i ) +r
Xi=1 x i ln p + rn r
Xi=1 x i!ln(1 p)Il en rsulte que :
p
ln L ( p; x1,...,x r ) =
r
Pi=1 xi p rn
r
Pi=1 x i1 p=
r
Pi=1 xi rnp p(1 p)do :
p
ln L ( p; x1,...,x r ) = 0 = p =1
rn
r
Xi=1
xi
et comme : 2
p2ln L ( p; x1,...,x r ) < 0
donc lestimateur du maximum de vraisemblance dun r -chantillon dunestructure de binomiale est :
p =1
rn
r
Xi=1 X i
6
-
7/29/2019 Exercices de Statistique 2006
11/124
A. El Mossadeq Structures Statistiques et Estimation
(b) Etude des proprits de p :Puisque :
E [ p] =1n
E [X ]= p
et :
V [ p] =V [X ]rn 2
=p (1 p)
rnon en dduit que p est un estimateur sans biais et convergent de p.
4. Soit X une variable alatoire de Poisson de paramtre .Pour tout x
N , la probabilit lmentaire p (x) de x est :
p(x) = x
x!exp
de plus :
E [X ] =
V [X ] = (a) Recherche du maximum de vraisemlance :
Considrons un r -chantillon de cette structure.Sa fonction de vraisemblance est d nie pour tout , > 0, et tout(x1,...,x r )
N r par :
L (; x1,...,x r ) =r
Yi=1 p(xi )
=
r
Pi =1 x ix1!...x r ! exp r
do :
ln L (; x1,...,x r ) = ln (x1!...x r !) +r
Xi=1 xi ln rIl en rsulte que :
ln L (; x1,...,x r ) =
r
Pi=1 xi r
7
-
7/29/2019 Exercices de Statistique 2006
12/124
Structures Statistiques et Estimation A. El Mossadeq
do :
ln L (; x1,...,x r ) = 0 = p =1r
r
Xi =1 x iet comme :
2
2ln L (; x1,...,x r ) < 0
donc lestimateur du maximum de vraisemblance dun r -chantillon dunestructure de Poisson est :
=1r
r
Xi=1
X i
Cest la moyenne empirique du r -chantillon.
(b) Etude des proprits de :Puisque :
E [ ] = E [X ]=
et :
V [] =V [X ]
r=
r
On en dduit que est un estimateur sans biais et convergent de .
5. Soit X une variable alatoire exponentielle de paramtre .Sa densit de probabilit f est d nie par :
f (x) =
0 si x 0
exp x si x > 0de plus :
E [X ] =1
V [X ] =12
Considrons un r -chantillon de cette structure.
8
-
7/29/2019 Exercices de Statistique 2006
13/124
A. El Mossadeq Structures Statistiques et Estimation
Sa fonction de vraisemblance est d nie pour tout , > 0, et tout (x1,...,x r )dans R r , tous strictement positifs, par :
L (; x1,...,x r ) =r
Yi=1 f (x i )= r exp
r
Xi=1 xido :
ln L (; x1,...,x r ) = r ln r
Xi=1 x iIl en rsulte que :
ln L (; x1,...,x r ) =r
r
Xi=1 xido :
ln L (; x1,...,x r ) = 0 = =r
r
Pi=1 xiet comme : 2
2 ln L (; x1,...,x r ) < 0donc lestimateur du maximum de vraisemblance dun r -chantillon dune struc-ture exponentielle est :
=r
r
Pi=1 X iCest linverse de la moyenne empirique du r -chantillon.6. Soit X une variable alatoire normale de paramtres et 2.
Sa densit de probabilit f est d
nie pour tout xR
par :f (x) =
1 2 exp
122
(x )2
de plus :
E [X ] =
V [X ] = 2
9
-
7/29/2019 Exercices de Statistique 2006
14/124
Structures Statistiques et Estimation A. El Mossadeq
(a) Recherche du maximum de vraisemlance :
Considrons un r -chantillon de cette structure.Sa fonction de vraisemblance est d nie pour tout
R , tout > 0 et
tout (x1,...,x r )R r par :
L (, ; x1,...,x r ) =r
Yi=1 f (xi )=
1
2r exp
122
r
Xi=1 (xi )2
do :
ln L (, ; x1,...,x r ) = r ln 2 r ln 1
22
r
Xi=1 (x i )2
Il en rsulte que :
L (, ; x1,...,x r ) =12
r
Xi=1 (xi ) L (, ; x1,...,x r ) = r + 13
r
Xi=1 (xi )2
do :
L (, ; x1,...,x r ) = 0
L (, ; x1,...,x r ) = 0
=
=1r
r
Xi=1 x i2 =
1r
r
Xi=1
(xi )2
Donc les estimateurs du maximum de vraisemblance dun r -chantillondune structure normale est :
=1r
r
Xi=1 X i2 =
1r
r
Xi=1 (X i )2
10
-
7/29/2019 Exercices de Statistique 2006
15/124
A. El Mossadeq Structures Statistiques et Estimation
(b) Etude des proprits de et :On a :
E [] = E [X ]=
et :
E 2
=r 1
rV [X ]
=r 1
r2
On en dduit que est un estimateur sans biais et convergent de , mais est un estimateur biais de .
7. Soit X une variable alatoire uniforme sur lintervalle [0, ].Sa densit de probabilit f est d nie pour tout x
[0, ] par :
f (x) =
1
si x
[0, ]
0 si x /
[0, ]
de plus :
E [X ] = 2
V [X ] =2
12Considrons un r -chantillon de cette structure.Sa fonction de vraisemblance est d nie pour tout , > 0, et tout (x1,...,x r )[0, ]r :
L (; x1,...,x r ) =r
Yi=1
f (x i )
=1r
La fonction :
L (; x1,...,x r )est strictement dcroissante, donc elle atteint son maximum lorsque est min-imum.Et comme :
i
{1,...,r } : xi
11
-
7/29/2019 Exercices de Statistique 2006
16/124
Structures Statistiques et Estimation A. El Mossadeq
donc est minimum lorsque :
= max( x1,...,x r )Donc lestimateur du maximumde vraisemblance dun r -chantillon dune struc-ture uniforme est :
= max( X 1,...,X r )
Exercice 2Soit X une variable alatoire dont la densit de probabilit f est d nie par :
f (x) =
1
exp x si x > 00 si x 0
o est un paramtre rel strictement positif.
1. Dterminer lestimateur du maximum de vraisemlance de dun r-chantillonde variable parente X .
2. est-il un rsum exhaustif ?3. Calculer lesprance mathmatique et la variance de .
Que peut-on conclure ?4. Calculer la quantit dinformation de Fisher .
En dduire que est efficace.
Solution 2Soit X une variable alatoire exponentielle dont la densit de probabilit f est d niepour tout x, x > 0, par :
f (x) =
1 exp x si x > 00 si x 0
o est un paramtre rel strictement positif.On a :
E [X ] =
V [X ] = 2
12
-
7/29/2019 Exercices de Statistique 2006
17/124
A. El Mossadeq Structures Statistiques et Estimation
1. Considrons un r -chantillon de cette structure.Sa fonction de vraisemblance est d nie pour tout , > 0, et tout (x1,...,x r )
R r , tous strictement positifs, par :
L (; x1,...,x r ) =r
Yi=1 f (x i )=
1r
exp
r
Pi=1 xido :
ln L (; x1,...,x r ) = r ln
r
Pi=1
xi
Il en rsulte que :
ln L (; x1,...,x r ) = r
+
r
Pi=1 xi2do :
ln L (; x1,...,x r ) = 0 = =1r
r
Xi=1 x iet comme :
2
2ln L (; x1,...,x r ) < 0
donc lestimateur du maximum de vraisemblance dun r -chantillon dune struc-ture exponentielle est :
=1r
r
Xi=1 X iCest la moyenne empirique du r -chantillon.
2. Pour tout , > 0, et tout (x1,...,x r )R r , tous strictement positifs, on a :
L (; x1,...,x r ) =1r
exp
r
Pi=1 xi=
1r
exp r (x1,...,x r )
13
-
7/29/2019 Exercices de Statistique 2006
18/124
Structures Statistiques et Estimation A. El Mossadeq
Daprs le thorme de factorisation, est un rsum exhaustif puisque :
L (; x1,...,x r ) = g; (x1,...,x r )h (x
1,...,x r )o :
g; (x1,...,x r )=1r
exp r (x1,...,x r )
et :
h (x1,...,x r ) = 1
3. Comme :
=1
r
r
Xi=1X i
alors :
E hi = E [X ]= et :
V hi =V [X ]
r
=2
rOn en dduit que est un estimateur sans biais et convergent de .
4. Calculons la quantit dinformation de Fisher , I [X, ], concernant .On a :
I [X, ] = E 2
2ln f (, X )
= E 2
2 ln X = E
1
2+
2X
3 = 12Donc la quantit dinformation de Fisher , I [X 1,...,X r , ], concernant fourniepar le r -chantillon est :
I [X 1,...,X r , ] = rI [X, ]
=r2
14
-
7/29/2019 Exercices de Statistique 2006
19/124
A. El Mossadeq Structures Statistiques et Estimation
Calculons lefficacit e
h
ide ..
On a :
ehi =1
I [X 1,...,X r , ]V hi= 1donc, est efficace.
Exercice 3
Soit X une variable alatoire dont la densit de probabilit f est d
nie par :
f (x) =
0 si x 0k
xk 1 exp x
si x > 0
o est un paramtre rel strictement positif , k un entier naturel non nul et uneconstante rel.
1. Dterminer la constante .2. Dterminer lestimateur du maximum de vraisemlance de dun r-chantillon
de variable parente X .3. est-il un rsum exhaustif ?4. Calculer lesprance mathmatique et la variance de .
Que peut-on conclure ?5. Calculer la quantit dinformation de Fisher .
En dduire que est efficace.
Solution 3
La densit de probabilit de la variable alatoire X est d
nie par :
f (x) =
0 si x 0k
xk 1 exp x
si x > 0
Rappelons que pour tout k
N :
Z +
0uk exp udu = k!
15
-
7/29/2019 Exercices de Statistique 2006
20/124
Structures Statistiques et Estimation A. El Mossadeq
1. Ainsi :
Z +
f (x) dx = Z
+
0
k x
k
1 exp x dx
= Z +
0u k 1 exp udu
= (k 1)!do
=1
(k 1)!puisque :
Z +
f (x) dx = 1
De plus :
E [X ] = Z +
xf (x) dx
= Z +
0
1(k 1)!
k xk exp
x
dx
= k
et :E X
2
= Z +
x2f (x) dx
= Z +
0
1(k 1)!
k xk +1 exp
x
dx
= k (k + 1) 2
do :
V [X ] = E
X 2
E [X ]
2
= k2
2. Considrons un r -chantillon de cette structure.Sa fonction de vraisemblance est d nie pour tout , > 0, et tout (x1,...,x r ) R r ,tous strictement positifs, par :
16
-
7/29/2019 Exercices de Statistique 2006
21/124
A. El Mossadeq Structures Statistiques et Estimation
L (; x1,...,x r ) =
r
Yi =1 f (xi )=
1[(k 1)!]
r rk(x1...x r )k
1 exp
r
Pi=1 xido :
ln L (; x1,...,x r ) = r ln (k 1)! ln (x1...x r )k 1
rk ln
r
Pi=1 xiIl en rsulte que :
ln L (; x1,...,x r ) = rk
+
r
Pi=1 xi2do :
ln L (; x1,...,x r ) = 0 = =1
rk
r
Xi=1 x iet comme :
2
2 ln L (; x1,...,xr ) < 0
donc lestimateur du maximum de vraisemblance dun r -chantillon de cettestructure est :
=1
rk
r
Xi=1 X i3. Pour tout , > 0, et tout (x1,...,x r )
R r , tous strictement positifs, on a :
L (; x1,...,x r ) =
1
[(k 1)!]r rk(x
1...x r )k
1 exp
r
Pi=1
x i
=1
[(k 1)!]r rk
(x1...x r )k 1 exp
rk (x1,...,x r )
Daprs le thorme de factorisation, est un rsum exhaustif puisque :
L (; x1,...,x r ) = g; (x1,...,x r )h (x1,...,x r )
17
-
7/29/2019 Exercices de Statistique 2006
22/124
Structures Statistiques et Estimation A. El Mossadeq
o :
g; (x1,...,x r )=
1rk exp
rk (x1,...,x r )
et :
h (x1,...,x r ) =1
[(k 1)!]r (x1...x r )
k 1
4. Puisque :
=1
rk
r
Xi=1 X ialors :
E hi= 1k E [X ] = et :V hi=
V [X ]rk 2
=2
rkOn en dduit que est un estimateur sans biais et convergent de .
5. Calculons la quantit dinformation de Fisher , I [X, ], concernant .On a :
I [X, ] =
E
2
2 ln f (, X )
= E 22 ln (k 1)! + (k 1)ln X k ln X = E k2 + 2X 3 =
k2
Donc la quantit dinformation de Fisher , I [X 1,...,X r , ], concernant fourniepar le r -chantillon est :
I [X 1,...,X r , ] = rI [X, ]=
rk2
Calculons lefficacit ehide ..On a :ehi=
1
I [X 1,...,X r , ]V hi= 1
18
-
7/29/2019 Exercices de Statistique 2006
23/124
A. El Mossadeq Structures Statistiques et Estimation
donc, est efficace.
Exercice 4Soit X une variable alatoire dont la densit de probabilit f est d nie par :
f (x) =
0 si x /
[0, ]
1
si x
[0, ]
o est un paramtre rel.
1. Dterminer la fonction de rpartition de X.2. Calculer la quantit dinformation de Fisher.3. Dterminer lestimateur du maximum de vraisemlance de dun r-chantillon
de variable parente X .4. Calculer lesprance mathmatique et la variance de .
Que peut-on conclure ?5. Dans le cas o est bias, proposer un estimateur sans biais de .
Solution 41. La fonction de rpartition F de X est d nie pour tout x
R par :
F (x) = Z x
f (t) dt
do :
F (x) =
0 si x 0x
si 0 x 1 si x
de plus :
E [X ] =2
V [X ] =2
122. Puisque le domaine D :
D = {xR |f (x) > 0}
= [0, ]
19
-
7/29/2019 Exercices de Statistique 2006
24/124
Structures Statistiques et Estimation A. El Mossadeq
dpend de , donc la quantit dinformation de Fisher nexiste pas.
3. Considrons un r -chantillon de cette structure.Sa fonction de vraisemblance est d nie pour tout , > 0, et tout (x1,...,x r )[0, ]r :
L (; x1,...,x r ) =r
Yi=1 f (x i )=
1r
La fonction :
L (; x1,...,x r )
est strictement dcroissante, donc elle atteint son maximum lorsque est min-imum.Et comme :
i
{1,...,r } : xiIl en rsulte que est minimum lorsque :
= max( x1,...,x r )
Donc lestimateur du maximumde vraisemblance dun r -chantillon dune struc-ture uniforme est :
= max( X 1,...,X r )
4. Pour dterminer la densit de probabilit de , commenons dabord par calculersa fonction de rpartition.
(a) Fonction de rpartition de :
20
-
7/29/2019 Exercices de Statistique 2006
25/124
A. El Mossadeq Structures Statistiques et Estimation
Pour tout u
R on a :
F (u) = P h < ui= P [max(X 1,...,X r ) < u ]
= P [X 1 < u,...,X r < u ]
=r
Yk =1 P [X k < u ]= [F (u)]r
=
0 si u 0
u
r
si 0
u
1 si u
21
-
7/29/2019 Exercices de Statistique 2006
26/124
Structures Statistiques et Estimation A. El Mossadeq
(b) Densit de probabilit de :Pour tout u
R
{0, } on a :
f (u) =d
duF (u)
=
0 si u /
]0, [
rur 1
rsi u
]0, [
(c) Esprance mathmatique de :
E hi = Z R uf (u) du= Z
0r
ur
rdu
=r
r + 1
(d) Esprance mathmatique de 2
:
E
h
2
i= Z R u2f (u) du= Z
0r ur +1
rdu
=r
r + 22
(e) Variance de :
V hi = E h2
iE hi2
=r
(r + 1) 2 (r + 2)2
Lestimateur de est biais, mais il est asymptotiquement sans biais.
5. Considrons lestimateur :
T =r + 1
r
Alors :
E [T ] =r + 1
rE hi=
22
-
7/29/2019 Exercices de Statistique 2006
27/124
A. El Mossadeq Structures Statistiques et Estimation
et :
V [T ] = r + 1
r 2
V hi= 1r (r + 2)
2
T est donc un estimateur sans biais et convergent de .
Exercice 5Soit X une variable alatoire dont la densit de probabilit f est d nie par :
f (x) =
0 si x <
exp( x) si x o est un paramtre rel.
1. Dterminer la fonction de rpartition de X.2. Calculer la quantit dinformation de Fisher.3. Dterminer lestimateur du maximum de vraisemlance de dun r-chantillon
de variable parente X .4. Calculer lesprance mathmatique et la variance de .
Que peut-on conclure ?5. Dans le cas o est bias, proposer un estimateur sans biais de .
Solution 51. La fonction de rpartition F de X est d nie pour tout x
R par :
F (x) = Z x
f (t) dt
do :
F (x) =
0 si x 1 exp( x) si x
de plus :
E [X ] = + 1
V [X ] = 1
23
-
7/29/2019 Exercices de Statistique 2006
28/124
Structures Statistiques et Estimation A. El Mossadeq
2. Puisque le domaine D :
D = {xR |f (x) > 0}
= [, + [dpend de , donc la quantit dinformation de Fisher nexiste pas.
3. Considrons un r -chantillon de cette structure.Sa fonction de vraisemblance est d nie pour tout
R , et tout (x1,...,x r )([, + [)
r :
L (; x1,...,x r ) =
r
Yi=1 f (xi )
= expr
Xi=1 ( xi )La fonction :
L (; x1,...,x r )est strictement croissante, donc elle atteint son maximum lorsque est maxi-mum.Et comme :
i
{1,...,r } : xiIl en rsulte que est maximum lorsque :
= min( x1,...,x r )
Donc lestimateur du maximum de vraisemblance dun r -chantillon de cettestructure est :
= min( X 1,...,X r )
4. Pour dterminer la densit de probabilit de , commenons dabord par calculersa fonction de rpartition.
24
-
7/29/2019 Exercices de Statistique 2006
29/124
A. El Mossadeq Structures Statistiques et Estimation
(a) Fonction de rpartition de :
Pour tout v
R on a :
F (v) = P h < vi= P [min(X 1,...,X r ) < v ]= 1 P [min(X 1,...,X r ) v]= 1 P [X 1 v,...,X r v]= 1
r
Yk =1
P [X k v]
= 1 r
Yk =1 (1 P [X k < v ])= 1 [1F (v)]
r
=
0 si v 1 exp r ( v) si v
(b) Densit de probabilit de :
Pour tout u
R {} on a :f (v) =
ddv
F (v)
=
0 si v <
r exp r ( v) si v >
(c) Esprance mathmatique de :
E hi = Z R vf (v) dv= Z
+
rv exp r ( v) dv
= +1r
25
-
7/29/2019 Exercices de Statistique 2006
30/124
Structures Statistiques et Estimation A. El Mossadeq
(d) Esprance mathmatique de 2
:
E h2
i = Z R v2f (v) dv
= Z +
rv 2 exp r ( v) dv
= + 1r2
+1r 2
(e) Variance de :
V
h
i= E
h
2
iE
h
i2
=1r 2
Lestimateur de est biais, mais il est asymptotiquement sans biais.
5. Considrons lestimateur :
T = 1r
Alors :
E [T ] = E hi1r
=
et :
V [T ] = V hi=1r 2
T est donc un estimateur sans biais et convergent de .
Exercice 6Les lments dune population possdent un caractre X qui suit une loi de Poissonde paramtre inconnu .Une suite de r expriences a fourni les valeurs k1,...,k r .
1. Dterminer lestimateur du maximum de vraisemlance de et tudier lesproprits de cet estimateur.2. est-il un rsum exhaustif ?3. On dsire estimer la quantit :
= P [X = 0]
Dterminer lestimateur du maximum de vraisemlance de .Que remarquez-vous ?
26
-
7/29/2019 Exercices de Statistique 2006
31/124
A. El Mossadeq Structures Statistiques et Estimation
Solution 61. Soit X une variable alatoire de Poisson de paramtre .
pour tout xN , la probabilit lmentaire p (x) de x est :
p(x) = x
x!exp
de plus :
E [X ] =
V [X ] =
(a) Recherche du maximum de vraisemlance :Considrons un r -chantillon de cette structure.
Sa fonction de vraisemblance est d nie pour tout , > 0, et tout(k1,...,k r )N r par :
L (; k1,...,k r ) =r
Yi=1 p(ki )=
r
Pi =1 k ik1!...kr !
exp rdo :
ln L (; k1,...,k r ) = ln (k1!...kr !) +r
Xi=1 ki ln r
Il en rsulte que :
ln L (; k1,...,k r ) =
r
Pi=1 ki rdo :
ln L (; k1,...,k r ) = 0 = p =1r
r
Xi=1
xi
et comme : 2
2ln L (; k1,...,k r ) < 0
donc lestimateur du maximum de vraisemblance dun r -chantillon dunestructure de Poisson est :
=1r
r
Xi=1 X iCest la moyenne empirique du r -chantillon.
27
-
7/29/2019 Exercices de Statistique 2006
32/124
Structures Statistiques et Estimation A. El Mossadeq
(b) Etude des proprits de :Puisque :
E [ ] = E [X ]=
et :
V [] =V [X ]
r=
r
On en dduit que est un estimateur sans biais et convergent de .
2. Pour tout , > 0, et tout (k1,...,k r )N r on a :
L (; x1,...,x r ) = r (k 1 ,...,k r )
x1!...x r !exp r
Daprs le thorme de factorisation, est un rsum exhaustif puisque :
L (; x1,...,x r ) = g (; (x1,...,x r )) h (x1,...,x r )
o :
g (; (x1,...,x r )) = r (k 1 ,...,k r ) exp ret :
h (x1,...,x r ) =1
x1!...x r !3. On a :
= P [X = 0]= exp
Pour tout , > 0, et tout (k1,...,k r )N r par :
L ( ; k1,...,k r ) =r
Yi=1 p(ki )=
(ln )r
Pi =1 k ik1!...k r !
r
do :
ln L ( ; k1,...,k r ) = ln (k1!...kr !) +r
Xi=1 ki ln (ln ) + r ln
28
-
7/29/2019 Exercices de Statistique 2006
33/124
A. El Mossadeq Structures Statistiques et Estimation
Il en rsulte que :
ln L ( ; k1,...,k r ) =
r
Pi=1 ki
ln +
r
do :
ln L ( ; k1,...,k r ) = 0 = = exp 1rr
Xi=1 ki!et comme :
2
2ln L ( ; k1,...,k r ) < 0
donc lestimateur du maximum de vraisemblance dun r -chantillon de cettestructure est :
= exp 1rr
Xi=1 X i!= exp
Exercice 7
Soit un rel appartenant ]1, + [ et X une variable alatoire telle que :P [X = k] =
1 1 1
k 1
, k
N
1. Calculer lesprance mathmatique et la variance de X .2. Dterminer lestimateur du maximum de vraisemlance de dun r -chantillon
de variable parente X et tudier ses proprits.3. est-il un rsum exhaustif ?
Solution 71. On a :
E [X ] =
Xk =1 kP [X = k]=
Xk =1k 1 1
k 1
=
29
-
7/29/2019 Exercices de Statistique 2006
34/124
Structures Statistiques et Estimation A. El Mossadeq
et :
E [X (X 1)] =
Xk =1 k (k 1) P [X = k]=
Xk =1k (k 1)
1 1k 1
= 221 1do :
E
X 2
= E [X (X 1)] + E [X ]= (2 1)et :
V [X ] = E X 2
E [X ]2
= ( 1)2. Considrons un r -chantillon de cette structure.
Sa fonction de vraisemblance est d nie pour tout
]1, + [ et tout (x1,...,x r )(N )r par :L (; x1,...,x r ) =
r
Yi=1 p(xi )
=1
r 1 1r
Pi =1 x i r
do :
ln L (; x1,...,x r ) = r ln + r
Xi=1 xi r!ln1 1
Il en rsulte que :
ln L (; x1,...,x r ) = r
+
r
Pi=1 xi r ( 1)=
r
Pi=1 x i r ( 1)
30
-
7/29/2019 Exercices de Statistique 2006
35/124
A. El Mossadeq Structures Statistiques et Estimation
do :
ln L (; x1,...,x r ) = 0 = =1r
r
Xi=1 xi
et comme : 2
2ln L ( p; x1,...,x r ) < 0
donc lestimateur du maximum de vraisemblance dun r -chantillon dune struc-ture gomtrique est :
=1r
r
Xi=1 X iCest la moyenne empirique du r -chantillon.
3. Puisque :
=1r
r
Xi=1 X ialors :
E [ ] = E [X ]=
et :
V [ ] =V [X ]
r
= ( 1)
rOn en dduit que est un estimateur sans biais et convergent du paramtre dune structure gomtrique.
Exercice 8Soit X une variable alatoire qui suit une loi de Pareto dont la densit de probabilitf est d nie par :
f (x) =
a
x +1si x a
0 si x < ao X reprsente le revenu par habitant, a le revenu minimum et , > 2, uncoefficient dpendant du type du pays o lon se place.
31
-
7/29/2019 Exercices de Statistique 2006
36/124
Structures Statistiques et Estimation A. El Mossadeq
1. Vri er que f est bien une densit de probabilit.2. Calculer lesprance mathmatique et la variance de X .3. Calculer la fonction de rpartition de X.4. Dterminer lestimateur du maximum de vraisemlance a de a dun r -chantillon
issu X .5. Dans le cas o a est bias, proposer un estimateur sans biais de a.
Solution 81. La densit de probabilit de la loi de Pareto est d nie par :
f (x) =
a
x +1si x
a
0 si x < a
f est bien une densit de probabilit.En eff et :
Z R f (x) dx = Z +
a
a
x +1dx
= 1
2. On a :
E [X ] = Z R xf (x) dx= Z
+
a
a
xdx
=
1a
et :
E
X 2
= Z R x2f (x) dx= Z
+
aa
x 1 dx
=
2a2
do :
V [X ] = E X 2
E [X ]2
=
( 2) ( 1)2 a
2
32
-
7/29/2019 Exercices de Statistique 2006
37/124
A. El Mossadeq Structures Statistiques et Estimation
3. La fonction de rpartition F de X est d nie pour tout x
R par :
F (x) = Z x
f (t) dt
=
0 si x a
Z x
a
a
t +1dt si x a
=
0 si x a
1 a
xsi x a
4. Considrons un r -chantillon de cette structure.Sa fonction de vraisemblance est d nie pour tout a
R et tout (x1,...,x r )(]a, + [)
r , par :
L (a; x1,...,x r ) =r
Yi=1 f (xi )=
r a r
(x1...x r ) +1
La fonction :
a L (a; x1,...,x r )est strictement croissante, donc elle atteint son maximum lorsque a est maxi-mum.Et comme :
i
{1,...,r } : a xiIl en rsulte que est maximum lorsque :
a = min( x1,...,x r )
Donc lestimateur du maximum de vraisemblance dun r -chantillon de cettestructure est :
a = min( X 1,...,X r )
5. Pour dterminer la densit de probabilit de , commenons dabord par calculersa fonction de rpartition.
33
-
7/29/2019 Exercices de Statistique 2006
38/124
Structures Statistiques et Estimation A. El Mossadeq
(a) Fonction de rpartition de a :
Pour tout xR on a :
F a (x) = P [a < x ]= P [min(X 1,...,X r ) < x ]= 1 P [min(X 1,...,X r ) x]= 1 P [X 1 v,...,X r x]= 1
r
Yk =1 P [X k x]= 1
r
Yk =1(1
P [X k < x ])
= 1 [1F (x)]r
=
0 si x a1 a
x r
si x a(b) Densit de probabilit de :
Pour tout x
R {a} on a :f a (x) =
ddv
F a (x)
=
0 si x < a
ra r
xr +1si x > a
(c) Esprance mathmatique de a :
E [a] = Z R vf a (v) dv= Z
+
a
ra r
vrdv
= rr 1a
(d) Esprance mathmatique de a2 :
E a2
= Z R v2f a (v) dv
= Z +
a
ra r
vr 1dv
=r
r 2a2
34
-
7/29/2019 Exercices de Statistique 2006
39/124
A. El Mossadeq Structures Statistiques et Estimation
(e) Variance de a :
V [a] = E a2
E [a]2
=r
(r 2) (r 1)2 a
2
Lestimateur a de a est biais, mais il est asymptotiquement sans biais.(f) Considrons lestimateur :
T =r 1
ra
Alors :
E [T ] = a
et :
V [T ] = r 1r 2
V [a] =1
r (r 2)a2
T est donc un estimateur sans biais et convergent de a.
Exercice 9Soit X une variable alatoire dont la densit de probabilit f est d nie par :
f (x) =
0 si x 1
exp( x)
si x >
o est un paramtre rel et un paramtre rel strictement positif.
1. Vri er que f est bien une densit de probabilit.2. Calculer lesprance mathmatique et la variance de X .3. Calculer la fonction de rpartition de X.4. On suppose connu et inconnu.
(a) Dterminer lestimateur du maximum de vraisemlance de dun r -chantillon issu X .(b) Etudier les proprits de .(c) Dans le cas o est bias, proposer un estimateur sans biais de .
5. On suppose connu et inconnu.
(a) Dterminer lestimateur du maximum de vraisemlance de dun r-chantillon issu de X .
(b) Etudier les proprits de (c) Dans le cas o est bias, proposer un estimateur sans biais de .
35
-
7/29/2019 Exercices de Statistique 2006
40/124
Structures Statistiques et Estimation A. El Mossadeq
6. On suppose que et sont tous les deux inconnus.
(a) Dterminer lestimateur du maximum de vraisemlance ,de (, )dun r-chantillon issu de X .(b) Etudier les proprits de , (c) Proposer un estimateur sans biais de (, ) .
Solution 91. f est bien une densit de probabilit.
En eff et :
Z R f (x) dx = Z +
1 exp ( x) dx
= Z +
0exp tdt
= 1
2. On a :
E [X ] = Z R xf (x) dx=
Z +
x
exp
( x)
dx
= Z +
0(t + )exp tdt
= +
et :
E X 2
= Z R x2f (x) dx
=
Z
+
x2
exp
( x)
dx
= Z +
0(t + )2 exp tdt
= 22 + 2 + 2
= ( + )2 + 2
do :
V [X ] = E X 2
E [X ]2
= 2
36
-
7/29/2019 Exercices de Statistique 2006
41/124
A. El Mossadeq Structures Statistiques et Estimation
3. La fonction de rpartition F de X est d nie pour tout x
R par :
F (x) = Z x
f (t) dt
=
0 si x
Z x
1
exp( t)
dt si x
=
0 si x
1 exp( x)
si x
4. On suppose connu et inconnu.
(a) Considrons un r -chantillon de cette structure.Sa fonction de vraisemblance est d nie pour tout , > 0,
R et tout
(x1,...,x r )(], + [)r par :
L (; x1,...,x r ) =r
Yi=1 f (x i )=
1
r exp
r
Xi=1(
xi )
do :
ln L (; x1,...,x r ) = r ln +1
r
Xi=1 ( xi )Il en rsulte que :
ln L (; x1,...,x r ) = r
12
r
Xi=1 ( x i )= 1
"r 1r
Xi=1 ( x i )#do :
ln L (; x1,...,x r ) = 0 = =1r
r
Xi=1 (xi )=
= "1rr
Xi=1 xi#
37
-
7/29/2019 Exercices de Statistique 2006
42/124
Structures Statistiques et Estimation A. El Mossadeq
et comme : 2
2 ln L (; x1,...,x r ) < 0donc lestimateur du maximum de vraisemblance dun r -chantillon decette structure est :
= "1rr
Xi=1 X i#(b) On a :
E [ ] = E
"1r
r
Xi=1
X i
!
#= et :V [] = V "1r
r
Xi=1 X i!#=
V [X ]r
=2
r
5. On suppose connu et inconnu.(a) Considrons un r -chantillon de cette structure.
Sa fonction de vraisemblance est d nie pour tout , > 0,
R et tout(x1,...,x r )(], + [)
r , tous strictement positifs, par :
L (; x1,...,x r ) =r
Yi=1 f (xi )=
1 r
expr
Xi=1( x i )
La fonction : L (; x1,...,x r )
est strictement croissante, donc elle atteint son maximum lorsque estmaximum.
38
-
7/29/2019 Exercices de Statistique 2006
43/124
A. El Mossadeq Structures Statistiques et Estimation
Et comme :
i
{1,...,r } :
xiIl en rsulte que est maximum lorsque :
= min( x1,...,x r )
Donc lestimateur du maximum de vraisemblance dun r -chantillon decette structure est :
= min( X 1,...,X r )
(b) Pour dterminer la densit de probabilit de , commenons dabord parcalculer sa fonction de rpartition.
(i) Fonction de rpartition de :Pour tout v
R on a :
F (v) = P h < vi= P [min (X 1,...,X r ) < v ]= 1 P [min (X 1,...,X r ) v]= 1 P [X 1 v,...,X r v]= 1
r
Yk =1
P [X k v]
= 1 r
Yk =1 (1 P [X k < v ])= 1 [1F (v)]
r
=
0 si v
1 exp r v si v (ii) Densit de probabilit de :
Pour tout v
R
{} on a :
f (v) =ddv
F (v)
=
0 si v <
r
exp r v si v >
39
-
7/29/2019 Exercices de Statistique 2006
44/124
Structures Statistiques et Estimation A. El Mossadeq
(iii) Esprance mathmatique de :
E hi = Z R vf (v) dv= Z
+
r
v exp r v dv= Z
+
0 r
t + exp tdt=
r
+
(iv) Esprance mathmatique de 2
:
E h2
i = Z R v2f (v) dv
= Z +
r
v2 exp r ( v) dv=
r
+ 2
+ r
2
(v) Variance de :
V
h
i= E
h
2
iE
h
i
2
= r 2
Lestimateur de est biais, mais il est asymptotiquement sansbiais.
(c) Considrons lestimateur :
T = r
Alors :
E [T ] = E
h
i
r=
et :
V [T ] = V hi=
r 2
T est donc un estimateur sans biais et convergent de .
40
-
7/29/2019 Exercices de Statistique 2006
45/124
A. El Mossadeq Structures Statistiques et Estimation
6. On suppose que et sont tous les deux inconnus.
(a) Considrons un r -chantillon de cette structure.Sa fonction de vraisemblance est d nie pour tout , > 0,
R et tout(x1,...,x r )(], + [)
r , tous strictement positifs, par :
L (, ; x1,...,x r ) =r
Yi=1 f (xi )=
1 r
expr
Xi=1( x i )
Compte tenu des questions prcedentes, la fonction :
(, ) 7L (, ; x1,...,x r )atteint son maximum pour :
= min( x1,...,x r )
= "1rr
Xi=1 xi#do, les estimateurs du maximum de vraisemblance
,
de (, ) sont
donns par :
= min( X 1,...,X r )
= "1rr
Xi=1 X i#(b) On a :
E hi=r
+
et :E [ ] = E [X ]E hi
=r 1
r
Donc les estimateurs et sont biaiss.
41
-
7/29/2019 Exercices de Statistique 2006
46/124
Structures Statistiques et Estimation A. El Mossadeq
(c) Considrons les estimateurs T et S de et respectivement d nis par :
T =r
r 1S =
1r 1
alors :
E [T ] =
E [S ] =
Donc T et S sont des estimateurs sans biais de et respectivement.
Exercice 10Soient X et Y deux variables alatoires indpendantes, la premire prenant lesvaleurs 1 et 0 avec les probabilits respectives et 1, et la deuxime prenant lesvaleurs 1 et 0 avec les probabilits respectives P et 1 P . On suppose inconnueet P connue, P > 0.5.On d nit la variable alatoire Z par :
Z = 1 si X = Y
Z = 0 si X 6= Y
On considre un n-chantillon ((X 1, Y 1) , ..., (X n , Y n )) de (X, Y ) et on d nit Z i ,1 i n, partir de X i et Y i comme on a d ni Z partir de X et Y .
1. Montrer que (Z 1,...,Z n ) est un n-chantillon de Z .2. Etudier les proprits de lestimateur :
T =1n
(Z 1 + ... + Z n )
3. Proposer alors un estimateur sans biais S de .
4. Etudier la variance de S en fonction de P .5. Indiquer un intervalle de con ance pour lorsque n est grand, en supposantquon dispose dune observation p de la variable :
T =1n
(Z 1 + ... + Z n )
6. Voyez-vous une application de ce qui prcde dans le domaine des sondagesdopinion ?
42
-
7/29/2019 Exercices de Statistique 2006
47/124
A. El Mossadeq Structures Statistiques et Estimation
Solution 10On a :
P [X = 0] = 1 P [X = 1] =
et :
P [Y = 0] = 1 P P [Y = 1] = P
X et Y deux variables alatoires de Bernouilli de paramtres et P respectivement.Dterminons la loi de probabilit de Z :
P [Z = 0] = P [X 6= Y ]= P [{(X, Y ) = (0 , 1)}
{(X, Y ) = (0 , 1)}]
= P [X = 0] P [Y = 1] + P [X = 1] P [Y = 0]= (1 ) P + (1 P )
et :
P [Z = 1] = P [X = Y ]= P [{(X, Y ) = (0 , 0)}
{(X, Y ) = (1 , 1)}]
= P [X = 0] P [Y = 0] + P [X = 1] P [Y = 1]
= (1 ) (1 P ) + P Z est donc une variable alatoire de Bernouilli de paramtre :
= (1 ) (1 P ) + P de plus :
E [Z ] = V [Z ] = (1 )
1. Puisque (X 1, Y 1) , ..., (X n , Y n ) sont indpentants et suivent la mme loi que(X, Y ), on en dduit que (Z 1,...,Z n ) sont indpendants et suivent la mmeloi que Z , donc cest un n-chantillon de Z .
2. Soit lestimateur :
T =1n
(Z 1 + ... + Z n )
On a :
E [T ] = E [Z ]= (1 ) (1 P ) + P
43
-
7/29/2019 Exercices de Statistique 2006
48/124
Structures Statistiques et Estimation A. El Mossadeq
et :
V [T ] =1n V [Z ]
=1n
[(1 ) (1 P ) + P ][(1) P + (1 P )]3. T est donc un estimateur biais de sauf lorsque :
=12
ou :
P = 1
(a) Si :
=12
ou P = 1
alors il suffi t de prendre :
S = T
(b) Si :
6=12
et P 6= 1
alors il suffi t de prendre :
S =1
2P 1[T (1 P )]
4. On a :
V [S ] =1
(2P 1)2 V [T ]
=1
n (2P 1)2 [(1 ) (1 P ) + P ][(1) P + (1 P )]
44
-
7/29/2019 Exercices de Statistique 2006
49/124
Tests dHypothses Les Frquences
-
7/29/2019 Exercices de Statistique 2006
50/124
-
7/29/2019 Exercices de Statistique 2006
51/124
A. El Mossadeq Tests : Les Frquences
Exercice 1
A la veille dune consultation lectorale, on a intrrog cent lecteurs constituantun chantillon au hasard. Soixante ont dclar avoir lintention de voter pour lecandidat C .En quelles limites, au moment du sondage, la proportion du corps lectoral favorable C se situe-t-elle ?
Solution 1
Construisons lintervalle de con ance correspondant la frquence f = 0 .6 du corpslectoral favorable C observe sur un chantillon de taille n = 100.Au seuil , cet intervalle est d ni par :
"f t 1 / 2r f (1 f )n , f + t 1 / 2r f (1 f )n #Pour = 5%, on a :
t .975 = 1 .96
on obtient alors lintervalle :
[.504, .696]A 95%, le candidat C serait lu.
Exercice 2
On sait que le taux de mortalit dune certaine maladie est de 30%.Sur 200 malades tests, combien peut-on envisager de dcs ?
Solution 2
Construisons dobord lintervalle de pari, pour un chantillon de taille n = 200,correspondant la probabilit de dcs p = 0 .3.Au seuil , cet intervalle est d ni par :
" p t 1 / 2r p (1 p)n , p + t 1 / 2r p (1 p)n #Pour = 5%, on a :
t .975 = 1 .96
47
-
7/29/2019 Exercices de Statistique 2006
52/124
Tests : Les Frquences A. El Mossadeq
on obtient alors lintervalle :
[.24, .36]
Il en rsulte que sur les 200 malades, le nombre de dcs envisager serait compris, 95%, entre 48 et 72 dcs.
Exercice 3
Dans une pr-enqute, on selectionne, par tirage au sort cent dossiers.Quinze dentre eux sont incomplets.Combien de dossiers incomplets trouvera-t-on sur dix milles dossiers ?
Solution 3
Construisons lintervalle de con ance correspondant la frquence f = 0 .15 dedossiers incomplets observe sur un chantillon de taille n = 100.Au seuil , cet intervalle est d ni par :
"f t 1 / 2r f (1 f )n , f + t 1 / 2r f (1 f )n #Pour = 5%, on a :
t .975 = 1 .96
on obtient alors lintervalle :
[.08, .22]
Il en rsulte que sur les 10000 dossiers, le nombre de dossiers incomplets seraitcompris, 95%, entre 800 et 2200 dossiers.
Exercice 4
Dans une maternit, on fait le point de la proportion de lles toutes les cent nais-sances.Comment peut varier cette proportion dune fois lautre si lon admet quil naiten moyenne 51% de lles ?
Solution 4
Construisons lintervalle de pari, pour un chantillon de taille n = 100, correspon-dant la probabilit dobtenir une lle p = 0 .51.
48
-
7/29/2019 Exercices de Statistique 2006
53/124
A. El Mossadeq Tests : Les Frquences
Au seuil , cet intervalle est d ni par :
" p t 1 / 2r p (1 p)n
, p + t 1 / 2r p (1 p)n #
Pour = 5%, on a :
t .975 = 1 .96
on obtient alors lintervalle :
[.41, .61]
Il en rsulte, qu 95%, la proportion de lles varie dune fois lautre, entre 41%et 61%.
Exercice 5
Une machine former des pilules fonctionne de faon satisfaisante si la proportionde pilules non russies est de 1 pour 1000.Sur un chantillon de 10000 pilules, on a trouv 15 pilules dfectueuses.Que faut-il conclure ?
Solution 5
Ici on :
n = 10 4
f = 15 10 4
p = 10 3
Testons, au seuil , lhypothse nulle :
H 0 : la machine est bien rgle
Sous cette hypothse, la quantit :
t =f p
r p (1 p)npeut tre considre comme une ralisation dune variable alatoire normale centrerduite.Pour = 5%, on a :
t .975 = 1 .96
49
-
7/29/2019 Exercices de Statistique 2006
54/124
Tests : Les Frquences A. El Mossadeq
et comme :
t =f p
r p (1 p)n= 1 .58
on accepte donc lhypothse nulle H 0 au seuil = 5%, cest dire, quau seuil = 5%, la machine fonctionne de faon satisfaisante.
Exercice 6
Sur un chantillon de 600 sujets atteints du cancer des poumons, on a trouv 550fumeurs.Que peut-on dire du pourcentage de fumeurs parmi les cancreux ?
Solution 6
Construisons lintervalle de con ance correspondant la frquence f =1112
descancreux parmi les fumeurs observe sur un chantillon de taille n = 600.Au seuil , cet intervalle est d ni par :
"f t 1 / 2r
f (1
f )n , f + t
1 / 2r f
(1 f
)n #Pour = 5%, on a :
t .975 = 1 .96
on obtient alors lintervalle :
[.9, .94]
Il en rsulte que parmi, les fumeurs, la proportion des atteints par le cancer despoumons est comprise, 95%, entre 90% et 94%.
Exercice 7
Avant de procder au lancement dun produit, une entreprise a fait procder uneenqute portant sur deux rgions gographiques A et B .Sur 1800 rponses provenant de la rgion A, 630 se dclarent intresses par leproduit.En provenance de B , 150 rponses sur 600 se dclarent favorables.Tester, au seuil de 5%, lhypothse de lidentit des opinions des rgions A et Bquant au produit considr.
50
-
7/29/2019 Exercices de Statistique 2006
55/124
A. El Mossadeq Tests : Les Frquences
Solution 7
Ici on :
n A = 1800 et f A =720
n B = 600 et f B =14
Testons, au seuil , lhypothse nulle :
H 0 : les opinions des rgions A et B sont identiques
Sous cette hypothse, la quantit :
t =f A f B
r f A (1 f A)n A + f B (1 f B )n Bpeut tre considre comme une ralisation dune variable alatoire normale centrerduite.Pour = 5%, on a :
t .975 = 1 .96
et comme :
t =f A f B
r f A (1 f A)n A + f B (1 f B )n B= 4 .77
on rejette donc lhypothse nulle H 0 95% (et mme 99.98%), cest dire, les deux rgions A et B ont des opinions di ff rentes.
Exercice 8
Dans un groupe de 200 malades atteints du cancer du col de lutrus, un traitementpar application locale du radium a donn 50 gurisons.Un autre groupe de 150 sujets atteints de la mme maladie a t trait par chirurgie,on a trouv 50 gurisons.Que peut-on conclure ?
51
-
7/29/2019 Exercices de Statistique 2006
56/124
Tests : Les Frquences A. El Mossadeq
Solution 8
Ici on :
n 1 = 200 , f 1 =14
n 2 = 150 , f 2 =13
Testons, au seuil , lhypothse nulle :
H 0 : les deux traitements sont quivalents
Sous cette hypothse, la quantit :
t =f 1 f 2
r f 1 (1 f 1 )n 1 + f 2 (1 f 2 )n 2peut tre considre comme une ralisation dune variable alatoire normale centrerduite.Pour = 5%, on a :
t .975 = 1 .96
et comme :
t =f 1 f 2
r f 1 (1 f 1 )n 1 + f 2 (1 f 2 )n 2= 1.69
on accepte donc lhypothse nulle H 0 au seuil 5%, cest dire, les deux mthodes sont quivalentes .
Exercice 9
Aux guichets dune gare parisienne, sur les 350 billets vendus vendredi aprs-midi,95 taient des billets de 1ere classe. Sur les 250 billets vendus la matine du lundisuivant, 55 taient de 1ere classe.Peut-on considrer quil y a une di ff rence entre les proportions de vente de parcoursen 1ere classe pour les ns et dbuts de semaines ?
52
-
7/29/2019 Exercices de Statistique 2006
57/124
A. El Mossadeq Tests : Les Frquences
Solution 9
Ici on :
n 1 = 350 , f 1 =1970
n 2 = 250 , f 2 =1150
Testons, au seuil , lhypothse nulle :
H 0 : les taux de billets de 1ere classe vendus en n et dbut de semaines sont identiques
Sous cette hypothse, la quantit :
t =f 1 f 2
r f 1 (1 f 1 )n 1 + f 2 (1 f 2 )n 2peut tre considre comme une ralisation dune variable normale centre rduite.Pour = 5%, on a :
t .975 = 1 .96
et comme :
t =f 1 f 2
r f 1 (1 f 1 )n 1 + f 2 (1 f 2 )n 2= 1 .45
on accepte donc lhypothse nulle H 0 au seuil 5%, cest dire, les taux de billets de parcours en 1ere classe vendus en ns et dbuts de semaines sont identiques etquon peut estimer par :
f =n 1 f 1 + n 2 f 2
n 1 + n 2= 0 .25
Exercice 10
On a lanc cent fois une pice de monnaie et lon a obtenu soixante fois pile etquarante fois face.Tester au seuil de 5%, puis 1%, lhypothse de la loyaut de la pice.
53
-
7/29/2019 Exercices de Statistique 2006
58/124
Tests : Les Frquences A. El Mossadeq
Solution 10
Ici on :
n = 100f = 0 .6o f est la frquence de pile.Testons, au seuil , lhypothse nulle :
H 0 : la pice est loyale
Sous cette hypothse, on a :
p = 0 .5
et la quantit :
t =f p
r p (1 p)npeut tre considre comme une ralisation dune variable alatoire normale centrerduite.on a :
t =f p
r p (1 p)n= 2
(1) Pour = 5%, on a :
t .975 = 1 .96
on rejette donc lhypothse nulle H 0 95%, cest dire, qu 95%, la pice est truque .
(2) Pour = 1%, on a :
2.57 < t .995 < 2.58
on accepte donc lhypothse nulle H 0 au seuil = 1%, cest dire, quauseuil = 1%, la pice est normale .
Exercice 11
Un chantillon de taille n a donn lieu au calcul dune frquence observe f corre-spondant lintervalle de con ance [.22 .34] au seuil = 5%.
1. Calculer n .2. Par rapport la proportion p = 0 .3, lcart est-il signi catif au seuil = 5% ?3. Dterminer lintervalle de con ance de |f p| au seuil = 5%.
54
-
7/29/2019 Exercices de Statistique 2006
59/124
A. El Mossadeq Tests : Les Frquences
Solution 11
1. Au seuil , lintervalle de con ance correspondant une frquence f observe
sur un chantillon de taille n est d ni par :
"f t 1 / 2r f (1 f )n , f + t 1 / 2r f (1 f )n #On en dduit :
f =0.22 + 0.34
2
n = t 21 / 2f (1 f )
(f 0.22)2
Pour = 5%, on a :t 0 .975 = 1 .96
on obtient alors :
f = .28n = 2152. Testons, au seuil , lhypothse nulle :
H 0 : lcart nest pas singi catif
Sous cette hypothse, la quantit :
t =f p
r p (1 p)npeut tre considre comme une ralisation dune variable alatoire normalecentre rduite.On a :
t =f p
r p (1 p)
n= 0.64
Pour = 5%, on a :
t .975 = 1 .96
on accepte donc lhypothse nulle H 0 au seuil = 5%.3. Au seuil :
f p
r p (1 p)n t 1 / 2 , t 1 / 2
55
-
7/29/2019 Exercices de Statistique 2006
60/124
Tests : Les Frquences A. El Mossadeq
donc, au seuil :
|f p| "0, t 1 / 2r p (1 p)n #
Pour = 5%, on a :
t .975 = 1 .96
do :
|f p| [0, 0.06]
Exercice 12
Ltude du taux de dfectuosits a ff rentes aux caractristiques de traitements ther-miques dune mme pice, traite par deux fours di ff rents, a donn lieu aux rsultatssuivants :* Pour le premier four, 20 pices dfectueuses sur un chantillon de 200 picestraites.* Pour le second four, 120 pices dfectueuses sur un chantillon de 800 picestraites.Que peut-on conclure ?
Solution 12
Ici on :
n 1 = 200 , f 1 = 0 .10
n 2 = 800 , f 2 = 0 .15
Testons, au seuil , lhypothse nulle :
H 0 : les deux traitements thermiques sont quivalents
Sous cette hypothse, la quantit :
t =f 1 f 2
r f 1 (1 f 1 )n 1 + f 2 (1 f 2 )n 2peut tre considre comme une ralisation dune variable alatoire normale centrerduite.Pour = 5%, on a :
t .975 = 1 .96
56
-
7/29/2019 Exercices de Statistique 2006
61/124
A. El Mossadeq Tests : Les Frquences
et comme :
t =f 1 f 2
r f 1 (1 f 1 )n 1 + f 2 (1 f 2 )n 2= 2.03
on rejette donc lhypothse nulle H 0 95%, cest dire, les deux traitements ne sont pas quivalents.
Exercice 13
Un questionnaire auquel on ne peut rpondre que par oui ou par non, a trempli par un chantillon de taille n.Lintervalle de con ance de la frquence observe f des rponses oui est (0.35 0.43)au seuil = 5%.
1. Quelle est la taille n de lchantillon.2. Par rapport la proportion p = 0 .4, lcart est-il signi catif au seuil = 5% ?3. Dterminer lintervalle de con ance de |f p| au seuil = 5%.
Solution 13
1. Au seuil , lintervalle de con ance correspondant une frquence f observesur un chantillon de taille n est d ni par :
"f t 1 / 2r f (1 f )n , f + t 1 / 2r f (1 f )n #On en dduit :
f =0.35 + 0.43
2
n = t 21 / 2 f (1 f )
(f 0.35)2
Pour = 5%, on a :
t 0 .975 = 1 .96
on obtient alors :
f = 0 .39
n = 571
57
-
7/29/2019 Exercices de Statistique 2006
62/124
Tests : Les Frquences A. El Mossadeq
2. Testons, au seuil , lhypothse nulle :
H 0 : lcart nest pas singi catifSous cette hypothse, la quantit :
t =f p
r p (1 p)npeut tre considre comme une ralisation dune variable alatoire normalecentre rduite.On a :
t =
f p
r p (1 p)n= 0.49
Pour = 5%, on a :
t .975 = 1 .96
On accepte donc lhypothse nulle H 0 au seuil = 5%.3. Au seuil :
f p
r p (1
p)n
t 1 / 2 , t 1 / 2
donc, au seuil :|f p| "0, t 1 / 2r p (1 p)n #
Pour = 5%, on a :
t .975 = 1 .96
do :
|f p| [0, 0.04]
Exercice 14
Parmi 470 sujets exposs une infection, 370 nayant pas t immuniss.Parmi ces derniers, 140 contractent la malidie ainsi que 25 sujets immuniss.Le traitement donne-t-il une protection signi cative ?
58
-
7/29/2019 Exercices de Statistique 2006
63/124
A. El Mossadeq Tests : Les Frquences
Solution 14
Soient f 1 la frquence de contracter la maladie pour un sujet non immunis et f 2 la
frquence de contracter la maladie pour un sujet immunis.Ici on :
n 1 = 370 et f 1 =1437
n 2 = 100 et f 2 =14
Testons, au seuil , lhypothse nulle :
H 0 : le traitements nest pas e ffi cace
Sous cette hypothse, la quantit :
t =f 1 f 2
r f 1 (1 f 1 )n 1 + f 2 (1 f 2 )n 2peut tre considre comme une ralisation dune variable alatoire normale centrerduite.Pour = 5%, on a :
t .975 = 1 .96
et comme :
t = f 1 f 2
r f 1 (1 f 1 )n 1 + f 2 (1 f 2 )n 2= 2 .56
On rejette donc lhypothse nulle H 0 95%, cest dire, le traitement donne une protection signi cative.
59
-
7/29/2019 Exercices de Statistique 2006
64/124
-
7/29/2019 Exercices de Statistique 2006
65/124
Les Tests du Khi-deux
-
7/29/2019 Exercices de Statistique 2006
66/124
-
7/29/2019 Exercices de Statistique 2006
67/124
A. El Mossadeq Les Tests du Khi-Deux
Exercice 1
Avant de procder au lancement dun produit, une entreprise a fait procder une
enqute portant sur deux rgions gographiques A et B .Sur 1800 rponses provenant de la rgion A, 630 se dclarent intresses par leproduit.En provenance de B , 150 rponses sur 600 se dclarent favorables.Tester, au seuil de 5%, lhypothse de lidentit des opinions des rgions A et Bquant au produit considr.
Solution 1
La rpartition observe est :
T ableau des eff ectifs observ ees
R egion Opinion favorable non favorable T otal
R egion A 630 1170 1800
R egion B 150 450 600
Total 780 1620 2400
Testons, au seuil , lhypothse nulle :
H 0 : les rgions A et B ont la mme opinion
Calculons, sous cette hypothse, la rpartition thorique :
Tableau des effectifs th eoriques
R egion Opinion favorable non favorable T otal
R egion A 585 1215 1800
R egion B 195 405 600
Total 780 1620 2400
Sous lhypothse nulle H 0 , la quantit :
2 =2
Xi=12
X j =1(oij t ij )2
t ij
63
-
7/29/2019 Exercices de Statistique 2006
68/124
Les Tests du Khi-Deux A. El Mossadeq
est une ralisation dune variable du Khi-deux :
(2 1)(2 1) = 1degr de libert.Pour = 5%, on a :
21; .95 = 3 .84
Et comme :
2 =2
Xi=12
X j =1(oij t ij )2
t ij
= 20 .51On rejette alors H 0 95% (et mme 99.5%), cest dire, les deux rgions ont des opinions di ff rentes quant au produit considr.
Exercice 2
Dans un groupe de 200 malades atteints du cancer du col de lutrus, un traitementpar application locale du radium a donn 50 gurisons.Un autre groupe de 150 sujets atteints de la mme maladie a t trait par chirurgie,on a trouv 54 gurisons.Que peut-on conclure ?
Solution 2
La rpartition observe est :
T ableau des eff ectifs observ ees
Traitement R esultat gu eri non gu eri Total
radium 50 150 200
chirurgie 54 96 150
Total 104 246 350
Testons, au seuil , lhypothse nulle :
H 0 : les deux traitements sont quivalents
64
-
7/29/2019 Exercices de Statistique 2006
69/124
A. El Mossadeq Les Tests du Khi-Deux
Calculons, sous cette hypothse, la rpartition thorique :
Tableau des effectifs th eoriques
Traitement R esultat gu eri non gu eri Total
radium 59.4 140.6 200
chirurgie 44.6 105.4 150
Total 104 246 350
Sous lhypothse nulle H 0 , la quantit :
2 =2
Xi=12
X j =1(oij t ij )2
t ij
est une ralisation dune variable du Khi-deux :
(2 1)(2 1) = 1
degr de libert.Pour = 5%, on a :
21; .95 = 3 .84
Et comme :
2 =2
Xi=12
X j =1(oij t ij )2
t ij
= 4 .94
On rejette alors H 0 95% , cest dire, les deux traitements ne sont pas quivalents .
Exercice 3
Aux guichets dune gare parisienne, sur les 350 billets vendus vendredi aprs-midi,95 taient des billets de 1ere classe. Sur les 250 billets vendus la matine du lundisuivant, 55 taient de 1ere classe.Peut-on considrer quil y une di ff rence entre les proportions de vente de parcoursen 1ere classe pour les ns et dbuts de semaines ?
65
-
7/29/2019 Exercices de Statistique 2006
70/124
Les Tests du Khi-Deux A. El Mossadeq
Solution 3
La rpartition observe est :
T ableau des eff ectifs observ ees
jour Classe 1ere classe 2ere classe T otal
V endredi A.M 95 255 350
Lundi matin 55 195 250
Total 150 450 600
Testons, au seuil , lhypothse nulle :H 0 : les taux de billets de parcours en 1ere classe vendus en n
et dbut de semaines sont identiques
Calculons, sous cette hypothse, la rpartition thorique :
Tableau des effectifs th eoriques
Jour Classe 1ere classe 2ere classe T otal
V endredi A.M 87.5 262.5 350
Lundi matin 62.5 187.5 250
Total 150 450 600
Sous lhypothse nulle H 0 , la quantit :
2 =2
Xi=12
X j =1(oij t ij )2
t ij
est une ralisation dune variable du Khi-deux :
(2 1)(2 1) = 1
degr de libert.Pour = 5%, on a :
21; .95 = 3 .84
66
-
7/29/2019 Exercices de Statistique 2006
71/124
A. El Mossadeq Les Tests du Khi-Deux
Et comme :
2 =2
Xi=12
X j =1 (oij t ij )2
t ij
= 2 .06
On accepte alors H 0 au seuil = 5% , cest dire, les taux de billets de parcours en 1 ere classe vendus en ns et dbuts de semaines sont identiques.
Exercice 4
On a lanc cent fois une pice de monnaie et lon a obtenu soixante fois pile et
quarante fois face.Tester au seuil de 5% puis 1%, lhypothse de la loyaut de la pice.
Solution 4
Testons, au seuil , lhypothse nulle :
H 0 : la pice est loyale
Sous cette hypothse, on a :
p = 0 .5
do les rpartitions :
C ot e R epartition Observ ee R epartition T h eorique
pile 60 50
face 40 50
Total 100 100
Sous lhypothse nulle H 0 , la quantit :
2 =2
Xi=1(oi t i )2
t i
67
-
7/29/2019 Exercices de Statistique 2006
72/124
Les Tests du Khi-Deux A. El Mossadeq
est une ralisation dune variable du Khi-deux :
2 1 = 1degr de libert.On a :
2 =2
Xi=1(oi t i )2
t i= 4
(1) Pour = 5%, on a :
21; .95 = 3 .84
On rejette donc lhypothse nulle H 0 95%, cest dire, qu 95%, la pice est truque.
(2) Pour = 1%, on a :
21; .99 = 6 .63
On accepte donc lhypothse nulle H 0 au seuil = 1%, cest dire, quau
seuil = 1%, la pice est normale.
Exercice 5
On veut savoir si la russite (R ) dun traitement est indpendantes du niveaux dela tension artrielle du malade (T ).On dispose pour cela de 250 observations rparties comme suit :
T R echec succ es
basse 21 104
elev ee 29 96
Que peut-on conclure ?
68
-
7/29/2019 Exercices de Statistique 2006
73/124
A. El Mossadeq Les Tests du Khi-Deux
Solution 5
La rpartition observe est :
T ableau des eff ectifs observ ees
T R Echec Succ es Total
Basse 21 104 125
Elev ee 29 96 125
Total 50 200 250
Testons, au seuil , lhypothse nulle :
H 0 : la russite du traitement est indpendante du niveau de la tension artrielle
Calculons, sous cette hypothse, la rpartition thorique, le tableau de cette rpar-tition est donn ci-aprs.
Tableau des effectifs th eoriques
T R Echec Succ es Total
Basse 25 100 125
Elev ee 25 100 125
Total 50 200 250
Sous lhypothse nulle H 0 , la quantit :
2 =2
Xi=12
X j =1(oij t ij )2
t ij
est une ralisation dune variable du Khi-deux :
(2 1)(2 1) = 1
degr de libert.Pour = 5%, on a :
21; .95 = 3 .84
69
-
7/29/2019 Exercices de Statistique 2006
74/124
Les Tests du Khi-Deux A. El Mossadeq
Et comme :
2 =2
Xi=12
X j =1 (oij t ij )2
t ij
= 1 .6
On accepte alors H 0 au seuil = 5% , cest dire, la russite du traitement est indpendante du niveau de la tension artrielle.
Exercice 6
On veut savoir sil y a une liason entre la localisation (L) du cancer du poumon
(priphrique , non priphrique) et le ct (C ) de la lsion (poumon gauche ,poumon droit).Ltude a port sur 1054 malades :
L C gauche droit
periph erique 26 62
non p eriph erique 416 550
Que peut-on conclure ?
Solution 6
La rpartition observe est :
T ableau des eff ectifs observ ees
L C gauche droit Total
periph erique 26 62 88
non p eriph erique 416 550 966
Total 442 612 1054
Testons, au seuil , lhypothse nulle :
H 0 : la localisation du cancer est indpendante du ct de la lsion
Calculons, sous cette hypothse, la rpartition thorique.Le tableau de cette rpartition est donne ci-aprs.
70
-
7/29/2019 Exercices de Statistique 2006
75/124
A. El Mossadeq Les Tests du Khi-Deux
Tableau des effectifs th eoriques
L C gauche droit Total
periph erique 36.9 51.1 88
nonp eriph erique 405.1 560.9 966
Total 442 612 1054
Sous lhypothse nulle H 0 , la quantit :
2 =2
Xi=12
X j =1(oij t ij )2
t ij
est une ralisation dune variable du Khi-deux :
(2 1)(2 1) = 1
degr de libert.Pour = 5%, on a :
2
1; .95 = 3 .84Et comme :
2 =2
Xi=12
X j =1(oij t ij )2
t ij
= 6 .05
On rejette alors H 0 95% (mme 97.5%), cest dire, la localisation du cancer dpend du ct de la lsion.
Exercice 7
De nombreuses observations cliniques ont montr que jusque l :
30% des malades atteints de M ont une survie infrieure un an 50% ont une survie entre un an et deux ans 10% ont une survie entre deux ans et cinq ans 10% ont une survie suprieure cinq ans.
On applique un nouveau traitement 80 malades atteint de la maladie M et onconstate :
71
-
7/29/2019 Exercices de Statistique 2006
76/124
Les Tests du Khi-Deux A. El Mossadeq
12 ont une survie infrieure un an 56 ont une survie entre un an et deux ans 8 ont une survie entre deux ans et cinq ans 4 ont une survie suprieure cinq ans.
Que peut-on conclure ?
Solution 7
Testons, au seuil , lhypothse nulle :
H 0 : le nouveau traitement nest pas actif contre la maladie M
Sous cette hypothse, on a les rpartitions :
Survie R epartition Observ ee R epartition T h eorique
survie 1 an 12 24
1 an < survie 2 ans 56 40
2 an < survie 5 ans 8 8
survie > 5 ans 4 8
Total 80 80
Sous lhypothse nulle H 0 , la quantit :
2 =4
Xi=1(oi t i )2
t i
est une ralisation dune variable du Khi-deux :4 1 = 3
degrs de libert.
Pour = 5%, on a :
23; .95 = 7 .81
72
-
7/29/2019 Exercices de Statistique 2006
77/124
A. El Mossadeq Les Tests du Khi-Deux
Et comme :
2 =2
Xi=1 (oi t i )2
t i= 14 .4
on rejette donc lhypothse nulle H 0 95% (mme 99.5%), cest dire, qu 99.5%,le nouveau traitement est actif contre la maladie M .
Exercice 8
On suppose pouvoir classer les malades atteints dune maladie M en trois catgories
cliniques : A , B , C.On se demande si ces trois catgories di ff rent par leurs survies un an.Les eff ectifs observs sont les suivants :
Survie Cat egorie A B C
survie a un an 5 20 45
deces avant un an 15 50 145
Que peut-on conclure ?
Solution 8
La rpartition observe est :
T ableau des eff ectifs observ ees
Survie Cat egorie A B C Total
Survie a un an 5 20 45 70
D eces avant un an 15 50 145 210
Total 20 70 190 280
Testons, au seuil , lhypothse nulle :
H 0 : la survie un an est indpendante de la catgorie clinique
Calculons, sous cette hypothse, la rpartition thorique.
73
-
7/29/2019 Exercices de Statistique 2006
78/124
Les Tests du Khi-Deux A. El Mossadeq
Tableau des effectifs th eoriques
Survie Cat egorie A B C T otal
Survie a un an 5 17.5 47.5 70
D eces avant un an 15 52.5 142.5 210
Total 20 70 190 280
Sous lhypothse nulle H 0 , la quantit :
2 =2
Xi=13
X j =1(oij t ij )2
t ij
est une ralisation dune variable du Khi-deux :
(2 1)(3 1) = 2
degrs de libert.
Pour = 5%, on a :
22; .95 = 5 .99
Et comme :
2 =2
Xi=13
X j =1(oij t ij )2
t ij
= .65
On accepte alors H 0 au seuil = 5% , cest dire, la survie un an est indpendante de la catgorie clinique.
Exercice 9
75 enfants sont vus en consultation pour un asthme. On relve chez eux les deuxsymptmes suivants :* Intensit de la maladie asmathique : lgre , moyenne , forte* Existence ou absence dun eczma au moment de lobservation ou dans le pass.
74
-
7/29/2019 Exercices de Statistique 2006
79/124
A. El Mossadeq Les Tests du Khi-Deux
On peut classer les enfants selon la rpartition suivante :
E A fort moyen l eger
pr esent 8 2 2
pass e 11 11 3
jamais 6 18 14
Au vu de ces rsultats, existe-t-il une association entre lintensit de lasthme etlexistence dun eczma ?
Solution 9
Le tableau de la rpartition observe est donne ci-aprs:
T ableau des eff ectifs observ ees
Ecz ema Asthme fort moyen l eger Total
pr esent 8 2 2 12
pass e 11 11 3 25
jamais 6 18 14 38
Total 25 31 19 75
Testons, au seuil , lhypothse nulle :
H 0 : lintensit de lasthme est indpendante de lexistence dun eczma
Calculons, sous cette hypothse, la rpartition thorique.Le tableau de cette rpartition est donne ci-aprs.
75
-
7/29/2019 Exercices de Statistique 2006
80/124
Les Tests du Khi-Deux A. El Mossadeq
Tableau des effectifs th eoriques
Ecz ema Asthme fort moyen l eger Total
pr esent 4 4.96 3.04 12
pass e 8.33 10.33 6.34 25
jamais 12.67 15.71 9.62 38
Total 25 31 19 75
Les eff ectifs thoriques sur la premire ligne sont strictement infrieurs cinq, ce quiempche lapplication dun test du Khi-deux.On peut remdier cet tat en oprantle groupement logique des classes pr esent et pass e.Les nouveaux tableaux des e ff ectifs observs et thoriques, obtenus aprs regroupe-ment de ces deux classes sont donns ci-aprs.
T ableau des eff ectifs observ ees
Ecz ema Asthme fort moyen l eger Total
pr esent ou pass e 19 13 5 37
jamais 6 18 14 38
Total 25 31 19 75
Tableau des effectifs th eoriques
Ecz ema Asthme fort moyen l eger T otal
pr esent ou pass e 12.33 15.29 9.38 37
jamais 12.67 15.71 9.62 38
Total 25 31 19 75
Sous lhypothse nulle H 0 , la quantit :
2 =2
Xi=13
X j =1(oij t ij )2
t ij
76
-
7/29/2019 Exercices de Statistique 2006
81/124
A. El Mossadeq Les Tests du Khi-Deux
est une ralisation dune variable du Khi-deux :
(2 1)(3 1) = 2degrs de libert.Pour = 5%, on a :
22; .95 = 5 .99
Et comme :
2 =2
Xi=13
X j =1(oij t ij )2
t ij
= 11 .84
On rejette alors H 0 95% (mme 99.5%), cest dire, lintensit de lasthme dpend de lexistence dun eczma.
Exercice 10
Une tude statistique relative aux rsultats dadmission du concours dune grandecole fait ressortir la rpartition des admis selon la profession des parents lorsquecelle-ci est connue.
1. La profession des parents a-t-elle une in uence sur laccs cette cole ?
2. Cette conclusion persiste-t-elle lorsquon tient compte pour complter la statis-tique prcdente de 961 candidats dont lorigine socio-professionnelle est incon-nue et qui ont obtenus 43 succs ?
P rofession des P arents Candidats Admis
F ontionnaires et Assimil es 2224 180
Commerce et I ndustrie 998 89
Professions Lib erales 575 48
Propri etaires Rentiers 423 37
Propri etaires Agricoles 287 13
Artisans 210 18
Banques et Assurances 209 17
77
-
7/29/2019 Exercices de Statistique 2006
82/124
Les Tests du Khi-Deux A. El Mossadeq
Solution 10
1. La rpartition observe est :
P rofession des P arents Candidats Admis Non admis
F ontionnaires et Assimil es 2224 180 2044
Commerce et Industrie 998 89 899
Professions Lib erales 575 48 527
Propri etaires Rentiers 423 37 386
Propri etaires Agricoles 287 13 274
Artisans 210 18 192
Banques et Assurances 209 17 192
Total 4916 402 4514
Testons, au seuil , lhypothse nulle :
H 0 : laccs lEcole est indpendant de la profession des parents
Calculons, sous cette hypothse, la rpartition thorique :
P rofession des P arents Candidats Admis Non admis
F ontionnaires et Assimil es 2224 181.9 2042.1
Commerce et Industrie 998 80.8 907.2
Professions Lib erales 575 47 528
Propri etaires Rentiers 423 34.6 388.4
Propri etaires Agricoles 287 23.5 263.5
Artisans 210 17.2 192.8
Banques et Assurances 209 17.1 191.9
Total 4916 402 4514
78
-
7/29/2019 Exercices de Statistique 2006
83/124
A. El Mossadeq Les Tests du Khi-Deux
Sous lhypothse nulle H 0 , la quantit :
2 =7
Xi=12
X j =1 (oij t ij )2
t ij
est une ralisation dune variable du Khi-deux :
(7 1)(2 1) = 6
degrs de libert.Pour = 5%, on a :
26; .95 = 12 .6
Et comme :
2 =2
Xi=13
X j =1(oij t ij )2
t ij= 6 .28
On accepte alors H 0 au seuil = 5% , cest dire, laccs lEcole est indpen-dant de la profession des parents.
2. Si lon tient compte des 961 candidats dont lorigine socio-professionnelle estinconnue et qui ont obtenus 43 succs, la rpartition observe et la rpartitionthorique, sous la mme hypothse nulle, deviennent comme consogns ci-aprs.
T ableau des eff ectifs observ ees
P rofession des P arents Candidats Admis Non admis
F ontionnaires et Assimil es 2224 180 2044
Commerce et Industrie 998 89 899
Professions Lib erales 575 48 527
Propri etaires Rentiers 423 37 386
Propri etaires Agricoles 287 13 274
Artisans 210 18 192
Banques et Assurances 209 17 192
Autres 961 43 918
Total 5877 445 5432
79
-
7/29/2019 Exercices de Statistique 2006
84/124
Les Tests du Khi-Deux A. El Mossadeq
Tableau des effectifs th eoriques
P rofession des P arents Candidats Admis Non admis
F ontionnaires et Assimil es 2224 168.4 2055.6
Commerce et Industrie 998 74.8 913.2
Professions Lib erales 575 43.5 531.5
Propri etaires Rentiers 423 32 391
Propri etaires Agricoles 287 21.7 265.3
Artisans 210 15.9 194.1
Banques et Assurances 209 15.8 193.2
Autres 961 72.8 888.2
Total 5877 445 5432
Sous lhypothse nulle H 0 , la quantit :
2 =8
Xi=12
X j =1(oij t ij )2
t ij
est une ralisation dune variable du Khi-deux :
(8 1)(2 1) = 7
degrs de libert.Pour = 5%, on a :
27; .95 = 14 .1Et comme :
2 =2
Xi=13
X j =1(oij t ij )2
t ij= 22 .5
On rejette alors H 0 95% (mme 99.5%) , cest dire, laccs lEcole est indpendant de la profession des parents.
80
-
7/29/2019 Exercices de Statistique 2006
85/124
A. El Mossadeq Les Tests du Khi-Deux
Exercice 11
Sur un chantillon de 84 prmaturs, on cherche sil existe une liaison entre la
survenue dune hypoglycmie et la survenue dun ictre : sur 43 enfants nayant pas dictre, 23 sont hypoglycmiques sur 20 enfants ayant un ictre modr, 6 sont hypoglycmiques sur 21 enfants ayant un ictre intense, 4 sont hypoglycmiques
Que peut-on conclure ?
Solution 11
La rpartition observe est donne dans le tableau :
T ableau des eff ectifs observ ees
Ict ere Hypoglyc emie hypoglyc emique non hypoglyc emique T otal
pas d 0ict ere 23 20 43
ict ere mod er e 6 14 20
ict ere intense 4 17 21Total 33 51 84
Testons, au seuil , lhypothse nulle :
H 0 : la survenue dune hypoglycmie est indpendante de la survenue dun ictre
Calculons, sous cette hypothse, la rpartition thorique :
Tableau des effectifs th eoriques
Ict ere Hypoglyc emie hypoglyc emique non hypoglyc emique T otal
pas d 0ict ere 16.89 26.11 43
ict ere mod er e 7.86 12.14 20
ict ere intense 8.25 12.75 21
Total 33 51 84
81
-
7/29/2019 Exercices de Statistique 2006
86/124
Les Tests du Khi-Deux A. El Mossadeq
Sous lhypothse nulle H 0 , la quantit :
2 =2
Xi=12
X j =1 (oij t ij )2
t ij
est une ralisation dune variable du Khi-deux :
(3 1)(2 1) = 2
degrs de libert.Pour = 5%, on a :
22; .95 = 5 .99
Et comme :
2 =3
Xi=12
X j =1(oij t ij )2
t ij
= 7 .97
On rejette alors H 0 95% (mme 97.5%), cest dire, la survenue dune hypogly-cmie dpend de la survenue dun ictre.
Exercice 12
Un mdicament essay sur 42 patients est contrl quant aux e ff ets secondaires quilpeut avoir sur le poids des malades.On peut considrer que :
quinze dentre eux ont maigri dix sept nont pas chang de poids dix ont grossi
En supposant que la maladie est sans e ff et sur les variations de poids, le mdicamenta-t-il un e ff et signi catif sur le poids ?
Solution 12
Testons, au seuil , lhypothse nulle :
H 0 : le traitement est sans e ff et sur les variations du poids
Si le traitement est sans e ff et sur les variations du poids, alors ces variations sontdes seulement au hasard.La loi de probabilit est donc la loi uniforme, cest dire la probabilit de chaqueclasse est la mme et est gale
13
.
82
-
7/29/2019 Exercices de Statistique 2006
87/124
A. El Mossadeq Les Tests du Khi-Deux
Do les rpartitions :
V ariations R epartition Observ ee R epartition Th eorique
ont maigri 15 14
n 0ont pas chang e 17 14
ont grossi 10 14
Total 42 42
Sous lhypothse nulle H 0 , la quantit :
2 =3
Xi=1(oi t i )2
t i
est une ralisation dune variable du Khi-deux :
3 1 = 2
degrs de libert.
Pour
= 5%, on a : 22; .95 = 5 .99
Et comme :
2 =2
Xi=1(oi t i )2
t i= 1 .86
on accepte donc lhypothse nulle H 0 au seuil = 5%, cest dire, le traitement est sans e ff et sur les variations du poids.
Exercice 13
Pour tudier la densit de poussires dans un gaz, on a procd une srie dobservationsde petits chantillons de gaz au moyen dun microscope.On a ainsi eff ectu 143 observations et les rsultats sont les suivants :
83
-
7/29/2019 Exercices de Statistique 2006
88/124
Les Tests du Khi-Deux A. El Mossadeq
Nombre de particules en suspension Nombre d0
echantillons de gaz
0 34
1 46
2 38
3 19
4 4
5 2
> 5 0
Peut-on admettre, au seuil = 5%, que le nombre de particules en suspension estune variable de Poisson ?
Solution 13Testons, au seuil , lhypothse nulle :
H 0 : le nombre de particules en suspension est une variable de Poisson
Calculons une estimation ponctuelle du paramtre de cette loi :
P [X = k] = k
k!exp
o X est la variable alatoire reprsentant le nombre de particules en suspension.On sait que :
= 1n
n
Xi=1 X iest un estimateur sans biais et convergent de .Une estimation ponctuelle de est donne par :
=1
143
5
Xi=0 in i= 1 .4336
Do les rpartitions :
84
-
7/29/2019 Exercices de Statistique 2006
89/124
A. El Mossadeq Les Tests du Khi-Deux
P articules en suspension R epartition observ ee R epartition th eorique
0 34 34.1
1 46 48.9
2 38 35.0
3 19 16.7
4 4 06.0
5 2 01.7
> 5 0 00.6
Total 143 143
Leff ectif thorique t k , k 0, reprsentant le nombre particules en suspension k estdonn par :
tk = nP [X = k]
On constate que le tableau contient des e ff ectifs thoriques strictement infrieurs 5, ce qui empche lutilisation dun test du khi-deux.On peut remdier cet tat en oprant le groupement logique des classes 4 et plus .Les tableaux des e ff ectifs observs et thoriques deviennent comme consigns ci-aprs.
P articules en suspension R epartition observ ee R epartition th eorique
0 34 34.1
1 46 48.9
2 38 35.0
3 19 16.7
4 4 08.3
Total 143 143
85
-
7/29/2019 Exercices de Statistique 2006
90/124
Les Tests du Khi-Deux A. El Mossadeq
Sous lhypothse nulle H 0 , la quantit :
2 =4
Xi=0(oi t i )2
t i
est une ralisation dune variable du Khi-deux :
5 1 1 = 3
degrs de libert.puisque pour calculer les e ff ectifs thoriques, nous avons utilislestimation, et non la valeur rel, du paramtre de la loi de Poisson.
Pour = 5%, on a :
23; .95 = 7 .81Et comme :
2 = 2 .97
On accepte alors H 0 au seuil = 5%, cest dire, le nombre de particules en suspension peut tre ajust par une loi de Poisson dont le paramtre est estimpar :
= 1 .4336
Exercice 14
Le tableau ci-aprs concerne le nombre annuel de cyclones tropicaux ayant atteintla cte orientale des Etats-Unis entre 1887 et 1956 :
Nombre annuel de cyclones Nombre d 0ann ees0 11 62 10
3 164 195 56 87 38 19 1
> 9 0
Peut-on admettre, au seuil = 5%, que ce nombre annuel de cyclones est unevariable de Poisson ?
86
-
7/29/2019 Exercices de Statistique 2006
91/124
A. El Mossadeq Les Tests du Khi-Deux
Solution 14
Testons, au seuil , lhypothse nulle :
H 0 : le nombre annuel de cyclones est une variable de Poisson
Calculons une estimation ponctuelle du paramtre de cette loi :
P [X = k] = k
k!exp
o X est la variable alatoire reprsentant le nombre annuel de cyclones.On sait que :
=1n
n
Xi=1 X iest un estimateur sans biais et convergent de .Une estimation ponctuelle de est donne par :
=170
9
Xi=0 in i = 3 .7286Leff ectif thorique t k , k 0, reprsentant le nombre dannes k cyclones est donnpar :
tk = nP [X = k]
Do les rpartitions :
Nombre annuel de cyclones Ef fectifs observ es Eff ectifs th eoriques0 1 1.681 6 6.272 10 11.693 16 14.534 19 13.545 5 10.16 8 6.287 3 3.348 1 1.569 1 0.65
> 9 0 0.36Total 70 70
On constate que le tableau contient des e ff ectifs thoriques strictement infrieurs 5, ce qui empche lutilisation dun test du khi-deux.On peut remdier cet tat en oprant le groupement logique :* des classes 0 et 1 dune part,* et des classes 7 et plus dautre part.
87
-
7/29/2019 Exercices de Statistique 2006
92/124
Les Tests du Khi-Deux A. El Mossadeq
Les tableaux des e ff ectifs observs et thoriques deviennent :
Nombre annuel de cyclones Ef fectifs observ es Eff ectifs th eoriques
0 ou 1 7 7.95
2 10 11.69
3 16 14.53
4 19 13.54
5 5 10.10
6 8 6.28
7 5 5.91
Total 70 70
Sous lhypothse nulle H 0 , la quantit :
2 =7
Xi=1(oi t i )2
t i
est une ralisation dune variable du Khi-deux :
7 1 1 = 5
degrs de libert.puisque pour calculer les e ff ectifs thoriques, nous avons utilislestimation, et non la valeur rel, du paramtre de la loi de Poisson.Pour = 5%, on a :
25; .95 = 5 .8948
Et comme :
2 = 5 .81
On accepte alors H 0 au seuil = 5%, cest dire, le nombre annuel de cyclones peut tre ajust par une loi de Poisson dont le paramtre est estim par :
= 3 .7286
88
-
7/29/2019 Exercices de Statistique 2006
93/124
A. El Mossadeq Les Tests du Khi-Deux
Exercice 15
Le tableau suivant indique le rsultat de lexamen de 124 sujets, classs daprs la
couleur de leurs yeux (Y ) et la couleur de leus cheveux (C ) :
Y C Blonds Bruns N oirs Roux
Bleus 25 9 3 7
Gris ou V erts 13 17 10 7
Marrons 7 13 8 5
Existe-t-il une liason entre ces deux caractres ?
Solution 15
La rpartition observe est :
Y C Blonds Bruns N oirs Roux Total
Bleus 25 9 3 7 44
Gris ou V erts 13 17 10 7 47Marrons 7 13 8 5 33
Total 45 39 21 19 124
Testons, au seuil , lhypothse nulle :
H 0 : les couleurs des yeux et des cheveux sont indpendantes
Calculons, sous cette hypothse, la rpartition thorique :
Y C Blonds Bruns N oirs Roux Total
Bleus 16 13.8 7.4 6.8 44
Gris ou V erts 17 14.8 8 7.2 47
Marrons 12 10.4 5.6 5 33
Total 45 39 21 19 124
89
-
7/29/2019 Exercices de Statistique 2006
94/124
Les Tests du Khi-Deux A. El Mossadeq
Sous lhypothse nulle H 0 , la quantit :
2 =3
Xi=14
X j =1 (oij t ij )2
t ij
est une ralisation dune variable du Khi-deux :
(3 1)(4 1) = 6
degrs de libert.
Pour = 5%, on a :
26; .95 = 12 .6
Et comme :
2 =2
Xi=13
X j =1(oij t ij )2
t ij
= 15
On rejette alors H 0 95% (mme 97.5%), cest dire, les couleurs des yeux et des cheveux ne sont pas indpendantes.
Exercice 16
On considre les familles de quatre enfants.Sur un chantillon de cent familles quatre enfants, la rpartition suivante a t ob-serve :
Nombre de filles Nombre de familles
0 7
1 20
2 41
3 22
4 10
Peut-on considrer que la probabilit quun enfant soit une lle est12
?
90
-
7/29/2019 Exercices de Statistique 2006
95/124
A. El Mossadeq Les Tests du Khi-Deux
Solution 16
Testons, au seuil , lhypothse nulle :
H 0 : la probabilit davoir une lle est 12
Sous lhypothse nulle H 0 , la variable alatoire X gale au nombre de lles parmi
les quatre enfants suit une loi binomiale dordre 4 et de paramtre12
: B 4, 12.Ainsi, pour tout k, 0 k 4, la probabilit pk davoir k lles parmi les quatreenfants est :
pk = C (4, k )124
Leff ectif thorique t k , 0 k 4, reprsentant le nombre de familles ayant k llesparmi les quatre enfants est donn par :
tk = np k
Do les rpartitions :
Nombre de filles R epartition observ ee R epartition th eorique
0 7 6.25
1 20 25
2 41 37.5
3 22 25
4 10 6.25
Total 100 100
Sous lhypothse nulle H 0 , la quantit :
2 =4
Xi=0(oi t i )2
t i
est une ralisation dune variable du Khi-deux :
5 1 = 4
degrs de libert.Pour = 5%, on a :
24; .95 = 9 .49
91
-
7/29/2019 Exercices de Statistique 2006
96/124
Les Tests du Khi-Deux A. El Mossadeq
Et comme :
2 = 4 .03
On accepte alors H 0 au seuil = 5% : la probabilit davoir une lle est 12
.
Exercice 17
On distribue un jeu de quarante cartes quatre joueurs : A , B , C , D ; chacunreevant dix cartesUn statisticien a labor un programme de distribution de donnes par ordinateur.Pour un ensemble de deux cents donnes, obtenues partir de ce programme, il
observe le nombre de donnes o le joueur A reoit k as, 0
k
4. Les rsultatssont les suivants :
Nombre d 0as Nombre de donnes
0 64
1 74
2 52
3 8
4 2
Le programme du statisticien est-il able ?
Solution 17
Testons, au seuil , lhypothse nulle :
H 0 : le programme du statisticien est able
Sous lhypothse nulle H 0 , la variable alatoire X gale au nombre das du joueurA suit une loi hypergomtrique.Ainsi, pour tout k, 0 k 4, la probabilit pk pour que le joueur A ait k as est :