课件制作:应用数学系 概率统计课程组

113
课课课课 课课课课课 概概 概概概概 概概概概概概

Upload: eric-ramsey

Post on 03-Jan-2016

108 views

Category:

Documents


0 download

DESCRIPTION

概率论与数理统计. 课件制作:应用数学系 概率统计课程组. 参数估计. 7-2. 统 计 推 断. 点 估 计. 参数估 计问题. 区间估 计. 假设检 验问题. 点估计. 区间估计. 什么是参数估计?. 参数是刻画总体某方面的概率特性的数量. 当这个数量是未知的时候,从总体抽出一个 样本,用某种方法对这个未知参数进行估计 就是参数估计. 例如, X ~N (  , 2 ),. 若  ,  2 未知,通过构造样本的函数 , 给出它 们的估计值或取值范围就是参数估计的内容. 参数估计的类型. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 课件制作:应用数学系 概率统计课程组

课件制作:应用数学系

概率统计课程组

概率论与数理统计

Page 2: 课件制作:应用数学系 概率统计课程组

参数估计

Page 3: 课件制作:应用数学系 概率统计课程组

参数估计问题

假设检验问题

点 估 计

区间估 计统计推断

7-2

Page 4: 课件制作:应用数学系 概率统计课程组

什么是参数估计?参数是刻画总体某方面的概率特性的数量 .

当这个数量是未知的时候,从总体抽出一个样本,用某种方法对这个未知参数进行估计就是参数估计 .

例如, X ~N ( , 2),

点估计 区间估计

若 , 2 未知,通过构造样本的函数 , 给出它们的估计值或取值范围就是参数估计的内容 .

Page 5: 课件制作:应用数学系 概率统计课程组

参数估计的类型

点估计 (point Estimation) —— 估计未知参数的值

区间估计 (interval Estimation)—— 估计未知参数的取值范围,使得这个范围包含未知参数真值的概率为给定的值 .

Page 6: 课件制作:应用数学系 概率统计课程组

点估计方法点估计的思想方法设总体 X 的分布函数的形式已知,但它含有一个或多个未知参数: 1,2, ,k

设 X1, X2,…, Xn 为总体的一个样本构造 k 个统计量:

),,,(

),,,(

),,,(

21

212

211

nk

n

n

XXX

XXX

XXX

随机变量

7-5

Page 7: 课件制作:应用数学系 概率统计课程组

当测得一组样本值 (x1, x2,…, xn) 时,代入上述统计量,即可得到 k 个数:

),,,(ˆ

),,,(ˆ

),,,(ˆ

21

212

211

nk

n

n

xxx

xxx

xxx

数值

称数k ˆ,,ˆ,ˆ

21 为未知参数 k ,,, 21 的估计值

aa 如何构造统计量?如何评价估计量的好坏?

对应的统计量为未知参数 k ,,, 21 的估计量

7-6

Page 8: 课件制作:应用数学系 概率统计课程组

三种常用的点估计方法 频率替换法 (Frequency substitution)

利用事件 A 在 n 次试验中发生频率nnA

作为事件 A 发生的概率 p 的估计量

pn

n pA

7-7

Page 9: 课件制作:应用数学系 概率统计课程组

例 1 设总体 X ~ N ( , 2 ), 在对其作 28 次独立

观察中 , 事件 “ X < 4” 出现了 21 次 , 试用频率替换法求参数 的估计值 .

解 由 75.028

21)

2

4()4(

XP

675.02

4

查表得

于是 的估计值为

045.3

7-8

Page 10: 课件制作:应用数学系 概率统计课程组

矩法 ( Method of moment)

方法用样本的 k 阶矩作为总体的 k 阶矩的 估计量 , 建立含有待估计参数的方程,从而可解出待估计参数

7-9

一般地,不论总体服从什么分布,总体期望 与方差 2 存在,则它们的矩估计量分别为

XXn

n

ii

1

1

2

1

22 )(1

ˆ n

n

ii SXX

n

Page 11: 课件制作:应用数学系 概率统计课程组

7-10

事实上,按矩法原理,令

n

iiX

nX

1

1

)(1 2

1

22 XEX

nA

n

ii

X

)()(ˆ 222 XEXE 22 A

2

1

21XX

n

n

ii

2

1

2)(1

n

n

ii SXX

n

Page 12: 课件制作:应用数学系 概率统计课程组

7-11设待估计的参数为 k ,,, 21

设总体的 r 阶矩存在,记为

),,,()( 21 krrXE

设 X1, X2,…, Xn 为一样本,样本的 r 阶矩为

n

i

rir X

nB

1

1

kr ,,2,1 令

),,,( 21 kr

n

i

riX

n 1

1

—— 含未知参数 1,2, ,k 的方程组

Page 13: 课件制作:应用数学系 概率统计课程组

解方程组,得 k 个统计量:

),,,(ˆ

),,,(ˆ

),,,(ˆ

21

212

211

nk

n

n

XXX

XXX

XXX

——未知参数 1,2, ,k

的矩估计量

),,,(ˆˆ

),,,(ˆˆ

),,,(ˆˆ

21

2122

2111

nkk

n

n

xxx

xxx

xxx

——未知参数 1,2, ,k

的矩估计值

代入一组样本值得 k 个数 :

Page 14: 课件制作:应用数学系 概率统计课程组

例 2 设总体 X ~ N ( , 2 ), X1, X2,…, Xn 为总体的 样本 , 求 , 2 的矩法估计量。解 X矩

2

1

22 1ˆ XX

n

n

ii

例 3 设总体 X ~ E(), X1, X2,…, Xn 为总体的样本 , 求的矩法估计量。

解 1

)( XE1

X令故

X

1矩

Page 15: 课件制作:应用数学系 概率统计课程组

例 4 设从某灯泡厂某天生产的一大批灯泡中 随机地抽取了 10 只灯泡,测得其寿命为 ( 单位:小时 ) : 1050, 1100, 1080, 1120, 1200 1250, 1040, 1130, 1300, 1200 试用矩法估计该厂这天生产的灯泡的平均 寿命及寿命分布的标准差 .

解)(1147

101

)(10

1

hxxXEi

i

6821101

ˆ)( 210

1

22

xxXDi

i

)(25.79)( hXD

Page 16: 课件制作:应用数学系 概率统计课程组

例 5 设总体 X ~ U (a, b), a, b 未知,求 a, b 的 矩法估计量 .

解 由于12

)()(,

2)(

2abXD

baXE

)()()( 22 XEXDXE

22

212

)(

baab

Xba

2

ˆˆ

n

iiX

nA

baab

1

22

22 1

2

ˆˆ

12

)ˆˆ(

Page 17: 课件制作:应用数学系 概率统计课程组

解得)(3ˆ 2

2 XAXa 矩

n

ii XX

nX

1

2)(3

)(3ˆ 22 XAXb 矩

n

ii XX

nX

1

2)(3

7-16

Page 18: 课件制作:应用数学系 概率统计课程组

点估计的极大似然估计法 (maximum likelihood)

思想方法:一次试验就出现的 事件有较大的概率

例如 : 有两个外形相同的箱子 , 都装有 100 个球 一号箱 99 个白球, 1 个红球 一号箱 1 个白球, 99 个红球

现从两箱中任取一箱,并从箱中任取一球,结果所取得的球是白球。

答 :极有可能是第一箱 .

问 所取的球来自哪一箱?

Page 19: 课件制作:应用数学系 概率统计课程组

Example: 设有甲乙两个口袋,袋中各装有4个同样大小的球,球上分别涂有白色( W)或黑色 (B) ,已知在甲袋中黑球数为1,乙袋中黑球数为3.(1)现任取一袋,再从中任取一球,发现是黑球,试问该球是取自哪一袋?(2)现任取一袋,再从中有返回地任取三球,发现有一个是黑球,试问该球是取自哪一袋?解: (1)设 p为抽到黑球的概率,从甲袋中抽一

球是黑球的概率为 p(甲)=1/4,从甲袋中抽一球是黑球的概率为 p(乙)=3/4.由于 p(乙)> p( 甲),这便意味着此球来自乙袋的可能性比来自甲袋的可能性大.因此我们会判断该球象是来自乙袋.

Page 20: 课件制作:应用数学系 概率统计课程组

(2)设 X是抽取三个球中黑球的个数,又设 p为袋中黑球所占的比例,则 X—B(3,p), 即

3,2,1,0,)1(3

)( 3

kpp

kkXP kk

在 X=1时,不同 p值对应的概率分别为:

64

27

4

3

4

1

1

3)1(

2

XP甲

64

9

4

3

4

13)1(

2

XP乙

由于 p(甲)> p( 乙),因此我们会判断该球象是来自甲袋.

Page 21: 课件制作:应用数学系 概率统计课程组

基本思想 :

如:甲 .乙两人比较射击技术 ,分别射击目标一次 ,甲中而乙未中 ,则可以认为 :甲射击技术优于乙射击技术 .

实际问题 (医生看病、公安人员破案、技术人员进行质量检验等 )尽管千差万别 ,但他们具有一个共同的规律 ,即在获得了观察资料之后 ,给参数选取一个数值 , 使得前面的观察结果出现的可能性最大 .

最大似然估计就是通过样本值 来求得总体的

分布参数 ,使得 取值为 的概率最大 .nXX ,,1 nxx ,,1

nxx ,,1

Page 22: 课件制作:应用数学系 概率统计课程组

极大似然估计的基本思想

Page 23: 课件制作:应用数学系 概率统计课程组

简单历史

• The method of maximum likelihood was first proposed by the German mathematician C.F.Gauss in 1821. However, the approach is uaually credited to the English statistician R.A.Fisher who rediscovered the idea in his 1922 paper “On the mathematical foundations of theoretical statistics” and first investigated the properties of the method.

Page 24: 课件制作:应用数学系 概率统计课程组

例 1 :英语六级未通过率•假设某理工大学的学生在毕业时尚未通过六级的比率为 p,现从中随机抽取 100 人调查其档案,发现其中有 10 人六级没过,试用极大似然法估计总体参数 p。

Page 25: 课件制作:应用数学系 概率统计课程组

例 1 :英语六级未通过率

• 解:若六级通过用“ 0” 表示,未通过用“ 1” 表示,则总体 X 的分布为

1( ) , 0,1, 1 ;x xP X x p q x q p

则样本观察值的联合分布(似然函数)为100 1001 1 2 2 11 1 10 90

1 100( , , ; ) ( )( ) ( )x xx x x xL x x p p q p q p q p q

两边取对数得对数似然函数为:

1 100ln ( , , ; ) 10ln 90ln(1 )L x x p p p

解得: 100.1

100p

Page 26: 课件制作:应用数学系 概率统计课程组

一般情形 设总体 X 服从 0-1 分布,且P (X = 1) = p, 用极大似然法求 p 的估计值。

解 X 的概率分布可以写成1,0,)1()( 1 xppxXP xx

设 X1, X2,…, Xn 为总体 X 的样本 ,

设 x1, x2,…, xn 为总体 X 的样本值 ,

则 ),,,( 2211 nn xXxXxXP

)()1( 11 pLpp

n

ii

n

ii xnx

nixi ,,2,1,1,0

7-18

Page 27: 课件制作:应用数学系 概率统计课程组

对于不同的 p ,L (p) 不同,见右下图

现经过一次试验,

0.2 0.4 0.6 0.8 1p

0.002

0.004

0.006

0.008

0.01

Lp

),,,( 2211 nn xXxXxX

发生了,

事件

则 p 的取值应使这个事件发生的概率最大。

p

Page 28: 课件制作:应用数学系 概率统计课程组

在容许的范围内选择 p ,使 L(p)最大 注意到, ln L(p) 是 L 的单调增函数,故 若某个 p 使 ln L(p)最大,则这个 p 必使 L(p)最大。

01d

dln 11令

p

xn

p

x

pL

n

ii

n

ii

xxn

pn

ii

1

0

)1(dlnd

21

21

2

2

p

xn

p

x

pL

n

ii

n

ii

所以 xp ˆ 为所求 p 的估计值 .

Page 29: 课件制作:应用数学系 概率统计课程组

一般地,设 X 为离散型随机变量,其分布律为 ,,,),,()( 21 uuxxfxXP

X1, X2,…, Xn 为总体 X 的样本 ,

x1, x2,…, xn 为总体 X 的样本值 ,

则 X1, X2,…, Xn 的概率分布为),,,( 2211 nn xXxXxXP

),(),(),( 21 nxfxfxf

,,,2,1

,,, 21

ni

uuxi

7-21

)(),,,,( 21 LxxxL n 记为 或

称 L( ) 为样本的似然函数

Page 30: 课件制作:应用数学系 概率统计课程组

)ˆ,,,,( 21 nxxxL )},(),(),(max{ 21

nxfxfxf

则称这样得到的 ),,,(ˆ

21 nxxxg

为参数 的极大似然估计值称统计量

),,,( 21 nXXXg

为参数 的极大似然估计量

7-22

选择适当的 = , 使 取最大值,即 L( )

当给定一组样本值时, 就是参数 的函数 ,极大似然估计法的思想就是:

L( )

mle简记为:

MLE简记为:

Page 31: 课件制作:应用数学系 概率统计课程组

若随机变量 X 连续 , 取 f (xi, ) 为 Xi 的密度函数

n

iixfL

1

),()( 似然函数为

7-23

注 1

注 2 未知参数个数可以不止一个 , 如 1, 2,…, k

设 X 的密度函数 ( 或概率分布 ) 为 ),,,,( 21 kxf 则定义似然函数为

n

ikik xfL

12121 ),,,,(),,,(

nixi ,,2,1, ),,,( 21 k

),,,;,,,( 2121 knxxxL

Page 32: 课件制作:应用数学系 概率统计课程组

若 ),,,;,,,( 2121 knxxxL 关于 1, 2,…, k

可微,0),,,;,,,( 2121

knr

xxxL

为似然方程组

kr ,,2,1

若对于某组给定的样本值 x1, x2,…, xn ,参数 使得似然函数取得最大值,即k ˆ,,ˆ,ˆ

21 )ˆ,,ˆ,ˆ;,,,( 2121 knxxxL

)},,,;,,,({max 2121),,,( 21

knxxxLk

则称 k ˆ,,ˆ,ˆ21 为 1, 2,…, k 的极大似然估计值

则称

7-24

Page 33: 课件制作:应用数学系 概率统计课程组

显然,),,,(ˆ

21 nr xxxg kr ,,2,1

称统计量),,,(ˆ

21 nr XXXg kr ,,2,1

为 1, 2,…, k 的极大似然估计量

7-25

Page 34: 课件制作:应用数学系 概率统计课程组

例 2 设总体 X ~ N (, 2), x1, x2,…, xn 是 X 的 一组样本值,求 , 2 的极大似然估计 .

解 ),;,,,( 221 nxxxL

n

i

ix

nn e 12

2

2

)(

222 )()2(

1

)ln(2

)2ln(22

)(ln 2

12

2

nnx

Ln

i

i

2

2

2

)(

1 2

1

ixn

i

e

7-26

Page 35: 课件制作:应用数学系 概率统计课程组

xxn

n

iimle

1

1

n

iimle xx

n 1

22 )(1

, 2 的极大似然估计量分别为

XXn

n

ii

1

1 2

1

2)(1

n

n

ii SXX

n

似然方程组为

0)(1

ln1

2

n

iixL

0)(2

)()(2

1ln

)( 21

2222

n

xLn

ii

7-27

Page 36: 课件制作:应用数学系 概率统计课程组

EXERCISES

Page 37: 课件制作:应用数学系 概率统计课程组

例 3 设有一批产品 , 根据以往的经验知道它的产品率 p 可能是 0.1 或 0.3. 生产这批产品的厂家认为该批产品质量很好 , 次品率大约为 0.1, 而收购产品的商业部门认为产品质量有问题 , 次品率可能为 0.3. 现从这批产品中随机抽取 15 件 , 发现有 5 件次品 . 问 : 生产厂家与收购部门谁的估计更可靠些 ?

Page 38: 课件制作:应用数学系 概率统计课程组

解 .),(~ pnBXX,则记次品数为

0105.09.01.0)5( 105515 CXP

概率,后一概率明显大于前一

件次品的概率为件中有则若次品率 515,1.01 p

件次品的概率为件中有则若次品率 515,3.02 p

2061.07.03.0)5( 105515 CXP

.

3.0

靠一些次品率的估计值更为可作为因此用

Page 39: 课件制作:应用数学系 概率统计课程组

求未知参数的极大似然估计值 ( 量 ) 的方法

1 ) 写出似然函数 L

2 )求出 k ˆ,,ˆ,ˆ21 , 使得

)ˆ,,ˆ,ˆ;,,,( 2121 knxxxL

)},,,;,,,({max 2121),,,( 21

knxxxLk

7-28

Page 40: 课件制作:应用数学系 概率统计课程组

0),,,;,,,( 2121

knr

xxxL

kr ,,2,1 可求得未知参数的极大似然估计值 k ˆ,,ˆ,ˆ

21

然后 , 再求得极大似然估计量 .

7-29

L 是 的可微函数 , 解似然方程组k ,,, 21 若

L 不是 的可微函数 , 需用其它方法 ( 回到原始的定义)求极大似然估计值 . 请看下例:

k ,,, 21 若

Page 41: 课件制作:应用数学系 概率统计课程组

例 4 设 X ~ U (a,b), x1, x2,…, xn 是 X 的一个样本 ,求 a , b 的极大似然估计值与极大似然估计量 .

解 X 的密度函数为

其它,0

,1

),;( bxaabbaxf

似然函数为

其它,0

,,2,1

,,

)(

1),;,,,( 21 ni

bxa

abbaxxxLi

nn

7-30

Page 42: 课件制作:应用数学系 概率统计课程组

似然函数只有当 a < xi < b, i = 1,2,…, n 时才能获得最大值 , 且 a 越大 , b 越小 , L 越大 .

令 xmin = min {x1, x2,…, xn}xmax = max {x1, x2,…, xn}

取maxmin

ˆ,ˆ xbxa

则对满足 bxxa maxmin 的一切 a < b , 都有

nn xxab )(

1

)(

1

minmax

7-31

Page 43: 课件制作:应用数学系 概率统计课程组

故maxmin

ˆ,ˆ xbxa 是 a , b 的极大似然估计值 .

},,,max{

},,,min{

21max

21min

n

n

XXXX

XXXX

分别是 a , b 的极大似然估计量 .

7-32

问 题1) 待估参数的极大似然估计是否一定存在 ?

2) 若存在 , 是否惟一 ?

Page 44: 课件制作:应用数学系 概率统计课程组

设 X ~ U ( a – ½, a + ½), x1, x2,…, xn 是 X的一个样本 , 求 a 的极大似然估计值 .

解 由上例可知 , 当

2

2

maxmin axxa

时 , L 取最大值 1, 即

2

2

1minmax xax

显然 , a 的极大似然估计值可能不惟一 .

7-33

例 5

Page 45: 课件制作:应用数学系 概率统计课程组

不仅如此 , 任何一个统计量

2

1),,,(

2

1)1(21)( xxxxgx nn

),,,( 21 nXXXg

若满足

都可以作为 a 的估计量 .

7-34

Page 46: 课件制作:应用数学系 概率统计课程组

常见分布的极大似然估计

分布 待估参数 极大似然估计二项二项 p

泊松泊松 λ

指数指数 λ

正态正态 μ

正态正态 σ2

m

1iiX

mn

1p

n

1iiX

n

n

1iiXnˆ

n

1iiX

n

n

1i

2i

2 )XX(n

Page 47: 课件制作:应用数学系 概率统计课程组

极大似然估计值的不变性原理(invariance property of MLEs)

设 是 的极大似然估计值 , u( ) ( ) 是

的函数,且具有单值的反函数 = (u), uU

则 是 u( ) 的极大似然估计值 . )ˆ(ˆ uu

7-35

Page 48: 课件制作:应用数学系 概率统计课程组

如:在正态分布总体 N (, 2) 中, 2 的极大 似然估计值为

n

ii xx

n 1

22 )(1

2 是 2 的单值函数,且具有单值的

反函数,故 的极大似然估计值为

n

ii xx

n 1

2)(1

lg 的极大似然估计值为

n

ii xx

n 1

2)(1

lglg

7-36

Page 49: 课件制作:应用数学系 概率统计课程组

矩估计就不具有这个性质 .

例如 设 X 的密度函数为

00

012

)(2

2

2

x

xexf

x

221)(,

2)(

XDXE

X1, X2,…, Xn 为总体的样本

7-37

Page 50: 课件制作:应用数学系 概率统计课程组

由矩法,令

n

iiX

nXEXDXE

XXE

1

2222 1)()()(

2)(

得 与 2 的矩法估计量为

2

1

22 )ˆ(1

n

iiX

n

X—— 不具有不变性

7-38

Page 51: 课件制作:应用数学系 概率统计课程组

练习 设总体 X 的分布密度函数为

的极大似然估计量 .

)0(.0,0

,0,)(

2

3

)(2

x

xexxf

xk

2),,,( 21 nXXX 为 X 的一个样本 , 求参数

0

2

3

2

2

)(1 dxexk

dxxfx

由 2

2

xu

0

21

2dueu

k u

)(

232

k

.44

kk

Page 52: 课件制作:应用数学系 概率统计课程组

)~1(04

)(1

2

3

2 1

221

nixexL i

n

i

x

i

nn

ii

n

ii

n

ii xxnnL

1

22

1

222 )/1(lnln)2/3()/4ln()(ln

令 011

2

3)(ln

1

242

22

n

iix

nL

d

d

n

iiX

n 1

22

3

2 为所求的极大似然估计量 .

Page 53: 课件制作:应用数学系 概率统计课程组

点估计的评价标准

对于同一个未知参数 , 不同的方法得到的估计量可能不同 ,于是提出问题

应该选用哪一种估计量 ?用什么标准来评价一个估计量的好坏 ?

常用标准

(1) 无偏性 (Unbiased Estimator)

(3) 一致性 (consistency)

(2) 有效性

Page 54: 课件制作:应用数学系 概率统计课程组

)ˆ(E

定义 设

),,,( 21 nXXX 是总体 X 的样本是总体参数 的估计量),,,(ˆ

21 nXXX

则称 是 的无偏估计量 .

存在 ,)ˆ(E Θ 都有且对于任意

无偏性

Page 55: 课件制作:应用数学系 概率统计课程组

),,,( 21 nXXX 是总体 X 的样本 ,

证明 : 不论 X 服从什么分布 ,

n

i

kik X

nA

1

1

是 k 的无偏估计量 .

n

i

ki

n

i

kik XE

nX

nEAE

11

)(1

)1

()(

例 1 设总体 X 的 k 阶矩 )( kk XE 存在

因而niXE kki ,,2,1)( 由于

kknn

1

Page 56: 课件制作:应用数学系 概率统计课程组

特别地 ,

样本二阶原点矩

n

iiX

nA

1

22

1 是总体二阶

的无偏估计量)( 22 XE原点矩

是总体期望 E( X ) 的无偏估计量X样本均值

Page 57: 课件制作:应用数学系 概率统计课程组

例 2 设总体 X 的期望 E( X ) 与方差 D( X ) 存在 , ),,,( 21 nXXX 是 X 的一个样本 , n > 1

(1) 不是 D( X ) 的无偏估计量 ;

n

iin XX

nS

1

22 )(1

(2) 是 D( X ) 的无偏估计量 .

n

ii XX

nS

1

22 )(1

1

证 2

1

2

1

2 1)(

1XX

nXX

n

n

ii

n

ii

前已证

. 证明

2)()(,)()( XDXDXEXE ii

nXDXEXE

2

)(,)()(

Page 58: 课件制作:应用数学系 概率统计课程组

)()(1

)(1 2

1

2

1

2 XEXEn

XXn

En

ii

n

ii

因而

)()( 22

22 n

221

n

n

2

1

2)(1

1

n

ii XX

nE故 证毕 .

Page 59: 课件制作:应用数学系 概率统计课程组

例 3 设 ),,,( 21 mXXX 是总体 X 的一个样本 ,

X ~ B ( n , p ) n > 1 , 求 p 2 的无偏估计量 .

解 由于样本矩是总体矩的无偏估计量以及数学期望的线性性质 , 只要将未知参数表示成总体矩的线性函数 , 然后用样本矩作为总体矩的估计量 , 这样得到的未知参数的估计量即为无偏估计量 .

npXEX )(令

)1()()(1 22

1

2 pnpnpXEXm

m

ii

Page 60: 课件制作:应用数学系 概率统计课程组

XXmnn

pm

ii

1

22

2 11

因此 , p 2 的无偏估计量为

)1(

)1(1

1

nn

XXm

m

iii

故 XXm

pnnm

ii

1

222 1)(

Page 61: 课件制作:应用数学系 概率统计课程组

例 4 设总体 X 的密度函数为

00

,01

);(

x

xexf

x

0 为常数

),,,( 21 nXXX 为 X 的一个样本证明 X 与 },,,min{ 21 nXXXn 都是 的无偏

估计量

)(1

~ XEEX

故 )()( XEXE

是 的无偏估计量 .X

Page 62: 课件制作:应用数学系 概率统计课程组

},,,min{ 21 nXXXZ 令

0

00)(

zen

zzf nz

Z

nZE

nEZ

)(~

01

00

ze

znz

)(nZE

故 nZ 是 的无偏估计量 .

)()()(1 21 zXPzXPzXP n

n

ii zXP

1

))(1(1

),,,(1)( 21 zXzXzXPzF nZ

Page 63: 课件制作:应用数学系 概率统计课程组

思考 题 设总体 X ~ N ( , 2),

),,,( 21 nXXX 为 X 的一个样本求常数 k , 使

n

ii XXk

1

|| 为 的无偏估计量

n

ii

n

ii XXEkXXkE

11

||||解

注意到 XX i 是 X1, X2,…, Xn 的线性函数 ,

nii XXnXXn

XX )1(1

21

,0)( XXE i21

)( n

nXXD i

Page 64: 课件制作:应用数学系 概率统计课程组

21,0~

n

nNXX i

dze

n

nzXXE n

nz

i

2

2

12

12

1|||)(|

dze

n

nz n

nz

2

2

12

0 12

12

n

n 1

2

2

Page 65: 课件制作:应用数学系 概率统计课程组

n

ii

n

ii XXEkXXkE

11

||||

n

nkn

122

)1(2

nnk

Page 66: 课件制作:应用数学系 概率统计课程组

Ex. (2003 年数学一考研试题十二题 ) 设总体 X 的概率密度为

,,,,

x

xexf

x

0

2)(

)(2

其中 >0 是未知参数。从总体 X 中抽取简单随机样本 ,,, 21 XX

。nX 。,,,记 )min( 21 nXXX

(1) 求总体 X 的分布函数 F(x) ;

(2) 求统计量 的分布函数 ;

(3) 如果 作为 的估计量,讨论它是否具有无偏性。

)(xF

问题:若参数 的无偏估计量不只一个,如何选取更好的无偏估计量?

Page 67: 课件制作:应用数学系 概率统计课程组

),,,(ˆ2111 nXXX

都是总体参数 的无偏估计量 , 且)ˆ()ˆ( 21 DD

则称 1 2比 更有效 .

定义 设

有效性

),,,(ˆ2122 nXXX

Page 68: 课件制作:应用数学系 概率统计课程组

所以 , X 比 },,,min{ 21 nXXXn 更有效 .

是 的无偏估计量 , 问哪个估计量更有效?

X 与 },,,min{ 21 nXXXn 由前面例 4 可知 , 都

00

,01

);(

x

xexf

x

0 为常数

例 6 设 密度函数为),,,( 21 nXXX 为 X 的一个样本 ,

221 }),,,min{( nXXXnD

nXD

2

)(解 ,

Page 69: 课件制作:应用数学系 概率统计课程组

例 7 设总体期望为 E( X )= , 方差 D( X )= 2

),,,( 21 nXXX 为总体 X 的一个样本

设)1( 常数 .11

n

iic.,,2,1

1ni

nc i

证明 i

n

ii Xc

1

1 是 的无偏估计量

(2) 证明 X 比 i

n

ii Xc

1

1 更有效

证 : (1)

n

iii

n

ii cXEcE

111 )()ˆ(

Page 70: 课件制作:应用数学系 概率统计课程组

(2)

n

iii

n

ii cXDcD

1

22

1

21 )()ˆ(

nc

n

ii

1

1

2

)ˆ(1

)ˆ( 12 D

nD

n

ii

njiji

n

ii cnccc

1

2

1

22

1

2 )(

结论 算术均值比加权均值更有效 .

nji

ji

n

i

i

n

i

i cccc

11

2

2

1

21

Page 71: 课件制作:应用数学系 概率统计课程组

例如 X ~ N( , 2 ) , ( X 1 ,X 2 ) 是一样本 .

213

212

211

2

1

2

4

3

4

3

1

3

XX

XX

XX

都是 的无偏估计量

由例 7(2) 知 3 最有效 .

Page 72: 课件制作:应用数学系 概率统计课程组

0))ˆ(lim

Pn

定义 设 是总体参数 的),,,(ˆˆ21 nXXX

则称 是总体参数 的一致 ( 或相合 ) 估计量 .

估计量 . 若对于任意的 , 当 n 时 , 依概

一致性

率收敛于 , 即 ,0

一致性估计量仅在样本容量 n 足够大时 ,才显示其优越性 .

Page 73: 课件制作:应用数学系 概率统计课程组

关于一致性的两个常用结论

1. 样本 k 阶矩是总体 k 阶矩的一致性估计量 .

2. 设 是 的无偏估计量 , 且 , 则0)ˆ(lim

D

n

是 的一致估计量 .

由大数定律证明

用切贝雪夫不 等式证明

矩法得到的估计量一般为一致估计量

在一定条件下 , 极大似然估计具有一致性

Page 74: 课件制作:应用数学系 概率统计课程组

例 9

00

,01

);(~

x

xexfX

x

0 为常数

则 是 的无偏、有效、一致估计量 .X

证 由例 8 知 是 的无偏、有效估计量 .X

)(lim XDn

0lim2

nn

所以 是 的一致估计量 , 证毕 .X

Page 75: 课件制作:应用数学系 概率统计课程组

参数的区间估计

Page 76: 课件制作:应用数学系 概率统计课程组

区间估计引例 已知 X ~ N ( ,1),x1,x2,…,xn 是一组样本值

不同的样本值算得的 的估计值不同,因此除了给出未知参数的点估计外, 还希望根据所给的样本确定一个随机区间,使其包含参数真值的概率达到指定的要求 .

的无偏、有效点估计为X

随机变量常数

Page 77: 课件制作:应用数学系 概率统计课程组

如引例中,若要找一个区间 , 使其包含 的真

值的概率为 0.95. ( 设 n = 5 )

5

1,~ NX 1,0~

51

NX

取 05.0

查表得 96.12/ z

Page 78: 课件制作:应用数学系 概率统计课程组

这说明

称随机区间

为未知参数 的置信度为 0.95 的置信区间 .

95.05196.15

196.1

XXP

05.096.1

51

XP

5

196.1,5196.1 XX

Page 79: 课件制作:应用数学系 概率统计课程组

反复抽取容量为 5 的样本 , 都可得到一个区间 , 这个区间可能包含未知参数 的真值 , 也可能不包含未知参数的真值 , 包含真值的区间占 95%.

)5196.1,5

196.1( XX

5196.1X

5196.1X

1

置信区间的意义

的置信区间

的置信上限

置信度

的置信下限

Page 80: 课件制作:应用数学系 概率统计课程组

若测得 一组样本值 ,

它可能包含 的真值,也可能不包含 的真值

)51,5

1(22 zXzX 当置信区间为 时

则得一区间 (1.86 – 0.877, 1.86 + 0.877)

反复抽样得到的区间中有 95% 包含 的真值 .

?2/z为什么要取

86.1x算得

区间的长度为 512

2z ——— 达到最短

Page 81: 课件制作:应用数学系 概率统计课程组

97.3

)13.2(84.133

2 1

zz

92.3

)96.1(96.122

1

zz

-2 -1 1 2

0.1

0.2

0.3

0.4

32z

31 z

-2 -1 1 2

0.1

0.2

0.3

0.4

2z

21 z

取 = 0.05

Page 82: 课件制作:应用数学系 概率统计课程组

设 是一个待估计的参数 , 是一给定的数 ,

( 0 < < 1). 若能找到两个统计量),,,(ˆ

212 nXXX ),,,,(ˆ211 nXXX

使得 Θ 1)ˆˆ( 21P

则称随机区间 )ˆ,ˆ( 21 为参数 的置信度为 1 - 的置信区间 , 21

ˆ,ˆ 为置信下限与置信上限 , 分别称1 - 称为置信水平或置信度 .

置信区间的定义

Page 83: 课件制作:应用数学系 概率统计课程组

反映了估计的可靠程度 , 越小 , 越可靠 .

置信区间的长度 反映了估计的精度 12ˆˆ

越小 , 1- 越大 , 估计的可靠程度越高 , 但这时 , 往往增大 , 因而估计的精度降低 .12

ˆˆ

12ˆˆ 越小 , 估计的精度越高 .

确定后 , 置信区间 的选取方法不唯一 , 常

选最小的一个 .

几点说明

Page 84: 课件制作:应用数学系 概率统计课程组

通常 , 增大样本容量可以提高精度 .

在求参数的置信区间时 , 一般先保证可靠性 . 在保证可靠性的基础上 , 再提高精度 .

Page 85: 课件制作:应用数学系 概率统计课程组

寻找一个样本的函数),,,,( 2 nx XXXg

它含有待估参数 , 不含其它未知参数 , 它的分布已知 , 且分布不依赖于待估参数 ( 常由 的点估计出发考虑 ).

51

,NX~

)1,0(~),,,,(

51

21 NXXXgX

n

例如

求置信区间的步骤

— 称为枢轴量

Page 86: 课件制作:应用数学系 概率统计课程组

给定置信度 1 , 定出两个常数 a , b , 使得 1)),,,(( 21 bXXXgaP n

( 引例中 )96.1,96.1 ba

由 bXXXga n ),,,( 21 解出),,,( 21 nXXX ),,,( 21 nXXX

得置信区间 ),(

引例中 ,

)5196.1,5

196.1(),( XX

Page 87: 课件制作:应用数学系 概率统计课程组

( 一 ) 一个正态总体 X ~N ( 2) 的情形

置信区间常用公式

(1) 方差 2 已知 , 的置信区间

)1(),(22

n

zXn

zX

推导

)1,0(~),,,,( 21 N

n

XXXXg n

),(~2

nNX

由 选取枢轴量

Page 88: 课件制作:应用数学系 概率统计课程组

由 确定

2z

n

XP

2

z

),( 00

22 nzX

nzX

2

z

n

X

得 的置信度为 的置信区间为1

Page 89: 课件制作:应用数学系 概率统计课程组

(2) 方差 2 未知 , 的置信区间

)1(~

nT

nSX

T

)1(

2nt

nS

XP 确定 )1(

2

nt

故 的置信区间为

n

SntX

n

SntX )1(,)1(

22

推导 选取枢轴量

)2()1(,)1(22

n

SntX

n

SntX

Page 90: 课件制作:应用数学系 概率统计课程组

当方差未知,且 n>30 ,

的置信度为 1- 的置信区间为

).(2

zn

SX

问题:若 X 的分布类型未知,如何估计 =E(X) ?取 n>30 ,此时 )( 2,~NX .当方差已知, 的置信度

为 1- 的置信区间为).(

2

zn

X

当方差未知, 的置信度为 1- 的置信区间为 ).(

2

zn

SX

思考题 (2003 年数学一考研试题填空题 )

已知一批零件的长度 X ( 单位: cm) 服从正态分布 N( , 1) ,从中随机地抽取 16 个零件,得到长度的平均值为 40 ( cm) ,则 的置信度为 0.95 的置信区间是 __________ 。

( 注:标准正态分布函数值 (1.96)=0.975 , (1.645)=0.95)

Page 91: 课件制作:应用数学系 概率统计课程组

(3) 当 已知时 , 方差 2 的 置信区间

)3(

)(

)(,

)(

)(

21

1

2

2

1

2

22

n

X

n

Xn

ii

n

ii

)(~ 2

1

2

nX

Qn

i

i

取枢轴量 ,

得 2 的置信度为 置信区间为 1

1)()(

)( 22

1

2

21 22

nX

nP

n

ii

由概率

Page 92: 课件制作:应用数学系 概率统计课程组

(4) 当 未知时 , 方差 2 的置信区间

-2 2 4 6 8 10

0.025

0.05

0.075

0.1

0.125

0.15

2

)1(~)1( 2

2

2

nSn

K

选取

得 2 的置信区间为

)4()1(

)1(,

)1(

)1(21

2

2

2

22

n

Sn

n

Sn

2

2

2

•21

2

1))1(

( 22

221 22

SnP

则由

Page 93: 课件制作:应用数学系 概率统计课程组

例 1 某工厂生产一批滚珠 , 其直径 X 服从正态分

布 N( 2), 现从某天的产品中随机抽取 6 件 , 测得

直径为 15.1 , 14.8 , 15.2 , 14.9 , 14.6 , 15.1 (1) 若 2=0.06, 求 的置信度为 95% 的 置信区间 ; (2) 若 2 未知 , 求 的置信度为 95% 的置信区间 ; (3) 求方差 2 的置信度为 95% 的置信区间 .

解 (1) )606.0

,(~ NX )01.0,(N即

)1,0(~1.0

NX 96.1025.0

2

zz

Page 94: 课件制作:应用数学系 概率统计课程组

由给定数据算得 95.146

1 6

1

i

ixx

由公式 (1) 得 的置信区间为

)15.15,75.14(

)1.096.195.14,1.096.195.14(

(2) 取 )5(~

6

tSX

T

5706.2)5(025.0 t查表得

由给定数据算得 95.14x

226.0.051.0)6(5

1 26

1

22

sxxsi

i

Page 95: 课件制作:应用数学系 概率统计课程组

)187.15,71.14(

))5(6

),5(6

( 025.0025.0

ts

xts

x

由公式 (4) 得 的置信区间为

(3) 选取枢轴量 )5(~5 2

2

2

S

K

831.0)5(,833.12)5( 20975

2025.0

)3069.0,0199.0())5(

5,

)5(

5(

2975.0

2

2025.0

2

ss

查表得

.051.02 s

由公式 (2) 得 的置信区间为

Page 96: 课件制作:应用数学系 概率统计课程组

),,,( 21 nXXX 为取自总体 N ( 1 12 ) 的样本 ,

),,,( 21 mYYY 为取自总体 N ( 2 22 ) 的样本 ,

置信度为 1

22

21 ,;, SYSX 分别表示两个样本的均值与方差

(二 ) 两个正态总体的情形

Page 97: 课件制作:应用数学系 概率统计课程组

),(~),,(~22

2

21

1 mNY

nNX

YX , 相互独立 ,

21 的置信区间为

)1,0(~)()(

22

21

21 N

mn

YX

(1) 22

21 , 已知 , 的置信区间21

mnzYX

mnzYX

22

21

22

21

22)(,)(

)5(

Page 98: 课件制作:应用数学系 概率统计课程组

)1,0(~11

)()(

),(~

21

22

21

N

mn

YXmn

NYX

)1(~)1( 2

2

21

n

Sn

)2(~

2

)1()1(11

)()(22

21

21

mnt

mn

SmSn

mn

YX

22

21 , 22

221 (2) 未知 ( 但 ) 的置信区间21

)2(~)1()1( 2

2

22

2

21

mn

SmSn

)1(~)1( 2

2

22

m

Sm

Page 99: 课件制作:应用数学系 概率统计课程组

21 的置信区间为

1

2)1()1(11

)()(

222

21

21

t

mnSmSn

mn

YXP

2

)1()1(11)(

22

21

2 mn

SmSn

mntYX

)6(

Page 100: 课件制作:应用数学系 概率统计课程组

YX , 相互独立 ,

m

S

n

SzYX

22

21

2)(

)1,0(~)()(

22

21

21 N

mS

nS

YX

22

21 ,(3) 未知 , 但 n, m > 50, 的置信区间21

21 的置信区间为因此

m

S

n

S

mn

22

21

22

21

)7(

Page 101: 课件制作:应用数学系 概率统计课程组

令 Zi = Xi -Yi , i = 1,2,…, n, 可以将它们看成来

自正态总体 Z ~ N ( 1 2 , 12 + 2

2) 的样本

仿单个正态总体公式 (2) 的置信区间为21

n

iiiZ YXYX

nS

YXZ

1

22 )()(1

,

22

21 ,(4) 未知 , 但 n = m , 的置信区间21

n

SntYX Z)1()(

2 )8(

Page 102: 课件制作:应用数学系 概率统计课程组

取枢轴量

(5) 方差比 22

21

的置信区间 ( 1 , 2 未知 )

)1,1(~/

/

22

21

22

21

22

22

21

21 mnF

SS

S

SF

因此 , 方差比 22

21

的置信区间为

)1,1(

1,

)1,1(

1

21

22

21

2

22

21

mnFS

S

mnFS

S

)9(

Page 103: 课件制作:应用数学系 概率统计课程组

取枢轴量

),(~

)(

)(

)(1

)(1

22

21

1

22

1

21

22

1

22

21

1

21

mnF

Y

X

n

m

Y

m

X

nF

m

jj

n

ii

m

jj

n

ii

(6) 方差比 22

21

的置信区间 ( 1 , 2 已知 )

Page 104: 课件制作:应用数学系 概率统计课程组

因此 , 方差比 22

21

的置信区间为

),(

)(

)(

,

),(

)(

)(

22 1

1

22

1

21

1

22

1

21

mnF

Y

X

nm

mnF

Y

X

nm

m

jj

n

ii

m

jj

n

ii

)10(

Page 105: 课件制作:应用数学系 概率统计课程组

例 2 某厂利用两条自动化流水线罐装番茄酱 . 现分别 从两条流水线上抽取了容量分别为 13 与 17 的两个 相互独立的样本

1321 ,,, XXX 1721 ,,, YYY 与已知

222

221 7.4,4.2

,5.9,6.10

gsgs

gygx

假设两条流水线上罐装的番茄酱的重量都服从正态分布 , 其均值分别为 1 与 2

(1) 若它们的方差相同 , ,222

21 求均值差

21 的置信度为 0.95 的置信区间 ;

(2) 若不知它们的方差是否相同 , 求它们的方差比 的置信度为 0.95 的置信区间

Page 106: 课件制作:应用数学系 概率统计课程组

)2(~

2

)1()1(11

)()(22

21

21

mnt

mn

SmSn

mn

YX 解

查表得 0484.2)28(025.0 t

21 由公式 (6) 的置信区间为

)5545.2,3545.0(

2

)1()1(11)(

22

21

2

mn

SmSn

mntYX

(1) 取枢轴量

Page 107: 课件制作:应用数学系 概率统计课程组

(2) 枢轴量为 )16,12(~/

/

22

21

22

21

22

22

21

21 F

SS

S

SF

查表得

16.3

1

)12,16(

1)16,12(

89.2)16,12(

025.0975.0

025.0

FF

F

22

21

由公式 (9) 得方差比 的置信区间为

)6136.1,1767.0(

)1,1(

1,

)1,1(

1

975.022

21

025.022

21

mnFS

S

mnFS

S

Page 108: 课件制作:应用数学系 概率统计课程组

( 三 ) 单侧置信区间定义 对于给定的 (0 < < 1) , 是待估参数

),,,( 21 nXXX 是总体 X 的样本 ,

若能确定一个统计量),,,( 21 nXXX

使得 )1)((1)( PP 或

则称 )),(()( 或

为置信度为 1 - 的单侧置信区间 .

)),,,( 21 nXXX 或(

单侧置信下限 单侧置信上限

Page 109: 课件制作:应用数学系 概率统计课程组

例 3 已知灯泡寿命 X 服从正态分布 , 从中随机

地抽取 5 只作寿命试验 , 测得寿命为

1050 , 1100 , 1120 , 1250 , 1280 ( 小时 )

求灯泡寿命均值的置信度为 0.95 的单侧置信

下限与灯泡寿命方差的置信度为 0.95 的单侧置信

上限 .

22 ,,),(~ NX 未知

9950)5(4

1,1160,5

5

1

22

xxsxni

i

Page 110: 课件制作:应用数学系 概率统计课程组

(1) 选取枢轴量 )4(~ t

nSX

1318.205.0 tt

9.1064505.0 s

tx

(2) 选取枢轴量 )4(~)1( 2

2

2

Sn

711.0)4(295.0

55977)4(

42

95.0

22

s

Page 111: 课件制作:应用数学系 概率统计课程组

(四 ) 非正态总体的情形

若总体 X 的分布未知 , 但样本容量很大 ,

由中心极限定理 , 可近似地视 ),(~2

nNX

若 2 已知 , 则 的置信度为 1 - 的置信区间

可取为n

zX

2

若 2 未知 , 则 的置信度为 1 - 的置信区间

可取为n

StX

2

Page 112: 课件制作:应用数学系 概率统计课程组

例 4 已知 X 服从参数为 p 的 0-1 分布 , 样本为

求 p 的置信度为 1 的置信区间

解 ),(~1

pnBXn

ii

1))1(

)((

22z

pp

pXnzP

nXXX ,,, 21 ( n > 50 ).

)1,0(~)1(

)(N

pp

pXn

( 近似 )

22

2)1(

)(0 z

pp

pXn

0)2()( 2222

22 XnpzXnpzn

令 222 ),2(),(22

XnczXnbzna

Page 113: 课件制作:应用数学系 概率统计课程组

a

acbbp

a

acbbp

2

4,

2

4 2

2

2

1

所以参数 p 的置信区间为 ( p1, p2 )

例如 , 自一大批产品中抽取了 100 个样品 , 其中有 60 个 一级品 , 求这批产品的一级品率 p 的置信度为 0.95 的置信区间 .

366.0100 2 c

p 的置信区间为 )69.0,50.0(),( 21 pp

96.1,05.0,6.0,100 025.0 zxn 84.10396.1100 2 a

84.123)96.16.01002( 2 b