統計學 : 應用與進階第 3 章 : 隨機變數

隨機變數 (random variables) 間斷隨機變數 (discrete random variables) Bernoulli 分配 (Bernoulli distribution) 連續隨機變數 (continuous random

variables) 均勻分配 (uniform distribution) 連續隨機變數之函數動差生成函數 (moment generating

functions)

隨機變數令 X 代表由狀態空間映射到實數線的函數 :

則稱 X 為一個隨機變數。

隨機變數隨機變數 : 將出象或事件以數值表示原始動機可能是來自於賭博隨機變數是一個函數 , 隨機變數不是變數 !

例子 : 擲一個六面骰子兩次令

e = {i , j} = { 第一次擲出點數 , 第二次擲出點數 }

賭局的報酬為 X(e) = max(i , j) 舉例來說 , 如果我們擲出 e = {2, 3}, 則贏 3

元。

狀態空間與所映射的隨機變數值

單變量隨機變數 Full description: 機率分配 Average outcome: 期望值 Dispersion of outcomes: 變異數 , 標準差

多變量隨機變數 Full description: 聯合機率分配 Comovement of outcomes: 共變數 , 相關係

數 Generating new random variables out of

old random variables (eg. 個股報酬⇒ 資產組合

報酬 )

Notations

隨機變數 : X (ex ante) 隨機變數實現值 (realizations): x (ex post) Notation: X = x

間斷隨機變數 (discrete random variables)

如果隨機變數實現值的數目為有限的 (finite) 或是無限但是可數 (countably infinite), 則稱之

為間斷隨機變數例子 : 擲一個六面骰子所得到的點數 ( 有限 ) 餐廳營業一天的登門客人數目 ( 無限但是可數 )

間斷隨機變數令 X 為一間斷隨機變數 , 則其任一實現值發生之

機率定義為

P(X = x) = P({ω : X(ω) = x}).

隨機變數 X 為實現值 x 的機率事實上就是來自 ω 事件 ( 此事件符合 X(ω) = x ) 發生的機率

例子 : 擲銅板的賭局擲不公正銅板 , 出現正面的機率為 2/3, 出現反面

的機率為 1/3 令隨機變數 X = 1 當出現正面 , X = −1 當出現

反面則 P(X = 1) 與 P(X = −1) 分別為

P(X = 1) = P({ω : X(ω) = 1}) = P({ 正面 }) = 2/3

P(X = −1) = P({ω : X(ω) = −1}) = P({ 反面 }) = 1/3

間斷機率分配 : 機率質量函數給定間斷隨機變數 X 的實現值來自可數的集合 B ⊆ 。函數 f (x) : → [0, 1] 定義為

且滿足

我們稱 f (x) 為機率質量函數 (probability mass function), 簡稱 pmf

顯而易見地 , 根據機率質量函數之定義 , 當 x B, 則 f (x) = 0, 從而機率質量函數 f (x) 的定義域

(domain) 可以為整個實數線此外 , 我們也將 B 稱作

隨機變數 X 的砥柱集合 (support)

砥柱集合給定一隨機變數之實現值使其機率不為零的集合

{x : f (x) > 0},

稱為此隨機變數的砥柱集合 (support), 以supp(X) 表示之

砥柱集合因此 , 機率質量函數定義中的性質可以改寫成① 1② 2③

砥柱集合 : 例子以之前擲銅板的賭局為例 , 我們可以寫出如下的

間斷機率分配 :

而其砥柱集合則為 supp(X) = {1,−1}

累積分配函數 (cumulative distribution function)

給定任何實數 x, 函數 F(x) : R 7→ [0, 1] 滿足 F(x) = P(X ≤ x),

則稱 F(x) 為累積分配函數 , 簡稱 CDF, 一般又稱

分配函數

累積分配函數的相關性質

例子 : 擲銅板的賭局我們知道其 pmf 與 CDF 分別為

機率質量函數 : 擲銅板賭局

累積分配函數 : 擲銅板賭局

間斷隨機變數之動差一般來說 , 描繪隨機變數特性的最佳方式就是以

機率分配刻劃其全貌為了簡化分析 , 有時我們僅對用來刻劃隨機變數

部份特性的動差 (moments) 有興趣

間斷隨機變數之動差譬如說 , 當我們購買風險性資產時 , 假設其報酬

為 X 。由於面對不確定性 , 因而 X 為一隨機變數。一般的經濟理論會假設人們的效用函數中僅考慮報酬期望值 ( 一階動差 ) 與變異數 ( 二階中央動差 ):

u = u( 期望報酬 , 變異數 ) = u(E(X), Var (X)),

而變異數事實上就是用於衡量該資產的風險

期望值隨機變數 X 的期望值 (expectation, expected value) 定義為

我們常用希臘字母 μ ( 讀作 mu) 代表期望值。期望值又稱均數 (mean), 事實上就是 X 所有可能實現

值以機率為權數的加權平均 (weighted average) 期望值所衡量的 , 就是隨機變數「平均而言」會出現的

值

期望值值得注意的事情是 , 期望值是將隨機變數所有可

能的實現值 , 依其可能發生的機率加權後加總得來 , 因此期望值是一個確定的值 , 是一個常數 ,不再是隨機變數

為了避免符號上的複雜 , 我們將假設所有加總的範圍都是隨機變數的砥柱集合 , 亦即除非另有說明 , 我們將以取代

期望值的性質給定 X 為一間斷隨機變數 , 則

一般而言 , 除非 g(·) 為線性函數 (linear function), 要不然

舉例來說 ,

變異數隨機變數 X 的變異數 (variance) 定義為

我們常用希臘字母 ( σ 讀作 sigma) 代表變異數

變異數是用來衡量所有可能實現值偏離均數的間斷程度

變異數由於我們將隨機變數減去其均數後再平方 , 使得

變異數的單位難以定義。舉例來說 , 如果 X 代表賭資 , 則期望值的單位為元 , 而變異數的單位為元的平方 , 不具任何意義

因此 , 我們將變異數開平方根 , 得到單位具有意義的間斷程度衡量 , 稱之為標準差 (standard deviation):

重要性質

動差 (moments) 與中央動差 (central moments)

隨機變數 X 的 r 階動差與 r 階中央動差分別為① r 階動差

② r 階中央動差

因此 , 一階動差就是隨機變數的期望值 ; 而二階中央動差就是隨機變數的變異數

動差的功能動差可以幫助我們描繪 (summarize) 隨機變數

(猶如以身高 , 體重 , 膚色 , 髮色等來描繪一個人 )

舉例來說 , 常態分配 ( 之後有詳盡介紹 ) 可以只用一階與二階動差予以刻畫

將常數視為一隨機變數給定常數 k, 若將之視為一隨機變數 , 則

E(k) = k, 且 Var (k) = 0.

間斷隨機變數的一個例子 : Bernoulli 分配我們將在之後討論一些常用且重要的間斷隨機變

數 , 在此 , 我們先介紹一個簡單的間斷隨機變數 : Bernoulli 分配 , 提供讀者一個例子以進一步了解間斷隨機變數的許多性質

給定隨機試驗只有兩個出象 , 例如擲銅板 , 支持或不支持特定候選人之民調 , 品質管制 (良品或不良品 ) 等 , 這樣的隨機試驗我們稱之 Bernoulli 試驗 (Bernoulli trials)

Bernoulli 隨機變數 (Bernoulli random variables)

如果 X 的機率分配為

其中 X = 1 代表出象為成功 (success); X = 0 代表出象為失敗 (failure), 則我們稱 X 為具有成功機率 p 的 Bernoulli 隨機變數 , 並以 X ∼Bernoulli(p) 表示之

Bernoulli 隨機變數值得注意的是 , 我們對於出象為成功或失敗 , 可

以自由設定。譬如說 , 我們可以設定擲銅板出現正面為成功 (X = 1), 出現反面為失敗 (X = 0)。然而反之亦可

Bernoulli 隨機變數的可能實現值非 0 即 1, 因此其砥柱集合為

Bernoulli 隨機變數 Bernoulli 隨機變數的 pdf 為

也可寫成

Bernoulli 隨機變數 Bernoulli 隨機變數

Bernoulli 隨機變數 Bernoulli 隨機變數的期望值 , 二階動差與變異

數分別為

連續隨機變數如果隨機變數 X 理論上的可能實現值為任一區間

中的任意實數 , 則 X 就稱作為一個連續隨機變數 , 舉例來說 , 明天的降雨量 , 下一尾上鉤的魚的體重 , 或是電池的壽命等

定義連續隨機變數最簡單的方法是由累積分配函數出發

累積分配函數的定義為 F(x) = P(X ≤ x), 因此 , 如果 F(·) 函數為連續且可微分 , 則稱 X 為一連續隨機變數

連續隨機變數給定函數 f : R → R 以及任意實數 a ≤ b, 使得

= (f 曲線下 , 橫軸之上 , a 到 b 的面積 ),

則稱 X 為一連續隨機變數 , 且 f (x) 稱為 X 的機率密度函數 (probability density function) 。我們要求

① ②

機率密度函數

連續隨機變數對於連續隨機變數 , 我們所計算的是一段區間 , 如 (a, b), 所發生的機率 , 而非可能實現值個別發

生的機率 , 因為任何一個可能實現值發生的機率必須為 0:

P(X = x) = 0

理由在於 , 連續隨機變數的可能實現值有無窮多個且不可數

為什麼我們可以無中生有 ?

連續隨機變數的性質假設

單調非遞減

累積分配函數

連續隨機變數之動差期望值

變異數

連續隨機變數之動差 r 階動差

r 階中央動差

均勻分配我們將在之後討論一些常用且重要的連續隨機變

數 , 在此 , 我們先介紹一個簡單的連續隨機變數 :

均勻分配 (uniform distribution) 。

均勻分配給定隨機變數 X 在區間 [l , h] 中 , 其實現值落在任

意一個子區間 [a, b] 的機率恰為

則稱 X 為一均勻隨機變數 , 其 pdf 為

並以 X ∼ U[l , h] 表示之

均勻分配均勻隨機變數的 CDF 為

均勻分配 ( 期望值 , 二階動差與變異數 )

Chebyshev 不等式給定隨機變數 X ∼ (μ, 2), 對於任意常數 k > 0,

由於不等式可改寫成

因此 , 這個不等式告訴我們 , 至少有 1 − 的機率 , 隨機變數 X 會落在區間 μ ± kσ 內

Chebyshev 不等式舉例來說 , 若 k = 2, 則至少有 (1 − 1/4) = 3/4 =

75% 的機率 X 會落在區間 μ ± 2 σ 內。

Laws of Expected Value…

E(c) = c The expected value of a constant (c) is just the value of the constant.

E(X + c) = E(X) + c

E(cX) = cE(X) We can “pull” a constant out of the expected value expression (either as part of a sum with a random variable X or as a coefficient of random variable X).

E(c) = c

Proof:

xx

xpcxcpcE )()()( 1)( and x

xp

cccE )1()( hence

E(X + c) = E(X) + c Proof:

x

xpcXcXE )()()(

( ) ( )

( ) ( )

( )

x x

Xp x cp x

E x E c

E x c

E(cX) = cE(X)

( ) ( )

( )

( )

x

x

E cX cXp x

c Xp x

cE X

E(X1+X2)=E(X1)+E(X2) (X1, X2具相同分配 P（ X ） )

Proof:

1 2 1 2

1 2

1 2

( ) ( ) ( )

( ) ( )

( ) ( )

x

x x

E X X X X p x

X p x X p x

E X E X

Laws of Variance…

V(c) = 0 The variance of a constant (c) is zero.

V(X + c) = V(X) The variance of a random variable and a constant is just the variance of the random variable (per 1 above).

V(cX) = c2V(X) The variance of a random variable and a constant coefficient is the coefficient squared times the variance of the random variable.

V(c) = 0

Proof:22 )()( XEXV

cX Let

22 )()( ccEcV

022 cc

V(X + c) = V(X)

Proof: 22 )]([])[()( cXEcXEcXV 222 ])([)2( cXEccXXE

2 2 2( ) 2 ( ) ( )E X cE X c c 2 2 2 2( ) 2 ( 2 )E X c c c c

)()( 22 XVXE

V(cX) = c2V(X)

Proof:22 )]([])[()( xcEcXEcXV

2222 )( cXcE

)(

])([

)(

2

222

2222

XVc

XEc

cXEc

統計學 : 應用與進階 第 3 章 : 隨機變數

Documents

統計學 : 應用與進階第 3 章 : 隨機變數