摘要訊息 : 隨機變數, 期望以及一些它們的特徵和性質.
0. 前言
在本文中, 我們將要討論具有有限個結局試驗的機率模型可能產生的一些數字特徵.
更新紀錄 :
- 2022 年 6 月 10 日進行第一次更新和修正.
1. 隨機變數
設 (Ω,A,P) 是某個具有有限個結局試驗的機率模型. 其中, A={A:A⊆Ω}. 之前所討論的關於事件 A∈A, 其機率的計算以及基本事件空間 Ω 的自然本性並不重要, 重要的是某種數字特徵, 它依賴於基本事件. 我們想要知道的是, 在一系列 n 次試驗中, 出現 k 次 (k≤n) 成功的機率如何等這一類問題.
定義 1. 稱任意定義在有限基本事件空間 Ω 上的數值函數 ξ=ξ(ω) 為隨機變數 (random variable).
例題 1. 對於接連兩次投擲硬幣模型, 其基本事件空間為 Ω={HH,HT,TH,TT}. 我們使用下列表格定義隨機變數 ξ=ξ(ω) :
ω | HH | HT | TH | TT |
ξ(ω) | 2 | 1 | 1 | 0 |
其中,
ξ(ω) 是事件
ω 中, 投擲硬幣得到正面的次數.
通過例題 1, 我們不難得到關於隨機變數 ξ 的另外一個簡單例子, 即集合的特徵函數 ξ=μ(ω).
當實驗者遇到描繪某些記載或者讀數的隨機變數時, 他關心的基本問題是隨機變數取各個數值的機率如何? 從這種觀點出發, 實驗者關心的並非機率 P 在 (Ω,A) 上的分佈, 而是機率在隨機變數之可能值的集合上的分佈, 即隨機變數 ξ 取到集合 C={c1,c2,...,cn} 中某個值的機率分佈. 由於所研究的情形, Ω 由有限個點所構成, 則隨機變數 ξ 的值域 Rξ 也是有限的. 設 Rξ={r1,r2,...,rm}, 其中, r1,r2,...,rm 是 ξ 的全部可能值.
記 R 是值域 Rξ 上的一切子集的全體, 並且設 B∈R. 當 Rξ 是隨機變數 ξ 的值域時, 集合 B 也可以視為某個事件.
在 (Rξ,R) 上考慮由隨機變數 ξ 按 Pξ(B)=P{ω:ξ(ω)∈B},B∈R 產生的機率 Pξ(⋅). 顯然, 這些機率的值完全取決於 Pξ(ri)=P{ω:ξ(ω)=ri},ri∈Rξ. 機率組 {Pξ(r1),Pξ(r2),...,Pξ(rm)} 稱作隨機變數 ξ 的機率分佈 (probability distribution), 簡稱為分佈 (distribution).
例題 2-1. 設隨機變數 ξ 分別以機率 p 和 q 取到 1 和 0 兩個值. 其中, p 稱作成功的機率, q 稱作失敗的機率. 則稱 ξ 為 Bernoulli 隨機變數, 也稱隨機變數 ξ 服從 Bernoulli 分佈. 顯然, 對於隨機變數 ξ 有 Pξ(x)=pxq1−x,x∈{0,1}.
例題 2-2. 設隨機變數 ξ 以機率 Pξ(x)=(nx)pxqn−x. 其中, x=0,1,2,…,n. 取 0,1,...,n 等 n+1 個值, 則稱隨機變數 ξ 為二項隨機變數 (binomial random variable), 或者說隨機變數 ξ 服從二項分佈.
我們可以發現, 在例題 2 中, 我們已經不關心基本機率空間 (Ω,A,P) 的構造了, 而只是關心隨機變數的值及其機率分佈.
2. 分佈函數
定義 2. 設 x∈R, 函數 Fξ(x)=P{ω:ξ(ω)≤x} 稱作隨機變數 ξ 的分佈函數 (distribution function).
根據隨機變數分佈函數的定義, 我們容易得到 Fξ(x)={i:xi≤x}∑Pξ(xi). 除此之外, Pξ(xi)=Fξ(xi)−Fξ(xi−). 其中, Fξ(xi−)=x→xi−limFξ(x). 特別地, 若有 x1<x2<...<xm 且 Fξ(x0)=0, 則有 Pξ(xi)=Fξ(xi)−Fξ(xi−1),i=1,2,...,n.
直接由定義 2, 我們可以得到分佈函數的三條性質 :
- x→−∞limFξ(x)=0;
- x→+∞limFξ(x)=1;
- Fξ(x) 具有右連續性, 即 x→x0+limFξ(x0)=x0, 且 Fξ(x) 為階梯函數.
除了隨機變數之外, 我們通常還研究隨機向量 (random vector) ξ=(ξ1,ξ2,...,ξr), 其各分量都是隨機變數. 對於多項分佈來說, 對象為隨機向量 υ=(υ1,υ2,...,υr). 其中, υi=υi(ω) 是序列 ω=(a1,a2,...,an) 中等於 bi (i=1,2,…,r) 的分量的數量.
對於 xi∈Xi (Xi 是 ξi 一切可能值的集合, i=1,2,...,r), 機率 Pξ(x1,x2,...,xr)=P{ω:ξ(ω)=x1,ξ2(ω)=x2,...,ξr(ω)=xr} 的全體稱為隨機向量 ξ=(ξ1,ξ2,...,ξr) 的機率分佈, 而函數 Fξ(x1,x2,...,xr)=P{ω:ξ1(ω)≤x1,ξ2(ω)≤x2,...,ξr(ω)≤xr} 稱為隨機向量 ξ=(ξ1,ξ2,...,ξr) 的分佈函數. 其中, xi∈R (i=1,2,...,r). 那麼對於多項分佈的向量 υ=(υ1,υ2,...,υr), 有 Pυ(n1,n2,...,nr)=(nn1,n2,...,nr)p1n1p2n2...prnr.
定義 3. 設 ξ1,ξ2,...,ξr 是一組在 R 中的有限集合 X 上取值的隨機變數. 記 X 是 X 中所有子集的代數. 若對於任意 x1,x2,...,xr∈X, 有 P{ξ1=x1,ξ2=x2,...,ξr=xr}=P{ξ1=x1}P{ξ2=x2}...P{ξr=xr}; 或等價地, 對於任意 B1,B2,...,Br∈X, 有 P{ξ∈B1,ξ2∈B2,...,ξr∈Br}=P{ξ1∈B1}P{ξ2∈B2}...P{ξr∈Br}, 則稱隨機變數 ξ1,ξ2,...,ξr 為全體獨立 (mutually independent) 的.
我們之前所討論的 Bernoulli 概型, 就是獨立隨機變數的一個例子. 具體地, 設 Ω={ω:ω=(a1,a2,...,an),ai=0,1 (i=1,2,...,n)},A={A:A⊆Ω},P({ω})=p(ω)=pi∑ai(1−p)n−i∑ai, 並且對於 ω=(a1,a2,...,an), ξi(ω)=ai (i=1,2,...,n), 由於事件 A1={ω:a1=1},A2={ω:a2=1},...,An={ω:an=1} 獨立, 從而隨機變數 ξ1,ξ2,...,ξn 獨立.
如果隨機變數 ξ 的值域 Rξ={x1,x2,...,xk}, 隨機變數 η 的值域為 Rη={y1,y2,...,yl}, 則隨機變數 ζ=ξ+η 的值域為 Rζ={z:z=xi+yj,i=1,2,...,k,j=1,2,...,l}. 那麼顯然, Pζ(z)=P{ζ=z}=P{ξ+η=z}={(i,j):xi+yj=z}∑P{ξ=xi,η=yj}.
例題 3. 若隨機變數 ξ1,ξ2,...,ξn 是獨立的 Bernoulli 隨機變數, 且 P{ξi=1}=p,P{ξi=0}=q,i=1,2,...,n. 證明 : 隨機變數 ζ=ξ1+ξ2+...ξn 服從二項分佈.
證明 :我們使用歸納法進行證明.
當 n=2 時, Rζ={0,1,2}. 那麼有 Pζ(0)=Pξ1(0)Pξ2(0)=q2=(20)p0q2,Pζ(1)=Pξ1(0)Pξ2(1)+Pξ1(1)Pξ2(0)=2pq=(21)p1q1,Pζ(2)=Pξ1(1)Pξ2(1)=p2=(22)p2q0. 故當 n=2 時, 隨機變數 ζ=ξ1+ξ2 服從二項分佈.
不妨假設當 n<l 時, 隨機變數 ζ=ξ1+ξ2+...+ξn 服從二項分佈.
當 n=l 時, Rζ={0,1,2,...,l}. 那麼有 Pζ(0)=Pξ1(0)Pξ2(0)...Pξl(0)=ql=(l0)p0ql,Pζ(1)=Pξ1(1)Pξ2(0)...Pξl(0)+Pξ1(0)Pξ2(1)Pξ3(0)...Pξl(0)+...+ Pξ1(0)Pξ2(0)...Pξl−1(0)Pξl(1)=qpl−1=(l1)p1ql−1,⋮Pζ(l)=Pξ1(1)Pξ2(1)...Pξl(1)=pl=(ll)plq0. 故當 n=l 時, 隨機變數 ζ=ξ1+ξ2+...+ξn 仍然服從二項分佈.
綜上所述, 隨機變數 ζ=ξ1+ξ2+...ξn 服從二項分佈.
■
3. 數學期望
設 (Ω,A,P) 是有限機率空間, 而 ξ=ξ(ω) 是某一隨機變數, 其值域為 Rξ={x1,x2,...,xk}. 如果設 Ai={ω:ξ(ω)=xi}, 則顯然 ξ 可以表示為 ξ=ξ(ω)=i=1∑kxiμAi(ω). 其中, A1,A2,...,Ak 構成集合 Ω 的分割, i=1,2,...,k, μAi(ω) 是集合 Ai 的特徵函數.
說明:我來說明一下為何 ξ(ω)=i=1∑kxiμAi(ω) 成立. 首先, 能夠使得 ξ(ω)=xi 成立的事件 ω, 必有 ω∈Ai. 那麼, μAi(ω)=1. 對於其它 Aj (j=i), 就有 ω∈/Aj, 即這些 ω 會使得 {j=i}μAj(ω)=0. 展開 ξ(ω), 可得 ξ(ω)=x1μA1(ω)+x2μA2(ω)+...+ xi−1μAi−1(ω)+xiμAi(ω)+xi+1μAi+1(ω)+...+ xkμAk(ω). 根據說明, 我們可以得到 μA1(ω),μA2(ω),...,μAi−1(ω),μAi+1(ω),...,μAk(ω) 都為零. 因此, 不論 x1,x2,...,xi−1,xi+1,...,xk 為何值, x1μA1(ω),x2μA2(ω),...,xi−1μAi−1(ω),xi+1μAi+1(ω),...,xkμAk(ω) 都為零. 最終有 ξ(ω)=xiμAi(ω)=xi=i=1∑kxiμAi(ω).
■
記 pi=P{ξ=xi},i=1,2,...,k. 直觀上, 如果在 n 次獨立重複試驗中觀測隨機變數 ξ 的取值, 則取 xi 的值大致上應該出現 npi 次. 考慮投擲 n 次均勻硬幣, 則 p0=p1=21. 其中, p0 代表反面向上的機率, 而 p1 表示正面向上的機率. 直觀上, 投擲 n 次硬幣, 正面應該大致出現 2n 次, 即 np1 次. 因此, 根據 n 次試驗的結果, 計算該隨機變數的平均值大致為 n1(np1x1+np2x2+...+npkxk)=i=1∑kpixi.
定義 4. 實數 E(ξ)=i=1∑kxiP(Ai) 稱作隨機變數 ξ=i=1∑kxiμAi(ω) 的數學期望 (mathematical expectation) 或者平均值 (mean value), 簡稱期望 (expectation) 或者均值. 其中, Ai={ω:ξ(ω)=xi} (i=1,2,…,k).
我們注意到, Pξ(xi)=P(Ai). 根據定義 4, 又有 E(ξ)=i=1∑kxiPξ(xi). 另外, 我們記 ΔFξ(x)=Fξ(x)−Fξ(x−), 根據定義 3, 我們可得 Pξ(xi)=ΔFξ(xi), 從而有 E(ξ)=i=1∑kxiΔFξ(xi).
有時, 隨機變數 ξ 的值域中可能出現相同的值, 即 xi=xj 但 i=j 的情形. 此時, 我們可以將隨機變數表示為 ξ(ω)=j=1∑lxj′μBj(ω). 其中, B1+B2+...Bl=Ω, xj 之中可能出現相同的值, j=1,2,...,l. 但之前, 我們所討論的隨機變數的值域是一個集合, 裡面不能存在相同的元素. 這時, 我們仍然可以按照上式計算期望, 而並不需要將其變換為所有的 xi 值兩兩不等的 ξ(ω)=i=1∑kxiμAi(ω). 其中, i=1,2,…,l.
事實上, 根據 {j:xj′=xi}∑xj′P(Bj)=xi{j:xj′=xi}∑P(Bj)=xiP(Ai), 於是有 j=1∑lxjP(Bj)=i=1∑kxiP(Ai).
設 ξ 和 η 為隨機變數, 則期望有以下基本性質 :
- 若 ξ≥0, 則 E(ξ)≥0;
- E(aξ+bη)=aE(ξ)+bE(η). 其中, a 和 b 是常數;
- 若 ξ≥η, 則 E(ξ)≥E(η);
- ∣E(ξ)∣≤E(∣ξ∣);
- 若 ξ 和 η 獨立, 則 E(ξη)=E(ξ)E(η);
- E2(∣ξη∣)≤E(ξ2)E(η2), 這是 Cauchy-Schwarz 不等式的機率形式;
- 若 ξ=μA(ω), 則 E(ξ)=P(A);
- 若 c 為常數, 則 E(c)=c.
證明 :根據期望的定義, E(ξ)=i=1∑kxiP(Ai), 由於 0≤P(Ai)≤1, 故當 ξ≥0 時, 必有 xi≥0. 其中, i=1,2,...,k. 於是 E(ξ)≥0.
(1) □
設 ξ=i∑xiμAi(ω) 且 η=j∑yjμAj(ω), 則 aξ+bη=ai∑xiμAi(ω)+bj∑yjμAj(ω). 由於 Ai=Ai∪Ω=Aij⋃Bj 且 Bj=Bji⋃Ai, 故有 aξ+bη=ai,j∑xiμAiBj(ω)+bi,j∑yjμAiBj(ω)=i,j∑axiμAiBj(ω)+i,j∑byjμAiBj(ω)=i,j∑(axi+byj)μAiBj(ω). 因此, 根據定義 4 有 E(aξ+bη)=i,j∑(axi+byj)P(AiBj)=i∑axiP(Ai)+j∑byjP(Bj)=ai∑xiP(Ai)+bj∑yjP(Bj)=aE(ξ)+bE(η).
(2) □
由性質 2 可知, E(ξ)−E(η)=E(ξ−η). 由於 ξ≥η, 結合性質 1, 於是有 E(ξ)≥E(η).
(3) □
根據絕對值不等式 (《【數學分析】實數——實數的四則運算》定理 3), 我們可以得到 ∣E(ξ)∣=∣∣∣∣∣∣i∑xiP(Ai)∣∣∣∣∣∣≤i∑∣xi∣P(Ai)=E(∣ξ∣).
(4) □
設 ξ=i∑xiμAi(ω) 且 η=j∑yjμAj(ω), 則 E(ξη)=E(i∑xiμAi(ω)j∑yjμAj(ω))=E(i∑j∑xiyjμAiBj(ω))=i,j∑xiyjP(AiBj). 由於隨機變數 ξ 和 η 獨立, 故事件 Ai={ω:ξ(ω)=xi} 和 Bj={ω:η(ω)=yj} 相互獨立, 於是 E(ξη)=i,j∑xiyjP(Ai)P(Bj)=i∑xiP(Ai)j∑yjP(Bj)=E(ξ)E(η).
(5) □
對於 ξ=i∑xiμAi(ω),η=j∑yjμAj(ω), 我們注意到 ξ2=i∑xi2μAi(ω),η2=j∑yjμBj(ω). 因此根據期望的定義, 有 E(ξ2)=i∑xi2P(Ai),E(η2)=j∑yj2P(Bj). 設 E(ξ2)>0 且 E(η2)>0, 記 ξ=E(ξ2)ξ,η=E(η2)η, 於是, E(ξ2+η2)=E(ξ2)ξ2+E(η2)η2,2∣∣∣∣ξη∣∣∣∣=E(ξ2)E(η2)2∣ξη∣. 由均值不等式可知, 2∣ξη∣≤ξ2+η2, 可見 2E(∣∣∣∣ξη∣∣∣∣)≤E(ξ2)+E(η2)=2. 因此, E(∣∣∣∣ξη∣∣∣∣)≤1 且 E2(ξη)≤E(ξ2)E(η2). 若 E(ξ2)=0, 則 i∑xi2P{Ai}=0. 從而 0 是隨機變數 ξ 的可能取值, 並且 P{ω:ξ(ω)=0}=1. 於是, 不論 E(ξ2)=0 或者 E(η2)=0, 顯然有 E(∣ξη∣)=0. 此時有 E2(ξη)≤E(ξ2)E(η2) 成立.
綜上所述, E2(ξη)=E(ξ2)E(η2).
(6) □
根據隨機變數 ξ 的性質 : ξ=i∑xiμAi(ω)=μAi(ω), 即 xi=1, 於是 E(ξ)=i∑xiP(Ai)=i∑P(Ai)=P(A)
(7) □
由於 c 有且唯有一種取值, 故 P(c)=1. 根據期望的定義, 有 E(c)=i∑xiP(Ai)=c⋅P(c)=c.
(8) □
■
推論 1. 若隨機變數 ξ1,ξ2,...,ξr 獨立, 則有 E(ξ1ξ2...ξr)=E(ξ1)E(ξ2)...E(ξr).
證明 :我們使用歸納法進行證明.
當 r=1 時, 顯然有 E(ξ1)=E(ξ1); 當 r=2 時, 由期望的性質可知, E(ξ1ξ2)=E(ξ1)E(ξ2).
不妨假設當 r<k 時, 有 E(ξ1ξ2...ξr)=E(ξ1)E(ξ2)...E(ξr) 成立.
當 r=k 時, E(ξ1ξ2...ξk−1ξk)=E((ξ1ξ2...ξk−1)ξk)=E(ξ1ξ2...ξk−1)E(ξk)=E(ξ1)E(ξ2)...E(ξk−1)E(ξk). 因此, 當 r=k 時, E(ξ1ξ2...ξr)=E(ξ1)E(ξ2)...E(ξr) 仍然成立.
綜上所述, 若隨機變數 ξ1,ξ2,...,ξr 獨立, 則有 E(ξ1ξ2...ξr)=E(ξ1)E(ξ2)...E(ξr).
■
例題 4. 設 ξ 是 Bernoulli 隨機變數, 以機率 p 和 q 取 0 和 1, 則 E(ξ)=1×P{ξ=1}+0×P{ξ=0}=P{ξ=1}=p.
例題 5. 設 ξ1,ξ2,...,ξn 是 n 個 Bernoulli 隨機變數, 以機率 P{ξi=1}=p 和 P{ξi=0}=q 及 p+q=1 取 1 和 0 為值. 其中, i=1,2,...,n. 那麼對於 Sn=ξ1+ξ2+...+ξn 的期望為 E(Sn)=E(ξ1+ξ2+...ξn)=E(ξ1)+E(ξ2)+...+E(ξn)=n 個(1×p+0×q)+(1×p+0×q)+...+(1×p+0×q)=np.
例題 5'. 設 ξ1,ξ2,...,ξn 是 n 個 Bernoulli 隨機變數, 以機率 P{ξi=1}=p 和 P{ξi=0}=q 及 p+q=1 取 1 和 0 為值. 其中, i=1,2,...,n. 求 Sn=ξ1+ξ2+...+ξn.
解 :若 ξ1,ξ2,...,ξn 是 n 個獨立的 Bernoulli 隨機變數, 則 E(Sn) 仍保持不變. 此時, 由二項分佈可知 P{Sn=k}=(nk)pkqn−k. 其中, k=0,1,2,…,n. 於是, E(Sn)=k=0∑nkP{Sn=k}=k=0∑nk(nk)pkqn−k=k=0∑nk⋅k!(n−k)!n!pkqn−k=0!(n−0)!0×n!p0qn+k=1∑nkk!(n−k)!n!pkqn−k=k=1∑nkk!(n−k)!n!pkqn−k=k=1∑nkk!(n−k+1−1)!n(n−1)!p⋅pk−1qn−k+1−1=k=1∑n(k−1)!((n−1)−(k−1))!n(n−1)!p⋅pk−1q(n−1)−(k−1)=npk=1∑n(k−1)!((n−1)−(k−1))!(n−1)!pk−1q(n−1)−(k−1)=npl=1∑n−1l!((n−1)−l)!(n−1)!plq(n−1)−l (令 l=k−1)=np.
■
設 ξ=i∑xiμAi(ω), 其中, Ai={ω:ξ(ω)=xi}, 從而 φ=φ(ξ(ω)) 是 ξ(ω) 的某一函數. 如果 Bj={ω:φ(ξ(ω))=yj}, 則 φ(ξ(ω))=j∑yjμBj(ω). 從而有 E(φ)=j∑yjP(Bj)=j∑yjPφ(yj). 顯然, φ(ξ(ω))=i∑φ(xi)μAi(ω). 於是, 為了求 φ=φ(ξ(ω)) 的期望值, 既可以使用 E(φ)=j∑yjP(Bj)=j∑yjPφ(yj), 也可以使用 E(φ(ξ(ω)))=i∑φ(xi)Pξ(xi). 我們稱 E(φ(ξ(ω))) 為隨機變數函數的數學期望.
定義 5. 稱 Var(ξ)=E((ξ−E(ξ))2) 為隨機變數 ξ 的方差 (variance).
定義 6. 稱 σ=Var(ξ) 為隨機變數 ξ 的標準差 (standard deviation).
隨機變數 ξ 的方差和標準差表徵了 ξ 的取值的散佈程度.
由於 E((ξ−E(ξ))2)=E(ξ2−2ξE(ξ)+E2(ξ))=E(ξ2)−E(2ξE(ξ))+E(E2(ξ))=E(ξ2)−2E(ξ)⋅E(ξ)+E2(ξ)=E(ξ2)−2E2(ξ)+E2(ξ)=E(ξ2)−E2(ξ) 可見, Var(ξ)=E(ξ2)−E2(ξ). 上面推導過程中, 由於 E(ξ) 是常數, 因此根據期望的性質 8 有 E(E(ξ))=E(ξ).
設 ξ 為隨機變數, a 與 b 均為常數, 可導出方差如下性質 :
- Var(ξ)≥0;
- Var(a+bξ)=b2Var(ξ);
- Var(a)=0;
- Var(bξ)=b2Var(ξ).
證明 :由定義 5 可知, Var(ξ)=E((ξ−E(ξ))2). 而 (ξ−E(ξ))2≥0, 由期望的性質可知, Var(ξ)≥0.
(1) □
根據定義 5 , 我們將其展開 : Var(a+bξ)=E((a+bξ)2)−E2(a+bξ)=E(a2+2abξ+b2ξ2)−E(a+bξ)E(a+bξ)=E(a2)+E(2abξ)+E(b2ξ2)−(E2(a)+E2(bξ)+2E(a)E(bξ))=a2+2abE(ξ)+b2E(ξ2)−a2−b2E2(ξ)−2abE(ξ)=b2E(ξ2)−b2E2(ξ)=b2(E(ξ2)−E2(ξ))=b2Var(ξ).
(2) □
根據定義 5 , 我們將其展開 : Var(a)=E(a2)−E2(a)=a2−a2=0.
(3) □
根據定義 5 , 我們將其展開 : Var(bξ)=E(b2ξ2)−E2(bξ)=b2E(ξ2)−b2E2(ξ)=b2(E(ξ2)−E2(ξ))=b2Var(ξ).
(3) □
■
對於兩個隨機變數 ξ 和 η, 有 Var(ξ+η)=E((ξ+η)2)+E2(ξ+η)=E(ξ2+2ξη+η2)−(E(ξ)−E(η))2=E(ξ2)+2E(ξ+η)+E(η2)−E2(ξ)−2E(ξ)E(η)+E2(η)=Var(ξ)+Var(η)+2E(ξη)−2E(ξ)E(η). 而 E((ξ−E(ξ))+(η−E(η)))=E(ξ2+E2(ξ)+η2+E2(η)−2ξE(ξ)+2ξη− 2ξE(η)−2ηE(ξ)+2E(η)E(η)−2ηE(η))=E(ξ2)+E2(ξ)+E(η2)+E2(η)−2E2(ξ)+2E(ξη)− 2E(η)E(ξ)−2E(η)E(ξ)+2E(ξ)E(η)−2E2(η)=Var(ξ)+Var(η)+2E(ξη)−2E(η)E(ξ), 因此, Var(ξ+η)=E(((ξ−E(ξ))+(η−E(η)))2). 除此之外, 2E((ξ−E(ξ))(η−E(η)))=2E(ξη−ξE(η)−ηE(ξ)+E(ξ)E(η))=2(E(ξη)−E(ξ)E(η)−E(η)E(ξ)+E(ξ)E(η))=2E(ξη)−2E(ξ)E(η), 故有 Var(ξ+η)=E((ξ−E(ξ))+(η−E(η)))=Var(ξ)+Var(η)−2E((ξ−E(ξ))(η−E(η))).
定義 7. 我們稱 Cov(ξ,η)=E((ξ−E(ξ))(η−E(η))) 為隨機變數 ξ 和 η 的協方差 (covariance, 也稱共變異數).
定義 8. 若 Var(ξ)≥0,Var(η)≥0, 我們稱 ρ(ξ,η)=Var(ξ)Var(η)Cov(ξ,η) 為隨機變數 ξ 和 η 的相關係數 (correlation coefficient).
定理 1. 若 ρ(ξ,η)=±1, 則隨機變數 ξ 和 η 線性相關, 即 η=aξ+b. 其中, 當 ρ(ξ,η)=1 時, a>0; 當 ρ(ξ,η)=−1 時, a<0, a 和 b 都為常數.
證明 :當 ρ(ξ,η)=1 時, 有 Var(ξ)Var(η)Cov(ξ,η)=E((ξ−E(ξ))2)E((η−E(η))2)E((ξ−E(ξ))(η−E(η)))=1. 記隨機變數 φ=ξ−E(ξ) 和 ψ=η−E(η), 由上式可知 E(φψ)=E(φ2)E(ψ2). 兩邊平方可得 E2(φψ)=E(φ2)E(ψ2). 根據期望的性質 6, 有 E2(φψ)≤E(φ2)E(ψ2). 顯然, 要使得等號成立, 若且唯若隨機變數 φ 和 ψ 線性相關, 即存在不為零的 k1 和 k2 使得 k1φ+k2ψ=0. 記 k=−k2k1, 於是有 φ=kψ. 那麼, 我們可以得到 E2(φψ)=E2(φ⋅kφ)=k2E2(φ2) 和 E(φ2)E(ψ2)=E(φ2)E(k2φ2)=k2E2(φ2). 因此, E2(φψ)=E(φ)E(ψ). 此時, φ=ξ−E(ξ)=kψ=k(η−E(η)). 變換可得 η=k1ξ+kkE(η)+E(ξ). 記 a=k1,b=kkE(η)+E(ξ), 則 η=aξ+b. 當 ρ(ξ,η)=−1 時, 同樣有 η=aξ+b.
接下來證明當 ρ(ξ,η)=1 時, a>0; 當 ρ(ξ,η)=−1 時, a<0. 當 ρ(ξ,η)=1 時, 有 η=aξ+b. 則 ρ(ξ,η)=ρ(ξ,aξ+b)=Var(ξ)Var(aξ+b)Cov(ξ,aξ+b)=∣a∣Var(ξ)E(ξ−E(ξ))E(aξ+b−E(aξ+b))=∣a∣a=1. 故當 a>0 時, ρ(ξ,η)=1. 對於 ∣a∣a=−1, 此時 a<0. 因此當 a<0 時, ρ(ξ,η)=−1.
綜上所述, 若 ρ(ξ,η)=±1, 則隨機變數 ξ 和 η 線性相關, 即 η=aξ+b. 其中, 當 ρ(ξ,η)=1 時, a>0; 當 ρ(ξ,η)=−1 時, a<0, a 和 b 都為常數.
■
顯然我們可以立即指出 : 若隨機變數 ξ 和 η 相互獨立, 則隨機變數 ξ−E(ξ) 和 η−E(η) 獨立, 於是 Cov(ξ,η)=E((ξ−E(ξ))(η−E(η)))=E(ξη)−E(ξ)E(η)=0. 另外, 由定義 7 可知 Var(ξ+η)=Var(ξ)+Var(η)+2Cov(ξ,η)=Var(ξ)+Var(η). 相比於 "隨機變數 ξ 和 η 相互獨立" 這個條件, "隨機變數 ξ 和 η 不相關" 這個條件要稍弱一些. 因此, 一般隨機變數 ξ 和 η 不相關並不能推導出 ξ 和 η 獨立.
4. 估計量
例題 6. 假設隨機變數 α 以 31 的機率分別取 0,2π,π 三個值. 證明 : 隨機變數 ξ=sinα 與 η=cosα 不相關但是 ξ 和 η 關於機率 P 不獨立, 並求 ξ 和 η 之間的函數關係.
證明 :顯然, 隨機變數 ξ 和 η 的值域為 Rξ={0,1},Rη={0,1,−1}, 那麼有 P{ξ=0}=32,P{ξ=1}=31,P{η=0}=P{η=1}=P{η=−1}=31,P{ξ=0,η=0}=0,P{ξ=1,η=0}=31,P{ξ=0,η=1}=31,P{ξ=1,η=1}=0,P{ξ=0,η=−1}=31,P{ξ=1,η=1}=0. 因此, 我們有 E(ξη)=0×0+0×31+31×0+0×1+31×0+0×(−1)=0 和 E(ξ)=32×0+31×1=31,E(η)=31×0+31×(−1)+31×1=0. 於是, Cov(ξ,η)=E(ξη)−E(ξ)E(η)=0. 故隨機變數 ξ 和 η 不相關. 然而, 對於任意 i∈Rξ,j∈Rη, 都有 P{ξ=i,η=j}=P{ξ=i}P{η=j}, 且由 sin2α+cos2α=1 可得 : 隨機變數 ξ 和 η 存在函數關係 ξ2+η2=1.
■
特別地, 若隨機變數 ξ1,ξ2,...,ξn 兩兩不相關 (不一定兩兩獨立), 則有 Var(i=1∑nξi)=i=1∑nVar(ξi). 考慮兩個隨機變數 ξ 和 η, 假設只對隨機變數 ξ 進行觀測. 如果隨機變數 ξ 和 η 相關, 則可以預期 : 已知 ξ 的值可以對未觀測的隨機變數 η 的值作出某種判斷.
我們把隨機變數 ξ 的任何一個函數 f=f(ξ) 稱作隨機變數 η 的一個估計量. 若有 E((η−f∗(ξ))2)=finfE((η−f(ξ))2), 則稱 f∗=f∗(ξ) 為在均方意義下的最佳估計量 (the optimal estimator).
對於線性估計 λ(ξ)=a+bξ 類中, 我們接下來討論如何求得線性估計類中的最佳線性估計. 考慮函數 g(a,b)=E((η−f(ξ))2), 對多變數函數 g(a,b) 針對 a 和 b 求偏導數, 得 ∂a∂g=−2E(η−(a+bξ)) 和 ∂b∂g=−2E((η−(a+b)ξ)ξ). 令 ∂a∂g=0 且 ∂b∂g=0, 即可求出 λ 均方線性估計 λ∗=a∗+b∗ξ. 其中, a∗=E(η)−b∗E(ξ), b∗=Var(ξ)Cov(ξ,η). 即 λ∗(ξ)=E(η)+Var(ξ)Cov(ξ,η)(ξ−E(ξ)). 稱 Δ∗=E((η−λ∗(ξ))2) 為估計值的均方誤差 (the mean-square error of estimation), 則有 Δ∗=E((η−λ∗(ξ))2)=Var(η)−Var(ξ)Cov(ξ,η)=Var(η)(1−ρ2(ξ,η)). 可見, ∣ρ(ξ,η)∣ 越大, 均方誤差 Δ∗ 越小. 特別地, 當 ∣ρ(ξ,η)∣=1, 則 Δ∗=0. 如果隨機變數 ξ 和 η 不相關, 即 ρ(ξ,η)=0, 則 λ∗(ξ)=E(η). 於是, 在隨機變數 ξ 和 η 不相關的情形下, 根據 ξ 對 η 的估計為 E(η).
5. 練習題
練習題 1. 向 n 個箱子中獨立地投擲 k 個球, 假設每個球落入各箱子的機率為 n1, 求非空箱子數量的期望.
解 :定義隨機變數 ξ1,ξ2,...,ξn. 當第 i 個箱子中有球時, ξi=1; 否則, ξi=0. 其中, i=1,2,...,n. 記 η=ξ1+ξ2+...+ξn, 則隨機變數 η 可以表示有球箱子的數量.
將球投入任一箱子中的機率為 n1, 則球不投入任何箱子的機率為 1−n1. 由於 n 個球的投擲相互獨立, 那麼 n 個球都不投入任何箱子中的機率為 (1−n1)n. 反之, 至少有一個球投入箱子的機率為 1−(1−n1)n. 於是, P{ξi=0}=(1−n1)n,P{ξi=1}=1−(1−n1)n. 根據定義 4, 故有 E(ξi)=0×P{ξi=0}+1×P{ξi=1}=1−(1−n1)n. 那麼, 有 E(η)=E(ξ1+ξ2+...ξn)=E(ξ1)+E(ξ2)+...+E(ξn)=n(1−(1−n1)n).
■
自主習題 1. 設 ξ1,ξ2,...,ξn 是獨立的 Bernoulli 隨機變數, 且 P{ξi=0}=1−λiΔ,P{ξi=1}=λiΔ. 其中, Δ>0,λi>0,i=1,2,...,n, 而 Δ 是較小的數. 記 o(⋅) 表示 ⋅ 的高階無窮小. 證明 :
- P{ξ1+ξ2+...+ξn=1}=Δi=1∑nλi+o(Δ2);
- P{ξ1+ξ2+...+ξn>1}=o(Δ2).
自主習題 2. 證明 : 當 a=E(ξ) 時, E((ξ−a)2) 達到最大下界 −∞<a<+∞infE((ξ−a)2), 即 −∞<a<+∞infE((ξ−a)2)=Var(ξ).
自主習題 3. 設 Fξ(x) 是隨機變數 ξ 的分佈函數, 而 me 是 Fξ(x) 的中位數, 即下列條件的點 Fξ(me−)≤21≤Fξ(me). 證明 : −∞<a<+∞infE(∣ξ−a∣)=E(∣ξ−me∣).
自主習題 4. 設 Pξ(x)=P{ξ=x},Fξ(x)=P{ξ≤x}, 證明 :
- 對於 a>0,−∞<b<+∞, 有 Paξ+b(x)=Pξ(ax−a) 和 Paξ+b(x)=Fξ(ax−b) 成立;
- 如果 y≥0, 則 Fξ2(y)=Fξ(y)−Fξ(−y)+Pξ(−y);
- 設 ξ+=max{ξ,0}, 則 Fξ+(x)=⎩⎪⎪⎨⎪⎪⎧0Fξ(x)Fξ(x)x<0x=0x>0.
自主習題 5. 假設對於隨機變數 ξ 和 η 有 E(ξ)=E(η)=0,Var(ξ)=Var(η)=1, 而 ξ 和 η 的相關係數為 ρ(ξ,η). 證明 : E(max{ξ2,η2})≤1+1−ρ2.
自主習題 6. 設 ξ1,ξ2,...,ξn 是獨立隨機變數, φ1=φ1(ξ1,ξ2,...,ξk) 和 φ2=φ2(ξk+1,ξk+2,...,ξn) 分別是 (ξ1,ξ2,...,ξk) 和 (ξk+1,ξk+2,...,ξn) 的函數. 證明 : φ1 和 φ2 獨立.
自主習題 7. 證明 : 隨機變數 ξ1,ξ2,...,ξn 獨立, 若且唯若對於一切 x1,x2,...,xn, 有 Fξ1,ξ2,...,ξn(x1,x2,...,xn)=Fξ1(x1)Fξ2(x2)...Fξn(xn). 其中, Fξ1,ξ2,...,ξn(x1,x2,...,xn)=P{ξ1≤x1,ξ2≤x2,...,ξn≤xn}.
自主習題 8. 證明隨機變數 ξ 與自己獨立, 即 ξ 與 ξ 獨立, 若且唯若 ξ 為常數.
自主習題 9. 問 : 隨機變數 ξ 滿足什麼條件時, ξ 與 sinξ 獨立.
自主習題 10. 設 ξ 和 η 時獨立隨機變數, 且 η=0. 請通過機率 Pξ(x) 和 Pη(y) 的形式表示機率 P{ξη≤z} 和 P{ηξ≤z}.
自主習題 11. 設隨機變數 ξ,η,ζ 滿足 ∣ξ∣≤1,∣η∣≤1,∣ζ∣≤1. 證明 A. G. Bell 不等式 ∣E(ξη)−E(ηζ)∣≤1−E(ξη) 成立.