摘要訊息 : 進一步完善大數法則和由 Chebyshav 不等式得到的估計.
0. 前言
在《【機率論】初等機率論——Bernoulli 概型 : 大數法則》中, 我們介紹了 Chebyshav 不等式, 並且由它導出了大數法則和最小觀測次數. 然而, 我們在導出最小觀測次數的時候, 已經指出最小觀測次數 ⌈4εα1⌉ 是粗略的. 在本篇文章中, 我們將繼續討論, 得到盡可能精確的結論, 並且形成新的定理.
更新紀錄 :
- 2022 年 6 月 12 日進行第一次更新和修正.
1. De Moivre-Laplace 局部極限定理
考慮隨機變數 ξ1,ξ2,...,ξn, 記 Sn=ξ1+ξ2+...+ξn, 有 E(nSn)=p. 由於 Var(Sn)=npq, 而 Var(Sn)=E((Sn−E(Sn))2)=E((Sn−np)2)=E((nSn−np⋅n)2)=E(n2(nSn−np)2)=n2E((nSn−p)2)=npq. 故有 E((nSn−p)2)=npq.
我們已經在大數法則中得到了 nSn 與 p 之間的機率意義. 那麼, 我們自然希望得到 (nSn−p)2 與 npq 的機率意義. 例如, 考慮下面這個機率 P{∣∣∣∣∣nSn−p∣∣∣∣∣≤xnpq},x∈R 如何?
又由於 E(Sn)=np 且 Var(Sn)=npq, 而 npq∣∣∣nSn−p∣∣∣=npq⋅nn∣∣∣nSn−p∣∣∣=npq∣∣∣∣n2nSn−np∣∣∣∣=npq∣Sn−np∣=Var(Sn)∣Sn−E(Sn)∣. 我們又可以考慮 P{∣∣∣∣∣∣Var(Sn)Sn−E(Sn)∣∣∣∣∣∣≤x}, 如果對於 n≥1, 記 Pn(k)=(nk)pkqn−k (k=0,1,2,…,n), 則有 P{∣∣∣∣∣∣Var(Sn)Sn−E(Sn)∣∣∣∣∣∣≤x}={k:npq∣k−np∣≤x}∑Pn(k). 那麼當 n→∞ 時, 機率 Pn(k) 如何?
定理 1. (局部極限定理) 記 Pn(k)=(nk)pkqn−k (k=0,1,2,...,n), 設 0<p<1, 則對滿足 ∣k−np∣=o((npq)32) 的所有 k, 一致有 Pn(k)→2πnpq1e−2npq(k−np)2 (n→∞) 即當 n→∞ 時, {k:∣k−np∣≤φ(n)}sup⎩⎪⎨⎪⎧∣∣∣∣∣∣∣2πnpq1e−2npq(k−np)2Pn(k)−1∣∣∣∣∣∣∣⎭⎪⎬⎪⎫→0. 其中, φ(n) 是任意滿足 φ(n)=o((npq)32) 的非負函數.
證明 :根據 Stering 公式 (《複雜度下界》引理 1), 有 n!=2πnennn(1+R(n)). 其中, 當 n→∞ 時, R(n)→0. 若 n→∞ 時, k→∞,n−k→∞, 則 (nk)=k!(n−k)!n!=2πk×2π(n−k)(ek)k(en−k)n−k(1+R(k))(1+R(n−k))2πn(en)n(1+R(n))=n12πk(n−k)ekkken−k(n−k)n−kennn(1+ε(n,k,n−k))=2πnk(n−k)kk(n−k)n−knn(1+ε(n,k,n−k))=2πnk(n−k)nk(nk)knn−k(1−nk)n−knn(1+ε(n,k,n−k))=2πnnk(1−nk)1×(nk)k(1−nk)n−k1+ε(n,k,n−k). 其中, 當 n→∞,k→∞,n−k→∞ 時, ε(n,k,n−k)→0. 故有 Pn(k)=(nk)pkqn−k=2πnnk(1−nk)(nk)k(1−nk)n−kpk(1−p)n−k(1+ε(n,k,n−k)). 記 p^=nk, 則 Pn(k)=(nk)pkqn−k=2πnp^(1−p^)p^k(1−p^)n−kpk(1−p)n−k(1+ε(n,k,n−k))=2πnp^(1−p^)1+ε(n,k,n−k)(p^p)k(1−p^1−p)n−k=2πnp^(1−p^)1+ε(n,k,n−k)exp{klnp^p+(n−k)ln1−p^1−p}=2πnp^(1−p^)1+ε(n,k,n−k)exp{n(nklnp^p+(1−nk)ln1−p^1−p)}=2πnp^(1−p^)1+ε(n,k,n−k)exp{−nH(p^)}=2πnp^(1−p^)1+ε(n,k,n−k)⋅enH(p^)1. 其中, H(x)=xlnpx+(1−x)ln1−x1−p.
由於 k 滿足 ∣k−np∣=o((npq)32), 故當 k→∞ 時, p−p^→0. 另外, 對於 0<x<1, 有 H′(x)=lnpx−ln1−x1−p,H′′(x)=x1+1−x1,H′′′(x)=−x21+(1−x)21. 將 H(p^) 表示為 H(p+(p^−p)), 根據 Taylor 公式, 當 n 充分大的時候, 有 H(p^)=H(p)+H′(p)(p^−p)+21H′′(p)(p^−p)2+o(∣p^−p∣3)=21(p1+q1)(p^−p)2+o(∣p^−p∣3). 從而有 Pn(k)=2πnp^(1−p^)1+ε(n,k,n−k)exp{−2pqn(p^−p)2+n⋅o(∣p^−p∣3)}. 注意到 2pqn(p^−p)2=2pqn(nk−p)2=2npq(n−kp)2, 故有 Pn(k)→2πnpq1e−2npq(k−np)2(1+ε′(n,k,n−k)). 其中, 1+ε′(n,k,n−k)=1+ε(n,k,n−k)en⋅o(∣p^−p∣3)p^(1−p^)p(1−p). 顯然, 當 n→∞ 時, sup∣ε′(n,k,n−k)∣→0. 因此, 有 Pn(k)→2πnpq1e−2npq(k−np)2 (n→∞). 其中, ∣k−np∣≤φ(n) 且 φ(n)=o((npq)32).
■
推論 1. 對於一切 x∈R, 若 x=o((npq)61), 而 np+xnpq 的結果是集合 {0,1,2,...,n} 中的整數, 則 Pn(np+xnpq)→2πnpq1e−2x2 (n→∞). 即當 n→∞ 時, 有 {x:∣x∣≤ψ(n)}sup⎩⎪⎨⎪⎧∣∣∣∣∣∣∣2πnpq1e−2x2Pn(np+xnpq)−1∣∣∣∣∣∣∣⎭⎪⎬⎪⎫→0. 其中, ψ(x)=o((npq)61).
在大數法則中, 我們曾給出 P{∣∣∣nSn−p∣∣∣≥ε}→0 (n→∞) 以質點游動的解釋. 引入上述理論之後, 我們可以將之前的解釋描述為 P{Sn=k}→2πnpq1e−2npq(k−np)2,∣k−np∣=o((npq)32) 和 P{npqSn−np=x}→2πnpqe−2x21,x=o((npq)61) (I). 其中, P{npqSn−np=x} 中的 np+xnpq∈{0,1,2,...,n}.
若設 tk=npqk−np, Δtk=tk+1−tk=npq1,, 那麼通過置換可以將 (I) 式改寫為, P{Var(Sn)Sn−E(Sn)}=tk→2πΔtke−2tk2,tk=o((npq)61). 顯然, 當 n→∞ 時, Δtk=npq1→0. 根據上述描述, 我們發現 e−2tk2⋅Δtk 與定積分的定義類似, 於是我們自然想到 P{a<Var(Sn)Sn−E(Sn)≤b}=tk→2π1∫abe−2x2dx,−∞<a≤b<+∞. 接下來, 我們將圍繞該式進行表述.
2. De Moivre-Laplace 極限定理
對於 −∞<a≤b<+∞, 設 Pn(a,b]=a<x≤b∑Pn(np+xnpq), 其中求和是針對一切使得 np+xnpq 為整數的 x 求和. 由局部極限定理可見, 對於 k=np+tknpq 決定且滿足 ∣tk∣≤T<+∞ 的 tk, 由推論 1 有 Pn(np+tknpq)→2πtke−2tk2(1+ε(tk,n)). 其中, ∣tk∣≤Tsup∣ε(tk,n)∣→0 (n→∞). 從而對於固定的 a 和 b, 其中 −∞<−T≤a≤b≤T<+∞, 有 a<tk≤b∑Pn(np+tknpq)=a<tk≤b∑2πtke−2tk2+a<tk≤b∑ε(tk,n)2πΔtke−2tk2=2π1∫abe−2x2dx+Rn(1)(a,b)+Rn(2)(a,b). 其中, R1(n)=a<tk≤b∑2πΔtke−2tk2−2π1∫abe−2x2dx,Rn(2)=a<tk≤b∑ε(tk,n)2πΔtke−2tk2. 對於 Rn(1)(a,b), 顯然地, 當 n→∞ 時, −T≤a≤b≤Tsup∣∣∣∣Rn(1)(a,b)∣∣∣∣→0. 為了繼續導出結論, 我們引入數學分析中的一個事實.
引理 1. 2π1∫−∞+∞e−2x2dx=1.
這個引理我們暫時不進行證明.
由於 f(x)=e−2x2 是連續函數且 f(x)>0, 故必有 2π1∫−TTe−2x2dx≤2π1∫−∞+∞e−2x2dx≤1. 因此, −T≤a≤b≤Tsup∣∣∣∣Rn(2)(a,b)∣∣∣∣=−T≤a≤b≤Tsup∣∣∣∣∣∣a<tk≤b∑ε(tk,n)2πΔtke−2tk2∣∣∣∣∣∣=−T≤a≤b≤Tsup∣∣∣∣∣∣a<tk≤b∑ε(tk,n)∣∣∣∣∣∣2πΔtke−2tk2≤∣tk∣≤Tsup∣ε(tk,n)∣∣tk∣≤T∑2πΔtke−2tk2=−T≤a≤b≤Tsup∣ε(tk,n)∣(R1(n)(a,b)+2π1∫abe−2x2dx)=−T≤a≤b≤Tsup∣ε(tk,n)∣−T≤a≤b≤TsupR1(n)(a,b)+2π1∫abe−2x2dx=−T≤a≤b≤Tsup∣ε(tk,n)∣. 所以, 當 n→∞ 時, −T≤a≤b≤Tsup∣∣∣∣Rn(2)(a,b)∣∣∣∣→0.
記 Φ(x)=2π1∫−∞xe−2t2dt, 由上述過程可見 : −T≤a≤b≤Tsup∣Pn(a,b]−(Φ(b)−Φ(a))∣→0 (n→∞). 我們已經證明, 對於有限的 T, 上式成立. 那麼對於 T→∞, 上式是否也成立呢?
顯然, 對於任意給定的 ε>0, 存在有限的 T=T(ε) 使得 2π1∫−TTe−2x2dx>1−4ε. 此時, 對於任意 ε>0, 存在正整數 N, 使得對於一切 n>N 和 T=T(ε), 有 −T≤a≤b≤Tsup∣Pn(a,b]−(Φ(b)−Φ(a))∣<4ε. 結合 P(a,b] 的定義與 21∫−TTe−2x2dx>1−4ε, 必定有 Pn(−T,T]>1−2ε. 而 Pn(−∞,−T]+Pn(−T,T]+Pn(T,+∞)=1. 因此, Pn(−∞,−T]+Pn(T,+∞)≤2ε. 其中, Pn(−∞,T]=S→−∞limPn(S,T],Pn(T,+∞)=S→+∞limPn(T,S]. 這樣, 對於任意 −∞<a≤−T≤T≤b<+∞, 根據絕對值不等式 (《【數學分析】實數——實數的四則運算》定理 3), 有 ∣∣∣∣∣∣Pn(a,b]−2π1∫abe−2x2dx∣∣∣∣∣∣=∣∣∣∣∣∣(Pn(a,−T)−2π1∫a−Te2x2dx)+ (Pn(−T,T]−2π1∫−TTe−2x2dx)+ (Pn(T,b]−2π1∫Tbe−2x2dx)∣∣∣∣∣∣≤∣∣∣∣∣∣Pn(a,−T]−2π1∫a−Te−2x2dx∣∣∣∣∣∣+ ∣∣∣∣∣∣Pn(−T,T]−2π1∫−TTe−2x2dx∣∣∣∣∣∣+ ∣∣∣∣∣∣Pn(T,b]−2π1∫Tbe2x2dx∣∣∣∣∣∣. 顯然地, 我們有 Pn(a,−T]≤Pn(−∞,−T],Pn(T,b]≤Pn(T,+∞). 除此之外, 根據絕對值不等式, 我們又得 ∣∣∣∣∣∣Pn(a,−T]−2π1∫a−Te2x2dx∣∣∣∣∣∣≤∣Pn(a,−T]∣+∣∣∣∣∣∣2π∫a−Te−2x21dx∣∣∣∣∣∣ 和 ∣∣∣∣∣∣Pn(T,b]−2π1∫Tbe2x2dx∣∣∣∣∣∣≤∣Pn(a,−T]∣+∣∣∣∣∣∣2π∫a−Te−2x21dx∣∣∣∣∣∣. 因此, ∣∣∣∣∣∣Pn(a,b]−2π1∫abe−2x2dx∣∣∣∣∣∣≤∣Pn(−∞,−T]∣+2π1∫−∞−Te−2x2dx+ ∣Pn(T,+∞)∣+2π1∫T+∞e−2x2dx+ ∣∣∣∣∣∣Pn(−T,T]−2π1∫−TTe−2x2dx∣∣∣∣∣∣. 因為 Pn(−∞,−T]≥0,Pn(T,+∞)≥0, 於是 ∣∣∣∣∣∣Pn(a,b]−2π1∫abe−2x2dx∣∣∣∣∣∣≤Pn(−∞,−T]+2π1∫−∞−Te−2x2dx+ Pn(T,+∞)+2π1∫T+∞e−2x2dx+ ∣∣∣∣∣∣Pn(−T,T]−2π1∫−TTe−2x2dx∣∣∣∣∣∣. 由於 2π1∫−∞−Te−2x2dx+2π1∫−TTe−2x2dx+2π1∫T+∞e−2x2dx=1 且 2π1∫−TTe−2x2dx>1−4ε, 則 2π1∫−∞−Te−2x2dx+2π1∫T+∞e−2x2dx≤4ε. 結合 Pn(−∞,−T]+P(T,+∞)≤2ε, 那麼 ∣∣∣∣∣∣Pn(a,b]−2π1∫abe2x2dx∣∣∣∣∣∣≤2ε+4ε+∣∣∣∣∣∣Pn(−T,T]−2π1∫−TTe2x2dx∣∣∣∣∣∣=43ε+∣∣∣∣∣∣Pn(−T,T]−2π1∫−TTe2x2dx∣∣∣∣∣∣. 對於 ∣∣∣∣Pn(−T,T]−2π1∫−TTe2x2dx∣∣∣∣, 我們已經知道 Pn(−T,T]≥1−2ε,2π1∫−TTe−2x2dx≥1−4ε, 故 Pn(−T,T]−2π1∫−TTe2x2dx≥−4ε. 不等式兩側取負, 不等式變號, 得到 −(Pn(−T,T]−2π1∫−TTe2x2dx)≤4ε. 不等式兩側取絕對值, 有 ∣∣∣∣∣∣Pn(−T,T]−2π1∫−TTe2x2dx∣∣∣∣∣∣≤4ε. 綜上所述, ∣∣∣∣∣∣Pn(a,b]−2π1∫abe−2x2dx∣∣∣∣∣∣≤43ε+4ε=ε. 對於等號, 我們只需要適當放大 ε, 即可得到對於任意 ε>0, 存在正整數 N, 當 n>N 時, 有 ∣∣∣∣∣∣Pn(a,b]−2π1∫abe−2x2dx∣∣∣∣∣∣<ε. 根據極限的定義, 有 n→∞limPn(a,b]=2π1∫abe−2x2dx. 我們總結一下上面的討論.
定理 2. (De Moivre - Laplace 積分定理) 設 0<p<1, Pn(k)=(nk)pkqn−k,Pn(a,b]=a<x≤b∑Pn(np+xnpq) 那麼 −∞<a≤b<+∞sup{∣∣∣∣∣∣Pn(a,b]−2π1∫abe2x2dx∣∣∣∣∣∣}→0 (n→∞).
在大數法則中, 我們得到的 P{∣∣∣nSn−p∣∣∣≥ε}→0 (n→∞) 可以更精確地表示為 −∞<a<b<+∞sup{∣∣∣∣∣∣P{a<Var(Sn)Sn−E(Sn)≤b}−2π1∫abe−2x2dx∣∣∣∣∣∣}→0 (n→∞). 由此可見, 對於任意 −∞<A<B<+∞, 有 P{A<Sn≤B}−(Φ(npqB−np)−Φ(npqA−np))→0 (n→∞).
例題 1. 將規則的骰子擲 12000 次. 問 : "6 點" 出現在次數區間 (1800,2100] 次的機率如何?
解 :根據前面的討論, 我們可以寫出 P12000(k)=1800<x≤2100∑(12000k)(61)k(65)k≐Φ(npqB−np)−Φ(npqA−np)≐0.992. 其中, A=1800,B=2100,n=12000,p=61,q=65,Φ(x)=2π1∫−∞xe−2t2dt.
■
把二項機率 Pn(np+xnpq) (僅考慮能夠使得 np+xnpq 取非負整數的 x) 標在圖上 :
Figure 1. Pn(np+xnpq)
那麼局部定理表明, 對於 x=o((npq)61), 機率 Pn(np+xnpq) 的值比較好地位於函數 f(x)=2πnpq1e−2x2 的曲線上. 由積分定理可知, 機率 Pn(a,b]=P{anpq<Sn−np≤bnpq}=P{np+anpq<Sn≤np+bnpq} 的值可以較好地由積分 2π1∫abe−2x2dx 逼近.
記 Fn(x)=Pn(−∞,x]=P{npqSn−np≤x}. 由 −∞<a<b<+∞sup∣∣∣∣∣∣Pn(a,b]−2π1∫abe−2x2dx∣∣∣∣∣∣→0 (n→∞) 可見 : −∞<x<+∞sup∣Fn(x)−Φ(x)∣→0 (n→∞). 那麼隨著 n 的增長, −∞<a≤b<+∞sup∣∣∣∣Pn(a,b]−2π1∫abe2x2dx∣∣∣∣ 和 −∞<x<+∞sup∣Fn(x)−Φ(x)∣ 兩式趨向於 0 的速度如何? 這裡直接引用 A.C. Berry - C.G. Esseen 定理的特殊情形 : −∞<x<+∞sup∣Fn(x)−Φ(x)∣≤npqp2+q2. 要特別強調的是, 估計 npq1 的量級不能再提高了. 這裡指的是當 p 的值接近於 0 或者 1 的時候, 甚至對於充分大的 n, 用函數 Φ(x) 來逼近 Fn(x) 的效果也可能不太好. 因此, 產生了一個問題 : 當 p 或者 q 比較小的時候, 能否找到一個比局部定理和積分定理給出的更好的逼近呢? 為此, 我們指出, 當 p=21 時, 二項分佈 {Pn(k)} 具有對稱的形狀. 不過當 p 比較小的時候, 二項分佈的形狀不是對稱的, 不能指望用常態逼近有好的結果.
3. Poisson 定理
定理 3. (Poisson 定理) 設 Pn(k)={(nk)pkqn−k0k=0,1,2,…,nk=n+1,n+2,…. 其中, p 是關於 n 的函數, 即 p=p(n). 當 n→∞ 時, p(n)→0 且 np(n)→λ. 其中, λ>0. 那麼, 對於任意 k=0,1,2,..., 有 Pn(k)→πk=k!λke−λ.
證明 :根據條件, 我們構造 p(n)=nλ+o(n1). 因此, 對於固定的 k=0,1,2,... 和充分大的 n, Pn(k)=(nk)pkqn−k=k!(n−k)!n!pkqn−k=k!n(n−1)...(n−k−1)(nλ+o(n1))k(1−(nλ+o(n1)))n−k=k!1⋅nkn(n−1)...(n−k−1)(λ+o(1))k(1−(nλ+o(n1)))n−k. 對於 nkn(n−1)...(n−k−1), 有 nk(n−k−1)⋅(n−k−1)⋅...⋅(n−k−1)k 個≤nkn(n−1)...(n−k−1)≤nkn⋅n⋅...⋅nk 個. 由於 n→∞limnk(n−k−1)k=n→∞limnknk+i=1∑k(ki)ni(1−k)k−i=1 且 n→∞limnknk=1, 由夾擠定理可知 n→∞limnkn(n−1)...(n−k−1)=1. 那麼當 n→∞ 時, k!1⋅nkn(n−1)...(n−k−1)(λk+o(1))k→λk. 而n→∞lim(1−(nλ+o(n1)))n−k=n→∞lim(1−nλ+o(n1))n−k=n→∞lim(1+(o(n1)−nλ))n−k=n→∞lim(1+(o(n1)−nλ))(n−k)o(n1)−nλo(n1)−nλ=en→∞lim(n−k)(o(n1)−nλ)=en→∞lim(n−k)⋅o(n1)−(n−k)nλ=en→∞lim−(n−k)nλ=en→∞lim−λ+nkλ=e−λ. 故當 n→∞ 時, Pn(k)→k!λke−λ.
綜上所述, 當 n→∞ 時, p(n)→0 且 np(n)→λ. 其中, λ>0. 那麼, 對於任意 k=0,1,2,..., 有 Pn(k)→πk=k!λke−λ.
■
序列 {πk,k=0,1,2,...} 滿足 πk>0 且 k=0∑∞πk=1, 因此可以作為機率分佈, 我們稱之為 Poisson 分佈 (Posson distribution). 之前所討論的所有分佈都是集中在有限個點上, Poisson 分佈時目前遇到的第一個集中在無限個點上的機率分佈.
和之前一樣, 我們仍然考慮當 n→∞ 時, 機率 Pn(k) 收斂於 πk 的速度如何? 這裡直接給出一個不經證明的結論 : 若 np(n)=λ, 則 k=0∑∞∣Pn(k)−πk∣≤n2λmin{2,λ}.
4. De Moivre - Laplace 極限定理和大數法則
De Moivre - Laplace 極限定理和大數法則都是建立在 Bernoulli 概型上的, 那麼是否可以由 De Moivre - Laplace 極限定理導出大數法則呢?
因為 P{∣∣∣∣∣nSn−p∣∣∣∣∣≤ε}=P{∣∣∣∣∣nSn−np∣∣∣∣∣≤ε}=P{n⋅n∣Sn−np∣≤ε}=P{n⋅n⋅pq∣Sn−np∣≤pqε}=P{npq∣Sn−np∣≤pqnε}=P{∣∣∣∣∣npqSn−np∣∣∣∣∣≤pqnε}=P{−εpqn≤npqSn−np≤εpqn}, 根據 De Moivre - Laplace 極限定理, 當 n→∞ 時, 有 P{∣∣∣∣∣nSn−p∣∣∣∣∣≤ε}→2π1∫−εpqnεpqne−2x2dx→2π1∫−∞+∞e−2x2dx→1. 即 P{∣∣∣nSn−p∣∣∣≤ε}→1. 這便是大數法則.
由上述的討論, 我們可以得到 P{∣∣∣∣∣nSn−p∣∣∣∣∣≤ε}→2π1∫−∞+∞e−2x2dx (n→∞). 然而, Chebyshev 不等式只能給出下面的估計 P{∣∣∣∣∣nSn−p∣∣∣∣∣≤ε}≥1−nε2pq. 在大數法則中, 為了得到使得 P{∣∣∣∣∣nSn−p∣∣∣∣∣≤ε}≥1−α 成立所需要的觀測次數, 我們由 Chebyshev 不等式得到了下面的估計 : n≥⌊4ε2α1⌋=n1(α). 現在, 我們可以通過 De Moivre - Laplace 極限定理得到更精確的估計. 我們由方程式 2π1∫−k(α)k(α)e−2x2dx=1−α 求得 k(α). 由於 εpqn≥2εn 且根據不等式 2εn≥k(α) 求出最小整數, 得到 P{∣∣∣∣∣nSn−p∣∣∣∣∣≤ε}≥1−α. 由 2εn≥k(α) 可見 n=n2(α)=⌊4ε2k2(α)⌋ 可以保證 P{∣∣∣nSn−p∣∣∣≤ε}≥1−α 成立, 其逼近精度可以由 −∞<x<+∞sup∣Fn(x)−Φ(x)∣≤npqp2+q2 得到.
例題 2. 設 ε=0.02, α=0.05. 則基於 Chebyshev 不等式的估計觀測次數為 12500 次, 而基於極限定理的估計觀測次數為 2500 次.
5. 常態分佈
在 De Moivre - Laplace 積分定理中引入的函數 Φ(x)=2π1∫−∞xe−2t2dt 在機率輪中有很大的作用, 稱為常態分佈函數 (normal distribution function) 或者 Gauss 分佈函數 (Gauss distribution function). 其導數 φ(x)=2π1e−2x2,x∈R 稱為常態密度函數 (normal density function) 或者 Gauss 密度函數 (Gauss density function).
常態分佈屬於機率輪中另一種類型的分佈——連續分佈, 而我們之前討論的都是離散型分佈. 在相當一般的條件下, 大量獨立隨機變數 (未必是 Bernoulli 隨機變數) 之和的分佈可以很好地使用常態分佈來逼近.
函數 φ(x)=2π1e−2x2 的圖形關於縱軸對稱, 且隨著 ∣x∣→∞ 而趨於 0. 而函數 Φ(x)=2π1∫−∞xe−2t2dt 隨著 x→+∞ 而趨於 1, 隨著 x→−∞ 而趨於 0.
除了 Φ(x) 之外, 我們還經常使用誤差函數 : erf(x)=π2∫0xe−t2dt,x>0. 顯然, 對於 x>0, 有 Φ(x)=21(1+erf(2x)) 和 erf(x)=2Φ(2x)−1.
6. 成功頻率對機率的偏差滿足一定要求的試驗次數
在大數法則中, 我們曾指出, 由 Chebyshev 不等式給出的事件 {ω:∣∣∣nSn−p∣∣∣≥ε} 機率的估計是相當粗略的. 這一估計對於非負隨機變數 X, 是由 Chebyshev 不等式 P{X≥ε}≤ε2E(X2) 得到的. 不過可以利用 Chebyshev 不等式的另一種形式 : P{X≥ε}=P{X2k≥ε2k}≤ε2kE(X2k). 然而, 還可以更進一步, 利用 Chebyshev 不等式的指數形式 : 對於 X≥0 和 λ>0, P{X≥ε}=P{eλx≥ελx}≤eλεE(eλx)=E(eλε)E(eλx)=E(eλεeλx)=E(eλ(X−ε)). 由於 λ>0 的任意性, 可見 P{X≥ε}≤λ>0infE(eλ(X−ε)).
接下來, 我們討論當 X=nSn,Sn=ξ1+ξ2+...+ξn,P{ξi=1}=p,P{ξi=0}=q,i=1,2,...,n 時, 沿此路徑將會導致的結果.
記 φ(λ)=E(eλξ1), 則 φ(λ)=eλξ1∣∣∣ξ1=0P{ξ1=0}+eλξ1∣∣∣ξ1=1P{ξ1=1}=1×q+eλ×p=1−p+peλ. 對於兩兩獨立的隨機變數 ξ1,ξ2,...,ξn, 則有 E(eλSn)=E(eλ(ξ1+ξ2+...+ξn))=E(eλξ1+λξ2+...+λξn)=E(eλξ1eλξ2...eλξn)=E(eλξ1)E(eλξ2)...E(eλξn)=en(eλξ1)=φn(λ). 因此, 對於 0<a<1, 根據 Chebyshev 不等式的指數形式, 有 P{nSn≥a}≤λ>0infE(eλ(nSn−a))=λ>0infE(e(nλSn−λa))=λ>0infE(eλaenλSn)=λ>0infeλaE(enλSn)=λ>0infeλaφn(nλ)=λ>0infe−λa⋅φn(nλ)=λ>0infe−λaelnφn(nλ)=λ>0infe−λa+nlnφ(nλ)=λ>0infe−n(nλa−lnφ(nλ))=λ>0infe−n(aμ−lnφ(μ))=e−nμ>0supaμ−lnφ(μ). 其中, μ=nλ. 類似地, 也有 P{nSn≤a}≤e−nμ<0supaμ−lnφ(μ). 當 p≤a≤1 時, 記函數 f(x)=ax−ln(1−p+pex), 則 f′(x)=a−1−p+pe2pex. 令 f′(x)=0, 得 ex=p(1−a)a(1−p). 若 x=x0 使得 f(x) 取得最大值, 則點 x0 滿足 ex0=p(1−a)a(1−p). 因此, μ>0supf(μ)=H(a). 其中, H(a)=alnpa+(1−a)ln1−p1−a. 這樣, 當 p≤a≤1 時, P{nSn≥a}≤e−nμ>0supf(μ)=e−nH(a). (II) 而由於 H(p+x)≥2x2,0≤p+x≤1, 那麼對於任何 ε>0 和 0≤p≤1, 有 P{nSn−p≥ε}≤e−2nε2. (III) 類似可得, 當 a≤p≤1 時, P{nSn≤a}≤e−nH(a). (IV) 從而對於任意 ε>0 和 0≤p≤1, 有 P{nSn−p≤−ε}≤e−2nε2. (V) 於是, P{∣∣∣nSn−p∣∣∣≤ε}≤2e−2nε2. 由此可見, 對於任意 0≤p≤1, 保證不等式 P{∣∣∣∣∣nSn−p∣∣∣∣∣≤ε}≥1−α 成立的估計觀測次數 n3(α) 決定於 n3(α)=⌊2ε2lnα2⌋. 若不取整數部分, 直接將 n3(α) 於 n1(α)=⌊4αε21⌋ 比較可見 : n3(α)n1(α)=2ε2lnα24αε21=2αlnα21→+∞ (α→0+). 由此可見, 當 α→0+ 時, 由 Chebyshev 不等式的指數形式估計最小必須要觀測的次數, 比用一般的 Chebyshev 不等式估計的次數更加精確, 特別是對於比較小的 α.
利用數學分析中的結論 x→−∞lim2π1∫x+∞e−2t2dt=2πx1e−2x2, 可以證明當 α→o+ 時, k2(α)→2lnα2. 於是有 α→0+limn3(α)n2(α)=1. 式 (II),(III),(IV),(V) 和式 P{∣∣∣∣∣nSn−p∣∣∣∣∣≤ε}≤2e−2nε2 (VI) 合稱為大偏差機率的不等式 (inequalities for the probability of large deviations). 利用 De Moivre - Laplace 定理, 可以簡單地對事件 {∣Sn−np∣≤xn} 的機率進行估計. 此事件表示 Sn 對 np (數量級為 n) 的標準離差 (standard deviation). 而不等式 (III),(V) 和 (VI) 對 {∣Sn−np∣≤xn} 給出的估計描繪量級大於 n 的離差, 其數量級為 n.
7. 練習題
自主習題 1. 設 p=21, 而 Zn=2Sn−n (n 組試驗中的 1 比 0 多出的數量). 證明 : jsup∣∣∣∣∣πnP{Z2n=j−e−4nj2}∣∣∣∣∣→0 (n→∞).
自主習題 2. 證明 : Poisson 定理對於 p=nλ 的收斂速度為 ksup∣∣∣∣∣Pn(k)−k!λke−λ∣∣∣∣∣≤nλ2.