標籤:

迷人的概率論 【轉自:善科網】

迷人的概率論

王壽仁

關鍵詞: 概率論,隨機過程

概率論,研究隨機現象數量規律的數學分支學科。隨機現象是指這樣的客觀現象,當人們觀察它時,所得的結果不能預先確定,而只是多種可能結果中的一種。在自然界和人類社會中,存在著大量的隨機現象。例如,擲一硬幣,可能出現正面或反面;測量一物體長度,由於儀器及觀察受到環境的影響,每次測量結果可能有差異;在同一工藝條件下生產出的燈泡,其壽命長短參差不齊,等等。典型的隨機實驗有擲骰子、扔硬幣、抽撲克牌以及輪盤遊戲等。

數學家和精算師認為概率是在0至1之間之閉區間的數字,指定給一發生與失敗是隨機的「事件」。概率P(A)根據概率公理來指定給事件A。

一事件A在一事件B確定發生後會發生的概率稱為B給之A的條件概率;其數值為P(B∩A)P(A) (當P(A)不等於零時)。若B給之A的條件概率和A的概率相同時,則稱A和B為獨立事件。且A和B的此一關係為對稱的,這可以由一同價敘述:「P(A∪B)=P(A)(B) ,當A和B為獨立事件時。」中看出。

概率論中的兩個重要概念為隨機變數和隨機變數之概率分布這兩種概念。

在實際中,人們往往還需要研究在時間推進中某一特定隨機現象的演變情況,描述這種演變的就是概率論中的隨機過程。例如,某一電話交換台從一確定時刻起到其後的每一時刻為止所收到的呼喚次數便是一隨機過程。又如,微小粒子在液體中因受周圍分子的隨機碰撞而形成不規則的運動(即布朗運動)也是一隨機過程。研究隨機過程的統計特性,計算與過程有關的某些事件的概率,特別是研究與過程樣本軌道(即過程的一次實現)有關的問題,是現代概率論的主要課題。總之,概率論與實際有著密切的聯繫,它在自然科學、技術科學、社會科學、軍事和工農業生產中都有廣泛的應用。概率論還是數理統計學的理論基礎。

發展簡史

概率論有悠久的歷史,它的起源與博弈問題有關。16世紀,義大利的一些學者開始研究擲骰子等賭博中的一些簡單問題,例如比較擲兩個骰子出現總點數為9或10的可能性大小。17世紀中葉,法國數學家B.帕斯卡、P.de費馬及荷蘭數學家C.惠更斯基於排列組合的方法研究了一些較複雜的賭博問題,他們解決了「合理分配賭注問題」(即「得分問題」)、「輸光問題」等等。其方法不是直接計算賭徒贏局的概率,而是計算期望的贏值,從而導致了現今稱之為數學期望的概念(由惠更斯明確提出)。使概率論成為數學的一個分支的真正奠基人則是瑞士數學家雅各布·伯努利,他建立了概率論中第一個極限定理,即伯努利大數律;該定理斷言:設事件A的概率P(A)=p,其中0 < p < 1。若ηn 表示前n次獨立重複試驗中事件A出現的次數,從而σn/n 為事件A出現的頻率,則當n→∞ 時,

雅各布·伯努利(Jakob Bernoulli?, 1654-1705) 高斯(C. F. Gauss, 1777-1855)

P(∣∣ηnn?p∣∣≥ε)→0

式中ε 為任一正實數。這一結果發表於他死後8年(1713)出版的遺著《推測術》(Ars conjectandi)中。這裡所說的事件的概率,應理解為事件發生的機會的一個測度,即公理化概率測度。1716年前後,A.棣莫弗對p=1/2情形,用他導出的關於n!的漸近公式(n!≈2π??√nn+1/2e?n ,即所謂斯特林公式)進一步證明了(ηn?np)/np(1?p)????????√ 漸近地服從正態分布(德國數學家C.F.高斯於1809年研究測量誤差理論時重新導出正態分布,所以也稱為高斯分布)。

棣莫弗的這一結果後來被法國數學家P.-S.拉普拉斯推廣到一般的p(0 < p < 1)的情形,後世稱之為棣莫弗-拉普拉斯極限定理,這是概率論中第二個基本極限定理的原始形式。拉普拉斯對概率論的發展貢獻很大。他在系統總結前人工作的基礎上,寫出了《概率的分析理論》(1812年出版,後又再版6次)。在這一著作中,他首次明確規定了概率的古典定義(通常稱為古典概率),並在概率論中引入了更有力的分析工具,如差分方程、母函數等,從而實現了概率論由單純的組合計算到分析方法的過渡,將概率論推向一個新的發展階段。拉普拉斯非常重視概率論的實際應用,對人口統計學尤其感興趣。

棣莫弗(Abraham De Moivre, 1667-1754) 拉普拉斯(Pierre-Simon Laplace, 1749-1827)

繼拉普拉斯以後,概率論的中心研究課題是推廣和改進伯努利大數律及棣莫弗-拉普拉斯極限定理。在這方面,俄國數學家∏.Л.切比雪夫邁出了決定性的一步,1866年他用他所創立的切比雪夫不等式建立了有關獨立隨機變數序列的大數律。次年,又建立了有關各階絕對矩一致有界的獨立隨機變數序列的中心極限定理;但其證明不嚴格,後來由Α.Α.馬爾可夫於1898年補證。1901年Α.М.李亞普諾夫利用特徵函數方法,對一類相當廣泛的獨立隨機變數序列,證明了中心極限定理。他還利用這一定理第一次科學地解釋了為什麼實際中遇到的許多隨機變數近似服從正態分布。

繼李亞普諾夫之後,Α.Я.辛欽、Α.Η.柯爾莫哥洛夫、P.萊維及W.費勒等人在隨機變數序列的極限理論方面作出了重要貢獻。到20世紀30年代,有關獨立隨機變數序列的極限理論已臻完備。在此期間,由於實際問題的需要,特別是受物理學的刺激,人們開始研究隨機過程。

馬爾可夫(A.A.Markov, 1856-1922) 柯爾莫哥洛夫(Andrey N. Kolmogorov, 1903-1987)

1905年A.愛因斯坦和R.斯莫盧霍夫斯基各自獨立地研究了布朗運動。他們用不同的概率模型求得了運動質點的轉移密度。但直到1923年,N.維納才利用三角級數首次給出了布朗運動的嚴格數學定義,並證明了布朗運動軌道的連續性。1907年馬爾可夫在研究相依隨機變數序列時,提出了現今稱之為馬爾可夫鏈的概念;而馬爾可夫過程的理論基礎則由柯爾莫哥洛夫在1931年所奠定。稍後一些時候,辛欽研究了平穩過程的相關理論(1934)。所有這些關於隨機過程的研究,都是基於分析方法,即將概率問題化為微分方程或泛函分析等問題來解決。從1938年開始,萊維繫統深入地研究了布朗運動,取得了一系列重要成果,他充分利用概率的直覺性,將邏輯與直覺結合起來,倡導了研究隨機過程的一種新方法,即概率方法。這種方法的特點是著眼於隨機過程的軌道性質。萊維對概率論的另一重要貢獻是建立了獨立增量過程的一般理論。他的著作《隨機過程與布朗運動》(1948)至今仍是隨機過程理論的一本經典著作。現代概率論的另外兩個代表人物是J.L.杜布和伊藤清,前者創立了鞅論,後者創立了布朗運動的隨機積分理論。

在概率發展史中特別值得一提的是柯爾莫哥洛夫在1933年建立了概率論的公理化體系。

概率論公理化體系的建立

早在拉普拉斯給出概率的古典定義之前,人們就提出了幾何概率的概念,這是研究有無窮多個可能結果的隨機現象問題的,著名的布豐(曾譯蒲豐)投針問題(1777)就是幾何概率的一個早期例子。19世紀,幾何概率逐步發展起來。但到19世紀末,出現了一些自相矛盾的結果。幾何概率這類問題說明了拉普拉斯關於概率的古典定義帶有很大的局限性。當嚴密的概率公理化系統建立後,幾何概率才能健康地發展且有廣泛的應用。

布豐投針問題投擲:500顆針後的分布

雖然到了19世紀下半葉,概率論在統計物理學中的應用及概率論的自身發展已突破了概率的古典定義,但關於概率的一般定義則始終未能明確化和嚴格化。這種情況既嚴重阻礙了概率論的進一步發展和應用,又落後於當時數學的其他分支的公理化潮流。1900年,D.希爾伯特在世界數學家大會上公開提出了建立概率論公理化體系的問題,最先從事這方面研究的是龐加萊、波萊爾及С.Η.伯恩斯坦。關於概率論與測度論有聯繫這一重要思想就出自波萊爾。伯恩斯坦於1917年構造了概率論的第一個公理化體系。20年代以後,相繼出現了J.M.凱恩斯及R.von米澤斯等人的工作。凱恩斯主張把任何命題都看作是事件。例如,「明天將下雨」,「土星上有生命」,「某出土文物是某年代的產品」,等等。他把一事件的概率看作是人們根據經驗對該事件的可信程度,而與隨機試驗沒有直接聯繫,因此,通常稱為主觀概率。從凱恩斯起,對主觀概率提出了幾種公理體系,但沒有一種堪稱權威。也許,主觀概率的最大影響不在概率論領域自身,而在數理統計學中近年來出現的貝葉斯統計學派。和主觀概率學派相對立的是以米澤斯為代表的概率的頻率理論學派。米澤斯把一事件的概率定義為該事件在獨立重複隨機試驗中出現的頻率的極限,並把此極限的存在性作為他的第一條公理。他的第二條公理是,對隨機選取的子試驗序列,事件出現的頻率的極限也存在並且極限值相等。

布豐(Georges Louis Leclere de Buffo,1707—1788) 波萊爾(Emile Borel, 1871-1956)

嚴格說來,這第二條公理沒有確切的數學含義。因此,這種所謂公理化在數學上是不可取的。此外,象某個事件在一獨立重複試驗序列中出現無窮多次這一事件的概率,在米澤斯理論中是無法定義的。這種頻率法的理論依據是強大數律,它具有較強的直觀性,易為實際工作者和物理學家所接受。但隨著科學的進步,它又已逐漸被絕大多數物理學家所拋棄。

20世紀初完成的勒貝格測度和勒貝格積分理論以及隨後發展起來的抽象測度和積分理論,為概率論公理體系的確立奠定了理論基礎。人們通過對概率論的兩個最基本的概念即事件與概率的長期研究,發現事件的運算與集合的運算完全類似,概率與測度有相同的性質。到了30年代,隨著大數律研究的深入,概率論與測度論的聯繫愈來愈明顯。例如強、弱大數律中的收斂性與測度論中的幾乎處處收斂及依測度收斂完全類似。在這種背景下,柯爾莫哥洛夫於1933年在他的《概率論基礎》一書中第一次給出了概率的測度論式的定義和一套嚴密的公理體系。這一公理體系著眼於規定事件及事件概率的最基本的性質和關係,並用這些規定來表明概率的運演算法則。它們是從客觀實際中抽象出來的,既概括了概率的古典定義、幾何定義及頻率定義的基本特性,又避免了各自的局限性和含混之處。這一公理體系一經提出,便迅速獲得舉世的公認。它的出現,是概率論發展史上的一個里程碑,為現代概率論的蓬勃發展打下了堅實的基礎。

現代概率論的內容

由於科學技術中許多實際問題的推動以及概率論邏輯基礎的建立,概率論從20世紀30年代以來得到了迅速的發展。

目前其主要研究內容大致可分為極限理論,獨立增量過程,馬爾可夫過程,平穩過程和時間序列,鞅和隨機微分方程,點過程等。此外,包括組合概率(用組合數學方法解決只涉及有限個基本事件的概率問題)、幾何概率等在內的一些屬於古典範疇的問題,至今仍有人在繼續研究,並有新的發展。

極限理論是研究與隨機變數序列或隨機過程序列的收斂性有關的問題的理論。20世紀30年代以後,有關隨機變數序列的極限理論(主要是中心極限定理)的研究,是將獨立序列情形的結果推廣到鞅差序列和更一般的弱相依序列等情形,以及研究收斂速度問題。近年來,由於統計力學的需要,人們開始研究強相依隨機變數序列的非中心極限定理。

自1951年M.唐斯克提出不變原理後,有關隨機過程序列的弱收斂的研究成了極限理論的一個中心課題。ю.Β.普羅霍洛夫及A.B.斯科羅霍德在這方面作出了最主要的貢獻。1964年V.斯特拉森的工作出現後,引起了有關隨機過程序列的強收斂的研究,這就是強不變原理。近年來,鞅論方法已滲透到這一領域,使許多經典結果的證明得到簡化和統一處理,並且還導致一些新的結果。

人們最早知道的獨立增量過程是在物理現象中觀察到的布朗運動和泊松過程,一般的獨立增量過程的研究,歸功於萊維,它在20世紀40年代已臻成熟。在這些研究中,包含了許多重要的方法和概念,概率論的許多近代研究課題都直接或間接地受其啟發與影響。

在實際中遇到的很多隨機現象有如下的共同特性:它的未來的演變,在已知它目前狀態的條件下與以往的狀況無關。描述這種隨時間推進的隨機現象的演變模型就是馬爾可夫過程。

20世紀50年代以前,研究馬爾可夫過程的主要工具是微分方程和半群理論(即分析方法);1936年前後就開始探討馬爾可夫過程的軌道性質,直到把微分方程和半群理論的分析方法同研究軌道性質的概率方法結合運用,才使這方面的研究工作進一步深化,並形成了對軌道分析必不可少的強馬爾可夫性概念。1942年,伊藤清用他創立的隨機積分和隨機微分方程理論來研究一類特殊而重要的馬爾可夫過程──擴散過程,開闢了研究馬爾可夫過程的又一重要途徑。近年來,鞅論方法也已滲透到馬爾可夫過程的研究中,它與隨機微分方程結合在一起,已成為目前處理多維擴散過程的工具。此外,馬爾可夫過程與分析學中的位勢論有密切的聯繫。對馬爾可夫過程的研究,推動了位勢理論的發展,並為研究偏微分方程提供了概率論的方法。最近十多年發展起來的吉布斯隨機場和無窮粒子隨機系統,是由於統計物理的需要而提出的。

《金融模型中的鞅理論》

許多自然的和生產過程中的隨機現象表現出某種平穩性。一種平穩性是過程在任意一些時刻上的聯合概率分布隨時間推移不變,這種平穩性稱為嚴平穩性。平穩過程的研究與遍歷理論有密切的聯繫。如果上述對概率分布的要求放寬為僅對二階相關矩的要求,即過程在任意兩時刻上的協方差隨時間推移不變,則稱這種平穩性為寬平穩性。關於寬平穩過程的研究,辛欽、柯爾莫哥洛夫和維納等人運用傅里葉分析和泛函分析的工具,在40年代已經找出了過程的相關函數及過程本身的譜分解式,並且較完滿地解決了有應用意義的預測問題。許多應用問題還要求根據觀測數據去建立這些數據所來自的隨機過程的模型。為此產生了時間序列分析這一課題,提出了寬平穩序列的自回歸滑動平均(ARMA)模型以及一些非線性模型。

鞅是另一類重要的隨機過程。從20世紀30年代起,萊維等人就開始研究鞅序列,把它作為獨立隨機變數序列的部分和的推廣。40年代到50年代初,杜布對鞅進行了系統的研究,得到有名的鞅不等式、停止定理和收斂定理等重要結果。1962年,P.A.邁耶解決了杜布提出的連續時間的上鞅分解為鞅及增過程之差的問題。在解決這個問題的過程中,出現了很多新鮮而深刻的概念,使鞅和隨機過程一般理論的內容大大豐富起來。鞅的研究豐富了概率論的內容,並引起人們用它所提供的新方法新概念對概率論中許多經典的內容重新審議,把以往認為是複雜的東西納入鞅論的框架而加以簡化。此外,利用上鞅的分解定理,可以把伊藤清的對布朗運動的隨機積分推廣到對一般鞅乃至半鞅的隨機積分;因而,更一般的隨機微分方程的研究也隨之發展。隨機微分方程理論不僅可以用來研究馬爾可夫過程,它還是解決濾波問題的必要工具。最近出現的流形上的隨機微分方程又和微分幾何及分析力學的研究發生了密切的聯繫。鞅論還對本學科以外的位勢理論、調和分析及複變函數論等提供了有用的工具。

點過程是從所謂計數過程發展出來的,它們的特點是,可用落在不相重疊的集合上的隨機點數目的聯合概率分布來刻畫整個過程的概率規律。最基本的計數過程是泊松過程,1943年,C.帕爾姆將它作為最簡單的輸入流應用於研究電話業務問題;1955年,辛欽又以嚴密的數學觀點作了整理和發展。

在60年代以前,點過程的研究主要限於泊松過程及其推廣的過程。以後,由於大量實際問題的需要以及隨機測度論和現代鞅論的推動,進一步把實軸上的點過程(即計數過程)推廣到一般的可分完備度量空間上,在內容和方法上都有根本性的進展。

現代概率論的應用

隨機引起的流體力學的湍流

概率論的發展史說明了理論與實際之間的密切關係。許多研究方向的提出,歸根到底是有其實際背景的。反過來,當這些方向被深入研究後,又可指導實踐,進一步擴大和深化應用範圍。概率論作為數理統計學的理論基礎是盡人皆知的。下面簡略介紹一下概率論本身在各方面的應用情況。

在物理學方面,高能電子或核子穿過吸收體時,產生級聯(或倍增)現象,在研究電了-光子級聯過程的起伏問題時,要用到隨機過程,常以泊松過程、弗瑞過程或波伊亞過程作為實際級聯的近似,有時還要用到更新過程(見點過程)的概念。當核子穿到吸收體的某一深度時,則可用擴散方程來計算核子的概率分布。物理學中的放射性衰變,粒子計數器,原子核照相乳膠中的徑跡理論和原子核反應堆中的問題等的研究,都要用到泊松過程和更新理論。湍流理論以及天文學中的星雲密度起伏、輻射傳遞等研究要用到隨機場的理論。探討太陽黑子的規律及其預測時,時間序列方法非常有用。

化學反應動力學中,研究化學反應的時變率及影響這些時變率的因素問題,自動催化反應,單分子反應,雙分子反應及一些連鎖反應的動力學模型等,都要以生滅過程(見馬爾可夫過程)來描述。

隨機過程理論所提供的方法對於生物數學具有很大的重要性,許多研究工作者以此來構造生物現象的模型。研究群體的增長問題時,提出了生滅型隨機模型,兩性增長模型,群體間競爭與生尅模型,群體遷移模型,增長過程的擴散模型等等。有些生物現象還可以利用時間序列模型來進行預報。傳染病流行問題要用到具有有限個狀態的多變數非線性生滅過程。在遺傳問題中,著重研究群體經過多少代遺傳後,進入某一固定類和首次進入此固定類的時間,以及最大基因頻率的分布等。

隨機性在生物系統里起著重要的作用

許多服務系統,如電話通信,船舶裝卸,機器損修,病人候診,紅綠燈交換,存貨控制,水庫調度,購貨排隊,等等,都可用一類概率模型來描述。這類概率模型涉及的過程叫排隊過程,它是點過程的特例。排隊過程一般不是馬爾可夫型的。當把顧客到達和服務所需時間的統計規律研究清楚後,就可以合理安排服務點。

在通信、雷達探測、地震探測等領域中,都有傳遞信號與接收信號的問題。傳遞信號時會受到雜訊的干擾,為了準確地傳遞和接收信號,就要把干擾的性質分析清楚,然後採取辦法消除干擾。這是資訊理論的主要目的。雜訊本身是隨機的,所以概率論是資訊理論研究中必不可少的工具。資訊理論中的濾波問題就是研究在接收信號時如何最大限度地消除雜訊的干擾,而編碼問題則是研究採取什麼樣的手段發射信號,能最大限度地抵抗干擾。在空間科學和工業生產的自動化技術中需要用到資訊理論和控制理論,而研究帶隨機干擾的控制問題,也要用到概率論方法。

概率論進入其他科學領域的趨勢還在不斷發展。值得指出的是,在純數學領域內用概率論方法研究數論問題已經有很好的結果。在社會科學領域,特別是經濟學中研究最優決策和經濟的穩定增長等問題,也大量採用概率論方法。正如拉普拉斯所說:「生活中最重要的問題,其中絕大多數在實質上只是概率的問題。」

原文鏈接: http://bbs.sciencenet.cn/blog-585324-489185.html
作者: 王壽仁
  • 喜歡
  • 不喜歡
  • 分享到: .ttru{ width:70px; line-height:20px;}

    表情 公式

  • 全部評論
  • 用戶評論
  • 微博評論
  • 推薦閱讀:

    凱利公式--給天台上徘徊的同學寫一篇科普文
    可靠性筆記(一) | 故障分布函數
    科學故事:概率論的產生
    當神經網路撞上薛定諤:混合密度網路入門

    TAG:概率論 | 概率 |