母函數和矩母函數的聯繫和區別?

二者主要的應用是做什麼?感覺很難分清


想要了解一個東西,先要弄懂他的定義。我先從定義出發,然後分別分析兩者的相似之處和不同點。

  • 定義:

概率母函數(probability generating function):

對於取值為非負整數的隨機變數X,其概率母函數定義為G_X(t)=sum_{i=0}^{infty}P(X=i)t^i=E(t^X),其中|t|leq 1.

矩母函數(moment generating function):

對於任意的隨機變數X,其矩母函數定義為M_X(t)=E(e^{tX})。我們說其矩母函數存在,當存在一個小區間(-varepsilon, varepsilon)上矩母函數收斂。

從定義我們可以看到:雖然概率母函數(p.g.f.)和矩母函數(m.g.f.)都可以看作是某族期望,但概率母函數(p.g.f.)的適用範圍相比矩母函數(m.g.f.)要小,因為它只適用於取值為非負整數,如{0,1,2,...},的離散型隨機變數,而矩母函數並不限定隨機變數類型。但矩母函數一般化定義有可能帶來其只在零點有定義M_X(0)=E(e^{0X})=1,而不存在。例如:Cauchy分布。

  • 相似性:

如果我們拋開概率母函數需要非負整數離散隨機變數矩母函數可能不存在的限制條件,其實兩者有很大的相似性

兩者的關係:M_X(log(t))=E(e^{tlog(X)})=E(X^t)=G_X(t)

因此,

(1)概率母函數和矩母函數都和分布一一對應。

對於概率母函數,對其進行微分再取t=0,我們得到G_X(0)=Pr(X=0),G,...,G_X^{<k>}(0)=k!	imes Pr(X=k)。因此,我們可以從矩母函數得到隨機變數X在任意一點的概率,因此概率母函數和分布一一對應。

對於矩母函數,由於其是Laplace變換。由Laplace變換的唯一性,我們可以得到矩母函數和分布一一對應。

(2)獨立隨機變數和的概率母函數或矩母函數分別是獨立隨機變數相應函數乘積。

對於S_n:=X_1+X_2+X_3+...+X_n,和的概率母函數

G_{S_n}(t)=E(t^{X_1+X_2+...+X_n})=E(t^{X_1})E(t^{X_2})...E(t^{X_n})=prod G_{X_i}(t)

和的矩母函數也可以用類似的方法進行計算,從而得到一樣的結論。

由於以上兩點性質,我們可以任意用概率母函數或矩母函數求獨立非負整數離散隨機變數的和的分布。例如:二項分布B(n_i,p),泊松分布Poi(lambda_i),幾何分布G(p)。但對於取值更一般的情況,則只能使用矩母函數進行計算。例如:正態分布N(mu_i,sigma^2_i)

  • 特性:

對於概率母函數:

G^{<k>}_X(1)=E[X(X-1)...(X-k+1)],即概率母函數的k階導數在z=1時是k-th falling factorial moment.

對於矩母函數:

對於矩母函數存在的情況,E(e^{tX})=sum_{k=0}^{infty}frac{E(X^k)}{k!}t^k,即對矩母函數進行Taylor展開,其k階矩等於t^k的係數乘以k!。或者等價而言,M_X^{<k>}(0)=E(X^k)

結論:事實上,除了對隨機變數的要求不同和對不同函數求導的差異之外,矩母函數和概率母函數並無太大差別,許多良好的解析性質對兩者都成立。

註:本文在求導與Taylor展開時運用多次交換運算符號。交換運算符號可能導致運算結果不一致,但本文中的情況並不會導致不一致的結果。詳細原因不贅述。


我試著回答一下。我不是數學專業的,但是自己看過一些這方面的內容,希望能幫到你。

只有取值非負的離散型隨機變數才有母函數。

一個非負離散型隨機變數X的母函數定義是:

f(t)=sum_{k=0}^{infty} {Pr[X=k]t^k}

它的一些比較有意思(有用)的性質有:

f(1)=1,f

如果X,Y(相互獨立)的母函數分別是f(t),g(t),那麼X+Y的母函數就是f(t)	imes g(t)

而只要是各階矩存在的隨機變數$X$,不管是離散型的還是連續型的都可以定義矩母函數

M(t)=sum_{n=0}^{infty}frac{t^n}{n!}E[X^n]

(但是有時候這個級數收斂半徑是0。)

它還有一種等價的定義:

M(t)=E[exp(tX)]

很多地方都用的是這個定義,但是我更喜歡上面那個級數的定義,我認為更有幫助理解本質。

它比較有用的性質是:

E[X^n]=M^{(n)}(0),也就是0處的n階導數。實際上這個性質直接對上面的級數逐項求n次導就出來了。

還有就是兩個獨立隨機變數和的矩母函數是它們矩母函數之積,這個性質和母函數很像。

為了彌補上面說的收斂半徑是0的情況,還有特徵函數:

phi(t)=sum_{n=0}^{infty}frac{(it)^n}{n!}E[X^n]=M(it)(i是虛數單位)

它的好處是總是收斂。性質和矩母函數都差不多,就是有的地方多出了一個i

母函數,矩母函數和特徵函數對一些問題有奇效。比如說隨機個獨立同分布隨機變數相加的特徵函數,就可以用(個數的)母函數和(共同分布的)特徵函數複合出來

另外,特徵函數應該是唯一確定分布的。你有興趣的話可以再查一下。


這兩個概念其實就是人們在計算和推導(包括積分和微分)各種概率分布函數的時候出現頻率較高的單元,然後人為強制規定它為概率母函數和矩母函數,並且給出了相應的形式。你首先要記住兩個概念的定義。

概率母函數定義為

矩母函數定義為

舉個小學生級別的不太恰當的栗子

在求解一元二次方程 y=ax^2+bx+c 的時候,因為sqrt{b^{2}-4ac} 是一個常用的量,既可以判斷方程有沒有根,也能看方程有幾個根,數學家認為它很神奇,於是就人為強制規定 Delta=sqrt{b^{2}-4ac} ,這時候就有了所謂求根公式。之後對於 Delta 的研究就成了一個新的命題(當然超過二次的方程大家研究起來才帶勁(ノ ̄▽ ̄))。

其實數學的本質就兩條:自然界存在的我們去發現,人為強制規定的我們去深入研究。

一人之見,歡迎討論


推薦閱讀:

什麼人種的智商最高?
太陽能船舶可能嗎?
有哪些聽起來不可思議但是卻真實存在的科技?
如何向一個沒學過大學物理的人解釋玻爾茲曼熵?

TAG:理論 | 數學 | 科學 | 概率論 | 大學數學 |