怎樣理解隨機過程中鞅的停時?
停時的定義要求,
是可測的。對於離散時間來說,這等價於
是可測的。這就是說,我們知道我們在t時刻應該"停下來"(或者做其他什麼事情),僅僅只能依靠t時刻的信息(). 例如如果我們知道明天股票會虧本於是我們選在在今天賣,那麼賣的時間就不是一個停時。
在鞅當中,如果這個鞅是一致可積而且停時處處有限的話,就表現為我們採用任何策略停下我們的遊戲,我們賺錢的期望都是0。
停時是一個隨機變數.你給定一個條件,讓這個過程在某個時刻停下.這個停下的時間就是停時.
比如我要在時間t=5時停下,那麼這個停時就永遠是5.從概率論的角度來講這個停時就是一個定義在平凡 代數上的隨機變數.
比如我要在這個過程達到10的時候停下,那麼因為這個過程是隨機的,所以這個停時也是個隨機變數.因為這個過程在什麼時候達到10是隨機的.
但是要注意一個停時只能定義在在這個停時之前的時間所關聯的sigma域上.比如你可以讓一個過程在它第一次達到10的時候停下,這個時間是一個停時.但是你不能讓一個過程在它最後一次達到10的時候停下.因為你永遠不知道這一次停下是不是最後一次.因此它就不是一個停時.
停時定理就是說如果一個鞅滿足特定條件(這些條件基本就是要求停時和過程本身almost surely bounded)那麼這個鞅在任何停時的期望值等於它在零時刻的期望值
舉一個拋硬幣賭博的例子,每次賭博有一個賭注Hn,硬幣為正獲得Hn的錢否則扣掉Hn的錢。
Xn這一系列隨機變數意味著賭博第n次為正面(就是贏了賭注)取1,反面取負1。
Sn是前n個Xn的和,Xn是獨立同分布的,因為每次拋硬幣都獨立而且分布一樣,這樣Sn就可以看作一個simple random walk。
在賭博中設第n次的賭注是Hn,並且Hn的值和上一次賭博結果也就是Xn有關,如果上一次贏了那麼賭注就是1,要是輸了賭注就是2*Hn-1也就是上一次賭注的二倍。
考慮第n次賭博時候的總財富:
(H·S)n=H1*X1+...+Hn*Xn且H0=0上述都是隨機變數。在這些前提下,{Sn}就是一個鞅,也就是在前n次事件發生後下個事件發生的期望等於Sn,另一個意義上來說就是沒發生的事件的期望可以在該時刻預測,所以鞅刻畫的是一列性質好可以預測的隨機過程。
並且由於Hn的定義知Hn是一個可預測的隨機變數序列,所以由已知定理{(H·S)n}也是一個(關於{Xn}的)鞅,也就是說下一次賭博後的總財富的期望可以通過這一刻財富總值預測。
下面設置一個關於{Xn}的停時N(取值正整數包括無窮),其是一個隨機變數,可以這樣設置:
N=inf{n:Xn=1}也就是說一旦你第n次賭贏了(前面幾次都輸了)立馬停止賭博(不要臉地拍屁股走人)。意味著這時候賭博達到的次數即N的取值N=n,(注意它也是個隨機變數),這樣N的取值與該時刻以及前面所有信息有關,也就是說N的每一個取值都有一定概率。因為你0時刻的賭本是H0=0,由於你總財富是一個鞅過程,所以你任何時刻財富的期望都是你0時刻的賭本值0(這個意義上來說這個賭博就是公平的)。
而鞅停時定理說的是,零時刻的財富值的期望值等於你停止賭博時候的期望值。意味著你的總收益的期望值等於最初時刻的賭本0(這個意義上來說賭博也是公平的)。舉個不嚴謹的例子,一個賭徒身上有10塊錢,每次賭博要麼贏要麼輸一塊錢,概率一半一半,那麼他的資產就是個鞅。規定他只能玩20次。要麼輸光離場,要麼次數耗盡,那麼,離場時間就是一個停時
You can think about one possible gambling strategy that is to bet 1 yuan each
time until you stop playing at time T.推薦閱讀:
※如何理解隨機變數序列?X和x有什麼區別?
※Logistic 回歸和費米分布有什麼聯繫嗎?
※如何理解並記憶大數定律?
※第一類錯誤和第二類錯誤的關係是什麼?
※如何優化邏輯回歸(logistic regression)?