如何理解指數分布的無記憶性?
書上舉個例子說電子元件在使用過a小時候,它還能再使用b小時和它一開始壽命就是b小時的概率是一樣的。
日常生活中的電子元件用了十年之後還能和新的有一樣的預期壽命嗎?覺得不對啊。
已有的回答基本都沒說到點子上,有的根本就是錯的。。題主應該是學過指數分布無記憶性的證明的,這證明很簡單,無論哪本教科書上都有,這個問題問的是直覺上為什麼無記憶性makes sense.
正好我教初級概率論的時候,從直覺角度解釋過這個問題,這裡copy一下:
- 現在你面前有一堆電子元件,因為製造的時候品質有差異,所以它們的壽命是各不相同的。你可以想像如果你把它們一個個都測試到爆,從而獲知了它們的壽命,畫一個histogram出來,那麼根據假設,大約是可以看到一個指數分布的。
- 現在再談「無記憶性」在這個例子里具體是什麼意思。
在這裡,「無記憶性」的意思具體翻譯為(注意!!):假如你面對(取樣過程獨立於上面那批零件的)另一批零件,你等了一段時間之後,比如一年之後,考察所有沒有壞的元件,這時候才開始計時,測試它們的壽命,畫出histogram.如果樣本數足夠大,(with high probability)你會發現這個histogram跟前一個histogram形態基本一致。
現在比較1和2:首先,在1中,你考慮了面前所有的零件,不加篩選,所以很多製造質量不是那麼好從而壽命很短的元件也參與了你的histogram;而在2中,當你等了一年之後才開始計時,這等於是對哪些元件有資格進入你的考慮範圍進行了篩選:壽命在一年以下的那些劣質元件被你淘汰了。
這就很清楚了:
- 在2中,雖然所有的元件都已經經歷了一年時光的磨損(負面因素),但是這些零件本來是製造質量相對較好的,所以如果從一開始計時,它們的平均壽命顯然是要比不加篩選的全體壽命的平均要長的(正面因素)。
- 指數分布的「無記憶性」說的是,如果population是指數分布的,那麼上述兩種因素就會正好抵消,於是你如果在第一年結束的時候開始計時,只考慮生存下來的元件,那麼看到的分布仍然是那個指數分布。
將來你如果上隨機過程這門課,那麼在更新過程這一章里,你會學到一個很有趣的東西叫做「檢查悖論」,其原理本質上是與這裡的解釋有相通之處的。參考閱讀:Renewal theory - Wikipedia
沒錯,指數分布的無記憶性與現實生活中出現的情況向矛盾。因此對於現實生活中一般電子產品或者機械工業中經常磨損的物品不能使用指數分布預測其壽命。但是對於一些高穩定性的特殊物品可以使用指數分布。
先把結論擺前面:
指數函數的無記憶性來自於泊松過程k=0時的 時間指數性,而泊松過程k=0時的 時間指數性 來自於泊松分布時 lambda的恆定性,也就是離散情況下,二項分布的n*p的恆定性。@荀迎曙 同學的想法是對的,某時刻壞的概率 恆定得比例於 此刻存留的沒壞的物品的數目。
數學得表示就是:f/(1-F) = lambda (泊松過程中的到達率/強度,constant) 不過可惜的是並沒有正面回答問題。背後的數學道理,我們可以遵循 伯努利分布 -&> 二項分布 -&> 泊松分布 -&> 泊松過程 -&> 指數分布 的脈絡來觀察。
伯努利分布描述的是單次隨機事件(Pr = p)的概率;
二項式分布預測的是多次(n次)獨立隨機事件(Pr =p holds)發生的次數(k為自然數);
泊松分布估計的是單位時間內隨機事件的發生次數,比如 售後接到電話的概率。事實上,泊松分布是近似化連續化的二項分布,當n很大,p很小,n*p大小適合時,lambda = n*p(用下自然數e的計算公式就可以轉化)。 以接電話為例,每個顧客打電話的概率都是p,很小很小,但是顧客數目很大(n很大),我們就可以用 泊松分布來模擬(k為自然數)
;一維泊松過程就是t時間內的隨機過程,有著和泊松分布中一樣的lambda,只是 泊松分布觀察的是單位時間,泊松過程中t改變,你把泊松分布中的lambda換成泊松過程中的lambda *t就是了(t是連續的,while K是離散的)
;而指數分布描述的是泊松過程中,第k次隨機事件與第k+1次隨機事件出現的時間間隔。間隔大於t的概率就是 泊松過程中k=0的情況,(t是連續的)
這是 只隨時間變化的指數函數 !我們看指數分布無記憶性的定義
我們回溯一下,就會發現,指數函數的無記憶性來自於泊松過程k=0時的 時間指數性,而泊松過程k=0時的 時間指數性 來自於泊松分布時 lambda的恆定性,也就是離散情況下,二項分布的n*p的恆定性。這是一個條件概率題。所謂的條件概率就是在已經知道一些信息的情況下,再來詢問事件發生的概率。這裡的事件是壽命大於等於某個時間x。對於某些元器件來講,它在一定的時間內,比如兩年,它工作了一天或者一個月甚至一年半,對它沒有什麼損耗,或者損耗微乎其微,我們就認為,工作了這一天或者一個月對它沒有帶來什麼信息。所以我們根據這個性質可以選擇指數分別來刻畫其壽命。因為指數分布的無記憶性。但是,隨著元器件使用時間越來越長,比如十年,其內部的損耗或者老化已經很大,不可能再忽略不計。這時,工作了十年這個條件對我們來說就是一個很有用的信息,它再工作一年的概率一定比新買來時小。這時,對其建模可以採用更加精確的Weibull概率分布。再說一個例子,以做難題為例。如果你在做一個難題,苦思冥想了一個小時,結果紙上還是沒有任何思路,這一個小時就白費了。你再想一個小時和一個小時以前,你覺得一個小時能做出來的可能性是一樣的。那麼你就可以用指數分布來刻畫你做出來這道題時間這個隨機變數。 當然,也不排除你想了一個小時,覺得再想一天也想不出來的可能性,這時,你可以使用非指數分布建模。供參考
壽命在現實中本就是一個很綜合的概念,甚至很主觀,例如一瓶牛奶,保質期是15天,可有的人認為3天就已經不能喝了,也有人幾個月後打開發現沒有異味,一口喝下,也毒不死人,那麼這個牛奶的壽命是以其新鮮程度為標準還是其是否致命為標準呢?
對於電子元件,通常認為,壽命的依據是其主要功能是否失效,但有太多的因素影響到它的功能,包括各種外界的干擾,還有內部磨損,材料老化,這些都不是概率模型討論的,指數分布這個例子中的產品壽命不是現實中我們理解的壽命,而是在這個產品的的質量不會有任何改變的假設下,故障出現前正常使用的時間,或者兩次故障發生之間的正常使用時間。
產品的各項物理特性綜合決定了故障發生時間的隨機性,這個隨機的特點與指數分布一致,指數分布概率密度公式里的參數反映了該產品的特性,在產品性能相對穩定的時間內,可以認為不變,但這不意味著產品就不會出故障,出故障的時刻無法預知,因此是隨機的。隨著產品使用過程中的損耗(這個損耗才主要決定壽命),在不斷變化,因此一個現實中的產品,在不同時期故障間隔對應的指數分布中參數是不同的,也就不能用同一公式去理解它的無記憶性。
另外樓上心之刃的回答舉的擲骰子的例子其實符合的是幾何分布,幾何分布也是一個無記憶性的分布,只不過它是離散的,指數分布是連續的
注,以上是我剛做了一個指數分布的題之後,也對其壽命的例子感到疑惑,然後上網搜索,沒有發現滿意的答案,倒是看到這有同樣的問題,於是乾脆自己理了理思路再寫下的,因此我也是概率剛入門,沒有深思熟慮,或許有很多謬誤,因此請樓主慎重,只是個人想法@張俊馳 給的是條件概率的證明方式,書上也有,但是還是無法直觀理解啊。性質穩定所以發生故障的概率保持不變這個不難理解吧。日常生活中的電子元件用了十年之後還能和新的有一樣的預期壽命嗎?這個是因為電子元器件在設計壽命周期內是符合指數分布,十年後肯定不符合了。其實我覺得最難理解的是為什麼說任何時候發生故障的概率都一樣,但是概率密度函數又不是常數,而是。我後來琢磨了一下,兩者區別這樣理解吧。比如開始有1000個設備,每小時1個故障, 如果是概率密度是常數也就是故障保持這樣的發生速度,差不多1000小時全部故障。但是考慮一下,其實還剩500的時候故障率已經提高一倍了。
而指數分布是開始時每小時1個故障,到了500的時候如果故障率還保持不變,這時事件發生的速度是要降低50%的,也就是這時候是兩小時故障一個,所以概率密度函數必須要指數下降
再說明白一點,也就是從1000個到500個所花的時候和從500個到250個所花的時候是一樣的。想要理解無記憶性,最好先理解指數分布。隨機事件的隔服從指數分布。
舉個例子,有一顆燈,平均5分鐘閃一次,每個時刻閃的可能性是一樣的,
那麼,假設你觀察了10分鐘,燈都沒閃,之後等到燈閃的預期時間還是5分鐘,
這個5分鐘的預期時間不會因為你已經等了多久而改變,這是顯而易見的。
那燈泡壽命做例子是十分扯淡的,燈泡壽命通常也不是指數分布。
本來無記憶性是顯而易見的,錯誤的例子害死人啊。
因為書上所說的意義並沒有考慮到現實的老化問題,在實際中損壞的概率應當隨時間的推移存在變化,書本中的假設則是損壞概率不隨時間的變化而變化,就是這樣吧,那當然是這樣的結果啦。 伯努利實驗的前提條件就是實驗只存在兩種結果,且每次實驗是獨立的,兩結果互逆,且概率是不變的,所以書中把電子元件假設為這種模型,自然是跟我們實際理解存在出入。
ps其實用年輕人的壽命做例子會更恰當些。
我一直告訴自己 我的電腦理論上可以再戰n年 因為有這個無記憶性 至少對裡面某些電氣元件是這樣 沒錯 我就是這麼安慰自己的 電腦啊電腦 你對自己已使用的時間沒有記憶 你可以像新買的一樣強大。。。好吧 該吃藥了
推薦閱讀:
※航模遙控器是D7E還是X9D性價比高?
※SiC mosfet的效果如何?
※大幅提升電力電子變換器功率密度的手段有哪些?
※制約開關電源頻率提升的局限是什麼?