威布爾壽命數據分析真的有那麼複雜嗎?
Version:1.0
StartHTML:000000295EndHTML:000055119StartFragment:000001612EndFragment:000055087StartSelection:000001612
EndSelection:000055083SourceURL:https://mp.weixin.qq.com/cgi-bin/appmsg?t=media/appmsg_edit&action=edit&type=10&appmsgid=100000264&isMul=1&token=89495562&lang=zh_CNbody{font-family:sans-serif;} .selectTdClass{background-color:#edf5fa !important}table.noBorderTable td,table.noBorderTable th,table.noBorderTable caption{border:1px dashed #ddd !important}table{margin-bottom:10px;border-collapse:collapse;display:table;}td,th{padding: 5px 10px;border: 1px solid #DDD;}caption{border:1px dashed #DDD;border-bottom:0;padding:3px;text-align:center;}th{border-top:2px solid #BBB;background:#F7F7F7;}.ue-table-interlace-color-single{ background-color: #fcfcfc; } .ue-table-interlace-color-double{ background-color: #f7faff; }td p{margin:0;padding:0;} ol,ul{margin:0;padding:0;width:95%}li{clear:both;}.list-paddingleft-1{padding-left:0}.list-paddingleft-2{padding-left:30px}.list-paddingleft-3{padding-left:60px} pre{margin:.5em 0;padding:.4em .6em;border-radius:8px;background:#f8f8f8;}導語
我們評估產品可靠性的最終目的是為了量化可靠性,而要量化可靠性就必須對收集實驗數據或是售後失效數據進行壽命數據分析。希望本次的分享,能讓你快速了解到威布爾壽命數據分析方法。
準備工作-基本概念的了解
在威布爾數據分析之前,我們需要先要回答幾個問題:可靠性有哪些特徵量?什麼是失效分布函數?如果不了解的朋友可以參閱前幾次關於可靠性基礎概念的文章:
- 可靠性特徵量
- 可靠性失效分布函數
壽命數據分析關注的是什麼?
假設:從同一批蘋果中獲得了100個連續完全變質時間的數據,如下所示:
對於這組數據,我們如何分析?
- 首先,我們可以用傳統的直方圖的方法來看看,以200小時為一柱狀區間
- 再次,進一步縮小區間範圍為20小時為一柱狀區間,並把各個柱狀圖用線連起來
- 如果進一步無限縮小分組的區間範圍,那麼原本崎嶇不平的稜角就變成優美的曲線
因此,我們進行壽命數據分析的關鍵是把收集的測試數據按一定分布模型擬合出概率密度函數分布,即pdf。有了概率密度函數,我們就很容易得到可靠性和累積失效概率是多少了。
這其中威布爾分布是可靠性分析中最受歡迎的一種分布,因為其形參β的變化可以很好的反映其他的失效分布函數:
1) 當β<1時,瞬時失效率呈遞減趨勢,正好可以提現對數正態分布。
2) 當β=1 時,瞬時失效率恆定不變,屬於「偶然失效」階段。此時的失效分布函數等同於指數分布。
3) 當β>1時,瞬時失效率呈遞增瞬趨勢,處於「退化失效」階段。當β=2時,失效分布函數等同於雷利分布;當β=3~4時,失效分布函數接近於正態分布。
所以,這也是大家經常談到數據分析就說威布爾分析的原因之一,其實壽命數據分析是找到產品合適的失效分布函數,這個失效分布可以是指數分布,可以是正態分布,可以說對數正態分布,也可以是威布爾分布等。
數據的類型
一般認為數據分為完整數據和刪失數據,而刪失數據又分為:左刪失,區間刪失和右刪失。如同所示:
- 完整數據:所收集的測試失效數據有明確的記錄時間。
- 右刪失數據:當試驗結束時,樣品沒有發生失效。如果測試繼續進行,也許它會在你停止時間後的某一時間發生失效。
- 區間刪失數據:樣品的失效時間發生在前後兩次檢查的中間,你只知道樣品是在這個時間段內發生了失效,但是具體哪個時間未知。
- 左刪失數據:試驗採用定時截尾,並且從開始測試到試驗結束都沒有檢查樣品是否失效,但是在時間截至時發現樣品發生失效了,因此產品的具體失效時間未知,只知道在檢查時前某個時刻內發生了失效。
威布爾分析
- 威布爾分布概率密度函數,見公式:
- 參數估計是統計推斷的基本問題之一。在可靠性中,經常遇到的參數(分布中的參數,各種可靠性指標等)都是未知的,都需要估計,根據子樣去尋找這些參數的估計問題都是參數估計問題。參數估計的方法有很多,但是我們在工程應用中,經常用到的是概率圖法->最小二乘法和極大似然法等。
如何利用最小二乘法進行線性擬合分析呢?
把上面的不可靠公式等式兩邊進行二次求對數,這樣可以把一直指數的公式變成線性方程式。
這樣我們就可以把所有的數據轉化後,在威布爾概率紙上描點進行線性擬合。但是這裡又出現另一個問題,Q(Tj)這個參數應該如何估計?
答案是一般採用中位秩,如下面公式所示:
那為什麼是中位秩 ?而不是其他呢? 使用中位秩排序位置來代替其他排序方法因為中位秩排序是在一個特定的置信水平(50%)。但是這樣的公式計算過於麻煩,尤其很多可靠性工程師並不是統計背景的,所以一個簡單快速但是精確度略低的方法被用來替代中位秩排序計演算法。
下面通過一個簡單的案例來解釋上面的方法:
安排4個樣品做高溫試驗,每個樣品的失效時間收集為10天,30天,50天和60天。
利用上面的公式可以計算出每個樣品的排序。具體如下圖所示:
利用最小二乘法,對這些點線性擬合,這條直線的斜率就是威布爾函數中的形參β,而y軸上62.3%所對應x軸上的時間點就是特徵壽命或尺度參數eta.有了形參β和尺度參數eta,就很容易求出可靠性R(t)或累積失效F(t)是多少了。
極大似然估計
極大似然估計方法(Maximum Likelihood Estimate,MLE)也稱為最大概似估計或最大似然估計,是求估計的另一種方法。設母體的待估參數為θ,它可以取很多值。在θ的一切可能值之中選出一個使子樣觀察結果出現的概率最大的值作為θ的估計,記為
。並稱
為θ的極大似然估計。
極大似然估計方法的步驟:
- 建立似然函數
- 似然函數對估計參數求導,使其等於0,得到似然函數方程
- 解似然方程,得到使似然函數達到極大的
就是θ的估計參數。
在實際分析中如何選擇秩回歸法和極大似然法?
- 秩回歸法-最小二乘法
- 完全數據
- 小樣本
- 極大似然法
- 刪失數據
- 混合數據
- 大樣本(30+)
前面討論的是完全數據,當有刪失數據存在的情況下,如何給失效數據排序?
假設一個產品的可靠性測試狀態如下:
100 小時有一個樣品發生失效,300小時沒有發生任何樣品失效,但是有一個樣品被取出進行其他功能檢測且沒有繼續進行餘下的測試。550小時又有一個樣品發生失效,剩餘樣品在700小時沒有發生發生任何樣品失效,但是有一個樣品被取出進行其他功能檢測且沒有繼續進行餘下的測試。最後一個樣品在1000小時發生失效, 試驗結束。
第一個是失效數據F1,第二是右刪失數據,那麼第三個數據F2究竟是排在第二序還是第三序呢?這裡可以引入Mean Order Number(MON)方法。
同理,可得F3的位序
採用完整數據同樣的中位秩排序法,可得3個失效數據的序位:
失效MON中位秩位置F1113%F22.2536%F34.12571%
用概率圖法可以再威布爾概率紙上描點擬合,但是這裡估計的方法是極大似然法,因為實驗數據中含有右刪失數據。
當然,有很多專業軟體來處理這些數據,但是在熟練使用軟體前還是非常有必要了解威布爾分析的具體原理。今天我們只是介紹了威布爾分析的一部分知識,關於置信區間的部分介紹,請持續關注本微信公眾號。
推薦閱讀: