常用決策分析方法(基本方法)
上一節我們說了決策分析的基本概念,這一節我們談談決策分析常用的三種方法:決策樹法、Bayes方法、Markov方法。
決策樹法
決策樹法(decision tree-based method):是通過確定一系列的條件(if-then)邏輯關係,形成一套分層規則,將所有可能發生的結局的概率分布用樹形圖來表達,生成決策樹(decision tree),從而達到對研究對象進行精確預測或正確分類的目的。
樹的擴展是基於多維的指標函數,在醫學領域主要用於輔助臨床診斷及衛生資源配置等方面。
決策樹分類:
按功能分:分類樹和和回歸樹
按決策變數個數:單變數樹和多變數樹
按劃分後得到分類項樹:二項分類樹和多項分類樹
決策樹的3類基本節點:
決策節點(用□表示)
機會節點(用○表示)
結局節點(用?表示)
從決策節點引出一些射線,表示不同的備選方案,射線上方標出決策方案名稱。射線引導到下一步的決策節點、機會節點或結局節點。從機會節點引出的線表示該節點可能出現的隨機事件,事件名稱標在射線上方,先驗概率在下方。每個結局節點代表一種可能的結局狀態。在結局節點的右側標出各種狀態的效用(utility),即決策者對於可能發生的各種結局的(利益或損失)感覺和反應,用量化值表示。
繪製決策樹基本規則:
各支路不能有交點
每一種方案各種狀態發生概率之和為1
決策樹分析法步驟:
1 提出決策問題,明確決策目標
2 建立決策樹模型--決策樹生長
2.1決策指標的選擇的兩個步驟:
2.1.1 提出所有分值規則
2.1.2 選擇最佳規則
2.2 估計每個指標的先驗概率
3 確定各終點及計算綜合指標
3.1 各終點分配類別
3.2 各終點期望效用值得確定
3.3 綜合指標的計算
3.4 計算值排序選優
樹生長停止情況:
子節點內只有一個個體
子節點內所有觀察對象決策變數的分布完全一致,不能再分
達到規定標準
一棵樹按可能長到最大,通常是過度擬合(overfit)的。
訓練集:用於決策樹模型建立的數據集
測試集:決策樹進行測評的數據集。
過度擬合的樹需要剪枝,即去掉雜訊(擬合中的誤差)。剪枝需要兼顧複雜度(節點數目)和預測精度(決策損失)。
決策損失(decision lose):指隨機抽取的某一個個體,在樹的某決策節點被錯誤分類所引起的效用損失。
建立決策樹的目的在於獲得最高精度的分類或預測值,以期為決策提供依據。可按照這幾個特性對其評估:準確、簡潔、易行、易理解和能發掘複雜數據內在關係。
Bayes方法
在實際決策過程中,決策者通常是將狀態變數當作隨機變數,狀態變數發生的可能性用先驗概率(prior probability)表示,以期望值準則(expectation rule)作為選擇最優方案的標準。
但是先驗概率來源於歷史資料和主觀判斷,有一定偏差。為了提高質量,就需要進行實驗、抽樣等工作計算出當前條件下的概率,這就是後驗概率(posterior probability)。後驗概率是對先驗概率的修正。
根據自然狀態的先驗概率和條件概率,利用樣本信息求得後驗概率並進行決策的方法就稱為貝葉斯決策(Bayesian decision)。
基本步驟:
先驗分析
後驗分析
決策分析
Markov方法
馬爾科夫模型(Markov model):是利用某一變數的現在狀態和動向來預測該變數未來的狀態及動向,以輔助決策的一種分析方法。
馬爾科夫模型與其他模型的主要區別是:它不需要從複雜的預測因子中尋找各因素之間的相互規律,而只需要考慮事件本身的歷史狀況及演變特點,通過計算狀態轉移概率預測自身狀態的變化。
馬爾可夫鏈為狀態空間中從一個狀態到另一個狀態轉換的隨機過程。該過程要求具備「無記憶」的性質:即已知現在狀態,將來狀態與過去狀態相互獨立。這種特定類型的「無記憶性」稱作馬爾可夫性質。在馬爾可夫鏈的每一步,系統根據條件概率保持現有狀態或轉為其他狀態。狀態的改變叫做轉移,狀態改變概率稱為轉移概率。
馬爾科夫模型優於決策樹發的特點主要有兩個方面:
允許狀態之間的相互轉移,及模型中的雙向箭頭,而決策樹只能是單向射線。
模型中加入了時間效應,可以進行貼現,更接近現實。
馬爾科夫模型當前應用非常火熱,什麼機器學習,人工智慧等等幾乎都是必須提到,google的網頁排序計算就是依據這個模型計算的。但是模型還是有點複雜,大家知道就可以了。
推薦閱讀:
※山根面相分析,山根出現橫紋代表什麼?
※哥來分析溫州金融地震的真相!
※抗感冒藥物分析
※見死不救是否構成犯罪?(案例分析)
※2012壬辰年家居風水分析與太歲三煞五黃