常用決策分析方法（基本方法）

07-20

上一節我們說了決策分析的基本概念，這一節我們談談決策分析常用的三種方法：決策樹法、Bayes方法、Markov方法。

決策樹法

決策樹法（decision tree-based method）：是通過確定一系列的條件（if-then）邏輯關係，形成一套分層規則，將所有可能發生的結局的概率分布用樹形圖來表達，生成決策樹（decision tree），從而達到對研究對象進行精確預測或正確分類的目的。

樹的擴展是基於多維的指標函數，在醫學領域主要用於輔助臨床診斷及衛生資源配置等方面。

決策樹分類：

按功能分：分類樹和和回歸樹

按決策變數個數：單變數樹和多變數樹

按劃分後得到分類項樹：二項分類樹和多項分類樹

決策樹的3類基本節點：

決策節點（用□表示）
機會節點（用○表示）
結局節點（用?表示）

從決策節點引出一些射線，表示不同的備選方案，射線上方標出決策方案名稱。射線引導到下一步的決策節點、機會節點或結局節點。從機會節點引出的線表示該節點可能出現的隨機事件，事件名稱標在射線上方，先驗概率在下方。每個結局節點代表一種可能的結局狀態。在結局節點的右側標出各種狀態的效用（utility），即決策者對於可能發生的各種結局的（利益或損失）感覺和反應，用量化值表示。

繪製決策樹基本規則：

各支路不能有交點
每一種方案各種狀態發生概率之和為1

決策樹分析法步驟：

1 提出決策問題，明確決策目標

2 建立決策樹模型--決策樹生長

2.1決策指標的選擇的兩個步驟：

2.1.1 提出所有分值規則

2.1.2 選擇最佳規則

2.2 估計每個指標的先驗概率

3 確定各終點及計算綜合指標

3.1 各終點分配類別

3.2 各終點期望效用值得確定

3.3 綜合指標的計算

3.4 計算值排序選優

樹生長停止情況：

子節點內只有一個個體
子節點內所有觀察對象決策變數的分布完全一致，不能再分
達到規定標準

一棵樹按可能長到最大，通常是過度擬合（overfit）的。

訓練集：用於決策樹模型建立的數據集

測試集：決策樹進行測評的數據集。

過度擬合的樹需要剪枝，即去掉雜訊（擬合中的誤差）。剪枝需要兼顧複雜度（節點數目）和預測精度（決策損失）。

決策損失（decision lose）：指隨機抽取的某一個個體，在樹的某決策節點被錯誤分類所引起的效用損失。

建立決策樹的目的在於獲得最高精度的分類或預測值，以期為決策提供依據。可按照這幾個特性對其評估：準確、簡潔、易行、易理解和能發掘複雜數據內在關係。

Bayes方法

在實際決策過程中，決策者通常是將狀態變數當作隨機變數，狀態變數發生的可能性用先驗概率（prior probability）表示，以期望值準則（expectation rule）作為選擇最優方案的標準。

但是先驗概率來源於歷史資料和主觀判斷，有一定偏差。為了提高質量，就需要進行實驗、抽樣等工作計算出當前條件下的概率，這就是後驗概率（posterior probability）。後驗概率是對先驗概率的修正。

根據自然狀態的先驗概率和條件概率，利用樣本信息求得後驗概率並進行決策的方法就稱為貝葉斯決策（Bayesian decision）。

基本步驟：

先驗分析
後驗分析
決策分析

Markov方法

馬爾科夫模型（Markov model）：是利用某一變數的現在狀態和動向來預測該變數未來的狀態及動向，以輔助決策的一種分析方法。

馬爾科夫模型與其他模型的主要區別是：它不需要從複雜的預測因子中尋找各因素之間的相互規律，而只需要考慮事件本身的歷史狀況及演變特點，通過計算狀態轉移概率預測自身狀態的變化。

馬爾可夫鏈為狀態空間中從一個狀態到另一個狀態轉換的隨機過程。該過程要求具備「無記憶」的性質：即已知現在狀態，將來狀態與過去狀態相互獨立。這種特定類型的「無記憶性」稱作馬爾可夫性質。在馬爾可夫鏈的每一步，系統根據條件概率保持現有狀態或轉為其他狀態。狀態的改變叫做轉移，狀態改變概率稱為轉移概率。

馬爾科夫模型優於決策樹發的特點主要有兩個方面：

允許狀態之間的相互轉移，及模型中的雙向箭頭，而決策樹只能是單向射線。
模型中加入了時間效應，可以進行貼現，更接近現實。

馬爾科夫模型當前應用非常火熱，什麼機器學習，人工智慧等等幾乎都是必須提到，google的網頁排序計算就是依據這個模型計算的。但是模型還是有點複雜，大家知道就可以了。