常用決策分析方法(基本方法)

上一節我們說了決策分析的基本概念,這一節我們談談決策分析常用的三種方法:決策樹法、Bayes方法、Markov方法。

決策樹法


決策樹法(decision tree-based method):是通過確定一系列的條件(if-then)邏輯關係,形成一套分層規則,將所有可能發生的結局的概率分布用樹形圖來表達,生成決策樹(decision tree),從而達到對研究對象進行精確預測或正確分類的目的。

樹的擴展是基於多維的指標函數,在醫學領域主要用於輔助臨床診斷及衛生資源配置等方面。

決策樹分類:

  • 按功能分:分類樹和和回歸樹

  • 按決策變數個數:單變數樹和多變數樹

  • 按劃分後得到分類項樹:二項分類樹和多項分類樹

  • 決策樹的3類基本節點:

    1. 決策節點(用□表示)

    2. 機會節點(用○表示)

    3. 結局節點(用?表示)

    從決策節點引出一些射線,表示不同的備選方案,射線上方標出決策方案名稱。射線引導到下一步的決策節點、機會節點或結局節點。從機會節點引出的線表示該節點可能出現的隨機事件,事件名稱標在射線上方,先驗概率在下方。每個結局節點代表一種可能的結局狀態。在結局節點的右側標出各種狀態的效用(utility),即決策者對於可能發生的各種結局的(利益或損失)感覺和反應,用量化值表示。

    繪製決策樹基本規則:

    1. 各支路不能有交點

    2. 每一種方案各種狀態發生概率之和為1

    決策樹分析法步驟:

    1 提出決策問題,明確決策目標

    2 建立決策樹模型--決策樹生長

    2.1決策指標的選擇的兩個步驟:

    2.1.1 提出所有分值規則

    2.1.2 選擇最佳規則

    2.2 估計每個指標的先驗概率

    3 確定各終點及計算綜合指標

    3.1 各終點分配類別

    3.2 各終點期望效用值得確定

    3.3 綜合指標的計算

    3.4 計算值排序選優

    樹生長停止情況:

    1. 子節點內只有一個個體

    2. 子節點內所有觀察對象決策變數的分布完全一致,不能再分

    3. 達到規定標準

    一棵樹按可能長到最大,通常是過度擬合(overfit)的。

    訓練集:用於決策樹模型建立的數據集

    測試集:決策樹進行測評的數據集。

    過度擬合的樹需要剪枝,即去掉雜訊(擬合中的誤差)。剪枝需要兼顧複雜度(節點數目)和預測精度(決策損失)。

    決策損失(decision lose):指隨機抽取的某一個個體,在樹的某決策節點被錯誤分類所引起的效用損失。

    建立決策樹的目的在於獲得最高精度的分類或預測值,以期為決策提供依據。可按照這幾個特性對其評估:準確、簡潔、易行、易理解和能發掘複雜數據內在關係。

    Bayes方法


    在實際決策過程中,決策者通常是將狀態變數當作隨機變數,狀態變數發生的可能性用先驗概率(prior probability)表示,以期望值準則(expectation rule)作為選擇最優方案的標準。

    但是先驗概率來源於歷史資料和主觀判斷,有一定偏差。為了提高質量,就需要進行實驗、抽樣等工作計算出當前條件下的概率,這就是後驗概率(posterior probability)。後驗概率是對先驗概率的修正。

    根據自然狀態的先驗概率和條件概率,利用樣本信息求得後驗概率並進行決策的方法就稱為貝葉斯決策(Bayesian decision)。

    基本步驟:

    1. 先驗分析

    2. 後驗分析

    3. 決策分析

    Markov方法


    馬爾科夫模型(Markov model):是利用某一變數的現在狀態和動向來預測該變數未來的狀態及動向,以輔助決策的一種分析方法。

    馬爾科夫模型與其他模型的主要區別是:它不需要從複雜的預測因子中尋找各因素之間的相互規律,而只需要考慮事件本身的歷史狀況及演變特點,通過計算狀態轉移概率預測自身狀態的變化。

    馬爾可夫鏈為狀態空間中從一個狀態到另一個狀態轉換的隨機過程。該過程要求具備「無記憶」的性質:即已知現在狀態,將來狀態與過去狀態相互獨立。這種特定類型的「無記憶性」稱作馬爾可夫性質。在馬爾可夫鏈的每一步,系統根據條件概率保持現有狀態或轉為其他狀態。狀態的改變叫做轉移,狀態改變概率稱為轉移概率。

    馬爾科夫模型優於決策樹發的特點主要有兩個方面:

    1. 允許狀態之間的相互轉移,及模型中的雙向箭頭,而決策樹只能是單向射線。

    2. 模型中加入了時間效應,可以進行貼現,更接近現實。


    馬爾科夫模型當前應用非常火熱,什麼機器學習,人工智慧等等幾乎都是必須提到,google的網頁排序計算就是依據這個模型計算的。但是模型還是有點複雜,大家知道就可以了。


    推薦閱讀:

    山根面相分析,山根出現橫紋代表什麼?
    哥來分析溫州金融地震的真相!
    抗感冒藥物分析
    見死不救是否構成犯罪?(案例分析)
    2012壬辰年家居風水分析與太歲三煞五黃

    TAG:方法 | 決策 | 決策分析 | 分析 |