中國的算命能不能算是模式識別?特徵是生辰八字,輸出是特定的命運?


算命行業內的機器學習...腦洞開得太大收不住了啊

  • 算命行業內的貝葉斯學習
  • 算命行業內的聚類分析
  • 算命行業內的遺傳演算法

就個人感覺來講,我覺得算命這一行當可能早就掌握了貝葉斯學習的技巧.首先從師傅那裡學習了先驗概率,跟著師傅算命的過程就是用訓練集計算後驗概率的過程.大概流程就象這樣:

  1. 師傅教授徒弟先驗概率,就像是

    ##道上混的人其實能打的只有三成
    ##這一片道上混的人裡面藍翔出身的只有10%
    ##不過少林寺出來的有30%"

    這樣子

  2. 師傅帶徒弟實習,這時候徒弟不能插嘴,只能看師傅給別人算命(或者看師傅挨揍,不過效果是一樣的)大概獲得了以下的經驗:

    ##藍翔技校出身的能打架的概率是90%
    ##少林寺出身的能打架的概率只有(9)

  3. 師傅和徒弟一起蹲馬路牙子上看人打架.看到一人左手麒麟臂右手寶礦力身背量天尺在人堆里開無雙,師傅問徒弟"你看這人是那出來的?"
  4. 小徒弟這時候就開始算了h_{MAP} = argmax_{h in H}P(h|D)..這樣,然後

    ##P(藍翔出身|能打架的)=(P(能打架的|藍翔出身)*P(藍翔出身))/P(能打架的) = 0.3
    ##P(少林寺來的|能打架的)=(P(能打架的|少林寺來的)*P(少林寺來的))/P(能打架的) = 0.09

    要算argmax嘛,那這個人當然是藍翔來的嘍

  5. 然後師傅屁顛屁顛去上煙,問人家是不是藍翔來的高手,要是沒挨揍,小徒弟就基本出師了

不過只有這點水平在算命這個智力密集型行業也不好吃飯,在長期的,堅持不懈的挨揍中小徒弟發現了這樣一個道理:

一個人能不能打不止和他的出身有關係,看問題不能太片面,少林寺也是有很厲害的方丈的嘛

而且小徒弟也學會了察言觀色,之前只能看到一個人是不是能打,現在通過觀察能得到這樣一個元組:

(是否能打架,是不是光頭,會不會開挖掘機,喝不喝酒,吃不吃肉)這樣.在有了足夠的數據積累後就可以用這樣的式子來計算:

h_{MAP} = argmax_{v_{j} in V}P(a_{1}, a_{2}, cdots a_{n} | v_{j})P_{V_{j}}

這樣計算雖然簡單而且相對準確,但是要求小徒弟見過的人足夠多,這樣才可以相對準確的估計P(V_{j})(其實就是這樣的人在之前出現的頻率)於是隨著年齡和經驗的增長,小徒弟就變成了很厲害的老師傅......

section{算命行業內的聚類分析}

剛才提到了算命行業內的貝葉斯演算法,不過這種演算法要求一個人的閱歷足夠多,才能得到相對準確的結果,而且這樣的模型也很難一代一代的,師傅傳徒弟的方法傳遞下去.於是新方法的開發就勢在必行了.俗話說物以類聚人以群分嘛,就用聚類分析好嘍

************************************佔個坑有時間再更新**************************************


算命採用了非常高級的演算法,它是generative model + discriminative model。

首先,它有一個先驗的generative model。

比如易經,紫微斗數之類,這是前人大數據訓練的結果。可以比較粗糙的分析事物之間的相關聯繫,比如乾卦,描述了事務發展的幾個階段,潛龍勿用、先龍在天、飛龍在天、亢龍有悔,一如艾略特的5上3下波浪圖,樸素的自然規律。這個模型其實很重要,不光可以給一個基本的思路,而且可以denoise,把握事件的清晰脈絡。

其實,它還有一個discriminative model。

很多命理師整天走街串巷,收集數據情報,比如所有人的家庭成員、狀態,誰家死了人,誰家生了病,誰家發了財。

光有數據的採集還不行,回家後還得進行數據的清洗、存儲、分析,最後對當事人家人的心理進行假設(比如家裡死人了,會擔心是否還會有血光之災,那麼可以建議其破財擋災。),通過隨後的實戰檢驗label反饋修正自己的模型,完成一輪假設檢驗的train,如此反覆,最終成為一代半仙。每一個立志成為頂級命理師的人無疑都是要是一個勵志的的存在,需要反覆調參,反覆train,最終才能一擊命中要害,讓萬眾敬仰。

時代在進步,人類在發展,現在我們都提倡採用科學算命,數據採集量必須足夠,必須用上大數據、分散式,什麼購物記錄、貸款信息,論壇留言統統採集。分析必須嚴謹,要上就是depp learning,dbm,dbn,cnn,ae+cnn,cnn+dbm,一陣調參,一統train,deeper than deeper 最終成為新一代deep plus blue。


不是,沒有訓練學習的過程。

唔,具體說,模式識別一定是兩個步驟,1.根據已有信息找規律,比如根據一堆前人的面相和命數,研究出面相和命數之間的規律。2.利用找到的規律做預測,比如來一個人,根據他的面相來預測他的命數。1叫做訓練學習,2叫做測試預測。算命只有2沒有1。


對業務本身的認識才是重點吧,生辰八字的話,特徵數量是不是不太夠啊。。


哎呀,今天剛剛想到這個問題。

我認為算命是一種固有方法,而不是模式識別。

因為算命方法是自成一套理論的,這套理論是形而上的,和模式識別無關(去研究一下算命方法你就明白)。

但是我們可以用模式識別的方法去優化算命的過程,因為生辰八字定性為多,定量為少。

耶~~~~~


腦洞好大。。。不懂幫頂


推薦閱讀:

如何向外行人解釋模式識別和機器學習中的 Generalization 機制?
有沒有值得推薦的隨機森林 Random Forest教材?
EM演算法怎麼用在聚類上?
機器視覺需要學習哪些數學知識?
圖像金字塔除了sift演算法之外還有什麼應用?

TAG:機器學習 | 模式識別 |