【古為今用】周易術數應用研究,對大數據輿情預測發展的四點啟示
至陽子醫道傳承
進入21世紀,大數據模式及其相關研究,在物理學、生物學、環境學等學科以及軍事、政治、經濟等領域已然發揮了重要作用,並帶動互聯網和信息行業以超乎想像的速度發展,特別是應用在社情民意、政策研判上的輿情預測,更是在近些年受到各國政府重視的一項重要工程,對於海量數據的挖掘和運用,預示著新一波生產率增長、產業革命浪潮和政治體制改革的到來。
同時,作為雲計算、物聯網之後,IT行業的又一大顛覆性的技術革命,大數據理論的誕生及發展,使數據成為一種真正的資產,融合國家、企業、組織、個人的各種交互信息,聚合成前所未有的信息庫,其數量將遠遠超越現有IT架構和基礎設施的承載能力,實時性要求也將大大超越現有的同行業承載能力。
眾所周知,數據挖掘預測建立在對樣本數據(歷史數據)的輸入值和輸出值關聯學習,從而得到預測模型,再利用該模型對未來的輸入值進行輸出值預測,隨即也就形成了大數據預測的悖論,一方面數據量過大,原有的固定分析模式模型難以承載,另一方面,國際國內複雜的形勢又亟需大數據在各種事務中發揮決斷作用。
對於這個問題,作為一名國學研究者,我在此提出自己的實踐心得——中國傳統文化中的周易術數研究可以為大數據輿情預測的發展提供借鑒。
實際上,中國的古人早在2500年前,就提出了關於數據分析、歸納、預測的基本模型,這就是《周易》,而後又進一步發展,直到近100年前,形成了以大六壬、奇門遁甲、子平八字、六爻(火珠林法)梅花等模型為主,一系列被稱為「術數」的實踐經驗主義哲學體系。單純的《周易》,其實用功能很有限,必須配以適當的術數方法,才得以在實踐中施展,這就像辭典和寫作程序之間的關係。
在本質上,周易和術數,並不像某些報章所宣揚的那樣妖魔化,是封建迷信的產物,而是建立在陰陽二元論基礎上對事物運行規律加以論證和描述,同時對天地萬物進行性狀歸類形成以天干地支五行論為首的「象義」,得出事物間的相似性和關聯性,從而對事物的未來狀況做出預測,像中醫一樣,是一門建立在大量數據成例收集上的經驗主義實用學科。
周易術數是以時間、空間、內因和外因這幾個基本因素作為資料提供分析的依據,程式的建立則以時間作為最主要的分析依據,也即是與天體運動密切相關。基於時間,將空間環境、人事變化、偶然因素(外應),以「象義」轉換為「數據」再以「新數據」轉換為「新象義」作為根本推導方法。不論以怎樣的方法獲得象義,都要將預測的時間排成天干地支,在分析過程中要看卦象或爻旬在此時間內處於一種什麼狀態,根據著眼點(用神),然後結合卦象、爻象、組合本身的生克制化關係得出吉凶成敗和所主吉凶內容的判斷,或提煉出發生事情具體時間的判斷。
直白地講,必須學會相應的預測方法,周易六十四卦、五行、天干地支等中國傳統的象徵主義元素,才能在現實中發揮實際意義。
在我們已知的知識體系內,時間是天體運動的反映,沒有天體的運動就沒有了時間,任何事物也就不會發生。時間在周易術數體系中,是第一重要的,其次就是空間,再次是具體因素,同時時間空間人事甚至能互相聯繫,比如甲這個天干,在時間上代表凌晨3點左右,代表甲天乾的年月日時,代表春天,在空間上,代表東北偏正東的位置,在人事上代表領導貴人長輩,在身體上代表頭,在物體上代表烏龜、樹木等等。這就類似於大數據同一數據的多元化。
關於大數據與周易術數預測的實質相同之處,甚至周易術數可以為大數據輿情預測發展提供必要的借鑒,主要著眼以下幾個方面:
一、數據的規律化——「不易」
數據是紛繁複雜的,永遠都處於不斷變化完善之中。在上古,《易經》本身也經歷了連山,歸藏,周易的變化,據說其最初的名稱為《變經》,就說明了「變化本身永恆」的道理。
「易」字,是由日和月組成,有簡易、變易和不易三個特點。簡易,如上日下月,光明顯而易見;變易,如日月常新,變化是永恆的;不易,如日月經天,規則有常。「數據」也是《周易》和術數的內核,八卦共含六十四個卦,一卦含六爻,六十四卦為三百八十四爻,術數里的火珠林法和梅花易數兩種方式,就是通過六爻組合的變化,結合不同的彖辭、爻辭,揭示事物發展的變化規律,揭示了宇宙萬事萬物的生成與發展,順其自然,靜以守常,即可從小到大,從弱到強。周易及一系列術數學,在中國古代被稱為「帝王之術」,被諸多政治名人所研習,已知的如張良、諸葛亮、李世民、趙普、康熙、曾國藩等等,在其治國治政的道路上發揮了巨大作用。
21世紀,大數據輿情時代帶來的海量經營數據亦如此理,受眾的口味習慣是日新月異的,大眾對於需求「喜新厭舊、眾口難調」,信息焦點「難以捉摸」,整個世界環境隨時隨刻都在變化。
中國的網民已經達到8億,上網的普及率幾乎到達一半。互聯網輿情的發展也成為的我們現在各級黨政機關和企事業單位都非常關注的一個話題,已經使得傳統的社會輿論構成發生了變化。過去我們主要的社會輿論主要是以報紙、電視、廣播這樣一些傳統媒體為主構成的。而現在互聯網時代我們說以網上自媒體為代表,新的社會輿論場正在形成。
龐大數據量,是個天文數字——輿情數據獲得方式、輿情數據產生的環境,以及輿情數據結構是否完整的問題,引發我們需要去思考,如果想真正知道網民、受眾需要什麼,單純依靠冷冰冰的數據統計,卻沒有對人性化的生活和言論場景的觀察,你很難覺察到大眾真正的心理驅動力。
這就必須能夠從「萬變」中抓住「不變」,建立起一系列像周易術數那樣的基礎分析模型公式,規律化地快速地將數據帶入運算,挖掘到並遵循與利用歷史的規律、特定團體的規律、社會發展的規律、人性的規律等等,這就為掌握大數據紛繁負責的外表下,安裝了可掌控的內核,可以快速地切換到實操主宰。
二、數據的精簡化——「簡易」
《周易》,是把具象的事物,簡化為六十四卦的形式,術數是以各種模型,模擬人生的種種情況——比如子平八字,就是以十天干十二地支的4萬多種組合,演示4萬多種人生,以這種實驗室模擬自然的形式,說明自然規律,並倡導人類遵從自然規律。
這一點完全是科學的精神,是值得肯定的!
無論是一個社會、一個群體,一個人,均有必然恆定的規律;除去固化的教條信念之外,周易術數預測,就是透過表象看本質,簡化概況的過程,不僅看到事物的內外層次,還要看到事物的正反面,從抽象到具體,再由具體到抽象,得出結論。
大數據輿情時代來講,數據挖掘就是整合各個層面的數據資源,要將具體內容精簡成寥寥數語的有用信息。這種基於規律的運營模式,之所以在目前還處於探索階段,精準度與效益度還不高,就是因為沒有一套通用的、極具規律性簡化性的類似周易術數規則的內在分析體系,將數據精簡歸納——尤其是對於粗放式、政策性的中國輿情分析來看,更是如此。
三、數據的複雜化——變易
大數據最重要的特點是一個「大」字,特別是包含海量的「模糊數據」,模糊數據中有很多缺乏精準性或可忽略的,甚至許多是有害的,但大部分卻是對整體數據卻非常有價值的,就像實驗室得出的大量數據,其中必定存在諸多誤差因素,但誤差本身,是有價值的,說明了實驗中非正向的可能性。
互聯網已經日益成為熱點事件曝光的主要平台和輿論的獨立源頭,大量的事實證明,超過80%以上社會新聞的披露,第一時間不是從正統的媒介傳播出來,而是從互聯網上播發出來。特別是一些公職部門的工作人員在公開場合的一些不當言詞很快就會引起輿情的波多,網路成為凈化政壇的一大力量。群眾廣泛參與,這就是當前輿情發展的第一趨勢。
另一個趨勢,就是所謂「意見領袖」的作用,他們關注新聞時事、在網上直抒胸臆,與傳統的意見表達主體存在很大的區別,本身喜歡發表觀點,有比較獨到的觀點,為他人提供了很多信息,其觀點可以影響更多的人,許多第一手資料就是由他們發布出去的,互聯網可以說是他們話語權的延伸。
還有一個趨勢就是輿情發布的工具和形式不斷發展,網上發布與網下參與相聯繫,過去僅僅是論壇、帖子,主體僅僅是電腦,而現在手機、平板電腦正逐漸取代電腦的作用,微信、微博、微博客、播客已經佔據主要輿情通道,發布者從躲在電腦幕後,也不時跳到前台,由此數據量更是大量增加。這也就為輿情預測,帶來了前所未有的複雜性。
在周易術數體系內,預測是必須考慮複雜的現實情況,即誤差和偶然因素的影響,在象、數、理、占的整體思維中,通過太極、陰陽、五行、干支、八卦等一系列的範疇模式來推演,要把特別的偶然因素、外在環境帶入模擬過程。比如在六爻(火珠林)卜卦時,人一定要虔誠集中精力,通過激發人的精神動力,從各種卦象中尋找與詢卦人處於相同或者類似境地中的卦象,得出結論,這就是盡量排出干擾的做法;梅花易數則反之,誤差、偶然性越多越說明問題,要將當時的各種環境參算進去,甚至某一方面的變化能影響整個大局。
這種思維完全可以作為大數據預測的借鑒,就比如在做數據分析的時候,有時必須從龐大的數據中選取某個維度,測算某兩種看似無關因素之間的關係,甚至有時經驗、直覺、靈感會成為預測的主要引導,即人腦與電腦相聯繫,發揮預測主觀能動性。
四、數據的偶然與必然——測不準現象
周易術數預測,與大數據輿情預測一樣,都是一種以現實數據到理論化公式再指導具體的實驗室模擬方式,所不同的是,前者用人腦,後者用電腦,所以不可能不出現差錯和誤差。
看似無關的事件通過卦象、邏輯分析和數理轉換聯繫起來,這本身就存在風險,因此測不準自然也就成為必要。在實踐中,主要是杜絕差錯,減少誤差。
人腦和電腦的區別,在於後者只是程式化地執行操作設定,而前者卻能夠產生主觀能動性。大數據預測模式,之所以準確率尚處於未定階段,就是由於人腦的主觀能動性,開發不足。
谷歌於2008年推出的「谷歌流感趨勢」為研究工具,採取與天氣預報相類似的預報可信度衡量標準,進行屬地化的季節性流感追蹤與預測。即該系統採取時間上每周跟蹤、空間上各地檢索的方式,對流感進行監測,以此來向生活在各地的人們預報當地的流感患病率。但這種預測不高,還不如美國疾病防控中心提供的年度預報。
這就指出了數據預測中如何排查誤差、干擾因素的問題。假如人腦和電腦相結合,應該能夠在此項預測中大大提高準確率。
再如前一階段「保定成為北京政治副中心」的人為不實報道,如果放在「保定房價未來走勢」大數據預測中,肯定只是一個偶然因素或誤差,但這個誤差就引起連續兩周的「保定房價暴漲」,如果放在一個預測整體來看,無法改變「保定房價整體下跌」的趨勢,但就此得出「保定房價上期上漲」的趨勢,就是錯誤的。必須整體與局部,長期與短期,動態與靜態,偶然與必然,相互配合來看,由此也必須人腦與電腦結合發揮作用。
在現實中,周易術數預測準確率能夠到達70%,就已經是很高的水準了,其主要受操作者水平、環境複雜程度、應用術數工具等多重方式的影響。比如子平八字預測是預測人生整體的主要工具,人在現場可以通過面相佐證,人不在現場自然準確性、全面性就下降;梅花易數要看外應,現場的天氣、人事,問卜人的動靜,都會對預測結果產生很大影響,測不準的現象是很自然的,是一個科學實踐中常出現的問題。
大數據時代,數據的量不是問題,重要的是如何在統計概括中提煉有價值的的信息,使之系統地為預測服務,有足夠的解析度才不會被數據所淹沒,要分辨哪些是與結果有著潛在聯繫的,要發現非常細微甚至隱蔽的關聯,從而掌握真實結果,當這些數據積累到一定量的時候,即使誤差很多,也會產生不可估量的分析價值。這就像周易術數預測,一般而言,斷具體事物的細節,誤差足以左右影響預測結果的準確性,但判斷整體趨勢,完全可以做到百不失一。
熱文推薦:
※ 《周易》到底是一本什麼書?
※西安周易國學的文化產業發展前景與路線圖
※【大家談易】朱自清:談《周易》
※【易道廣備,互聯互通】從《周易》看首屆世界互聯網大會
※【國術研討】周易八卦與八卦掌有著什麼關係?
※【易學研究】林忠軍:試論易學象數起源與《周易》文本形成
※【名家談易】邵偉華:周易只有走科研,才有利富民強國
※【易道論壇】《周易》有「十德」 微言大易
※【玄學論壇】《周易》與中國傳統文化的關係
※【易道論壇】《周易》那些成語 蘊涵哪些精神?
※【易道論壇】周有光:神學、玄學和科學
※【大家說易】中國智慧在《周易》,《周易》智慧在和諧
※【大家說易】南懷瑾:學習《周易》首先要懂「三易」和「易經三原則」
點贊是支持鼓勵 |分享是傳遞友誼
推薦閱讀:
※自招危險的緊急避險適用研究
※DDGS在豬日糧中的應用研究
※下編 數理奇門的現代應用研究 (續)
※低可視性和可發現性:通過四種方法找出其原因