認識與思考之一：關於兵棋推演特徵內涵的討論！

02-02

張永亮、陳希亮

兵棋是通過對過去的深刻理解而得以跳向未來的工具，兵棋是模擬、歷史和科學的結合體，是紙片時間機器。

——美軍著名民間兵棋設計師鄧尼根

2017年，伴隨席捲全國各大軍校與地方高校的三大賽事：首屆全國兵棋推演大賽、首屆京津冀高校兵棋推演邀請賽、全國兵棋推演大賽—「中創杯」南通邀請賽的圓滿落幕，以及近幾年以美軍為代表的北約軍隊重振兵推的系列動作，還有國內眾多科技公司掀起研發兵棋系統（或模擬系統，本文不做狹義上的區分）的勃勃雄心，特別是人工智慧在智能棋牌類遊戲領域的突破性進展，中科院自動化所「先知一號」AI分隊指揮員在全國兵棋大賽上的不俗表現，DeepMind團隊進軍《星際爭霸》，有學者甚至稱2017年為智能兵棋推演元年。

從我們老祖宗最早提出的陣法演示（「解帶為城,以牒為械」）到19世紀初普魯士（現在的德國）人馮·萊斯維茨父子發明的基於理化計算的真正意義手工兵推（利用「克里格斯貝爾Kriegsspiel」進行戰爭遊戲（Wargaming）式的宮廷展示），到一戰與二戰期間德、美、日軍廣泛應用的大規模戰役軍團兵棋推演，再到現代美軍依託JTLS（聯合戰區級作戰模擬系統）、JCATS（聯合衝突與戰術模擬系統）、VBS等計算機兵棋系統開展的系列兵推，可以說兵棋推演作為一種古老的戰爭模擬手段，一直在實踐運用中發展。那麼是什麼原因又讓兵棋推演「重新回歸」了呢？兵棋推演特徵內涵又是什麼？後信息時代中西方對「兵棋推演」的認識一致嗎？我們對兵棋推演的爭議與分歧又在哪？下就來面談談近年來我們參與兵推、研究兵推的幾點想法，僅供參考。

關於兵棋推演的特徵內涵的討論

這個問題是後續問題討論的邏輯起點，否則容易造成對不同事物的無謂爭論。熟知兵棋推演歷史發展脈絡的人而言，這本來不是個問題，只要弄清兵棋推演概念由來，以及其組織與應用，就不難理解。然而，兵棋推演在我們當下（無論是軍方還是民間），有兩種認識：一種是工程技術的領域專家，從純建模與模擬（M&S）的角度來解讀兵棋和兵棋推演，認為純屬開歷史的倒車；另一種軍事訓練或作戰研究的軍事領域專家，認為基於回合制的兵棋推演很有「味道」，可以反映實際作戰指揮雙方策略博弈對抗過程，與現在我們開展的計算機模擬有區別，應當大力推開。

暫且不論誰是誰非。這裡只強調說明，基於兵棋的虛擬推演，其核心是「推演」。即通過合理的推演設計，來確保兵棋推演過程與結果的合理性與科學性。這裡的「推演設計」是關鍵，可以從三個層面來理解：合理的組織布局、規範的推演規則與科學的支撐技術。也即是我們在指揮決策學中經常提到的組織決策、方法決策與技術決策，這三者是確保決策科學高效的要素。同理，也是確保兵推合理性的關鍵。這裡推演布局，包括整體布局樣式（開放式、封閉式和現地式）的選擇，以及兵棋推演對陣雙方指揮機構與裁決機構內部角色編配與職能區分；科學的方法是指，兵棋推演的流程與規則體系設計（隨著兵棋的計算機化，這部分被視為作戰模擬工程建設中的「數據工程與模型工程」的任務）。推演流程，包括對回合制、半回合制、實時制或其他結合方式的選擇，以及每種推演流程下決策階段、時節的設計，這是衡量兵棋推演能否滿足指揮決策訓練或作戰問題分析合理性的關鍵一環。例如火力戰採取回合制嵌入四個階段的流程設計方法，《魚叉》兵棋採取高速交火與低速交火相結合的流程設計思路。科學的支撐技術則是指支撐兵棋推演的手工兵棋構件（作戰板、運算元、規則與骰子）或計算機兵棋系統開發技術，這也即是我們這麼多年在計算機作戰建模與模擬領域的主要工作。這其中兵棋規則體系的建立，是手工兵棋和計算機兵棋系統能夠進入實戰化運用的關鍵，是兵棋推演的「靈魂」所在。

啰嗦這麼多，無非想說明一個問題，即我們國內提及的兵棋推演，與西方運用兵棋推演體系進行作戰模擬的不一致：我們設置了兵棋推演的機構，研發了計算機兵棋系統，而或輕視或弱化了其中兵棋規則體系的建立。這也有其歷史原因，上個世紀80年代我們引入了西方開展計算機作戰模擬的思想、基於軍事運籌的建模方法，以及計算機模擬技術，在模型建設上稍做停留，即直接用於了計算機兵棋系統的研發。所以，我們對「兵棋作業」的定義是：「按設想的作戰情況和要求，以隊標、隊號和模型為棋子，在沙盤或軍用地圖上研練組織指揮的作業。是想定作業的方式之一。」這種結果的背後，是當時我們整體建設的滯後和計算機模擬人才的缺乏造成的。而在德美式計算機兵棋系統發展背後，卻是其民間與軍方嚴格式（刻板式）兵棋的大發展（湧現出了以《火力戰》、《機械戰爭2》、《魚叉》、《猛禽》等多級多類的典型兵棋），從而為其積累了豐富而實用的兵棋規則與數據。

回到正題。實際上自普魯士將兵棋推演用於戰爭模擬始，普魯士參謀總長卡爾·馮·穆福林就驚呼：「這不是遊戲，這是真實的戰爭，我要儘力把它推廣到軍隊。」兵棋推演雖然隨著人類文明的發展在不斷與時俱進，但其能夠「模擬」真實戰爭進程的三個基本特徵是被沉澱下來的，這也即是普魯士後來的參謀長老毛奇乃後來的兵棋追隨者們接受並堅定利用兵推分析、設計、預測戰爭的根本原因。那麼這三個基本特徵是什麼呢？

一是「人在迴路」的決策模式。人在迴路，是對「人在決策，規則做裁決」這一過程的表達。人類指揮打仗過程，可以抽象為由決策點與行動過程交織形成的複雜決策樹與若干行動鏈。因而兵棋推演，實質是對「人在迴路」的OODA指揮控制過程的模擬（細究一下，兵推中的「回合」即是對一個OODA周期的高度抽象）。其中，第二個「O」（Orient,判斷）與第三個「D」(行動決策)交由指揮員來做。其他則由兵棋規則來完成。這是區別於了「由虛擬的人操作虛擬兵力的」的「人不在迴路」的構造模擬。

不難看出，兵棋推演則著重體現了，由指揮員在認知域的決策判斷，由兵棋規則在物理域與社會域的交戰結果裁決（可以是查表也可以利用計算機輔助自動裁決）的過程。我們認為這也是兵棋推演能夠更加合理模擬真實作戰過程的重要原因之一。首先是戰爭的複雜性決定了目前計算機模擬技術與機器學習方法還無法對戰場態勢合理認知與自動決策，雖然現有基於深度學習的態勢理解與基於深度強化學習/納什均衡CFR演算法的決策優化，在棋牌類AI上取得了顯著成功。然而，面對非完全信息條件下不確定性戰爭博弈問題，人類還顯得沒有太好的解決辦法，特別是更強調指揮藝術的戰役以上決策問題。

從歷史上看，兵棋推演，將面向特定任務目標的複雜戰爭行動過程，通過實際指揮員的決策與基於戰爭經驗性規則與數據的行動裁決，進行「分而治之」地分解，並在其中加入了「人的有限理性決策」帶來的不確定性與戰場隨機事件帶來的不確定性，從而為尋找達成戰爭目的的決策方案提供了合理解決辦法。這種不確定性也正體現了克勞塞維茨提到的「戰爭阻力」，也因此能夠科學體現兵棋推演對「勝戰不復」這一特徵的模擬。

從這層意義上看，戰爭模擬走過了傳統手工兵棋+運籌分析方法形成「人不在迴路」的模擬推演模式後，重新重視（而非取代）「以人為中心」的指揮決策運用模式，也是對「以人為中心」的戰爭複雜體系的理性再認識，這也是前幾年美軍在「知識中心戰」中遵循的基本思想。也正契合了毛主席「戰爭中人是決定因素」的論斷。

二是「博弈對抗」的運用形式。戰爭是一種社會活動，「是一種集體和互相使用暴力的活動。」馬克思說，人是一切社會關係的總和。兵棋推演作為有人參與的「虛擬演兵」，就必然要體現出敵我雙方或多方的暴力對抗關係。因而，我們認為，兵棋推演自普魯士軍隊發明「克里格斯貝爾」之日起，就蘊含了這種博弈對抗的思想。

由兵棋的英文「Wargame」和兵棋推演「Wargaming」的英文（當然這種英文稱呼還有爭議，但並不是本文的重點）不斷演變過程，以及即便其應用在政治、經濟諸領域，但一直沿用這種稱謂的做法本身，就可見兵棋推演「博弈對抗」的基本特徵，在不斷時代變遷中得到了廣泛的認可。美軍兵棋專家彼德.波拉博士在其《兵棋推演藝術》指出:兵棋，「是指可供對弈雙方依據各自決策和一定規則，以對抗形式進行作戰過程的推演工具。」美軍在《定下戰術決心的過程》也強調了這一模擬方法的運用，「兵棋推演就是依據所給定的己方實力與配置、敵方兵力兵器和可能的行動方案以及一定的地形條件有意識地顯現一場戰鬥的過程。」相較於諸多領域動輒就將基於六角格的單方事件的模擬推演稱作「XXX兵棋推演系統」而言，顯然只是借鑒了「兵棋推演」的形而忽略了其「魂」。

那麼這種博弈對抗又有什麼優勢呢？可以體現戰爭本身人的活力對抗特徵，用於指揮員訓練，可以啟髮指揮員的決策思維，歷練其謀略水平,讓模擬藍軍發揮「磨刀石」的作用；用於作戰方案或發展策略推演則可以創造更加逼真的情境，排除一廂情願的「自說自話」，發現策略上諸多漏洞和不足，進而為優化決策方案提供依據，真正發揮兵棋推演「實驗室」的作用。

三是基於歷史統計分析的兵棋規則。這一提法，與國內兵棋著作《戰術兵棋發展應用研究》中的觀點基本一致。這也是我們國內這幾年呼喚兵棋推演回歸的重要原因之一，當然還有其他諸多方面的因素吧（具體原因不再細表）。但有一點要說明的是，信息時代西方計算機兵棋推演發展較早，早已完成並跨越這一階段，更強調這種方法與運籌分析、實兵演習的互補式融合。（詳見《兵棋推演藝術》）

兵棋推演是指揮決策人員按照特定的推演機制，實現對虛擬兵力的指揮與控制過程，再現戰爭進程中的複雜決策樹與若干行動鏈（再次重複，表示強調）。前者，是靠指揮員在決策迴路的推演規則設計來實現合理性，那麼行動鏈的合理性就得靠兵棋規則。這裡的兵棋規則，我們認為主要包括行動規則與裁決規則。推演機制規定了兵棋推演的基本流程，是對不同作戰樣式OODA過程的抽象，如《火力戰》中的每回合四階段設計，《機械化戰爭77》中對計劃、機動、直瞄、壓制、間瞄等階段的區分；行動規則給出了雙方兵力兵器受到自身性能、地形條件、氣候特徵等因素的限制關係；裁決規則，則由戰爭歷史數據擬合得到的若干裁決表（手工兵棋而言）給出，也可以由基於概率論與數理統計方法求得的線性/非線性模型（計算機兵棋系統）來體現。總之，這種兵棋規則與數據是對戰爭歷史經驗的高度抽象，是對戰爭歷史事實的統計分析。這正是西方兵棋設計專家鄧尼根、馬克·赫爾曼在兵棋設計與應用中總結歸納的「基於歷史的兵棋分析方法」的精髓所在。

為什麼就認為這種規則設計與數據擬合就一定合理呢？我們認為，這種由外而內的規則建模思路與當前基於機器學習的思路是契合的，都是讓「事實數據」來說話，其本質是從歷史數據中「挖掘」戰爭規律並用來預測戰場事件。因為，戰爭體系的複雜性，在過去近一個世紀運用基於軍事運籌方法（特指發端於二戰護航、反潛和防空作戰中的軍事問題定量分析方法，主要應用於決策優化）的解決辦法被證明存在諸多不合理性，這也是我軍自八十年代將傳統軍事運籌方法應用於計算機作戰模擬以來，廣受質疑的原因之一。基於這種軍事運籌方法構建的模擬模型，當然有其科學性，但很容易出現「累加性偏差」而導致模擬結果偏離客觀實際。因為這種「由內而外」的建模方法，更多地是對理想或標準條件下的量化計算，而面向非標準條件的實戰規則修正難免「掛一漏萬」。特別是進入信息時代，基於信息系統的體系作戰，從合同戰鬥到聯合戰役，反映戰爭中網路支撐、信息共享、分布指揮、要素聯動、戰場密度等綜合作用效應的複雜系統涌顯性，還無法用合理的解析模型予以表達。反觀，基於歷史的兵棋規則建模方法，則是以戰例或靶場實驗數據為基礎，利用戰爭中事件的發生概率和戰果進行規則修正，從而在模擬戰爭宏觀作用效應上與實際作戰相吻合，跨越了難以準確認知複雜世界這一「瓶頸」。這種方法，用在案例式兵推，或機械化條件下的評估式兵推，還是比較科學的，因為有充分的戰爭歷史數據支撐。這也與目前大數據時代，諸多行業運用以深度學習為代表的機器學習來發現「知識」又何其相似，前提是都要有「樣例」數據。當前深度學習已經在機器翻譯、語音識別、圖像理解、自動駕駛等領域已經成功應用，可見一斑。美國兵棋設計專家鄧尼根、馬克.赫爾曼等人基於這種方法設計了一系列兵棋，並得到了美軍和防務機構的認可與推廣。

當然，事物總是與時俱進的。進入信息時代，兵棋推演的計算機化不可避免。隨著計算機建模與模擬技術的日漸成熟，在武器平台至分隊戰術模擬層次上，多採用由內而外的軍事運籌建模方法，因為該類問題多為結構化或半結構化，且規則清晰，對模擬細節要求高；而在分隊戰術到聯合戰役層次多採用由外而內的概率論與數理統計分析的數據統計方法（可以是手工的數據裁決表，也可以是計算機擬合模型），得到作戰單元、作戰要素乃至作戰體系的宏觀結論，同時與實兵演習（Live）、運籌分析方法（OR）相結合，使得兵棋推演結果更可靠。美軍當前正在開發的JWARS（Jonit Warefare System）,正是這二種方法的有機結合。

以上對兵棋推演基本特徵的總結，是其在戰爭應用中被實戰所驗證且符合戰爭模擬規律性的東西，是歷史的選擇。這也是西方德美式兵棋的共識（可參見彼德波拉博士的《兵棋推演藝術》），這種對兵棋模擬的理性回歸，是兵棋運用者們在戰爭實踐和訓練中只唯實不僵化，有所揚棄的結果。

如果非要在當下來理性地界定「兵棋推演」，基於以上特徵，我們認為：通過量化戰場環境和作戰實體為地圖與棋子，以「人在迴路」的決策模式和概率分布體現戰爭的不確定性，依據從戰爭經驗、演習訓練和研究實驗中抽象積累的規則和數據進行結果裁決，並採用博弈對抗的方式和科學的推演機制來反映作戰指揮決策與戰術行動過程的虛擬推演。（未完待續。。。。）