人工智慧何時在兵棋推演中打敗人類?

經過三局苦戰,世界排名第一的柯潔完敗於AlphaGo,至此「人類最後的希望」也輸了,人類已經沒辦法阻止人工智慧在圍棋上的腳步了。那麼?人工智慧什麼時候將在兵棋推演中挑戰人類呢?

01

人類是輸了還是贏了?

5月27日,人機大戰最後一役, 當今排名世界第一的年輕圍棋大師柯潔與AlphaGo比分最終定格在0:3。其實這個結果大家早有預料,早在Master橫掃中日韓頂尖圍棋高手,豪取60連勝之後,人工智慧界的專家就已經告誡,AlphaGo的進步將是指數級的,即使柯潔九段也無法獲勝。

而這次對陣柯潔的「AlphaGo 2.0」採用了新的演算法模型,更加難以對付。原有支撐AlphaGo 1.0的基本演算法有兩類:

一是所謂的策略網路,用來訓練模仿人類行為。看過數百萬計的對局後,它已學會提取特徵、原則和經驗法則。它在對局中的工作就是觀察棋盤的狀態,併產生一些看起來更有希望的步數提供給第二個演算法考慮。第二個演算法叫做價值網路,用來評估一個步數的取勝概率。機器會根據策略網路的建議,評估數以千計的走法。

因為圍棋非常複雜,所以將所有可能的走法都走完是不可能的。作為替代,價值網路會評估數個步數後可能的棋盤狀態,並與它之前見過的例子進行比較。這種想法是找出統計意義上最像過去能夠獲勝的棋形。策略網路和價值網路結合起來構成了人類棋手需要通過幾年實踐才能累積的圍棋智慧。

AlphaGo 2.0在升級之後,應該已經超越了這兩個演算法,即沒有事先學習人類的棋譜和下棋經驗,而是在學習圍棋基本規則之後,直接通過對戰來獲得認知能力。

所以DeepMind團隊在這方面進行了大量升級,而對人類來說,由於有了人工智慧作為對手,已經完全顛覆了傳統的棋法,將促進人類棋藝進一步提高!從這一點上看,人類棋手雖然敗了,但整個人類卻是贏了!

02

人工智慧在兵棋推演上能夠打敗人類嗎?

雖然人工智慧在圍棋上取得了很大成功,但在兵棋上這種成功短期內在兵棋推演上卻難以複製。原因有以下三條:

一是兵棋的規則比圍棋要複雜得多,而且不是一成不變的,戰略、戰役和戰術級兵棋規也不一樣,而且兵棋規則會隨著武器裝備的發展、技術條件的進步和部隊編製結構等的變化而不斷更新,而AlphaGo所採取的策略網路和價值網路均是基於規則衡定的基礎下,才通過不斷累積得出的結果,而規則複雜的情況下,很難累積結果。道理就像為什麼國際象棋中,深藍很早就可以下贏世界冠軍,而AlphaGo只有在最近才取得突破一樣。

複雜的作戰體系和規則

二是兵棋推演靈活性強,可變性強,每一棋都有成千上萬種變化,因此很難尋找成千上萬的案例來進行學習,而且每次評價的標準也有所不同,評估的標準數據和關聯關係非常複雜,即使能夠找到成千上萬的人對弈,也不可能將每次對弈僅通過圍棋類似數目來評估輸贏。而沒有這個對弈的基礎,很難掌握基礎的規則,可難以有效靈活變通。

複雜的評估流程和標準

三是兵棋上的態勢是不對等的,而圍棋是透明的。敵對雙方的態勢不清晰,直接影響著決策的結果,影響進行複雜的判斷,使得人工智慧的決策演算法和模型更加複雜。

複雜不對等的戰場態勢

但是,雖然如此,我們必須要看AlphaGo 2.0已經探索了一條路徑,只要繼續沿著這條路徑走下去,很快就會看到兵棋推演上人機對戰的局面。

03

人工智慧軍事應用前景,誰將搶佔先機?

實際上AlphaGo的深度神經網路技術:「策略網路」(policy network)和 「值網路」(value network)技術已經完全能夠運用于軍事行動之中,也許美國軍方正在謀求應用之路。

那麼未來作戰中,人工智慧將發揮什麼樣的作用呢?很顯然未來作戰將更加是體系與體系的對抗,平台武器的效能將會日益被體系效能所削減。

人工智慧+兵棋+網路化指揮控制系統+無人系統」將構成未來新的作戰體系。在這個體系中人工智慧+兵棋是輔助人決策的大腦,控制控制系統是神經、無人系統是手臂。

通過在兵棋推演中獲取的經驗將使人工智慧進一步發展,依據兵棋的規則,人工智慧將能夠提供高級智能輔助決策,能夠料敵先行、抓住關鍵時節,給敵以致使一擊。

如對戰場態勢感知,傳統的方式是偵察獲取多維戰場態勢後,依靠人工判圖、辨別信號或比對頻率,分析判斷敵情。而有人工智慧的輔助,在大數據和深度演算法支撐下,就可極大提高效率,快速形成戰場態勢,以料敵先行。

快速判斷戰場態勢

同時依託在兵棋推演中形成的人工智慧大腦,人工智慧可充當智能參謀,作戰計劃和方案會快速形成、自動校驗,會實現多級協同、自動避免誤傷,多種行動方案快速評估與優化。

智能決策,搶佔先機

普魯士時期,總參謀長老毛奇依託兵棋培訓參謀、制定計劃和評估方案。未來依託人工智慧支撐的兵棋也可擔負同樣的任務,只不過效率更高,更加優化。

但是,人工智慧為大腦的作戰體系需要與兵棋、指揮控制系統、無人系統共同支撐,兵棋用於訓練人工智慧並與人工智慧相融,形成決策優勢。指揮控制系統形成態勢感知和指揮優勢,無人系統形成平台優勢。

而全世界能夠形成全面優勢的只有美軍。首先其建立了涵蓋戰略、戰役和戰術級的兵棋系統,其次美軍形成了完善的指揮控制系統框架,指控系統領先世界。

美軍戰略戰役戰術兵棋系統

美軍指揮控制系統框架

聯合作戰指揮平台(JBC-P)

同時美軍又具有實戰性很強的無人打擊平台體系,再加上AlphaGo2.0的先發優勢,因此美軍具有足夠的優勢。但也不是後發國家沒有希望,只要開始足夠重視,合理規劃發展路徑,高起點籌劃,將人工智慧技術深度運用於兵棋、指揮控制系統和無人系統中,實現彎道超車並不是沒有可能的。

最後以《桌面戰爭》一書後記作為結語:

進入新時代,軍事變革從機械化向信息化發展,再從信息化向智能化發展,當Alpha不僅戰勝的人類圍棋高手,更戰勝了人類飛行員時,未來人工智慧在軍事領域的應用必然引領軍事變革的趨勢,通過人工智慧進行作戰將變成現實。而細究人工智慧之後的規則、演算法均與兵棋規則、數據和底層演算法相關,不通過兵棋建設發展促進軍事規則、智能化演算法的發展,將很難在未來戰場獲取智能優勢。可以預見在未來戰場,當落後國家由人指揮的坦克洪流向先進國家由計算機AI支撐的無人作戰平台蜂群發起攻擊時,其結果只不過是波蘭騎兵向德國坦克集群衝鋒的翻版。所以當落後思想還依舊在沉醉於X代坦克、X代戰機、艦艇時,新的戰略思維應將目光投向X代智能大腦上,兵棋規則和數據底層是未來智能基石,基礎不牢地動山搖,所以應該重視!

————《桌面戰爭》一書後記

桌面戰爭公眾號:wargame11,兵棋交流者平台,挖掘兵棋原理及背後的故事!

歡迎瀏覽本號精品文章

1.【焦點!】美重振兵棋推演,意欲何為?

2.【揭秘!】「薩德」系統部署在兵棋中如何推演?

3.【焦點!】美軍軍改,我們能從中學到什麼?

4.「先吵架再融合」——美多軍種融合平台空陸海應用中心的「前世今生」

5.【關注!】這個概念從提出到融入聯合條令,美軍用了三十年!

6.引導打擊尖兵—美軍聯合終端空中控制員(JTAC)運用及訓練

7.【關注】精神食糧,兵棋經典書籍推薦!

8.兵棋—歷史與未來之十三:美軍逆轉型之路!

9.【深度!】為什麼兵棋沒能在中國推廣?10.【觀點!】兵棋思維:打破範式,變革作戰研究方式!

11.【關注!】美軍戰區用什麼系統指揮作戰?

12.【關注!】美軍如何評估火力安全距離!13.【關注!】美軍兵棋系統發展了多久!

14.《桌面戰爭》一書前沿及目錄!

推薦閱讀:

TAG:兵棋推演 | 人工智能 | 技术 |