AlphaGo 終於還是贏了,
(本文經本人授權首發與觀察者網,未經許可不得轉載)
柯潔代表「人類最強」挑戰尚在成長的人工智慧AlphaGO終於在上周末落下帷幕。事前不論圍棋圈內外都不看好柯潔能力挽狂瀾、遏制AlphaGO創下60:0橫掃人類專業棋手的勢頭, 雖然柯潔表現可圈可點,但仍然不出意外地,柯潔還是0:3 惜敗於人工智慧。不過,接下來的新聞才更有意思:
看來柯潔越挫越勇,從與alphaGo的對弈中獲得了新的靈感?超越棋局的勝負,從局外來看,這次對弈不僅僅是人類大腦與電腦的對抗,也許預示了人工智慧在將來也會反饋人腦,幫助人類的智慧站上一個新的台階?
科學家、棋士們正熱烈地討論著、憧憬著未來;但此時,將軍們或許已經在悄悄思考是否能將人工智慧引入軍事決策的前景了。畢竟從石器時代開始,最前沿的科技總是首先在軍事領域尋找自己的落腳點。
實際上,太平洋對岸的美國已經開始在這方面的探索了。去年8月,美國國防高等研究計劃署(Defense Advanced Research Projects Agency,簡稱DARPA, 隸屬於美國國防部的下屬高科技軍事研發機構,誕生了包括互聯網、圖形界面等影響深遠的重大技術) 在拉斯維加斯舉辦了網路安全挑戰賽的決賽。七支來自美國國內的隊伍參加了比賽。比賽內容為12小時的連續攻防,每個隊伍需要檢測己方主機的漏洞,及時打補丁,並且尋找對方伺服器的漏洞並且攻破。
這聽起來似乎與別的黑客攻防大賽沒什麼特別之處,但是這次比賽的直接參与者是AI,也就是說只有預先設定的演算法在執行攻防,所有的分析、攻擊、防禦完全都是計算機的自主行為,參賽隊員幾乎是在全程「看海」。冠軍的獎金為四百萬美元,大致與當年Dota國際邀請賽亞軍的獎金差不多。
比賽結果,來自匹茨堡、擁有卡耐基梅隆大學背景的隊伍獲得了冠軍。他們的系統代號為「Mayham」,儘管它在後半程比賽中崩潰了,但是仍舊依靠在比賽前半場中建立起來的優勢獲得了全場最高分。而比賽的組織者,美國國防部顯然對比賽的結果很滿意。他們表示,舉辦這次公開比賽的目的就是驗證機器自主大規模網路防禦的可信性,並且通過舉辦比賽發掘潛在的技術和人才。下一步的工作就是通過進一步的實踐來驗證這些方法。
DARPA的項目主管表示,「目前查找系統漏洞的工作仍需依賴數以千計的專業人士來人力完成,不計其數的安全專家、白帽子每年花費不計其數的工時在上百萬行代碼間尋找並修復漏洞。而通過這次競賽,計算機程序已經能夠在幾秒鐘內完成某些專家需要幾個月完成的工作量。」 甚至有樂觀的人把這次比賽的意義和萊特兄弟的首飛相提並論。
美國國防部不會專職防守而不去進攻,能用來掃描並修復己方系統漏洞的程序也能被用來掃描並攻擊他人的系統。網路戰場從一開始就不是一個人力對抗的遊戲。
離開略帶科幻色彩的網路戰場,傳統戰場恐怕也難獨善其身。「兵棋(wargame)」作為軍事決策的工具之一已有幾個世紀的歷史。發展到今天,戰棋系統既有面向民間愛好者設計的商業遊戲,也有被列上對華禁運清單的軍用系統。
兵棋系統雖然有個「棋」的名字,但它不是一款軍事背景的遊戲,而是已發展成為規則複雜,基於詳細的武器參數、地理信息系統,結合數量化了的實戰記錄並可以引入各種隨機變數的軍事模擬系統。只要關注台海軍事新聞的讀者應該對此不會陌生,因為每次對面的台灣漢光演習,都會把從美國進口的兵棋推演系統搬出來,意淫一把「解放軍不堪一擊,英勇的國軍從勝利走向勝利」的保留戲碼。
台灣引進的戰術和戰役級兵棋系統,截圖為其應用在救災的場景。可以看到是典型的六邊形戰區地圖,基於地理信息系統的大比例戰術地圖,注意其引進的年代為2003與2008年,從軟體見面來看已經顯得有些古老
而對於美國國防部,兵棋推演則遠沒有那麼兒戲。2017財年,用於兵棋相關的預算為5500萬美元,而未來五年的預算將不少於5.25億美元,可以說是節節攀升。雖然每年一億美元上下的花費比起動則上百億美元的軍購預算並不起眼,在美國每年幾千億美元的國防預算里也不過是九牛一毛,但是在預算案中,明確提出了兵棋系統的中期目標為具備驗證關於「區域拒止/反介入」戰略的應對策略和概念。可見其在戰略上的意義對美軍來講並不小。
台灣本年度的漢光演習的兵棋系統維護合同,為指定供應商採購合同,合同價值11.7萬美元
在人工智慧、大數據、機器學習等概念已經熱得發紅、紅得發紫的這幾年,將人工智慧領域的新技術引入到軍事模擬中也是必然的。過去那種分別由兩隊參謀坐在計算機前,扮演紅藍雙方在模擬環境中調兵遣將,在演習導演部的指揮下作戰的模式實質上和多人連線的電腦策略類遊戲沒有太大的本質區別。
無非就是用的參數更接近實際,少一點娛樂的元素罷了,在耗時幾天的演習中只能執行個位數的模擬。而如果移植類似AlphaGO的演算法,先通過大量的歷史戰役數據訓練,揣摩人類戰術戰略的特點,然後在實際的演習甚至是實戰中,演算法可以憑藉計算速度上人類無法企及的優勢,在人類參謀尚在思考的階段,率先算出各種可能採取的策略中最優的一種,搶佔先機。
而由於速度的脫節,依靠人力完成參謀作業的一方很可能會因為疲於應付,完全喪失在決策上的主動權,就好比兩個劍客,勝利的一方不需要絕世寶劍,只要做到每招每式都比對方快一拍,勝負自然見分曉。要知道這次狗和柯潔對弈,柯潔的思考時間是對方的三倍!而戰場上可沒有讀秒的規則。
人工智慧的意義也不局限於人機博弈。採用演算法對演算法,機器對機器的模擬,以計算機的運算速度,可以在短時間內遍歷大量的假設的和場景,從而在無限多重的可能中,幫助參謀人員快速找到風險最小或是潛在收益最大的方案,給與決策的指揮官一個參考的依據。
甚至演算法還有可能找到過去由於習慣思維被人類忽視的方案或者戰略,開闢一種全新的戰術風格。粟裕也許不再需要千里迢迢跑去西柏坡向中央陳述暫緩分兵江南的原因,或許也不會留下一碗炒紅辣椒的梗。利用類似蒙特卡羅模擬的技術,未來的決策層可以清楚地看到各種方案的利弊,統帥只需要掂量自己傾向於冒險還是保守。軍事指揮再也不是一門藝術而更加向科學的方向傾斜。
與人類相比,人工智慧是種沒有人性的機器,不需要睡眠,不會生病也不會在壓力下緊張或者猶豫。不會像中途島戰役前的哈爾西因為皮膚病休假,也不會如拿破崙,由於精力有限和疾病錯失戰機導致抱憾於滑鐵盧。
在感測器滿天飛,數據比炸藥還多的現代戰場,用人工智慧來處理爆炸的信息量也是必然。過去幾十年中,不管軍艦的戰術信息中心還是預警機上,以電腦處理髮現的目標信息,在顯示器上標註目標的威脅程度,航速航向信息等已經是很成熟的技術了。而在未來,從發現目標,完成識別,排序優先順序,分配火力,到最後制定攻擊計劃的工作可能只需要以微秒計量的時間。南雲或者栗田再也不需要和十幾個參謀擁擠在狹小的指揮塔里,在吵雜的環境中抉擇。更不會因為電報收發的混亂漏過重要電文,淪落到被後世生於信息時代的軍迷頻繁開涮。
更有可能的劇本是:「提督sama,AI參謀提示我們勝利的機會只有萬分之一,請問是繼續戰鬥還是剖腹?AI建議大西做介錯。」
推薦閱讀:
※我們還沒準備好和AI共生——柯潔和AlphaGo大戰之觀後感
※李東樓:有關柯潔落敗阿爾法狗的一點亂想
※28 天自制你的 AlphaGo (1) : 圍棋 AI 基礎
※先贏圍棋,再勝刀塔,跟遊戲較勁的人工智慧要怎麼趕超人類?