★ALphaGO發明者是誰？AlphaGo是怎樣模擬人類「思考」的

06-16

隨著科技的發展與現代化，機器人極有可能代替人類的大腦和思維，去完成一些事情，這不，智能圍棋手機器人阿爾法竟然戰勝了人類，下面來跟小編看下吧。阿爾法圍棋（AlphaGo）是一款圍棋人工智慧程序，由位於英國倫敦的谷歌（Google）旗下DeepMind公司的戴維·西爾弗、艾佳·黃和戴密斯·哈薩比斯與他們的團隊開發，這個程序利用「價值網路」去計算局面，用「策略網路」去選擇下子。2015年10月阿爾法圍棋以5:0完勝歐洲圍棋冠軍、職業二段選手樊麾；2016年3月對戰世界圍棋冠軍、職業九段選手李世石。為什麼alphago 這麼厲害，從目前來看alphago確實有幾分實力，但是人工智慧也畢竟是工程師設計的，終究還是人類的作品。不過要談過alphago為什麼這麼厲害，此次推出的alphago，將高級搜索樹與深度學習演算法結合在一起，甚至能夠讓機器做到「左右互搏」實現自我學習。在較短的時間內變得越來越聰明，量變必然會引起質變，而量變正是計算機最容易實現和最擅長的東西。

AlphaGo是怎樣模擬人類「思考」的1、AlphaGo棋力如何在圍棋人工智慧程序方面，除了開源程序Pachi和Fuego，還有日本的Zen、韓國的DolBaram和法國的CrazyStone。按照以往的戰績來看，AlphaGo和Crazy Stone、Zen的戰績為495戰，494勝，而且在讓四子的情況下（讓對方先下四個子），與Crazy Stone、Zen的勝利為77%和86%。雖然還沒有AlphaGo與韓國DolBaram交手的具體戰績，但這並不妨礙AlphaGo成為現階段頂尖水平圍棋人工智慧程序。職業棋手的段位是根據比賽成績來確定的——根據勝、負、和的成績計算積分，按照積分高低將棋手分為1-9段，而且段位會根據棋手在一定時間內的比賽成績而上升或下降。根據2014年12月31日公布的中國圍棋職業棋手等級分排名，在讓4子和5子的情況下戰勝DolBaram的中國棋手（七段）連笑排名為第12位，而作為棋壇宿將的李世石（九段）的棋力則更勝一籌。被AlphaGo擊敗的中國職業二段棋手樊麾，在棋力上與即將和AlphaGo交手的李世石，以及戰勝DolBaram的連笑有著非常大的差距，但畢竟具備職業棋手的基本素質和水平。就現今的戰績來看，AlphaGo基本具備不低於職業初段棋手的棋力。如果AlphaGo的棋力與韓國DolBaram的水平相當，或僅僅是略優於DolBaram，那顯然是無法戰勝李世石的。若是AlphaGo具備能在讓6子的情況下戰勝DolBaram的棋力，那麼和李世石的比賽就有可能存在一定懸念了。筆者在此斗膽做一個推測，也許在將來AlphaGo能與李世石一較高下，但就現階段而言，AlphaGo戰勝李世石的可能性並不高。

摘自： 2、AlphaGo獲勝的秘訣何在在國際象棋上，因為王、後、車、相、馬、兵的重要性不一樣，程序員可以對不同的子設定不同的分值，比如王10分，後8分.....讓計算機以判定分值的高低來指導計算機計算和落子。但圍棋的棋子沒有大小之分，使得計算機很難做出取捨，只能以窮舉法的方式進行計算。而圍棋的另一個特點是非常複雜——下棋時可能會遭遇3^361 種變化,在過去計算機性能相對有限的情況下，又沒有一個良好的演算法進行輔助，使用窮舉法計算自然導致人工智慧雖然在國際象棋上戰勝了卡斯帕羅夫，但在圍棋領域一直處於業餘棋手的棋力水平。AlphaGo戰勝樊麾的秘訣在於神經網路系統、蒙特卡洛演算法和深度學習。神經網路系統是以人類大腦為原型的信息處理模式，使神經網路可以根據特定的輸入產生特定輸出，並實現圖片識別、語音識別等功能。谷歌做了兩個神經網路，一個神經網路用於動態評估——計算對手下一步棋落子的各自可能性，依靠計算機遠遠超過棋手的計算能力，在某種程度上會佔據一定優勢。另一個神經網路用於靜態評估——評估棋局交戰雙方總體態勢。因為圍棋的各個棋子很難用數值進行打分量化，也不存在精確描述棋局的「圍棋定律」，使得計算機在靜態評估方面，單純的高計算能力未必會強於職業棋手「棋感」之類的抽象思維。此外，谷歌還輸入了海量棋手對弈的棋譜，並讓AlphaGo以棋譜的數據為基礎進行了3千萬局自我對局，充分豐富了資料庫，並將預測對手下一步棋落子的準確率提升到57%。在下棋的過程中，輔以蒙特卡洛演算法——通用性的圍棋盤面靜態評估函數曾經是圍棋人工智慧的瓶頸，在引入蒙特卡洛演算法後則很大程度上解決了這個問題。蒙特卡洛演算法構造了一個隨機的過程，並對過程採用進行統計評估，從而得出一個最優的解法。簡單的說，蒙特卡羅演算法對計算進行了篩選，對資料庫中低勝率的選擇直接拋棄，放棄了窮舉法中那些大量消耗計算資源，但卻沒有意義的計算。明確了計算的主攻方向，使其對具有高勝率的選擇有更加精確的計算和分析。特別是在選擇策略中加入更多和圍棋相關的專業知識，使得基於蒙特卡洛樹搜索的圍棋弈棋系統水平擁有和職業其較量的能力。

3、AlphaGo並非只會複製人類棋手的招數有一種觀點人為，只要下AlphaGo棋譜中所未記載的招數就能獲勝，哪怕這些下法根本不符合圍棋棋理。但筆者認為，這種做法的可行性並不高。AlphaGo並非是對人類棋手弈棋棋譜記憶後的簡單再現，而是具備了一定模擬人類神經網路的「思考」能力，既不是像過去那樣採用窮舉法尋找最有選項，也不是複製棋譜中所記載的定勢或手筋。而是會對選擇進行「思考」，刪除那些勝率低的選擇，並對具有高勝率的選項進行深度「思考」，最終從無數個落子的選擇中基於自己的「思考」選擇一個最優項。因此，若是人類棋手想憑藉下幾步不符合圍棋棋理，或未被棋譜記載的圍棋下法，就輕而易舉戰勝AlphaGo的可能性並不高。因為AlphaGo是人工智慧，而不是一台只會複製人類棋手招數的機器。AlphaGo依靠精確的專家評估系統（value network）、基於海量數據的深度神經網路（policy network），及傳統的人工智慧方法蒙特卡洛樹搜索的組合，已經至少達到了與標準業餘6段棋手，或中國職業棋手等級分200位之後的棋手實力相當的地步，如果有人類頂尖棋手長期陪伴AlphaGo對弈，AlphaGo的棋力還會進一步提高。因此，AlphaGo已經不再是可以依靠程序漏洞就可以戰勝的圍棋程序，正如連笑在讓6子的情況下負於DolBaram的那場棋賽，在比賽中連笑被吃掉一條大龍。對此，連笑表示，「我知道那塊棋要死，但是以為它看不出來，沒想到它很快就下出來了，後面打劫的地方他也下得很好。」

4、展望人工智慧目前，限制人工智慧發展的核心因素有兩個：一是演算法上還沒有達到完善，人類對智能計算的過程理解不夠，目前的演算法依舊有很大的改進提升空間。二是計算機硬體瓶頸。雖然計算機技術在過去30年中突飛猛進，但目前的集成電路相對於人類大腦有千億神經元，數百萬億突觸構成的複雜網路，還是有著多個數量級差距。但人工智慧並非遙不可及，在很多方面已經有了非常廣泛的應用，比如已經商用化，或已經走入尋常百姓家的語音識別，圖像識別，自動翻譯，廣告推薦，數據挖掘等。除了上述提到的理解外部輸入感知智能。更高級的智能如推理想像決策湧現等被稱為認知智能。谷歌圍棋可能是認知智能方面的突破，相關的技術突破不僅僅限於圍棋人工智慧一隅，還可能會帶來一系列的這方面的新技術和產品。使人工智慧在影響著社會生產的同時，充分服務於人民生活。