從「三次人機對弈」讀懂人工智慧的過去、現在與未來
人工智慧經歷了60多年螺旋式的發展與演進,如今已成為實際應用眾多、科研活躍、投資熱捧的領域。人工智慧研究的範圍包括基於搜索的問題求解、知識的表達推理與規劃、機器學習、智能應用等諸多子領域。由於人工智慧研究內容的廣泛性,因此對於人工智慧的定義一直存在爭議。目前業界比較認可的定義來自加州伯克利的斯圖爾特·羅素與谷歌研發總監彼特·諾維格合著的人工智慧經典著作——《人工智慧:一種現代的方法》,該書將人工智慧定義為:人工智慧是能感知環境,並為獲得最佳結果,採取理性行動的智能體。人工智慧從發展的階段而言,可以按照其不同層級,將人工智慧分為弱人工智慧(如蘋果公司的Siri)、強人工智慧和超級人工智慧(即智能體在所有領域都比最聰明的人類還要聰明得多)。從目前而言,超級人工智慧還只是存在於電影或小說中的場景而已。2.從「三次人機對弈」看人工智慧的前世今生棋類遊戲自古以來就是人類智慧的象徵,受眾面廣泛,而且棋類遊戲規則清晰,勝負容易評估,因此每一次人機對弈都會引起公眾的極大關注,並推動人工智慧技術的快速發展。2.1西洋跳棋AI擊敗人類選手
早在1962年,當時就職於IBM的阿瑟·薩繆爾在IBM 7090晶體管計算機上(內存僅為32k)研製出了西洋跳棋(Checkers)AI程序,並擊敗了當時全美最強的西洋棋選手之一的羅伯特·尼雷,引起了轟動。阿瑟·薩繆爾在西洋跳棋AI程序研製過程中,第一次提出了「機器學習」的概念,即不需要顯式地編程,讓機器具有學習的能力。因此,阿瑟·薩繆爾被稱為機器學習之父。西洋跳棋AI程序的核心技術是通過自我對弈來學習評價函數,大致原理是利用兩個副本進行對弈,學習線性評價函數每個特徵的權重,其中一個副本Beta始終使用固定的評價函數,另一個副本Alpha則通過與使用極小極大搜索(minimax search)演算法作對比來學習特徵的權重。事實上,AlphaGo圍棋AI演算法和當今深度學習領域非常火爆的生成式對抗網路(GAN)都採用了類似的思想。雖然西洋跳棋AI程序使用了相當多的領域知識,以及一些簡化的假設,但不可否認的是,薩繆爾的工作是早期AI的一個里程碑,其工作中強化學習與對抗學習的思想至今仍然是AI程序的核心演算法。2.2 IBM深藍戰勝國際象棋世界冠軍
時隔35年的1997年5月,IBM深藍以 3.5:2.5戰勝了人類國際象棋(Chess)世界冠軍加里·卡斯帕羅夫,成為人工智慧發展史上的又一個里程碑。深藍是IBM一台超級計算機,在1秒鐘內可算兩億步棋。然而,國際象棋按照一盤棋平均走80步計算,每步棋可能的落子位置為35個,則總狀態數約為10的120次方,若僅用蠻力搜索,即使作為超級計算機的深藍都無法在合理的時間內完成走棋任務。因此,深藍在軟體設計上採用了知識庫結合搜索的方法。一方面,深藍存儲了100 年來幾乎所有國際特級大師的開局和殘局下法,利用知識庫的思想幫助程序節省時間並得出合理的棋步。另一方面,深藍採用的是α-β剪枝搜索演算法,並採用規則的方法對棋局進行評價,大致思路是根據棋子的重要程度、棋子的位子、棋子之間的關係對棋局進行評價,但這些思路並沒有超越薩繆爾的工作。不過,值得一提的是,深藍在硬體上將通用處理器和象棋加速晶元相結合,提高了計算速度。深藍國際象棋AI程序匯聚了諸多人類國際象棋大師的知識與智慧,因此可以被認為是知識工程在計算機棋類博弈的經典應用。但是,深藍國際象棋AI的核心技術依然被認為是領域相關的,缺乏通用性。人工智慧的第二次浪潮(1976年-2006年)代表性成果之一就是知識工程。知識工程的典型應用就是各種專家系統,比如醫學專家系統、工程學專家系統等。然而,知識工程也有弊端,主要表現在知識的總結與獲取很難,另外有些領域的專家不願意分享他們的經驗。因此,人工智慧的第二次浪潮的另一個重要成果就是將各種機器學習演算法引入人工智慧,讓機器從數據中自動學習,獲得知識。這段時期,機器學習的各大學派紛紛提出了各類機器學習演算法,是知識工程與各類機器學習方法群雄逐鹿的時代。2.3 AlphaGo戰勝圍棋世界冠軍李世石
2016年3月,谷歌旗下的DeepMind公司的AlphaGo圍棋AI戰勝了韓國圍棋世界冠軍九段棋手李世石,再一次掀起了人工智慧的浪潮。圍棋一直被認為是最複雜的棋類博弈,對AI來講是經典博弈中最具挑戰的棋類。圍棋按照一盤棋平均走150步計算,每步棋可能的落子位置為250個,則總狀態數約為10的150次方,據說圍棋的計算複雜度已超過宇宙中原子的總數。AlphaGo圍棋的核心技術是將深度學習、強化學習和蒙特卡洛樹搜索有機整合起來,使其既具有圍棋的局部戰鬥能力,更重要的是還具備了圍棋的全局觀。總體而言,AlphaGo具有兩套深度神經網路:即策略網路(Policy network)與價值網路(Value network)。策略網路選擇下棋步法,即給定當前的局面,預測下一步如何走棋;價值網路則評估當前局面,即給定當前局面,估計是白方勝還是黑方勝。AlphaGo首先從專業棋手的三千萬手棋,通過監督學習的方式,訓練深度卷積神經網路,學習人類圍棋高手下棋的方式,這個策略網路稱為「監督學習策略網路」;接著,AlphaGo讓兩個訓練好的監督學習策略網路對弈,從而訓練一個更強的策略網路,稱為「強化學習策略網路」。AlphaGo再利用強化學習策略網路對弈的數據作為輸入,通過深度卷積神經網路訓練價值網路。在對弈過程中,AlphaGo採用蒙特卡洛模擬方法,針對當前局面,根據策略網路的建議,有限制地向前模擬展開行為樹,並用估值網路對每種走法的勝率進行估計,在展開足夠的搜索後選擇最優的下一手棋。因此,AlphaGo本質上是在蒙特卡洛樹搜索框架下,整合了深度學習和強化學習技術並將線下深度學習與在線高效搜索相結合,從而獲取圍棋問題的有效解法。雖然,AlphaGo只解決了計算機圍棋的問題,但它在演算法上比深藍具有通用性,其思想可以被應用在多個領域,比如DeepMind最新的研究是讓AI能和人類玩家一起玩星際爭霸這類電子遊戲,而這類電子遊戲是屬於不完全信息博弈,因此比圍棋AI更具挑戰。人工智慧的第三次浪潮(2006年-現在)代表性成果就是深度學習。2006年傑夫·辛頓和他的學生在《科學》雜誌上發表了一篇關於應用神經網路進行數據降維的文章,其核心是提出了深度神經網路具有優異的特徵學習能力,並可採用「逐層預訓練」的策略對其有效訓練。2015年谷歌DeepMind公司研發了深度學習結合強化學習的「深度強化學習」技術,該技術能夠學會玩Atari視頻遊戲,並達到了可與人類匹敵的水平。事實上,「深度強化學習」技術就是AlphaGo的核心技術。3.人工智慧技術的挑戰與展望深度學習技術由於能夠自動從數據中學習複雜的特徵,因此被認為是現代人工智慧最重要、應用最廣泛的技術。但是,深度學習的技術進展遇到如下挑戰:比如目前深度學習成果主要依賴於大規模有標籤數據、深度學習幾乎是個黑箱模型,可解釋性不強、深度學習依然無法解決不確定的推理問題等等。因此,從人工智慧技術發展的路徑上,近年來無監督的深度學習、遷移學習、深度強化學習和貝葉斯深度學習等技術成為邁向強人工智慧的重要途徑。
無監督的深度學習目前,深度學習在複雜特徵空間上泛化能力依賴於帶有標籤信息的大規模數據樣本,因此無監督的深度學習技術將是未來深度學習發展的重要方向。就如深度學習三巨頭之一的Yann LeCun的觀點:AI最大的局限是沒有人類的常識,而無監督學習是突破AI局限的關鍵。遷移學習所謂遷移學習,就是能讓現有的模型演算法稍加調整即可應用於一個新的領域或功能的機器學習技術。遷移學習的目標是用已有的知識來解決目標領域中僅有少量有標籤樣本數據,甚至沒有數據的學習問題,讓機器賦予人類舉一反三的智慧。前百度首席科學家吳恩達認為,遷移學習將引領下一波人工智慧技術商業化的浪潮。深度強化學習人工智慧領域,感知、規劃、推理、決策的能力是衡量智能的指標,深度學習使得AI的感知能力(視覺、聽覺等)得到了巨大的提升,但通過與環境交互,並作出最優的決策是目前深度學習所不能解決的問題。強化學習則可不斷與環境交互,以試錯的學習方式獲得最優決策。因此,將深度學習與強化學習有機融合的「深度強化學習」可以讓智能體既具有感知能力,又具有理性行動能力。該技術是DeepMind公司近年來重點研究和應用的核心技術。貝葉斯深度學習貝葉斯學習指的是具有在小樣本數據上學習與推理的能力。因此,將深度學習與貝葉斯學習結合起來的「貝葉斯深度學習」可以使智能體既具有小樣本學習和推理能力,又有深度學習非常強大的擬合能力,即讓智能體既有感知能力又具備推理能力。本文作者認為若能將深度學習、貝葉斯學習和強化學習有機融合,讓AI具備感知、推理、決策和理性行動能力,將是實現強人工智慧的可能途徑。此外,本文作者認為人工智慧的某些應用還需要解決其安全性、魯棒性(robust)和人機交互問題,比如自動駕駛AI、自動手術AI、基於AI的對沖基金等場景。4.結語雖然人工智慧在很多領域表現出色,甚至超過了人類的表現,人工智慧已無處不在,但這並不意味著人工智慧已無所不能。從技術角度來講,目前的人工智慧還屬於弱人工智慧範疇,AI依然沒有常識、沒有自我意識、沒有真正的情感,不具備抽象能力。科幻片中的強人工智慧離我們依然遙遠,就如美國加州伯克利大學人工智慧與機器學習大師邁克爾·喬丹的觀點:在邁向強人工智慧的路上,我們才剛剛起步。但是,無需質疑的是人工智慧時代已經到來,人工智慧技術將深刻地影響人類生活、社會經濟、法律與倫理。我們準備好迎接這個人機共舞的時代了嗎?作者簡介陳敏剛,副研究員,博士畢業於上海交通大學計算機系,國家信標委大數據工作組成員,在上海科學院所屬上海計算機軟體技術開發中心/上海市計算機軟體評測重點實驗室從事新一代信息技術研究工作。騰訊馬化騰等大佬深度解讀人工智慧的過去、現在和未來來源:金融科技創新網(ID:FIA-FinTech)科技,尤其是如今炙手可熱的人工智慧,會給生活、商業、學術等帶來多大的影響?在近日由清華經管學院舉辦的「科技·驅動成長」論壇上,六位來自各界的大佬坐而論道,給出了他們或保守或開放的看法和解讀。
人工智慧控制人類,是我們想多了嗎科技,尤其是如今炙手可熱的人工智慧,會給生活、商業、學術等帶來多大的影響在近日由清華經管學院舉辦的「科技·驅動成長」論壇上,六位來自各界的大佬坐而論道,給出了他們或保守或開放的看法和解讀。從左到右依次為:清華經管學院院長錢穎一;2012年諾貝爾化學獎得主、美國國家科學院院士、斯坦福大學教授Brian K. Kobilka 教授;騰訊董事會主席兼首席執行官馬化騰先生;美國國家科學院院士、中國科學院外籍院士、斯坦福大學、清華大學教授張首晟教授;北京大學校務委員會副主任、理學部主任、生命科學學院講席教授饒毅教授;中國科學院深圳先進技術研究院副院長、香港中文大學教授、商湯科技聯合創始人湯曉鷗教授人工智慧變的這麼熱,有四方面的原因:想要在某一領域取得重大突破,是一件容易的事情嗎從幾位科學家的回答來看,這並非一件易事。比如,Brian K. Kobilka說道,花費25億美元、經歷7-12年的時間,但最終一種新葯成功上市的概率只有10%-15%。饒毅也表示,雖然人工智慧推動了神經學的研究,但其實神經學沒有任何概念上的突破。湯曉鷗也表示,在過去很多年裡,都不好意思說自己在研究人工智慧,因為什麼都沒有做出來。即便目前取得了一點進展,但仍然困難重重。具體來說,從50年代開始,就已經有人在做人工智慧 ,但從50年代到2011年做的都不好。湯曉鷗認為,2011年是一個分水嶺,主要有四方面的原因:一是實際應用的剛需。之前手提電腦非常多,雖然手提電腦能移動,但是大部分的情況下我們不會拎著電腦去吃飯,出去旅遊時用電腦拍照。後來手機出來以後,手機上的攝像頭變成了人的第三隻眼睛,我們在微信上發的最多的就是照片或者是視頻。一圖勝千言,這時候產生了大量的數據,這些數據需要智能地分析,所以有了實際應用的剛需。二是數據的體量有了大幅的增加。原來數據是從電腦中產生的,有手提電腦的人還是很少的,因為要一萬多塊錢一台,但是紅米手機一出來,五六百塊錢一台,任何人都可以購置兩台。原來不到一億的用戶,一下子變成十億、二十億,體量出來了,也就產生了大量的訓練和應用數據。三是可承受的硬體訓練平台。原來我們用CPU的時候,做人臉識別時會用近千個核,但還是要跑一兩個月才能把一個演算法跑出來,然後調一個參數,再來兩個月,又花錢又花時間。但後來用GPU,十台機器、六個小時,同樣的東西就跑出來了。所以,這就給大學實驗室和小公司一個可承受的硬體平台和能力來做訓練。四是演算法的革命性的進步。有了前三個方面還是不夠的,最後深度學習的框架允許我們做端到端的學習,有了大量的參數,以前我們是做小參數學習的。而且還要將這些小參數設計的非常複雜,因為要解決很多問題,但實際的應用很不理想。但深度學習的網路框架,允許我們用幾千個、幾萬個、幾億個參數,用無窮大的數據直接覆蓋各種場景應用。這樣就可以在一些單項、個別的應用上超過人類,意味著可以替人類來做這個工作。對此,張首晟也認為,人工智慧突飛猛進是因為計算能力的指數增長,以及大數據的產生和演算法的改進。人工智慧不可能控制人類,也不可能達到科幻的程度雖然從科學研究的角度來看,取得革命性的成果是一件困難的事情,但是按照摩爾定律的規律,經過指數級發展的人工智慧,會不會像科幻小說和書籍中所說的那樣,為我們創造一個無所不能的世界。進一步說,像很多人所擔憂的那樣,人工智慧會取代人類,甚至是控制人類。對於這一令很多人不安的話題,多位科學家給出了偏保守的回答。饒毅認為,大部分常人可以想到的人工智慧擁有記憶、思維,在我們有生之年都不可能達到科幻的程度。而且我們離那個程度還差很遠,不是一點半點。但是,也許我們可以做一些自閉症方面的事情,也許腦血管方面的疾病可以治療了,也許在睡眠方面(睡與不睡)有新的發現。他表示,在這些具體方面,是可以預期的。但是那些所有高級的,人工智慧有思維、認知和情感的都是瞎說的。同樣他也認為,「人工智慧的進步是有限的,所有把人工智慧模擬成人的那一部分,我認為百分之百的都是假的。」雖然湯曉鷗的人工智慧實驗室並評為全球前十大先鋒實驗室,而且他本人也是人工智慧方面的專家。但是他卻認為,我們聽到的那些名人和網紅講的人工智慧的事情,基本上是不可能實現的。他坦言,從事人工智慧的那些第一線的、離炮火最近的人,其實做的很辛苦。因為過去幾十年里,什麼都沒有做出來。他還調侃道,以前還曾以此來招生,因為啥都做不出來,所以可以保證學生一輩子都有工作。但他也承認,最近幾年人工智慧確實迎來了爆髮式的增長。以前人工智慧每年成長的速度是提高1%,剛開始ImageNet檢測的準確率只有22%,如果要達到100%,需要大概80年。但深度學習技術出現後,我們真的是幾年以內就做到了將近70%。儘管人工智慧的進步比以前快多了,但他還是堅持認為:「機器的任務還是人類定義的,不可能控制人類,想多了。」他還補充道,其實離炮火越近的人,越覺得這件事情還很遙遠;而離炮火越遠的人,可能剛聽到一點炮聲就開始行動了。人工智慧的應用以及未來的市場價值雖然不能太誇大人工智慧,但該項技術的應用似乎已經勢不可擋。馬化騰認為,人工智慧演化的第一步肯定會成為人類的幫手,成為人類研究和解決下一代技術時的一個重要的助手。但AI在怎麼發展都是戰術性的,是一種支持和幫助。比較複雜的戰略以及沒有多次重複規律的領域,還是離不開人腦的判斷。未來計算機和信息科學都會在生物科學以及人們生活的方方面面產生很大的作用。從騰訊方面來說,AI是發展的方向之一。他認為,在足夠垂直的細分領域裡還是有機會的。這些方面代替人,比人做得好是有可能的。所以公司現在在找細分領域裡,一些可以應用到AI和信息技術的商業機會。各種研究再怎麼天花亂墜,最終還要看是否能提高效率、改善用戶體驗。在湯曉鷗看來,目前人工智慧在三個方面應用的比較多:一是語音識別。這個是相對成熟,也是第一個突破的。二是視覺,現在的主戰場就是在視覺領域,而且看的能力的場景是非常多的。三是自然語言的理解,就是要像大腦一樣解決問題,這件事情目前是完全沒有解決的。現在這一塊很熱,很多國內外的公司都做對話機器人,但這其實是非常難的一件事情,因為它對各種背景知識以及條件的要求是非常多的。自然語音技術的應用到底有多難,為此他還舉了好幾個例子,比如說一句「上次我交給你的那件事,你給我辦了」,語音機器人是判斷不了具體什麼時間以及什麼事情的。這就需要很多的背景,但這都還沒有解決。目前市面上的應用是比較簡單的,主要是問一下餐館、影院這些比較固定的場景。還有一個問題是,很多智能機器人完全是由人來控制的,比如他開玩笑道,有的機器人是5點要下班的,因為後台操作它的人5點就下班了。還有Siri團隊會搜集一些比較難的問題,然後自己回答,當我們問到相關問題時,就會得到相同的答案。雖然馬化騰和湯曉鷗都看好人工智慧的發展,但因為兩家公司發展階段的不同,導致他們做的事情也有些不同。馬化騰認為,人工智慧與醫療和教育的結合是比較難的。騰訊投了大量與醫療和教育相關的公司,但感覺只了解到皮毛。因為這個產業鏈太長了,從各個角度來說只做了一小部分。雖然路還很長,但也是看到一些跡象可以與醫療和教育進行結合。比如用AI將教育的個性化系統進行提升。因為現在的教育可以利用信息技術,能針對每一個人、對不同的教育內容的反饋來決定下一步的教育的內容。利用信息技術的遠程、視頻寬頻,以及配對和匹配這些技術手段和產品可以將學生和教師進行更好的適配,提供更加靈活的方式和更好的體驗。而對於創業公司商湯科技來說,短期來說首先是要活下來,所以不能挑高大上的事情做。湯曉鷗說,公司第一步要做安防,因為安防到處都是,每個攝像頭幾百萬。然後是手機,手機有視覺、圖像等很多需求,目前商湯已經在和很多手機廠商合作。第三是直播,做廣告植入和特效也需要很多的視覺要求,像faceu和一直播都是商湯在提供核心技術。從中期和長期來說的話,公司會布局金融領域,無論是開戶還是內部的大數據運算、智能投顧等,都會用到人工智慧。雖然這些技術普及後,可能公司再去推進業務沒那麼容易。但是人工智慧還有很多的用處,比如做個性化的保險服務。而自動駕駛、醫療、晶元三大領域,在未來5-10年會有很大的應用。目前這三個行業的融資是最多的,但需要多做原創技術,而且還需要跟大廠商合作才能取得更大的進展。大公司的激烈競爭與小公司的艱難發展早在2002年的時候,湯曉鷗就曾成立了一家美圖公司,做人臉識別、家庭監控攝像頭、VR。但做了一年的時間,就關掉了,因為人才、技術不夠,也沒有辦法同時兼顧科研。直到2011年、2012年時候,湯曉鷗在各方面準備成熟的情況下,與人聯合成立了商湯科技。在很多人看來,商湯科技已經算是很成功的人工智慧公司。但湯曉鷗卻坦言,別人說創業是痛並快樂著,但他覺得沒有快樂,只有痛。這是因為國內和國外,是完全不同的創業環境。在國外,創業成功的概率是5%,而要做強做大的話,概率會更小。然而在中國,這一概率可能要再縮小10倍。因為前面有谷歌、微軟、Facebook這些大公司,後面有BAT三座大山以及無數的小公司。在中國三分天下的格局下,很難再有創業公司成長起來。無論做什麼行業,大家的壓力都很大,很早的時候就開始站隊。在國外是不存在這樣的問題,跟谷歌合作後,還是可以跟微軟、IBM合作的。就大公司投資和收購的創業公司來說,很多可能也想做一番事業。但他調侃道,雖然說大丈夫不為五斗米折腰,但是如果你給六斗的話,有人也是會動搖的。他還補充,創業公司還是很願意跟BAT這樣的大公司合作的。而且像AI技術,它不是獨立存在的,它需要很多的場景等。它是一個賦能的技術,可以幫助各個行業提高效率。像谷歌不是靠自動駕駛和下棋掙錢的,它是將深度學習演算法運用到搜索,使得整體效率提升了30%,相應的帶來了幾億甚至幾十億的產出。對於湯曉鷗的「抱怨」,馬化騰回應說,其實我們也很無奈。騰訊沒有開放之前,業界對我們的意見很大。但這五六年我們完全大變樣,已經形成更開放的生態,包括開放平台、眾創空間以及舉辦的一些活動都是往這個方向發展。然而競爭是免不了了,但BAT三家的發展路徑使得中國在移動互聯網、O2O、移動支付、共享單車、自動駕駛方面的發展是遠超歐美的。但另一方面,也確實產生了一些惡性競爭,使得創業者很無奈的思考要不要站隊,接受了這個投資那個就不行。馬化騰表示,這就是競爭形成的格局。雖然在享受競爭帶來的高速發展,但也會面對一些自己感覺都很厭煩的事情。其實這是一個很不健康的事情,我們也想打破。希望大家一起努力,但短時間內可能還沒有那麼容易實現。另外,因為3Q大戰的前車之鑒,目前騰訊奉行「半條命戰略」,把另一半命交給合作夥伴。公司內部會要求這不要做、那不要做,要做的話就出去做,然後騰訊可以投資。馬化騰表示,騰訊內部很多事情是不做的,專註做那些能發揮核心優勢的事情,其他全部留給生態合作夥伴。而且包括佔小股就行,不用控股,這樣才更有活力。
推薦閱讀: