AIQ | 人工智慧的全面科普

轉載請註明 AIQ - 最專業的機器學習大數據社區 6aiq.com

本文由網易雲 發布

原文閱讀地址:人工智慧的全面科普-網易雲博客

人們在日常生活中接觸人工智慧的頻率越來越高,有可以幫用戶買菜的京東智能冰箱;可以做自動翻譯的機器;還有Siri、Alexa和Cortana這樣的機器人助理;以及無人車、AlphaGo等已經把人工智慧技術帶到了「看得到摸得著」的境地。人工智慧正以前所未有的態勢洶湧而來,相關領域的融資總額一直在逐年穩步增長,到2016年達到數十億美元的火爆程度。那麼人工智慧到底是什麼?這個領域涉及哪些方面?人工智慧要完成的目標和任務有哪些?接下來的內容將做一一介紹。

1.什麼是人工智慧

Alan Turing定義的AI是:能使計算機完成那些需要人類智力才能完成的工作的科學。斯坦福大學的學者認為AI是智能機器的科學和工程,特別是智能計算機程序。維基百科定義AI是指由人工製造出來的系統所表現出來的智能,該詞同時也指研究這樣的智能系統是否能夠實現,以及如何實現的科學領域。不管怎樣定義,都離不開智能,然而到目前為止人類還沒能統一地給出智能的定義,通常所說的智能也只是參考人類智慧的表現形式。原中國人工智慧學會理事長鍾義信教授,認為人類智慧包含發現問題、定義問題、解決問題三方面,而人工智慧目前只做到了解決問題的程度。筆者認為智能是一種有序,是信息的體現,也是使世界朝著有序的方向發展的能力。可悲的是,根據熵增原理,無論智能體做怎樣的努力,整個宇宙總是朝著熵增加的方向發展,即越來越無序和混亂。不知道這是上帝故意的安排,還是人類觀察到的宇宙之外另有天地。

2.人工智慧的歷史

1950 年代初期,人工智慧聚焦在所謂的強人工智慧,希望機器可以像人一樣完成任何智力任務。強人工智慧的發展止步不前,導致了弱人工智慧的出現,即把人工智慧技術應用於更窄領域的問題。1980 年代之前,人工智慧的研究一直被這兩種範式分割著,兩營相對。但是,1980 年左右,機器學習開始成為主流,它的目的是讓計算機具備學習和構建模型的能力,從而它們可在特定領域做出預測等行為。

歷史上人工智慧有三大學派:符號主義(symbolicism),又稱為邏輯主義(logicism)、心理學派(psychologism)或計算機學派(computerism),其原理主要為物理符號系統(即符號操作系統)假設和有限合理性原理。連接主義(connectionism),又稱為仿生學派(bionicsism)或生理學派(physiologism),其主要原理為神經網路及神經網路間的連接機制與學習演算法。行為主義(actionism),又稱為進化主義(evolutionism)或控制論學派(cyberneticsism),其原理為控制論及感知-動作型控制系統。

符號主義認為人工智慧源於數理邏輯。其早在1956年首先採用「人工智慧」這個術語。後來又發展了啟發式演算法->專家系統->知識工程理論與技術,並在20世紀80年代取得很大發展。

連接主義認為人工智慧源於仿生學,特別是對人腦模型的研究。20世紀60~70年代,連接主義對以感知機(perceptron)為代表的腦模型的研究出現過熱潮,由於受到當時的理論模型、生物原型和技術條件的限制,腦模型研究在20世紀70年代後期至80年代初期落入低潮。直到Hopfield教授在1982年和1984年發表兩篇重要論文,提出用硬體模擬神經網路以後,連接主義才又重新抬頭。1986年,魯梅爾哈特(Rumelhart)等人提出多層網路中的反向傳播演算法(BP)演算法。此後又有卷積神經網路(CNN)的研究,連接主義勢頭大振,從模型到演算法,從理論分析到工程實現,為神經網路計算機走向市場打下基礎。2006年,Hinton在《Science》和相關期刊上發表了論文,首次提出了深度信念網路(DBN)的概念,將深度學習推向學術界並成為當前人工智慧領域非常熱門的研究方向。

行為主義認為人工智慧源於控制論。控制論思想早在20世紀40~50年代就成為時代思潮的重要部分,影響了早期的人工智慧工作者。維納(Wiener)和麥克洛克(McCulloch)等人提出的控制論和自組織系統以及錢學森等人提出的工程式控制制論和生物控制論,影響了許多領域。控制論把神經系統的工作原理與信息理論、控制理論、邏輯以及計算機聯繫起來。早期的研究工作重點是模擬人在控制過程中的智能行為和作用,如對自尋優、自適應、自鎮定、自組織和自學習等控制論系統的研究,並進行「控制論動物」的研製。到20世紀60~70年代,上述這些控制論系統的研究取得一定進展,播下智能控制和智能機器人的種子,並在20世紀80年代誕生了智能控制和智能機器人系統。行為主義是20世紀末才以人工智慧新學派的面孔出現的,引起許多人的興趣。這一學派的代表作者首推布魯克斯(Brooks)的六足行走機器人,它被看作是新一代的「控制論動物」,是一個基於感知-動作模式模擬昆蟲行為的控制系統。

3.人工智慧的目標

人工智慧的目標包括:推理、知識表示、自動規劃、機器學習、自然語言理解、計算機視覺、機器人學和強人工智慧八個方面。知識表示和推理包括:命題演算和歸結,謂詞演算和歸結,可以進行一些公式或定理的推導。自動規劃包括機器人的計劃、動作和學習,狀態空間搜索,敵對搜索,規劃等內容。機器學習這一研究領域是由AI的一個子目標發展而來,用來幫助機器和軟體進行自我學習來解決遇到的問題。自然語言處理是另一個由AI的一個子目標發展而來的研究領域,用來幫助機器與真人進行溝通交流。計算機視覺是由AI的目標而興起的一個領域,用來辨認和識別機器所能看到的物體。機器人學也是脫胎於AI的目標,用來給一個機器賦予實際的形態以完成實際的動作。

人工智慧、機器學習、數據挖掘這些非常相關的術語或知識我們經常看到,也見到很多關於三者關係的文章和討論。一般來說,人工智慧是一個很大的研究領域;機器學習是人工智慧的一個目標,提供很多演算法;而數據挖掘是偏向演算法應用的部分。三者相輔相成,另外也需要其他領域的知識支持。具體關係請參考下圖。

4.人工智慧的方法

為了達到人工智慧的目標,下面依次梳理一下學術和工業界研究的各種方法和成果。

4.1 知識的表示和推理

知識表示包括:基於知識的系統,表示常識知識等。傳統的知識表示已經很成熟了,包括了描述邏輯,也包括了語義網(資源描述框架RDF)。知識推理建立在邏輯上,首先需要龐大的數據集,比如freebase;其次需要關係抽取自動化工具;最後需要合理的知識存儲結構,比如資源描述框架RDF。谷歌提的知識圖譜概念就是一種知識工程,它有龐大的知識庫和基於知識庫的各種服務。早年業界研究的知識本體也是一種知識工程,研究成果有 FrameNet、WordNet、中文知網HowNet等。具體的知識本體的例子請參考下圖。

IBM在2011年研發了Watson問答系統。谷歌在2012年提出知識圖譜,作為谷歌的兩大重要技術儲備,一個是深度學習,形成了谷歌大腦;另一個就是知識圖譜,用來支撐下一代搜索和在線廣告業務。臉譜公司利用知識圖譜技術構建興趣圖譜,用來連接人、分享的信息等,並基於此構建了graph search。其他的工業應用還有:SIRI、EVI、Google Now、Dbpedia、 freebase等。一般一個知識工程的底層技術架構,請參考以下圖示。

4.2 自動規劃

首先要說一下有限狀態機(FSM),一般應用於遊戲機器人,網路協議,正則表達式,詞法語法分析,自動客服等。如下圖是一個簡單的遊戲機器人狀態轉移和行動圖。

其次是狀態空間搜索,最簡單粗暴的是盲目搜索,就像特斯拉評價愛迪生:「如果說有一根針掉進草垛了,讓他去找,他會毫不猶豫的,一根一根草挑出來找」。優化改進的版本是啟發式搜索,如A*演算法。這方面的應用有國際象棋Deepblue,圍棋AlphaGo。AlphaGo 在蒙特卡洛樹搜索 (Monte Carlo Tree Search, MCTS) 基礎上使用了深度學習,監督學習和增強學習等方法。「蒙特卡洛樹搜索」是一類啟發式的搜索策略,能夠基於對搜索空間的隨機抽樣來擴大搜索樹,始終保證選取當前抽樣中的最優策略從而不斷接近全局最優,確定每一步棋應該怎麼走才能夠創造更好機會。另外還包括:計劃、動作和學習,敵對搜索,基於邏輯的規劃方法,狀態演算等內容。

4.3 機器學習

谷歌CEO桑德爾·皮蔡在一封致股東信中,把機器學習譽為人工智慧和計算的真正未來,可想而知機器學習在人工智慧研究領域的重要地位。機器學習的方式包括:有監督學習、無監督學習、半監督學習和強化學習。其中的演算法有:回歸演算法(最小二乘法、LR等),基於實例的演算法(KNN、LVQ等),正則化方法(LASSO等),決策樹演算法(CART、C4.5、RF等),貝葉斯方法(樸素貝葉斯、BBN等),基於核的演算法(SVM、LDA等),聚類演算法(K-Means、DBSCAN、EM等),關聯規則(Apriori、FP-Grouth),遺傳演算法,人工神經網路(PNN、BP等),深度學習(RBN、DBN、CNN、DNN、LSTM、GAN等),降維方法(PCA、PLS等),集成方法(Boosting、Bagging、AdaBoost、RF、GBDT等)。想要深入學習的同學請參考《機器學習知識表格》和《機器學習方法匯總》。

深度學習是機器學習中人工神經網路演算法的延伸和發展,近期深度學習的研究非常火熱,就在這裡介紹一下神經網路和深度學習。先說兩層網路,如下圖,其中a是「單元」的值,w表示「連線」權重,g是激活函數,一般為方便求導採用sigmoid函數。採用矩陣運算來簡化圖中公式:a(2) = g( a(1) * w(1) ), z = g( a(2) * w(2) )。設訓練樣本的真實值為y,預測值為z,定義損失函數 loss = (z – y)2,所有參數w優化的目標就是使對所有訓練數據的損失和儘可能的小,此時這個問題就被轉化為一個優化問題,常用梯度下降演算法求解。一般使用反向傳播演算法,從後往前逐層計算梯度,並最終求解各參數矩陣。

深度學習採用多層神經網路,在求解參數矩陣時計算量隨層數呈指數上升。假設處理一張300*300像素的圖片,採用8層網路,每層6個節點,那麼在全聯接的情況下將有300*300*6^8個參數需要計算求解。卷積神經網路(CNN)提出卷積運算元和權值共享來大幅減少參數個數。另外一個問題是梯度彌散,由於sigmoid函數求導後的函數小於0.25,標準化正態分布產生的初始隨機參數w也都在0-1之間。而各層的梯度是從後往前逐層求解,且前面層的梯度是來自後面層的值乘積。因此會有一個剃度指數,一旦初始值小於1,經過多層乘積後將會迅速變小。一個有效的解決方案是使用ReLU做激活函數。介於篇幅這裡只做簡介,想要深入了解深度學習的同學請參考《一文讀懂深度學習》。

4.4 自然語言處理NLP

NLP是人工智慧的另一個目標,用於分析、理解和生成自然語言,以方便人和計算機設備進行交流,以及人與人之間的交流。它的應用領域包括:機器翻譯,文本、語音、圖片轉換,聊天機器人,自動摘要,情感分析,文本分類,信息提取等。以下給出了自然語言處理簡要的知識架構圖。

4.5 機器人視覺

視覺對人很重要,人類獲得訊息90% 以上是依靠眼睛的,那麼對於機器人要想獲得人獲取信息的能力,重點是解決機器人視覺系統。目前機器視覺已經可以做到很多事情,比如識別人臉、標誌和文字;探測物體並了解其環境的應用,如自動駕駛無人車等;檢測的事件,對視頻監控和人數統計;組織信息,如對於圖像和圖像序列的索引資料庫;造型對象或環境,醫學圖像分析系統或地形模型;自動檢測,如在製造業的應用程序。

4.6 機器人學和強人工智慧

機器人學是一個交叉學科,主要研究包括環境適應機器仿生,機器人自主行為,人機協作,微納操作機器人,製造裝備機器人、科學工程機器人、服務型機器人等。目前國內的機器人行業還沒有形成規模,商業化做得好的比如大疆、瀋陽新松機器人公司。

強人工智慧是人工智慧研究的最主要目標之一,強人工智慧也指通用人工智慧(artificial general intelligence,AGI),或具備執行一般智慧行為的能力。強人工智慧通常把人工智慧和意識、感性、知識和自覺等人類的特徵互相連結。實現強人工智慧至少需要擁有以下能力:

  • 自動推理,使用一些策略來解決問題,在不確定性的環境中作出決策;
  • 知識表示,包括常識知識庫;
  • 自動規劃;
  • 學習;
  • 使用自然語言進行溝通;
  • 整合以上這些手段來達到同一個的目標。

目前的強人工智慧主要出現在電影或小說里,比如斯皮爾伯格導演的《人工智慧》裡面的機器男孩大衛。

最後,再回到人類智慧和人工智慧的討論上,人類智慧是人類的「隱性智慧」與「顯性智慧」相互作用相互促進相輔相成的能力體系。其中,「隱性智慧」主要是指人類發現問題和定義問題從而設定工作框架的能力,由目的、知識、直覺能力、抽象能力、想像能力、靈感能力、頓悟能力和藝術創造能力所支持,具有很強的內隱性,因而不容易被確切理解,更難以在機器上進行模擬;「顯性智慧」主要是指人類在隱性智慧所設定工作框架內解決問題的能力,依賴於收集信息、生成知識和創生解決問題的策略並轉換為行動等能力的支持,具有較為明確的外顯性,因而有可能被逐步理解並在機器上模擬出來。目前幾乎所有的人工智慧都只能模仿人類的解決問題的能力,而沒有發現問題、定義問題的能力。因此,「人工智慧將全面超越人類智慧」的說法沒有科學根據,目前的人工智慧只是幫助人類提高生產力的工具而已。

轉載請註明 AIQ - 最專業的機器學習大數據社區 6aiq.com


推薦閱讀:

AlphaZero實踐——中國象棋(附論文翻譯)
類似AlphaGo一樣的人工智慧什麼時候才可以擊敗RTS(如星際)頂級選手?
絕藝奪冠——從AlphaGo到國產狗絕藝系列評論之一
28 天自制你的 AlphaGo (1) : 圍棋 AI 基礎

TAG:AlphaGo | 機器學習 |