《淺談人工智慧:現狀、任務、構架與統一》·第二期
上一期我們介紹了朱松純老師發表的《淺談人工智慧:現狀、任務、構架與統一》文章上半部分:人工智慧的歷史、現狀,發展的大趨勢。
接下來,我們用六節分別介紹人工智慧六大領域的問題和例子。
回顧第一期:
Testplus:解讀《淺談人工智慧:現狀、任務、構架與統一》·第一期共性的、統一的框架和表達模型
05 計算機視覺:從「深」到「暗」
視覺是人腦最主要的信息來源,也是進入人工智慧這個殿堂的大門。我自己的研究也正是從這裡入手的。本節以一個具體例子介紹視覺里的問題。
? 幾何常識推理與三維場景構建
人造環境中有很多重複的東西,比如幾個窗戶一樣大小一致,建築設計和城市規劃都有規則。這些就是geometric common sense,你根據這些幾何的約束就可以定位很多點的三維位置,同時估計相機位置和光軸。
? 場景識別的本質是功能推理
現在很多學者做場景的分類和分割都是用一些圖像特徵,用大量的圖片例子和手工標註的結果去訓練神經網路模型 --- 這是典型的「鸚鵡」模式。而一個場景的定義本質上就是功能。當你看到一個三維空間之後,人腦很快就可以想像我可以幹什麼:這個地方倒水,這裡可以拿杯子,這裡可以坐著看電視等。
? 物理穩定性與關係的推理
我們對圖像的理解包含了物體之間的物理關係,每個物體的支撐點在那裡。
? 意向、注意和預測
機器人能夠預判別人的意圖和下面的動作,那麼它才能和人進行互動和合作。
? 任務驅動的因果推理與學習
計算機視覺要繼續發展,必須發掘這些從當前圖像看不見的「東西」。把圖像中想像的95%的dark matter energy與圖像中可見的5%的蛛絲馬跡,結合起來思考,才能到達真正的理解。
06 認知推理:走進內心世界
內心世界反映外部世界,同時受到動機任務的影響和扭曲。
研究內涵包括:
? Ta看到什麼?知道什麼?什麼時候知道的?這其實是對視覺的歷史時間求積分。? Ta在關注什麼?這是當前的正在執行的任務。? Ta的意圖是什麼?後面想幹什麼?預判未來的目的和動機。? Ta喜歡什麼?有什麼價值函數?我們要達成共識,共同的知識,然後在一個小的團體、大致社會達成共同的價值觀。
當有了共同價值觀的時候,就有社會道德和倫理規範,這都可以推導出來了。機器人要與人共生共存 必須理解人的團體的社會道德和倫理規範。
烏鴉知道人類在幹什麼,它才能夠利用這個在社會裡生存。
07 語言通訊:溝通的認知基礎
人工智慧的第三個領域是語言、對話。主要講了語言、文字的起源(以及象形文字),機器人是否會危害人類的生存?(根本在於人類給它制定的規範)
在語言產生之前,人類就已經有了十分豐富的認知基礎,除了需要這個認知基礎,語言的研究不能脫離了視覺對外部世界的感知、機器人運動的因果推理,否則語言就是無源之水、無本之木。
研究機器人的一個很重要的一個問題是:機器要去做的事情它不知道該不該做。
那麼它首先想一下(就相當於棋盤推演simulation):我如何做這個事情,人會有什麼反應,如果反應好就做,如果反應不好就不做,就這麼一個規則。以不變應萬變。
那它怎麼知道你怎麼想的呢?它必須先了解你,你喜歡什麼、厭惡什麼。每個人都不一樣,你在不同的群體裡面,哪些話該說,哪些話不該說,大家心裡都知道,這才是交互,你沒有這方面知識你怎麼交互呢?
08 博弈倫理:獲取、共享人類的價值觀
機器人要與人交流,它必須懂得人類價值觀。機器人需要計算出許多常識,分析任務的本質,據此做出價值觀判斷。
有了價值函數,在一個多人環境中,就有了競爭與合作,形成我們上一節談到的社會規範、倫理道德。
這些倫理、社會規範就是人群在競爭合作之中,受到外部物理環境與因果限制下,達成的暫時的准平衡態。
兩大類學習方法:
? 歸納學習 Inductive learning:通過觀察大量樣本歸納總結。例如AlphaGo。
? 演繹學習 Deductive learning:就是從價值函數(還有物理因果)出發,直接推導出這些准平衡態,要求對研究的對象有深刻的、生成式的模型和理解。比如,諸葛亮到了祁山,先查看地形,知道自己的隊伍、糧草情況,摸清楚對手司馬懿的情況(包括性格)。然後,他腦袋裡面推演,就知道怎麼布局了。
09 機器人學:構建大任務平台
人和機器人要執行任務,把任務分解成一連串的動作,而每個動作都是要改變環境中的流態。
當機器人重建了三維場景後(在談視覺的時候提到了,這其實是一個與任務、功能推理的迭代生成的過程)。
它就帶著功利和任務的眼光來看這個場景,分析哪個地方可以站,哪個地方可以坐,哪個地方可以倒水等等..
在機器人規劃中又叫做Affordance Map,意思是:這個場景可以給你提供什麼?有了這些單個基本任務的地圖,機器人就可以做任務的規劃。它一邊做,一邊還要不斷看和更新場景的模型。
10 機器學習:學習的極限和「停機問題」
機器學習是研究解決「方法領域」,如何去擬合、獲取上面的那些知識。真正的學習是一個交互的過程,這個學習過程是建立在認知構架之上的。
七種學習模式:
被動統計學習 passive statistical learning
主動學習 active learning演算法教學 algorithmic teaching演示學習 learning from demonstration感知因果學習 perceptual causality
因果學習 causal learning增強學習 reinforcement learning深度學習只是廣義學習構架裡面很小的一部分,而學習又是人工智慧里的一個領域,把深度學習等同於人工智慧,真的是坐井觀天、以管窺豹。
11 智能科學:牛頓與達爾文理論體系的統一
物理世界存在著完整的因果鏈條,但智能科學要研究的是一個物理與生物混合的複雜系統。
智能科學的複雜之處在於:
(1)物理學面對的是一個客觀的世界,當這個客觀世界映射到每個人腦中, 形成一個主觀與客觀融合的世界,也就是每個人腦中的模型(這是統計中貝葉斯學派觀點)。這個模型又被映射到別人腦袋之中。每個腦Mind裡面包含了上百個他人的模型的估計。 由這些模型來驅動人的運動、行為。
(2)物理學可以把各種現象隔離出來研究,而我們一張圖像就包含大量的模式, 人的一個簡單動作後面包含了很複雜的心理活動,很難隔離開。
說到底,人工智慧要變成智能科學,它本質上必將是達爾文與牛頓這兩個理論體系的統一。
歡迎關注我們的官方vx號:西山居質量 ,定期推送技術文章~
推薦閱讀:
※人工智慧會毀滅人類嗎?
※反欺詐行業首份《無監督機器學習引擎》白皮書發布 | 詳解網路欺詐原理
※傳統自動控制、機器人等與人工智慧、機器學習的結合點(包括已有的和可能的)有哪些?如何結合?
※人工智慧寫春聯來了 人類還需要學書法嗎?
※自然語言處理遇到的那些「坑」