《淺談人工智慧：現狀、任務、構架與統一》·第二期

04-20

上一期我們介紹了朱松純老師發表的《淺談人工智慧：現狀、任務、構架與統一》文章上半部分：人工智慧的歷史、現狀，發展的大趨勢。

接下來，我們用六節分別介紹人工智慧六大領域的問題和例子。

回顧第一期：

Testplus：解讀《淺談人工智慧：現狀、任務、構架與統一》·第一期?

zhuanlan.zhihu.com

共性的、統一的框架和表達模型

05 計算機視覺：從「深」到「暗」

視覺是人腦最主要的信息來源，也是進入人工智慧這個殿堂的大門。我自己的研究也正是從這裡入手的。本節以一個具體例子介紹視覺里的問題。

? 幾何常識推理與三維場景構建

人造環境中有很多重複的東西，比如幾個窗戶一樣大小一致，建築設計和城市規劃都有規則。這些就是geometric common sense，你根據這些幾何的約束就可以定位很多點的三維位置，同時估計相機位置和光軸。

? 場景識別的本質是功能推理

現在很多學者做場景的分類和分割都是用一些圖像特徵，用大量的圖片例子和手工標註的結果去訓練神經網路模型 --- 這是典型的「鸚鵡」模式。而一個場景的定義本質上就是功能。當你看到一個三維空間之後，人腦很快就可以想像我可以幹什麼：這個地方倒水，這裡可以拿杯子，這裡可以坐著看電視等。

? 物理穩定性與關係的推理

我們對圖像的理解包含了物體之間的物理關係，每個物體的支撐點在那裡。

? 意向、注意和預測

機器人能夠預判別人的意圖和下面的動作，那麼它才能和人進行互動和合作。

? 任務驅動的因果推理與學習

計算機視覺要繼續發展，必須發掘這些從當前圖像看不見的「東西」。把圖像中想像的95%的dark matter energy與圖像中可見的5%的蛛絲馬跡，結合起來思考，才能到達真正的理解。

06 認知推理：走進內心世界

內心世界反映外部世界，同時受到動機任務的影響和扭曲。

研究內涵包括：

? Ta看到什麼？知道什麼？什麼時候知道的？這其實是對視覺的歷史時間求積分。

? Ta在關注什麼？這是當前的正在執行的任務。

? Ta的意圖是什麼？後面想幹什麼？預判未來的目的和動機。

? Ta喜歡什麼？有什麼價值函數？

我們要達成共識，共同的知識，然後在一個小的團體、大致社會達成共同的價值觀。

當有了共同價值觀的時候，就有社會道德和倫理規範，這都可以推導出來了。機器人要與人共生共存必須理解人的團體的社會道德和倫理規範。

烏鴉知道人類在幹什麼，它才能夠利用這個在社會裡生存。

07 語言通訊：溝通的認知基礎

人工智慧的第三個領域是語言、對話。主要講了語言、文字的起源（以及象形文字），機器人是否會危害人類的生存？（根本在於人類給它制定的規範）

在語言產生之前，人類就已經有了十分豐富的認知基礎，除了需要這個認知基礎，語言的研究不能脫離了視覺對外部世界的感知、機器人運動的因果推理，否則語言就是無源之水、無本之木。

研究機器人的一個很重要的一個問題是：機器要去做的事情它不知道該不該做。

那麼它首先想一下（就相當於棋盤推演simulation）：我如何做這個事情，人會有什麼反應，如果反應好就做，如果反應不好就不做，就這麼一個規則。以不變應萬變。

那它怎麼知道你怎麼想的呢？它必須先了解你，你喜歡什麼、厭惡什麼。每個人都不一樣，你在不同的群體裡面，哪些話該說，哪些話不該說，大家心裡都知道，這才是交互，你沒有這方面知識你怎麼交互呢？

08 博弈倫理：獲取、共享人類的價值觀

機器人要與人交流，它必須懂得人類價值觀。機器人需要計算出許多常識，分析任務的本質，據此做出價值觀判斷。

有了價值函數，在一個多人環境中，就有了競爭與合作，形成我們上一節談到的社會規範、倫理道德。

這些倫理、社會規範就是人群在競爭合作之中，受到外部物理環境與因果限制下，達成的暫時的准平衡態。

兩大類學習方法：

? 歸納學習 Inductive learning：通過觀察大量樣本歸納總結。例如AlphaGo。

? 演繹學習 Deductive learning：就是從價值函數（還有物理因果）出發，直接推導出這些准平衡態，要求對研究的對象有深刻的、生成式的模型和理解。比如，諸葛亮到了祁山，先查看地形，知道自己的隊伍、糧草情況，摸清楚對手司馬懿的情況（包括性格）。然後，他腦袋裡面推演，就知道怎麼布局了。

09 機器人學：構建大任務平台

人和機器人要執行任務，把任務分解成一連串的動作，而每個動作都是要改變環境中的流態。

當機器人重建了三維場景後（在談視覺的時候提到了，這其實是一個與任務、功能推理的迭代生成的過程）。

它就帶著功利和任務的眼光來看這個場景，分析哪個地方可以站，哪個地方可以坐，哪個地方可以倒水等等..

在機器人規劃中又叫做Affordance Map，意思是：這個場景可以給你提供什麼？有了這些單個基本任務的地圖，機器人就可以做任務的規劃。它一邊做，一邊還要不斷看和更新場景的模型。

10 機器學習：學習的極限和「停機問題」

機器學習是研究解決「方法領域」，如何去擬合、獲取上面的那些知識。真正的學習是一個交互的過程，這個學習過程是建立在認知構架之上的。

七種學習模式：

被動統計學習 passive statistical learning

主動學習 active learning

演算法教學 algorithmic teaching

演示學習 learning from demonstration

感知因果學習 perceptual causality

因果學習 causal learning

增強學習 reinforcement learning

深度學習只是廣義學習構架裡面很小的一部分，而學習又是人工智慧里的一個領域，把深度學習等同於人工智慧，真的是坐井觀天、以管窺豹。

11 智能科學：牛頓與達爾文理論體系的統一

物理世界存在著完整的因果鏈條，但智能科學要研究的是一個物理與生物混合的複雜系統。

智能科學的複雜之處在於：

（1）物理學面對的是一個客觀的世界，當這個客觀世界映射到每個人腦中，形成一個主觀與客觀融合的世界，也就是每個人腦中的模型（這是統計中貝葉斯學派觀點）。這個模型又被映射到別人腦袋之中。每個腦Mind裡面包含了上百個他人的模型的估計。由這些模型來驅動人的運動、行為。

（2）物理學可以把各種現象隔離出來研究，而我們一張圖像就包含大量的模式，人的一個簡單動作後面包含了很複雜的心理活動，很難隔離開。

說到底，人工智慧要變成智能科學，它本質上必將是達爾文與牛頓這兩個理論體系的統一。

歡迎關注我們的官方vx號：西山居質量，定期推送技術文章~