推薦好文 | 常識推理和常識知識庫

《Commonsense Reasoning and Commonsense Knowledge in Artificial Intelligence》

作者介紹

Ernest Davis,紐約大學計算機科學部門(ComputerScience department)教授,他的主要研究興趣包括常識推理、知識表示、空間推理、物理推理、人工智慧等。

Gary Marcus,紐約大學心理學教授,紐約大學嬰兒語言中心主任,機器學習初創公司Geometric Intelligence 創始人兼CEO,出版有《TheAlgebraic Mind: Integrating Connectionism and Cognitive Science》等著作,在包括Science和Nature的頂級期刊中發表論文四十餘篇。他的研究興趣包括人類和動物行為學、神經科學、遺傳學和人工智慧等。

雜誌介紹

本文於2015年9月發表在《Communications of the ACM》上。該期刊是國際計算機學會ACM的月刊,其內容主要包括計算機領域的最新發現、創新及研究成果。該期刊是計算機領域影響力最高的出版物之一。

論文摘要

Since the earliest days of artificial intelligence, it has been recognized that commonsense reasoning is one of the central challenges in the field. However, progress in this area has on the whole been frustratingly slow. In this review paper, we discuss why commonsense reasoning is needed to achieve human-level performance in tasks like natural language processing, vision, and robotics, why the problem is so difficult, and why progress has been slow. We also discuss four particular areas where substantial progress has been made, the techniques that have been attempted, and prospects for going forward.

主要觀點

「Prince William和他的三歲寶貝兒子誰身高更高?」、「針扎入胡蘿蔔,它會留下小孔,請問它指的是什麼」… 這些問題看似很傻,但機器要完成許多智能型任務(例如:文本理解、計算機視覺、路徑規劃、科學推理等)卻需要理解這些常識和相應的推理。本文主要介紹常識推理的應用領域、近年來的突破和進展、難點及發展瓶頸、已有的各種技術和對未來進一步研究的建議。

常識推理在文本理解、計算機視覺、機器人操作和規劃等許多AI任務中有著舉足輕重的地位。例如,在自然語言處理(NLP)領域,歧義的處理通常需要常識推理:「The electrician is working」和「The telephone isworking」中的兩個「working」,看似都是「工作」,但第一個working的內涵為「勞動」,而第二個則為「正常運作」。若機器要理解到這一層次,就需要對人類常識有一定的積累。再例如,在計算機視覺(CV)領域,機器需要能夠對「桌布底下有桌子」、「柜子可以通過『把手』打開」這些隱含的常識進行理解和推理。

目前自動化常識推理已經取得了部分的實質性進展,具體如下所示:

  • 類別推理(Taxonomicreasoning):類別推理的兩種形式為傳遞和繼承,比如說:Lassie是狗的一個實例(instance),狗是哺乳動物的一個子集(subset),那麼Lassie是哺乳動物的一個子集,這就是傳遞。再比如說,狗是哺乳動物的子集,哺乳動物有「多毛」的屬性,那麼狗也有這一屬性,這就是繼承性。這些簡單形式的推理已經在人工智慧領域(如WordNet和一些web挖掘系統)和醫學、基因學領域有了一定程度的應用。
  • 時間推理(Temporalreasoning):時間推理主要研究關於時間(times)、持續時間(durations)和時間間隔(time intervals)的知識表示和自動推理。比如說:已知莫扎特早於貝多芬出生,並且他死時比貝多芬死時年輕,那麼我們可以推理出莫扎特早於貝多芬去世。儘管關於時間推理的研究取得了很大的進展,但是在某些特定領域(如NLP)仍舊面臨一些挑戰。
  • 行動和變化推理(Actionand change):行動和變化推理在滿足某些約束(如Events are atomic、Every change in the world is the result of an event、Events aredeterministic、Single actor和Perfect knowledge)的研究領域已經取得了很大的進展,其主要成功應用於高層次規劃和機器人規劃。但在某些特定領域仍存在一些挑戰,比如整合不同抽象層次的行為描述(integrating action descriptions at different levels of abstraction)。
  • 定性推理(Qualitativereasoning):定性推理主要分析和推理具有內在關聯的數量之間的變化。例如,如果密閉容器內溫度升高,那麼壓力就會增大。定性推理已經在物理學、工程學、生物學等許多領域得到了成功的應用。

儘管常識推理在眾多領域取得了顯著進展,但仍然面臨許多挑戰。以下列出了主要的挑戰。

  • 許多涉及到常識及推理的領域仍處於對常識理解的初級階段,甚至還尚未開始研究。對於絕大多數涉及常識推理的領域,都還遠遠沒有達到深入理解的程度。
  • 許多看似簡單的情景很可能具有相當大的邏輯複雜性。
  • 常識推理經常涉及到合情推理(plausible reasoning)。合情推理是指人們根據已有的信息進行看似合乎邏輯的推理,但這樣的推理結果未必是正確的。儘管合情推理已經被廣泛研究了數年,但仍是常識推理中極具挑戰性的問題之一。
  • 許多領域不可避免地會出現長尾現象(long tail)。長尾現象指的是高頻樣本或對象僅佔整體的一小部分,而更多的是一些低頻樣本或對象。比如在NLP領域,「of the year」等常用詞終究是少數的,而更多的是類似於「moldy blueberry soda」這種人們可以立刻理解但實際上不常用的片語。
  • 在知識的形式化表示時,機器往往很難分辨出合適的抽象層次。比如說那個「針頭扎入胡蘿蔔」的例子,機器在推理時並不知道「針頭扎進胡蘿蔔,則胡蘿蔔上會有一個孔」這一特定事實,但它可能知道更一般的規則:「尖銳物體扎在其他物體上,該物體會有孔洞」。但問題是如何更廣泛地、更通用地制定這樣的規則呢?「釘子釘入木頭」、「訂書釘釘入紙中」、「釘子大入水中?」… 是否應該為每一個這樣的小領域分別制定規則呢?這些領域又是如何劃分的呢?… 每一個問題都值得人們深入思考。

此外,常識推理的主要技術包括以下幾點:

  • 基於知識的方法。由專家分析常識推理所需要的特徵,進而手工建立知識表示的方法和常識推理引擎。此外,還包括基於數學的方法、基於機器學習和大規模資料庫的方法。
  • web挖掘的方法。人們嘗試利用web挖掘技術從web文檔中提取常識。
  • 基於眾包的方法。該方法可以避免web挖掘方法中存在的問題(如常識結果的不一致性),但不能得到對於基本領域(fundamental domains)的分析以及支持可靠推理所需的不同含義和類別的精細區分。

最後,作者對未來的研究方向給出了一些建議,包括基準測試(Benchmarks)、評估CYC系統(Evaluating CYC)、多技術整合(Integration)、推理的其他方式(Alternative modes of reasoning)和認知科學(Cognitivescience)等。

論文鏈接cacm.acm.org/magazines/ reasoning-and-commonsense-knowledge-in-artificial-intelligence/abstract#PageTop

推薦閱讀:

《機器學習》筆記-貝葉斯分類器(7)
谷歌展示全新醫療診斷範式:深度學習+AR顯微鏡=實時檢測癌症
【願景學城】24小時AI熱點新聞的匯總(2018/04/13)
為什麼號稱美女的機器人都穿得這麼土?
AlphaGo背後的力量:蒙特卡洛樹搜索入門指南

TAG:人工智慧 | 知識庫 |