知識圖譜是什麼?有哪些應用價值?

本題已收錄至知乎圓桌:人工智慧 · 語言智能,更多「人工智慧」相關話題歡迎關注討論


劉知遠老師所提供的兩篇論文:知識圖譜構建技術綜述,知識圖譜技術綜述。對知識圖譜問題進行了詳細介紹,非常適合入門。在此我再提供一些個人覺得非常優秀實用的論文供參考。

莊嚴,李國良,馮建華. 知識庫實體對齊技術綜述[J]. 計算機研究與發展,2016,(01):165-192.

Wang Yuanzhuo, Jia Yantao, Liu Dawei, Jin Xiaolong, Cheng XueqiOpen. Web Knowledge Aided Information Search and Data Mining [J]. Jisuanji Yanjiu yu Fazhan/Computer Research and Development, vol. 52, issue 2 (2015)

Bernstein P A, Madhavan J, Rahm E. Generic schema matching, ten years later [J].Proceedings of the VLDB Endowment, vol. 4, issue 11 (2011) pp. 695-701

Shvaiko P , Euzenat J. Ontology matching: State of the art and future challenges [J]. IEEE Transactions on Knowledge and Data Engineering ( Volume: 25, Issue: 1, Jan. 2013 )

Otero-Cerdeira L , Francisco J, Rodríguez-Martínez A. Ontology matching: A literature review [J]. Expert Systems with Applications, vol. 42 (2015) pp. 949--971

以上五篇論文大多對實體對齊和本體匹配做了很多綜述,希望能對你知識圖譜的進一步研究有參考價值


謝邀。

我的工作里沒有在做knowledge graph(KG), 但組裡有其他同學在做。之前學了很多first order logic的東西,KG里用到的compositional semantics也跟我做的有重合。還是足以回答這個問題的。一邊在回答的時候一邊整理讀過的paper,對我自己也是很大的幫助。不過距離我上次接觸已經有一些時間了,如果有不準確的地方還請大家指出。

前面的回答介紹的很全面了。值得補充的一點是,KG是個IR (Information Retrieval)辭彙。而且KG 具備semantic, 也就是圖中每一個點都是self-descriptive的。另外,relation是一等公民,通過圖可以推理(reasoning, inference)entity之間的關係。相似的辭彙還有「knowledge base」,"freebase", 其實本質上是一樣的,數據結構、應用領域不同罷了。我來給個具體結合question answering的例子,方便大家理解。

想像一下如下場景:你想知道Christopher Manning 和Yann Lecun的關係是什麼。除了直接上google搜,假設你可以直接向google提問:「Christopher Manning 和Yann Lecun的關係是什麼」。Google將問題轉化為query, 在成千上萬的網頁中找答案,與其給你一堆相關網頁,google給你歸納成一句話:Christopher Manning 和Yann LeCun 在dl的領域中都有貢獻(我隨便編的哈)。

好, 至此,整個場景由三個部分組成: 用戶提問-&> google建KG, 找答案-&>回答問題。

1) 用戶提問

這裡的關鍵在一個自然語言的query是如何轉為KG的query。常用的方法無非就是將其主幹抓出(entity extraction),變成logic query。可以簡單formulate成:(Christopher Manning) INTERSECTION (Yann LeCun). (取兩者的交集)。關於自然語言轉成query已經有很多work了。

2)google建KG, 找答案

google拿著這條query,分析出有兩個entities: Chris Manning 和Yann LeCun, 開始查詢成千上萬的網頁。搜索結構就是KG的主幹。兩個entities之間有連接(entity linkage),可能是通過ontology matching, 也可能是其他方法(我暫時想到這一個,感興趣的可以閱讀RDF, OWL, etc)。下圖是如何搭建一個KG, 出自Szekely, Pedro, et al. "Building and using a knowledge graph to combat human trafficking." International Semantic Web Conference. Springer, Cham, 2015.

3) Query轉化為自然語言

像我在場景里提到的,最後google給你返回的是一個答案,而非一大片搜索結果網頁。這個過程是nlp很火的領域:natural language generation(NLG),自然語言生成。 假設返回結果是: (Chris Manning) INTERSECTION (Yann LeCun) = [ICLR,NIPS,Nature,ICML,Computer Science,Research], 那可以用nlg的技術來生成答案:"Chris Manning 和Yann LeCun都在deep learning研究領域中做出工作/貢獻。"

上述這個例子可以直觀表述kg的應用和價值。想像一下某天用戶可以直接跟wikipedia提問。與其瀏覽大片網頁,答案會以自然語言的形式表述出來。這過程涉及了信息檢索,自然語言生成, entity resolution, 還有各種reasoning, inference, scalable, 優化演算法等。 這個方向能發掘的問題還有很多很多,比如從nlp的方面來說,用戶的提問不一定是規則的:或許有quantifiers, 有歧義之類的。

綜上所述,這個領域很有趣。對IR感興趣的同學可以看南加大Craig A. Knoblock教授的工作, 對nlp感興趣的同學可以參考Percy Liang。

Reference

Xu, Kun, et al. "Question answering on freebase via relation extraction and textual evidence." arXiv preprint arXiv:1603.00957 (2016).

Guo, Shu, et al. "Jointly Embedding Knowledge Graphs and Logical Rules." EMNLP. 2016.

Song, Dezhao, et al. "Building and Querying an Enterprise Knowledge Graph." IEEE Transactions on Services Computing (2017).

Hohenecker, Patrick, and Thomas Lukasiewicz. "Deep Learning for Ontology Reasoning." arXiv preprint arXiv:1705.10342 (2017).

Szekely, Pedro, et al. Building and using a knowledge graph to combat human trafficking." International Semantic Web Conference. Springer, Cham, 2015

Berant, Jonathan, et al. "Semantic Parsing on Freebase from Question-Answer Pairs." EMNLP. Vol. 2. No. 5. 2013.

Gawriljuk, Gleb, et al. "A scalable approach to incrementally building knowledge graphs." International Conference on Theory and Practice of Digital Libraries. Springer International Publishing, 2016.


請讀一下這篇論文的博文 機器之心 | 知識圖譜研究進展


知識計算主要是根據圖譜提供的信息得到更多隱含的知識,如通過本體或者規則推理技術可以獲取數據中存在的隱含知識;而鏈接預測則可預測實體間隱含的關係;同時使用社會計算的不同演算法在知識網路上計算獲取知識圖譜上存在的社區,提供知識間關聯的路徑;通過不一致檢測技術發現數據中的雜訊和缺陷。通過知識計算知識圖譜可以產生大量的智能應用如可以提供精確的用戶畫像為精準營銷系統提供潛在的客戶;提供領域知識給專家系統提供決策數據,給律師、醫生、公司 CEO 等提供輔助決策的意見;提供更智能的檢索方式,使用戶可以通過自然語言進行搜索;當然知識圖譜也是問答必不可少的重要組建。


推薦閱讀:

中文知識圖譜構建思路是什麼?

TAG:自然語言處理 | 知識圖譜 |