知識圖譜的構建

知識圖譜的構建

來自專欄 Excalibur4 人贊了文章

知識圖譜一般用於自然語言處理中,用來達到語義化的理解,通俗來說,機器看到足球運動員羅納爾多,並沒有真正理解,它只知道是個人名,並不能像人一樣想到它是足球運動員。

大規模知識圖譜構建還是挺複雜的,我在這篇文章中先講一下和訊網人物關係圖譜的構建,分成3個部分:

  • 爬蟲
  • neo4j存儲
  • d3.js或者echarts展示

前兩個部分我已經寫好了,項目地址:

willwinworld/web-related-?

github.com圖標

其中knowledge_graph就是

爬蟲取完數據存儲到mongodb, 然後結點裡面有重複的,要進行去重,然後存儲到neo4j ,效果如下:

其實知識圖譜要做可以做的非常複雜,freebase knowledge graph就是一個例子,github上搜了一下,

Shuang0420/knowledge_graph_demo?

github.com圖標

這個屬於比較簡單的,爬取,存儲,展示,

qq547276542/Agriculture_KnowledgeGraph?

github.com圖標

這個華東師範大學的就更為複雜一點了,

我前期還是以存儲,展示為主。


推薦閱讀:

知識圖譜探究問題背後複雜關係,真相只有一個 ——「中國的蘋果」到底是怎麼了?
從 6 篇頂會論文看「知識圖譜」領域最新研究進展 | 解讀 & 代碼
知識圖譜前沿課程 | 知識圖譜的質量控制
語義網(知識圖譜)是什麼?有什麼好處?
讓機器認知中文實體 —復旦大學知識工場發布中文實體識別與鏈接服務

TAG:自然語言處理 | 知識圖譜 |