知識圖譜的構建
08-16
知識圖譜的構建
推薦閱讀:
來自專欄 Excalibur4 人贊了文章
知識圖譜一般用於自然語言處理中,用來達到語義化的理解,通俗來說,機器看到足球運動員羅納爾多,並沒有真正理解,它只知道是個人名,並不能像人一樣想到它是足球運動員。
大規模知識圖譜構建還是挺複雜的,我在這篇文章中先講一下和訊網人物關係圖譜的構建,分成3個部分:
- 爬蟲
- neo4j存儲
- d3.js或者echarts展示
前兩個部分我已經寫好了,項目地址:
willwinworld/web-related-
其中knowledge_graph就是
爬蟲取完數據存儲到mongodb, 然後結點裡面有重複的,要進行去重,然後存儲到neo4j ,效果如下:
其實知識圖譜要做可以做的非常複雜,freebase knowledge graph就是一個例子,github上搜了一下,
Shuang0420/knowledge_graph_demo
這個屬於比較簡單的,爬取,存儲,展示,
qq547276542/Agriculture_KnowledgeGraph這個華東師範大學的就更為複雜一點了,
我前期還是以存儲,展示為主。
推薦閱讀:
※知識圖譜探究問題背後複雜關係,真相只有一個 ——「中國的蘋果」到底是怎麼了?
※從 6 篇頂會論文看「知識圖譜」領域最新研究進展 | 解讀 & 代碼
※知識圖譜前沿課程 | 知識圖譜的質量控制
※語義網(知識圖譜)是什麼?有什麼好處?
※讓機器認知中文實體 —復旦大學知識工場發布中文實體識別與鏈接服務