數據下載 | CN-DBpedia Dump數據正式對外開放下載

數據下載 | CN-DBpedia Dump數據正式對外開放下載

來自專欄 知識工場

介紹

CN-DBpedia是由復旦大學知識工場實驗室研發並維護的大規模通用領域結構化百科,其前身是復旦GDM中文知識圖譜。

主要針對單數據源中文百科類網站(如百度百科、互動百科、中文維基百科等)進行深入挖掘,經知識抽取、知識清洗、知識填充以及知識更新等操作後,最終形成一個質量高、知識多、更新快的中文通用百科知識圖譜,供機器和人訪問。

CN-DBpedia自2015年12月份發布以來已經在問答機器人、智能玩具、智慧醫療、智慧軟體等領域產生3.5億次API調用量。

Dump

CN-DBpedia目前提供Dump數據下載。包含900萬+的百科實體以及6700萬+的三元組關係。其中mention2entity信息110萬+,摘要信息400萬+,標籤信息1980萬+,infobox信息4100萬+

Dump數據僅供學術研究使用,商用請聯繫我們獲取授權。

最新數據請直接訪問CN-DBpedia API (kw.fudan.edu.cn/apis/cn

如果您在使用的過程中出現問題請聯繫徐波博士xubo@fudan.edu.cn

引用

如果您需要引用我們的文章,請引用:

Bo Xu, Yong Xu, Jiaqing Liang, Chenhao Xie, Bin Liang, Wanyun Cui, and Yanghua Xiao. CN-DBpedia: A Never-Ending Chinese Knowledge Extraction System. In International Conference on Industrial, Engineering and Other Applications of Applied Intelligent Systems, pp. 428-438. Springer, Cham, 2017.

關注「知識工場」公眾號,查看此篇文章,點擊「閱讀原文」下載數據。


推薦閱讀:

從 6 篇頂會論文看「知識圖譜」領域最新研究進展 | 解讀 & 代碼
如何用知識圖譜識別欺詐行為
高效的關係補全——EMNLP2015 SFE論文研讀
知識圖譜前沿課程(蘇州大學站)報告PPT
大規模知識圖譜數據流設計

TAG:人工智慧 | 知識圖譜 |