標籤:

大規模百科知識圖譜CN-DBpedia

https://www.zhihu.com/video/913720895401521152

CN-DBpedia是什麼?

CN-DBpedia是由復旦大學知識工場實驗室(kw.fudan.edu.cn/ )研發並維護的大規模通用領域結構化百科,其前身是復旦GDM中文知識圖譜 。

CN-DBpedia主要針對單數據源中文百科類網站(如百度百科、互動百科、中文維基百科等)進行深入挖掘,經知識抽取、知識清洗、知識填充以及知識更新等操作後,最終形成一個質量高、知識多、更新快的中文通用百科知識圖譜,供機器和人訪問。

CN-DBpedia自2015年12月份發布以來已經在問答機器人、智能玩具、智慧醫療、智慧軟體等領域產生超過3.6億次API調用量。CN-DBpedia提供全套API,並且免費開放使用。對於大規模商務調用,提供由IBM、華為支持的專業、穩定服務介面。如果需要,請聯繫徐波博士 xubo@fudan.edu.cn。

CN-DBpedia特色服務

1、提供結構化數據

相較於傳統的wiki網站(維基百科、百度百科等),CN-DBpedia將知識整理歸納成三元組形式(如下表所示),省略掉了自然語言處理過程,更容易被機器理解,這也是人工智慧能夠發展的基礎。

2、提供同義詞查詢

對於同義詞,如「復旦」、「fudan」、「fudan university」、「復旦大學」等,都是指代復旦大學,不對這些同義詞進行合併將對搜索、推薦等應用造成影響。CN-DBpedia提供同義詞查詢介面,為企業和個人提供服務。

3、提供Dump數據下載

CN-DBpedia目前提供Dump數據下載。包含900萬+的百科實體以及6700萬+的三元組關係。其中mention2entity信息110萬+,摘要信息400萬+,標籤信息1980萬+,infobox信息4100萬+

Dump數據僅供學術研究使用,商用請聯繫我們獲取授權。

Dump數據下載地址如下:

kw.fudan.edu.cn/cndbped

4、開放全部API介面

CN-DBpedia最新的數據,可以通過API介面的形式來訪問。地址如下:kw.fudan.edu.cn/apis/cn

目前提供了兩個API,一個是mention2entity,另一個是entityAVP。

mention2entity API實現了輸入一個字元串,返回CN-DBpedia中對應的實體名。

entityAVP API實現輸入一個實體,返回這個實體的所有知識。


推薦閱讀:

詳解谷歌第二代TPU:功耗性能究竟如何?巨頭想用它幹什麼?
從《攻殼機動隊》看未來人類發展,人人都將成為智能終端?
驍龍845全新AI架構,三倍AI性能提升
Cousera deeplearning.ai筆記 — 超參數調試、批標準化、多分類、深度學習框架

TAG:人工智慧 |