Freebase 關閉之後,最好的替代品是什麼?

Freebase 已經正式關閉了。而題主很喜歡 Freebase 的三元組形式的數據格式。

請問還有什麼知識圖譜也是三元組形式呢?

或者更廣義地說,還有什麼大規模知識圖譜呢?


可以用WikiData。


樓主看來是語義網外行呀~LOD上很多知識庫都直接提供RDF各種格式,樓主說的三元組格式大部分是.nx格式的文件,可以下載下來自己存到rdf資料庫里用sparql來查詢,不用翻牆方便快捷。最大的是Dbpedia,

非常規範化,其他nytimes,sws.geotimes等具有領域相關性的知識庫都可以,最好的是BTC2014提供百萬triple涵蓋lod大部分數據源巨量實體。

LOD 你直接google可以到它主頁,百度百科也有相關介紹。建議稍微了解一下RDF格式。。。。

Billion Triples Challenge 2014 Dataset


根據本人有限的經歷,貌似現在的knowledge graph其實都是wikipedia, imdb等來源的處理後數據的一個變形。

所以其他可用的有:

谷歌知識圖

https://developers.google.com/knowledge-graph/

Bing Knowledge API:

Microsoft Cognitive Services

還有這個問題也相關:目前的提供開放API的中文知識圖譜有哪些? - 人工智慧

當然這些數據都是公司自有的,沒有辦法全部下載下來。


自薦一個我自己的項目:楚辭:http://www.chuci.info

缺點是目前數據量超級少。

另外,其實國內有不少這方面的產品(比如復旦的:Knowledge Works 知識工場),不過最大的問題就是只能查詢,或者只能看到查詢結果。很難/無法像wiki那樣通過URL去訪問某一條數據。--而這是楚辭的特性,像維基學習,每個條目都有一個unique id。


找到一個google/freebase-wikidata-converter

不過我也覺得其實schema也無所謂,如果你真的要用的話。

因為你可以自己寫程序preprocess

參考 Are there any substitutes for Freebase?


freebase似乎都遷到wikidata上了


推薦閱讀:

大家對人工智慧醫療怎麼看?人工智慧醫療應該著重往那個方向發展比較好?
如何進入BAT做大數據方向的研發?
如何評價李飛飛在谷歌開發者大會宣布穀歌 AI 中國中心正式成立 ?
大數據培訓怎麼樣?
文科生能做好數據分析師嗎?如何提高相關技能?

TAG:人工智慧 | 機器學習 | 大數據 | 知識圖譜 |