Freebase 關閉之後,最好的替代品是什麼?
01-05
Freebase 已經正式關閉了。而題主很喜歡 Freebase 的三元組形式的數據格式。
請問還有什麼知識圖譜也是三元組形式呢?或者更廣義地說,還有什麼大規模知識圖譜呢?
可以用WikiData。
樓主看來是語義網外行呀~LOD上很多知識庫都直接提供RDF各種格式,樓主說的三元組格式大部分是.nx格式的文件,可以下載下來自己存到rdf資料庫里用sparql來查詢,不用翻牆方便快捷。最大的是Dbpedia,
非常規範化,其他nytimes,sws.geotimes等具有領域相關性的知識庫都可以,最好的是BTC2014提供百萬triple涵蓋lod大部分數據源巨量實體。
LOD 你直接google可以到它主頁,百度百科也有相關介紹。建議稍微了解一下RDF格式。。。。Billion Triples Challenge 2014 Dataset根據本人有限的經歷,貌似現在的knowledge graph其實都是wikipedia, imdb等來源的處理後數據的一個變形。
所以其他可用的有:
谷歌知識圖
https://developers.google.com/knowledge-graph/Bing Knowledge API:
Microsoft Cognitive Services
還有這個問題也相關:目前的提供開放API的中文知識圖譜有哪些? - 人工智慧
當然這些數據都是公司自有的,沒有辦法全部下載下來。自薦一個我自己的項目:楚辭:http://www.chuci.info
缺點是目前數據量超級少。
另外,其實國內有不少這方面的產品(比如復旦的:Knowledge Works 知識工場),不過最大的問題就是只能查詢,或者只能看到查詢結果。很難/無法像wiki那樣通過URL去訪問某一條數據。--而這是楚辭的特性,像維基學習,每個條目都有一個unique id。
找到一個google/freebase-wikidata-converter
不過我也覺得其實schema也無所謂,如果你真的要用的話。
因為你可以自己寫程序preprocess
參考 Are there any substitutes for Freebase?
freebase似乎都遷到wikidata上了
推薦閱讀:
※大家對人工智慧醫療怎麼看?人工智慧醫療應該著重往那個方向發展比較好?
※如何進入BAT做大數據方向的研發?
※如何評價李飛飛在谷歌開發者大會宣布穀歌 AI 中國中心正式成立 ?
※大數據培訓怎麼樣?
※文科生能做好數據分析師嗎?如何提高相關技能?