標籤:

知識圖譜

知識圖譜的三個核心邏輯

1.找到正確的東西

2.展示更加恰當的摘要

3.更深更廣

知識圖譜構建的過程:一是知識獲取,從非結構化、半結構化以及結構化數據中獲取知識;二是數據融合,將不同數據源獲取知識進行融合構建數據之間的關聯;三是知識計算及應用

知識計算主要是根據圖譜提供的信息得到更多的隱含知識,如通過本體或者規則推理技術獲取數據中存在的隱含知識;而連接預測則可預測實體間隱含關係;同時使用社會計算的不同演算法在知識網路上計算獲取知識圖譜上存在的社區,提供知識間關聯的路徑;通過不一致檢測技術發現數據中的雜訊和缺陷。

通過知識計算知識圖譜可以產生大量的智能應用,如可以提供精確的用戶畫像為精準營銷系統提供潛在的客戶;提供領域知識給專家系統提供決策數據,提供更智能的搜索方式,使用戶可以通過自然語言進行搜索。

知識融合與數據融合

知識融合是將多個數據源抽取的知識進行融合

知識融合可能使用多個知識抽取工具為每個數據項從每個數據源中抽取相應的值,而數據融合未考慮多個抽取工具。因此,知識融合除了應對抽取出來的事實本身可能存在的雜訊外,還比數據融合多引入了一個雜訊,就是不同抽取工具通過實體鏈接和本體匹配可能產生不同的結果。另外,知識融合還需要考慮本體的融合和實例的融合。

從知識獲取以後,知識往往是分散、異構、自治存在的,另外還有冗餘、噪音、不確定、非完備的特點,通常需要融合和驗證的步驟,將不同源不同結構的數據融合成統一的知識圖譜,以保證知識的一致性。因此知識的融合主要工作是對獲取的知識(三元組)進行融合,去冗餘,去衝突,規範化。,包括實體對齊,屬性對齊,衝突消解,規範化等

知識驗證

再往上一層主要是驗證,分為補全、糾錯、外鏈、更新各部分,確保知識圖譜的一致性和準確性。一個典型問題是,知識圖譜的構建不是一個靜態的過程,當引入新知識時,需要判斷新知識是否正確,與已有知識是否一致,如果新知識與舊知識間有衝突,那麼要判斷是原有的知識錯了,還是新的知識不靠譜?這裡可以用到的證據可以是權威度、冗餘度、多樣性、一致性等。如果新知識是正確的,那麼要進行相關實體和關係的更新。

推薦閱讀:

為得音樂,你剖開雲雀,一顆顆銀珠,盛著翻騰的鮮血
鹽源南紅知識大全!速來搜羅!
你必須要知道的南紅原石知識!
移動互聯新風口!關於"知識共享"的一切 都在這裡
苦惱,知識到底有什麼用

TAG:知識 |