知識圖譜的問答(基於模板方法 )
一,什麼是基於知識圖譜的問答(KBQA)?
KBQA--knowledge base question answering,通過對問題進行語義理解及解析,通過知識庫進行查詢。
二,KBQA的基本要素:
輸入:自然語言問句,例如「姚明的老婆是誰?」,「姚明的身高多少?」
輸出:知識圖譜里的實體或者關係,例如「葉莉」,「2米29」
評價標準:召回率,準確率,F1-Score
三,KBQA的最基礎方法--基於模板方法:
步驟:
自然語言查詢-->意圖識別(Intention Recognition)-->實體鏈指(Entity Linking)+關係識別(Relation Detection) -->查詢語句拼裝(Query Construction)-->返回結果選擇(Answering Selection)
下面簡單介紹下各個步驟的內容:
意圖識別(Intention Recognition):預先準備好意圖模板,可以通過相似度來匹配,也可以通過機器學習里的分類問題來解決,這個是所有問答系統都要面臨的問題。
實體鏈指(Entity Linking)+關係識別(Relation Detection):將查詢語句中出現的實體和關係映射到知識圖譜里,本質是一個NER問題,只是需要將NER結果進一步鏈接到圖譜。
參考論文:
Entity Linking: Finding Extracted Entitiesin a Knowledge Base
Improved Neural Relation Detection forKnowledge Base Question Answering
查詢語句拼裝(Query Construction):需要根據底層知識圖譜的查詢語言,拼裝成對應的query來查詢(sparq等),最簡單的方法就是預先定義好查詢模板,根據之前解析出來的(意圖,實體,關係)填進模板查詢即可。
返回結果選擇(Answering Selection):圖譜查詢之後的結果可能存在多個,需要選擇一個最合適的答案,可以預先指定排序規則去選擇答案。
四,基於模板方法的優缺點及改進:
基於模板的優點:
查詢響應速度快;準確率高,可以回答覆雜查詢
基於模板的缺點:
要滿足用戶的各種問法,需要建立龐大的模板庫,這個過程是很耗精力的
優化點:
以上步驟最大的問題在於,需要人工事先準備模板,需要很大的工作量,是否可以自動生成模板?
參考論文:Automated Template Generation for Question Answering over KnowledgeGraphs
五,其他方法:
KBQA除了基於模板的方法之外,還有基於語義解析和基於深度學習等方法,後續再開新的文章進行介紹。
推薦閱讀:
※為什麼知識圖譜終於火了?|甲子光年
※AAAI 2018論文解讀 | 基於置信度的知識圖譜表示學習框架
※如何用知識圖譜識別欺詐行為
※超詳細解讀:神經語義解析的結構化表示學習 | 附代碼分析
※知識圖譜技術如何落地金融行業?
TAG:知識圖譜 |