Relation Classification名詞解釋(持續更新,歡迎補充)
關係分類(relation classification):關係分類,又叫關係抽取,就是我有一句話,這句話的兩個實體已經標記出來了,那麼關係分類就是要找出這句話是描述的這兩個實體的什麼關係。
遠程監督(distant supervision):用來自動標註語料生成有標記的訓練樣本。就是把知識庫與非結構化文本對齊,只要某個句子含有對應的實體對,就認為這個句子描述的就是知識庫里的關係。會有嚴重的噪音問題。
bag-level prediction:在bag層面上進行關係分類,對應上面的遠程監督,就是把所有相同實體對的句子都分到一個bag里然後映射到一個關係,這樣的話就可以認為雖然我bag里有很多噪音,但bag的標籤是對的。這樣的話就不是處理句子看句子是不是描述實體之間的這個關係,而是只能知道兩個實體之間是否存在這樣的關係。這裡應用到的思想就是multi-instance learning。
sentence-level prediction:對應上面的bag-level,sentence-level是對每個句子進行關係抽取。
attention機制:多用於bag-level關係分類模型,大概就是給bag里valid instance賦予更大的權重,給noisy instance更小的權重。
推薦閱讀:
※word embedding之GLOVE代碼
※Deep Metric Learning via Lifted Structured Feature Embedding(CVPR,2016)
※Top 機器學習會議
※Tensorflow VS PMML
※第二章:機器學習對配電網健康指數分析
TAG:深度學習DeepLearning | 機器學習 | 自然語言處理 |