DrQA基於維基百科數據的開放域問答機器人實戰教程

DrQA基於維基百科數據的開放域問答機器人實戰教程

來自專欄 TensorFlowNews6 人贊了文章

作者 | fendouai

【磐創AI導讀】:本文主要向大家推薦一個開放域問答機器人的實戰項目。

目錄:

  • 官方介紹
  • 實戰

DrQA 是一個基於維基百科數據的開放域問答系統,它由檢索器和閱讀器組成。其中檢索器用於從海量的文本(例如維基百科)中獲得相關的文章;閱讀器用於從文章中獲得相應的答案。

一 . 官方介紹

DrQA是一個應用於開放域問答的閱讀理解系統。特別是,DrQA的目標是「大規模機讀」(MRS)。在這個設定中,我們在可能非常大的非結構化文檔集中搜索問題的答案。因此,系統必須將文檔檢索(查找相關文檔)的挑戰與機器對文本的理解(從這些文檔中識別答案)的挑戰相結合。

我們使用DrQA的實驗側重於回答factoid問題,同時使用Wikipedia作為文檔的獨特知識源。維基百科是一個非常適合大規模,豐富,詳細信息的來源。為了回答任何問題,必須首先在超過500萬個文章中檢索可能相關的文章,然後仔細掃描它們以確定答案。

請注意:

DrQA將Wikipedia視為一個通用的文章集合,並不依賴於其內部知識結構。因此,DrQA可以直接應用於任何文檔集合。

數據集:維基百科

框架:PyTorch

版本:PyTorch torch-0.3.0

論文:Reading Wikipedia to Answer Open-Domain Questions

項目:github.com/facebookrese

系統架構:

二. 實戰

交互模式下提問(一):

where is stanford university

可以看到檢索到的文檔是 Stanford University,問題的答案是:淺綠色標註的部分,答案非常的精準。

交互模式下提問(二):

where is Barack Hussein Obama from

回答不是很精準,我其實想問的是奧巴馬來自哪裡。答案返回的是奧巴馬在哪裡,奧巴馬在華盛頓,不過也還是相當不錯。

交互模式下提問(三):

who is Donald Trump

這個問題並沒有找到準確的答案,雖然文檔是相關的。

最後,對深度學習感興趣,熱愛Tensorflow的小夥伴,歡迎關注我們的網站!http://www.tensorflownews.com。我們的公眾號:磐創AI。


推薦閱讀:

南方周末 ?人工智慧有多「危險」?阿爾法狗是怎樣煉成的
從虛擬世界伸到現實的機械臂,靠攝像機就能玩轉任何物體
量子計算 人工智慧——這才是未來科技的最大熱門!
人工智慧:夠聰明之前,還需善約束
連羞羞的事都要和機器人一起做,人活著還有什麼意義?

TAG:科技 | 機器人 | 人工智慧 |