論文推薦:GAN,信息抽取,機器閱讀理解,對話系統 | 本周值得讀 #35

「本周值得讀」是 PaperWeekly 的優質文章集合地。在這裡,來自 NLP、CV、DL 等方向的學習達人,各自用精鍊妙語推薦當下最新的高質量文章。

#機器閱讀理解#

1. MACHINE COMPREHENSION USING MATCH-LSTM AND ANSWER POINTER

作者使用其針對 neural inference 任務提出的 match-lstm 模型做了機器閱讀理解(SQUAD),其融合 match-lstm 和 pointer-network 的框架在後續多篇工作中出現,包括 squad leaderboard 上目前的第一名 r-net。match-lstm 在標準的 word-by-word attention 之後,將生成的 weighted question representation 和 encoder 讀入的當前 passage vector 一起作為輸入送進 lstm,計算 question related passage representation。這種結構在其他自然語言生成任務上也值得借鑒。

論文鏈接:arxiv.org/pdf/1608.0790

推薦人:孫靜遠,中國科學院(PaperWeekly arXiv組志願者)

#Metric Learning#

2. Metric Learning: A Survey

This paper aims to estimate the distance (metric) function by the training dataset consist of, Type1: Input: (x_i, y_i) output: x_i, y_i are similar or not Type2: Input: (x_i, y_i, z_i) output: y_i is closer to x_i than z_i

對於兩種不同類型的數據類型, 文章里提出了幾種估計方法。 第一種是線性的估計,假設 d_A(x,y) = x^T A y 問題轉化成為估計 A 的問題,Type1 類型的 data 就轉化成了分類問題,思想和 SVM 類似。第二種變成 Ranking 問題,思想和 RankSVM 類似。計算上會比 SVM 難,在某種意義在說就是 RankSVM 的 scoring function 是二次函數的形式。

第二種是非線性的估計,假設 d(x,y) = d_A(f(x), f(y)), f 可以是 RKHS 空間裡面的函數,用 representer thm 轉化成了 kernel 的問題。思想和 kernel svm 非常相似,先把 data map 到非線性的空間,再算 distance。最後是一些 Application, 如 Face recognition,如兩張照片是不是一個人。

論文鏈接:web.cse.ohio-state.edu/

推薦人:Ben Dai,香港城市大學(PaperWeekly arXiv組志願者)

#GAN#

3. GeneGAN: Learning Object Transfiguration and Attribute Subspace from Unpaired Data

本文的工作屬於圖像到圖像間的翻譯。類似於 DiscoGAN、CycleGAN 和 DualGAN,作者通過對偶學習,加上弱監督信息(weak 0/1 label),成功實現圖像屬性的遷移。G 採用 autoencoder 結構,encoder 將圖像編碼成圖像主體信息(如:圖像背景和人臉 ID 等)和屬性信息(如:微笑、戴眼鏡、髮型等),decoder 則類似於 CGAN,將圖像主體信息和屬性信息翻譯成圖像。通過修改輸入 decoder 的屬性信息,實現屬性的遷移。這種遷移成功的關鍵在於對偶學習機制(L1 重構誤差),以及平行四邊形 loss 和 nulling loss。值得一提的是,跟 CycleGAN 等相比,GeneGAN 只需要 generator 和 discriminator 各一個。文章在 CelebA 和 Multi PIE 數據集上進行實驗,得到了不錯的人臉屬性遷移效果。 亮點推薦:推薦學習文章對弱監督信息的處理技巧。

代碼地址:Prinsphield/GeneGAN

論文鏈接:arxiv.org/abs/1705.0493

推薦人:洪佳鵬,北京大學(PaperWeekly arXiv組志願者)

#ACL2017#

4. Joint Modeling of Content and Discourse Relations in Dialogues

本文研究的問題非常有意思,從多人會議中抽取關鍵信息,從而進一步自動生成會議摘要。類似的,我們可以做微信群的討論摘要和精彩討論抽取,以及其他多人對話、討論場景中的重點信息抽取和摘要生成。

論文鏈接:arxiv.org/abs/1705.0503

推薦人:大俊,PaperWeekly 首席客服

#對話系統#

5. Key-Value Retrieval Networks for Task-Oriented Dialogue

本文的具體研究場景是車載智能助理,作者提出了一種基於知識庫的端到端解決方案,車的 response 信息檢索自形如 key-value 知識庫中。文章會在後面開放出一個數據集出來供大家研究。本文工作來自斯坦福 Christopher D. Manning 組。

論文鏈接:arxiv.org/pdf/1705.0541

推薦人:大俊,PaperWeekly 首席客服

#IJCAI 2017#

6. Learning to Identify Ambiguous and Misleading News Headlines

信息過載是一個非常嚴重的事情,而大量的信息中又有非常多的標題黨信息。本文的工作很有趣,研究標題和新聞內容之間的一致性和連貫性,來判斷新聞是否為標題黨。做這個方向的童鞋可以來看看。

論文鏈接:arxiv.org/abs/1705.0603

推薦人:大俊,PaperWeekly 首席客服

「本周值得讀」欄目的內容來自 PaperWeekly arXiv 志願者小組推薦,如果您也是 arXiv 愛好者,願意一起來豐富 PaperWeekly 的推薦內容,並且培養良好的閱讀習慣,就請加入我們吧。請添加微信號:PW-Assistant,並註明「志願者+學校+碩士生/博士生+研究方向」,一起來為 AI 領域學術的發展貢獻自己的一份力量。

關於PaperWeekly

PaperWeekly是一個推薦、解讀、討論、報道人工智慧前沿論文成果的學術平台。如果你研究或從事AI領域,歡迎在公眾號後台點擊「交流群」,小助手將把你帶入PaperWeekly的交流群里。

微信公眾號:PaperWeekly

新浪微博:@PaperWeekly


推薦閱讀:

模型壓縮那些事(一)
深度學習實踐:使用Tensorflow實現快速風格遷移
2017 ICCV 行人檢索/重識別 接受論文匯總
TensorFlow小試牛刀(2):GAN生成手寫數字
論文推薦:機器閱讀理解,文本摘要,Seq2Seq加速 | 本周值得讀 #34

TAG:计算机视觉 | 深度学习DeepLearning | 自然语言处理 |