請問如何理解遷移學習中的負遷移,有哪些資料闡述了這一問題?
如何理解負遷移
要理解負遷移,首先要理解什麼是遷移學習。遷移學習指的是,利用數據和領域之間存在的相似性關係,把之前學習到的知識,應用於新的未知領域。遷移學習的核心問題是,找到兩個領域的相似性。找到了這個相似性,就可以合理地利用,從而很好地完成遷移學習人物。比如,之前會騎自行車,要學習騎摩托車,這種相似性指的就是自行車和摩托車之間的相似性以及騎車體驗的相似性。這種相似性在我們人類看來是可以接受的。(遷移學習的更多介紹可以參照我之前的這個回答以及我的Github)
所以,如果這個相似性找的不合理,也就是說,兩個領域之間不存在,或者基本不相似,那麼,就會大大損害遷移學習的效果。還是拿騎自行車來說,你要拿騎自行車的經驗來學習開汽車,這顯然是不太可能的。因為自行車和汽車之間基本不存在什麼相似性。所以,這個任務基本上完不成。這時候,我們可以說出現了負遷移(negative transfer)。比較權威的定義
遷移學習領域權威學者、香港科技大學楊強教授發表的遷移學習的綜述文章《A survey on transfer learning》給出了負遷移的一個定義:
負遷移指的是,在源域上學習到的知識,對於目標域上的學習產生負面作用。
文章也引用了一些經典的解決負遷移問題的文獻。但是普遍較老,這裡就不說了。
所以,產生負遷移的原因主要有:
- 源域和目標域壓根不相似,談何遷移?------數據問題
- 源域和目標域是相似的,但是,遷移學習方法不夠好,沒找到可遷移的成分。 --------方法問題
因此,在實際應用中,找到合理的相似性,並且選擇或開發合理的遷移學習方法,能夠避免負遷移現象。
最新的研究成果
但是,隨著研究的深入,已經有新的研究成果在逐漸克服負遷移的影響。楊強教授團隊2015在數據挖掘領悟頂級會議KDD上發表了傳遞遷移學習文章《Transitive transfer learning》,提出了傳遞遷移學習的思想。傳統遷移學習就好比是踩著一塊石頭過河,傳遞遷移學習就好比是踩著連續的兩塊石頭。更進一步,楊強教授團隊在2017年人工智慧領域頂級會議AAAI上發表了遠領域遷移學習的文章《Distant domain transfer learning》,可以用人臉來識別飛機!這就好比是踩著一連串石頭過河。這些研究的意義在於,傳統遷移學習只有兩個領域足夠相似才可以完成,而當兩個領域不相似時,傳遞遷移學習卻可以利用處於這兩個領域之間的若干領域,將知識傳遞式的完成遷移。這個是很有意義的工作,可以視為解決負遷移的有效思想和方法。可以預見在未來會有更多的應用前景。
參考資料
[1] 遷移學習綜述文章:Pan S J, Yang Q. A survey on transfer learning[J]. IEEE Transactions on knowledge and data engineering, 2010, 22(10): 1345-1359.
[2] 傳遞遷移學習:Tan B, Song Y, Zhong E, et al. Transitive transfer learning[C]//Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM, 2015: 1155-1164.
[3] 遠域遷移學習:Tan B, Zhang Y, Pan S J, et al. Distant Domain Transfer Learning[C]//AAAI. 2017: 2604-2610.
[4] 我的Github上關於遷移學習的資料:https://github.com/jindongwang/transferlearning
[5] 我之前關於遷移學習介紹的回答
從A到B修一條路很容易,通常兩點之間直線最短,如果B旁邊緊挨著個C,這時候要從A到C再修一條路就比較鬧心了。繞道B的話路程太長,好處是幾乎不用修路,從A重新修,工程浩大,所以很可能會先沿AB走一段後再修到C,形成一個樹枝路,走多長再分叉也是問題,這樣從A到C就有了多種的選擇方案,不同的場景會產生不同的需求不同的路徑走法,平均下來單條路會用的少,相對都不如AB健壯,那麼等野草叢生的路到了用的時候就有可能還得重修。
這就是學會了從A到B,再去學從A到C會變的相對困難的原因。
推薦閱讀:
※論文篇:Latent Dirichlet Allocation(LDA)(二)
※自然語言處理工程師需要掌握機器學習到什麼程度?
※【博客存檔】Machine Learing With Spark Note 4: 構建回歸模型
※那些年我趕過的時髦技術趨勢
TAG:人工智慧 | 數據挖掘 | 機器學習 | 遷移學習TransferLearning |