你讀過的 機器學習/數據挖掘 頂級會議論文中最水的是哪一篇?

題主是個數據挖掘領域內的菜鳥,剛開始讀一些文獻。不過最近發現有不少出現在頂級會議的論文都很簡單,而且很多細節如果自己深究一下,便感覺有很多漏洞。在這裡提出這個問題不是要故意黑某些人,只是想討論一下,看看大家的看法。

題主不才,稍微將此類論文概括一下:
1. 「開山之作」。提出一個新的問題,至於有沒有用無所謂(大部分是沒啥實際用處),反正就是沒人研究過就好。Intruduction裡面吹的天花亂墜,然後搞搞feature,訓練個簡單的模型。也沒有啥baseline,實驗隨便做做對比一下naive的方法,看上去提升很高,但是其實根本解決不了問題。
2. 照葫蘆畫瓢。照著一個論文,做個微小的改動(圖模型加個圈之類的),就連論文的邏輯和公式基本上都是照搬,這種論文寫起來簡單,不過讀完基本沒啥營養。
3. 論文工廠。有些研究組每年發幾十篇論文, 單獨拉出來一篇來看,其實寫的還不錯。不過如果多讀幾篇,就發現其實這些論文都是一個套路,越看越覺得沒意思。

個人認為這種論文也越來越多,其實對research領域的發展沒有什麼作用,相反,是在傷害領域的發展,對那些踏實做科研的老師學生不公平。

想問一下各位 讀過的/認為的 最水的論文都是啥樣的?


我覺得是這篇:Clustering by fast search and find of density peaks 號稱是聚類新方法

只要是做 機器學習/數據挖掘 的人都能感受到這篇paper的水度,發在普通的水會或者水期刊上無可厚非,然而,居然發了science。。。貼一下Shai Ben-David 的評論

評論地址:Clustering by fast search and find of density peaks


在知乎上看過不少問題,第一次不想看到自己的名字出現在回答中。


第二種還真不少,比如推薦系統的論文。矩陣分解或者貝葉斯框架,推導都一個樣,還很少給源代碼^_^


做CV的亂入一下,這個問題反過來說比較好:對於領域發展有推動性的研究是什麼樣的?
推薦林達華(大神,膜拜之)的兩篇blog。
https://dahuasky.wordpress.com/2010/09/23/learning%e5%92%8cvision%e4%b8%ad%e7%9a%84%e5%b0%8f%e8%bf%9b%e5%b1%95%e5%92%8c%e5%a4%a7%e8%bf%9b%e5%b1%95/
https://dahuasky.wordpress.com/2008/09/13/computer-vision%e7%9a%84%e5%b0%b4%e5%b0%ac/


應該是我2014年的nips論文。。。


在讀博士一枚
這麼說吧,我也不想寫爛文章,我也想好好研究一下,寫一篇創新點飽滿的文章
可是 我要畢業 老師催我
於是我只能屈服於數量 而不是 質量


NFL定理: 我不是針對某個演算法,我是說,你們所有的演算法, 都是辣雞。


說到這個,怎麼不提某Top1的C老闆。當年有人匿名舉報惡意灌水就不說了,最近又聽人說了他投論文還喜歡找熟人來審稿。不以為恥,還常津津樂道。

這跟考試作弊有什麼兩樣,真沒想到還能這麼玩,對科學是沒有一丁點敬畏之心啊,把國人的臉都丟光了。

雖然已經畢業多年不混學術圈了,還是可恥的匿了。


比較喜歡看別人打臉。但是說心裡話,發水文也是種水平,我想發還發不出來。我的終極目標就是夠水平發水文,畢業。

喜歡看你們大牛們相互撕逼,辨則明,能讓菜鳥少走點兒彎路


應該看什麼地方或者什麼期刊的論文比較好呢?樓主有沒有見解?


做feature extraction的文章里有一部分不是灌水


science的機器學習的文章個人感覺都。。。。很奇怪


→_→ 我也覺得應該自己的文章,匿了


說自己的真是佩服啊。水篇sci也叫頂級會議么?


推薦閱讀:

如何寫學術論文的rebuttal?
為什麼計算機科學專業背景的人喜歡黑機器學習?
13千瓦水泵搖表怎麼測電機阻值?
計算中有哪些好用的文本相似度演算法?
深度學習最終會淘汰掉其他所有機器學習演算法嗎?

TAG:數據挖掘 | 機器學習 | 論文 | 吐槽 |