除了 arxiv.org, 機器學習與數據挖掘相關在哪可以閱讀比較專業的文獻?

如果發paper的話,也算。


我的研究內容是Pattern Recognition and Machine Learning。從我的角度來說說常用的論文資源來源。

常關注的期刊:

IEEE Transactions on Pattern Analysis and Machine Intelligence
(PAMI)

IEEE Transactions on Neural Networks

IEEE Transactions on Knowledge and Data Engineering

Journal of Machine Learning Research

Machine Learning (ML), springer

會議:

IEEE Conference on Computer Vision and Pattern Recognition (CVPR)

International Conference on Machine Learning (ICML)

European Conference on Machine Learning (ECML)

AAAI Conferences

Neural Information Processing Systems (NIPS)

搜索論文的網址:

IEEE Xplore - Home

http://www.sciencedirect.com/

Springer - International Publisher Science, Technology, Medicine

Google Scholar

其實大部分時候,還是根據自己的研究方向,google scholar關鍵詞搜索相關論文。如果論文是發表在上述期刊或者會議中,可能質量會比較好,更重視些。


感謝@David Chang 邀請,問題時間很長了,上面的回答都很豐富,我簡單說說我的看法吧。

1. 如果只是想應用,並不想研究,參考機器學習和模式識別的經典書目就可以了。可以百度:機器學習 模式識別 經典書籍。或是根據項目具體需求,直接搜索最相關的論文參考,這個論文發在什麼雜誌上往往並不是最重要的,因為真正管用的方法並不一定就能發表在相關領域最好的雜誌上。

2. 如果是想從事機器學習和數據有關的研究工作,這個就要注意文獻的選擇,讀什麼的樣文獻往往決定了你以後從事什麼層次的研究。

期刊:

Journal of Machine Learning Research (JMLR) (理論+應用)

IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI) (應用)

Machine Learning (偏理論,不推薦 )。註:不推薦不代表沒有用或是不重要。

會議:

COLT、SODA (理論,不推薦)

ICML、NIPS (理論+應用)

CVPR(應用)。其它的會還有 KDD,ICDM,IJCAI, AISTATS,UAI,AAAI,ECML等等。

如果還包括機器視覺,就再加上:

International Journal of Computer Vision

IEEE Transactions on Image Processing

ICCV,ECCV。

這方面的會議和期刊都比較多,一定要挑最好的看,從事相關研究工作,一定要緊緊盯住會議的最新進展,頂級會議的論文代表了國際上最新、水平最高的學術進展。並不是每一篇頂級會議的論文水平都很高,但是水平很高的一般都會首先出現在會議上。如果要更專註一點,JMLR、TPAMI、ICML、NIPS、CVPR就夠了。如果是學生,還可以看一些學術大牛們的公開課程。國內有些學校對於期刊和會議的等級分類和國際上出入比較大,一定要以國際學術界大家都認可的真實的檔次為標準,這樣更有利於你把握學術研究進展。

一點個人淺見,希望有幫助。


機器學習細分也很廣的。

不知道題主是新開學的研究生博士生,還是只是對機器學習感興趣想要了解一二的工程師。

如果是後者,可以上coursera上看看機器學習相關的公開課。

可以看一些機器學習的教科書,例如《Pattern Recognition and Machine Learning》,《Foundation of Machine Learning》。

網易公開課早就有andrew NG機器學習課的中文版,入門已經很好了。

當然其他學校也有不少公開的資料。

龍星計劃-機器學習

Courses on machine learning

Machine Learning Surveys

Statistical Data Mining Tutorials

也可以平時上微博上關注一些機器學習領域比較活躍的人。

如果是前者,首先要確定方向,然後再找相關。這個得跟老闆商量,盲目地瞎看很難看出什麼來。

確定方向之後,可以找相關會議期刊的論文,也可以讓老師推薦一篇種子論文開始看,也可以follow一些大牛的工作。

論文一般都是發表在會議或期刊上。

機器學習相關的會議期刊很多,好的會就那麼幾個,也可以去找人工智慧的方向。

身為中國的學生,我更關注中國計算機學會的會議推薦排名。

CCF推薦排名

看裡面數據挖掘人工智慧模式識別板塊列出的會議不少是機器學習相關。排名僅供參考。

可以和樓上各位回答中的會議名對照。

到會議的主頁,找accepted paper,裡面會列出接受的論文。

會議有的一年一開,有的兩年一開,搜會議主頁要帶年份搜。

除去研究相關,如果對機器學習數據挖掘的其它領域現狀感興趣,就去看看近年,尤其是今年相關會議的發表論文。。

大部分的好會議期刊都是ACM或IEEE出版的,少數springer和其它出版社。ACM和IEEE的都有自己的資料庫,都可以下載pdf(前提是在高校用高校賬戶登錄)。搜論文標題一般前幾個鏈接里就有ACM和IEEE頁面的鏈接。如果不是ACM和IEEE的,google標題,一般都能在Google Scholar里找到pdf。

如果老師給你推薦一篇種子論文,你最好從這篇論文開始,看他引用的其它論文,從裡面引用次數最多的論文開始看起,這一般都是一個小方向的奠基作品,更靠譜。然後從引用的論文找他們引用的論文,展開一張網。

比如說經常某一個作者的論文,可能這個人很厲害,那麼就可以follow這個人的工作。

可以找作者的大學首頁,如果有的話,裡面一般會列出不少資料,包括publication和一些數據,不少人會附上pdf。

如果是個沒有主頁的phd學生,找他的老闆。

也可以找dblp,直接google搜,作者名加dblp,這是個資料庫列出發表的論文標題,不過沒有pdf,知道標題再去搜。

例如Michael I Jordan的dblp:

dblp: Michael I. Jordan

當然也可以google scholar直接搜作者名。


我都看那些博客或者整理性paper下面的reference,然後就google咯,基本都能找到pdf的


個人覺得其實axiv並不是一個很好的尋找相關學習資料的網站,上面的文章質量太參差不齊。我個人的方法是:關注若干重點實驗室,瀏覽幾個 top會議的abstract,選取感興趣的讀。另外一個是經常看看大公司的最新專利,會有意外的收穫。當然,論文是讀不完的,最重要的是專註自己的課題


一般上都是大牛的博客或者主頁, 就是大學裡面的機器學習團隊的主頁了:

The Ideal Large Scale Learning Class ? Machine Learning (Theory)

Workshop on Algorithms for Modern Massive Data Sets (MMDS)

courses:bigdata:slides:start

Cambridge Machine Learning Group Publications

更多的時候,根據wiki,然後去看wiki下面推薦的論文。


理論化學方向

Web of Knowledge

各大期刊的 RSS


前面Richard Li關於期刊會議提得比較全面了,會議應該是比較重要的信息來源,比期刊更能及時反映當前熱點

另外,還可以關注大牛的微博,也會有很多有用的信息

對某個主題感興趣的話,就直接Google scholar,然後深入下去

如果要系統學習的話,就看書,經典的ESL,PRML什麼的


我來補充一個計算機視覺方面的。

CVPapers - Computer Vision Resource


一般都是到關注幾個相關的conference,可以去看看最近幾年有哪些感興趣的文章。

像nips、icml的文章都會給出pdf鏈接;kdd acl cvpr iccv等可以到google scholar上搜一下。

再就是收藏一些大牛的研究主頁,和幾個主要labs的頁面,上面除了最近的文章,可以還會有一些demo和源碼。

不過最貼心的還屬機器之心和新智元等公眾號,省心又省力。


我一般關注極每年conference, ICML, ICDM, KDD, CIKM.

然後是一些journal paper. TPAMI, TKDE, TNNLS, TIP等。

我也關注領域,大牛的或者牛組的網頁。

大體就是這三個方向了!


工作之後很難有特別集中的時間閱讀大量的paper,推薦兩個方法:1)top conference的paper出來之後自己要過一遍,第一形成當前主流研究方向的印象,第二挑選一些相關的、感興趣的paper,可以的話組織組內進行paper reading,每人分一兩篇精讀,做分享;2)關注一些大牛的主頁,研讀他們的tutorial,對一些簡單的方法手動實現,這樣最能深入理解


我的很簡單 跟蹤文獻 我們導師主要研究貝葉斯 所有我們找貝葉斯相關的文獻以及最新論文後面的參考文獻


先找到一篇國際Top、國際A、國際B類近幾年的期刊看一篇,然後根據文中所引的參考文獻再看,如果覺得直接看英文不方便,可以先看中文,然後轉英文,不過中文期刊創新點一般晚於國外期刊,現在有很多關於數據挖掘和機器學習的書籍,推薦《失控》,正在拜讀。。。


感謝邀請, 我個人在 ML相關領域涉足不深,提一些自己的淺見吧。

1. 機器學習的領域很廣,有必要參考上面各位大蝦的建議系統學習一下。

2. 我個人理解的機器學習是一門和實踐緊密結合的學科。所以,可以是自己在偶爾看paper中觸發的某個興趣點 或 自己工作需要涉及的興趣點,先直接上 google or bing 搜索,按引用找一下優質文獻閱讀,再從 Ref 中拓展。

3. 具體看Paper時,如果感覺paper的東西和你的方向很吻合, 直接搜作者的主頁。 繼續挖墳。

大概就這些了~


感謝邀請,不過我真的沒能力向你推薦任何地方。因為我本身也是去年才開始接觸數據挖掘的,目前也就會些基本演算法而已。如果真有拓展,我頂多去萬方或其他 論文庫去查看相關論文。不過 感覺 國內的某一領域的論文看過十篇左右就差不多了,因為剩餘的都和這個差不多。沒有多大看頭。我沒有打算做學術,所以面向實際技術的方面多一些。


我主要在這兩個地方搜

Microsoft Academic Search

Google 學術搜索


推薦閱讀:

如何有效的區分和理解RNN循環神經網路與遞歸神經網路?
人工神經網路與人類神經網路有關係嗎?
ICCV2017有什麼令人關注的文章?
機器如何去理解一個「概念」?
學習機器學習演算法一定要做到會手寫編程實現嗎?還是只要拿到數據後知道使用哪個演算法調用numpy的包就行?

TAG:數據挖掘 | 機器學習 |