有哪些比較好的機器學習、數據挖掘、計算機視覺的訂閱號、微博或者是論壇?

推薦一些寫的比較好的機器學習,數據挖掘,計算機視覺的訂閱號,微博或者論壇吧!國內國外的都可以!?


我覺得最好的訂閱號是 - arxiv.org.
選擇感興趣的領域,subscribe一下,每天會給你推送一些新的論文。 堅持一段時間,你就會發現你變厲害了!


自薦:智能單元 - 知乎專欄。目前關注4000+,已獲得讚賞內測資格。

推薦理由

  • 授權翻譯斯坦福深度學習課程CS231n-Convolutional Neural Networks for Visual Recognition(面向視覺識別的卷積神經網路)官方筆記。
  • 翻譯獲得課程講師Andrej Karpathy的授權

  • 翻譯行為是一群深度學習愛好者自發的無償行為,翻譯團隊有理想,對翻譯精益求精,對知友的批評及時討論和反饋。
  • 除課程連載外,三位機器學習領域的好基友在各自領域發布原創文章。這三個領域分別是深度增強學習,圖像分類與標註,RNN和TensorFlow使用。感興趣的知友也可以關注。

斯坦福CS231n課程簡介

  • 課程官網:Stanford University CS231n: Convolutional Neural Networks for Visual Recognition
  • 課程講師:

Fei-Fei Li的主頁:Stanford Computer Vision Lab (直接就是斯坦福計算機視覺實驗室主頁,好吧大老闆你牛逼)
Andrej Karpathy的個人網頁:Andrej Karpathy Academic Website
Justin Johnson的個人網頁:Justin Johnson

  • 課程結構:課程一共15課,內容由簡入難。從線性分類器到神經網路再到卷積神經網路,遞歸神經網路。包含3個有分量的作業(專欄下步計劃講解的內容)多個詳細的筆記(專欄正在翻譯的內容)
  • 課程近況:最近由於課程中的一些版權引用,導致課程視頻在YouTube上被下架,目前斯坦福正在努力恢復。需要視頻的同學看下條。
  • 課程資源獲取:http://pan.baidu.com/s/1gfEuAX1,資源包含所有CS231n課程視頻和PPT,提取碼請私信我。

翻譯進度

  • 所有note均已草譯完畢,正在仔細修改和校對,已經發布11篇:
  1. 獲得授權翻譯斯坦福CS231n課程筆記系列 - 智能單元 - 知乎專欄
  2. CS231n課程筆記翻譯:Python Numpy教程 - 智能單元 - 知乎專欄
  3. CS231n課程筆記翻譯:圖像分類筆記(上) - 智能單元 - 知乎專欄
  4. CS231n課程筆記翻譯:圖像分類筆記(下) - 智能單元 - 知乎專欄
  5. CS231n課程筆記翻譯:線性分類筆記(上) - 智能單元 - 知乎專欄
  6. CS231n課程筆記翻譯:線性分類筆記(中) - 杜客的文章 - 知乎專欄
  7. CS231n課程筆記翻譯:線性分類筆記(下) - 智能單元 - 知乎專欄
  8. CS231n課程筆記翻譯:最優化筆記(上) - 智能單元 - 知乎專欄
  9. CS231n課程筆記翻譯:最優化筆記(下) - 智能單元 - 知乎專欄
  10. 斯坦福CS231n課程作業# 1簡介 - 智能單元 - 知乎專欄
  11. CS231n課程筆記翻譯:反向傳播筆記 - 智能單元 - 知乎專欄
  • 發布節奏按照1周1-2篇的速度發布。
  • 歡迎知友們對我們的翻譯內容批評指正,請直接在文章下評論。
  • 筆記長度較長,包含公式和代碼等,建議在PC端閱讀。

一些廢話

  • 尋求學習資源,尋求同伴,尋求大牛知道等問題是每個機器學習初學者開始學習的時候都遇到過的問題。
  • 翻譯是一個降低門檻,傳播知識,充滿理想主義的行為。希望能通過自己的一點努力,讓後來者更加快速地進入領域,利用深度學習的知識讓我們的世界變得更好!
  • 這麼多乾貨,最後來點雞湯怎麼了?!

補充一個paper+code的:http://gitxiv.com/ ,這個網站也可以訂閱,每天推送paper,而且所有的paper都是有代碼的。

====================================================================
牆裂推薦Arxiv Sanity Preserver , 根據自己的library每天推薦新的paper。
以上是嚴肅臉,下面的可以拿來放鬆:
Reddit 的Machine Learning版:Machine Learning
GitHub的awsome系列:
GitHub - kjw0612/awesome-deep-vision: A curated list of deep learning resources for computer vision
GitHub - jtoy/awesome-tensorflow: TensorFlow
GitHub - ChristosChristofidis/awesome-deep-learning: A curated list of awesome Deep Learning tutorials, projects and communities.
我有時候還會刷刷StackOverflow裡面感興趣的tag,比如python的:Highest Voted "python" Questions


為什麼不安心讀書讀論文?你們真以為看看所謂牛人發的博客就能學好機器學習了?naive!看看那些公眾號發那麼多資料,恐怕他們自己一個都沒看過吧。

如果想follow高大上的東西,就去看看Berkeley Simons Institute上的講座,那才是乾貨。Workshops Symposia


謝邀

Data science blogs: GitHub - rushter/data-science-blogs: A curated list of data science blogs

是一個比較長的數據科學、機器學習等內容的博客列表,給了rss,會不斷增加。


廣告兩個真原創的公眾號:VALSE和深度學習大講堂,請叫我雷鋒。


github里一般來說會有很多資源集錦 (awesome系列),比如:
博客匯總:rushter/data-science-blogs · GitHub,
機器學習資源匯總:josephmisiti/awesome-machine-learning · GitHub
深度學習資源匯總:ChristosChristofidis/awesome-deep-learning · GitHub

博客的話特別推薦幾個:
pluskid"s blog(MIT博士生,中文博客):Free Mind
colah"s blog(幾篇關於深度學習的文章非常形象):http://colah.github.io/,
python代碼一步步實現神經網路:i am trask
stanford cs231n課程講師的博客:Andrej Karpathy blog

Reddit里的Machine Learning板塊也是個非常好的去處。

這些只是輔助,教材和論文當然不可少,否則會消化不良的


用Google搜英文資料!
用Google搜英文資料!
用Google搜英文資料!
像這樣搜:『SVM tutorial』,『MCMC introduction』,『convolutional neural network stackexchange』。。。
很多外國人寫的博客或者導論簡直沒的說,不像中文博客那樣抄來抄去。


自薦一下 ResysChina 吧,應該不會讓你失望,

  1. 微信公眾號,在微信里搜索「ResysChina」或者掃描下面的二維碼即可。

  2. ResysChina - 知乎專欄,知乎的專欄,剛剛開,第一篇文章「關於 Facebook NewsFeed,看這一篇就夠了!」就被選入了知乎日報,也是挺受寵若驚的。特別感謝!

看書
聽課
讀paper

看啥公眾號啊


http://arxiv.org/


我覺得第一名的回答有點絕對。題主想必並不排斥從主流途徑學習機器學習,而blog、社交媒體等等都會是一個不那麼枯燥的補充,適合閑的時候瞅瞅。

本人的feedly收集了很多機器學習和統計的博客(英文居多,許多需要翻牆),下面列出來一部分最近還在更新的:

The Spectator ← Shakir"s Machine Learning Blog
stitch fix公司的技術博客: Blog | Stitch Fix Technology
Thinking Machine Blog下的機器學習子類 http://thinkingmachineblog.net/category/machine-learning-narrow-artificial-intelligence/
Daniel Lemire(一個魁北克大學正教授)的blog http://lemire.me/blog
Darren Wilkinson"s research blog
Data Mining: Text Mining, Visualization and Social Media
Error Statistics Philosophy on WordPress.com
http://googleresearch.blogspot.com/
Neil Lawrence
Analytics, Data Mining, and Data Science
http://bickson.blogspot.com/
Machine Learning
Machine Learning (Theory)
Delip Rao
inFERENCe
http://nlpers.blogspot.com/
http://nuit-blanche.blogspot.com/
Pillow Lab Blog on WordPress.com
http://allendowney.blogspot.com/
http://simplystatistics.org/
Statisfaction on WordPress.com
Statistical Modeling, Causal Inference, and Social Science -
Innovative Ideas for a Better World
Stigler Diet
Consulting in mathematics, statistics, and scientific computing
http://blog.geomblog.org/
Walking Randomly
Xi"an"s Og on WordPress.com
增強視覺 | 計算機視覺 增強現實
我愛計算機 | @52cs 關注計算機領域進展
http://www.aboutdm.com/


機器之心 | 前沿科技媒體與產業服務平台 關於人工智慧和深度學習的諮詢,主要內容來自於翻譯國外的最新報道。
https://www.coursera.org/Andrew Ng創辦的免費雲課堂,有他親自授課的內容,入門必看。
機器學習日報 微信訂閱號和微博都有,搜索「好東西傳送門」關注即可。
VALSE - 視覺與學習青年學者研討會 這個是國內關於機器學習和計算機視覺最權威的論壇了,彙集無數大牛,有非常豐富的優質資源。

以上幾個由淺入深,相信無論題主處於什麼階段,都會對你有所幫助。
當然學習機器學習最好的辦法還是去實踐,圖普科技—專註於圖像識別和視覺檢測的人工智慧企業正在招收實習生,歡迎勾搭~


數說工作室
真的全是乾貨,可以看出是用心做的。

當時是在火車上想抽時間搞懂SVM時候找到的,關於SVM部分說的很透徹。適合入門,如果想要深入,還是去看公開課看書吧,NJ的課程和講義寫的非常好!!!

附數說工作室最新目錄

量化金融系列

【F1】多因子選股模型
【F2】動量反轉
【F3】資本資產定價模型(CAPM)
【F4】盈餘管理的測量

【A1】金融數據挖掘之樸素貝葉斯
【A2】金融數據挖掘之決策樹(ID3)

【FX】風險管理與數據分析
第一文:風險管理與數據分析
第二文:商業銀行

演算法·理論

【gll】概率論,上帝的賭術
第一話:古典概率論,一場賭局引發的血案
第二話:大數定律,看不見的神的秩序
第三話:正態分布,眾生的百態
第四話:暴走的假設檢驗
第五話:回歸模型,命運的方程
番外話:常用分布表
局部完結篇

【machine】機器學習分類大全

【nt】牛頓迭代法
【ntcode】牛頓迭代法的matlab代碼

【MB】面板數據與Eviews操作指南(上、下)

【logistic】logistic回歸
從生產到使用(使用篇)
從生產到使用(生產篇)
logistic回歸建模指南

【SVM】分類戰車SVM
開題話
線性分類
最大間隔分類器
拉格朗日對偶問題
核函數
SMO演算法
用Python做SVM模型

語言·工具

【Python】統計師的Python日記
第1天:誰來給我講講Python?
第2天:再接著介紹一下Python唄
本系列待續中...

【sasbase】SAS Says·基礎篇
1. SAS軟體入門
2. 讀取數據
3. 描述數據
4. ODS的使用
5. 開發數據(一)
6. 開發數據(二)
7. SAS宏初步
8. 相關、回歸等初步統計
本系列分基礎篇、進階篇、高級篇,待續中...

資訊·精選

【family】大數據圈
【O8】你需要了解的十項國家大數據工程

金融經濟:

【dsj】大數據與金融業
P quant與Q quant(轉)
P quant的裝備之戰
銀行如何裝備Hadoop平台(轉)
全面了解大數據在銀行業的應用(轉)
全面了解大數據在證券業的應用(轉)

【O2】爭鳴!西方經濟學流派圖

客戶管理:

【seg】當我們談論「細分」(segmentation)的時候我們在談論什麼

生物:

【bioml】機器學習在生物大數據應用的一個例子

【fine】統計分析方法在生物信息學「精細定位(fine-mapping)中的應用」

人口:

【old】數說工作室聯合推出老齡數據分析報告

農業:

【arg】德強農場

【arg】Farmeron:農場主的分析工具

http://weixin.qq.com/r/33VRSazEE-Fsregq9yDN (二維碼自動識別)


要說到計算機視覺技術公號,當然要有我們啦~^^
請允許我自吹自擂一下

深度學習大講堂

初期集中在利用深度學習解決cv問題~之後會拓展到更多深度學習的領域。

技術文章都是棒棒噠(請允許我吹一下我們的專家團)

最後,歡迎聯繫我投稿^^ 知名度會大大的提升!


http://www.memect.com/,有各位需要的列表,也有微信公眾號和微博的鏈接。 @鮑捷


機器學習日報,訂閱號,推送的內容質量還不錯,通過它你可以找到你要的微博id/論壇/博客。

大部分網路資料,你在排隊打飯的時候瀏覽一下就行了。

最終還是要看書論文。


如果想了解最新的動態可以:
1. google scholar 上可以follow 你關注的researcher的新paper,著名的作者的paper質量通常有保證。
2. arxiv 可以rss訂閱 https://arxiv.org/help/rss 但是質量參差不齊,有可能浪費一些時間。
3. 其實 jmlr、The Annals Of Statistics、now publishers 等等期刊都可以rss訂閱的。有些不上傳到arxiv的paper可以rss訂閱期刊來獲得最新的消息,質量自然比 arxiv 高多了。
4. G+上的deep learning 組: https://plus.google.com/u/0/communities/112866381580457264725 DL有關的 paper 有的會在這裡宣傳。
5. 有的大佬會在twitter和weibo上發消息,可以follow下,不過會有很多無聊的信息。

另外這幾個blog也不錯
1. Machine Learning (Theory) 可以從第一篇開始翻著看。
2. Free Mind
3. FastML
4. 等等等等就不列了


有很多很好的機器學習paper,還會有kddcup獲獎的paper合集:

http://www.jmlr.org

數盟,大雜燴,看看工業應用的結果:

數盟(數據科學家聯盟)


這幾年,機器學習絕對是計算機領域最熱門的話題和方向。筆者不屬於專門研究機器學習,但是平時的工作會經常用到一些相關的演算法。因此,對於機器學習也僅僅是入門的水平。但是我想也正是因為我只是一個入門漢,所以能夠從我們入門者的角度來總結如何入門,希望對還在門外的同學有一些幫助。

數 學

很多人翻看任何一本機器學習的書,看到一推的數學公式就開始打退堂鼓了。開始搜索,提問「機器學習需要哪些數據知識?」然後得到的結果可能會是「矩陣分析,概率論,優化設計……」而且還會有大量的人推薦一些例如「All of Statistics」,「Convex Optimation」等等外文教材。至少我當時面對的情況就是這樣的。這種情況很可能後面會朝以下畫風發展。

看到上述推薦的那些經典教材,你像看待聖經一樣看待他們。抱著一種學會了那些課,我再看機器學習的書簡直就會是探囊取物的想法,你下載了巨多相關材料。但是,慢慢你會發現,除了把他們下載了下來,你並沒有任何的進步。你並沒有完完整整的看完一本,你並沒有在機器學習方面卓越超群。

入門階段真的需要這麼多的數學儲備嗎?未必。

入門階段我感覺你只要有普通工科專業大一大二那幾門基礎數學課「線性代數」,「高數」,「概率論與數理統計」就可以讓你入門了。

所以,千萬別被機器學習中的數學所嚇倒而不知道該如何下手。

只要有上述的幾門課的基礎,你完全可以看懂很大一部分機器學習演算法。

程序語言

機器學習入門最佳的方法其實就是理論和代碼一起學習。一邊看相應的理論推導,一邊看並且實踐經典代碼。所以,為了更快入門,我推薦你最好能夠懂點MATLAB或者是Python語言。

Matlab和Python說實話做高端的機器學習肯定是不推薦的,但是如果你想的是機器學習快速入門,那這兩門語言絕對是絕佳選擇。


第一步

有了上述基礎後,你可以開始看點機器學習的相關內容了。我看很多人推薦elements of machine learning。我想說,你想讓一個基礎為零的人去看這本書,真的合適嗎???

所以,我推薦的是Machine Learning in action,(這裡面的完成語言為Python)這是英文版本的。當然如果你覺得英文對你是一個完全過不去的坎,(雖然我建議做技術的人都必須至少要看得懂英文)現在有中文版本,叫「機器學習實踐」。

這本書用盡量少的公式把機器學習的基本演算法都過了一遍,而且還講得很清楚,更為重要的是他將公式和代碼結合了起來。因此,你的機器學習並沒有那麼的抽象了,你知道演算法里的公式如何的轉化為代碼。

所以,第一步,你可以耐著性子將這本書看完。反正我當時,把書中的代碼自己敲了一次,雖然代碼有的下載,你也可以選擇只是把代碼看懂完事。但我還是建議,自己敲一次,運行運行,這樣你會得到不一樣的體會。


第二步

學習Coursera上面Andrew Ng老師的machine learning的課程。這門課造福了眾多機器學習的入門者,不僅僅是因為課程全面,內容由淺入深。更加重要的是這門課程每次課都有課堂作業,作業不需要你寫出來所有的代碼,但是關鍵代碼要你寫出來,而且還會教你如何調試代碼。

初學者學這門課的時候很可能會買有耐心,又是英文的,又有進度要求,又有作業。沒關係,你可以把視頻下載下來(很多網盤裡都有下載好的視頻),然後慢慢的去啃。作業也是,可能你自己不能一口氣寫出來,沒關係,在自己做了大量嘗試後,去Github上面下載一些別人寫好的代碼看一看,找找自己的問題到底出在了哪裡。

總之,一定要耐著性子過一遍甚至是幾面這個課程。


第三步

這時候你已經對機器學習很多簡單的演算法比較清楚了,但是可能還沒有一種大的全局觀。所以,我建議大家可以看看這兩本中文教材。周志華老師的西瓜書《機器學習》和李航老師的《統計學習方法》,這兩本書都是作者花了大量心思編寫的,也是在中國眾多科技書籍中難得的兩本佳作。

英文書籍,可以推薦《Patten Recognition and Machine Learning》,《Elements
of Statistical Learning》
(但是這本書難度比較大,如果你有足夠的耐心,可以慢慢啃,多次的啃。相信每次都會有不同的收穫。我自己已經看了好幾次,但是確實每次都沒有完全看完,但是目前我遇到很多問題,我去翻這本書,還是能找到很多答案,尤其是我做稀疏相關的工作,裡面的相關內容講解非常清楚。)


第四步

這時候,機器學習你已經可以說大概入門了。後面的事情,就得根據你的需求來制定相關的學習路線。

比如,做大數據分析的,得去學學spark,Hadoop等計算框架;

另外,圖模型,深度學習……等等內容,都是一些方向。

自然語言處理、圖像識別、語音識別等等也是一些應用方向,更有大量的領域知識需要結合。

在前沿部分和第一到第三步的內容,如果你能按照這幾步走下來,入門是肯定可以的。至於後面的機器學習精通部分,我也只能說:Good Luck and Have Fun

廣告時間:機器學習、未來智能、機器人相關話題,可關注公眾號:

AITMR: Artificial Intelligent Tomorrow

http://weixin.qq.com/r/A0wDG77E9uOJrfp49xkR (二維碼自動識別)


推薦閱讀:

機器學習(machine learning)在經濟學領域是否有應用前景?
從事經濟、金融工作的人都是通過什麼渠道獲得數據資源,運用什麼軟體來分析行業狀態和經濟走勢的?
調參這事兒,為什麼越干越覺得像老中醫看病?
有什麼好的模型可以做高精度的時間序列預測呢?
機器學習中的Bias(偏差),Error(誤差),和Variance(方差)有什麼區別和聯繫?

TAG:數據挖掘 | 機器學習 | 計算機視覺 |