大學經濟學專業,5年知名互聯網公司數據分析經驗,想做數據挖掘和機器學習,是否要去讀個相關學位? ?

大學學經濟時有高數、線代、概率、統計和計量的基礎。在互聯網公司做數據分析工作5年,日常的業務分析、報表建設、專題分析都有一定經驗。

對統計分析、數據挖掘和機器學習感興趣,經常自己看書學習,SAS、SPSS比較熟悉,Hive和Shell工作中經常使用,Python正在學習。也正好有機會在做挖掘的項目,但是經常感到在挖掘理論基礎、代碼coding方面比較吃力。

所以向大家求教,是否需要去讀個相關的學位,如果需要,讀什麼學位比較適合(考慮到原來的學科背景),有必要去國外讀嗎?


數據挖掘有兩大類方向,一個是利用現成的演算法工具去解決業務問題,另一個是開發新的演算法工具,各有側重。但不論你是向業務方向發展,還是向演算法方向發展。合理的自學帶來的提升效果,好於一般的學校帶來的提升。畢竟在工作中自學有一種推力,不容易懈怠。

自學可以分為四個途徑。

1、通過閱讀來學習。包括了閱讀經典的理論教材、代碼教材、論文、公開課。

2、通過牛人來學習。包括同行的聚會、討論、大牛的github、微博、twitter、RSS。

3、通過練習來學習。包括代碼練習題、參加kaggle比賽、解決實際工作中的難題。

4、通過分享來學習。包括自己寫筆記、寫博客、和同事分享交流、培訓新人。


個人覺得很沒有必要,而且鑒於你都有工作經驗了,比較適合的是用到什麼就學什麼,反正現在相關資料多如牛毛。解決問題才是關鍵,去念個學位的話,只會浪費你接觸實際項目的時間,而且也不見得能學到什麼東西。

念研究生只是保證了你有充足的時間可以自學而已,而時間這個東西就看你自己怎麼安排了。

經驗薄弱都是需要用時間來補足的,念學位的時候應該不會增長你的實際操作經驗,多的可能就是最後那張紙和一些你實際用不上的理論。


也不用呀。可以試試走業務性的路線,更偏向依附你現在已有的經驗。也不一定要一下子就去高上大技術coding嘛。


你所謂的目前的分析只是統計,歸類,清洗,排序等,而估計你目前遇到了工作的瓶頸,發現單純的數據分析已經不能滿足工作的需要,急需要對該方面進行提升,甚至你們公司目前招的數據挖掘的人工作沒你豐富,但是工資比你高,心裡些許不平衡,總之要研究數據挖掘。

那麼,既然會spss和sas,各種模型也是會的了,起碼會用,會調參數吧。

現在學python的scikit-learn,也是想從演算法和細節下功夫吧。

建議你從業務出發,運用演算法。

能夠切實解決業務問題的演算法才是好演算法。

像互聯網公司,能用的幾種演算法就沒多少,邏輯回歸,聚類,svm,等就很夠用了。

如果還用到了個性化推薦,則學習下推薦演算法,pca等降維演算法。

弄一個學位,時間耗不起,你畢業了,職位說不定就沒了,除非是在職。我比較贊成或者在線學習也可以。


挖掘理論差一些不會妨礙你找一份數據挖掘的工作,你不是做演算法的,你只需要對應用場景熟悉,可能你對這個也不熟悉,不過通過學位來學算是走了遠路

coding方面,你應該還處於初學,而且本身你的要求也不需要很高,你只要掌握基於python的離線數據挖掘,並且學習基本的數據結構知識,就算是入門了。其他高大上的東西以後再說

完成你現在的挖掘項目,再把python練熟一些,你就可以嘗試找這方面的工作了。突出你在業務理解方面的能力,對Hadoop和python現有的熟悉程度,並且表達你對數據挖掘技術的熱愛

在進入數據挖掘團隊之後,如果想要更接近技術本質,再繼續提高模型、coding和架構方面的知識


看我簽名大概你就知道咱們背景差不多。現在主要在做數據開發,但也做一些挖掘和分析,之前純做分析,基本上就是excel+spss等統計軟體,現在會用到一些簡單的演算法,比如k鄰近,布隆過濾等。按照如今形式來看,單純掌握挖掘理論及其實現方式,並不夠,還需要對數據平台等知識有一定了解,比如hadoop及其生態系統內的組件,比如spark,storm等。你所提到的挖掘區別於分析,首先應該是數據量級上的差別,沒有一些平台知識,很難在實踐中進行數據挖掘的工作。我編碼技術基本上全部在平台開發中學就的,所以你說的編碼,不是什麼問題,沒必要去回爐再造,干中學嘛。

我本科是數學+計算機,研究生經濟學,所以可能數學比你接觸的多點,僅供參考。


個人覺得短期內倒沒有這個必要呢,所謂了解的越多,你知道的就越少(那個時候可以考慮繼續深造)。

正如肖凱達人所說,只要你有比較強的自學能力,通過讀、寫、問、答等方式一定可以達到你所預期的效果。


有句話超好,「干中學,比趕超」。


大學也是學經濟的,目前也正好剛在互聯網公司做數據分析崗。感覺自己的職業方向和題主完全一樣啊!(求回復,求指導)


看到你發的帖子,第一反應是我什時候可以做到你這樣,目前工作一年也在找互聯網公司的數據分析工作,很多都不是很清楚具體是做什麼的,也怕沒找好,看到能給我回復,謝謝


DM和ML你想學明白的話不勤編程實現的話是絕對不可能的,我還從來沒聽說誰不編程能理解演算法的,要搞演算法研究就更不用說了...沒有紮實的理論基礎和實現經驗你在工程師文化強的團隊中不可能具有強有力的話語權

所以就看你自己的定位了,如果只是想找個工作那沒必要讀了,要想成為團隊核心的話必然要既有理論基礎又有與產業結合的能力,後者你已經有了,對於前者我覺得最省事的方式就是修學位


推薦閱讀:

如何找到自己的第一個數據分析項目(表哥篇)
面試坑殺新人指南,第二篇:數據哪來
如何成為數據分析師
【原創】《如何系統性的搭建自己的知識體系》——個體加速成長的秘密
面試坑殺新人指南,第三篇:分析個啥

TAG:數據挖掘 | 數據分析 | 機器學習 | 數據分析師 | 大數據 |