學長學姐說系列——透過CMU MCDS項目看Data Science
來自專欄 非高大上的留學專欄
近幾年有機會接觸到很多公司以往送出去的學生,大多數都已經在學術或者職業發展上取得了一定的成績。因此,他們對學校和專業的看法、對一些問題的認識對於後來者是十分重要的經驗。因此試著整理一個學長學姐說系列,陸續發幾篇文章。當然,有些信息是不能公開的,我會挑選可以放出來的信息,做一些總結和整理,部分地方添加了自己的理解,如有紕漏請指正。第一期從目前大火的數據科學專業講起,截取了一部分聊天內容放在這裡。
————————————————————————————————————————
分享人背景:CMU MCDS項目學長,本科畢業於國內頂尖985院校
模塊一:關於CMU MCDS項目
MCDS (Master of Computational Data Science)設置在CMU School of Computer Science下的Language Technologies Institute下面,是在眾多DS項目中更偏CS的項目,分為3個 track:
——System Track
——Analytics Track
——Human-Centered Data Science Track (HCDS, 和HCI有關聯)
每個track的core courses, elective courses, capstone project有明顯區別。此外,該項目有兩種修讀方式:
- Standard Timing — a 16-month degree consisting of study for fall and spring semesters, a summer internship, and fall semester of study. Each semester comprises a
minimum of 48 units. This timing is typical for most students. Students
graduate in December. - Extended Timing — a 20-month degree consisting of study for fall and spring semesters, a summer internship, and a second year of fall and spring study. Each semester comprises a minimum of 36 units. Students graduate in May.
具體關於該項目的介紹可以看官網鏈接:
https://www.lti.cs.cmu.edu/learn#quicktabs-master_of_science_in_computation=0
我們這屆大概900-1000人申請,發了110左右的offer, 最終入學的大概60-70人,這也是該項目每一屆錄取的平均人數。其中Systems有20人左右, Analytics有30人左右,HCDS比較新,16年開始招生的,有10多個學生。這個項目最多的是中國人,佔了大約一半,大多來自清華、北大、上交、浙大,其他的還有來自中科大、復旦、北郵、北航。其次是印度人。
這個項目選課自由度比較高,我就讀於Systems Track, 這個方向大多數學生都是本科CS出身,過來後大多選擇做infrastructure,畢業後去向主流是Software Engineer. Analytics和HCDS的學生背景相對更多樣化,比如Analytics學生本科有CS, 統計,數學的,也有少量學生是文商科的,比如我有朋友是本科讀經濟學的,研究生階段實習去了Blackstone,畢業後他還是做了software engineer. Analytics Track有超過一半的學生同他一樣,選擇了software engineer. 有一些去做更偏DS的Machine Learning Engineer, 還有一些做Data Analyst, 另外還有一些做FinTech的,比如上一屆有人去Two Sigma. HCDS的話我知道有學生是設計出身的。也有個別學生繼續讀PhD的,我們這屆有4個,上一屆有學生直接申到了CMU的Machine Learning PhD.
經常有人問MCDS這3個不同的track錄取難度有什麼區別。從錄取背景上看,Systems會很看重CS的基本功,所以傾向於CS本科學生。Analytics很看重數理統計經驗和專業知識。HCDS的話希望學生有information system, design方面的課程。但我不認為這個項目本身的bar有高低之分,各個方向的bar是差不多的,而且各個track之間轉的自由度比較大,我們這一屆就有好幾個學生是入學後換的track. 而且從就業上看,各個track也並沒有什麼嚴格區分,看你個人興趣。因為MCDS項目選課很自由,除了必修之外,選修課很自由,所以你完全可以根據自己意向去學習。
模塊二:關於Data Science
DS的就業前景非常好,就業範圍很廣,就業方向包括了上面提到了Software Engineer, Machine Learning Engineer, Business Analyst, Data Analyst, Data Scientist等等。此外,DS還可以去做Biomedical Science/Public Health/Medicine等領域工作。但目前形式看,最主流的還是去soft engineering領域。因此最熱的區域還是加州,如果想做FinTech, 那當然紐約也是很好的選擇。
關於DS學習常用語言的話,如果你想去做Machine Learning Engineering, 那對Python和JAVA的要求比較高;如果你想去做Data Analyst的話,那經常會用到SQL. 還有一個職位方向是Data Engineering, 主要是做data processing和小規模的analytics工作,涉及到的也是SQL和Hive等偏資料庫的語言;如果做金融方向的話,會涉及到R, MATLAB和SAS.
模塊三:關於Data Science申請
對於DS申請,前面聊的已經基本涵蓋了。首先,有些先修課程是能有一定要有的:
(1)數學方面:數理統計、線性代數,這兩門非常重要。
(2)CS: 數據結構、操作系統、計算機組成原理、高級語言程序設計
總的來說,對於CS專業本科生,根據你申請的細分方向去補充相關的實習和科研經歷即可。對於統計/數學類專業的本科生,那盡量去補充CS方面的知識和項目經歷。如果你兩類專業都不是,那從上面兩個方面入手輔修相關課程、做project. 我認識一些商科背景的學生,在自己本校沒有機會,甚至會跑到隔壁學校去聽課程做project, 這樣能很好地體現motivation, 也錄了MCDS項目。
除此之外,實習對於DS申請非常重要。因為DS本身就是一門特別偏應用的學科,本科階段實習不僅對master申請有幫助,對於之後找工作也很有幫助。我有很多同學之前在微軟亞洲研究院實習,他們在來MCDS項目之前就都認識了。而實習的質量主要取決於你的工作內容,如果只是用excel做基礎的數據整理和分析,那肯定趕不上你用SQL去抓公司資料庫中的數據做分析。
推薦閱讀:
※韓國留學性價比最高大學TOP5
※全球留學生都到哪些國家?中國留學生最愛去哪個?
※何為博雅教育?
※哪些因素決定你的名校錄取?
※普林學霸帶你了解金融工程