我怎樣成為數據科學家?|哥大學子在美求職路

點撥諮詢師:Evelyn Fu

本科:清華大學 工業工程系

碩士:哥倫比亞大學

Management Science and Engineering

目前在紐約一家創業公司做Data Scientist

被Machine Learning的課程虐得體無完膚,但義無反顧地愛上了

我曾經在清華念書的時候選修過數據挖掘的公選類課程,當時多少也是帶著好玩兒的心態,並不認真,也就馬馬虎虎地水過去了。

我本來以為自己會喜歡諮詢類工作,到了美國後,卻意識到自己比起做PPT寫報告和空中飛人的生活,更加喜歡看paper,寫代碼,鑽研各種技術問題。在哥大,因為實在對於所有偏商類的課程提不起來興趣,於是就自己製造困難選修了有一定挑戰性的數據挖掘類課程。至今記得最難的一門課Machine Learning,幾乎每個禮拜都要花兩三天的時間完成編程題和數學證明題,學得雲里霧裡,期末考試考完覺得自己人生都灰暗了。期中考試整整複習了兩周,拿到卷子還是覺得自己什麼都不會。雖然那門課把我折磨得體無完膚,但還是義無返顧地喜歡上了這一行。

在這類數據科學相關的課程上,我才忽然間意識到,在全世界範圍內火熱起來的所謂Machine Learning,其實就是需要一定的數學基礎加上較快上手的代碼能力。 這兩樣東西,我絕不能說是有天賦的,但至少都是我熱愛的,且從本科開始就一直有接觸的。

在哥大期間,曾經系裡面發郵件問大家誰有興趣給一家叫做Wiser新聞收集推送公司做數據挖掘方面的實習。我當時抱著試試看的心態投了簡歷,沒想到面試也通過了。到了公司的第一個學期,我是兼職做免費的實習。當時我還完全不懂Python,只會寫C和C++,SQL也是多年不曾應用,幾乎要還給資料庫課的老師了。當時要處理的數據都是新聞文稿,就涉及到如何把文字轉化為數據這個問題。從完全不懂什麼是TF-IDF,到寫出來一個基於客戶閱讀習慣的新聞推薦系統,我花了大量的時間學習Python,學習數據處理方面的知識。雖然我做了一年的實習,那一家只有十個人的創業公司只給了我兩千多刀,用來報銷我交給哥大修CPT實習課程的錢。但我自己知道這一份經歷幾乎填補了我建立上數據類工作的空缺,對我後來申請Data Scientist的工作起了巨大的幫助。

求職維艱:干一年實習只拿了2000多刀

求職途中最艱苦的可能還是找實習的過程。我在到了美國後的第二個學期,也就是春季學期,已經開始在給Wiser做兼職實習。我的第一個學期基本是在糾結和迷茫當中度過的,完全沒有給自己定好位,因為原來心心念念的諮詢之路,是明擺著自己不喜歡也不想走了。看著小夥伴們風風火火地做起Case Study,在第一個學期已經開始各種名企面試,我卻不知道自己出路是什麼。當時覺得自己剛開始做Data Science相關的工作,並不確定是不是真的喜歡。而自己在本科期間所做過的實習,多少跟生產管理和物流搭邊,於是就想同時投數據科學類和生產管理及物流類的實習。

現在回想,當時確實有點兒貪多嚼不爛的意思。我做了兩手準備,於是兩邊都沒有想清楚自己的優勢是什麼。再加上多少在投實習的時候還是沖著自己聽說過的大企業去了,有些好高騖遠。於是在投了40多個簡歷之後,只拿到一個電話面試,還因為如果轉正則需要H1B簽證這種多少帶有歧視的理由,而被對方拒絕了。

在我最難過的時候,男朋友給我的安慰是: 「你才只投了40多個簡歷而已。我認識的認真找實習的童鞋,至少都投了三位數……」。

聽到這種安慰的話,我當然是萬念俱灰,一點兒精神都打不起來了。多次跟院系負責就業指導的老師聊天,她推薦我乾脆跟Wiser談談要不要把春季實習延伸到夏季繼續做。後來果然一帆風順,在Wiser繼續做了夏季實習和秋季學期兼職實習。

我老是跟別人說,我最慘的還是幹了一年實習,只拿了兩千五百多塊錢這件事兒……拿F1的簽證,要求在到美國後的前兩個學期,不可以在學校以外做任何有償的工作。因此,那一個學期的實習,自然是義務勞動。夏季實習,跟老闆哭窮說我明明做實習賺點兒辛苦錢、還要給學校交學費(聽說過CPT的都懂得)。於是,CTO開眼說那我們把你交的學費報銷了吧。這大概是兩千五百多刀,在我快要結束實習的時候發給了我一張支票,當時感動得不行。但從來不敢跟去了大公司實習,三個月拿一兩萬刀的同學多聊。

之後的秋季繼續在Wiser兼職實習,每周有兩天半到公司上班。本來Wiser這邊也說好了要報銷我的CPT學費,但到了我12月結束實習,仍然沒有任何要發工資的意思。因為這家公司真的只有十個人,我可以理解他們運作的經費很可能會在年底吃緊,我也並不想在年底個中節日的歡樂氣氛中跟他們提工資的事兒。再加上我和同事們關係很好,我好像總覺得就不該催發工資。於是越拖越久,我就越來越沒有勇氣把這件事情說出口。

直到今年九月份,Wiser的CTO也就是我原來的上司跟我聯繫,說想一起出來吃飯聊聊天。於是在一起吃午飯的時候,他跟我聊起來公司如何運轉不好,又被別的公司收購了技術,他和另外幾位工程師如何離開公司,到這家收購他們的公司工作。感覺不到一年的時間,好像他經歷了好多生活工作上巨大的變化。到最後,我也沒捨得提有關於最後一個學期兩千多塊錢的工資的事情。

總之,我就這樣,實習一年,只拿了兩千多刀工資。

不過真心說來,我其實還是很感謝那一年的工作,讓我徹底下決心走數據科學的技術路線,也徹底喜歡上了創業公司活躍的氛圍。

走過糾結和迷惘,終於成為數據科學家

後來,我有幸被目前的公司選中,繼續做Data Science相關的工作。這是一家電視廣告媒體創業公司,我的工作具體來講比較偏技術,大量時間用來寫代碼,跑模擬,讀paper,和客戶及同事討論數據處理及數學模型。

這份工作比我想像得還好。我所在的公司,連續三四年獲得Best Places to Work in NYC獎項,上司、同事、公司氣氛環境、公司福利待遇,都超出我的預期。目前為止所做的工作和我之前研究的整數規劃比較相關,尤其研究課題有相對前沿又棘手的凸整數規劃問題。當然,也有一些類似電視收看習慣的預測等典型的數據科學類問題。

我很幸運我所在的公司是管理結構非常扁平化的創業公司。一百多人的企業,我往上數兩級就已經是CEO了。雖然公司在經歷成長的變化(一年新招30%以上的員工),但是整個公司的氛圍仍舊是輕鬆愉快,帶著創業公司的年輕氣息的。CEO也是動不動拉著大家開一瓶他收藏的龍舌蘭酒,或者到了五點就鼓勵大家去冰箱拿瓶啤酒,放鬆一下。

我和三五個同事成為了周末也會時常出來hang out的好友。我組織過餃子趴,火鍋趴,還給大家介紹各種美食和中國文化,同事也都很喜歡拉著我去感受他們的文化。總之,我並沒有遇到傳說中的辦公室政治。

美國數據分析類工作情況

總體來講,數據類相關的工作可以分為兩類,一類是數據科學家Data Scientist,一類是數據分析師Data Analyst。第一類工作比較講究實用現代的數據科學手段,結合計算機技術,對上一定規模的數據進行分析、預測、優化以及可視化的工作。第二類工作相對來講使用的數據量較小,需要的技術知識大多為傳統的概率與統計學。有時候大家互相開玩笑會說,每天開電腦,先開Terminal的多半是數據科學家,先開Excel的多半是數據分析師。具體來說,還是要看各個公司招聘職位時具體列出來的職位描述(Job Description),會對職位所需要的技能有具體要求,大致就可以判斷到底是Data Scientist還是Data Analyst類的工作。

具體來講,有一定傳統概率與統計基礎,有一定的數據可視化技巧,能夠通過數字講出道理分析原因,都可以去嘗試去申請Data Analyst類的工作。這類工作在Glassdoor上統計,紐約地區的平均年薪是$62,228。

而對於Data Scientist類型的工作,會要求有一定的編程能力,懂得Machine Learning, Data Mining等一些數據科學的具體數學基礎,能夠有操作大量數據的能力(SQL,甚至Hadoop)。目前我身邊從事這類工作的人背景其實很多樣,我同事裡面有幾位有學經濟的,學物理的,也有學化學的,但大家多少都有多年編程經歷。當然啦,計算機系的同學也有大量轉向Data Science方向的。同樣引用Glassdoor上統計,紐約地區Data Scientist的平均年薪是$106,575。

紐約VS北京

我在哥大讀書期間,非常討厭紐約,多少跟租到了又貴又鬧心的房子有很大關係。後來,逐漸使用正確的方式打開這座城市,住到了相對偏遠,但安全又交通方便又便宜的大房子,每天可以看河景,有貼心的室友,讓我的生活質量上升了N個檔次。

工作以後,周中基本不需要加班,周末也完全屬於自己,於是一下子就開始了瘋狂的看演出計劃。一個禮拜看三五場音樂劇歌劇交響樂室內樂這種瘋狂的事情,基本每個季度都可能發生。

我出生在北京長在北京,過分點兒講,北京永遠是心裡那個第一名。雖然我也知道霧霾,我也知道高水平的演出又少又貴,但是家裡人和內心深處那個家還是在北京,金窩銀窩也比不了。

想跟數據科學家一對一諮詢學業和職場問題?

下載一起點撥APP,搜索ID:Evelyn Fu


推薦閱讀:

我收到一個叫卡塞爾的美國大學的錄取通知書 我該去嗎?這學校好么?
哈佛大學和耶魯大學有哪些陰暗的地方?
喬治亞理工學院為何名氣相對較低?
美國哪個大學的建築設計專業比較好?
美國選校地圖 | 女神校集中地——麻省地區名校錄取情況解析及優勢專業對比

TAG:留学 | 哥伦比亚大学ColumbiaUniversity | 美国大学 |