想學BA的你需要這一份數據科學家報告
自從考拉開設專欄以來,有很多童鞋來問我關於BA的問題,今天來給大家做一次梳理。這個專業將來的就業方向其中一個就是數據科學家。接下來我們從數據科學家這個職位的角度分析。以下內容部分來源論壇
根據Glassdoor的報告,數據科學家的平均薪水高達118709美元,與之相對應的是,程序猿的平均薪水只有64537美元。麥肯錫的研究預測,截止2018年,美國將面臨14萬到19萬擁有深度分析技能的人才缺口,同時懂得運用大數據作出有效決策的分析師和經理也將會有150萬人次的短缺。
數據科學家的定義
數據科學(Data Science)是從數據中提取知識的研究。數據科學集成了多種領域的不同元素,包括信號處理,數學,概率模型技術和理論,機器學習,計算機編程,統計學,數據工程,模式識別和學習,可視化,不確定性建模,數據倉庫,以及從數據中析取規律和產品的高性能計算。數據科學並不局限於大數據,但是數據量的擴大誠然使得數據科學的地位越發重要。
營銷人最為關注的數據驅動營銷(Data Driven Marketing)就是數據科學在營銷領域的運用。
一家公司要打廣告,有多個選擇:搜索引擎、各種風格迥異的social media、傳統媒體,到底應該把錢投入到那裡會帶來最大的回報?
至於伴隨著你的網頁點擊,amazon調整產品顯示的順序,推薦你最感興趣的產品,或者你修改LinkedIn Profile里的skills & projects,這家公司自動給你推薦匹配的工作、從你的connections里查找可能幫忙的人,這些聰明、精準又實時的決策背後,都是data science。
數據科學家,顧名思義就是數據科學的從業者。這個頭銜首次出現於2008年,由D.J. Patil和Jeff Hammerbacher所提出,他們後來分別成為了LinkedIn和Facebook的數據和分析團隊的負責人。目前已經有數千位數據科學家供職於創業公司和成熟的大型企業。數據科學家在行業中的忽然走俏,反映了這樣一個現狀,企業需要處理的信息正以從未遇見過的規模和渠道湧現。
曾經投資過Facebook,LinkedIn的格雷洛克風險投資公司把數據科學家描述成「能夠管理和洞察數據的人」。在IBM的網站上,數據科學家的角色被形容成「一半分析師,一半藝術家」。他們代表了商業或數據分析這個角色的一個進化。
數據科學家需要的工作內容
數據科學家能夠駕馭多種職責的工作。《數據之美 Beautiful Data》的作者Jeff Hammerbacher在書中提到:
「對於 Facebook 的數據科學家,我們發現傳統的頭銜如商業分析師、統計學家、工程師和研究科學家都不能確切地定義我們團隊的角色。該角色的工作是變化多樣的:
在任意給定的一天,團隊的一個成員可以用 Python 實現一個多階段的處理管道流、設計假設檢驗、用工具R在數據樣本上執行回歸測試、在 Hadoop 上為數據密集型產品或服務設計和實現演算法,或者把我們分析的結果以清晰簡潔的方式展示給企業的其他成員。為了掌握完成這多方面任務需要的技術,我們創造了數據科學家這個角色。」
遊戲公司Playstudios 的數據科學家Jon Greenberg說:「每天我都管理著一堆與業務相關的Dashboard——用以向公司彙報我們的用戶正在做什麼。」如今擔任經理的Jon比從前花在編程上的時間更少了。通常,他將數據從Hadoop中提取出來,然後用R來運行,最終以可視化的形式來呈現。
Jon熱愛的是這份工作本身。「想成為數據科學家,首先,你得有一個分析型的頭腦,你需要頭腦靈活、有好奇心、充滿創意,並且總能想到多種解決問題的方法。這份工作的缺點是清洗數據所花費的時間太長,這一部分並不那麼令人興奮。」
數據科學家的工作可能不像人們想像得那樣酷炫有趣。由於Data是一切分析的基礎,所有公司都會僱傭一些人集中做最基本的數據收集和整理,主要用SQL,可能寫一些簡單的程序、做一些粗淺的分析,但是整體上工作比較枯燥無聊,也可以說是「底層人群」;用Machine Learning或者統計建模的則屬於高級人群;同時,分析數據要用到各種軟體工具,可能需要高級的軟體系統來支持experiments,自然也就需要軟體工程師來支持。分析結果最終要用來幫助公司盈利,所以公司的管理層和直接帶來盈利的部門(sales、marketing、business development)也會參與,並作出最終的決策(decision making)。
數據科學家所需技能素養
「數據科學家應該是藝術和科學的結合體。科學的部分是顯而易見的:數學/統計、編程等等硬技能。藝術的部分也是同等重要——創造力、深層語境理解。兩部分組合在一起才能造就一個出色的問題解決者。」獨立數據科學家及諮詢顧問Anmol Rajpurohit如是說。他同時認為,對於數據科學家來說,懂得通用的編程技能比成為某一特定語言的編程大師更為重要,因為技術發展的速度令人驚奇,而且總有新的程序語言會冒出來代替舊語言。
數據科學家需要具備的能力,可以用Thomas H. Davenport(埃森哲戰略變革研究院主任) 和 D.J. Patil(美國科學促進會科學與技術政策研究員,為美國國防部服務)的話來總結:
數據科學家傾向於用探索數據的方式來看待周圍的世界。(好奇心)
把大量散亂的數據變成結構化的可供分析的數據,還要找出豐富的數據源,整合其他可能不完整的數據源,並清理成結果數據集。(問題分體整理能力)
新的競爭環境中,挑戰不斷地變化,新數據不斷地流入,數據科學家需要幫助決策者穿梭於各種分析,從臨時數據分析到持續的數據交互分析。(快速學習能力)
數據科學家會遇到技術瓶頸,但他們能夠找到新穎的解決方案。(問題轉化能力)
當他們有所發現,便交流他們的發現,建議新的業務方向。(業務精通)
他們很有創造力的展示視覺化的信息,也讓找到的模式清晰而有說服力。(表現溝通能力)
他們會把蘊含在數據中的規律建議給Boss,從而影響產品,流程和決策。(決策力)
谷歌、亞馬遜、Netflix和Uber這類數據驅動型科技公司都擁有數據科學小組。一些傳統公司例如GE,聯合利華也都在招聘這類人才。
具備綜合素質的跨界人才更加會被認可,BA無疑是對口數據科學家的一個專業,之前列過的學校開設列表在這裡:商業分析這個我並不想寫的專業是個什麼鬼。今天給大家看一個學校的學位以及就業情況。
BA開設學校就業(自行翻譯)
在這裡先只舉這一個學校的案例。
Our students come from the U.S., China, and India, as well as other countries. Students』 backgrounds range from business, to sciences, to engineering. Eight-six percent of our 2014-2015 graduates had jobs within three months of graduation, with an average salary of $71,500. Companies that have hired our graduates include: IBM, Research Now, Dentsu Aegis Network, Cisco Systems, The Comcast Corporation, Facts & Measures, Accenture, Dish Network, WalMart, QueBIT, LL Bean, and CDPHP.
這樣的專業自然少不了印度同胞。大家可以看到,就業數據還是可以的,86%的同學畢業之後找到了工作。
課程設置
個人認為課程設置還是很感人的,選修課裡面不乏一些有深度的課程,比如機器學習,數據挖掘,自然語言處理等,想從事互聯網科技行業的童鞋趕緊抱緊。
推薦閱讀:
※到 2020 年,中國電子競技行業市場規模將有多大?
※南加大商業分析專業知心學姐分享:如何申請、選課、找實習?
※SAS學習途徑與相關資源 – SAS商業分析
※如果,你也想讀數據分析......
※如何快速熟悉一個新領域