我數學不好、不會編程,能成為數據科學家嗎?

想成為數據科學家或工程師,正在學習的技能在現實中該如何應用?作為互聯網產品或運營,如何用數據輔助決策?作為傳統行業從業者,大數據會改變你所在的行業嗎?無論是正在學習相關知識的學生還是有自我提升需求的職場人,這個「通識」系列適合你。

大數據科學家 @北冥乘海生 是數據變現領域首部專著《計算廣告》的作者之一,在 Yahoo! Labs、MediaV、奇虎 360 等公司從事互聯網大數據與商業變現的工作,用數據驅動公司收入增長,數以十億計。

在系列 Live —— 通往數據達人之路 開始前,我們提前請教了他幾個問題,希望能幫到你~

進入大數據行業需要具備哪些知識或者技能?能否推薦一些可供自學的書籍、公開課?

進入大數據行業肯定需要某一方面的具體技能,Hadoop、Spark等工具,機器學習、數據挖掘之類。有關這方面的公開課很容易在各大在線教育網站和培訓課程中找到相關的系統課程,我也就不做太多廣告了。關於這些技能必讀的經典著作,也會在 Live 中作進一步介紹。

如果關注大數據的背景與未來的,可以看看維克托.邁爾.舍恩伯格的名作《大數據時代》,當然更多的濃湯寶味道的大數據書籍,我認為多說無益。

但是我同時想指出一個誤區,很多人通過各種渠道來問我,學了很多技能但是不了解怎麼用,該怎麼辦?我想說,這個需要去了解業界實際情況和需求,只是去學習技術,是非常容易迷惑的。這個可以看看,我們去年整理出版的針對數據變現問題的專著《計算廣告》,另外還有介紹推薦系統問題的《推薦系統實踐》等,都是這方面的嘗試。本次系列live的出發點,也是希望幫助希望進入大數據行業的朋友們快速了解具體的市場與產品,找到努力方向。

何種專業背景適合進入「大數據」行業?我數學不好、不會編程,有可能成為數據工程師嗎?

如果你所學的行業使你掌握了一些編程、統計學相關知識,肯定進入大數據行業相對來說會更加直接,也更容易找到切入點。如果你現在還不會編程、對統計學知識也沒有了解,倒也不用著急,不妨聽聽我們的系列 Live,在對全行業有了全面的認識以後,再來思考什麼樣的職業發展道路適合自己,進行進一步學習。

有一個需要澄清的概念是,大數據行業並不是只有數據工程師或者數據科學家這一個發展方向。這個行業需要大量有市場和商業感覺的產品經理、掌握數據精髓的運營經理。並不是每人都需要寫代碼,但這些都是大數據行業的成員。

另外,在如今這個智能時代、數據時代,互聯網相關的所有崗位,都越來越多地需要數據的正確理念和基本素養。你可以不知道怎麼做,但是你需要知道你可能用數據做到什麼,然後讓知道怎麼做的人協助你去做。沒有數據思維,在未來可以說寸步難行。

為什麼現在「大數據」相關人才如此炙手可熱?這和大數據行業的行業價值匹配嗎?有泡沫嗎?

「數據」行業本身當然不存在泡沫,因為這一行業的真實潛力或者說「錢景」是遠遠還沒有被挖掘出來的,甚至說還沒有被認識到。說個小例子,我經常還會聽到國內大數據行業的一些從業者討論「數據能不能掙錢」這樣可笑的問題,希望聽完我的live的朋友不會再有這樣的疑問。這一行業的人才炙手可熱,本身也說明這個行業前景廣闊。如果一定說有泡沫,那麼是這一行業缺乏足夠多合格的從業者,很多根本不是大數據、人工智慧的事被「包裝成」大數據,而真正有專業素養和系統技能的人遠遠滿足不了工業界的要求。

真正合格的數據相關工作者,絕不是看兩篇雞湯文章就行,甚至不是學寫代碼那麼簡單,更需要清晰地了解數據加工、使用、變現、交易的基本原理和關鍵產品,只有這樣才能清醒地使用數據,而不是被別人給出的數據所利用。

您是如何進入大數據行業的?

我最早在 MSRA 從事人工智慧研究,當時做語音識別有個很深的印象:你的演算法再精妙,用兩百小時的訓練數據也趕不上別人五千小時訓練數據得到的效果。這樣的經歷讓我深信,數據是決定行的資源,就看誰能用好它。於是後來有機會進入 Yahoo Labs,師從業界一些著名的科學家,研究互聯網領域大規模的數據問題,我就決定進入了這個行業。在若干互聯網公司從事變現的工作就更令人興奮,你可以非常切實地感受到,數據和智能技術的結合,能夠帶來數以十億計的收入提升,這讓我深深感受到數據的魅力。

聖人說過:學而不思則罔,思而不學則怠。這也同樣適用於數據領域的學習:整天思考數據行業的美好未來是無意的,但是深陷於各種技術的細節卻不了解市場問題,也是不行的。正確的方法,我覺得還是要從產品入手,先了解「做什麼」,才能更好地了解「怎麼做」和做好了「會怎樣」。

非數據相關崗位,需要學習數據相關知識嗎?為什麼?需要學到何種程度?該怎麼學?

大數據的熱潮讓我們相信數據比經驗更可靠,人工智慧的熱潮又讓我們相信機器計算比人的決策更可靠。在這樣的時代里,如果你還認為你的崗位與數據無關,那恐怕遲早要被淘汰了。當然,對於大多數人來說,學習數據行業不意味著要學寫代碼,但也決不是看兩篇雞湯文章了事,清洗地了解數據加工、使用、變現、交易的基本原理和關鍵產品,是每個人都應該做的功課,也是我們準備內容的出發點。

Tips :

  1. 在「通往數據達人之路」系列 Live 第一場開始前,購買全部 6 場 Live 可享受 優惠價格,我們將直接把差額退回你的付款帳戶。

  2. 你可以在參與後及時進入 Live 提問或者為你同感疑惑的問題點「喜歡」,我們將在 Live 開始前 48 小時 ,將最受歡迎的問題提供給主講人,他們將把這些問題融入到分享之中。

希望在系列 Live 中,你能有更多、更系統地收穫。也希望從中掌握的學習方法,能讓你成為高效學習者。
推薦閱讀:

人不如新?Uber空窗期終結,黑馬掌門人Expedia CEO被選中
中國民生銀行大數據團隊的Flume實踐
1-遊走HBase的Block Cache
科技與商業管理策略的結合:約翰霍普金斯大學MSIS項目
微軟、IBM、英特爾、三星、紅帽歡迎谷歌入群,怎麼來了一條狗?

TAG:知乎Live | 大数据 |