從事數據分析(數據挖掘)的工作已經一段時間的你(1年,2~3年,5年,8年),現在是一種怎樣的狀態?

如題,從事數據分析(數據挖掘、人工智慧、機器學習)之類的工作已經有一定年頭的你,你的升職之路是怎樣的坎坷?現在的工作狀態是怎樣的?正在學習著什麼新知識新技能?有什麼工作收穫?未來有怎樣的奮鬥目標?有什麼好建議要給新入行的年輕人?


[該回答的內容已經經過整理和增加內容,放在我的專欄《AI泡泡浴》裡面5年數據科學家熬成Senior,在想啥呢? - 知乎專欄]


從2012年博士畢業,入職亞馬遜,成為亞馬遜最年輕的機器學習研究員+數據科學家,到現在已經5年了,如果算上2010年在谷歌實習,現在也有7年了吧。眼睜睜看著數據科學家這個頭銜從炙手可熱的香餑餑淪陷成為了人盡可夫的行業,真是感慨萬千。

大多的東西已經總結準備寫在《實時機器學習實戰》這本書裡面了,預計2017年8月出版,就提出幾個大點說一下哈:

0 當年的戰友去哪兒了?

細細數來當年和我同時入職亞馬遜的數據科學家主要有三個出路:

1) 轉純程序員(50%左右):數據科學家的價值體現其實非常曲折,有些時候做的心累了,就直接轉純程序員了。中間牛逼無敵的大有人在,因為程序員的選擇面很寬,所以不乏薪資比我多兩三倍的牛人~

2)轉PM(40%左右):數據科學家免不了忽悠,忽悠多了失去了自己,有的就變成了會寫SQL的產品經理。

3)變成全棧數據科學家(10%左右):能在數據科學方面混到很多年的,大多都最後變成了全棧科學家,我現在就在這條路上走。全棧化的好處是前面可以通程序員、系統構架,後面可以通管理層,大侃價值觀,對全局把控強了之後,做的東西更容易落地。壞處頭髮白的特別多。

經驗:數據科學家這個職位可能就像是諮詢公司一樣,不是特別適合終身職業的。雖然早期入行可能非常風光,但是長期看來,價值的落地、測量比較困難,可能需要從長計議,找好下一步。

1 機器學習技術方面

模型是平的,很容易獲得。經驗是曲折的,必須耗費無數血汗去獲得。這點不管對於做研究還是做業務都是如此。模型方面,現在不外乎五大生態系統:

  1. Python + Scikit Learn,最適合生產環境和數據研究混用
  2. Spark + MLLib
  3. Java + Weka
  4. TensorFlow等深度學習生態
  5. 微軟等內部重造輪子生態

上面五種生態除了最後一個,其實都非常容易入門,有基本的數學、統計知識,看看github源代碼,鼓搗鼓搗基本上都是可以出東西的。但是具體參數怎麼調,這些都是費力不一定討好的地方,具體出多少成果,完全要看自己的具體領域和上下游情況。

另外,系統工具方面近幾年發展真是突飛猛進。現在入行的小朋友們福氣太好了,遙想我們剛剛開始工作的時候,做個數據透視表還要用R敲敲打打,現在直接上Elasticsearch + Logstash + Kibana (ELK) ,分分鐘幾下就出來的事情。Docker, Kubernetes都非常好用,連續部署的速度和門檻都比以前大大降低了。

經驗:Docker出現以後,如果一件課題的代碼超過了2000行,就說明你做錯了。

2 管理方面

很丟人的還沒爬到管理崗,大家可以盡情的鄙視我。從亞馬遜騙走了一個程序媛當老婆,中間談戀愛結婚生子,現在小孩總算上幼兒園了,希望這方面可以鍛煉一下。

經驗:要跟對好的、有上升機會的老闆/部門,跟著老闆走升的比較快。大數據看似是一個很火的領域,但是真的有上升機會的部門其實不多,例如做risk和預測的部門,往往一直都比較苦逼,只有在出問題的時候大家才會想到你。


入行8年左右,目前感觸比較深的,就是數據與業務的結合,目前在國內的各個公司里,還是一個處在一個非常非常年輕、非常非常初階的狀態

個人感覺主要有兩個阻礙


1、高級管理崗位和關鍵業務崗位的決策人,大部分都嚴重缺乏基本的數據知識

就我接觸過的,具備數據常識的高管非常少(其實我想說的是根本沒見過一個),缺乏數據知識並不是說他們不聰明,相反,他們的商業直覺異常敏銳,但這種敏銳並不是數據思維化的,他們的世界只有他們的世界的人才能互相溝通,數據人員基本上跟他們聊不到一起去。

你想證明某個新聞點擊率高是選題的優勢,還是位置的優勢?或者你想證明盲目的攀附熱點對微信公眾號的分析增長沒好處?你寫了密密麻麻的一個郵件,別人看到第三行就失去了興趣。 拜託,人家是老闆,是決策層,不是上數理邏輯課的大學生,你寫了那麼臭長的證明題,誰有興趣看下去,何況,世界各地發生的故事有70%都是不具備因果關係無法證明的(別問我為啥是70%)

你認為跟人溝通邏輯重要?邏輯是什麼,邏輯什麼都不是。一個部門一條普通的銷售曲線,選擇不同的前提,選擇不同的對比對象,選擇不同的方法論,能在邏輯通暢的前提下,得出完全截然不同的對立結論,你想黑還是想粉全在一念間。怎麼,不信,去看看股票就知道了,相同的數據,截然相反立場的多空雙方互相對罵傻逼,相信我,企業里高管撕逼沒差太多

他們擺明了要聽故事、要聽風口、要聽願景、要你提供情緒上的共鳴,結果你給他寫了一道數學證明題?你有錯嗎,好像沒錯,你要堅持自己的數據思想。那他有錯嗎,也沒錯,他的世界觀價值觀和人生觀都擺在那裡,你不適應他難道還要老闆來適應你?


2、具備數據知識的人,大部分都嚴重缺乏對應的業務知識,也缺乏決策經驗

由於數據科學是一個新興的領域,具備紮實數據功底的同學,一般都很年輕,除了理論基礎紮實外,對於商業的理解也非常膚淺,一般都不是擔任的決策崗位,所以這些小年輕來推動公司的數據化運營異常困難.

另外還有很扯淡的一點,就是很多公司都沒想清楚,數據崗位倒是個什麼東西,設立這個崗位要解決什麼問題。不信,你隨便問問你的老闆,數據是技術崗,還是業務崗?

我問過很多同行,基本上沒有組織架構不坑數據兄弟的。把你划到技術部門吧,好了,以後你就是個提數的,這個數據幹嘛去了,用到哪裡了,你就不用多想了,其實你也沒必要去問,99%數據的去向都是ppt,也僅有ppt。但把你划到業務崗吧,那就更好玩了,所有數據許可權全部關閉,想做模型,想做分析?去走提數流程吧,不把需求刪個七零八落不走個半個月流程都對不起我們這麼大公司的規模,你若真分析出個東西要落地,呵呵,呵呵。

發了這麼多牢騷,也需要展望未來,雖然路途很坎坷,但前景是越來越明朗的,很多同行都有這樣的感覺,數據未來的工作性質一定是技術+業務雙結合,能夠通過演算法直接解決業務問題直接扛起KPI。所以有個小建議,入行3年以內的,可以多看書打紮實基本功,3年以上的,爭取向業務轉型,能夠扛起KPI


--------------------------------------------------------------------------------------------------------

繼續寫點技術與業務結合的體會,轉一段話,剛從微博上看到的

有好些朋友私信問我講課是不是主講程序化,我統一回復一下吧:我個人的交易手法是一個從純主觀到純量化最後到主觀和量化結合的過程,交易思想是一個從主觀判斷為先到數據統計為先最後到交易邏輯為先的過程。在這個過程中,我深深體會到程序化與否根本不是是否盈利的關鍵,交易方法背後的交易邏輯才是關鍵。這就好比一道菜,是廚子做的還是炒菜機器人做的並不重要,重要的是菜料的品質以及烹飪的過程。手動或自動僅僅只是外在形式差異,交易背後的邏輯才是本質,我們要把握住本質而不要去執著於形式。

如果我們要想長久在這個市場存活下去,就要克服這些弱點,去尋找真正重要的東西,那就是交易策略背後的交易邏輯是什麼?更進一步的是,講課人是通過什麼樣的方式尋找到這個交易邏輯的?學會了這些,即使原有策略失效了,你仍然有能力尋找到新的策略,這才是長久生存的根本

這段話基本上把業務和技術的關係說得很清楚了,表面上是在談交易,其實可以套用到任何領域,商務的本質是根源,技術、演算法、數據,都是圍繞著商業本質的變化而變化的。


3年,數據分析兼職數據挖掘工程師,不談過程說說結果吧。
1.在一行業做三年,我發現其實漸漸的,數據分析也好數據挖掘也好,其實是有套路的。
比如:流失分析擁有是從用戶C端轉化率漏斗找漏洞,然後多維組合分析找原因,之後abtest驗證原因,最後分類識別深挖潛在目標用戶。

2.東西變化的很快,但是實用的沒有那麼多。
演算法每年各種論文各種高等級的paper滿天飛,但是行業裡面通用的東西其實變化並不是很大,金融圈子裡面logistic打分卡都用爛了,現在合作的很多大公司中還是在用,甚至連gbdt都不願意嘗試一下。

3.入參選擇真的是曠古爍今的難題。
大學的時候,老師就說,你們以後能走多遠不在於你們的演算法學的多好,而是在於你們對你們所處的行業的理解深度。現在看下來,身邊很多訓練集校驗集準確率、recall高的嚇人的項目,實際上線的效果慘不忍睹,公司也安排過很多次交流,每次吹的天花亂墜,每每問到變數選擇的問題,基本上都是冷場。


做了快2年的數據挖掘/機器學習,談談自己的感受。

數據挖掘/機器學習工程師是做啥的?
在我司做機器學習和數據挖掘的統稱演算法開發,業界也差不多吧,所以下文中數據挖掘/機器學習/演算法開發都是一個意思。別以為有著演算法開發的Title就天天寫演算法了,我當時也是這麼想的(天真臉)。除了公司平台部門(基礎架構部啥的),其他業務部門的演算法工程師來了之後要從事和業務緊密相關的數據挖掘工作(劃重點)多麼痛的領悟。說白了用機器學習在業務數據找到規律,然後應用於業務。

做到最後,你可能比運營更懂業務數據(悲傷無奈中。。)自己寫演算法的機會也是有的,只要你覺得在緊張的排期中,你願意自己寫而不是用Spark mllib或者sklearn等現成的工具包。

演算法工程師和系統工程師不一樣。系統工程師做一個系統邊界很明確的,需求文檔上的功能全部實現了,就算完成了。但是模型的準確率達到多少算是好呢?事先會拍腦袋定一個正確率和召回率,但是不一定有用啊,因為模型的效果和數據有極大關係,所以我感覺數據挖掘是個探索的過程。就像挖金子,沒挖到之前,你也不知道金礦到底有多大。

你需要哪些技能?
我描述下自己的工作流程,中間順帶說明要掌握的技能,這樣直觀些。

    1. 了解需求,考察數據。和產品和運營開會,了解她們的需求,自己去數據倉庫中考察各種數據(寫HiveQL,類SQL語言)。
    2. 生成原始特徵表。考察完之後將要用的數據匯總到一張Hive表中,作為原始特徵表,這張表為後面的特徵工程提供原始數據(寫ETL)。
    3. 模型選擇。將問題抽象成分類、聚類或者是標註問題,然後選擇一個模型(熟悉機器學習演算法)。
    4. 實現模型,或者用開源工具包。用開源工具包需要先熟悉介面(熟悉機器學習演算法或是開源工具包,自己實現的話用CPP或是Python,Java寫矩陣運算有點尷尬)。
    5. 特徵工程。根據2中的原始特徵表生成4中模型需要的數據,特徵的增刪改都需要在特徵工程中完成。特徵工程是整個過程中用時最長,影響最大的環節,需要工程師對業務深刻了解。(一般是計算密集型程序,單機跑太慢,用分散式集群跑,就得用MR程序或者Spark程序,現在比較流行Spark)。
    6. 將結果數據寫回Hive,然後生成抽查數據,讓運營檢驗(寫HiveQL)。

總結起來,一個數據挖掘工程師工作中用到的技能包括HiveQL、ETL、機器學習演算法、一種強類型語言(CPP/Python/Java也行吧)、Spark/Hadoop。

如果你周圍的人不懂演算法?

我發現一個很有意思的現象:如果一個人沒搞過演算法,TA對演算法有一種不信任感,而寧願相信規則。

一個人對於不懂的東西,不會產生信任也很正常,但是這會極大影響你的工作節奏。如果是你的上級,和你對接的運營、產品不懂演算法、不信任演算法,工作起來是有些吃力的。目前來看,懂機器學習的運營和產品太少了,做好給她們解釋最基礎概念的準備。

遇到過的挑戰?

數據噪音好坑爹。在工作的時候,運營和產品要求模型正確率是98%,然後我優化到94%就優化不上去了,後面查了下標註數據的正確率是95%,這就尷尬了。讓運營去標註吧,工作量太大。想要清洗數據吧,找不到規律(不是所有數據都能找到規律)。這個時候只有用各種奇技淫巧生產正確率夠高的標註數據,或者修改項目預期,不然就等著項目delay吧。

薪資待遇、競爭和門檻

薪資待遇和門檻成正比,和競爭成反比。總的來說,演算法工程師的門檻相對較高,所以競爭不算激烈,缺口蠻大,薪資待遇相比於其他職位要高一些。

喂,這麼用心的回答,好歹點個贊再走。

傳送門:
對即將學習大數據專業的學生有什麼建議和推薦的書籍? - XbtLin 的回答 - 知乎
從零開始學數據分析,什麼程度可以找工作? - XbtLin 的回答 - 知乎


在互聯網做數據挖掘三年多,來談談個人體驗和感受。

大學學的軟體工程,在遊戲和迷茫中度過。剛畢業時做的是普通開發,覺得很無聊。

後來想起大學老師曾推薦一本書,叫《數學之美》,找時間看了看,覺得非常有趣。

那時候也知道互聯網有種崗位數據挖掘工程師,於是開始關注和學習這方面的知識。

剛入門時,在coursera上看了andrew ng的機器學習的課程,雖然是英文的,但憑著自己的一腔激情,以及大學時鍛煉的看英文教材的能力,最後把課程學完了,還很認真做matlab做了習題,最後的考試還拿了100分。

當然,後來也轉方向做了數據挖掘方向的工作,一些常見的數據挖掘演算法有所接觸,比如關聯規則,分類,聚類,回歸,排序學習。項目上,接觸了推薦系統和廣告系統,當然所做的只是冰山一角。

其實,在互聯網,大部分數據挖掘工程師,是屬於偏演算法應用,旨在用演算法提升業務。入門的門檻也不會很高,數據處理能力是必須的,演算法的話,懂些理論,知道能解決什麼問題,參數怎麼調,就能入門了。當然,演算法理論細節懂最好了,但是切記,演算法牛逼不一定能做出牛逼的項目,演算法不牛逼也不一定做不出牛逼的項目。所以不能迷信演算法。只是作為技術人員,有時間有能力的話,還是多學點演算法來滿足自己的求知慾。

現在的我,是跟著工作內容拓展自己的知識,比如目前在做廣告dmp系統,然後在看劉鵬的《計算廣告》,基本就是業務和演算法一起學。很多時候,並沒有很多機會讓你接觸牛逼哄哄的技術,一是業務的發展階段問題,不需要那麼牛逼哄哄的技術,二是你的實力問題。所以當你工作很無聊的時候,多跟著工作往外拓展自己的實力。

關於自己未來的奮鬥目標,最近跟一個朋友聊過,不是做底層演算法研究,也不是做演算法平台,而是做增長黑客,通過數據和演算法驅動業務的增長。希望將來的1-2年內,對互聯網廣告業務有深入的了解和實踐。比如實踐上,目前做的廣告dmp系統大部分是離線計算,希望將來業務發展能做dsp系統,對接ssp參與廣告競價。另外,補補數學,補補演算法,提高一下自己的逼格和視野。

對於新入行的年輕人,如果你數學功底和演算法理論足夠強大,可以考慮偏演算法理論研究和演算法平台開發的崗位,不然就像我一樣,考慮偏演算法應用的崗位,做一位增長黑客。


這是一個好問題。本質上問的是數據分析工作進階過程中的各個階段的工作狀態,包括工作職責、工作內容、匹配工作職責和內容所需的能力,進一步發展和學習的方向等。

正好我在近些年的工作中管理和指導過超過百位處於不同水平階段的數據分析師,對處於不同階段的數據分析師的職責、工作內容、能力要求、學習和發展方向都有過比較全面的了解和思考,在這裡給知乎的朋友分享一下。

1.困惑篇

先抄一段我兩年前為公司內部的「數據分析師職業規劃與能力提升輔導」課程寫的推廣文案:

作為一位剛工作或者轉行成為數據分析師不久的領域新兵,你是否面臨「永遠跑不完的數據需求,幾乎淪落為跑數據工程師」的窘境?數據怎麼也對不上,快要被老闆批死了,該怎麼辦?

作為一位初窺門徑的數據分析師,你是否面臨「明明花大力氣做出了洋洋洒洒的分析報告,為什麼發給PM和運營經理卻被束之高閣置之不理」的困境?每天都在寫分析報告,卻怎麼也抓不到業務痛點,該怎麼辦?

作為一位有一些經驗的高級數據分析師,你是否面臨「每天都在為業務部門的同事提供各種數據解讀、需求響應、專題分析,看似遊刃有餘卻依然找不到自身價值」的迷茫?感覺該會的東西差不多都會了,卻在大數據這個朝陽領域裡看不到自己的明天,怎麼辦?

回頭來看,兩年前對處於職業生涯各種解讀的數據分析師的現狀和困惑的描述,到今天依然是適用的。

這些現象背後反映的問題是:

數據分析領域的新人,在掌握了一定專業技能的基礎上,卻還是只能從事最初級的、缺乏實質性價值貢獻的工作,更有甚者,還反反覆復出現數據準確性問題、數據口徑問題、數據穩定性問題。明明書上和知乎上老師講的東西都會了,卻還是沒有掌握崗位所要求的能力的精髓;

從數據分析新人逐步進階至中級階段後,基礎的技術問題逐步有所突破,但價值層面上卻遭遇了更加堅固的玻璃牆。數據明明是用來為業務服務的,卻發現並不是所有的數據分析都能服務於業務,開始對這個崗位的定位產生了疑惑;

進一步成長到了高級階段之後,知道自己可以做什麼,也能夠與業務的同學順利的協作,卻發現自己早早的在職業生涯里摸到了專業領域的天花板。一方面是身處於被學弟學妹們羨慕的高大上領域,捧著金飯碗要飯,另一方面卻是在謀求進一步職業發展的時候發現,什麼都會一點卻定義不出自己的核心競爭力。

2.職責篇

對於初、中、高級數據分析師分別需要在什麼職位要求下達到相應的能力水平,行業裡面很多專家都有很多獨到的理解和闡述,巨頭公司裡面的崗位職級評定文檔裡面也有系統性的描述。不過這些標準要麼是為了兼顧到大範圍的實用性而不可避免的做了過度的抽象,要麼局限於個人特定的經驗而只適用於特定業務的特定階段。

所以,在這裡我想特別分享一下我在管理和指導各種不同水平的數據分析師的過程中,對這個崗位的進階能力要求的一些通俗的描述,對每個級別的數據分析師的能力要求,用對應業務需求場景的一句話來刻畫,然後在此基礎上進行一定的解讀和發散。依然是引用之前我在公司內部分享時寫的文檔里的一些資料:

初級數據分析師需要具備能力解決的問題,一句話總結就是「獨立使用數據回答定義明確的業務問題」。
展開講,初級同學需要解決的問題包含兩個方面:一,理解業務問題並將其轉化為數據問題;二,掌握數據結構並利用數據尋求問題的答案。
要理解業務問題,並具備將業務問題轉化為數據問題的能力,需要在與業務同學配合的過程中,搞清楚當前業務的背景、目標、現狀,吃透業務問題,將問題所關注的核心因素量化;要從數據里尋求業務問題的答案,需要以業務流程中可得的數據來定義出業務關鍵指標,並在此基礎上結合業務邏輯和已有數據建立必要的數據模型,來解讀業務指標的變化邏輯。

注意到,初級數據分析師不需要掌握「獨立定義業務問題」的能力。獨立定義業務問題,意味著能夠理解業務工作的優先順序,並且充分掌握了解決問題所需的專業能力。一旦達到這種水平,即可進入中級數據分析師的行列。
中級數據分析師的需要具備能力解決的問題,一句話總結是「獨立完成一篇完整的數據分析報告」。
一篇完整的數據分析報告,加上周邊工作,以所關注的問題為核心來發散,應該包含:當前所關注問題的業務背景、目前業務在做的事情的目標、業務工作展開所面臨的主要約束條件、業務工作展開的方向,需要用數據回答的業務問題,圍繞問題展開的建模、數據處理,分析結論里所給出的現狀評判和業務建議,業務建議落地後的預期目標達成情況。如果團隊協作允許,還需要進一步關注業務建議落地後的效果跟蹤。

中級數據分析師要再進一步尋求突破,需要對工作價值和工作邊界有更明確的認知。
一旦突破,成長為高級數據分析師,就意味著可以「獨擋一面」。
能夠獨擋一面的高級數據分析師,需要對數據分析工作在業務團隊里所創造的價值和數據分析解決問題的邊界有清醒的認知。對哪些事情應該做得更重、哪些方面的投入可以適當控制、哪些業務方面的數據需求可予以拒絕,要有能力做出合理的判斷。業務團隊成員的好奇心是沒有邊界的,數據分析工作不應該淪落為以滿足業務同學的好奇心為目標。數據分析也不是銀彈,並非所有業務上遭遇的問題都一定可以從數據里找到答案。

上面這些定義主要是通過解決問題的難度(包括深度和廣度)來定義初、中、高級數據分析師的能力要求,因此,數據分析師實際達到了什麼樣的水準往往也是通過實戰中解決問題的方案和效果展開評估。

為了達成解決這些問題的能力,我們需要對數據分析師的技能模型進行更詳細的刻畫,落實到具體做事情的過程中所必須掌握的技能。

3.技能篇

數據分析師的技能樹大面上可以分為硬技能和軟技能兩個分支。

  • 硬技能

必備的硬技能主要三個維度的具體能力:

一是數據處理能力。展開來講,目前實際工作中使用頻率最高的是SQL和excel。此外,Python、R語言以及一些傳統的數據處理軟體,如SPSS、MATLAB也視不同人的工作習慣會有相應的使用。

SQL主要用於基於大規模明細數據的指標統計、分維度匯總、排序、多業務數據的關聯統計等。基礎層面數據分析師需要掌握常用的查詢命令,進階層面需要關注查詢原理和查詢效率。學習曲線較為平坦,初學者花2-4周時間可以達到基礎層面夠用的水平;

excel功能十分強大,在數據分析工作中的應用也十分廣泛,掌握各種常用函數、圖表對數據分析工作幫助很大。學習曲線十分平坦,邊用邊學基本沒有什麼門檻;

此外,Python在數據處理方面,比sql更靈活、高效,有大量不斷改良的外部庫輔助數據分析工作展開。學習曲線前期相對陡峭,初學者需要有一段爬坡之後才能享受到工具紅利;R和Python類似,有大量的包可以幫助展開專題數據分析。特別值得一提的是,R在數據可視化方面十分強大。如果在數據結構方面有一定基礎,學習曲線相對不太陡峭,邊學邊用一段時間就可以見效。

二是統計學訓練和統計學思維。據我所知,有一些公司的數據分析團隊相對不太關注這個維度的能力,短期來看,能力缺失也不構成瓶頸,對產出的影響也不像數據處理能力缺失那麼顯著。但長遠來看,每天和海量數據打交道,如果沒有受過一定的統計學訓練,也不具備統計學思維,既不熟悉各種常見分布的特徵,也不了解大數定律的含義和假設檢驗的原理,數據分析工作很難深入,效率上也會受到很多制約。

單獨說明一點,有不少非統計學科班出身的同學,雖然沒有受過系統的統計學訓練,但在日常工作中注重獨立思考,可以建立起比較好的統計學思維,支持日常工作也沒有什麼問題。畢竟統計學理論的很多應用和生活常識結合緊密,實際用起來也都是和直接比較匹配的。

三是理解業務邏輯的能力。這一部分在不同崗位上,內涵差別極大。籠統地講,對數據分析師的要求就是,在理解業務方面,需要達到和你的業務搭檔相同或更高的水平。

例如,數據分析師在搭檔產品經理展開產品優化的效果評估分析時,雖然不要求具備產品經理的系統化的產品設計能力,但在理解為什麼要按照某種方式進行某項設計方面,需要能講清楚其邏輯,達到和產品經理一樣清晰的水平。

這個維度上的能力,考驗的是數據分析師的內功。

以上三個方面的硬技能,若不具備,則數據分析師的日常工作開展會受到各種挑戰,效率和效果都會打很大的折扣。另外還有一些軟技能,如果有欠缺,雖然短期內看起來工作也可以順利展開,但長遠來看很難走得遠。

  • 軟技能

軟技能方面,除了整個行業都在強調的快速學習能力、團隊協作能力外,數據分析師還需要特別關注溝通能力、嚴謹性和責任心、好奇心和數據敏感性

溝通方面,通常數據分析師需要兼具用業務語言與非技術背景同事溝通的能力,和用技術語言與工程師溝通的能力。

強調嚴謹性和責任心主要是因為很多時候,數據準確性對分析結論的影響巨大,但數據的錯誤卻不一定像功能研發的bug一樣在使用過程中會自我顯示出來,所以除了通過一些流程和機制來保障數據準確性,還需要特彆強調數據分析師在專題分析中具備很強的責任心,養成嚴謹的好習慣,盡量降低數據出錯的概率。

好奇心和數據敏感性更多是在幫助發現問題、尋求解答問題的線索方面有巨大的價值。

嚴謹性和責任心、好奇心和數據敏感性很難單純依靠團隊建立學習機制來培養,通常來自於數據分析師對數據的強烈興趣,某種程度上可遇而不可求。

4.成長篇

這篇簡單介紹一下數據分析師從初級到中級到高級的成長路徑和時間周期。

目前互聯網行業里,一線公司的初級數據分析師,對應本科或研究生畢業一到兩年工作經驗的新同學。學歷背景不錯、工作過程中能夠快速學習新事物的同學,經過一到兩年的邊干邊學,基本上可以成長為合格的初級數據分析師。

當前行業里的中級數據分析師,在很多公司的業務數據分析領域都構成了中堅力量,雖然未必能夠像很多業務和技術團隊的明星員工那樣做出令人矚目的貢獻,但這些同學的工作在實實在在的支持著公司層面和業務線層面戰略的拆解、落地、效果衡量和迭代。合格的初級數據分析師,在業務方面具備一定的積累、找到和業務團隊協作的節奏、在數據收集和處理方面逐步熟練之後,基本上就算成長為中級數據分析師了。資質中上的應屆生,三到五年的工作和學習,有機會成長為合格的中級數據分析師。

由於互聯網數據分析工作主要是2010年代之後才逐步發展成熟起來的,高級水平的數據分析師相對還比較稀缺。一方面是有不少資質稟賦優秀的數據分析師入行時間還不長,還沒有充分成長起來,另一方面是早年從市場調研、管理諮詢、社會調查統計等領域轉到互聯網行業的數據分析師,由於缺乏系統的方法論指導以及個人成長方面遭遇天花板,很多人還停留在中級水平無法進一步突破。

要成長成為優秀的高級數據分析師,更多需要關注的是站在互聯網業務發展的角度思考問題,對業務發展的邏輯,包括戰略、市場環境、競爭策略、組織結構、團隊能力架構有更深入的理解。

5.發展篇

一些資質優秀的數據分析師,沿著初級到中級到高級的路徑發展,快則五年,慢則八到十年,在專業能力方面就達到專家的水平。那麼,逐步成長到高級數據分析師之後,職業生涯還可以朝哪些方向拓展呢?

第一個選擇是成為大規模數據分析領域的技術型專家。這個方向有點類似於矽谷比較火爆的數據科學家,除了具備數據分析師的基礎技術能力、理解業務之外,需要進一步在演算法、工程、統計方面加強,通過技術手段輔助展開複雜項目的數據分析。技術型專家的生存空間會一直存在,並且在接下來五年左右時間內會持續是行業最稀缺的人才種類之一。

第二個選擇是成為數據分析團隊管理者。數據分析團隊更適合expert leads expert 的模式,優秀的管理者首先應該是領域專家。在此基礎上,還需要補強團隊管理能力,在團隊建設、團隊成員培養、日常管理、跨團隊協作方面有進一步提升。目前國內大部分互聯網公司的數據分析團隊組建時間不超過五年,優秀管理者仍然在成長路上,總體處於供不應求的狀態。成長為優秀的數據分析團隊管理者,會讓數據分析師的職業生涯進入一個全新的境界,對個人在職場獲得良好的回報和進一步發展有巨大的幫助。

除了成為專家和領域管理者兩個常規發展方向之外,數據分析師由於其崗位能力模型的特殊要求,還有其他一些發展方向可供參考。

首先,數據分析師在很多公司的首要工作是服務於業務管理者,這要求數據分析師在日常工作中必須建立起業務的全局意識,從整體層面上關注業務展開的邏輯,對團隊整體能力和業務發展空間有更多的思考。在這方面一以貫之的思考,使得數據分析師有機會轉型為戰略決策者甚至直接晉陞為業務管理者。當然,這個方向的成長,也對數據分析師的能力提出了很高的要求,需要在本身的專業能力之外,建立戰略決策的方法論體系,並且在團隊管理和業務管理方面做好充分的準備。

其次,數據分析師在和業務同事搭檔的過程中,需要對協作對象的決策邏輯有深入的理解。因此,無論是與產品經理、市場或運營相關的同事協作,一段時間後就有機會成長為相關領域的專家。如果有進一步發展的興趣驅動,數據分析師具備很好的機會轉型到產品經理、市場或運營相關的崗位。目前行業內炙手可熱的growth hacker一貫強調需要數據驅動,數據分析師轉型做growth機會也很多。另外,特別值得一提的是,在產品方向,有一個分支是策略產品經理,其能力模型有相當一部分與數據分析師重疊,數據分析師轉型過去切換成本尤其低。

此外,近幾年大數據方向的創業如火如荼。早幾年為開發者做數據採集SDK和數據統計平台的友盟、talkingdata等,為開發者做推送SDK並採集數據面向B端做數據生意的極光、個推等,直接基於公網爬取數據和運營商等渠道採購數據展開清洗、建模的quest mobile、數據堂等,以私有化部署或聯合部署方式為B端提供專業的數據採集、清洗、建模、專題分析和可視化服務的growing io、神策、BDP等公司,都需要大量具備專業數據分析能力的售前、售中、售後服務專家。目前整個行業還處於起步和告訴發展階段,未來的人才需求規模也十分可觀。互聯網行業的優秀數據分析師,如果轉投大數據專業領域的創業公司,發展前景也不可限量。

除了以上這些方向之外,數據分析師作為佈道者,帶著互聯網行業發展起來相對比較成熟的理念和方法論,去相對傳統一些行業的公司,帶動公司甚至整個行業更好的使用數據,推動公司和行業的發展升級,也是充滿了機遇和挑戰的方向。

小結:

題主的問題是想了解已經入行之後、處於不同水平的數據分析師的工作狀態。對此,有很多很棒的答主的答案,都結合自身的經歷,對數據分析師的職業發展生涯的某個截面,或者從入行到成長至當前水平的歷程,做了詳細的介紹。我貢獻的答案,更多是站在一個數據分析領域資深管理者的角度,結合自己實際工作中的經歷,通過梳理介紹不同階段水平的數據分析師的困惑、職責、技能、成長和發展的歷程,爭取讓知乎上對數據分析方向的工作感興趣的朋友們,對這個領域的全景有更充分的了解和認知。

拉拉雜雜,一不小心寫了接近6000字。由於個人水平所限,不可避免會有各種錯誤、疏漏。歡迎知乎的朋友們多多指教!

最後聲明一下,文中所有的內容,包括引用格式的內容,都是本人原創,非經許可不得轉載用於商業途徑。

如需轉載,請私信聯繫本人獲得授權。


做數據分析快2年了,結合最近許多想要進入這個行業的人諮詢的問題。分享下自己的一些體驗

1.數據分析的實際工作流程和內容是什麼?實際的工作內容我覺得大致可以分為如下幾個部分:

  • KPI監控——及時監控業務指標的健康情況,並定期向leader進行彙報
  • 事後分析——找出問題,給出業務優化的建議;例如針對運營活動,產品功能優化等動作,進行一段時間的數據監測,整理成數據報告,與業務方交流,優化業務流程;
  • 事前預判——評估可行性,策略調整及需要準備的資源是否到位;例如產品功能是否應該改版,電商大促的備貨量是否充足等;
  • 專項項目——如精準運營crm,物流倉儲協調,事件漏斗等

具體的工作流程基本是

  • 數據搜集,統計口徑確認
  • 數據清洗整合
  • 統計分析 or 模型設計
  • 形成分析報告 or 獲得優化好的模型
  • 報告校驗 or 模型評估
  • 報告交付 or 模型交付部署上線

2.進入公司時這方面的職位有什麼要求?

  • 業務分析思維(需求程度--5星):數據分析工作需要與業務保持緊密深入的結合,需要對運營,用戶體驗,產品,市場都有一定了解,才能對業務起到指導作用;
  • 基礎的技術能力(需求程度--3星) :需要會基本的數據整合研究的能力,不同公司對本部分的要求會有不同,如果開發人員不足,會要求數據分析師具備更強的底層數據清洗能力;
  • 統計 or 機器學習(需求程度--4星) : 數據分析與挖掘一樣,需要具備一定的統計和機器學習的基礎知識,這樣才能在實際的項目中更準確的依據數據獲得結論,同時讓數據發揮更大的能力;
  • 報告整合表達能力(需求程度--4星) :由於最終的分析報告需要由數據分析師與業務方交流才能讓報告落地,因此需要把繁雜的數據轉化為容易理解有執行性的語言傳達給業務方,這一步在工作中也十分重要;否則辛辛苦苦的工作最後什麼價值也沒有產生,就徒勞了;

3.具體需要哪些硬性技能(技術方面)?

  • linux 基本操作 (需求程度--5星)
  • sql/hive 的使用 (需求程度--5星)
  • R / python 的數據處理建模能力, R包多,可視化效果好;但 python更適合在大規模集群上處理,更加推薦;會 java / python 肯定是加分項

4.面試時應該注意什麼?

  • 最好提前對你要面試的崗位做負責的產品有所了解
  • 結合自身優勢對於 2中提到的技能進行準備,可以偏重不同;

5.其他的個人感受

  • 數據分析師是一個非常需要有合作精神的工作,因為底層的數據邏輯很複雜,要想弄清楚必須要與開發合作;如何從數據中發現業務問題,需要與業務方緊密結合在一起;推薦車品覺的《決戰大數據》,裡面「混通曬」的觀點特別好;
  • 數據分析可能必須得有強迫症,因為一定得保證數據的準確性,所有的分析才有意義,因此你可能會花大量的時間去保證數據準確性;
  • 數據思維和實際落地業務之間的溝壑是要慢慢填滿的,數據分析有時候會陷入自嗨和糾結數據意義的環節中去,而忘記了如何在實際業務中產生價值,但產生業務價值才是數據分析師的【第一性原理】

2年數據挖掘,說說自己的感受。
1、你不是在做數據挖掘,是在完成kpi(重點中的重點 ),這一條不解釋;
2、你不是在做數據挖掘,是在理解運營業務;
3、你不是在做數據挖掘,是在給上級科普(註:有些上級不懂原理,也不相信你做的東西);
4、你不是在做數據挖掘,是在洗臟數據。業務來源複雜,產生數據的方式多重多樣,導致拿到的數據良莠不齊;
5、最後一條,業務變化,老闆方向變化更快,你需要放下手頭剛剛熟悉的業務,去奔赴新的前線。

——————我是分割線——————

上面說了很多消極信息,其實如果站在整體的角度看業務的變化,其實數據挖掘就是在挖掘新的業務增長點,為企業創造利潤。

新增內容:
工具(pai+odps)相當便利:
不用寫數據挖掘演算法的代碼(需要哪些表哪些特徵還是需要sql選擇的),只需要拖拽相關演算法的組件,用pipeline的方式就完成了整個演算法的建模。


感觸較深的一點:其實很多人是對機器學習葉公好龍。
舉個例子:機器學習不只是弄個啥模型耍一耍,你首先要接受他的思想和思維方式,認同一些基本原則。
說要靠機器學習提升,捨不得投人投錢標數據量,也捨不得做眾包,這就是葉公好龍。
口口聲聲說要靠機器學習驅動,結果看到一個錯分樣本就要否定模型效果,這就是葉公好龍的一種表現。
duangduangduang跑模型,然後彙報訓練集的效果,不敢報測試集效果,這也是葉公好龍。
如果基本的統計思維都沒有,那還弄啥機器學習。


我在學校是數學專業,博士期間呢,搞的課題是生物方面的數據分析嗯,不過畢業以後頭四年吧,做的是跟數據分數據挖掘沒有關係的工作,從2012年到現在是在做數據挖掘,目前在國內的一線互聯網公司。我個人認為數據挖掘演算法的分為三個等級。第一個等級是能夠使用開源的數據挖掘工具,解決普通應用場景問題。第二個等級,我覺得是已經用數據挖掘的方法解決過很多應用場景,踩過很多坑,並且有一定的理論基礎。第三個等級,對現有的理論和方法能夠做自己的創新改進;並且能跟的上最新的演算法進展。我覺得我目前已經過了第二等級在第三等級前沿徘徊

2017年4月14日(回答網友評論)

===================

我畢業的時候是07年,生物信息專業在國內的確很難就業(如果不留高效或者科研機構的話)。我當時拿到一家北美的通訊公司的在當時看來還不錯的offer,但男怕入錯行,當年望京牛逼的公司全是通訊公司,北電,摩托,愛立信,朗訊,現在這些公司基本都被收購或者在苦苦掙扎。從08年我在的公司申請破產保護,然後被另外一家北歐通訊公司收購,相反,互聯網公司卻如日中天。2010年,我開始想往互聯網行業跳,但背景經驗不足,我換了一家公司,雖然不是互聯網公司,但崗位離數據近了很多,終於在2012年我才算跳出通訊行業,進入互聯網公司。


入坑快兩年,贊同 @Slade Sal答案,數據分析(挖掘)在實際應用中,各個演算法模型的到實際運用端,各類參數是重要的,還有對行業業務理解程度,否則,數據分析只是束之高閣的一個看上去不錯的玩物。


深感數據分析作為新興行業的市場混亂、魚龍混雜、巧立名目、誤導新人...
於是自己寫了本書...
希望能做一點微小的工作...


畢業6年,先說一下經歷:

我剛畢業的時候進的一家諮詢公司,平時用的是excel+spss+ppt。

平時的分析主要用各種excel公式加spss出分析報告。

後來進入一家第三方數據公司,主要做外包挖掘項目,用的一款開源挖掘軟體。

目前在一家互聯網金融公司從事信用評分,數據挖掘相關工作,用的軟體是R,下一步進階是數據平台架構或者數據產品。

基本上從初級的數據分析到現在的數據挖掘都做過。

我來說一下我自己一些不成熟的看法:

1.分析與挖掘工具的選擇

數據分析、數據挖掘的相關軟體發展速度超級快,只要你在這個行業你就會有深刻的體會。幾年前大家常用的spss等軟體迅速被淘汰,R、python等工具發展十分迅猛,而在超大數據量方面hadoop,spark也層出不窮。

很多人總是在糾結於學習哪個軟體,其實一方面要考慮你的自身條件,另一方要考慮團隊情況,不要大家都在用R,你去用python,不是不可以,而是會加大了學習工作的成本。最重要的一點不管學什麼,一定要馬上去學,不要比來比去,任何一門主流的工具只要你掌握了,都有很好的發展,而且學習其他的也很快。我現在還天天寫R代碼呢。

sql和excel這兩個東西是基礎的東西,一定要認真學,好好學,不要看起來簡單就不好好學,因為幾乎在所有的工作中都要用到他們,sql我就不說了,大家都知道重要性,excel其實也很重要,因為很多結果的輸出與展示會放到excel中,用好excel+ppt好處我不多說,大家試試就知道了。(可以用來撩妹)

我個人感覺未來大數據框架或平台方面的東西比較重要,因為一方面數據越來越大,另一方面這些工具的可用性也越來越強。

2.不要迷戀演算法

體現你在公司中的價值不是你用的演算法多高明,報告多華麗,一切分析和挖掘的終極目的是解決問題。只要你解決了問題,你就是牛逼的,即使你用線性回歸,也沒有人去說你,你也不要因為用了簡單演算法而自慚形考,因為隨著你對演算法的了解,你會發現很多演算法是殊途同歸,一種演算法可能是另外一種演算法的擴展。

演算法的重要性體現在你可以有多種方法去解決同一個問題,甚至有時一個問題也許就只有唯一解。

3. 統計學和概率方面的知識要學一下,基礎之一,不多說。

4.與其他人員的交流溝通

坊間流傳著一種說法,好事從來輪不到做數據的,出問題了做數據的來背鍋。我可以告訴你這中情況很可能發生。數據人員在一個公司中面對的人員非常多,包括技術開發、運維、運營、市場、高層等等。人多了,打起交道來有時候並不那麼簡單,單單一個指標的制定就可能設計到不同部門的部門利益。做分析或者挖掘都是要結合業務來的,如果你不了解業務或者業務人員故意不告訴你一個東西,你做出來的東西很可能把自己給坑了。一定不要拿著做出來的結果想當然的去告訴別人該怎麼做,一切分析的結果都是執行的參考,特別是對高層,尤其要注意。有時候一個政策的執行會設及到很多方面,一些事情你並不一定了解。對自己輸出的結果有充分的了解,因為數據既可以指導業務,也可能傷及到業務,甚至傷人。

5.一定要獨立完成一個項目,從數據採集、數據清洗、模型建立、模型優化、結果輸出等等所有的工作都要自己來完成。任何一個數據分析或者挖掘項目,不管多麼小,相關的流程都要走一遍,做多了你就會知道自己的瓶頸在哪裡了。也許是在數據清洗就卡住了,也許演算法不行,模型建不好,當然你也有可能你表達不行,好東西大家聽不懂,當然也不會採納了。


## update 20173.1

6.需要有一定的編程能力,如果你畢業自計算機相關專業,那麼你要更關注3,如果你畢業於統計學或者數學等專業,那麼一定要提高自己的編程能力。好處多多,例如可以把一些複雜性不高但重複性高的工作自動化。另外很多數據分析挖掘工作要有較強的工程能力來配合,而編程是不可或缺的。


# update 3.8

剛建了一個學習R的群 600411803,想學習R的朋友可以加一下,暗號:知乎學習R.

# update 3.17

他山之石:

What do experienced data scientists know that beginner data scientists don#x27;t know?

Quora:有哪些數據科學新人不知道老手才知道的?(獨譯) | 36大數據

後面想到再補充~~


謝邀。

大家說了不少乾貨,我就談談自己經驗。

本人理論物理博士畢業,因緣際會入了行。世事如棋,不是自己掌控,那時我連數據挖掘是啥也不知影,現已做了四年多。

第一年,就是不停學新知識,數學丶建模丶自然語言處理,還有編程技術,在Coursera修課。

後來就是讀文章,建立小組討論群,互相切磋。

然後就是學新的編程技術,因為舊的被塗汰了??

對時局要有敏感度。

現在因為一project成了型,要做的東西可以很快地做,所以相對沒那麽忙,但就把精力放在更進深和尖端的知識,畢竟行業競爭也大。


數據挖掘目前很火,有點類似於11年火爆的iso、Android開發。入學門檻逐漸變低,現在都開始變成搭積木似的,幾個介面API調用,就能完成絕大部分工作。比如我剛入門看深度學習時,多少坑要寫多少代碼。但是現在keras 感覺就如傻瓜式的入門。導致這一行的人越來越多,如有個答主所說,讀博時多苦逼的寫代碼作分析、出來後發現跟搭積木一樣,完全沒有優勢。誠然,這是行業的現狀。但是,任何行業上升之路都是充滿荊棘的。你要做到高層,都是不容易的事情。

前面已經有牛人梳理了整個行業的一些東西,我這裡不做技術性的總結,技術文章一搜一大片。這裡我總結幾點我工作中遇到的問題,其實是關於意識的問題,和技術關係不大,但是在工作的時候更重要。

1、對模型的偏愛。

很多人會非常執著於模型,特別是聰明的人,覺得這些才是最牛逼的。誠然,好的模型,好的效果大家都喜歡。但是,很多時候解決業務問題才是核心,模型只是解決問題的工具而已。這個主次一定要分明。你的產出才是你的能力表現。你的模型只是輔助你而已。

2、對數據不做充分的理解

有些人拿到數據做個粗淺分析就開始套模型,絲毫不對數據進行充分的分析。導致後期積重難返,耗費很多資源。有時候對數據進行充分的分析,利用規則就能達到很好的效果,雖然看起來low,但是很有用。

4、數據分析條理不清晰。

沒有一個整體的框架意識,分析的時候東一塊西一塊,一看就不專業。

5、對業務部門解釋不重視

模型產出結果後,直接扔給業務部門,不做任何的解釋性分析。這是最大的忌諱,我也栽了好幾次。這玩意跟程序員不寫注釋一個道理。但是比這個嚴重。不寫注釋坑的是自己人,這個還好一點(尷尬)。你對業務部門不把模型梳理清楚,你給別人一個黑盒子,會導致別人雖然用你的分析結果,但是很可能會用錯。直接導致你的成果打個折扣。

6、半路出家

剛說了很多人重視模型,但是有人半路出家,又不太重視模型。有個模型介面調用就行了,對裡面的原理又不清楚。這和程序員ctrl+c ctrl+V一樣,很難提升自己。跳槽也不容易。所以原理該學還得學,概率論 微積分 該拿起來啃還得啃。


未完待續


4-5年,每天刷知乎。。。


本身入行時間也不長 互相討論吧

背景:

校招去的一個二線互聯網公司 做了一年數據分析師 經常加班積攢負能量 崗位沒有話語權 最終帶著遺憾離職

之後去的一線互聯網公司 到現在做了兩年策略/數據產品經理 很享受這個崗位 績效一直1~2分 拿了事業部的季度個人最高獎 工作中的成果也獲得了幾個國家專利和授權

感受:

1,數據分析師的生命周期:

數據分析師的理想狀態是做到商業分析師的感覺 做出來的東西能落地能有影響力

而我之前做的數據分析師呢 其實完全可以被PM+RD做一個數據產品出來就能解決掉

因為論業務PM在一線 論技術演算法工程師們也是碾壓

可能現階段就是靠著即能理解業務又能分析數據這種跨界綜合能力

2,如何體現數據的價值:

還是得深入業務 做什麼比怎麼做要重要些 而不了解業務就沒法獲得好的問題和需求

之前做過很多四平八穩的報告 確實沒什麼亮點 不是想不到好的切入點 就是提出的問題其實業務方不怎麼感興趣

3,未來的可能性:

以前覺得自己的職業規劃應該就是數據分析---&>數據挖掘這種技術路線的升級

後來偶然的機會做了策略和數據產品的工作才發現 之前給自己的限制太多了

其實想想看 只要是運用抽象能力、邏輯分析和數據分析背景能解決實際的問題 崗位其實就無所謂

當設計了很多策略和數據模型之後 就越發現需要總結提煉一下這些問題的特徵與共性 也不用太多的糾纏一些細節


這應該是數據分析的終極形態吧


我來答一個吧,從事數據挖掘相關領域4~5年
我是做業務安全相關的,風控,異常識別和對抗
隨著工作經驗的增長,對這門學科有了一點粗淺的認識。
就如同老祖宗講的術和道,數據挖掘其實也有類似的
我第一年來,就是直接針對具體的業務,設計特徵,設計業務模型,選擇合適的演算法,建模,評估準確率覆蓋率等等,這感覺就是術,術做得好,基礎是業務的理解能力,對數據的敏感程度以及對演算法的熟練掌握,很多業務模型的巧妙都在裡面。
後來的幾年,逐步轉向平台化的設計和開發,基於數據的主動發現,自動識別等。也就是數據的建設,但這塊不僅僅止於用hadoop、hive等大數據框架將數據「吃」進去,而且還有從通用業務角度出發的「消化」,,從之前的經驗中歸納出通用的邏輯,並且自動的轉起來,自動的輸出更有用的模型、規則等等

就我個人而言,其實我更喜歡術,解決疑難問題,感覺更加有成就感。
但是就目前互聯網大公司而言,更喜歡人往道的方向發展,講你的經驗固化下來,形成通用的方法論,解決一系列的問題。

道和術應該是互補的,道有了,基本上80%的問題能輕鬆的滅掉,剩下的20%,術才有精力去發揮,去精研。
至於成長么,先從術做起,簡單的case積累經驗,然後歸納總結,至道,道術結合吧。。。


你這分明是想,套進階路線。

空手套白狼。不幹。

(? ̄?? ̄??) 嫌棄你。

就像高考一樣。怎麼樣能考好。不是天天研究一些奇技淫巧 。而是把五年高考,三年模擬做爛。爛到一題都不錯。高考成績一定好。

可惜啊。現在人,往往不願意一步一個腳印。腳踏實地的去學習。

天天追求,30天走向北大。怎麼不做題考上清華。選做題猜題技巧。英語看不懂,也能得高分記住這30個技巧就夠了。

有意思么?

我推薦一本PRML給你。這個就是機器學習屆的。五年高考,三年模擬。什麼時候你讀爛了。你就是8年水平。差不多看懂了就是5年水平。讀了一半就是三年水平。

總結一句:學習是一條很曲折的路,很難走,長著很多的荊棘,路上需要挑戰和堅持的太多,所以學習路上沒有捷徑。

順帶加一段,初中生的作文來鼓勵你。

「父親那頂常年放置在後院的草帽下,竟竄出了一棵梧桐樹苗」??「三個月後,梧桐樹就有一層樓那麼高了,可是,父親竟把它砍了」??「來年,又是如此。父親還是將它扼殺了」??「這已經是第三次了,我憤怒的跑進了柴房,猛然發現,前兩次的梧桐樹桿竟然都是空心的」?? 我不禁為之心頭一震——

身為一名中學生,只知道一味的追求學習速度卻忽略了最重要的效率,這難道不可笑嗎?如果只是在速度上超過了別人,而效率卻落在最後,那麼,即使是學的再多也沒用。學得多不代表學的精呀!

加油!一起腳踏實的學習,生活。


推薦閱讀:

QQ 是否可以取代 Skype,怎樣才能?
阿里金融侵蝕了銀行壟斷體的利益嗎?為什麼後者沒有反應?
人人網為什麼不但沒成為中國的 Facebook,反而日漸式微?
小區論壇的前景怎麼樣,前期做需要哪些準備?
為什麼那麼多網站鍾情 UTF-8?

TAG:互聯網 | 數據分析 | 機器學習 | 數據科學家 | 大數據 |