「數據達人養成計劃」Live知識要點

感謝各位知友的參與,Live2順利結束(此處有撒花)

回答了全部的提問,如果有沒照顧到的,可以私信給我。

這裡補充下整理好的知識要點(●-●)

第一章、人生第一步我為什麼投身數據產業? (5min)

  • 讀萬卷書不如行萬里路。
  • 行萬里路不如閱人無數。
  • 閱人無數不如名師指路。

第二章、我最喜歡 DA&DM 工作的哪一點?最不喜歡哪一點? (10min)

  • 音樂家譜寫一首新樂曲、科學家創造一個新發明、物理學家發現一個新規律。

  • 《1984》:誰控制了現在,誰就控制了歷史;誰控制了歷史,誰就控制了未來。
  • 面向過去的描述性分析(Deive Analysis),發現潛藏的歷史規律。

  • 面向未來預測性分析(Predictive Analysis),對未來趨勢進行預測。

  • 數據科學的痛點故事:「豬欄的小豬」、「黑天鵝事件」。

第三章、什麼樣的數據科學家可以做到年薪百萬? (15min)

  • IBM總部訪談:Chief Data Scientist of IBM Big Data University——Saeed Aghabozorgi
  • 關於學歷和數據科學認證的含金量
    1. Cloudera Certified Developer for Apache Hadoop
    2. Cloudera Certified Specialist in Apache HBase

    3. Cloudera Certified Administrator for Apache Hadoop
    4. Mongo DB Certified DBA
    5. Mongo DB Certified Developer
    6. Oracle Administrator Certified Master—DBA (OCM)
    7. IBM Certified Advanced Database Administrator
    8. HP Vertica Big Data Solutions Administrator
    9. SAS Certified Predictive Modeler – SAS Enterprise Miner
    10. Certified Analytics Professional) — CAP
    11. Certification of Professional Achievement in Data Sciences — Columbia University in the City of New York
    12. Mining Massive Data Sets Graduate Certificate) — Stanford University

    第四章、成為這樣的大牛需要什麼樣的學歷和能力?(15min)

  • 領域介紹( ● 情感分析 ● 風險建模 ● 欺詐檢測 ● 客戶流失分析 ● 用戶體驗分析)
  • 通用技能:Data Mining, BI, Visualization and Data Warehousing,
  • 通用工具:using R, Python, Weka, Rapid Miner, SSIS, SSAS, Tableau
  • 數據科學家的技能樹(魔法書):
    • 關於數據科學的職業規劃和路線

      1. 初級數據新人——用數據解答業務產品問題(正確性、合理性、全面性)
      2. 中級數據高手——獨立完成高質量的數據分析報告(構思、規劃、完善、評價)
      3. 高級數據達人——帶領團隊,負責幾個子產品項目or模塊(研究最新的領域內進展)
      4. 終極數據大神——成為公司的領路人(首席數據官Chief Data Officer、首席執行官Chief Executive Officer)
    • 數據科學(BAT筆試題)

    第五章、 剛入職的新人對這份工作通常有哪些誤解? (15min)

    • 新人常見的誤解主要有以下幾種:

    1. 「數據科學家」和「商業分析師」本質上是相同的。
    2. 數據科學應用的領域很小,只有互聯網公司用的上。
    3. 數據科學繁榮是一場泡沫,未來將會被AI技術取代。
    4. 非計算機專業的人,不具備成為數據科學家的潛力。
    5. 演算法和模型是萬能的,活用數據能夠解決一切問題。
    6. 數據分析只能被業務牽著鼻子走,不然就無事可做。
    • 數據人的自我修養

    第六章、我從這個行業中所獲得的核心技能是什麼?(15min)

    • 1. 決策力——有勇有謀,百戰不殆,運籌帷幄,決勝千里。

    1)決策力體現在工作中——對工具、數據、產品有自己的判斷優先順序。

    2)決策力體現在學習中——就是有預見性的自學能力。

    3)為什麼要強調決策力?決策力在數據工作中如何體現?

    4)如何正確的培養自己的決策力?(以銅為鏡,可以正衣冠;以古為鏡,可以知興替;以人為鏡,可以明得失。)

    • 2. 執行力——其疾如風,果斷堅決,兵貴神速,侵掠如火。

    1)執行力體現在工作中——堅持三省吾身、日格一物的工作態度。

    2)執行力體現在學習中——堅持思考與行動相結合,即思行合一。

    3)為什麼「站在巨人肩膀上」常常會讓你掉進坑裡?

    4)如何正確的培養自己的執行力?(學而不思則罔,思而不學則殆;數據知其然,更要知其所以然。)

    • 3. 耐久力——天道酬勤,人無我有,人有我精,人精我勤。

    1)耐久力體現在工作中——數據處理過程中(數據獲取、數據清洗、數據建模、數據展現)與人高效可持續溝通(業務人員、程序員、管理層)

    2)耐久力體現在學習中——終生學習,AI技術的發展迫使底層的數據從業者不斷提升自我。

    3)為什麼要強調耐久力?(未來不是一個「死記硬背」的時代,而是好奇心+實踐的時代。比你聰明的人不可怕,比你聰明而且比你更努力的人才可怕。)

    4)耐久力在數據工作中如何體現?(人們真正注意到你的時候,不是第一眼看到你站在那裡,而是發現過了這麼久,你居然還在那裡。)

    其他:

    • 分析解決領域問題的能力

    • 數據獲取清洗展示的能力

    • 數據建模和最優化的能力

    • 編程和資料庫優化的能力

    • 設計和做數據報表的能力

    第七章、何時應該跳槽?如何計劃跳槽?跳槽的技術要點是什麼?(10min)

    • 發生在我身邊一個真實故事。

      1. 跳槽,要有目的性,明確你的目標期望值。
      2. 跳槽,要時刻準備,切勿臨時起興抱佛腳。
      3. 跳槽,要有預見性,選擇比努力更加重要。

    • 自我感悟:思深方益遠,謀定而後動,知止而有得。

    以上就是我在本次Live分享的全部內容,感謝各位知友的參與,鄙人才疏學淺,時間倉促,考慮不周之處,望海涵理解。如果滿意的話請給個笑臉(●-●),謝謝。

    有時間的朋友歡迎花60秒完成一份6個問題的小問卷,提出您關於本次Live的寶貴意見和建議:「數據達人養成計劃」Live反饋問卷,您的滿意是我分享的動力,再次向各位表示由衷的感謝。

    FM wx: Dataology.


    推薦閱讀:

    機器學習很枯燥,不想繼續學了怎麼辦?或許,這些建議值得一看
    91 job interview questions for data scientists
    初入數據科學職業時,要避免的9個錯誤
    簡明數據科學 Part1:原理與過程

    TAG:大数据 | 知乎Live | 数据科学 |