Big Data (Specialization)

這是UCSD在coursera上開設的一門Big Data的專項課程,包括六個獨立的課程,前五門課程會介紹Big Data和Data Analysis的一些基礎概念。最後會用之前學習到的知識完成一個簡單的Big Data 結業項目。

如果是為了滿足工作需要,課程內容的深度是遠遠不夠的,這個系列課程只是會讓你對Big Data裡面一些基本概念有所了解,但距離直接在工作中運用還有很遙遠的距離。畢竟Big Data相關的工具和工作上手難度是相對較高的。如果是想要了解Big Data相關的知識倒確實是一個很合適的業餘學習資源吧。

這個Specialization裡面的六門課分別是

一、Introduction to Big Data:介紹一下相關的技術和概念,主要是Hadoop和Machine learning。

二、Hadoop Platform and Application Framework:會介紹Hadoop的架構是什麼樣的,有哪幾個模塊;什麼是MapReduce,在虛擬機環境下寫一些簡單的Mapreduce代碼體驗一下mapreduce的過程。

三、Introduction to Big Data Analytics :介紹並且簡單的使用HBase、Hive、PIG、Splunk等等,但距離熟悉了解和能夠在工作中使用還是差很遠的。

四、Machine Learning With Big Data :介紹機器學習的相關概念,分類演算法和聚類演算法,用KNIME工具來從劃分訓練集數據集開始做一個簡單的機器學習數據分析。

五、Graph Analytics for Big Data:介紹社交網路這種圖結構,用Neo4j來做圖的大數據分析。

最後的Big Data - Capstone Project 就是一個簡單的數據分析項目,提供一個遊戲公司玩家行為的數據集,包括玩家遊戲里的行為,購買,廣告點擊,社交活動等等的數據,用Big Data相關的數據來分析怎麼提高公司的營收。

例如,對玩家特徵提取後進行分類,預測玩家能夠給公司帶來的收入;對玩家進行聚類來觀察不同群體玩家的屬性和表現;分析玩家的社交數據觀察社交行為和收入之間的關係。

不是做數據挖掘工作的人還是會覺得挺有意思的吧,因為課程內容比較淺所以花的時間也比較少,大概就像一本需要動手實踐的成年人課外書吧。

推薦閱讀:

多重預訓練視覺模型的遷移學習
地理大數據的商業金礦,怎麼挖? | 數據俠實驗室07期
2017 年回顧:NLP、深度學習與大數據
2017黑五背後的消費者數據_諸葛io
流行音樂五十年的發展歷程

TAG:Coursera | 大数据 | 数据挖掘 |