如何學習 Spark-經典Spark視頻教程!
首先是官網視頻下載頁所有的視頻教程 http://www.bjsxt.com/download.html 支持在線觀看,也可離線下載視頻、源碼、文檔、ppt等,選擇方便的時間學習。
力薦!Spark視頻教程 鏈接:http://www.bjsxt.com/2017/down_0227/86.html
課程介紹:
Spark 是在 Scala 語言中實現的,它將 Scala 用作其應用程序框架。與 Hadoop 不同,Spark 和 Scala 能夠緊密集成,其中的 Scala 可以像操作本地集合對象一樣輕鬆地操作分散式數據集。
/========我是分割線=========/
敲黑板! 邦邦邦!
我們為什麼要用Spark? 用來做大數據分析!
這套視頻教程由陳老師主講,史上最全、最細、最深的Spark教程,非常適合零基礎和有基礎需要提升的人。
課程目錄:
01_Spark_初識
02_Spark_Java開發_RDD五大特性
03_Spark_運行時_程序調度
04_Spark_持久化策略_緩存優化
05_Spark_Standalone集群模式_ZK配合搭建HA_以及測試
06_Spark_Yarn集群模式_以及測試
07_Spark_操作運算元本質_RDD的容錯
08_Spark_寬窄依賴_DAG的切割
09_Spark_術語的歸納總結_源碼的初步剖析
10_Spark_調度流程剖析_調度流程源碼剖析
11_Spark_DAG源碼剖析_Task最佳計算位置源碼剖析
12_Spark_源碼學習總結_SparkPi代碼剖析
15_Spark_更多運算元操作剖析
16_Spark_更多運算元操作及總結
17_Spark_textFile詳解_分組取TopN_二次排序
18_Spark_共享變數_SparkSQL初識
19_Spark_隱式轉換和隱式參數_DataFrame初探_RDD反射轉為DataFrame
20_Spark_RDD動態轉為DataFrame
21_Spark_JSON數據源_JDBC數據源_以及Standalone集群測試
22_Spark_Hive數據源_以及Yarn集群測試_SQL來做分組取TopN
23_Spark_自定義函數_自定義聚合函數_Spark源碼PageRank的問題
24_Spark_SparkStreaming初識
25_Spark_HDFS數據源_DStream的持久化存儲
26_Spark_UpdateStateByKey運算元_Tranform運算元
27_Spark_Kafka的安裝以及測試
28_Spark_Kafka數據源_Receiver方式接收數據_Direct方式接收數據
29_Spark_基於滑動窗口的操作_Spark和MR在Yarn運行的區別
30_Spark_對於內存的使用_靜態模式_統一模式
推薦閱讀:
※Spark Streaming有沒有計劃引入Flink 那種真正的流式處理?
※大數據進階,你現在處於哪些階段
※Spark MLlib實現求解惑?
※一般而言常見的Spark的性能瓶頸有哪些?
※Spark中,Dataset和DataFrame的性能比較?
TAG:Spark |