標籤:

關於Spark有哪些大牛們的博客?

如題,求推薦......剛開始接觸 最好是中文博客


  1. Intel @邵賽賽 的博客 http://jerryshao.me/ 他是早期Spark contributor之一

  2. 盛利:Spark SQL 源碼分析系列文章
  3. 許鵬:徽滬一郎 - 博客園 博主的新書《Spark源碼剖析》快出了吧 :-)

想到了繼續補充。


在連城的基礎上補充幾個還不錯的

[1]fxjwind - 博客園

[2]張包峰的博客

[3]Spark - anzhsoft的技術專欄

另外有幾個業界著名的公司博客

[1]Databricks Blog

[2]Spark Archives

[3]https://www.mapr.com/blog/big-data-hub/apache-spark

有想到再補充


推薦spark創始人在UC berkeley AMP lab期間發的論文,裡面介紹了作者創建Spark的初衷,Spark最初的設計,RDD的由來等

實驗室他的主頁Matei Zaharia 他的很多論文基本都是在USENIX上,下面是部分。

  • Fast and Interactive Analytics over Hadoop Data with Spark
  • Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computing (Best Paper Award)
  • Improving MapReduce Performance in Heterogeneous Environments
  • Spark: Cluster Computing with Working Sets


推薦一個一起學習spark的平台,不是大牛,適合像我這樣的初學者,容易入門。

優雅程序員-博客園 Spark - 標籤

【Spark大數據處理】動手寫WordCount


毛遂自薦 遠算不上牛 但真心用心寫的

牛肉圓粉不加蔥


伴隨Spark技術的普及推廣,對專業人才的需求日益增加。Spark專業人才在未來也是炙手可熱,輕而易舉可以拿到百萬的薪酬。而要想成為Spark高手,也需要一招一式,從內功練起:通常來講需要經歷以下階段:

  第一階段:熟練的掌握Scala語言;

  第二階段:精通Spark平台本身提供給開發者API;

  第三階段:深入Spark內核;

  第四階級:掌握基於Spark上的核心框架的使用;

  第五階級:做商業級別的Spark項目;

  第六階級:提供Spark解決方案;

  前面所述的成為Spark高手的六個階段中的第一和第二個階段可以通過自學逐步完成,隨後的三個階段最好是由高手或者專家的指引下一步步完成,最後一個階段,基本上就是到」無招勝有招」的時期,很多東西要用心領悟才能完成。

-------------------------------------------------------------------------------------------------------------------------

相信在不久的將來,雲計算、人工智慧、大數據、物聯網,經過數年的發展,將完全融入我們的生活,我們應該對其進行擁抱,建議大家有時間,可以留心關注這方面的信息資訊,學術,科普類的平台,多智時代:http://duozhishidai.com ,引領智能變革,雷峰網——讀懂智能未來等等,讓我們一起迎接人工智慧時代的社會、經濟與文化變革,擁抱智能,暢享未來!

推薦閱讀-多智時代:什麼是Spark,怎麼才能成為雲計算大數據Spark高手? - 大數據 多智時代


推薦一下我自己的:

[1] & lw-lin/CoolplaySpark

[2] & lw-lin/CoolplaySpark


想寫大數據面試的書如何?


自己寫的一些Spark源碼閱讀的筆記,主要是針對機器學習的。專欄:spark.mllib源碼閱讀與分析 - 博客頻道 - CSDN.NET


我不是大牛 但是感覺自己的一些經驗 應該可以幫到一部分人: Spark – FlyML


樓主可以看看 《深入理解SPARK:核心思想與源碼分析》

這本書


看文檔,看源碼。還需要什麼博客?


hashjoin,Databricks大數據公司聯合創始人, Apache Spark PMC member

Sina Visitor System ,http://rxin.org


推薦閱讀:

有什麼關於 Spark 的書推薦?
想研讀下spark的源碼,怎麼搭閱讀和調試的環境呢?
如何高效閱讀 Spark 和 Hadoop 這類大型開源項目源代碼?有什麼工具可以藉助?
第四範式的人工智慧平台 Prophet 有可能替代 Spark 么?

TAG:Spark |