聊聊Hadoop:圖解HDFS是個啥
04-13
Hadoop進入到2.0以後,最大的改動便是拆分出數據處理(MapReduce)和集群資源管理(YARN)部分。HDFS作為分散式儲存系統在Hadoop 2.0中繼續沿用。今天讀了一些介紹Hadoop生態圈的文章,感覺都寫得非常地學術。周末正好有興緻和時間,做了幾張介紹HDFS基本信息的圖,包括HDFS的用處、架構和讀寫文件的流程,讓大家見笑啦。
HDFS是幹嘛的?
HDFS處理文件的思路
HDFS架構
HDFS讀取過程
HDFS寫入過程
預告
下期我們一起試試運行幾個基於HDFS和MapReduce的小程序。
推薦閱讀:
※從頭學習大數據培訓課程 數據倉儲工具 hive(五)hive 的 grouping sets、排序、窗口函數用法
※做大數據相關專業,如Hadoop、Hive、Impala等研究與優化的人就業情況如何呢?
※從頭學習大數據培訓課程 hadoop,mapreducer 分散式計算框架(三) Windows 開發 wordcount
※從頭學習大數據培訓課程 hadoop 分散式計算框架(十)mapreducer 編程,任務工作鏈、生產項目打包方式
※用於大數據處理高性能計算的4個實現步驟