標籤：

Hadoop 大数据大數據處理

從頭學習大數據培訓課程 hadoop，mapreducer 分散式計算框架（二） Windows 偽分散式環境部署

02-05

1. mapreducer shuffle過程回顧

2. 需要的軟體

https://github.com/steveloughran/winutils

winutils-master

以下內容回帖刷新可見………………

編譯之後的hadoop2.7.3的tar包

3. 把hadoop和winutils解壓

4. 複製解壓之後的winutils文件

複製到解壓之後的hadoop文件夾的bin目錄裡面，不要覆蓋已存在的文件

5. 在WINDOWS上配置環境變數

(1).HADOOP_HOME

(2).把hadoop的bin和sbin配置到path環境變數里

;%HADOOP_HOME%bin;%HADOOP_HOME%sbin;

6. 設置hadoop配置文件

core-site.xml

hdfs-site.xml

maprd-site.xml

yarn-site.xml

hadoop-env.cmd

把修改好的配置文件覆蓋hadoop-2.7.3etchadoop目錄

7. 測試hadoop命令

打開cmd輸入set查看設置的環境變成是否生效

輸入hadoop version查看hadoop的版本

8. 格式化namenode

hadoop namenode -format

9. 啟動dfs

start-dfs.cmd 之後彈出兩個窗口

namenode

datanode

之後在電腦上的c盤就能看到tmp目錄，裡面有namenode文件和datanode文件

啟動成功之後就可以查看hdfs的web頁面

10. 啟動yarn

start-yarn.cmd之後彈出兩個窗口

resourceManager

nodeManager

查看yarn的web界面

11. 測試hdfs是否好用

12. 開啟和關閉

start-all.cmd開啟hadoop

stop-all.cmd關閉hadoop

更多學習資料：海牛大數據社區

推薦閱讀：

※Hadoop 一般用在哪些業務場景？
※MooseFS和Hadoop兩個分散式文件系統各有什麼優缺點？
※Kafka 2017技術峰會摘要（pipeline分類）
※Spark編程有哪些有用技巧？
※想轉行做大數據技術相關的工作，需要學習語言還是學什麼？

TAG:大数据 | 大数据处理 | Hadoop |