從頭學習大數據培訓課程 hadoop,mapreducer 分散式計算框架(三) Windows 開發 wordcount
02-04
1. 需要的軟體
2. 解壓eclipse
3. 解壓maven
4. 修改maven配置使用阿里提供的maven源
5. eclipse使用的java版本
6. eclipse配置maven
修改maven配置
7. eclipse配置代碼模板
8. eclipse設置字體大小
9. eclipse安裝插件
ExploreFS的安裝地址:
在線安裝:http://www.junginger.biz/eclipse/重啟ECLIPSE
eclipseFS使用方法
Eclipse正則表達式插件 Regex Util
插件安裝把下載的插件放到eclipse目錄下的plugins文件夾里之後重啟eclipse
10. 創建wordcount maven項目
11. 檢查項目使用的jdk
12. 通過maven增加hadoop-client
查看build path裡面maven已經下載的hadoop依賴包
13. 包結構
創建包結構的本地文件目錄
14. 寫mapreducer的順序
繼承Mapper類,實現map函數
繼承Reducer類,實現reduce函數設置Job相關信息提交Job運行15. 創建wordcount類繼承configured,實現tool介面
16. 實現mapper內部類
17. 實現reducer內部類
18. 設置Job相關信息
19. 提交job運行
20. 增加自動刪除目錄方法
21. 配置輸入輸出路徑,並把測試數據放到輸入/tmp/input目錄里
22. 運行任務查看任務結果
23. 增加job日誌
新建resource源碼目錄
拷貝hadoop配置下的log4j文件到新建的resource源碼文件目錄里
這樣運行就會列印出log4j日誌
更多學習資料:海牛大數據社區
推薦閱讀:
※大咖熱議,大數據把脈,論網劇大風口的機遇與挑戰
※數據分享讀書系列篇:《大數據時代》R凸凸d
※Ray的數據新聞學習日記(一):什麼是數據新聞
※大數據是不是侵犯隱私?
※如何合理搭建大數據分析團隊?需要有哪些背景的人?