從頭學習大數據培訓課程 hadoop 分散式計算框架（七） mapreducer多目錄輸出、innerjoin 實現

02-04

標題：mapreducer 編程，多目錄輸出、innerjoin 實現、多目錄輸入並指定所用 mapper

1. 多目錄輸出

maxout/max

maxout在輸出目錄下新建的文件夾

max輸出文件的前綴

結果

文件前綴

map實現使用FileSplit inputSplit = (FileSplit) context.getInputSplit();取得輸入文件路徑，用文件路徑判斷是數據那個數據集

reducer實現，實現join的拼接

job配置

輸入數據1

輸入數據2

運算結果

mappe1r實現

mapper2實現

job配置

reducer實現同第2步

輸入和輸出數據同第2步

更多大數據方向JAVA視頻教程：海牛大數據社區