《Accessing Hadoop Data Using Hive》第三章Hive DML問題集
02-05
1.如何把數據導入到HIVE?
第三種,從Query導入:2.如何從HIVE導出數據呢?
推薦閱讀:
第一種,從本地文件導入:
第二種:從hdfs導入
第一種:直接拷貝hdfs數據(如果已經是你需要的格式的話)
第二種:可以通過HIVE導出到本地或hdfs
3.常用的HQL?注意有些是和SQL有區別的。
Join時大表應該放在右邊。原因是會把左邊的小表放到內存中,右邊的大表在硬碟中。
4.什麼是map join?
5.什麼是bucket map join?
推薦閱讀:
※Hive On Spark, SparkSQL On Spark, 與Spark On YARN如何定義呢?
※為何Hive中的數據不均勻分布會導致數據傾斜?
※《Accessing Hadoop Data Using Hive》第一章Introduction To Hive問題集
※在Hive中適不適合像傳統數據倉庫一樣利用維度建模?
TAG:Hive |