標籤:

《Accessing Hadoop Data Using Hive》第三章Hive DML問題集

1.如何把數據導入到HIVE?

第一種,從本地文件導入:

第二種:從hdfs導入

第三種,從Query導入:

2.如何從HIVE導出數據呢?

第一種:直接拷貝hdfs數據(如果已經是你需要的格式的話)

第二種:可以通過HIVE導出到本地或hdfs

3.常用的HQL?

注意有些是和SQL有區別的。

Join時大表應該放在右邊。原因是會把左邊的小表放到內存中,右邊的大表在硬碟中。

4.什麼是map join?

5.什麼是bucket map join?


推薦閱讀:

Hive On Spark, SparkSQL On Spark, 與Spark On YARN如何定義呢?
為何Hive中的數據不均勻分布會導致數據傾斜?
《Accessing Hadoop Data Using Hive》第一章Introduction To Hive問題集
在Hive中適不適合像傳統數據倉庫一樣利用維度建模?

TAG:Hive |