Hive分區介紹

02-08

Hive組織表到分區。它是將一個表到基於分區列，如日期，城市和部門的值相關方式。使用分區，很容易對數據進行部分查詢。

表或分區是細分成桶，以提供額外的結構，可以使用更高效的查詢的數據。桶的工作是基於表的一些列的散列函數值。

例如，一個名為Tab1表包含僱員數據，如 id, name, dept 和yoj (即加盟年份)。假設需要檢索所有在2012年加入，查詢搜索整個表所需的信息員工的詳細信息。但是，如果用年份分區僱員數據並將其存儲在一個單獨的文件，它減少了查詢處理時間。下面的示例演示如何分區的文件和數據：

下面文件包含employee 數據表。

/tab1/employeedata/file1

id, name, dept, yoj1, gopal, TP, 20122, kiran, HR, 20123, kaleel,SC, 20134, Prasanth, SC, 2013

上面的數據被劃分成使用年兩個文件。

/tab1/employeedata/2012/file2

1, gopal, TP, 20122, kiran, HR, 2012

/tab1/employeedata/2013/file3

3, kaleel,SC, 20134, Prasanth, SC, 2013

添加分區

可以通過添加分區表改變所述表。假設我們有一個表叫employee ，擁有如 Id, Name, Salary, Designation, Dept, 和 yoj等欄位。

語法：

ALTER TABLE table_name ADD [IF NOT EXISTS] PARTITION partition_spec[LOCATION location1] partition_spec [LOCATION location2]...;partition_spec::(p_column = p_col_value, p_column = p_col_value,...)

以下查詢用於將分區添加到employee表。

hive> ALTER TABLE employee> ADD PARTITION (year=』2013』)> location /2012/part2012;

重命名分區

此命令的語法如下。

ALTER TABLE table_name PARTITION partition_spec RENAME TO PARTITION partition_spec;

以下查詢用來命名一個分區：

hive> ALTER TABLE employee PARTITION (year=』1203』)> RENAME TO PARTITION (Yoj=』1203』);

刪除分區

下面語法用於刪除分區：

ALTER TABLE table_name DROP [IF EXISTS] PARTITION partition_spec, PARTITION partition_spec,...;

以下查詢是用來刪除分區：

hive> ALTER TABLE employee DROP [IF EXISTS]> PARTITION (year=』1203』);