Hive 分区

Hive将表分区。根据分区列（例如日期、城市和部门）的值将表分成相关部分的一种方法。使用分区，可以轻松查询数据的一部分。

表或分区被细分为 bucket， 以提供更有效的查询可能性的数据额外结构。桶的工作原理是基于表的某些列的哈希函数值来实现的。

例如，名为 Tab1 的表包含员工数据，例如id、name、dept和yoj（即加入年份）。假设您需要检索加入2012年的所有员工的详细信息。查询将为所需的信息搜索整个表。但是，如果将员工数据分区并存储在单独的文件中，则可以减少查询处理时间。以下示例显示了如何分区文件及其数据：

以下文件包含employeedata表。

/tab1/employeedata/file1

id，name，dept，yoj
1，gopal，TP，2012
2，kiran，HR，2012
3，kaleel，SC，2013
4，Prasanth，SC，2013

以上数据已使用年份分成两个文件。

/tab1/employeedata/2012/file2

1，gopal，TP，2012
2，kiran，HR，2012

/tab1/employeedata/2013/file3

3，kaleel，SC，2013
4，Prasanth，SC，2013

阅读更多：Hive 教程

添加分区

我们可以通过更改表来添加分区。假设我们有一个名为 employee 的表，其中包括Id、Name、Salary、Designation、Dept和yoj等字段。

语法：

ALTER TABLE table_name ADD [IF NOT EXISTS] PARTITION partition_spec
[LOCATION 'location1'] partition_spec [LOCATION 'location2'] ...;

partition_spec:
: (p_column = p_col_value, p_column = p_col_value, ...)

以下查询用于将分区添加到employee表。

hive> ALTER TABLE employee
> ADD PARTITION (year=’2012’)
> location '/2012/part2012';

重命名分区

此命令的语法如下。

ALTER TABLE table_name PARTITION partition_spec RENAME TO PARTITION partition_spec;

以下查询用于重命名分区：

hive> ALTER TABLE employee PARTITION (year=’1203’)
   > RENAME TO PARTITION (Yoj=’1203’);

删除分区

以下语法用于删除分区：

ALTER TABLE table_name DROP [IF EXISTS] PARTITION partition_spec, PARTITION partition_spec,...;

以下查询用于删除分区：

hive> ALTER TABLE employee DROP [IF EXISTS]
   > PARTITION (year=’1203’);

Hive 分区

Hive 分区

添加分区

语法：

重命名分区

删除分区

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

Hive 教程

回顶部