Hive 分区
Hive将表分区。根据分区列(例如日期、城市和部门)的值将表分成相关部分的一种方法。使用分区,可以轻松查询数据的一部分。
表或分区被细分为 bucket, 以提供更有效的查询可能性的数据额外结构。桶的工作原理是基于表的某些列的哈希函数值来实现的。
例如,名为 Tab1 的表包含员工数据,例如id、name、dept和yoj(即加入年份)。假设您需要检索加入2012年的所有员工的详细信息。查询将为所需的信息搜索整个表。但是,如果将员工数据分区并存储在单独的文件中,则可以减少查询处理时间。以下示例显示了如何分区文件及其数据:
以下文件包含employeedata表。
/tab1/employeedata/file1
以上数据已使用年份分成两个文件。
/tab1/employeedata/2012/file2
/tab1/employeedata/2013/file3
阅读更多:Hive 教程
添加分区
我们可以通过更改表来添加分区。假设我们有一个名为 employee 的表,其中包括Id、Name、Salary、Designation、Dept和yoj等字段。
语法:
以下查询用于将分区添加到employee表。
重命名分区
此命令的语法如下。
以下查询用于重命名分区:
删除分区
以下语法用于删除分区:
以下查询用于删除分区: