Hive 视图和索引
本章介绍如何创建和管理视图。视图是基于用户需求生成的。您可以将任何结果集数据保存为视图。在Hive中使用视图与在SQL中使用视图相同。这是标准的RDBMS概念。可以在视图上执行所有DML操作。
阅读更多:Hive 教程
创建视图
您可以在执行SELECT语句时创建视图。语法如下:
CREATE VIEW [IF NOT EXISTS] 试图名称[(列名称[COMMENT列注释],...)]
[COMMENT table_comment]
AS SELECT...
例子
让我们以视图为例。假设有一个名为employee的表,其字段为Id,Name,Salary,Designation和Dept。生成一个查询,检索工资超过30000卢比的员工详细信息。我们将结果存储在一个名为emp_30000的视图中。
+------+--------------+-------------+-------------------+--------+
| ID | Name | Salary | Designation | Dept |
+------+--------------+-------------+-------------------+--------+
|1201 | Gopal | 45000 | Technical manager | TP |
|1202 | Manisha | 45000 | Proofreader | PR |
|1203 | Masthanvali | 40000 | Technical writer | TP |
|1204 | Krian | 40000 | Hr Admin | HR |
|1205 | Kranthi | 30000 | Op Admin | Admin |
+------+--------------+-------------+-------------------+--------+
下面的查询使用上述情况检索员工详细信息:
hive> CREATE VIEW emp_30000 AS
SELECT * FROM employee
WHERE salary>30000;
删除视图
使用以下语法删除视图:
DROP VIEW 视图名称
以下查询将删除名为emp_30000的视图:
hive> DROP VIEW emp_30000;
创建索引
索引就是表中特定列的指针。创建索引意味着在表格的特定列上创建一个指针。其语法如下:
CREATE INDEX index_name
ON TABLE base_table_name (col_name,...)
AS 'index.handler.class.name'
[WITH DEFERRED REBUILD]
[IDXPROPERTIES (property_name=property_value,...)]
[IN TABLE index_table_name]
[PARTITIONED BY (col_name,...)]
[
[ ROW FORMAT ...] STORED AS ...
| STORED BY ...
]
[LOCATION hdfs_path]
[TBLPROPERTIES (...)]
例子
让我们以索引为例。使用早期使用的相同的employee表,其字段为Id,Name,Salary,Designation和Dept。创建一个名为index_salary的索引,该索引指向employee表的salary列。
以下查询将创建一个索引:
hive> CREATE INDEX inedx_salary ON TABLE employee(salary)
AS 'org.apache.hadoop.hive.ql.index.compact.CompactIndexHandler';
它是对工资列的指针。如果列被修改,更改将使用索引值存储。
删除索引
使用以下语法删除索引:
DROP INDEX <index_name> ON <table_name>
以下查询将删除名为index_salary的索引:
hive> DROP INDEX index_salary ON employee;